内容持续更新中
在人工智能领域,语言模型的快速发展引发了语音理解语言模型(SULMs)的广泛关注。近日,西北工业大学 ASLP 实验室发布了开放语音理解模型 OSUM,旨在探索在学术资源有限的情况下,如何有效训练和利…
OpenAI 的首席执行官 Sam Altman 近日在社交媒体平台 X 上发起了一项调查,询问用户对公司下一步开源开发方向的看法。 这一举动发生在 OpenAI 正在经历重大转型的背景下,公司正将其…
最近,一款由 OpenAI 的 Whisper 技术驱动的 AI 转录工具在医疗行业广受欢迎。许多医生和医疗机构都在使用这个工具来记录和总结与患者的会面。 根据 ABC 新闻的报道,研究人员却发现这款…
法国初创公司Gladia提供了一种语音识别应用程序编程接口(API),在A轮融资中筹集了1600万美元。本质上,Gladia的API能够将任何音频文件以高准确度和低延迟转换成文本。 虽然亚马逊、微软和…
近日,GroqCloud 静悄悄地推出了 Whisper V3 Large。赶紧尝试吧,现在已经内置在 GroqChat 中,让每个人都能体验。 现在开发者们可以利用 Whisper 的语音转文字功能…