内容持续更新中
近日, 在全球语音识别技术日益发展的背景下,通义千问今日正式推出其最新语音识别模型 ——Qwen3-ASR-Flash。该模型基于 Qwen3基座模型,经过海量多模态数据及数千万小时的自动语音识别(A…
美国初创公司 Useful Sensors 推出了一款名为 Moonshine 的开源语音识别模型。Moonshine 的设计旨在更高效地处理音频数据,相比于 OpenAI 的 Whisper,它在计…
在2024年8月21日举办的火山引擎AI创新巡展上海站上,火山引擎展示了其豆包大模型的全面升级,以及对话式AI实时交互解决方案的增强。 豆包大模型自5月15日发布以来,日均tokens使用量已超500…