智谱 AI 正式推出了其最新GLM-ASR 系列语音识别模型,并将相关技术开源,旨在为广大用户提供更高效的语音交互体验。这一系列的推出还包括了一款桌面端的 “智谱 AI 输入法”,为用户在 PC 端的语音输入提供了极大的便利。

智谱 AI 输入法全新发布,语音识别技术同步开源!

GLM-ASR-2512是智谱 AI 发布的全球领先的云端语音识别模型,其主要特点是支持实时语音转文字,并在复杂的真实环境中表现出色,字符错误率(CER)仅为0.0717。这一卓越的识别精度使其在多场景、多语种及多口音的应用中依然保持行业领先地位。

除了 GLM-ASR-2512,智谱 AI 还开源了 GLM-ASR-Nano-2512。这款模型参数仅为1.5B,但在语音识别的开源领域中表现为 SOTA,甚至在部分测试中超越了一些闭源模型。GLM-ASR-Nano-2512的设计使得其能够在本地运行,既保证了高精度的语音识别能力,又增强了用户的隐私保护,并减少了交互延迟。

基于以上两个模型的强大能力,智谱 AI 推出了新款的智谱 AI 输入法。用户通过这款输入法不仅可以实现精准的语音转文字功能,还能够进行翻译和文本改写等智能操作,真正实现了 “指尖即模型,语音即指令” 的便捷体验。目前,智谱 AI 输入法已经对所有用户开放,并且新用户还可获得2000积分,享受长达28天的免费使用时间。

GLM-ASR-Nano-2512:Hugging Face:https://huggingface.co/zai-org/GLM-ASR-Nano-2512

智谱 AI 输入法:https://autoglm.zhipuai.cn/autotyper/

划重点:

🌟 GLM-ASR 系列模型发布,包含全球领先的云端语音识别模型和端侧模型,识别精度出色。  

🛠️ 新款智谱 AI 输入法推出,支持语音转文字、翻译及改写,提供便捷的 PC 端语音交互体验。  

🎁 新用户可免费获取2000积分,享受长达28天的使用权,鼓励更多用户体验智能输入法。