在庆祝公司成立16周年之际,Reverie Language Technologies 发布了一款全新的语音转文本(STT)模型,旨在应对印度多元化的语言环境。这款模型不仅能够识别印地语、英语,还可以处理 Hinglish 等混合语言,极大地满足了银行和呼叫中心等行业的需求。

图源备注:图片由AI生成,图片授权服务商Midjourney
据 Reverie 介绍,该模型在过去一年内处理了300万次 API 调用,其精确度和速度都表现出色。在与 Deepgram 的独立测试中,Reverie 的模型在准确率上高出约4.2%,响应速度提升了1.5倍。这使其成为针对印度用户的强大语音识别系统。
这款模型的优势在于其对多语言和文化背景的理解能力。无论是用英语说的数字 “twenty-three”,还是用印地语说的 “तेईस”,该模型都能够准确识别。此外,它还能识别来自印度各地的名字,考虑到拼写和发音的差异,这些特性往往是全球模型难以处理的。
除了 Hinglish,Reverie 还推出了一系列针对其他印度语言的 STT 模型,包括泰米尔语、泰卢固语、孟加拉语、马拉地语、古吉拉特语、卡纳达语、马拉雅拉姆语、阿萨姆语、奥里亚语和旁遮普语。每个模型都针对特定语言的方言和口音进行了独立训练,旨在更真实地反映当地人的语言使用习惯。
Reverie 的 R&D 负责人 Pranjal Nayak 表示:“我们的研发一直专注于印度特有的语言挑战,这款 Hinglish 模型正是其中的成果。它能够理解印度人在使用数字时的习惯,以及在同一句话中如何混合使用英语和印地语。” 这使得 AI 代理的表现更加自然和人性化。
该模型已经在多个行业中得到应用,例如某大型金融服务公司采用 Reverie 的 STT 引擎处理超过15,000个多语种的债务催收电话,成功实现了高准确度的数字和付款识别。
目前,这款模型已在 Reverie 的 API 平台上上线,企业可通过云端或本地部署来使用。其支持特定领域的语言包、数字和名称的歧义消解以及热词增强等功能,所有配置均可通过同一个 API 完成。
划重点:
🌟 这款新模型在准确率和响应速度上超过 Deepgram,满足印度市场的需求。
💬 Reverie 模型能够理解 Hinglish 等多种语言混合,具备文化背景的深刻理解。
📈 多个行业已开始应用该技术,显著提高了语音识别的准确性与效率。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则