在2025年科大讯飞1024开发者节上,科大讯飞正式发布AI软硬一体解决方案,通过AI算法与硬件架构的深度融合,实现了在高噪声、远场等复杂环境下的精准识别与理解。这一突破被视为语音与视觉智能融合领域的重要进展。
讯飞表示,传统AI语音识别系统在嘈杂环境下往往存在准确率下降的问题。为此,科大讯飞在软硬件一体化设计上进行了系统性创新,让AI不仅能“听清”,还能“看懂”。

基于该方案,讯飞多款AI硬件的降噪与识别性能显著提升:
讯飞智能办公本 X5 搭载行业首创“上4下4环”八麦克风阵列,在远场高噪音环境下的识别效果远超 iPhone17Pro;
讯飞 AI 翻译耳机 在地铁、展会等复杂场景中识别准确率达到 97.1%;
讯飞双屏翻译机2.0 在 90dB 工厂轰鸣声环境下依然实现 98.69% 的语音识别准确率。
讯飞方面称,这些成果得益于其在语音增强、声源定位、回声消除和多模态感知算法上的持续积累。
在本次开发者节上,科大讯飞还发布了基于 星火语音大模型 的“百变声音复刻”技术。用户只需一句录音即可高保真复刻任意音色,并可通过一条指令生成不同风格的声音输出。
这项技术的出现,意味着个性化语音创作进入普及阶段。它可广泛应用于数字人、有声读物、影视配音、内容创作等领域,让每个人都能快速打造属于自己的“AI声音分身”。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则