人工智能的语音交互正在迎来一场“降维打击”式的进化。近日,不少用户在 ChatGPT 的网页端及 App 端发现了一个名为“Bidi1”的新型语音模型,预示着 OpenAI 正筹备开启更大规模的测试,为 AI 语音交互带来前所未有的流畅体验。
长期以来,AI 语音助手往往遵循着“我问、你答”的线性逻辑,用户必须等待 AI 将上一段话完整输出后,才能进行下一次互动。而 Bidi1语音模型的出现,彻底打破了这一桎梏。其核心亮点在于“双向并行处理”:AI 不仅能在说话的同时实时监听用户的输入,还能在对话进行到一半时,立即响应用户的打断或新指令。

这种交互模式极大地拉近了人机对话与真实人类沟通的距离。在演示案例中,当模型正在执行“从1数到10”的任务时,用户随时插话要求其“倒数”,模型能够无缝衔接并立刻切换逻辑执行新指令。这种“边听边回、实时响应”的交互逻辑,彻底告别了僵硬的等待周期,让对话变得极其自然、丝滑。
在界面操作层面,Bidi1的辨识度也相当高。当用户在设置的模型选择器中选中该选项后,原有的语音气泡将转变为醒目的黄色,以提示用户当前已切换至这一高级语音模式。
虽然 OpenAI 官方尚未对此进行大范围的正式发布,但根据目前的测试反馈来看,这一功能的上线已经进入倒计时。从辅助工具到真正的对话伙伴,ChatGPT 的这一轮升级,不仅提升了语音交互的效率,更在人机协作的沉浸感上迈出了重要的一步。对于习惯通过语音处理事务的用户而言,一个更懂“听话”且反应迅捷的智能助手即将触手可及。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则