近日,OpenAI 在其官方网站上宣布,旗下的 ChatGPT 正式将 “语音模式” 整合进主聊天界面。这一更新让用户在进行语音对话时,不仅能够通过语音提问,还能实时查看与对话内容相关的视觉信息,如地图、图片等,同时系统还会自动生成文字转录稿,方便用户回顾和查阅交流内容。

OpenAI ChatGPT 升级:语音与文本无缝结合,实现多模态互动

之前,语音对话功能是一个独立的模块,用户需要手动切换到语音模式。而此次更新后,用户可以直接在主聊天窗口启动语音交互,使整个使用体验更加顺畅和高效。这种多模态的互动方式,不仅提升了信息传递的效率,也丰富了用户的交流体验。

新版语音模式的一大亮点是其视觉信息呈现能力。OpenAI 通过演示展示了,当用户通过语音提问时,ChatGPT 能够自然流畅地进行语音回答,并且在聊天界面中实时展示相关的图表和图片。这种互动方式,让用户在获取信息的同时,能够更直观地理解内容。

为了照顾不同用户的偏好,OpenAI 还在更新中增加了一个 “后悔药” 选项。对于那些更喜欢沉浸式纯音频对话的用户,新的设置菜单提供了一键切换到旧版独立语音模式的功能,确保用户可以根据自己的需求选择最适合的使用方式。

OpenAI 的这一更新,标志着其在 AI 产品领域不断探索和创新的决心。此前,该公司已推出多款新功能,包括用于商品比价的 AI 购物助手、支持 iCloud 钥匙串的 Atlas AI 浏览器新功能以及在部分地区上线的群聊功能。这些更新均反映出 OpenAI 在扩展 AI 应用边界方面的持续努力。

划重点:  

🌟 ChatGPT 正式整合语音模式,用户可在主界面实现语音与文本的无缝互动。  

🖼️ 语音提问时,系统可实时展示相关的视觉信息,如地图和图片。  

🔄 更新提供切换功能,用户可根据需求选择传统的独立语音模式。