可穿戴设备迎来“感知革命”。中国AI声学领军企业声智科技(SoundAI)宣布,其全球首款多模态AI时尚耳机将于海外知名众筹平台Kickstarter全球首发。该产品突破传统耳机仅限音频交互的局限,创新性融合视觉感知与声学交互,定位为用户的“随身感知工具”,让AI真正“看得见、听得清、回得准”。
声视融合:用眼睛看,用耳朵说
不同于普通AI耳机仅依赖麦克风阵列,声智此次产品搭载微型视觉传感器与自研多模态大模型,实现“视觉场景验证 + 声学结果交付”的闭环体验:
– 视觉端:通过轻量级摄像头或环境光感知,识别用户所处场景(如咖啡馆、会议室、街道);
– 声学端:基于场景智能优化降噪策略、语音唤醒灵敏度及TTS输出音色;
– 交互闭环:例如在嘈杂街道,耳机识别“户外”后自动增强语音收听清晰度;进入会议室则切换至“静音模式”,仅通过骨传导提示日程。
该设计有效解决纯语音AI在复杂环境中的误触发与响应失准问题,显著提升交互可靠性。
全栈声学底座,软硬一体赋能
产品依托声智科技自研的全栈声学技术体系,涵盖远场语音识别、声源定位、回声消除、个性化声纹建模等核心技术,并集成其多模态大模型推理引擎,可在端侧完成低延迟场景理解,保障用户隐私与响应速度。
时尚设计+全球首发,瞄准高端消费市场
作为“时尚耳机”,产品由国际设计团队操刀,兼顾美学与佩戴舒适性,目标用户为科技爱好者、商务人士与数字游民。选择Kickstarter首发,旨在借力全球早期用户反馈,快速迭代并建立海外品牌认知。
AIbase认为,声智科技此举标志着AI可穿戴设备从“语音助手”向“环境感知智能体”跃迁。当耳机不仅能听指令,还能“看懂”你所处的世界,人机交互的自然性与主动性将实现质的飞跃。而这场由声智掀起的“声视融合”浪潮,或将成为下一代智能硬件的关键入口。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则