近日,其发布了一款名为StreetReaderAI的创新原型系统,旨在让盲人及低视力用户也能无障碍地“游览”Google街景——不再是被动接收信息,而是通过自然语言与虚拟环境实时互动,真正实现自主探索城市空间的自由。
多模态AI驱动,打造可对话的街景体验
StreetReaderAI并非简单的语音播报工具,而是一个深度融合计算机视觉、地理信息系统(GIS)与大语言模型的多模态AI系统。它能实时解析街景图像内容,并结合精确的地理位置数据,生成结构化、情境化的语音描述。当用户“置身”于某条街道时,系统会主动说明周边环境:“您正面向一座红砖建筑,左侧是咖啡馆,右侧是公交站,前方50米处为十字路口。”

更关键的是,该系统支持智能对话交互。用户无需记忆复杂指令,只需像与人交谈一样提问:“前面那栋楼是什么?”“附近有银行吗?”“这条路通向哪里?”AI便会基于当前视角和地图数据,给出准确、连贯的回答,让虚拟探索变得直观而自然。
无障碍操作,赋予用户真正的控制权
为确保操作对视障用户友好,StreetReaderAI设计了极简的交互方式。用户可通过语音命令或标准键盘按键自由控制视角旋转、前进后退、切换街景点位,整个过程无需依赖屏幕或触控界面。这种“语音+键盘”的双模输入,兼顾了不同用户的使用习惯,真正实现了“所问即所见,所控即所行”。
科技向善:从工具到权利的转变
长期以来,数字地图和街景服务虽极大便利了大众出行,却因高度依赖视觉界面,将视障群体排除在外。StreetReaderAI的出现,标志着无障碍技术正从“辅助功能”升级为“平等体验”——它不只是提供信息,而是赋予用户主动探索、理解并决策的能力。
尽管目前该系统仍处于原型阶段,尚未集成至Google Maps正式产品线,但其技术路径已展现出明确的落地潜力。AIbase分析认为,随着多模态大模型与空间计算技术的成熟,未来此类无障碍AI将不仅限于街景,还可拓展至室内导航、公共交通指引甚至远程导览等场景,真正构建一个“人人可感知、可参与”的数字世界。
科技的意义,不仅在于突破极限,更在于弥合鸿沟。StreetReaderAI或许只是第一步,但它照亮的方向,值得整个行业追随。
.png)
 
  
  
 
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则