据新浪科技消息,近日,一款名为 灵光 的全新多模态应用已在腾讯应用宝、vivo 应用商店等平台悄然上线,并开启邀约内测。用户可通过手机号或支付宝账号直接登录体验。

据悉,“灵光”由 支付宝(杭州)数字服务技术有限公司开发,其最大亮点在于内置的 “AGI 相机” 功能。这一功能可通过相机镜头识别并理解现实世界中的场景与内容,实现拍摄即问、实时理解与回答。有业内人士指出,该功能与字节跳动的 豆包 App、阿里 元宝 App 的图像识别功能类似,但灵光更强调“认知层理解”,或具备更强的场景分析与多模态推理能力。

事实上,蚂蚁集团在多模态与 AGI 方向的探索已持续数月。今年4月底,蚂蚁首次实现了图像理解与生成的统一;5月份又推出了 Ming-Lite-omni-Preview 模型,这是全球首个在模态支持上可媲美 GPT-4o 的开源模型,具备语音、图像的生成与理解整合能力。