内容持续更新中
据智能涌现消息,外卖巨头美团在 AI 战略上迈出了重要一步,前字节跳动视觉模型 AI 平台负责人潘欣正式加入公司,负责多模态 AI 的创新工作。这一人事变动被业内广泛关注,标志着美团在竞争日益激烈的外…
多模态AI龙头ElevenLabs重磅官宣:全新「Image & Video平台」正式上线!这不再是单纯的语音工具,而是一座集图像生成、视频生成、声音合成、音乐创作、音效设计于一体的超级AI内…
在今日举行的百度世界大会上,百度创始人、董事长兼CEO李彦宏正式发布文心大模型5.0,并将其定义为“统一的原生全模态模型”——这一命名不仅宣告百度在多模态AI领域的技术跃迁,更标志着国产大模型正式迈入…
你以为只是随手发了张旅行合照?在AI大模型的“火眼金睛”下,这张照片可能正在泄露你的住址、身份证号、家庭关系甚至行程轨迹。在2025年世界互联网大会期间,央视新闻罕见发出高危警示:随着多模态AI的普及…
当业界还在争论多模态AI能否真正落地,美团已悄然甩出一张王牌——全新开源大模型 LongCat-Flash-Omni 正式上线,并在多项基准测试中超越多个闭源竞品,实现“开源即SOTA”(State-…
近日,其发布了一款名为StreetReaderAI的创新原型系统,旨在让盲人及低视力用户也能无障碍地“游览”Google街景——不再是被动接收信息,而是通过自然语言与虚拟环境实时互动,真正实现自主探索…
据报道,百度旗下 小度 AI 眼镜 将于 11月举行的百度世界2025大会 上正式发布,并计划在 今年年内开售。这款产品是百度在多模态 AI 与可穿戴设备领域的重要落地成果,标志着其在智能硬件生态中的…
10月9日,马斯克旗下 xAI 宣布推出其最新视频生成模型 Imagine v0.9,标志着该公司在多模态 AI 创作领域取得重大突破。相比早期版本 v0.1,新模型在画质、动作自然度与音频生成等方面…
近日,多模态 AI 领域的先锋企业生数科技宣布成功完成数亿元人民币的 A 轮融资。这轮融资由博华资本领投,老股东百度战投、北京市人工智能产业投资基金等多个投资方继续跟进,显示出市场对生数科技的高度认可…
近日,MiniMax公司推出了一款令人瞩目的视频Agent工具,为视频生成技术带来了全新突破。这款工具不仅支持通过简单文本指令生成完整视频,还能通过上传人脸图片实现视频中人物身份的精准一致性,展现了M…
近年来,多模态AI技术以其强大的跨领域能力,逐渐成为科技行业的增长引擎。谷歌DeepMind最新发布的Veo3模型以及OpenAI的GPT-4o,通过结合文本、图像、视频甚至音频的生成能力,不仅提升了…
2025年4月25日,百度Create AI开发者大会在北京隆重举行。在这场备受瞩目的科技盛会中,百度正式发布了文心快码3.5版本以及国内首个多模态AI程序员——文心快码Comate Zulu智能体,…
近日,Moonshot AI正式宣布推出Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注,被认为是多模态AI发展的重要…
由xAI打造的生成式人工智能聊天机器人Grok迎来了一次里程碑式的更新,其功能全面升级,不仅新增了视觉处理能力,还实现了多语言音频处理以及语音模式下的实时搜索功能。这一更新标志着Grok在多模态AI领…
在多模态人工智能(AI)领域,苹果公司的工程师们与法国索邦大学的研究团队合作,展开了一项重要研究。近日,科技媒体 marktechpost 发布了相关博文,探讨了早期融合与后期融合模型在多模态 AI …
人工智能技术的边界正在不断拓展。AIbase从社交媒体获悉,中国AI初创公司MiniMax稀宇科技于近日宣布,其MiniMax MCP Server正式上线。这一服务器通过简单的文本输入,即可调用视频…
人工智能领域的领跑者OpenAI即将在下周掀起新一波技术热潮!据科技媒体 The Verge 报道,OpenAI计划推出包括GPT-4.1系列、o3系列以及其他多款AI模型在内的重大更新。这一波密集发…
在联想集团2025/26财年誓师大会上,首席技术官Tolga Kurtoglu强调,当前AI应用仍处于快速迭代的技术演示阶段,远未真正释放为用户创造价值的成熟能力。他指出,未来AI发展的关键在于将技术…
硅谷科技巨头的版图扩张再添新篇!埃隆·马斯克旗下的xAI公司今日宣布收购专注于视频生成AI技术的初创公司Hotshot,这一战略收购将为xAI在多模态AI技术领域注入新的活力。 Hotshot首席执行…
湾区机器人新锐Figure正以超预期速度推进其家庭机器人计划。公司创始人Brett Adcock周四宣布,将于2025年下半年启动Figure02人形机器人的家庭环境Alpha测试,这一时间表较业界预…
微软在其官网上正式发布了多模态 AI Agent 基础模型 “Magma”,并进行了开源。这一新兴技术相较于传统的智能助手,展现出了更为强大的多模态能力,能够处理图像、视频、文本等多种数据形式,打破了…
近日,微软研究团队联合多所高校的研究人员,发布了一款名为 “Magma” 的多模态 AI 模型。这款模型的设计旨在处理和整合图像、文本和视频等多种数据类型,以便在数字和物理环境中执行复杂任务。随着科技…
2025年2月11日,北京智谱华章科技有限公司宣布,其研发的Agentic GLM全面登陆三星最新款手机Galaxy S25系列。这一合作标志着全球首款支持多模态AI交互的智能手机正式推向市场,为用户…
近期,阿里巴巴在AI领域迎来了一位重量级人物。据业内人士透露,一位全球顶级人工智能科学家已于近期正式入职阿里巴巴,未来或将专注于AI To C业务的基础大模型研发与应用。这位科学家在工业界和学术界均拥…
国产大模型DeepSeek发布了全新的Janus-Pro多模态大模型,正式进军文生图领域。这一举动标志着DeepSeek在多模态AI技术上的重大突破。 在GenEval和DPG-Bench基准测试中,…
阿里巴巴近日推出了一款名为QVQ-72B的全新多模态推理模型,该模型基于Qwen2-VL-72B构建,融合了强大的语言和视觉能力,能够处理更为复杂的推理和分析任务,标志着阿里巴巴在多模态AI领域取得了…
谷歌云近日发布了一份趋势报告,指出2025年企业将进入 AI 全面应用的新时代,AI 智能体、多模态 AI 以及企业搜索将成为主流趋势。报告中提到,2024年是 AI 实验的阶段,而2025年则是企业…
近日,OpenAI 宣布从竞争对手 Google DeepMind 引入三名资深计算机视觉和机器学习工程师,进一步加强其在人工智能领域的研发能力。 这三位新员工分别是 Lucas Beyer、Alex…