内容持续更新中
月之暗面近日宣布,旗下最强编程模型、原生多模态大模型 Kimi K2.5正式接入 Kimi Code。为了庆祝这一技术跨越,官方同步推出了限时福利与重磅计费调整,旨在为开发者提供更畅快、更精准的 AI…
2026年1月29日,商汤科技正式宣布开源其多模态自主推理模型 SenseNova-MARS,并同步提供8B 和32B 两个版本。这款模型的发布,标志着多模态大模型在自主推理领域迈出了关键一步。 技术…
企业级AI智能体(AI Agent)赛道迎来高速增长拐点。据最新发布的《2025年Q3全球企业级AI Agent优秀厂商图谱》,神州云动(CloudCC)凭借其多模态大模型融合平台成功入选,成为国内少…
全球多模态大模型竞争格局再更新。近日,权威评测平台SuperCLUE-VLM发布2025年12月多模态视觉语言模型综合榜单,谷歌Gemini-3-Pro以83.64分断层领先,展现其在视觉理解与推理领…
在AI智能体(Agent)向复杂、多步任务演进的关键阶段,开源社区迎来一员新锐猛将。Jan团队今日正式发布 Jan-v2-VL-Max——一款300亿参数的多模态大模型,专为长周期、高稳定性自动化执行…
开源 AI 项目 Jan 团队近日正式推出了全新的多模态大模型 Jan-v2-VL-Max。这款拥有30B 参数的模型并非盲目追求通用性,而是精准锁定在“长周期执行任务”这一核心痛点上,旨在解决 AI…
前字节跳动视觉大模型AI平台负责人潘欣已于本周到岗,出任多模态AI创新业务负责人,直接向美团技术委员会汇报。至此,这家市值千亿港元的生活服务巨头在 2025 年“外卖+AI”战略中补齐了最核心的一块算…
智谱正式并上线开源 GLM-4.6V 多模态大模型系列,含基础版 GLM-4.6V(总参106B,激活12B)与轻量版 GLM-4.6V-Flash(9B)。新模型将上下文窗口提升至128k toke…
12月4日,北京智源人工智能研究院正式发布新一代多模态大模型Emu3.5,被誉为“真正理解物理世界的AI”。与以往图像、视频、文本模型各自为战不同,Emu3.5首次实现“世界级统一建模”,让AI从“会…
当AI生成内容席卷广告行业,虚假宣传、违规素材和恶意诱导也悄然滋生。面对这场由技术催生的新风险,巨量引擎选择用更强大的AI来守护秩序。近日,其首次公开自研的AI广告治理大模型,以“全链路治理”为框架、…
多模态大模型(MLLM)在解决复杂问题方面逐渐展现出强大的潜力。然而,这些模型在处理复杂推理时常常显得 “耿直”,缺乏反思能力,导致在面对需要多次尝试的挑战时难以回头。为了解决这一问题,上海交通大学与…
2025年9月19日,生数科技宣布完成新一轮数亿元人民币规模的A轮融资,此次融资由博华资本领投,百度战投、北京市人工智能产业投资基金、启明创投、达泰资本、BV百度风投等老股东持续跟投,同时建发新兴投资…
阿里巴巴集团旗下智能信息事业群近日启动了近年最大规模的AI人才招聘计划,面向社招与校招,总规模接近千人,覆盖北京、上海、杭州、广州等核心城市。 本轮招聘重点聚焦大语言模型、多模态识别与理解、多模态训练…
小米宣布开源全新版本的多模态大模型——Xiaomi MiMo-VL-7B-2508,并同步推出 SFT 和 RL 两个模型版本。此次升级不仅优化了输出模式,还提升了 RL 训练的稳定性,在多项能力评测…
小米大模型团队宣布开源最新一代多模态大模型 Xiaomi MiMo-VL-7B-2508,包含 RL 与 SFT 两个版本。 官方数据显示,新版模型在学科推理、文档理解、图形界面定位及视频理解四项核心…
小红书 Hi Lab 近日发布并开源了其首个自研多模态大模型 dots.vlm1。该模型基于12亿参数的 NaViT 视觉编码器 和 DeepSeek V3大语言模型,从零开始完全训练,其卓越性能在多…
OpenBMB 团队近日宣布,新一代多模态大模型 MiniCPM-V4.0 正式开源发布。该模型凭借其轻量级架构和卓越性能,被誉为“手机上的 GPT-4V”,有望为移动设备上的 AI 应用…
小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型,这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩,更在…
在人工智能技术飞速发展的今天,中国科学院计算技术研究所自然语言处理团队推出了一款名为 Stream-Omni 的文本 – 视觉 – 语音多模态大模型。这一模型的核心亮点在于它能…
近日,意大利特伦托大学、德国柏林工业大学及慕尼黑工业大学的研究团队联合推出了开源多模态大模型 EarthMind,该模型旨在高效分析和理解复杂的地球观测数据。这一创新的模型能够处理多粒度和多传感器的地…
2025年6月29日,阿里巴巴国际AI团队正式发布了全新多模态大模型 **Ovis-U1**,标志着其在多模态人工智能领域的又一重大突破。作为Ovis系列的最新力作,Ovis-U1将多模态理解、图像生…
近日,Qwen VLo多模态大模型正式发布,该模型在图像内容理解与生成方面取得了显著进展,为用户带来了全新的视觉创作体验。 据介绍,Qwen VLo在继承原有Qwen-VL系列模型优势的基础上,进行了…
近日,来自香港大学、香港中文大学以及商汤科技的研究团队发布了一个令人瞩目的新框架 ——GoT-R1。这一全新的多模态大模型通过引入强化学习(RL),在视觉生成任务中显著提升了 AI 的语义和空间推理能…