今日AIGC相关新闻总结(2025年11月14日)
一、大模型领域:头部企业迭代核心产品,技术路线差异化显著
1. 百度文心大模型 5.0 正式发布:原生全模态成关键突破
- 核心参数与技术:参数量达 2.4 万亿,采用原生全模态统一建模技术,依托飞桨框架的超稀疏混合专家架构,推理时仅激活不到 3% 参数,平衡性能与效率;不同于多数模型的 “后期融合”,其从训练阶段就融合文本、图像、音频、视频等多模态数据,实现理解与生成一体化。
- 能力表现:在多模态理解、指令遵循、创意写作、智能体规划等方面突出,40 余项权威基准评测显示,语言与多模态理解能力比肩 Gemini-2.5-Pro、GPT-5-High,图像与视频生成能力接近垂直领域专精模型,达全球领先水平;此前 LMArena 排名中,其文本任务位列全球并列第二、中国第一。
- 落地应用:预览版已上线文心 App,开发者和企业可通过百度千帆大模型平台调用 API,百度创始人李彦宏强调 “智能是最大应用,技术迭代速度是唯一护城河”,将持续推高智能天花板。
2. OpenAI GPT-5.1 发布:聚焦 “人性化交互” 与自适应推理
- 模型体系:推出 GPT-5.1 Instant(日常交互)、GPT-5.1 Thinking(高级推理)两款新模型,及 Auto 自动切换系统 —— 可根据任务复杂度(如日常写作 / 复杂编程)自动选择模型,复杂任务时启用 “思考模式”,用户可点击 “Answer now” 切换回快速响应。
- 体验升级:默认风格更温暖、具同理心,减少专业术语;新增 8 种个性化预设风格(默认、专业、友好等),部分用户可微调回复简洁度、热情度及表情符号频率,系统还能感知偏好并主动适配;GPT-5.1 Pro 版本在研发中,当前 Pro 用户仍使用 GPT-5 Pro。
- 权限与过渡:免费用户每 5 小时限 10 条消息,Plus 用户每 3 小时限 160 条(临时提额);付费用户(Plus/Pro/Business)今日可手动选择模型,免费用户逐步覆盖;旧版 GPT-5 将在付费用户菜单中保留 3 个月,API 本周晚些时候更新。
二、视频生成技术:字节自回归模型突破,挑战传统扩散模型
字节跳动在 NeurIPS’25 发表论文,推出视频生成方法InfinityStar,以 “高效 + 高质量” 打破行业对扩散模型(DiT)的依赖:
- 核心优势:单 GPU 一分钟可生成 5 秒 720p 视频,在文生图(T2I)、文生视频(T2V)、图生视频(I2V)任务中表现卓越,VBench 评测超越 HunyuanVideo 等 DiT 类模型。
- 关键技术:采用离散自回归架构,通过 “时空金字塔建模” 拆分视频(首帧用图像金字塔抓静态外观,后续片段加时间维度抓动态),搭配高效视觉分词器(多尺度残差量化 + 知识继承)与优化的时空自回归 Transformer(语义尺度重复、时空稀疏注意力等),实现架构统一与效率提升。
- 行业意义:为视频生成提供新路线,自回归模型的高效性更适配实际部署,未来或推动内容创作、视频制作领域变革。
1. 极佳视界获亿元级 A1 轮融资,华为哈勃联合领投
- 企业定位:2023 年成立的具身智能基础模型企业,聚焦 “世界模型驱动的物理世界通用智能”,产品涵盖世界模型平台 GigaWorld(驾驶 / 具身)、具身基础模型 GigaBrAIn、通用具身本体 Maker。
- 技术价值:可改善高维数据稀缺、传统仿真器 Sim2Real Gap 问题,提升强化学习训练效果;创始人黄冠预测,“物理世界 ChatGPT 时刻” 将在 2-3 年内到来,目标是通过 “世界模型(泛化性)+VLA(作业复杂性)+ 强化学习(准确率)” 协同,让物理 AI 在 90% 场景中成功率达 95%。
- 合作与规划:华为除投资外,还从多业务线推进战略合作;融资将用于模型研发、通用具身人形本体开发及标杆场景商业化落地。
2. 北京发布人形开源 VLM 模型,推动具身智能落地
北京团队推出最新开源视觉语言模型(VLM),针对人形机器人场景优化,可提升机器人对物理环境的理解与任务执行能力,为具身智能发展提供关键技术支撑,加速机器人 “感知 – 规划 – 行动” 全链路落地。
四、AI 应用与生态:办公、交易、医疗多场景开花
1. 百度 GenFlow 3.0:办公智能体升级,拓展海外市场
百度文库与百度网盘联合发布 GenFlow 3.0,定位 “全球最大通用智能体”:
- 核心功能:搭载首个 “吃透办公套件” 的 Office Agent,支持一句话生成 / 编辑文档、执行复杂专业操作;活跃用户超 2000 万,海外推出一站式 AI 学习办公平台「Oreate」,践行 “超级应用成就超级个体” 理念。
2. 全球首个 ai agent 交易市场 MuleRun 2.0 上线
上线一个月用户数突破 50 万,为 AI Agent 提供交易与流通平台,推动 Agent 技术从研发走向商业化应用,完善 AI 生态链路。
3. 医疗 AI:国产模型达全球水平,32 位专家制定评测标准
- 技术突破:国产医疗 AI(如 MedGPT)临床诊疗能力问鼎全球,协和等 32 位一线专家联合制定《Clinical Safety-Effectiveness Dual-Track Benchmark(CSEDB)》,涵盖 30 项标准(危急重症识别、指南依从性等),2069 道开放式问答覆盖 26 个临床科室。
- 评测结果:6 款 LLM 平均得分 57.2%(安全 54.7%、有效性 62.3%),高风险场景性能下降 13.3%;领域专用医疗 LLM 表现优于通用模型,安全最高分 0.912、有效性 0.861,为医疗 AI 临床应用提供标准化评测依据。
五、行业动态与资本动作
- 腾迈医药获 2200 万美元 A 轮追加融资:累计融资超 8000 万美元,资金将用于加速 AI 驱动的药物创新研发,推动 AI 在生物医药领域的产业化。
- AI Coding 领域估值飙升:头部团队(如 Cursor 相关)2 年估值达 2050 亿,近期再获 160 亿融资,成为硅谷应用赛道 “最贵 300 人团队”,反映市场对 AI 代码生成技术的高度认可。
- 孙正义清仓英伟达股票:继上一次 “价值 2500 亿美元” 教训后,软银再次调整 AI 相关投资布局,引发行业对 AI 硬件投资热度的讨论。
- 小米组建 AI 团队:前 deepseek 高管罗福莉正式加盟,领军小米 MiMo 项目,雷军曾以千万年薪争取,强化小米在 AI 大模型领域的竞争力。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则