大语言模型相关资讯及大语言模型相关产品 | 第 2 页

Unsloth Studio 发布：首个本地可视化大模型微调平台，显存占用降低 70%

知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面，旨在大幅降低软件工程师微调大语言模型（LLM）的门槛，让开发者彻底告别复杂的 C…

技术优化仍需打磨:Meta 宣布 Llama4发布计划推迟至5月

据知情人士透露，Meta 已决定将其备受期待的新一代大语言模型 Llama4的发布时间至少推迟至今年5月。尽管扎克伯格曾多次表达对该模型的厚望，但研发团队在基础模型的性能微调与逻辑推理优化过程中遇到了…

读完 500 万篇新闻，谷歌 Gemini 成功预测全球山洪灾害

山洪暴发因其突发性和局部性，一直是全球气象预报中最难攻克的“幽灵”灾害。今日，谷歌宣布通过一种极具创意的方案破解了这一难题:利用大语言模型挖掘新闻报道中的非结构化数据，成功构建了覆盖全球的山洪预测体系…

xAI发布Grok4.20:推理性能提升显著，不幻觉率78%创行业纪录

2026年3月12日，xAI正式发布新一代大语言模型Grok4.20Beta，该模型在保持价格竞争力的同时，凭借极高的事实可靠性刷新了行业纪录。根据Artificial Analysis的最新评估，…

杨立昆进军“世界模型”：其 AI 初创公司完成 10.3 亿美元融资

图灵奖得主、Meta 前首席人工智能科学家杨立昆（Yann LeCun）创办的初创公司 Advanced Machine Intelligence (AMI) 周二宣布，已成功筹集 10.3 亿美元 …

毁灭性风险！研究发现 AI 在 95% 模拟核危机中倾向选择“核打击”

当人工智能掌握了核武器的“发射按钮”，世界会变得更安全吗？伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示，在模拟核危机场景中，大语言模型（LLM）更倾向于升级冲突，甚至在…

小而强、轻而快！通义千问 Qwen3.5 推出多款小尺寸模型，适配消费级显卡

阿里通义实验室宣布，正式推出其最新一代大语言模型 Qwen3.5的系列小尺寸版本。本次发布的模型涵盖了0.8B、2B、4B 以及9B 四种参数规模，旨在通过极致的性能优化，降低 AI 技术的应用门槛，…

检索速度狂飙 948 倍！Google DeepMind 推出 STATIC 框架，攻克 LLM 生成式检索难题

在现代工业推荐系统中，基于大语言模型（LLM）的“生成式检索(GR)”正逐渐取代传统的嵌入式搜索。然而，这种模式在实际应用中面临一个棘手问题:模型容易“胡言乱语”，生成不存在的商品 ID 或违反库存逻…

体积减半性能不减!西班牙 Multiverse 靠量子压缩术挑战 OpenAI

针对大语言模型（LLM）体积臃肿、部署成本高昂的痛点，西班牙 AI 初创公司 Multiverse Computing 正在通过独特的“压缩术”打破僵局，试图在企业级 AI 市场与 OpenAI 等巨…

融资2.55亿美元:AI实验室Fundamental破茧而出，用Nexus模型重塑大模型分析能力

AI初创实验室 Fundamental 正式结束隐身状态。公司宣布已成功筹集2.55亿美元的 A 轮融资，投后估值达到12亿美元。本轮融资由 Oak HC/FT、Valor Equity Partne…

卡内基梅隆大学研发新 AI 系统：像“指挥家”一样实时修复 3D 打印缺陷

3D 打印技术虽然革新了制造业，但由于大多数设备采用“开环系统”，极其微小的参数波动都可能导致打印失败。近日，卡内基梅隆大学机械工程系副教授 Amir Barati Farimani 团队开发出一种基…

研究揭示就业寒冬早于 ChatGPT 问世，AI 冲击波早在2022年初已显现

长期以来，公众普遍认为 AI 对就业市场的冲击始于2022年11月 ChatGPT 的发布，但由匹兹堡大学摩根·弗兰克领导的最新研究通过大数据分析打破了这一固有认知。研究团队深度挖掘了美国劳工部失业数…

一年狂飙500%！“AI教母”李飞飞再造神话，World Labs50 亿美元估值剑指世界模型

在生成式AI的浪潮中，大语言模型（LLM）的红利正逐渐被巨头瓜分，而“AI教母”李飞飞早已敏锐地锁定并领跑在下一条黄金赛道上。根据彭博社的最新消息，由李飞飞创办的初创公司World Labs正在进行一…

东软集团携手 Cerence AI，打造未来智能座舱新体验

近日，东软集团与全球领先的人工智能技术公司 Cerence AI 正式签署了一项战略合作协议，旨在共同开发新一代智能座舱平台。此次合作重点将放在智能语音和大语言模型等前沿技术领域，目标是为全球汽车制造…

宾大团队运用AI大模型，纳米超表面设计速度提升至 “毫秒” 级别！

在最新的科技突破，宾法尼亚州立大学的研究团队开发出了一种性的超表面设计方法，这种利用人工智能大语言模型，大幅度缩短了超表面的设计时间。超表面是一种可以通过其结构操控线和电磁波的材料，广泛应用于虚拟现实…

福特2026CES 官宣:AI 助手明年上线，2028年直指“无视线”自动驾驶

在2026年国际消费电子展（CES）上，福特汽车通过一场聚焦“科技与人文交汇”的演讲，正式揭晓了其未来两年的智能化核心蓝图，标志着这家传统巨头在 AI 驱动与自动驾驶领域的全面发力。福特…

DeepSeek 发布重大研究:仅靠优化架构即可显著提升 AI 推理能力

近日，知名 AI 实验室DeepSeek发表了一项极具影响力的研究论文，揭示了通过优化神经网络架构而非仅仅增加模型规模，也能大幅提升大语言模型的推理表现。这一发现为 AI 行业提供了一条不依赖于“无限…

隐私不再是问题！WitNote—— 你的离线 AI 笔记助手

在当今信息安全日益受到关注的背景下，许多人对于在线 AI 笔记工具的隐私问题感到忧虑，尤其是在需要频繁支付订阅费的情况下。为了解决这一难题，一位独立开发者推出了 WitNote—— 一款完全离线的 A…

1美元跑200个浏览器任务！开源浏览器操控神器BU-30B-A3B-Preview横空出世

近日，知名开源浏览器自动化项目BrowserUse正式发布了其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便引发广泛关注，被誉为“网页代理（Web Agent）领域的全新…

蚂蚁开源 LLaDA2.0，业内首个100B 参数规模的扩散语言模型

在大语言模型技术发展的新潮流中，蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列，这是业内首个参数规模达到100B 的离散扩散大语言模型（dLLM）。这一创新的模型不仅打破了扩散模型难以规模化的固…

阿里通义推出新型强化学习方法 SAPO，让大语言模型更稳更强

在大语言模型（LLM）发展的浪潮中，阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 ——Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标是解…

普惠算力新解法：英博云如何通过 K8S 原生架构降低 AI 研发门槛

行业观察:大模型时代的算力“破局”之道随着大语言模型（LLM）与生成式 AI 的爆发式增长，算力已成为数字经济时代的核心生产力。然而，对于广大中小企业研发团队及高校科研机构而言，获取高性能、高稳定性…

我国首个无障碍 AI 伴读系统星光 AI 伴读 “小星”，助力盲童阅读

日前，我国首个专为盲童设计的无障碍 AI 伴读系统 —— 星光 AI 伴读 “小星” 正式上线。该系统由中国盲文出版社与科技公司联合研发，旨在满足盲童在阅读过程中的特殊需求。用户可以通过手机或电脑登录…

用诗歌 “破解” AI 安全防线，研究揭示潜在漏洞

最近，来自意大利 Icaro Lab 的研究者发现，诗歌的不可预测性可以成为大语言模型（LLM）安全防护的一大 “隐患”。这一研究来自一家专注于伦理 AI 的初创公司 DexAI，研究团队写了20首中…

西藏首个千亿参数藏语大模型“阳光清言”问世，人工智能在高原迈入新阶段

全球海拔最高的大语言模型正式诞生。西藏大学与本土创业团队联合发布的“阳光清言”V1.0今日亮相，模型参数量突破千亿，训练语料达288亿Token，覆盖新闻、法律、医学、教育、科技等全领域，…

图灵奖得主 LeCun 退出 Meta：大模型是 “死路”，未来在于 “世界模型”

在人工智能领域的风云变幻中，图灵奖得主 Yann LeCun 与 Meta（前 Facebook）似乎走到了分岔口。作为 Meta 的首席 AI 科学家，LeCun 长期以来一直在推动基础 AI 研究…

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

最近，一项引人关注的研究表明，大语言模型（LLM）在持续接触低质量数据后，会出现类似于人类的 “脑损伤” 现象，导致推理和记忆能力显著下降。研究者发现，AI 模型在接受高流行但低价值的社交媒体数据(如…

OpenAI重磅推出GPT-5.1:更快、更准、更具“人情味”的个性化AI助理

OpenAI正在推出其最新的大语言模型迭代——GPT-5.1，旨在将ChatGPT打造成一个更灵活、响应更快、且高度个性化的数字助理。此次更新不仅带来了更快的响应速度和更清晰的语言表达，还引入了能适应…