大语言模型相关资讯及大语言模型相关产品

美团辟谣LongCat模型负责人离职，持续推进国产算力万亿大模型落地

7月27日，针对市场关于美团 LongCat 团队基础模型负责人裴鹏即将离职的传言，美团官方公开表示该消息不属实。公开信息显示，裴鹏毕业于北京大学，2023年加入美团后先后担任基座模型团队预训练负责…

OpenAI人才流动：前研究员田永龙入职腾讯，深耕视觉语言模型研发

人工智能领域的人才流动近期引发关注。据最新消息，OpenAI前研究员田永龙（Yonglong Tian）已正式加盟腾讯，未来将进入腾讯大语言模型部工作，主要参与视觉语言模型（VLM）的相关研发任务。 …

以 AI 治理 AI：Reddit 升级自动化系统，日均拦截 2300 万条垃圾信息

知名论坛型社交平台 Reddit 昨日公开了其在对抗人工智能生成垃圾内容方面的最新进展。该平台通过将先进的大语言模型（LLM）与既有的自动化工具相结合，正在全力保护社区内容的真实性，向智能化黑产发起全…

Anthropic发布重磅大模型Claude Sonnet 5：性能直逼旗舰，价格却大跳水

人工智能巨头Anthropic今日正式推出全新大语言模型Claude Sonnet 5。该模型定位为极具性价比的中高阶型号，核心优势在于显著缩小了与旗下顶级旗舰Opus系列之间的性能差距。作为迄今为…

降本增效大动作：Meta 大规模启用 AI 接管内容审核

在首席执行官马克·扎克伯格（Mark Zuckerberg）全力押注人工智能的背景下，Meta 近期在内部运营层面采取了重大调整。为了优化运营成本并提升处理效率，公司正加速推进“AI 审核”战略，试图…

大模型长文本迎来新突破，智谱AI正式开源旗舰模型GLM-5.2

国内大语言模型领域再度迎来重磅升级。智谱AI今日宣布，新一代旗舰模型GLM-5. 2 正式上线并同步开源。该模型专门针对长程任务能力进行了深度打造，不仅具备高达1M的无损上下文处理能力，在编程效率上也…

腾讯与人大高瓴联合推出开源规划评测框架 PlanningBench

近日，腾讯混元团队联合中国人民大学高瓴人工智能学院等机构，共同推出并开源了 PlanningBench。这是一个旨在评测和训练大语言模型规划能力的可扩展、可验证的数据生成框架。 PlanningBen…

顾全全确认离职字节Seed团队，曾主导SeedFold与Seed2.0训练体系建设

字节跳动Seed团队核心研究员顾全全已确认离职。顾全全日前在社交平台发文表示，当天是其在字节跳动Seed团队的最后一天，并回顾了过去三年在AI药物发现和大语言模型预训练领域的研究成果。此次离职正值字节…

GPT-5. 5 拿下利用率冠军，DeepSeek V4 Pro斩获性价比之王！大模型网络安全攻防实测报告出炉

大语言模型（LLM）的智能极限究竟在哪?网络安全领域正成为检验其真实推理与复杂逻辑的“修罗场”。近日，安全研究员 Kasra Rahjerdi 发布了一项引发行业广泛关注的测试报告。他通过搭建一个故意…

GPT 5.5 称霸 AI 漏洞挑战，DeepSeek 斩获“性价比之王”

安全研究员 Kasra Rahjerdi 近日发布了一项引人瞩目的报告，他通过构建一个故意留有漏洞的图书评论应用，对多款主流大语言模型的安全推理能力进行了实战测试。在这场模拟真实漏洞场景的挑战中，研究…

告别单轮傻瓜问答！云知声发布原生智能体大模型U2，自主攻克百步复杂工作流

生成式人工智能正在加速从“只会聊天”的问答工具，演变为能够卷起袖子干活的“超级数字员工”。6月8日，云知声（9678.HK）正式发布了新一代通用大语言模型——U2。作为一款面向个人、开发者以及企业组织…

恶意开发者利用Claude编写恶意包:超670个受污染npm包威胁开源生态安全

近日，网络安全领域曝出一起利用大语言模型（LLM）协助开发恶意软件的典型案例。据安全研究员Sibi Moosa监测，一名网名为“mousie-5212-super-formatter”的恶意开发者被指…

连自己名字都拼不对?谷歌AI搜索屡屡“翻车”引发用户集体卸载

科技巨头谷歌（Google）近期对其全面推行的“AI概览”(AI Overviews)搜索功能进行了重大升级，旨在将传统的搜索引擎彻底转变为对话式引擎。然而，这一战略动作再度遭遇滑铁卢。大量用户测试…

网络快餐还是精神断粮？AI生成文章已全面碾压人类创作

数字化浪潮正迎来一场前所未有的剧烈冲击。最新追踪研究显示，互联网上AI生成的英文文章数量已正式超过人类，在这个庞大的数字世界里，每两篇内容中就有一篇出自机器之手。这类由机器批量生产的低质内容被精准地…

图灵测试尘埃落定：GPT-4. 5 胜率超真人，AI学会了完美撒谎

这是计算机科学史上注定被载入史册的时刻。英国数学家、计算机科学之父艾伦·图灵在1950年提出的伟大设想，在诞生76年后终于迎来了确凿的实证数据。最新一期《美国国家科学院院刊》（PNAS）刊登了加州大…

阿里云百炼重磅升级：全栈开放接入，打造模型“超级市场”

在 5 月 20 日的阿里云峰会上，阿里云宣布其大模型服务平台“百炼”进一步强化开放生态，正式宣布将接入多家行业领先的第三方顶尖模型。这一举措标志着百炼已不再仅仅是阿里自研“千问”模型的展示台，而是正…

AI大模型在基层执法落地，豆包助力警务破案跑出“加速度”

据平安湖北消息，大语言模型正在加速向垂直行业渗透，并在基层社会治理与智慧警务领域展现出具象化的实战价值。2026年5月14日，湖北潜江市公安局在侦破一起工地柴油盗窃案时，一线办案民警面对无监控视频、无…

加速国产大模型：AMD推出vLLM-ATOM插件大幅提升推理效率

AMD近日正式发布了专为大语言模型部署设计的vLLM-ATOM插件。该插件旨在不改变现有工作流的前提下，显著优化DeepSeek-R1、Kimi-K2 等主流国产大模型在AMD硬件上的推理性能。作为…

谷歌警告：黑客首次利用 AI 开发 “零日” 漏洞攻击工具

谷歌近日发布了一份报告，称其安全研究团队首次发现黑客利用人工智能技术开发出了一款能够绕过广泛使用的计算机管理软件的攻击工具。这一发现引发了对网络安全新威胁的广泛关注。根据报告，这款由网络犯罪团伙制造…

OpenAI发布生物学专属大模型GPT-Rosalind，剑指科研加速

OpenAI周四正式推出GPT-Rosalind，一款专为生物学研究场景深度训练的垂直领域大语言模型。有别于谷歌、微软等巨头押注的通用科学模型路线，OpenAI这次选择了一条更聚焦的赛道——直击生物学…

目标“真·AI个人助理”:苹果开办内部训练营，详解 Siri 进化底座

苹果公司近期面向 Siri 工程师团队启动内部“AI 编程训练营”，旨在通过系统性再培训快速强化其在大语言模型（LLM）领域的工程实践能力，为新一代 Siri 及 iOS 系统的 AI 功能落地提供人…

AI医疗进入“深水区”:研究指生成式模型尚难独立承担临床推理重任

由美国麻省总医院MESH孵化器团队开展的一项针对生成式人工智能（AI）临床推理能力的最新研究显示，尽管AI在医疗领域的渗透日益加深，但在模拟真实诊疗的逻辑链条中仍存在显著短板。相关研究成果已发表于权威…

苹果发布 AI 原型工具 SQUIRE，旨在重塑 UI 设计流程

苹果公司最近在机器学习领域发布了两项关键研究，展示了其利用大语言模型（LLM）简化 UI 开发及强化图像安全审查的最新进展。 SQUIRE:告别“盲盒式”设计针对目前 AI 生成 UI …

千问 3.6 正式发布：100 万长上下文，硬刚 Claude Code

4月2日，阿里官方正式发布了新一代大语言模型 Qwen3.6-Plus。这款被誉为“当下最强编程国产模型”的新作，不仅在整体性能上较3.5版本有质的飞跃，更在多个维度上无限接近全球公认的编程标杆 ——…

ChatGPT-5.2 首次独立证明数学猜想，开启“氛围证明”时代

近日，比利时布鲁塞尔自由大学（VUB）发布了一项足以载入 AI 史册的研究成果：商用大模型已具备独立生成原创数学证明的能力。实验显示，OpenAI 旗下的 ChatGPT-5.2 (Thinking)…

维基百科向 AI 下“逐客令”：严禁 LLM 生成内容，违者或遭处罚

维基百科长期以来对生成式 AI 的“模糊态度”终于走到了终点。 3 月 27 日，据 OSCHINA 报道，维基百科发布了最新的政策变更声明，正式明确：禁止使用大语言模型（LLM）生成或重写文章内容。…

维基百科发布编辑新规:投票表决通过，严禁使用 AI 生成或重写文章内容

3月26日，维基百科正式通过投票表决，宣布实施针对大语言模型（LLM）的新编辑政策，明确禁止用户直接使用 AI 生成或重写文章内容。这一举措标志着全球最大的开源百科全书在维护内容准确性与人类编辑主权方…

4000 亿参数“生啃”成功！iPhone 17 Pro 挑战本地运行超大模型，但速度只有 0.6 token

智能手机的算力极限在哪里?苹果的最新旗舰iPhone17Pro刚刚给出了一个既令人震撼又略显尴尬的答案。 3月23日，拥有 4000亿参数的大语言模型在iPhone17Pro上成功跑通。要知道，即便…