内容持续更新中
近日,腾讯混元团队联合中国人民大学高瓴人工智能学院等机构,共同推出并开源了 PlanningBench。这是一个旨在评测和训练大语言模型规划能力的可扩展、可验证的数据生成框架。 PlanningBen…
字节跳动Seed团队核心研究员顾全全已确认离职。顾全全日前在社交平台发文表示,当天是其在字节跳动Seed团队的最后一天,并回顾了过去三年在AI药物发现和大语言模型预训练领域的研究成果。此次离职正值字节…
大语言模型(LLM)的智能极限究竟在哪?网络安全领域正成为检验其真实推理与复杂逻辑的“修罗场”。近日,安全研究员 Kasra Rahjerdi 发布了一项引发行业广泛关注的测试报告。他通过搭建一个故意…
安全研究员 Kasra Rahjerdi 近日发布了一项引人瞩目的报告,他通过构建一个故意留有漏洞的图书评论应用,对多款主流大语言模型的安全推理能力进行了实战测试。在这场模拟真实漏洞场景的挑战中,研究…
生成式人工智能正在加速从“只会聊天”的问答工具,演变为能够卷起袖子干活的“超级数字员工”。6月8日,云知声(9678.HK)正式发布了新一代通用大语言模型——U2。作为一款面向个人、开发者以及企业组织…
近日,网络安全领域曝出一起利用大语言模型(LLM)协助开发恶意软件的典型案例。据安全研究员Sibi Moosa监测,一名网名为“mousie-5212-super-formatter”的恶意开发者被指…
科技巨头谷歌(Google)近期对其全面推行的“AI概览”(AI Overviews)搜索功能进行了重大升级,旨在将传统的搜索引擎彻底转变为对话式引擎。然而,这一战略动作再度遭遇滑铁卢。 大量用户测试…
数字化浪潮正迎来一场前所未有的剧烈冲击。最新追踪研究显示,互联网上AI生成的英文文章数量已正式超过人类,在这个庞大的数字世界里,每两篇内容中就有一篇出自机器之手。 这类由机器批量生产的低质内容被精准地…
这是计算机科学史上注定被载入史册的时刻。英国数学家、计算机科学之父艾伦·图灵在1950年提出的伟大设想,在诞生76年后终于迎来了确凿的实证数据。 最新一期《美国国家科学院院刊》(PNAS)刊登了加州大…
在 5 月 20 日的阿里云峰会上,阿里云宣布其大模型服务平台“百炼”进一步强化开放生态,正式宣布将接入多家行业领先的第三方顶尖模型。这一举措标志着百炼已不再仅仅是阿里自研“千问”模型的展示台,而是正…
据平安湖北消息,大语言模型正在加速向垂直行业渗透,并在基层社会治理与智慧警务领域展现出具象化的实战价值。2026年5月14日,湖北潜江市公安局在侦破一起工地柴油盗窃案时,一线办案民警面对无监控视频、无…
AMD近日正式发布了专为大语言模型部署设计的vLLM-ATOM插件。该插件旨在不改变现有工作流的前提下,显著优化DeepSeek-R1、Kimi-K2 等主流国产大模型在AMD硬件上的推理性能。 作为…
谷歌近日发布了一份报告,称其安全研究团队首次发现黑客利用人工智能技术开发出了一款能够绕过广泛使用的计算机管理软件的攻击工具。这一发现引发了对网络安全新威胁的广泛关注。 根据报告,这款由网络犯罪团伙制造…
OpenAI周四正式推出GPT-Rosalind,一款专为生物学研究场景深度训练的垂直领域大语言模型。有别于谷歌、微软等巨头押注的通用科学模型路线,OpenAI这次选择了一条更聚焦的赛道——直击生物学…
苹果公司近期面向 Siri 工程师团队启动内部“AI 编程训练营”,旨在通过系统性再培训快速强化其在大语言模型(LLM)领域的工程实践能力,为新一代 Siri 及 iOS 系统的 AI 功能落地提供人…
由美国麻省总医院MESH孵化器团队开展的一项针对生成式人工智能(AI)临床推理能力的最新研究显示,尽管AI在医疗领域的渗透日益加深,但在模拟真实诊疗的逻辑链条中仍存在显著短板。相关研究成果已发表于权威…
苹果公司最近在机器学习领域发布了两项关键研究,展示了其利用大语言模型(LLM)简化 UI 开发及强化图像安全审查的最新进展。 SQUIRE:告别“盲盒式”设计 针对目前 AI 生成 UI …
4月2日,阿里官方正式发布了新一代大语言模型 Qwen3.6-Plus。这款被誉为“当下最强编程国产模型”的新作,不仅在整体性能上较3.5版本有质的飞跃,更在多个维度上无限接近全球公认的编程标杆 ——…
近日,比利时布鲁塞尔自由大学(VUB)发布了一项足以载入 AI 史册的研究成果:商用大模型已具备独立生成原创数学证明的能力。实验显示,OpenAI 旗下的 ChatGPT-5.2 (Thinking)…
维基百科长期以来对生成式 AI 的“模糊态度”终于走到了终点。 3 月 27 日,据 OSCHINA 报道,维基百科发布了最新的政策变更声明,正式明确:禁止使用大语言模型(LLM)生成或重写文章内容。…
3月26日,维基百科正式通过投票表决,宣布实施针对大语言模型(LLM)的新编辑政策,明确禁止用户直接使用 AI 生成或重写文章内容。这一举措标志着全球最大的开源百科全书在维护内容准确性与人类编辑主权方…
智能手机的算力极限在哪里?苹果的最新旗舰iPhone17Pro刚刚给出了一个既令人震撼又略显尴尬的答案。 3月23日,拥有 4000亿参数 的大语言模型在iPhone17Pro上成功跑通。要知道,即便…
知名高性能微调库 Unsloth AI 正式推出了 Unsloth Studio。这是一款开源、无代码的本地可视化界面,旨在大幅降低软件工程师微调大语言模型(LLM)的门槛,让开发者彻底告别复杂的 C…
据知情人士透露,Meta 已决定将其备受期待的新一代大语言模型 Llama4的发布时间至少推迟至今年5月。尽管扎克伯格曾多次表达对该模型的厚望,但研发团队在基础模型的性能微调与逻辑推理优化过程中遇到了…
山洪暴发因其突发性和局部性,一直是全球气象预报中最难攻克的“幽灵”灾害。今日,谷歌宣布通过一种极具创意的方案破解了这一难题:利用大语言模型挖掘新闻报道中的非结构化数据,成功构建了覆盖全球的山洪预测体系…
2026年3月12日,xAI正式发布新一代大语言模型Grok4.20Beta,该模型在保持价格竞争力的同时,凭借极高的事实可靠性刷新了行业纪录。 根据Artificial Analysis的最新评估,…
图灵奖得主、Meta 前首席人工智能科学家杨立昆(Yann LeCun)创办的初创公司 Advanced Machine Intelligence (AMI) 周二宣布,已成功筹集 10.3 亿美元 …
当人工智能掌握了核武器的“发射按钮”,世界会变得更安全吗?伦敦国王学院教授肯尼斯·佩恩的一项最新研究给出了令人不寒而栗的答案。实验显示,在模拟核危机场景中,大语言模型(LLM)更倾向于升级冲突,甚至在…