大型语言模型相关资讯及大型语言模型相关产品 | 第 2 页

OpenAI 版权诉讼新进展:《纽约时报》将可访问已删除的用户数据

在《纽约时报》起诉 OpenAI 的长期版权侵权诉讼中，案件取得了重大进展。据 Ars Technica 报道，审理此案的联邦法官已授权《纽约时报》及其共同原告《纽约每日新闻》和调查报道中心，访问 O…

OpenAI 版权诉讼新进展:《纽约时报》将可访问已删除的用户数据

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异，推出 OctoThinker

大型语言模型（LLM）通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展，如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型，展现出强大的推理能力。然而，这种…

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异，推出 OctoThinker

科学家们有话说！SciArena 平台上线，多维度评测大语言模型科学表现

一个名为 SciArena 的全新开放平台现已上线，旨在通过人类偏好评估大型语言模型（LLM）在科学文献任务中的表现。早期结果已揭示不同模型之间存在显著的性能差距。 SciArena 由耶鲁大学、纽约…

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异，推出 OctoThinker

科学家们有话说！SciArena 平台上线，多维度评测大语言模型科学表现

探秘 LLM 强化学习兼容性:上海交大揭示 Llama 与 Qwen 差异，推出 OctoThinker

苹果 AI 团队遭遇动荡:顶尖研究员离职引发信任危机

最近，苹果公司在人工智能领域面临了一场不小的风波。一位重要的高级研究员汤姆・冈特（Tom Gunter）在公司工作八年后选择离职，这一消息引发了内部的广泛关注。冈特在大型语言模型方面的专业知识被认为是…

苹果 AI 团队遭遇动荡:顶尖研究员离职引发信任危机

加州法院裁定使用版权内容训练 AI 合规，引发创作者担忧

美国加州北区地方法院作出了一项重要裁决，允许使用受版权保护的作品来训练人工智能模型。这个决定引发了广泛的关注和争议，尤其是在创意产业中，许多艺术家和内容创作者对此表示担忧。裁决支持了被告 Anthro…

AI 逆袭：大型语言模型助力癌症新药研发，竟然能 “发明” 疗法！

近日，一项来自剑桥大学等机构的研究成果引发了广泛关注:大型语言模型（LLMs）不仅在自然语言处理领域崭露头角，还能为癌症治疗带来新的希望。研究人员利用 GPT-4模型，首次尝试将其作为科学假说的生成工…

用AI会让人变笨！研究揭示：过度依赖AI或导致损坏批判性思维与记忆力

一项由麻省理工学院媒体实验室的Nataliya Kosmyna及其团队主导的最新研究，深入探讨了在论文写作任务中，使用大型语言模型（LLM）如OpenAI的ChatGPT可能带来的认知成本。该研究发现…

大模型推理大变革！CMU 与英伟达携手推出 Multiverse，实现超高速并行生成

随着人工智能的发展，大型语言模型（LLM）的应用越来越广泛，但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token，效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一…

Meta 团队研究发现:简化推理链条能显著提升 AI 准确率

近期，Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究，表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。研究结果显示，使用较短推理链的 AI 模型准确…

Ollama v0.8发布！AI流式响应+实时搜索，本地模型也能秒变智能助手！

Ollama官方宣布推出其最新版本Ollama v0.8，为本地运行大型语言模型（LLM）带来了突破性升级。新版本引入了流式传输响应和工具调用功能，支持实时网络搜索等交互场景，显著提升了本地AI的实用…

Mistral 推出全新 Agents API：助力开发者构建智能 AI 代理

Mistral 公司近日发布了其全新的 Agents API，这是一个专为开发者设计的框架，旨在简化 AI 代理的创建，代理可以执行多种任务，例如运行 Python 代码、生成图像以及进行检索增强生成…

开创性扩散思维链：让人工智能更具创造力和灵活性

在近年来的人工智能研究中，思维链的概念越来越受到重视，尤其是在大型语言模型的训练和推理中。最近，西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”，这是一种为扩散语…

阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型，性能媲美Claude-3.7

阿里巴巴今日正式发布QwenLong-L1-32B，这是一款专为长上下文推理设计的大型语言模型，标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A22…

GPT-4.1 模型遭遇质疑：对齐性和稳定性引发关注

近日，OpenAI 推出了其新一代人工智能模型 ——GPT-4.1，声称在遵循用户指令方面表现优异。然而，令人意外的是，多项独立测试的结果显示，GPT-4.1的对齐性和稳定性较之前的版本有所下降，尤其…

谷歌发布 Gemma 3 QAT 模型：一张3090显卡也能轻松驾驭

谷歌近期推出了 Gemma3系列的全新版本，这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后，谷歌便发布了经过量化感知训练（QAT）优化的 Gemma3，旨在显著降低内存需求的同时，保持模型的高…

别再只玩ChatGPT了！OpenAI悄悄发布《构建 Agent 实战指南》手把手教你打造智能体

OpenAI 最近悄悄发布了一份《构建 Agent 实战指南》（A practical guide to building agents），简直就是一份“AI 打工人”的养成手册!今天，老司机我就…

AI 基准测试平台 Chatbot Arena 成立一家新公司

在 AI 行业快速发展的背景下，Chatbot Arena 这个众包 AI 基准测试项目正在扩展其影响力，正式成立了一家名为 Arena Intelligence Inc. 的新公司。根据彭博社的报道…

OpenAI 发布“智能体构建实战指南”实用性文档（附文档资源）

人工智能领域领军企业 OpenAI 近日重磅发布了一份名为“构建智能体实践指南”（"A practical guide to building agents"）的实用性文档。这份共…

微软推出新型语言模型 BitNet b1.58 2B4T，仅占用0.4GB内存

近日，微软研究团队正式发布了一款名为 BitNet b1.582B4T 的开源大型语言模型。这款模型拥有20亿参数，采用了独特的1.58位低精度架构进行原生训练，与传统的训练后量化方式相比，BitNe…

亚洲崛起：DeepSeek、巨额投资与数据中心助力 AI 竞争力

在今年的达沃斯世界经济论坛上，众多商界和政界领袖齐聚一堂，普遍认为美国科技巨头在人工智能（AI）领域占据主导地位，而中国乃至整个亚洲似乎都在这一赛道上滞后。然而，在与会者离开后，这种看法开始遭遇挑战。…

Gartner报告显示：2027年，任务特定AI将超越通用AI

近日，Gartner 发布了一份新报告，指出到2027年，企业将使用任务特定的人工智能模型的频率是通用大型语言模型的三倍。报告中提到，虽然通用的语言模型在语言处理方面具有强大的能力，但在需要深入理解特…

智谱全新站点 http://z.ai 正式启用

北京智谱华章科技有限公司（以下简称智谱）全新官方网站 https://z.ai 已全面上线。据 AIbase 了解，该平台集成了最新的对话、推理与沉思三款 GLM 模型，自今日起全面向全球用户免费开放…