内容持续更新中
瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 A…
近日,知名开源项目 BentoML 推出了一款名为 llm-optimizer 的全新工具,旨在为开发者提供一种简单而高效的方法来优化大型语言模型(LLM)的推理性能。随着人工智能技术的迅速发展,LL…
德国初创公司 DeepL 宣布将业务从翻译拓展至 企业通用 AI 智能体 领域。新推出的 DeepL 智能体 能跨人力资源、市场营销等部门执行重复性和耗时任务,支持自然语言指令操作。该产品基于 Dee…
360智脑团队宣布推出全新的Light-IF系列模型,这一创新框架旨在显著提升大型语言模型(LLM)在复杂指令遵循方面的能力。随着人工智能技术的不断进步,尽管LLM在数学、编程等领域已经展现出了卓越的…
【AIbase报道】生成式人工智能,尤其是大型语言模型(LLM)的兴起,正以前所未有的速度改变知识获取的格局。奥克兰大学商学院教授帕特里克·多德在《对话》(The Conversation)上撰文指出…
在信息爆炸的时代,处理复杂的文档资料一直是企业和研究者面临的挑战。现在,腾讯开源了一款基于大型语言模型(LLM)的全新文档理解与检索工具 WeKnora,旨在帮助用户高效地从 PDF、Word、图片等…
谷歌正式发布了一款全新的开源 Python 库 LangExtract,旨在利用大型语言模型(LLM)如 Gemini,从非结构化文本中高效提取结构化信息。 这一工具的推出为开发者、数据科学家以及各行…
【AIbase 报道】近日,一家鲜为人知但备受关注的旧金山初创公司 Deep Cogito 发布了旗下 Cogito v2系列大型语言模型(LLM),试图在拥挤的开源AI赛道中突围。不同于传统的参数堆…
Mistral AI 是一家位于巴黎的科技公司,专注于开发开放式和开源的大型语言模型。近期,该公司对其一款大型语言模型进行了全面的生命周期分析,旨在评估人工智能技术的环境影响。 这项研究由 Mistr…
在《纽约时报》起诉 OpenAI 的长期版权侵权诉讼中,案件取得了重大进展。据 Ars Technica 报道,审理此案的联邦法官已授权《纽约时报》及其共同原告《纽约每日新闻》和调查报道中心,访问 O…
大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。然而,这种…
一个名为 SciArena 的全新开放平台现已上线,旨在通过人类偏好评估大型语言模型(LLM)在科学文献任务中的表现。早期结果已揭示不同模型之间存在显著的性能差距。 SciArena 由耶鲁大学、纽约…
最近,苹果公司在人工智能领域面临了一场不小的风波。一位重要的高级研究员汤姆・冈特(Tom Gunter)在公司工作八年后选择离职,这一消息引发了内部的广泛关注。冈特在大型语言模型方面的专业知识被认为是…
美国加州北区地方法院作出了一项重要裁决,允许使用受版权保护的作品来训练人工智能模型。这个决定引发了广泛的关注和争议,尤其是在创意产业中,许多艺术家和内容创作者对此表示担忧。裁决支持了被告 Anthro…
近日,一项来自剑桥大学等机构的研究成果引发了广泛关注:大型语言模型(LLMs)不仅在自然语言处理领域崭露头角,还能为癌症治疗带来新的希望。研究人员利用 GPT-4模型,首次尝试将其作为科学假说的生成工…
一项由麻省理工学院媒体实验室的Nataliya Kosmyna及其团队主导的最新研究,深入探讨了在论文写作任务中,使用大型语言模型(LLM)如OpenAI的ChatGPT可能带来的认知成本。该研究发现…
随着人工智能的发展,大型语言模型(LLM)的应用越来越广泛,但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token,效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一…
近期,Meta 的 FAIR 团队与耶路撒冷希伯来大学的研究人员联合发布了一项新研究,表明减少大型语言模型的推理时间可以显著提高其在复杂推理任务中的表现。研究结果显示,使用较短推理链的 AI 模型准确…
Ollama官方宣布推出其最新版本Ollama v0.8,为本地运行大型语言模型(LLM)带来了突破性升级。新版本引入了流式传输响应和工具调用功能,支持实时网络搜索等交互场景,显著提升了本地AI的实用…
Mistral 公司近日发布了其全新的 Agents API,这是一个专为开发者设计的框架,旨在简化 AI 代理的创建,代理可以执行多种任务,例如运行 Python 代码、生成图像以及进行检索增强生成…
在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩散语…