内容持续更新中
埃隆马斯克的xAI今天宣布其应用程序编程接口(API)现已向公众开放,并且到今年年底每月可免费获得25美元的API积分。该API允许开发人员在xAI的Grok大型语言模型(LLM)上构建应用程序。 x…
2024年11月5日 – Anthropic正式发布了新一代快速模型Claude 3.5 Haiku。该公司表示,在与Claude 3 Haiku相似的速度下,Claude3.5…
近日,Meta AI 的研究团队与加州大学伯克利分校及纽约大学的研究人员合作,推出了一种名为思维偏好优化(Thought Preference Optimization, TPO)的方法,旨在提升经过…
麻省理工学院(MIT)本周展示了一种全新的机器人训练模型,该模型放弃了以往专注于特定数据集的训练方法,转而采用类似大型语言模型(LLMs)训练时使用的海量信息。 研究人员指出,模仿学习——即代理通过模…
Meta 近日宣布,其 MobileLLM 模型现已向研究人员开放,用户可在 Hugging Face 平台上免费下载并使用这些模型,这些模型已与 Transformers 库全面集成。 这一举措旨在…
AI 竟然开始“长脑子”了?!麻省理工学院的最新研究表明,大型语言模型(LLM)的内部结构,竟然和人脑有着惊人的相似之处! 这项研究利用稀疏自编码器技术,对LLM的激活空间进行了深入分析,发现了三个层…
大型语言模型(LLM)如GPT系列,凭借庞大的数据集,在语言理解、推理和规划方面展现出惊人的能力,在各种挑战性任务中已达到与人类相当的水平。大多数研究都集中在通过在更大的数据集上训练这些模型来进一步增…
大型语言模型(LLM)的横空出世,尤其是ChatGPT等应用的普及,彻底改变了人机交互的方式。 这些模型能够生成连贯且全面的文本,令人印象深刻。然而,尽管能力强大,LLM却容易产生“幻觉”,即生成看似…
近日,Google DeepMind 正在将其 SynthID 技术集成到其 Gemini 模型中,并将其作为开源项目发布。SynthID for Text 使用复杂的流程来干预大型语言模型 (LLM…
近日,网络安全公司 Palo Alto Networks 的 Unit42研究团队发布了一项令人瞩目的研究,揭露了一种名为 “Deceptive Delight”的新型越狱方法。 这个方法能够在仅仅两…
最近,谷歌宣布将其文本水印工具 SynthID 开源,旨在帮助开发者更好地识别 AI 生成的文本。这一工具现已通过谷歌的 “负责任生成 AI 工具包” 向公众开放使用。 谷歌 DeepMind 的研究…
近年来,大型语言模型(LLMs)在数据管理领域受到了广泛关注,应用范围不断扩大,包括数据整合、数据库调优、查询优化以及数据清洗等。然而,处理非结构化数据,尤其是复杂文档时,依然面临许多挑战。 目前一些…
《华尔街日报》的母公司道琼斯和《纽约邮报》正在起诉AI驱动的搜索创业公司Perplexity,原因是该公司使用它们的新闻内容来训练其大型语言模型。 这两家新闻集团旗下的出版物指控Perplexity侵…
在未来的2025年,生成式人工智能(GenAI)有望迎来一个关键的转折点,届时我们将更清楚地看到其真正潜力的展现。随着对其在各个行业多种应用案例的分析逐步深入,原本笼罩在噪音中的 GenAI 将逐渐显…
一项新的研究表明,大型语言模型中出于善意的安全措施可能会带来意外的弱点。研究人员发现,根据不同的人口统计学术语,模型被“越狱”的难易程度存在显著差异。这项名为“Do LLMs Have Politic…
瑞士洛桑联邦理工学院 (EPFL) 的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评…
一项由以色列理工学院主导的最新研究表明,大型语言模型(LLM)可能“深藏不露”,掌握的知识比实际表现出来的更多。研究人员发现,LLM 的内部表征编码了关于其输出正确性的信息,即使它们最终生成了错误的答…
大型语言模型在许多任务中表现出色,但其推理能力一直备受争议。Meta 的研究人员近日发表论文,展示了他们如何利用 Transformer 模型解决数学领域一个长期存在的难题:发现动力系统的全局李雅普诺…
最近,Meta、加州大学伯克利分校和纽约大学的科学家们合作研发了一种新技术,名为 “思维偏好优化”(Thought Preference Optimization,简称 TPO)。这项技术的目标是提升…
加拿大卡尔加里大学的研究人员开发了一款名为“Augmented Physics”的全新工具,旨在将静态的物理课本图表转化为交互式模拟,为物理教育带来革新。 该工具利用先进的计算机视觉技术,如 Segm…
最近在寻找能提升编程效率的工具?我强烈推荐你试试 DevKit!这款AI驱动的开发者助手,彻底改变了我的编程体验,现在分享一下我的真实感受。 DevKit (https://www.getdevkit…
一个名为OpenR的创新开源框架近日问世,旨在解决大型语言模型(LLMs)在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架,通…
在人工智能的世界里,机器学习模型尤其是大型语言模型(LLMs)的推理能力一直是科学家们关注的焦点。 最近,苹果公司的AI研究团队发表了一篇论文,题为《理解大型语言模型在数学推理上的局限性》,为我们揭开…
最近,超长上下文窗口的大型语言模型(LLMs)成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记,为开发者开启了许多新的可能性。不过,这些长上下文 LLM 到底能多好地理解和利用…
沃尔玛一直以来都在积极探索人工智能的应用,最近他们开始测试自己的大型语言模型(LLM),名为 Wallaby。 这款模型是专为零售行业设计,经过了数十年的沃尔玛数据训练,能够更好地理解员工和顾客的沟通…
近日,谷歌宣布推出一款名为 “gemma-2-2b-jpn-it” 的新模型,这是其 Gemma 系列语言模型的最新成员。这个模型专门针对日本语言进行优化,展示了谷歌在大型语言模型(LLM)领域持续投…
随着人工智能越来越多地融入企业的工作流程和产品,市场上对机器学习操作平台(MLOps)的需求也在不断上升。这类平台帮助企业更轻松地创建、测试和部署机器学习模型。然而,尽管市场上已有不少竞争者,比如 I…
在自然语言处理领域,大型语言模型(LLMs)的发展迅速,已经在多个领域取得了显著的进展。不过,随着模型的复杂性增加,如何准确评估它们的输出就变得至关重要。传统上,我们依赖人类来进行评估,但这种方式既耗…