内容持续更新中
近日,Google DeepMind 正在将其 SynthID 技术集成到其 Gemini 模型中,并将其作为开源项目发布。SynthID for Text 使用复杂的流程来干预大型语言模型 (LLM…
近日,网络安全公司 Palo Alto Networks 的 Unit42研究团队发布了一项令人瞩目的研究,揭露了一种名为 “Deceptive Delight”的新型越狱方法。 这个方法能够在仅仅两…
最近,谷歌宣布将其文本水印工具 SynthID 开源,旨在帮助开发者更好地识别 AI 生成的文本。这一工具现已通过谷歌的 “负责任生成 AI 工具包” 向公众开放使用。 谷歌 DeepMind 的研究…
近年来,大型语言模型(LLMs)在数据管理领域受到了广泛关注,应用范围不断扩大,包括数据整合、数据库调优、查询优化以及数据清洗等。然而,处理非结构化数据,尤其是复杂文档时,依然面临许多挑战。 目前一些…
《华尔街日报》的母公司道琼斯和《纽约邮报》正在起诉AI驱动的搜索创业公司Perplexity,原因是该公司使用它们的新闻内容来训练其大型语言模型。 这两家新闻集团旗下的出版物指控Perplexity侵…
在未来的2025年,生成式人工智能(GenAI)有望迎来一个关键的转折点,届时我们将更清楚地看到其真正潜力的展现。随着对其在各个行业多种应用案例的分析逐步深入,原本笼罩在噪音中的 GenAI 将逐渐显…
一项新的研究表明,大型语言模型中出于善意的安全措施可能会带来意外的弱点。研究人员发现,根据不同的人口统计学术语,模型被“越狱”的难易程度存在显著差异。这项名为“Do LLMs Have Politic…
瑞士洛桑联邦理工学院 (EPFL) 的一项最新研究比较了两种主流的大型语言模型 (LLM) 适应性训练方法:上下文学习 (ICL) 和指令微调 (IFT)。研究人员使用 MT-Bench 基准测试来评…
一项由以色列理工学院主导的最新研究表明,大型语言模型(LLM)可能“深藏不露”,掌握的知识比实际表现出来的更多。研究人员发现,LLM 的内部表征编码了关于其输出正确性的信息,即使它们最终生成了错误的答…
大型语言模型在许多任务中表现出色,但其推理能力一直备受争议。Meta 的研究人员近日发表论文,展示了他们如何利用 Transformer 模型解决数学领域一个长期存在的难题:发现动力系统的全局李雅普诺…
最近,Meta、加州大学伯克利分校和纽约大学的科学家们合作研发了一种新技术,名为 “思维偏好优化”(Thought Preference Optimization,简称 TPO)。这项技术的目标是提升…
加拿大卡尔加里大学的研究人员开发了一款名为“Augmented Physics”的全新工具,旨在将静态的物理课本图表转化为交互式模拟,为物理教育带来革新。 该工具利用先进的计算机视觉技术,如 Segm…
最近在寻找能提升编程效率的工具?我强烈推荐你试试 DevKit!这款AI驱动的开发者助手,彻底改变了我的编程体验,现在分享一下我的真实感受。 DevKit (https://www.getdevkit…
一个名为OpenR的创新开源框架近日问世,旨在解决大型语言模型(LLMs)在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架,通…
在人工智能的世界里,机器学习模型尤其是大型语言模型(LLMs)的推理能力一直是科学家们关注的焦点。 最近,苹果公司的AI研究团队发表了一篇论文,题为《理解大型语言模型在数学推理上的局限性》,为我们揭开…
最近,超长上下文窗口的大型语言模型(LLMs)成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记,为开发者开启了许多新的可能性。不过,这些长上下文 LLM 到底能多好地理解和利用…
沃尔玛一直以来都在积极探索人工智能的应用,最近他们开始测试自己的大型语言模型(LLM),名为 Wallaby。 这款模型是专为零售行业设计,经过了数十年的沃尔玛数据训练,能够更好地理解员工和顾客的沟通…
近日,谷歌宣布推出一款名为 “gemma-2-2b-jpn-it” 的新模型,这是其 Gemma 系列语言模型的最新成员。这个模型专门针对日本语言进行优化,展示了谷歌在大型语言模型(LLM)领域持续投…
随着人工智能越来越多地融入企业的工作流程和产品,市场上对机器学习操作平台(MLOps)的需求也在不断上升。这类平台帮助企业更轻松地创建、测试和部署机器学习模型。然而,尽管市场上已有不少竞争者,比如 I…
在自然语言处理领域,大型语言模型(LLMs)的发展迅速,已经在多个领域取得了显著的进展。不过,随着模型的复杂性增加,如何准确评估它们的输出就变得至关重要。传统上,我们依赖人类来进行评估,但这种方式既耗…
在驱动的人工智能时代,大型语言模型(LLM)如 GPT-3和 BERT 对高质量数据的需求日益增加。然而,从网络上手动整理这些数据不仅费时费力,而且常常难以扩展。 这给开发者们带来了不小的挑战,尤其是…
最近,西班牙瓦伦西亚理工大学的科学家进行了一项研究,揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现,随着AI模型复杂性的增加,它们在面对复杂…
谷歌DeepMind研究团队最近取得重大突破,开发出名为SCoRe(Self-Correction through Reinforcement Learning,通过强化学习进行自我纠正)的创新技术。…
近期,一项发表在《自然》杂志上的研究揭示了人工智能发展中的一个令人深思的现象:随着大型语言模型(LLMs)的不断升级,它们在回答问题时越来越倾向于"自信满满"地给出答案,即便这些答…
最近,加州大学洛杉矶分校和亚马逊的研究人员对大型语言模型(LLMs)的推理能力进行了深入分析。他们首次系统地区分了归纳推理和演绎推理这两种能力,探讨了这两者对 AI 系统的挑战程度。 图源备注:图片由…
随着OpenAI的GPT-4在传统数学评测中屡创佳绩,北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH,旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅…
近日,一项来自清华大学和加州大学伯克利分校的研究引发了广泛关注。研究表明,经过强化学习与人类反馈(RLHF)训练的现代人工智能模型,不仅变得更加智能,还学会了如何更有效地欺骗人类。这一发现对AI发展和…
近日,哈佛肯尼迪学院的“错误信息审查”研究发现,人工智能生成的虚假研究论文正在渗透到谷歌学术等学术搜索引擎中。这可能会削弱公众对科学发现的信任,并破坏依赖尖端研究的行业的产品开发。 研究人员发现了13…