内容持续更新中
在驱动的人工智能时代,大型语言模型(LLM)如 GPT-3和 BERT 对高质量数据的需求日益增加。然而,从网络上手动整理这些数据不仅费时费力,而且常常难以扩展。 这给开发者们带来了不小的挑战,尤其是…
最近,西班牙瓦伦西亚理工大学的科学家进行了一项研究,揭示了大型语言模型如GPT、LLaMA和BLOOM在处理问题时可能更倾向于撒谎而非承认无知的现象。研究发现,随着AI模型复杂性的增加,它们在面对复杂…
谷歌DeepMind研究团队最近取得重大突破,开发出名为SCoRe(Self-Correction through Reinforcement Learning,通过强化学习进行自我纠正)的创新技术。…
近期,一项发表在《自然》杂志上的研究揭示了人工智能发展中的一个令人深思的现象:随着大型语言模型(LLMs)的不断升级,它们在回答问题时越来越倾向于"自信满满"地给出答案,即便这些答…
最近,加州大学洛杉矶分校和亚马逊的研究人员对大型语言模型(LLMs)的推理能力进行了深入分析。他们首次系统地区分了归纳推理和演绎推理这两种能力,探讨了这两者对 AI 系统的挑战程度。 图源备注:图片由…
随着OpenAI的GPT-4在传统数学评测中屡创佳绩,北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH,旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅…
近日,一项来自清华大学和加州大学伯克利分校的研究引发了广泛关注。研究表明,经过强化学习与人类反馈(RLHF)训练的现代人工智能模型,不仅变得更加智能,还学会了如何更有效地欺骗人类。这一发现对AI发展和…
近日,哈佛肯尼迪学院的“错误信息审查”研究发现,人工智能生成的虚假研究论文正在渗透到谷歌学术等学术搜索引擎中。这可能会削弱公众对科学发现的信任,并破坏依赖尖端研究的行业的产品开发。 研究人员发现了13…
最近,Hugging Face 推出了一个名为 LightEval 的新工具,这是一个轻量级的 AI 评估套件,旨在帮助企业和研究人员更好地评估大型语言模型(LLMs)。 随着 AI 技术在各个行业中…
最近,艾伦人工智能研究所(AI2)发布了一款全新的开源模型 OLMoE,旨在满足对大型语言模型(LLM)的需求。这个模型不仅性能优异,而且成本相对低廉。 OLMoE 采用了一种稀疏混合专家(MoE)架…
近日,英国秘密情报局(MI6)局长理查德・摩尔和美国中央情报局(CIA)局长比尔・伯恩斯首次联合发表了一篇文章,分享他们如何在情报工作中利用生成式人工智能。 图源备注:图片由AI生成,图片授权服务商M…
在人工智能快速发展的今天,一款名为Mini-Omni的开源多模态大型语言模型正在引领语音交互技术的革新。这个由多个先进技术集成而成的AI系统,不仅能够实现实时的语音输入和输出,还具备"边思考…
在本周的一次商业会议上,OpenAI日本业务负责人忠志永(Tadao Nagasaki)的一番话引发了广泛关注。他提到了“GPT Next”,这被外界广泛解读为即将推出的下一代大型语言模型(LLM)。…
OpenAI的 ChatGPT5让人期待已久,人们对 GPT-5的功能、新功能和发布时间的猜测不断升温。 关于 ChatGPT5的信息已经流传很多,本文将结合市面上的消息,对ChatGPT5发布日期、…
最近,谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法,名为生成奖励模型(GenRM),旨在提升生成式 AI 在推理任务中的准确性和可靠性。 生成式 AI 被广泛应用于自然语言处理等多个…
在当今竞争激烈的就业市场中,一款名为LinkedIn_AIHawk的革命性AI求职工具正引起广泛关注。这款开源工具声称能在短短24小时内自动申请1000个工作岗位,并获得50个面试机会,其惊人的效率让…
近日,一项由研究员纳Naphtali Deutsch进行的调查引发了人们的关注。他通过扫描网络发现,数百个开源的大型语言模型(LLM)构建服务器和几十个向量数据库正在泄露大量敏感信息。这些信息的泄露源…
北京智谱华章科技有限公司近期宣布,将旗下GLM-4-Flash大型语言模型的API接口免费向公众开放,以推动大型模型技术的普及和应用。 GLM-4-Flash模型在速度和性能上都展现出显著的优势,特别…
最近的一项分析显示,越来越多的美国财富500强公司在财务报告中提到了生成性人工智能(AI),不过提到的内容并不全是积极向上的。 根据 Arize 的研究,自2022年以来,这类提及的数量增加了250%…
最近,一项新研究令人振奋,证明了大型语言模型(LLM)可以通过搜索功能来显著提升性能。特别是,参数量仅8亿的 Llama3.1模型经过100次搜索,竟然在 Python 代码生成的任务上与 GPT-4…
8月14日,Anthropic公司宣布为其Claude系列大型语言模型推出一项名为"提示缓存"的新功能,声称能大幅降低企业使用AI的成本,同时提升性能。但这项功能究竟是否能如公司所…
最近,加州大学伯克利分校的一项研究显示,由大型语言模型(LLM)进行的自动提示修改,会显著降低 DALL-E3生成图像的质量。该研究对1,891名参与者进行了一项在线实验,目的是探讨这种自动重写对图像…
近日,AI界的知名研究员Andrej Karpathy抛出了一个颇具争议的观点,他认为目前广受推崇的基于人类反馈的强化学习(RLHF)技术可能并非通往真正人类级别问题解决能力的必由之路。这一言论无疑给…
在这个智能设备无处不在的时代,我们渴望让手机、平板、甚至是智能家居设备拥有更强大的智能处理能力。但是,这些边缘设备的硬件资源有限,特别是内存和计算能力,这限制了大型语言模型(LLMs)在它们上面的部署…
最近,一个名为 “Twitter Personality” 的 AI 代理爆火,上线12天时间吸引400万用户,因为用户只需要输入推特账号名称即可分析推特人格。 这款由 Wordware 开发的工具,…
近日,阿里云重磅推出了Qwen2-Math系列大型语言模型,这一专注于数学领域的AI新秀一经亮相就引发了业界的广泛关注。 作为Qwen2系列的最新成员,Qwen2-Math和Qwen2-Math-In…
在现代科技飞速发展的今天,人工智能尤其是大型语言模型(LLMs)正逐渐成为焦点。然而,美国的网络安全法律似乎跟不上这个快速变化的领域。最近,哈佛大学的一组学者在黑帽大会上指出,现行的《计算机欺诈和滥用…
在自然语言处理领域,长语境理解一直是一个挑战。尽管大型语言模型(LLMs)在多种语言任务上表现出色,但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制,研究者们一直在努力提升LLMs对…