大型语言模型相关资讯及大型语言模型相关产品 | 第 5 页

Meta 提出新型可扩展记忆层，提升语言模型知识储备、减少幻觉现象

随着企业越来越多地应用大型语言模型（LLMs），如何提升模型的知识准确性并减少幻觉现象，成为了一项重要挑战。Meta AI 的研究人员在一篇新论文中提出了 “可扩展记忆层”，或许能够为这一问题提供解决…

谷歌利用小模型加速 AI 训练大模型，提升 28% 效率

近年来，训练大型语言模型（LLM）变得越来越昂贵且复杂，只有少数大型科技公司具备相应的计算资源。不过，谷歌最近推出了一种名为 SALT(小模型辅助大模型训练)的新方法，这一创新可能会彻底改变 AI 训…

基于LLM自动图构建框架 AutoGraph，推动推荐系统革新

随着用户体验的提升和留存率的增强，推荐系统在电商、流媒体和社交媒体等多个行业中愈发受到重视。这些系统需要分析用户、商品及其背景因素之间的复杂关系，以精准地推荐用户可能感兴趣的内容。然而，现有的推荐系…

Meta 发布新型记忆层技术：突破参数限制，大幅提升 AI 事实准确性

Meta 公司近日发布了一项突破性的研究成果，他们开发出一种新型的记忆层技术，可以显著提升大型语言模型（LLM）的事实准确性，并在参数规模上实现了前所未有的扩展。这项技术不仅挑战了传统神经网络的扩展方…

NVIDIA发布ChipAlign：实现LLM与芯片专用模型完美融合

在当今科技迅速发展的背景下，大型语言模型（LLM）在多个行业中扮演着重要角色，帮助自动化任务和提升决策效率。然而，在芯片设计等专业领域，这些模型面临着独特的挑战。NVIDIA 最近推出的 ChipAl…

上交大揭露AI审稿弊端一句话就能让论文评分大幅提高

学术同行评审是科学进步的基石，但随着投稿数量的激增，这一系统正面临巨大压力。为了缓解这一问题，人们开始尝试利用大型语言模型（LLM）进行辅助审稿。然而，一项最新研究揭示了LLM审稿中存在的严重风险，…

GE医疗利用 AWS打造首个全身3D MRI模型，实现更精准医学影像解析

MRI 图像因其复杂性和数据量大，一直以来都是医学影像分析中的一大挑战。为了训练大型语言模型（LLM）进行 MRI 分析，开发者不得不将获取的图像切割为2D 图像，这样的处理虽然可行，但却限制了模型对…

苹果与NVIDIA联手提升AI模型生产效率，速度提升近三倍

近日，苹果公司在机器学习领域的最新研究显示，他们通过与 NVIDIA 的合作，成功将大型语言模型（LLM）的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter…

别再手动调优了！微软 PromptWizard 实现大规模提示优化，节省时间与成本！

近日，微软 AI 研究团队发布了开源工具 PromptWizard，这是一种基于反馈驱动的 AI 框架，旨在高效优化大型语言模型（LLM）的提示设计。提示的质量对于模型输出的优劣至关重要，然而，创建高…

AI也玩“伪装”？Claude等大模型竟然学会了“见人说人话，见鬼说鬼话”

话说人工智能这几年是真火，尤其是大型语言模型（LLM），那简直是红得发紫。它们能写诗、能作画、能聊天，甚至还能“假装”成医生给你看病(虽然结果可能……)。但你有没有想过，这些看似乖巧的AI，背地里可能…

AI并非万能：最新研究揭示顶尖AI模型出现类似早期痴呆的认知障碍

一项最新研究表明，顶尖的人工智能模型在接受蒙特利尔认知评估（MoCA）测试时，表现出与早期痴呆症状相似的认知障碍。这项发现强调了人工智能在临床应用中的局限性，尤其是在需要视觉和执行技能的任务中。发表…

AI独角兽Cohere与Palantir深度合作：企业级AI应用浮出水面

作为OpenAI和Anthropic之外最受关注的AI初创公司之一，Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need…

Meta 推出“大型概念模型” LCMs！突破 LLM 局限，引领 AI 语言理解新方向

大型语言模型 (LLM) 在自然语言处理 (NLP) 领域取得了显著进展，使其在文本生成、摘要和问答等应用中大放异彩。然而，LLM 对令牌级处理（一次预测一个词）的依赖也带来了一些挑战。这种方法与人类…

NeurIPS大会惊现种族争议！MIT教授演讲引发热议，公开道歉平息风波

在备受瞩目的NeurIPS人工智能大会上，麻省理工学院媒体实验室教授罗莎琳德·皮卡德的一次演讲，因涉及种族偏见的言论，迅速引发业内强烈反响。在题为"如何优化最重要的事情"的主题演…

NeurIPS大会惊现种族争议！MIT教授演讲引发热议，公开道歉平息风波

Meta AI 推出大概念模型:超越传统语言模型的新突破

近年来，大型语言模型（LLMs）在自然语言处理(NLP)领域取得了显著进展，广泛应用于文本生成、摘要和问答等场景。然而，这些模型依赖于逐字预测的 token 级处理方法，这种方式在理解上下文时存在困难…

哈佛大学发布千万级书籍数据集为AI模型提供高质量训练材料

哈佛大学近日宣布，计划发布一个由近100万本公共领域书籍组成的数据集，任何人都可以使用该数据集来训练大型语言模型和其他人工智能工具。此项目由哈佛大学新成立的机构数据计划（Institutional …

上海AI实验室推大模型“指纹识别”方法REEF，打击“套壳”行为

在 AI 时代，大型语言模型（LLM）就像武林秘籍，其训练过程耗费巨大算力、数据，就像闭关修炼多年的武林高手。而开源模型的发布，就像高手将秘籍公之于众，但会附带一些许可证(如 Apache2.0和 L…

哈佛大学将发布由 OpenAI 和微软资助的海量免费 AI 训练数据集

哈佛大学周四宣布，将公开一份包含近百万本公共领域图书的高质量数据集，任何人都可以利用它来训练大型语言模型和其他 AI 工具。这份数据集由哈佛大学新成立的机构数据倡议（Institutional D…

通义千问联合魔搭社区开源测试集P-MMEval：可评测模型多语言能力

阿里巴巴达摩院联合魔搭社区ModelScope近期宣布开源一项新的多语言基准测试集P-MMEval，旨在全面评估大型语言模型（LLM）的多语言能力，并进行跨语言迁移能力的比较分析。这一测试集覆盖了基础…

AIGC、AGI中文名怎么说？人工智能相关词汇中英对照表发布

教育部近日宣布，外语中文译写规范部际联席会议专家委员会审议通过了第十六批共18组推荐使用的外语词中文译名，这些译名主要涉及人工智能和信息技术领域。此举旨在规范AI领域中频繁出现的新名词，为公众提供清晰…

ARC-AGI 基准即将突破，但创始人警告测试设计存在缺陷

人工智能领域的一个重要基准，ARC-AGI，即“通用人工智能抽象和推理语料库”，即将取得突破性进展。然而，测试的创始人弗朗索瓦·肖莱（Francois Chollet）警告，尽管成绩提高，但这并不意味…

Swift Ventures发布AI公司指数明确人工智能投资标准

Swift Ventures今日发布了一项全新的人工智能公司指数，该指数为投资者提供了识别真正进行AI技术投资的上市公司与仅仅在财报电话会议上谈论AI的公司之间的区别。该风险投资公司通过微调大型语言模…

Stability AI推Stable LM 1.6B阿拉伯语模型，精准理解文化细节

随着大型语言模型（LLMs）在自然语言处理(NLP)领域的广泛应用，文本生成和语言理解等任务的效果得显著提升。然而，阿拉伯语由于其复杂的词形变化、丰富的方言和文化背景，依然在语言模型的应用中被低估。 …

字节跳动AI助手豆包已支持一键生成带有指定文字的图片

字节跳动公司旗下的智能AI助手豆包近期对其文生图能力进行了升级，新功能支持用户通过一键操作生成含有指定文本的图片。豆包大模型团队的相关负责人指出，豆包的文生图模型通过整合LLM（大型语言模型）和DI…

AI聊天机器人在社交判断测试中超越人类，或成社交互动顾问

最近，发表在《Scientific Reports》上的一项研究显示，某些先进的 AI 聊天机器人在评估复杂社交情境方面的表现优于人类。研究人员利用一种被广泛使用的心理学工具 —— 情境判断测试，发…

Liquid AI 推出 STAR 模型架构，效率超越传统 Transformer

在当前大型语言模型（LLM）开发的竞争中，各大人工智能公司面临着越来越多的挑战，因此，越来越多的目光开始转向 “Transformer” 以外的替代架构。Transformer 架构自2017年由谷歌…

无须超级集群！Nous Research 启动全球分布式 AI 训练，颠覆大模型开发方式

在快速发展的生成式 AI 领域，Nous Research 团队正在进行一项独特的实验:他们正在利用分布在全球的机器，预训练一款15亿参数的大型语言模型（LLM），这一过程避免了传统上需要在昂贵且耗电…