内容持续更新中
近年来,人工智能(AI)的编程能力不断发展,但尚未达到完美。最近,BuzzFeed 的资深数据科学家 Max Woolf 通过实验发现,如果对大型语言模型(LLM)不断提供 “写更好代码” 的提示,A…
随着企业越来越多地应用大型语言模型(LLMs),如何提升模型的知识准确性并减少幻觉现象,成为了一项重要挑战。Meta AI 的研究人员在一篇新论文中提出了 “可扩展记忆层”,或许能够为这一问题提供解决…
近年来,训练大型语言模型(LLM)变得越来越昂贵且复杂,只有少数大型科技公司具备相应的计算资源。不过,谷歌最近推出了一种名为 SALT(小模型辅助大模型训练)的新方法,这一创新可能会彻底改变 AI 训…
随着用户体验的提升和留存率的增强,推荐系统在电商、流媒体和社交媒体等多个行业中愈发受到重视。这些系统需要分析用户、商品及其背景因素之间的复杂关系,以精准地推荐用户可能感兴趣的内容。 然而,现有的推荐系…
Meta 公司近日发布了一项突破性的研究成果,他们开发出一种新型的记忆层技术,可以显著提升大型语言模型(LLM)的事实准确性,并在参数规模上实现了前所未有的扩展。这项技术不仅挑战了传统神经网络的扩展方…
在当今科技迅速发展的背景下,大型语言模型(LLM)在多个行业中扮演着重要角色,帮助自动化任务和提升决策效率。然而,在芯片设计等专业领域,这些模型面临着独特的挑战。NVIDIA 最近推出的 ChipAl…
学术同行评审是科学进步的基石,但随着投稿数量的激增,这一系统正面临巨大压力。为了缓解这一问题,人们开始尝试利用大型语言模型(LLM)进行辅助审稿。 然而,一项最新研究揭示了LLM审稿中存在的严重风险,…
MRI 图像因其复杂性和数据量大,一直以来都是医学影像分析中的一大挑战。为了训练大型语言模型(LLM)进行 MRI 分析,开发者不得不将获取的图像切割为2D 图像,这样的处理虽然可行,但却限制了模型对…
近日,苹果公司在机器学习领域的最新研究显示,他们通过与 NVIDIA 的合作,成功将大型语言模型(LLM)的生成速度提高了近三倍。这一进展的关键在于苹果开源的技术 “Recurrent Drafter…
近日,微软 AI 研究团队发布了开源工具 PromptWizard,这是一种基于反馈驱动的 AI 框架,旨在高效优化大型语言模型(LLM)的提示设计。提示的质量对于模型输出的优劣至关重要,然而,创建高…
话说人工智能这几年是真火,尤其是大型语言模型(LLM),那简直是红得发紫。它们能写诗、能作画、能聊天,甚至还能“假装”成医生给你看病(虽然结果可能……)。但你有没有想过,这些看似乖巧的AI,背地里可能…
一项最新研究表明,顶尖的人工智能模型在接受蒙特利尔认知评估(MoCA)测试时,表现出与早期痴呆症状相似的认知障碍。这项发现强调了人工智能在临床应用中的局限性,尤其是在需要视觉和执行技能的任务中。 发表…
作为OpenAI和Anthropic之外最受关注的AI初创公司之一,Cohere在 7 月份的估值已高达 55 亿美元。这家公司的联合创始人之一正是“Attention Is All You Need…
大型语言模型 (LLM) 在自然语言处理 (NLP) 领域取得了显著进展,使其在文本生成、摘要和问答等应用中大放异彩。然而,LLM 对令牌级处理(一次预测一个词)的依赖也带来了一些挑战。这种方法与人类…
在备受瞩目的NeurIPS人工智能大会上,麻省理工学院媒体实验室教授罗莎琳德·皮卡德的一次演讲,因涉及种族偏见的言论,迅速引发业内强烈反响。 在题为"如何优化最重要的事情"的主题演…
近年来,大型语言模型(LLMs)在自然语言处理(NLP)领域取得了显著进展,广泛应用于文本生成、摘要和问答等场景。然而,这些模型依赖于逐字预测的 token 级处理方法,这种方式在理解上下文时存在困难…
哈佛大学近日宣布,计划发布一个由近100万本公共领域书籍组成的数据集,任何人都可以使用该数据集来训练大型语言模型和其他人工智能工具。 此项目由哈佛大学新成立的机构数据计划(Institutional …
在 AI 时代,大型语言模型(LLM)就像武林秘籍,其训练过程耗费巨大算力、数据,就像闭关修炼多年的武林高手。而开源模型的发布,就像高手将秘籍公之于众,但会附带一些许可证(如 Apache2.0和 L…
哈佛大学周四宣布,将公开一份包含近百万本公共领域图书的高质量数据集,任何人都可以利用它来训练大型语言模型和其他 AI 工具。 这份数据集由哈佛大学新成立的机构数据倡议 (Institutional D…
阿里巴巴达摩院联合魔搭社区ModelScope近期宣布开源一项新的多语言基准测试集P-MMEval,旨在全面评估大型语言模型(LLM)的多语言能力,并进行跨语言迁移能力的比较分析。这一测试集覆盖了基础…
教育部近日宣布,外语中文译写规范部际联席会议专家委员会审议通过了第十六批共18组推荐使用的外语词中文译名,这些译名主要涉及人工智能和信息技术领域。此举旨在规范AI领域中频繁出现的新名词,为公众提供清晰…
人工智能领域的一个重要基准,ARC-AGI,即“通用人工智能抽象和推理语料库”,即将取得突破性进展。然而,测试的创始人弗朗索瓦·肖莱(Francois Chollet)警告,尽管成绩提高,但这并不意味…
Swift Ventures今日发布了一项全新的人工智能公司指数,该指数为投资者提供了识别真正进行AI技术投资的上市公司与仅仅在财报电话会议上谈论AI的公司之间的区别。该风险投资公司通过微调大型语言模…
随着大型语言模型(LLMs)在自然语言处理(NLP)领域的广泛应用,文本生成和语言理解等任务的效果得显著提升。然而,阿拉伯语由于其复杂的词形变化、丰富的方言和文化背景,依然在语言模型的应用中被低估。 …
字节跳动公司旗下的智能AI助手豆包近期对其文生图能力进行了升级,新功能支持用户通过一键操作生成含有指定文本的图片。 豆包大模型团队的相关负责人指出,豆包的文生图模型通过整合LLM(大型语言模型)和DI…
最近,发表在《Scientific Reports》上的一项研究显示,某些先进的 AI 聊天机器人在评估复杂社交情境方面的表现优于人类。 研究人员利用一种被广泛使用的心理学工具 —— 情境判断测试,发…
在当前大型语言模型(LLM)开发的竞争中,各大人工智能公司面临着越来越多的挑战,因此,越来越多的目光开始转向 “Transformer” 以外的替代架构。Transformer 架构自2017年由谷歌…