内容持续更新中
在快速发展的生成式 AI 领域,Nous Research 团队正在进行一项独特的实验:他们正在利用分布在全球的机器,预训练一款15亿参数的大型语言模型(LLM),这一过程避免了传统上需要在昂贵且耗电…
最近,AI 聊天助手可谓是风头无两,ChatGPT、Gemini 等等,各种新产品层出不穷,功能也越来越强大。很多人觉得,这些 AI 小助手聪明又贴心,简直是居家旅行必备神器! 但一项最新的研究却给这…
美国云计算软件公司 Salesforce 的首席执行官马克・贝奥夫(Marc Benioff)近日在《华尔街日报》的《未来一切》播客上表示,人工智能的未来在于自主代理(autonomous agent…
听说过ChatGPT、文心一言这些高大上的AI吗?它们背后的核心技术就是“大型语言模型”(LLM)。是不是觉得很复杂,很难理解?别担心,即使你只有小学二年级的数学水平,看完这篇文章,也能轻松掌握LLM…
近日,据彭博社的消息,苹果公司正在开发一款新的语音助手 Siri,这款助手将采用先进的大型语言模型(LLMs)技术,以实现更自然的对话体验。苹果此举意在缩小与竞争对手之间的差距,近年来,像谷歌的 Ge…
随着人工智能(AI)技术在工业领域的迅猛发展,专家们指出,优质数据和数据治理将比生成性技术更为重要。到2025年,企业在采用 AI 时,必须更加重视可扩展和灵活的解决方案,而不是单纯依赖生成性 AI(…
机器学习早已渗透到各种线上服务中,网购便是其中最成功的领域之一。近年来,机器学习被应用于各种网购任务,例如用户查询、浏览记录、评论分析、产品属性提取等等。为了促进机器学习方法的发展,许多基准测试应运而…
微软最近在企业 AI 智能体领域取得了显著进展,已经建立起全球最大的企业 AI 智能体生态系统。自推出 Co pilot Studio 以来,已有超过10万个组织参与了 AI 智能体的创建和编辑。这一…
自然语言到 SQL(NL2SQL)技术正在快速发展,成为自然语言处理(NLP)领域的一项重要创新。该技术使得用户能够将自然语言查询转化为结构化查询语言(SQL)语句,这一进步极大地方便了缺乏技术背景的…
在于11月17日至22日举行的国际高性能计算、网络、存储与分析大会(SC24)上,戴尔正式推出了一系列新产品和服务,旨在帮助企业克服在采用生成式 AI 和大型语言模型(LLM)过程中遇到的挑战。戴尔基…
最近,AI 大型语言模型(LLM)在各种任务中表现出色,写诗、写代码、聊天都不在话下,简直是无所不能!但是,你敢相信吗?这些“天才”AI 居然是“数学菜鸟”!它们在处理简单的算术题时经常翻车,让人大跌…
一项最新研究表明,利用生成式 AI 模型,特别是大型语言模型(LLM),可以构建一种能够在多种情境下准确模拟人类行为的架构。这项研究成果为社会科学研究提供了一个强大的新工具。 研究人员首先招募了100…
随着 ServiceTitan 向美国证券交易委员会提交首次公开募股(IPO)申请文件,该公司在风险因素部分特别提到了大型语言模型(LLMs)可能带来的潜在风险。此类警告或许标志着未来 IPO 文档中…
在人工智能技术迅速发展的背景下,开发者们迫切需要一个能够灵活应用多种大型语言模型(LLM)的平台。近期推出的 AnyChat 正好满足了这一需求,它将多个领先的 AI 模型整合到一个统一的界面上,极大…
美国AI翻译平台Unbabel周三宣布推出一项由人工智能驱动的翻译服务——Widn.AI,这是该公司的新产品,基于其专有的大型语言模型(LLM)Tower。Unbabel的CEO瓦斯科·佩德罗(Vas…
微软近期发布了一款引人注目的 Python 库 ——TinyTroupe,这是一种基于大型语言模型(LLM)的多智能体人格模拟工具。 TinyTroupe 中的智能体被称为 TinyPersons,它…
根据研究公司 IDC 的最新预测,到2025年,全球人工智能(AI)相关技术的支出将达到3370亿美元,并预计到2028年这一数字将翻倍,达到7490亿美元。随着各行业 IT 领导者们不断推动 AI …
人工智能行业迎来重大转折点:领先企业纷纷改变发展方向,从追求更大规模的语言模型转向专注于提升模型的思考能力。这一转变将重塑整个AI行业的发展格局。 据路透社报道,主要AI实验室正面临困境。开发大型语言…
大型语言模型(LLM)的崛起为人工智能应用带来了革命性的变化,然而,它们在处理表格数据方面却存在着明显的不足。 浙江大学计算创新研究院的研究团队针对这一问题,推出了一款名为 TableGPT2的全新模…
近日,密歇根大学的一项新研究发现,一种训练大型语言模型的省力方法可以在相同的时间内完成,但能耗可降低30%。这种方法可以节省足够的能源,到2026年为110万美国家庭供电。 研究人员开发了一款名为 P…
埃隆马斯克的xAI今天宣布其应用程序编程接口(API)现已向公众开放,并且到今年年底每月可免费获得25美元的API积分。该API允许开发人员在xAI的Grok大型语言模型(LLM)上构建应用程序。 x…
2024年11月5日 – Anthropic正式发布了新一代快速模型Claude 3.5 Haiku。该公司表示,在与Claude 3 Haiku相似的速度下,Claude3.5…
近日,Meta AI 的研究团队与加州大学伯克利分校及纽约大学的研究人员合作,推出了一种名为思维偏好优化(Thought Preference Optimization, TPO)的方法,旨在提升经过…
麻省理工学院(MIT)本周展示了一种全新的机器人训练模型,该模型放弃了以往专注于特定数据集的训练方法,转而采用类似大型语言模型(LLMs)训练时使用的海量信息。 研究人员指出,模仿学习——即代理通过模…
Meta 近日宣布,其 MobileLLM 模型现已向研究人员开放,用户可在 Hugging Face 平台上免费下载并使用这些模型,这些模型已与 Transformers 库全面集成。 这一举措旨在…
AI 竟然开始“长脑子”了?!麻省理工学院的最新研究表明,大型语言模型(LLM)的内部结构,竟然和人脑有着惊人的相似之处! 这项研究利用稀疏自编码器技术,对LLM的激活空间进行了深入分析,发现了三个层…
大型语言模型(LLM)如GPT系列,凭借庞大的数据集,在语言理解、推理和规划方面展现出惊人的能力,在各种挑战性任务中已达到与人类相当的水平。大多数研究都集中在通过在更大的数据集上训练这些模型来进一步增…
大型语言模型(LLM)的横空出世,尤其是ChatGPT等应用的普及,彻底改变了人机交互的方式。 这些模型能够生成连贯且全面的文本,令人印象深刻。然而,尽管能力强大,LLM却容易产生“幻觉”,即生成看似…