内容持续更新中
麻省理工学院的 GenSim 项目利用大型语言模型,通过自动生成新任务或详细说明所需行为的每个步骤,扩大了机器人可以接受培训的仿真任务范围。该项目通过生成任务描述和模拟行为所需的代码,并利用任务库优化…
牛津大学AI研究员在最新研究中发出警告,指出大型语言模型可能对科学完整性构成威胁。研究呼吁改变LLMs使用方式,建议将其作为“零射击翻译器”以确保输出的事实准确性。然而,信任LLMs作为信息来源可能导…
Real AI在贝尔格莱德数据科学大会上成功中标ISCRA项目,将利用LEONARDO超级计算机建设欧洲首个人本主义大语言模型HOMINIS。该项目旨在构建道德、无偏见的AI系统,减少环境影响,并通过…
在Vectara排行榜中,OpenAI GPT-4以出色的97%准确率和仅有3%的幻觉率位居榜首。Vectara通过开源模型提供了一种评估大型语言模型幻觉率的方法,为企业提供更可信的生成式AI系统。谷…
来源:bilibili哔哩哔哩 作者:@钱得乐玩赚AI 视频时长/时间:00:10:10 / 2023-10-24 【内容介绍】 换个角度理解Prompt,本视频将对Prompt能力做另外一条线的梳理…
据报道,日本电信公司 NTT 计划于明年 3 月发布一款高效能大语言模型 (LLM),旨在为学习日语的生成式人工智能提供基础。NTT 通过专注于特定行业,成功降低了模型学习和运行的成本。这一举措将使 …
最近,Facebook母公司Meta发布了新一代大语言模型Llama 2,在处理长文本和复杂任务上优于此前的GPT-3.5 Turbo和Claude 2。Llama 2于2022年7月面世,提供了70…
10 月 30 日,昆仑万维宣布开源了百亿级大语言模型「天工」Skywork-13B 系列,并提供了超大规模的高质量中文数据集。该系列包括两个模型: Skywork-13B-Base 和 Skywor…
韩国SK电信宣布与德国电信合作,共同开发面向电信领域的大语言模型(LLM)。该合作旨在支持全球电信公司,加速生成式AI服务的开发,特别是AI客服应用。合作计划于2023年第一季度发布多语言LLM,支持…
2023年全球大语言模型竞赛中,中文大语言模型的表现备受瞩目。香港中文大学发布了CLEVA中文评测平台,包括全面的评测任务和指标。CLEVA注重各种指标,如准确性、鲁棒性、公平性、效率、校准、多样性等…
总部位于加利福尼亚州的创业公司Nucleus AI,日前发布了首款产品:220亿参数的大语言模型,采用开源MIT许可证,可针对不同任务进行微调。Nucleus AI计划以农业为中心,利用AI研究构建一…
谷歌DeepMind提出了OPRO框架,使用大语言模型(LLM)进行优化,利用自然语言描述解决方案。其中「深呼吸」成为最佳Prompt提示词,提高模型性能。OPRO还在数学问题中表现出潜力,验证了提示…
本文探讨了大语言模型(LLM)研究中的十大挑战,包括减少和衡量幻觉、优化上下文长度和上下文构建、融入其他数据模态、提高LLMs的速度和降低成本、设计新的模型架构、开发GPU替代方案、提高agent的可…
淘天集团联合爱橙科技开源了大模型训练框架 Megatron-LLaMA,旨在提升大语言模型的训练性能,降低训练成本,并与 LLaMA 社区保持兼容性。框架在 32 卡训练上能够取得 176% 的加速,…
最近百度、抖音等8家国内AI企业开放了各自研发的大模型。这对普通用户来说是一个利好,可以不需要内测就能体验国产大模型。目前这些模型的知名度和影响力还不如ChatGPT。但这些模型都具有提升工作效率的潜…
商汤旗下的大语言模型应用 SenseChat 正式开放服务。SenseChat 提供智能助手、文本编辑器、智能伙伴等多项功能,并已与多个行业建立合作,服务超过 500 家客户。
美国艾伦人工智能研究所最近发布了名为 Dolma 的开源数据集,包含了 3 万亿个 token。这个数据集将为 AI2 正在开发的开放语言模型 OLMo 提供基础,计划于 2024 年初发布。Dolm…
谷歌 AI 研究团队提出了一种利用大型语言模型进行个性化文本生成的通用方法。他们采用多阶段多任务结构,包括检索、排序、摘要、合成和生成,训练大语言模型进行个性化文本生成。在三个公开数据集上验证了该方法…