内容持续更新中
美国艾伦人工智能研究所最近发布了名为 Dolma 的开源数据集,包含了 3 万亿个 token。这个数据集将为 AI2 正在开发的开放语言模型 OLMo 提供基础,计划于 2024 年初发布。Dolm…
谷歌 AI 研究团队提出了一种利用大型语言模型进行个性化文本生成的通用方法。他们采用多阶段多任务结构,包括检索、排序、摘要、合成和生成,训练大语言模型进行个性化文本生成。在三个公开数据集上验证了该方法…