内容持续更新中
日本政府与NEC、富士通、软银等主要科技公司合作,投资数亿美元开发文化敏感的日语语言模型。该模型将在国家超级计算机Fugaku上训练,具备至少300亿个参数,旨在解决现有模型在日本市场上的不足。研究人…
腾讯混元大模型在 2023 腾讯全球数字生态大会上正式亮相,并通过腾讯云对外开放。该模型是由腾讯全链路自研的通用大语言模型,拥有超千亿参数规模和超 2 万亿 tokens 的预训练语料。腾讯混元大模型…
云知声推出山海大模型 2.0 版,参数规模达到千亿,并在全球大模型评测中取得了优异的成绩。模型团队通过丰富语料库和在医疗领域的突破,为实现 AGI 的进化打下了基础。
艾伦人工智能研究所(AI2)发布了名为 Dolma 的开放式文本数据集,旨在促进 AI 语言模型的透明度和创新。Dolma 作为 AI2 开放式语言模型 (OLMo) 计划的核心,将为研究人员和开发者…
最近一项来自华盛顿大学、卡内基梅隆大学和西安交通大学的研究发现,AI 语言模型存在政治偏见。研究人员测试了 14 个模型,并使用政治指南针测试来确定模型的政治倾向。结果显示,OpenAI 的 Chat…