内容持续更新中
由上海人工智能实验室发布的“万卷·丝路2.0”多语言多模态语料库正式开源。该语料库在原有的阿拉伯语、俄语、韩语、越南语、泰语等5个语种基础上,新增了塞尔维亚语、匈牙利语、捷克语3个稀缺语料数据,涵盖文…
上周,约100名作家在 Meta 位于伦敦的总部外发起抗议,指责这家美国科技巨头未经许可 “盗用” 他们的作品用于训练人工智能模型。抗议者高喊着 “Meta,Meta,书籍小偷”,一些人还举着标语,内…
近年来,人工智能(AI)成为热议话题,尤其是在其使用及相关风险方面的讨论愈发激烈。然而,AI 如何获取数据以及如何进行训练的问题也日益受到关注。最近,位于墨尔本的一家出版社向其作者发出请求,希望使用其…
千名音乐家近日发布“无声专辑”,抗议英国拟议的版权法修改。音乐界担忧新规将允许科技公司未经许可、无偿使用受版权保护作品进行技术训练。 名为《这是我们想要的吗?》的专辑汇集了凯特·布什等众多知名音乐人的…
随着AI行业迅速发展,高质量数据对于强大AI算法至关重要,但研究预测到2026年前可能告急。解决数据短缺问题的方法包括改进算法以更有效地利用已有数据,并使用合成数据来训练系统。此外,AI公司或许需要付…