重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

9月18日，在昆明举行的2025年国家网络安全宣传周人工智能安全治理分论坛上，中文互联网基础语料3.0正式发布。这一新版本的数据量达到了惊人的120GB，旨在为大模型训练和人工智能的进一步发展提供可靠的数据支持。

中文互联网基础语料3.0的发布，是在中央网信办的指导下，由中国网络空间安全协会与国家互联网应急中心等单位协同合作的成果。此次语料的开发与构建，得益于企业、高校和科研单位之间的紧密合作，充分利用了网安协会人工智能安全治理专委会建立的语料共建共享机制。与前两版相比，3.0版本在信源范围上进行了扩大，进一步提升了数据的质量。

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

图源备注：图片由AI生成，图片授权服务商Midjourney

在数据处理方面，语料3.0经过了严格的信源筛选、内容过滤和数据去重等一系列细致的加工处理措施。这些措施确保了发布的数据更加可信，有助于过滤掉违法和不良信息，为人工智能的研究和应用提供一个更为健康的环境。

用户可以通过登录中国网络空间安全协会网站，点击 “中文互联网语料资源平台” 链接，注册并认证后下载相关语料。该负责人表示，中文互联网基础语料3.0的推出标志着各界对高质量中文语料的共同努力与成果，未来还将继续加强中文互联网基础语料的建设，以支撑人工智能技术的创新与产业发展。

中文互联网基础语料3.0的发布，无疑为人工智能的发展注入了新的动力，也为相关领域的研究提供了更为坚实的基础。

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

34.9万用户在看

中国人工智能缩小与美国差距

21.8万用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.6万用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

18.1万用户在看

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

最近更新

文章目录

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

搜索

近期热门

【搬运】AI动画制作流程揭秘！综合实拍+合成+ai视频转绘技术（带中文字幕）

34.9万 用户在看

中国人工智能缩小与美国差距

21.8万 用户在看

七个圈AIGC破圈俱乐部欢迎您！

19.6万 用户在看

快速上手！Midjourney 网页版操作指南，生成MJ图片无需Discord！

18.1万 用户在看

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

最近更新

文章目录

重磅发布！中文互联网基础语料3.0助力AI发展，数据量高达120GB

发评论，每天都得现金奖励！超多礼品等你来拿

关联网址

关联标签

相关文章

34.9万用户在看

21.8万用户在看

19.6万用户在看

18.1万用户在看