瑞士的科研机构正在联手挑战大型语言模型的“黑箱”现状。瑞士联邦理工学院洛桑分校(EPFL)、**苏黎世联邦理工学院(ETH Zurich)以及瑞士国家超级计算中心(CSCS)**近日发布了一款名为 Apertus 的大规模开源语言模型。该模型不仅在名称上——拉丁语意为“开放”——彰显了其核心理念,更在实践中将“开放”做到了极致。
与OpenAI的GPT系列、Meta的Llama以及Anthropic的Claude等美国主流模型不同,Apertus以其史无前例的透明度脱颖而出。它公开了从模型权重、架构、训练代码、数据配方,到完整的训练过程文档的所有关键信息,毫不保留。这种完全透明的发布方式,旨在促进全球范围内的合作与创新,让研究人员和开发者能够深入理解模型的工作原理,并在此基础上进行改进与优化。
Apertus的发布,标志着瑞士在推动人工智能研究开放性与可复现性方面迈出了重要一步,为行业树立了新的标杆。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则