内容持续更新中
10 月 30 日,昆仑万维宣布开源了百亿级大语言模型「天工」Skywork-13B 系列,并提供了超大规模的高质量中文数据集。该系列包括两个模型: Skywork-13B-Base 和 Skywor…
近日,上海人工智能实验室(上海AI实验室)推出首个图文混合创作大模型书生·浦语灵笔(InternLM-XComposer)。浦语灵笔能进行流利的中英文图文对话,准确理解图像内容,更解锁了“一键生成”图…
Meta在美国总部外遭遇抗议示威,反对其开源发布AI模型的策略,担心这些模型权重的泄露会造成负面影响。Meta首席科学家LeCun则表示开源AI社区发展势头正猛。业内对开源与闭源仍存在分歧,开源可提高…
ctoc 是一个轻量级工具,用于分析代码库的令牌级别信息。它是基于 gocloc 的,具有极快的性能。这种工具允许开发者更深入地理解他们的代码,特别是在处理大型代码库时,它可以帮助开发者更有效地定位和…
AI 组织 LAION 和领先的 AI 开发者在给欧盟的公开信中建议,AI 领域的监管努力应该鼓励使用开源 AI 模型,以支持透明度、安全性和创新,特别是中小企业。LAION 认为,开源 AI 模型具…
站长之家报道,Colossal-AI团队通过词表扩充、数据筛选和多阶段训练策略,在15小时内用几千元成本训练出参数规模达85亿字元的中文版LLaMA2大模型。这个低成本方案使中文版LLaMA2在多项中…
Colossal-AI 团队通过低成本构建了中文版的 LLaMA-2 大模型,在多个评测榜单中取得了优异的成绩。他们开源了完整的训练流程、代码及权重,并提供了评估体系框架 ColossalEval。这…
阿联酋科技集团 G42 与 Cerebras Systems 合作推出了一款名为 Jais 的开源阿拉伯语 AI 模型,该模型拥有 130 亿个参数,可以为生成式 AI 应用提供支持。Jais 的发布…
阿里云开源了视觉语言模型Qwen-VL,这是继8月开源通用模型Qwen-7B和对话模型Qwen-7B-Chat之后,又一个开源的大模型。Qwen-VL支持中英文,可以进行知识问答、图像标题生成、图像问…
上海 AI 实验室与语料数据联盟发布了 “书生・万卷”1.0 多模态预训练语料,包含文本、图文和视频数据集。这个开源语料库总量超过 2TB,经过细粒度清洗和去重,具备多元融合、精细处理和易用高效的特点…