内容持续更新中
蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型(dLLM) LLaDA-MoE,在约20T数据上完成了从零训练MoE架构的扩散语言模型,验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠…
字节跳动Seed团队宣布推出实验性扩散语言模型Seed Diffusion Preview,标志着在语言模型领域的一次重大技术突破。该模型旨在通过结构化的代码生成实验,验证离散扩散技术路线作为下一代语…