据财联社报道,阿里巴巴新一代基座模型 Qwen3.5 已在 HuggingFace 的 Transformers 项目中出现代码合并申请(PR),预示发布在即。
据悉,Qwen3.5采用了全新的混合注意力机制,并极有可能是一款原生支持视觉理解的 VLM 模型。目前开发者挖掘的信息显示,Qwen3.5预计将开源至少 2B 的密集模型以及 35B-A3B 的 MoE 模型。此前有消息称,该系列模型将在今年春节期间正式开源。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则