内容持续更新中
在视觉语言模型(VLM)领域,一场“小而美”的革命正在上演。最新发布的Moondream3.0(预览版)以其高效的混合专家(MoE)架构,凭借总9B参数、激活仅2B的轻量设计,实现了前沿级视觉推理能力…
近日,美团宣布推出一款基于混合专家架构的大型推理模型 ——LongCat-Flash-Thinking。这个新模型的参数量高达5600亿,令人瞩目!但最令人惊喜的是,它能够根据上下文需求动态激活186…
在4月10日的商汤技术交流日上,商汤科技发布了其最新的多模态融合大模型 “商汤日日新 SenseNova V6” 及 “商汤大装置 SenseCore2.0” 体系。这一新版本大模型旨在整合文本、图像…
备受期待的Deepseek V3终于开源!这款全新的AI模型在多语言编程能力上取得了重大突破,其在aider多语言编程测评中的表现,甚至超越了Claude3.5Sonnet V2等竞争对手,引发了业界…