最新发布的 GLM-5.1中,这一开源模型展示了其卓越的智能水平,能够在长达8小时的任务中独立工作,完成复杂的工程项目。与之前仅能进行短时间交互的模型相比,GLM-5.1在代码能力和长程任务执行上都有显著提升。

​GLM-5.1 发布:一个能独立工作的智能模型,持续作业长达 8 小时

该模型在全球开源模型中表现出色,在多个代码评测基准上取得了优异成绩。在 SWE-Bench Pro 基准测试中,GLM-5.1成功定位并修复高难度的工程 Bug,超越了现有的顶级模型,如 GPT-5.4和 Claude Opus4.6。这标志着其在专业软件开发领域的强大能力。

GLM-5.1的工作方式让人惊叹。它能够在晚上构建一个完整的 Linux 桌面系统,历时8小时,执行超过1200步,早在20分钟时便交出了初步成果。最终交付的系统功能完备,相当于四名开发人员一周的工作量。此外,它在向量数据库优化和真实机器学习负载的自我进化能力方面也表现突出,展现了 AI 在工程领域的潜力。

​GLM-5.1 发布:一个能独立工作的智能模型,持续作业长达 8 小时

这款模型的最大亮点在于它能够自我评估和优化。GLM-5.1在面临复杂任务时,不仅能识别并解决问题,还能主动调整策略,以实现最佳结果。这种能力为 AI 在实际应用中的发展提供了新的方向。

GLM-5.1的发布标志着一个新的技术时代的开始,开发者们只需给予指令,便能期待它在长时间内的高效工作。

  • GitHub:https://github.com/zai-org/GLM-5
  • Hugging Face:https://huggingface.co/zai-org/GLM-5.1
  • ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.1

划重点:

🌟 GLM-5.1能够在8小时内独立完成复杂任务,提升了代码能力。  

💻 在多个代码评测基准上表现卓越,超越了许多顶尖模型。  

🔧 具备自我评估与优化能力,展现了 AI 在工程领域的广泛应用潜力。