在今日下午举行的华为开发者大会HDC2025主题演讲中,华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5,标志着自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。
盘古自然语言处理NLP大模型方面,全新的718B深度思考模型作为由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域的能力实现大幅提升,处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成,彰显了昇腾架构打造世界一流大模型的实力。此外,盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行了升级,通过自适应快慢思考合一技术,使模型能根据问题难易程度自动切换思考模式,整体推理效率提升8倍。盘古深度研究DeepDiver借助长链难题合成、渐进式奖励等技术,在网页搜索、常识性问答等应用上展现出高效执行能力,如5分钟内完成超过10跳的复杂问答、生成万字以上专业调研报告,显著提升了工作效率。
在盘古预测大模型领域,采用业界首创的triplet transformer统一预训练架构,对不同行业的数据进行统一编码和处理,极大提升了预测精度和跨行业、跨场景的泛化性。
盘古科学计算大模型方面,华为云持续深化其与科学应用领域的结合。深圳气象局基于盘古升级了“智霁”大模型,实现AI集合预报,更直观地反映天气系统演变可能性,减少预报误差。重庆市气象局针对成渝地区降水特点,打造了“天资・12h”气象大模型,提升灾害天气日内预报预警能力。深圳能源则采用盘古进行中短期风光水发电量预测,减少弃电现象,提升能源开发效率。
盘古计算机视觉CV大模型方面,华为云发布了全新MoE架构的300亿参数视觉大模型,这是目前业界最大的视觉模型,全面支持多维度、泛视觉的感知、分析与决策。同时,盘古CV大模型通过跨维度生成模型,构建了工业场景稀缺的泛视觉故障样本库,极大提升了业务场景的可识别种类与精度。
盘古多模态大模型方面,全新发布了基于盘古多模态大模型的世界模型,为智能驾驶、具身智能机器人的训练构建数字物理空间,实现持续优化迭代。在智能驾驶领域,盘古世界模型能生成大量训练数据,无需依赖高成本的路采,为智能驾驶的发展提供了有力支持。
此外,在华为云盘古大模型5.5发布后,其进一步拓展应用场景,推出了五款具备深度思考能力的行业自然语言大模型。这五款大模型分别为盘古医学Thinking大模型、盘古金融Thinking大模型、盘古政务Thinking大模型、盘古工业Thinking大模型以及盘古汽车Thinking大模型,旨在为不同行业提供更专业、更智能的自然语言处理解决方案。据悉,这五款大模型很快将正式上线,届时将为各行业带来更加高效、精准的自然语言处理体验。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则