近日,百川大模型正式发布了其最新的医疗大模型 ——Baichuan-M2Plus,并同步升级了配套应用百小应,开放了 API 接口。这一发布标志着百川在推出开源模型 Baichuan-M2后的又一重要进展。
通过一系列评测,M2Plus 在医疗幻觉率方面表现优异,较通用大模型显著降低,尤其在与现有医疗产品 DeepSeek 的比较中,幻觉率降低了约3倍,甚至超过了美国流行的医疗应用 OpenEvidence。
图源备注:图片由AI生成,图片授权服务商Midjourney
M2Plus 采用了六源循证推理(EAR)范式,成为被誉为 “医生版 ChatGPT” 的智能助手。该模型针对严肃医疗场景中的应用难题,整合了原始研究、证据综述、指南规范、实践知识、公共健康教育以及监管的真实世界信息,构建了完整的医学知识体系,确保医疗决策的可信性和科学性。
在循证检索方面,M2Plus 利用 PICO 框架,将医疗查询转化为结构化问题,确保检索到的信息既精准又可靠。该模型的设计使得医生在面对复杂的医疗问题时,能够获得高等级、可信的医学证据,大幅提升医疗信息的使用效率。
更值得关注的是,M2Plus 在回答医疗问题时采用了 “循证增强训练” 机制,确保模型的回答不仅基于检索到的证据,还能有效避免随意生成信息的情况。通过强化引用权威资料并评估证据质量,M2Plus 展现出与资深临床专家相当的可信度。
在多次医疗场景的测试中,M2Plus 获得了临床医生的高度评价,尤其在分析病史、诊断思路和治疗方案时,其回答的准确性和专业性得到了广泛认可。此外,在美国执业医师资格考试(USMLE)中,M2Plus 取得了惊人的97分的佳绩,进一步证明了其在医疗领域的应用潜力。
划重点:
🌟 M2Plus 模型发布,显著降低医疗幻觉率,超越多款现有医疗产品。
🔍 采用六源循证推理(EAR)范式,确保医疗决策的科学性和可信性。
🏆 在 USMLE 考试中取得97分,显示出卓越的医疗专业能力。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则