百川发布循环证据增强大模型 M2Plus 打造“医生版 ChatGPT”
近日,百川大模型正式发布了其最新的医疗大模型 ——Baichuan-M2Plus,并同步升级了配套应用百小应,开放 API 接口。这一发布标志着百自8月份开源 Baichuan-M2以来的又一重要进展。通过评测,M2Plus 在医疗幻觉率方面表现出色,较通用大模型显著降低,尤其是相比现有的医疗产品 DeepSeek,幻觉率降低了约3倍,甚至超越了美国广受欢迎的医疗应用 OpenEvidence。
M2Plus 以其创新的六源循证推理(EAR)范式,成为了 “医生版 ChatGPT”。该模型针对严肃医疗场景中的应用难题,通过整合原始研究、证据综述、指南规范、实践知识、公共健康教育及监管真实世界信息,构建了完整的医学知识体系,确保了医疗决策的可信性和科学性。
在循证检索方面,M2Plus 采用 PICO 框架,将医疗查询转化为结构化问题,确保检索到的信息精准可靠。该模型的独特设计还允许医生在面对复杂的医疗问题时,获取到高等级、可信的医学证据,大幅提升了医疗信息的使用效率。
更为重要的是,M2Plus 在回答医疗问题时的 “循证增强训练” 机制,使得模型的回答不仅基于检索到的证据,而是有效避免了随意生成信息的情况。通过强化引用权威资料并评估证据质量,M2Plus 在实际应用中展现出与资深临床专家相当的可信度。
在医疗场景的多次测试中,M2Plus 的表现得到了临床医生的高度评价,尤其是在分析病史、诊断思路和治疗方案时,其回答准确性和专业性得到了广泛认可。更令人瞩目的是,在美国执业医师资格考试(USMLE)中,M2Plus 取得了惊人的97分的佳绩,显示出其在医学知识运用能力上的超越。
百川大模型的发布不仅为中国医疗行业的数字化转型注入了新动能,更代表了中国在全球大模型领域的进一步突破。随着 M2Plus 的推出,预计将对提高临床决策的科学性和有效性产生深远的影响。
空空如也!