<汇港通讯> DeepSeek 发布新型数学推理模型 DeepSeekMath-V2,采用可自我验证的训练框架,在2025年国际数学奥林匹克竞赛(IMO 2025)和2024年中国数学奥林匹克竞赛(CMO 2024)中,均达到金牌水平,并在2024年普特南数学竞赛(Putnam 2024)获得近乎满分的118/120分优异成绩。
新模型基於 DeepSeek-V3.2-Exp-Base 构建,透过 LLM 验证器自动审查生成的数学证明,并利用高难度样本持续优化性能,透过验证、产生闭环和元验证机制,显著提升证明品质评估准确性,并实现全自动化标注。
团队表示,该成果验证了自验证推理路径的可行性,为建立可靠数学智能系统提供新方向。
模型程式码与权重已开源,发布於 Hugging Face 及 GitHub 平台。
(BC)
新闻来源 (不包括新闻图片): 汇港资讯