首页 > 3D标签Qwen25MathPRM 相关文章
阿里云通义开源Qwen2.5-Math-PRM模型:数学推理的突破与创新

阿里云通义开源Qwen2.5-Math-PRM模型:数学推理的突破与创新

2025年1月16日,阿里云通义团队宣布开源其最新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一创新的7B尺寸模型,凭借其卓越的推理错误检测能力,不仅在与同类模型的比较中取得了显著优势,甚至超越了GPT-4o,成为开源领域中的一颗璀璨新星。尤其值得关注的是,Qwen2.5-Math-PRM开创了一个全新的评估标准——ProcessBench,填补了大模型推理过程错误评估的空白,为...