2025年1月16日,阿里云通义团队宣布开源其最新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一创新的7B尺寸模型,凭借其卓越的推理错误检测能力,不仅在与同类模型的比较中取得了显著优势,甚至超越了GPT-4o,成为开源领域中的一颗璀璨新星。尤其值得关注的是,Qwen2.5-Math-PRM开创了一个全新的评估标准——ProcessBench,填补了大模型推理过程错误评估的空白,为...
中国初创公司 DeepSeek 近日公开推出了一系列大型语言模型(LLM),号称性能可与 OpenAI 的 o1 模型抗衡。成立仅两年的 DeepSeek 由创业者梁文锋创办,其背后有量化对冲基金「高飞资本」的资金支持。DeepSeek 模型以 MIT 许可的形式免费开放下载,宣称在推理、数学等方面达到与主流美系大模型相当的水平。本文将从模型亮点、推理表现、使用方法等角度,一探这款免费对标 o1 ...
2025年03月04日 — 微软近日宣布,通过 Azure AI Foundry 为 Copilot+ PC 推出全新 DeepSeek R1 系列 7B 与 14B 精馏模型,此举标志着微软在推动设备级人工智能应用方面迈出了坚实步伐。技术突破与多元应用今年1月,微软已发布计划,将针对高通骁龙 X 处理器优化的 NPU 版本 DeepSeek-R1 模型引入 Copilot+ PC。紧接着,今年2...