2025年1月9日,微软研究院发布了一款令人瞩目的AI模型——Phi-4。这一新型小参数模型,尽管只有140亿个参数,却在多个基准测试中超越了许多大型开源和闭源模型,甚至挑战了GPT-4o和其他顶级AI的性能。最令人振奋的是,Phi-4不仅开源,而且支持MIT许可证下的商业用途,给广大开发者和企业带来了巨大的机遇。Phi-4的惊人表现:超越GPT-4o,强悍实力不容小觑自从去年12月12日首次展示...
生成式人工智能正在以前所未有的速度重塑各行业格局,每天都有新的应用场景和技术突破涌现。在这一蓬勃发展的领域,长期以来美国的科技巨头如OpenAI、Anthropic和Meta占据了主导地位。然而,2025年,一个来自中国的AI初创公司——DeepSeek,凭借其最新发布的DeepSeek-V3模型,打破了这一格局。DeepSeek-V3不仅在性能上超越了诸如OpenAI的GPT-4o和Anthro...
2025年1月16日,阿里云通义团队宣布开源其最新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一创新的7B尺寸模型,凭借其卓越的推理错误检测能力,不仅在与同类模型的比较中取得了显著优势,甚至超越了GPT-4o,成为开源领域中的一颗璀璨新星。尤其值得关注的是,Qwen2.5-Math-PRM开创了一个全新的评估标准——ProcessBench,填补了大模型推理过程错误评估的空白,为...
在刚刚落幕的CES 2025展会上,AI硬件行业迎来了令人瞩目的突破。从云端到端侧,AI技术正以前所未有的速度渗透到我们日常使用的各类设备中。AI不再是某些产品的附加功能,而已经成为了硬件产品的基础能力。这一变革不仅仅是硬件厂商的挑战,更是整个技术生态的全面进化。在这一波AI端侧化浪潮中,有一家名为面壁智能的公司脱颖而出,成为了端侧AI领域的领先者。日前,面壁智能发布了其最新的全模态AI模型——M...
2025年开年,中国AI战场硝烟再起。1月30日,阿里巴巴云智能集团高调发布千亿参数大模型Qwen 2.5,宣称其旗舰版本Qwen 2.5-Max在综合性能上“全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B”。这场技术亮剑直指近期异军突起的AI独角兽深度求索(DeepSeek),后者凭借“低成本研发+高频迭代”策略,在1月内连发DeepSeek-V3和R1两代模型,搅动...