token

微软Phi-4：14B小模型如何在数学与推理领域击败GPT-4，并开启AI新纪元

随着人工智能技术的不断进步，微软的下一代14B小模型Phi-4横空出世，震撼了AI界。Phi-4的问世不仅是对现有大模型的挑战，也重新定义了AI训练与推理领域的未来发展方向。经过大量的创新技术和合成数据应用，Phi-4的数学能力超过了现有许多更大规模的模型，尤其是在推理能力和STEM（科学、技术、工程和数学）问答领域表现卓越。本文将深入解析Phi-4的技术突破，探索其如何在竞争激烈的AI领域脱颖而...

具身智能新突破！Physical Intelligence推出机器人动作Tokenizer，训练提速5倍

具身智能（Physical Intelligence）在人工智能（AI）领域迎来重大突破，推出了一种专为机器人动作设计的新型Tokenizer——FAST。这一创新不仅大幅提升了机器人动作控制模型的训练速度，达到了传统方法的5倍，还为复杂且精细的机器人任务提供了新的解决方案。突破性创新：FAST提高机器人控制训练效率在机器人技术不断进步的今天，如何有效训练大型Transformer模型以控制机器人...

阶跃星辰发布Step-2mini与Step-2文学大师版，AI创作迈入新纪元

2025年1月20日，上海阶跃星辰智能科技有限公司重磅发布了Step系列语言模型的全新成员——Step-2mini和Step-2文学大师版。这两款新模型的推出，标志着阶跃星辰在满足市场需求和优化用户体验方面迈出了坚实一步，为各类创作场景提供了更具差异化的解决方案。Step-2mini：轻量高效，极致响应作为Step-2的轻量化版本，Step-2mini凭借其仅占Step-2约3%的参数量，却依然保...

AI惨败！「人类最后一次考试」揭示LLM能力极限，DeepSeek力挽狂澜

近日，由Scale AI和Center for AI Safety（CAIS）联合发起的全球AI挑战——「人类最后一次考试」（Humanity’s Last Exam，简称 HLE）公布了最新测试结果。令人震惊的是，即便是当前最强的AI大模型，正确率也未能突破10%。曾被寄予厚望的GPT-4.0、Claude 3.5、Gemini等行业领先模型，均未能展现出预期的智能表现，而中国的DeepSee...

DeepSeek推理模型暴露弱点：频繁切换思路导致“欠思考”，最短答案常为正确

尽管DeepSeek等推理大模型在人工智能领域掀起了技术革命，但最新的研究揭示了这些模型在解决复杂问题时的明显弱点。研究表明，当DeepSeek等模型遇到高难度问题时，频繁切换思路而不深入探讨现有路径，导致了所谓的“欠思考”（Underthinking）现象。这种现象不仅降低了推理效率，还显著影响了模型的准确性。“三心二意”的问题：频繁思维切换降低推理质量近日，腾讯AI实验室、苏州大学和上海交通大...

AI技术飞速发展，谷歌Jeff Dean与Transformer作者畅谈未来：1000万倍工程师即将到来

2025年2月22日，谷歌首席科学家Jeff Dean与Transformer模型的作者Noam Shazeer在一场深度访谈中，讨论了AI技术的飞速发展以及未来的可能性。他们揭示了让AI模型提升300%速度的低精度计算技术，同时畅想了处理万亿级Token的未来，甚至设想了“1000万倍工程师”的出现。Jeff Dean指出，随着专用硬件的不断创新，包括TPU和GPU的进步，AI模型的计算能力得到...

Claude 3.7 Sonnet发布：双思维模式提升推理能力，挑战DeepSeek与o3

2025年2月25日，Anthropic发布了其最新的大型语言模型——Claude 3.7 Sonnet，标志着人工智能领域的又一次重要突破。这一版本的Claude带来了革命性的“标准”和“扩展”双思维模式，使得模型的推理能力和透明度大幅提升，尤其在复杂任务和代码分析上表现出色。双思维模式：标准与扩展思维的结合Claude 3.7 Sonnet引入了两种思维模式：标准思维和扩展思维。标准思维能够快...

邀请码价格破万引热议——Manus爆火引发业界关注

昨晚，一则关于国内全新Agent产品Manus的报道迅速走红网络。社交媒体上关于“一个邀请码卖到上万”、“拳打GPT、脚踢DeepSeek”的夸张标题层出不穷，吸引了大量用户和业内人士的关注。尽管Manus目前仅处于内测阶段，通过邀请码限定体验，但其引发的讨论已成为业内关注的焦点。爆火背后的“通用型Agent”Manus自称为“全球首款通用型Agent”，其核心竞争力在于能够实现用户一键下达复杂需...

首页 1 尾页