2025年2月15日,清华大学KVCache.AI团队联合趋境科技宣布,在KTransformers开源项目的最新更新中,成功突破了大模型推理算力瓶颈,令英伟达的RTX 4090显卡单枪匹马就能运行DeepSeek-R1和V3的671B满血版模型。这一技术突破标志着AI计算领域的一个重要里程碑,不仅大幅降低了硬件成本,也为中小团队和个人开发者提供了更多的AI开发机会。此次KTransformers...