2025年2月15日,清华大学KVCache.AI团队联合趋境科技宣布,在KTransformers开源项目的最新更新中,成功突破了大模型推理算力瓶颈,令英伟达的RTX 4090显卡单枪匹马就能运行DeepSeek-R1和V3的671B满血版模型。这一技术突破标志着AI计算领域的一个重要里程碑,不仅大幅降低了硬件成本,也为中小团队和个人开发者提供了更多的AI开发机会。此次KTransformers...
随着AI技术的飞速发展,英伟达(NVIDIA)再次在科技领域引起关注。2025年初,DeepSeek发布的开源模型R1引发了全球行业的巨大反响,部分业内分析人士认为,这款AI模型有可能挑战英伟达在AI算力领域的霸主地位。尽管英伟达面临着来自DeepSeek等竞争者的威胁,但通过一系列的并购和投资,英伟达逐渐展示出强大的韧性与应对能力。并购扩张:英伟达走向AI时代的关键战略英伟达的成功并非偶然。自成...
在AI技术的不断进步和GPU计算能力提升的背景下,DeepSeek团队近日发布了名为DeepGEMM的开源库,震撼了业界。仅用300行代码,DeepGEMM在Hopper GPU上突破了1350 TFLOPS的性能瓶颈,比传统优化技术更高效、更简洁,成为新一代矩阵乘法计算的理想工具。DeepGEMM是DeepSeek开源周的第三个项目,它专注于FP8矩阵乘法(GEMM)的加速,支持V3/R1训练...