2025年2月15日,清华大学KVCache.AI团队联合趋境科技宣布,在KTransformers开源项目的最新更新中,成功突破了大模型推理算力瓶颈,令英伟达的RTX 4090显卡单枪匹马就能运行DeepSeek-R1和V3的671B满血版模型。这一技术突破标志着AI计算领域的一个重要里程碑,不仅大幅降低了硬件成本,也为中小团队和个人开发者提供了更多的AI开发机会。
此次KTransformers项目的重大更新,采用了异构计算策略和稀疏性利用技术,通过MoE架构(专家混合模型),每次只激活部分专家模块,优化了显存占用。团队将非共享的稀疏矩阵卸载至CPU内存,并结合高速算子处理,将显存占用压缩至仅24GB,这使得原本需要高性能多卡服务器的DeepSeek大模型可以在单张24GB显存的RTX 4090显卡上本地运行。
除了稀疏性利用,KTransformers还通过量化与算子优化进一步提高了计算效率。采用的4bit量化技术,配合Marlin GPU算子,将效率提升了3.87倍。同时,CPU端通过llamafile实现多线程并行,显著提高了预处理速度,达到了每秒286个tokens的处理速度。而CUDA Graph加速技术的引入,则大大减少了CPU与GPU之间的通信开销,单次解码仅需一次完整的CUDA Graph调用,生成速度达到每秒14个tokens。
这项技术突破意味着,传统的大型AI服务器配置,如8卡A100方案,往往需要超百万的成本,每小时按需计费数千元。而现在,单卡RTX 4090就能实现与高端服务器配置相媲美的性能,整机成本仅为2万元,功耗仅为80W,为中小型团队和个人开发者带来了更加实惠且高效的AI计算方案。
这一突破不仅是技术上的奇迹,也证明了开源精神与硬件潜能的结合。在AI领域,创新往往来自对“不可能”的挑战,清华团队的这一成果无疑推动了AI技术的普及和发展,打开了更多可能性的大门。这也为全球的AI研究者和开发者提供了新的动力,证明了AI应用不仅仅局限于大型企业和高成本计算资源,而是可以在更加普及和低成本的环境中获得充分的应用。
在未来,随着更多类似KTransformers的创新项目不断涌现,AI计算的门槛将进一步降低,技术创新将持续推动AI产业的飞速发展,带来更多的商业机会和社会变革。
相关推荐
在2025年初的CES展会上,Nvidia首席执行官黄仁勋发表了一项震撼的声明:“RTX 5070能够以549美元的价格,达成RTX 4090的性能水平。”这一言论迅速成为话题,激起了社交媒体上大量讨论,尤其是在YouTube和TikTok等平台。作为Nvidia的最新显卡,RTX 5070是否真能与售价高达1599美元的RTX 4090抗衡?答案似乎并不像预期的那么简单,关键在于Nvidia最新...
随着技术的不断进步,2024年3D动画产业正经历着一次深刻的变革。从传统的手工绘制和计算机生成图像(CGI)到如今的人工智能(AI)辅助制作,3D动画的生产流程、创作方式和呈现效果都发生了翻天覆地的变化。AI技术不仅提升了动画制作的效率,还赋予了创作者更大的创意自由,带来了前所未有的沉浸式体验。这一转变不仅重新定义了动画行业的生产模式,也推动着整个娱乐产业的创新与发展。1. 传统3D动画制作:技术...
埃隆·马斯克(Elon Musk)再次引领全球科技创新,推动多个领域的革命性进展。从火星载人计划到人工智能的全球发展,再到裸眼3D显示技术进入大屏幕娱乐行业,马斯克的多重创新布局正在加速塑造未来科技格局。以下是他近期在各大领域的最新动态,展示了这一科技巨头如何影响全球各个行业。1. SpaceX计划2025年实现火星载人任务马斯克的太空公司SpaceX在探索火星的计划中迈出了重要一步。近日,马斯克...
随着技术的快速发展,人工智能(AI)正以惊人的速度渗透到各个行业,推动着从医疗、金融到气候变化等多领域的变革。近期,全球科技巨头纷纷发布了最新的AI产品和服务,标志着AI技术在应用广度和深度上的进一步扩展。1. 谷歌推出PaLM 3,多模态能力突破传统谷歌发布的最新AI语言模型PaLM 3不仅增强了传统的文本理解能力,还在多模态技术上做出了突破。PaLM 3可以同时处理图像、音频和文本,进一步推动...
2024年11月28日,深圳——美图公司今日正式宣布其全新AI社交创作平台WHEE的上线,标志着该公司在智能影像和社交娱乐领域的又一重要布局。WHEE不仅是一个社交平台,更融入了强大的AI创作工具,用户能够在平台内创建、编辑和分享个性化的照片、视频和动态图像。这一创新型平台的推出,旨在通过人工智能技术提供更加个性化和创意化的影像内容创作体验,推动影像娱乐行业的发展。1. WHEE:AI赋能社交与创...
2024年11月28日,硅谷——随着人工智能(AI)聊天机器人的广泛应用,业界和社会的关注焦点逐渐从技术创新转向了这些机器人的道德困境与技术挑战。尤其是近期一系列关于AI聊天机器人的负面新闻引发了公众对其潜在风险和伦理问题的广泛讨论。人们开始质疑,尽管AI聊天机器人在提升效率和便利性方面具有巨大潜力,但它们是否已经走到了**“黑暗时刻”**,正面临着不可忽视的技术困境和道德挑战?1. AI聊天机器...
2024年11月28日,腾讯应用宝电脑版正式推出了全新的“小宝AI助手”功能。这一创新工具不仅为用户提供更为智能和便捷的应用管理体验,还通过集成人工智能技术,让用户能够享受更加个性化、自动化的操作服务。此次发布的“小宝AI助手”预计将在应用宝的生态系统中产生广泛影响,提升应用下载、更新、管理等各个环节的效率和便捷度。小宝AI助手亮相:智能管理的全新方式作为腾讯应用宝电脑版的核心新功能,“小宝AI助...
2024年11月28日,全球3D游戏产业在技术创新、内容创作以及玩家体验方面迎来了前所未有的突破。随着虚拟现实(VR)、增强现实(AR)以及云游戏等前沿技术的不断成熟,3D游戏的画质、互动性、沉浸感和可玩性都得到了显著提升。行业的变革不仅推动了游戏开发商的创意突破,还为玩家带来了更加丰富和多元的游戏体验。新一代游戏引擎引领3D游戏画质革新随着硬件性能的提升和新一代游戏引擎的发布,3D游戏的画质呈现...
2024年11月28日,苏黎世——瑞士苏黎世的一座教堂近日推出了一项令人震惊的创新项目——“AI耶稣”。这一项目结合了人工智能和基督教教义,利用AI技术生成耶稣基督的虚拟形象,并通过人工智能对话系统,允许信徒与“AI耶稣”进行互动。这一突破性的融合了科技与宗教的尝试,迅速引起了全球媒体和社会的广泛关注。1. 项目背景:科技与信仰的融合“AI耶稣”项目由瑞士苏黎世的圣彼得教堂(St. Peter's...
2024年11月28日,北京——在人工智能技术快速发展的背景下,支小宝(Zhixiaobao)近日推出了一项全新的功能——“AI帮找工作”。这一功能结合了人工智能与大数据分析,旨在帮助求职者通过智能推荐系统快速找到与自己背景和需求匹配的工作,同时帮助企业筛选出最符合岗位要求的候选人。随着这一功能的上线,支小宝进一步巩固了其在智能招聘和职业发展领域的技术领先地位。1. AI帮找工作的核心功能“AI帮...
2024年11月28日,孟买——印度领先的音频平台之一,Pocket FM,近日宣布推出一系列创新功能,进一步扩展其在音频娱乐和创作者生态中的影响力。这一举措旨在通过技术和创意支持,推动平台内容创作者的成长,同时提升用户的听觉体验,巩固其在印度音频流媒体市场的地位。1. Pocket FM 创作者生态扩展Pocket FM 近年来一直致力于为印度本土内容创作者提供平台,帮助他们创作和发布音频内容。...
2024年11月28日,伦敦——根据最新的报道,英国政府目前尚未对其使用的人工智能(AI)技术进行全面登记,这一问题引发了广泛的隐私和监管担忧。政府部门在多个领域应用AI技术,包括公共服务、执法、安全监控等方面,但由于缺乏透明度和监管措施,外界对这些AI系统的使用情况及其可能带来的隐私风险产生了疑虑。1. AI技术应用广泛,但缺乏透明性近年来,AI技术在全球范围内得到广泛应用,尤其是在公共部门。英...
最新文章
在2025年亚布力中国企业家论坛第25届年会期间,新浪财经对话了亚布力论坛轮值主席、滴灌通创始人李小加。在对话中,李小加分享了对AI技术的深刻见解,特别是他对Deepseek的影响与认识。李小加表示,Deepseek让他对AI的理解产生了巨大转变。他回忆道:“在使用ChatGPT时,我并没有非常深刻的认知,虽然讨论过它,但总有一个疑问在心里——‘靠谱吗?’”然而,Deepseek的推出改变了这一点...
英特尔近日宣布,其18A工艺已准备就绪,并将在今年上半年开始流片,这标志着英特尔四年五个节点计划的关键进展。此次突破被视为英特尔IDM 2.0战略的重要里程碑,也为公司代工服务(IFS)的复兴奠定基础。前英特尔CEO Pat Gelsinger曾为这一战略的成功而倍感期待。根据现有信息,英特尔的下一代移动处理器Panther Lake将会部分基于Intel 18A工艺生产,预计这款芯片将在2025...
黑龙江亚布力——在2025年亚布力论坛第二十五届年会上,武汉高德红外股份有限公司董事长黄立透露,公司自五年前便已开展脑机接口的研究,并取得了多个技术突破,尤其是在脑机接口领域的技术上,已超越了马斯克的Neuralink公司。黄立在会议上表示,高德红外已经成功实现了65000个通道的脑机接口,相比之下,Neuralink目前的技术只支持3072个通道,高德红外的技术突破是马斯克公司的20倍。更值得注...
在过去的一年里,董科含和他的团队巡回到北大、清华、复旦和港大等大学,为上千名充满创业热情的年轻人带去了20堂创业课。课程中,参与者提出了许多关于创业的共性问题,涵盖了从选定创业方向、组建团队到融资等方面的多种话题。在这些课堂上,13个高频问题反映了年轻创业者的焦虑和探索。问题包括如何选择创业行业、如何找到合适的联创伙伴、如何识别和满足用户需求、如何进行融资和股权调整,以及如何应对创业过程中的挫折和...
OpenAI的一名员工近日公开指责埃隆·马斯克旗下的xAI公司发布的最新AI模型Grok 3在基准测试中的结果存在误导性。此指责引发了两家公司的激烈争论。xAI在其官方博客中发布了一张图表,显示Grok 3的两个版本——Grok 3 Reasoning Beta和Grok 3 mini Reasoning——在AIME 2025(2025年高难度数学考试)上的表现超越了OpenAI的最强可用模型o...
电影《哪吒之魔童闹海》(《哪吒2》)近日在香港和澳门全面上映,并创下了前所未有的排片纪录。据媒体报道,首日两地的影院放映场次从超500场迅速增加至超过800场,座无虚席,整体上座率高达80%。这一规模在港澳影史上前所未有,成为了当地电影市场的焦点。根据香港电影资讯平台WMOOV的数据,截至22日19时38分,《哪吒2》在香港的入场人次已突破5.8万,超越了好莱坞大片《美国队长4:新世界秩序》的票房...
在全球科技变革的浪潮中,中国的低空经济正迎来前所未有的快速增长,市场规模已突破1200亿元,而这一行业的潜力远未被完全释放。低空经济涉及的是1000米以下至3000米内的飞行活动,涵盖无人机的广泛应用,包括外卖配送、农业植保、智能清洁等多个领域。根据中国民航局的数据显示,截至2024年6月,全国实名登记的无人机数量已突破187万架,飞手的数量已达到22.5万人。然而,这一增长速度与人才的培养速度严...
2025年2月23日,Moxie,这款革命性的社交和教育机器人,本应为神经发育迟缓儿童带来陪伴与教育,但由于依赖云服务器的设计,最终遭遇了致命的缺陷,成为一个警示故事。近日,Moxie的制造商Embodied宣布公司因融资失败而关闭,导致所有依赖其云服务的机器人功能完全丧失,令众多家长陷入困境。Moxie本身是一款售价800美元的机器人,它并不是一个独立的智能设备,而是依靠云端服务器来运行核心的人...
最新网站