DeepSeek在开源周活动中再次迈出重要一步,今天上午发布了其全新开源项目——DeepGEMM。该项目专注于FP8高效通用矩阵乘法(GEMM)库的开发,并以其强大的功能和极高的算力优化能力迅速引起了国内外技术圈的热议,文章发布后不久便收获了超过2.1万的阅读量。DeepGEMM作为一款基于CUDA开发的库,专为高效矩阵计算需求而设计,特别适用于普通及混合专家(MoE)分组的矩阵运算。其轻量级即时...
在AI技术的不断进步和GPU计算能力提升的背景下,DeepSeek团队近日发布了名为DeepGEMM的开源库,震撼了业界。仅用300行代码,DeepGEMM在Hopper GPU上突破了1350 TFLOPS的性能瓶颈,比传统优化技术更高效、更简洁,成为新一代矩阵乘法计算的理想工具。DeepGEMM是DeepSeek开源周的第三个项目,它专注于FP8矩阵乘法(GEMM)的加速,支持V3/R1训练...
DeepSeek公司今日宣布,将对其开放平台进行重大调整,推出夜间错峰优惠活动,以降低API调用价格。此次优惠活动将于即日起生效,优惠时段为北京时间每日00:30至08:30。在此期间,DeepSeek的API调用价格大幅下调,其中DeepSeek-V3的价格降至原价的50%,而DeepSeek-R1的价格更是降至仅为原价的25%。此次降价措施旨在鼓励用户充分利用夜间空闲时段,从而获得更为经济且流...
字节跳动旗下的AI助手“豆包”近日宣布正在小范围测试其自研的“深度思考模型”,但与广受关注的DeepSeek不同,豆包此次并未接入DeepSeek开源生态,而是选择继续推进自家技术路线。尽管目前尚未在用户界面中全面推出这一新功能,但一些在灰度测试中的用户已开始体验到“思维链”展示,这或许预示着豆包正在向更复杂的推理能力进化。根据豆包相关负责人的透露,团队正在测试不同的实验版本,旨在找到最佳的模型表...
美东时间2月26日,全球人工智能芯片巨头英伟达(NVIDIA)公布了2025财年第四季度(2024年11月至2025年1月)及全年财报,多项数据远超市场预期,其核心业务增长势头强劲,Blackwell芯片需求与DeepSeek大模型的全球热潮成为焦点。业绩全线爆发:营收、利润同比翻倍财报显示,英伟达第四财季营收达393.31亿美元,同比增长78%;净利润飙升至220.91亿美元,同比增幅达80%。...
2025年2月27日,微信生态体系迎来历史性变革——腾讯元宝正式入驻微信九宫格生活服务专区,成为首个占据该顶级流量入口的AI原生应用。此次灰度测试中,用户点击九宫格内「腾讯元宝」图标,即可直达专属下载页面,入口下方「满血DeepSeek」标识昭示其技术内核。战略布局:流量核弹级配置:九宫格作为微信生态最高级别入口,日均曝光量超5亿次,此前仅有美团、滴滴等超级应用曾获此资源。技术协同效应:深度融合深...
——全球首个双轨并行优化方案开源,大模型训练成本或降40%北京时间今日午间,国内AI独角兽深度求索(DeepSeek)在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术,直击千亿参数大模型训练的算力瓶颈,GitHub首发5小时即登热榜首位,开发者社区惊呼“分布式训练的Game Changer来了...
——独家解析微软“亲华”姿态背后的全球算力博弈新棋局当微软总裁布拉德·史密斯在《华尔街日报》访谈中,将DeepSeek列为“最具潜力的七家中国创业公司”时,这番看似寻常的商业判断,实则是中美科技冷战棋局的一次战略级示警。这位科技巨头的“外交官”罕见承认:中国AI初创企业正以成本碾压+技术奇袭的双重攻势,动摇美国在人工智能领域的统治根基。DeepSeek R1:一场颠覆硅谷定价体系的“红色风暴”引发...
OpenAI公司近日通过直播形式发布了其备受期待的GPT-4.5大模型预览版。令人震惊的是,GPT-4.5的定价高达DeepSeek的1000倍,引发了业内的广泛关注。据OpenAI介绍,GPT-4.5支持搜索、上传文件和图片、以及画布功能。然而,尽管该版本有了诸多增强功能,但目前并不支持语音模式、视频和屏幕共享等多模态特性。更令业界吃惊的是,GPT-4.5的API定价为每百万Tokens 75美...
Meta加速AI基础设施扩展,全球科技巨头进入资金竞赛在人工智能(AI)技术迅速发展的背景下,全球科技巨头们正在加大对AI基础设施的投资。今日,据外媒报道,Meta正在与私募巨头阿波罗全球管理公司(Apollo Global Management)领导的一组投资者洽谈一笔高达350亿美元(约合人民币2556亿元)的数据中心建设融资。此次融资若达成,将成为近年来科技企业与另类资产管理公司间规模最大的...
美图公司旗下的美图设计室近日宣布,成功接入DeepSeek R1大模型,推出全新AI图文功能。这一创新功能为创作者提供了一站式的AI图文创作体验,极大提升了自媒体内容生产效率,帮助用户快速生成高质量的小红书图文内容。在传统的创作过程中,许多自媒体创作者常常面临效率低、专业门槛高和创意受限等问题。而美图设计室的AI图文功能,通过DeepSeek R1的强大支持,使得创作者只需输入简单的主题并选择De...
DeepSeek公司于3月1日发布了题为《DeepSeek-V3/R1 推理系统概览》的文章,首次公开了其V3/R1推理系统的核心数据。这一重磅信息揭示了DeepSeek在AI领域的商业模式及其背后的巨大利润空间,特别是在理论成本和利润率方面,引起了广泛关注。根据文章的内容,DeepSeek的V3/R1推理系统在运营成本与收入之间展现出了惊人的差距。具体数据显示,假定GPU租赁成本为每小时2美元,...
全新架构与关键技术加持。 摩尔线程此次适配的核心在于其升级后的 MUSA Compute Capability 3.1 GPU 架构及配套软件栈。该架构首次提供了 原生 FP8(8位浮点)计算能力,并搭载自研的高性能线性代数模板库 MUTLASS。借助这些技术突破,摩尔线程得以及时优化实现 DeepSeek 开源项目中的关键算法。例如,在 FlashMLA(高效多头潜在注意力推理内核)中,摩尔线程...
近期,随着DeepSeek现象席卷业界,中国企业对人工智能(AI)技术人才的争夺进入白热化阶段。据《钛媒体AGI》报道,小米集团与华为等头部企业纷纷“抛出橄榄枝”,为招聘AI大模型技术人才提供高达“百万人民币”年薪,引发业内广泛关注。小米、高薪引进AI大模型人才据悉,小米集团日前启动了“AI大模型”人才招聘计划,面向拥有计算机科学、人工智能及自然语言处理等相关领域硕士或博士学历、并具备3年以上工作...
近期,关于人工智能模型的“蒸馏”技术再次成为业内关注焦点。尽管此前 OpenAI 曾在一起争议事件中抨击竞争对手涉嫌违规使用蒸馏,最新消息却显示,OpenAI、微软、Meta 等多家全球领先的 AI 公司正加速部署这一方法,用以降低模型运行成本并推动 AI 大规模普及。“蒸馏”技术:从前沿实验到行业常态“蒸馏”技术并非新鲜事物,但近期在大语言模型(LLM)上的应用突飞猛进。它的基本原理是:先利用一...
据《金融时报》最新报道,分析师警告美国股市近年来对人工智能的巨额押注正催生泡沫风险。随着全球金融危机后美国股市一路高歌猛进,其市值中科技巨头占比不断攀升,投资者正面临“把鸡蛋放在同一个篮子里”的巨大风险。不少经济学家直言,这些科技公司的估值“高得离谱”,令人不禁担忧泡沫破裂的可能性。科技巨头撑起美股市值神话报告指出,近年来华尔街在AI热潮推动下,不仅让英伟达、苹果、微软等科技巨头的股价屡创新高,更...