AI圈的“诸神之战”正在上演!DeepSeek开源周第二日再投“技术核弹”,阿里通义千问、Anthropic Claude 3.7 Sonnet紧急加入推理模型战场,一场围绕开源生态、算力优化与代码能力的全球AI竞赛彻底白热化。DeepSeek:开源周“五天五连炸”,GPU性能榨到一滴不剩继首日发布FlashMLA(专为英伟达H100/H800显卡设计的极致优化工具)后,DeepSeek今日开源D...
字节跳动在AI视频生成领域的野心再度膨胀!据《晚点LatePost》报道,其旗下AI视频创作平台“即梦”(剪映生态核心产品)正考虑接入爆火的开源大模型DeepSeek,以强化脚本生成与视频制作全链路能力。与此同时,“即梦”用户数在春节前后实现3倍狂飙,并迎来原零一万物大将曹大鹏掌舵移动端,一场AI视频生态卡位战已全面打响。技术升级:DeepSeek或成“脚本+视频”双核引擎知情人士透露,“即梦”计...
DeepSeek在开源周活动中再次迈出重要一步,今天上午发布了其全新开源项目——DeepGEMM。该项目专注于FP8高效通用矩阵乘法(GEMM)库的开发,并以其强大的功能和极高的算力优化能力迅速引起了国内外技术圈的热议,文章发布后不久便收获了超过2.1万的阅读量。DeepGEMM作为一款基于CUDA开发的库,专为高效矩阵计算需求而设计,特别适用于普通及混合专家(MoE)分组的矩阵运算。其轻量级即时...
在AI技术的不断进步和GPU计算能力提升的背景下,DeepSeek团队近日发布了名为DeepGEMM的开源库,震撼了业界。仅用300行代码,DeepGEMM在Hopper GPU上突破了1350 TFLOPS的性能瓶颈,比传统优化技术更高效、更简洁,成为新一代矩阵乘法计算的理想工具。DeepGEMM是DeepSeek开源周的第三个项目,它专注于FP8矩阵乘法(GEMM)的加速,支持V3/R1训练...
字节跳动旗下的AI助手“豆包”近日宣布正在小范围测试其自研的“深度思考模型”,但与广受关注的DeepSeek不同,豆包此次并未接入DeepSeek开源生态,而是选择继续推进自家技术路线。尽管目前尚未在用户界面中全面推出这一新功能,但一些在灰度测试中的用户已开始体验到“思维链”展示,这或许预示着豆包正在向更复杂的推理能力进化。根据豆包相关负责人的透露,团队正在测试不同的实验版本,旨在找到最佳的模型表...
2025年2月26日,福布斯专栏作家Josipa Majic Predin撰文指出,人工智能产业正经历历史性转折——随着科技巨头垄断AI底层模型开发,全球风险投资重心正从"造模型"转向"造界面",一场围绕人机交互的革命悄然开启。模型层垄断已成定局:三巨头掌控65%算力命脉最新研究显示,亚马逊、谷歌和微软已控制全球65%的数据中心容量,构建起AI开发的"基础设施霸权"。大型语言模型(LLM)成本在1...
——全球首个双轨并行优化方案开源,大模型训练成本或降40%北京时间今日午间,国内AI独角兽深度求索(DeepSeek)在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术,直击千亿参数大模型训练的算力瓶颈,GitHub首发5小时即登热榜首位,开发者社区惊呼“分布式训练的Game Changer来了...
大屏时代讯:Meta(前身为Facebook)正在筹备推出一款独立的AI聊天机器人应用——Meta AI,旨在更好地与OpenAI的ChatGPT和谷歌的Gemini等AI聊天机器人竞争。预计Meta将在公司下一个财季(即4月到6月之间)发布这一应用。目前,Meta AI仅通过Meta的官方网站及其旗下社交平台(如Facebook和WhatsApp)为用户提供服务。然而,随着这一新应用的推出,Me...
核心性能:重新定义AI时代存储效率上限在DeepSeek开源周第五天,这家中国AI领军企业正式发布革命性存储系统——Fire-Flyer文件系统(3FS)。作为专为数据密集型AI任务设计的并行文件系统,3FS在180节点集群测试中实现6.6 TiB/s聚合读取吞吐量,较主流Ceph系统提升近3倍;在25节点规模的GraySort基准测试中,以3.66 TiB/min吞吐量刷新全球排序性能纪录。技术...
全新架构与关键技术加持。 摩尔线程此次适配的核心在于其升级后的 MUSA Compute Capability 3.1 GPU 架构及配套软件栈。该架构首次提供了 原生 FP8(8位浮点)计算能力,并搭载自研的高性能线性代数模板库 MUTLASS。借助这些技术突破,摩尔线程得以及时优化实现 DeepSeek 开源项目中的关键算法。例如,在 FlashMLA(高效多头潜在注意力推理内核)中,摩尔线程...
2025年3月4日 — 谷歌今日宣布开源其最新人工智能模型SpeciesNet,该模型专为分析相机陷阱捕捉的海量野生动物图像而设计,旨在大幅提升全球生态监测与生物多样性研究的效率。助力生态监测与数据分析在野外研究中,相机陷阱被广泛应用于监测野生动物种群,但随之而来的却是数据量庞大、处理周期长的问题。为了应对此挑战,谷歌在六年前启动了“野生动物洞察”(Wildlife Insights)项目,此举作...
2025年3月4日,北京——大模型独角兽智谱近日宣布发布2025开源年的首款创新产品——CogView4,这款开源文生图模型首次实现生成汉字功能,引发业内广泛关注。据《科创板日报》独家报道,CogView4在DPG-Bench基准测试中综合评分排名第一,正式达到当前开源文生图模型的SOTA水平,成为市场上最先进的代表之一。技术突破与应用前景CogView4作为首个支持生成汉字的文生图模型,充分展示...
2025年3月7日,北京——就在Manus全网邀请码炒至天价、用户难以触及之际,一场开源界的“核爆”行动震撼上线。由MetaGPT核心贡献者推动的OpenManus项目,仅用三小时代码量便全盘复刻Manus核心功能,无需邀请码即可体验,其快速落地与高效协作模式对Manus封闭生态构成了有力打脸。同时,Manus X官方账号遭遇冻结,使得这场技术较量更显戏剧性,暗示着AI智能体生态即将迎来一轮全新洗...
字节豆包大模型团队今日正式开源一项针对MoE(混合专家模型)架构的关键优化技术。据悉,该技术在实际应用中已实现大模型训练效率提升1.7倍,同时可显著降低训练成本达40%,为人工智能领域的大规模模型训练带来了全新突破。技术创新 助力大模型训练此次开源的优化技术针对MoE架构中存在的计算资源分配和调度瓶颈问题,采用了全新的算法优化方案和调度策略。经过在字节旗下万卡集群的实战检验,该技术累计帮助节省了数...
在全球智能制造浪潮中,机器人技术不断突破边界。近日,智元机器人合伙人姚卯青在接受凤凰网科技《浪潮》专访时,直言“人形机器人必然会走入家庭”,并详细阐释了公司在具身智能、大模型应用及数据采集等领域的前沿布局,为业界描绘出一幅机器人产业大幅普及的蓝图。从工厂到家庭:技术创新驱动变革姚卯青指出,当前机器人在“聪明”与“灵活”两个维度上都面临技术瓶颈,而公司最新发布的通用具身基座模型正是为突破这一局面而设...
在数字时代,颠覆性技术总会在不经意间改变人们的生活方式。继ChatGPT引发全球生成式AI热潮后,一场更为深刻的变革正在中国悄然上演——DeepSeek开源战略打破了大模型封闭式的商业模式,为AI平权与普及提供了全新动力,也让业内开始追寻下一个能撬动生态的“超级应用”。DeepSeek时刻:技术普及的关键转折点近年来,深度学习和大模型技术迅速进步,催生出诸如AI聊天机器人、AI搜索、AI教育等多种...