GPU_3D标签 - 大屏时代

英伟达市值一夜大增超6300亿元：从数据中心的变革到全球芯片行业的巅峰

英伟达（NVIDIA）的市值在短短一夜之间飙升超过6300亿元人民币，这一惊人的涨幅引发了我们对其背后原因及广泛影响的深思。这不仅是股市赢家的故事，更是全球科技前沿变革的缩影。作为半导体行业的巨头，英伟达在快速发展的人工智能、数据中心和图形处理技术等领域中，展现出了卓越的表现，成为市值增长的标志。1.新技术革命的见证者英伟达的发展得益于其在图形处理单元（GPU）领域的主导地位。虽然GPU最初是为了...

清华团队突破大模型算力瓶颈，单卡RTX 4090运行满血版DeepSeek引领AI创新

2025年2月15日，清华大学KVCache.AI团队联合趋境科技宣布，在KTransformers开源项目的最新更新中，成功突破了大模型推理算力瓶颈，令英伟达的RTX 4090显卡单枪匹马就能运行DeepSeek-R1和V3的671B满血版模型。这一技术突破标志着AI计算领域的一个重要里程碑，不仅大幅降低了硬件成本，也为中小团队和个人开发者提供了更多的AI开发机会。此次KTransformers...

“杭州六小龙”之一群核科技冲刺IPO，瞄准千亿美元市值目标

在DeepSeek和宇树等科技公司引领A股市场时，另一个来自杭州的科技新星——群核科技，也开始了其IPO的冲刺。这家公司被誉为“杭州六小龙”之一，虽名气未及DeepSeek那般炙手可热，但其背后的战略布局和技术优势，使其在业内受到了极大关注。群核科技成立于2011年，由黄晓煌、陈航和朱皓三位计算机科学专业的同窗共同创办。自成立以来，群核科技迅速在空间设计与可视化领域站稳脚跟，凭借创新的AI技术和G...

Grok 3：埃隆·马斯克发布新AI，挑战人工智能领域霸主地位

2025年2月22日，xAI公司宣布推出其全新人工智能模型——Grok 3，这一模型迅速引起了全球科技界的广泛关注。xAI创始人埃隆·马斯克表示，Grok 3“聪明得让人惊讶”，并预测它将超越目前的人工智能领军者，如OpenAI和DeepSeek等。尽管尚需时间验证这些宣言，早期的表现已显示出Grok 3可能具备改变AI行业格局的潜力。Grok 3在多个高难度领域表现出色，包括科学研究、编程和数学...

DeepSeek开启“开源周”发布Flash MLA代码库，优化Hopper GPU加速

DeepSeek启动开源周，发布Flash MLA代码库助力GPU优化2025年2月24日，北京——DeepSeek今日宣布启动其“开源周”计划，正式发布首个开源代码库——Flash MLA。这是一个专为Hopper GPU优化的高效MLA（多级解码）解码内核，经过针对可变长度序列的优化，已成功投入生产，标志着DeepSeek在开源技术领域迈出了重要一步。Flash MLA代码库：专为Hopper...

英伟达的并购战略：如何通过收购加速赢得AI时代的竞争

随着AI技术的飞速发展，英伟达（NVIDIA）再次在科技领域引起关注。2025年初，DeepSeek发布的开源模型R1引发了全球行业的巨大反响，部分业内分析人士认为，这款AI模型有可能挑战英伟达在AI算力领域的霸主地位。尽管英伟达面临着来自DeepSeek等竞争者的威胁，但通过一系列的并购和投资，英伟达逐渐展示出强大的韧性与应对能力。并购扩张：英伟达走向AI时代的关键战略英伟达的成功并非偶然。自成...

DeepSeek开源DeepEP通信库：为MoE模型训练和推理提供高效解决方案

2025年2月25日，DeepSeek在开源周第二日宣布，成功开源DeepEP，这是第一个专为Mixture of Experts（MoE）模型训练和推理设计的开源EP通信库。DeepEP旨在提升MoE模型的计算效率，提供高效的节点内和节点间通信，优化GPU资源管理，并为AI开发者提供更灵活、低延迟的解决方案。1. DeepEP通信库：MoE模型的高效支持DeepEP是专门为MoE（Mixture...

DeepSeek发布开源DeepGEMM，推动FP8矩阵运算高效化

DeepSeek在开源周活动中再次迈出重要一步，今天上午发布了其全新开源项目——DeepGEMM。该项目专注于FP8高效通用矩阵乘法（GEMM）库的开发，并以其强大的功能和极高的算力优化能力迅速引起了国内外技术圈的热议，文章发布后不久便收获了超过2.1万的阅读量。DeepGEMM作为一款基于CUDA开发的库，专为高效矩阵计算需求而设计，特别适用于普通及混合专家（MoE）分组的矩阵运算。其轻量级即时...

深度优化引领AI未来：DeepSeek开源DeepGEMM显著提升矩阵运算性能

在AI技术的不断进步和GPU计算能力提升的背景下，DeepSeek团队近日发布了名为DeepGEMM的开源库，震撼了业界。仅用300行代码，DeepGEMM在Hopper GPU上突破了1350 TFLOPS的性能瓶颈，比传统优化技术更高效、更简洁，成为新一代矩阵乘法计算的理想工具。DeepGEMM是DeepSeek开源周的第三个项目，它专注于FP8矩阵乘法（GEMM）的加速，支持V3/R1训练...

DeepSeek开源“双响炮”：DualPipe算法破局训练效率，EPLB重构AI算力分配

——全球首个双轨并行优化方案开源，大模型训练成本或降40%北京时间今日午间，国内AI独角兽深度求索（DeepSeek）在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术，直击千亿参数大模型训练的算力瓶颈，GitHub首发5小时即登热榜首位，开发者社区惊呼“分布式训练的Game Changer来了...

DeepSeek首次披露推理系统成本与利润率，理论利润率高达545%

DeepSeek公司于3月1日发布了题为《DeepSeek-V3/R1 推理系统概览》的文章，首次公开了其V3/R1推理系统的核心数据。这一重磅信息揭示了DeepSeek在AI领域的商业模式及其背后的巨大利润空间，特别是在理论成本和利润率方面，引起了广泛关注。根据文章的内容，DeepSeek的V3/R1推理系统在运营成本与收入之间展现出了惊人的差距。具体数据显示，假定GPU租赁成本为每小时2美元，...

技术分析：摩尔线程如何支持 DeepSeek “全家桶”

全新架构与关键技术加持。摩尔线程此次适配的核心在于其升级后的 MUSA Compute Capability 3.1 GPU 架构及配套软件栈。该架构首次提供了原生 FP8（8位浮点）计算能力，并搭载自研的高性能线性代数模板库 MUTLASS。借助这些技术突破，摩尔线程得以及时优化实现 DeepSeek 开源项目中的关键算法。例如，在 FlashMLA（高效多头潜在注意力推理内核）中，摩尔线程...

马来西亚重磅出击：2.5亿美元购Arm芯片设计助推国产GPU产业腾飞

在全球半导体产业迎来新一轮技术革新的背景下，马来西亚政府近日宣布将在未来10年内向芯片设计巨头Arm支付2.5亿美元，获得其7套高端芯片设计蓝图，以支持本土GPU芯片的研发与生产。这一举措不仅标志着马来西亚加快自主芯片制造步伐，也将为国内数字经济和人工智能产业注入强大动力。打造本土芯片生态体系据马来西亚经济部长Rafizi Ramli介绍，此次向Arm支付的2.5亿美元不仅涵盖知识产权费用，更是马...

谷歌发布Gemma 3：单GPU AI模型再创巅峰，引领智能应用全新时代

谷歌今日震撼推出全新升级的Gemma 3人工智能模型。这款模型在继去年推出两款基于Gemini AI技术的“开放”Gemma模型后，迎来全新进化，专为开发者量身打造，致力于在各类设备上实现智能应用的无缝部署与高效运行。全面升级：跨平台、多语言与多模态能力据谷歌官方介绍，Gemma 3不仅支持在手机、工作站等各类终端上平稳运行，更具备处理文本、图像和短视频等多模态数据的能力。其支持超过35种语言，这...

软银重磅收购夏普液晶厂打造日本最强AI算力基建

软银集团再出重拳，计划以约1000亿日元（约合49亿元人民币）的价格收购位于大阪堺市的一家前夏普液晶电视工厂设施及部分土地，并将其改造为一座大型数据中心。这座数据中心将作为软银与OpenAI联合开发的AI代理项目的重要基础设施，助力日本乃至全球人工智能商业化应用的落地。转型升级：从液晶厂到AI数据中心据《日经亚洲》报道，软银旗下的电信公司正准备最快于本周五签署收购合同。收购标的为一座曾经用于生产液...

首页 1 2 3 尾页