训练_3D标签 - 大屏时代

OLMo2横空出世，全面开源引领LLM新纪元，数据架构双升级助力低碳高效训练

近日，非营利研究机构AI2（Allen Institute for AI）推出了全新开源大语言模型（LLM）——OLMo2，其在同等规模模型中表现出色，并在训练效率、透明度和环境友好性方面实现了重大突破。与Llama、Qwen等当前热门的开源模型不同，OLMo2不仅开放了模型权重，更开放了完整的训练数据、方法和代码，为全球研究人员和开发者提供了前所未有的资源支持。OLMo2：开源领域的重大突破在当...

AI 2025：硅谷60大前瞻洞察，解密未来人工智能趋势

人工智能（AI）正以前所未有的速度重塑全球，硅谷依然是这场科技革命的核心引擎。2025年，AI领域的最新趋势和挑战是什么？在近日举办的Scale With AI活动中，全球顶级AI研究员、投资人及创业者齐聚一堂，分享了关于人工智能的深度洞察。本文将带你解读60条关键洞察，揭示未来AI发展的核心趋势，帮助你把握行业风口。1. LLM预训练接近瓶颈，后训练成突破关键大模型开发进入新阶段预训练（Pre-...

OpenAI陷数学测试作弊风波，AI公信力危机再升级

近日，OpenAI因其最新大模型o3在数学基准测试FrontierMath中的“优异表现”而陷入争议。据悉，OpenAI不仅资助了FrontierMath的开发，还在o3发布前要求合作方Epoch AI对此测试进行严格保密。多方质疑其是否利用了“内部优势”进行针对性训练，进而在测试中取得异常领先的成绩。批评者认为，这种行为不仅破坏了AI技术评测的公正性，也为OpenAI的信誉蒙上了阴影。事件回顾：...

DeepSeek创始人梁文锋首度发声：中国AI要做领先者，而非永远跟随者

在国产AI崛起的关键时间点，深度求索（DeepSeek）创始人梁文锋近日频频走到公众视野：先是受邀出席高层专家、企业家代表座谈会，随后又在多场场合谈及“中国AI不可能永远跟随”的观点。其言论引发业内热议，也让外界更加关注这家以“R1模型”震撼全球的AI公司究竟有怎样的雄心壮志。01 从量化交易到通用AI，梁文锋的跨界之路1. 幻方量化起家，国内量化私募“四大天王”1985年出生于广东湛江的梁文锋，...

DeepSeek以开源之姿攀登AI巅峰：中美榜单齐夺冠，英伟达股价夜盘突挫5%

自 1 月 20 日正式发布 DeepSeek-R1 模型以来，这家中国 AI 黑马便以惊人的速度攀升至苹果 App Store 免费下载榜首，不仅在中国区更在美国区一度超越了 ChatGPT。DeepSeek-R1 以其在数学、编程和推理等关键领域的高性能、超低成本优势震撼全球，也引发资本市场连锁反应——Nvidia（英伟达）夜盘股价下挫 5%。在业界看来，DeepSeek 的崛起或将重塑 AI...

甲骨文掀起“AI原生”新革命：打破中台架构，赋能企业数智跃迁

在生成式 AI 迅猛发展的当下，如何让企业在“繁复的 IT 基础”与“不可逆的智能化浪潮”之间实现无缝对接，成了产业界亟待破解的课题。近日举办的“2025 甲骨文中国创新峰会”上，甲骨文（Oracle）给出了它的答案：以 AI 为中心、砸掉中台、深度融合数据和云，重构企业级平台架构。这一思路不仅颠覆了传统“多中台+多数据库”的复杂模式，也为中国企业迈向“AI 原生”之路点亮新方向。01 企业架构变...

当单一数据中心难以支撑AI：全球联接打造“超算新星”，跨区域分布式训练呼之欲出

随着大模型与生成式 AI 的火速崛起，庞大的算力需求正给单一数据中心的承载能力带来前所未有的压力。当“在一栋楼里容纳无限 GPU”变得不可行，业界正萌生出全新思路——通过高速网络将多个数据中心互联，形成分布式超级计算架构。这样一来，不仅能源分配与冷却问题有望得到缓解，更可能打开全球性跨数据中心合作的新篇章。01 爆发式AI需要“超大规模”数据中心过去两年间，大规模生成式 AI 模型在研发和商业应用...

DeepSeek横空出世，中国AI效率革命撼动全球格局

在全球AI竞争日益白热化的背景下，美国对华实施芯片禁令、美方豪掷巨资筹建“星际之门”计划等一系列动作，将国际视线再次聚焦在AI产业上。然而，就在此时，中国初创公司 DeepSeek 仅凭 2048 块显卡便训练出一款可媲美顶级大模型的 DeepSeek-V3，且选择完全开源。这样的“高效低耗+开放共享”范式，不仅打破了原有的行业竞争规则，也为中国AI的未来发展带来全新想象空间。一、从“巨额砸钱”到...

DeepSeek横空出世，能否撼动中美AI格局？王维嘉给出冷静判断

最近，名为 DeepSeek 的开源大模型项目在科技圈引发广泛关注。据悉，其团队采用自动推理训练的方案，将大模型的成本大幅降低，引来媒体和资本的高度追捧。许多分析人士纷纷猜测，这是否意味着中国 AI 技术已经赶上或正在超越美国。对此，硅谷资深技术专家王维嘉在接受采访时给出了他的冷静思考：DeepSeek 确实是一项有价值的突破，但从整体来看，中美之间的 AI 技术差距依然难以在短期内被撼动。一、D...

DeepSeek R1横空出世：东方AI新势力能否改写全球技术格局？

近日，一款来自中国的全新AI大模型——DeepSeek R1——在全球范围内引发了广泛关注。它不仅在多项技术指标上与欧美主流模型展开正面竞争，更以极低的训练成本和超强推理能力成为业界焦点。这个看似崛起速度惊人的“东方力量”，究竟如何颠覆AI世界的旧平衡？它又会如何改变每一个普通人的工作与生活？让我们走近这场堪称“技术奇迹”的新进化。一、DeepSeek R1：从“旋转球形弹球”测评脱颖而出在AI研...

激战中国AI之巅：阿里云Qwen2.5硬刚DeepSeek-V3，AGI竞赛进入白热化

2025年开年，中国AI战场硝烟再起。1月30日，阿里巴巴云智能集团高调发布千亿参数大模型Qwen 2.5，宣称其旗舰版本Qwen 2.5-Max在综合性能上“全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B”。这场技术亮剑直指近期异军突起的AI独角兽深度求索（DeepSeek），后者凭借“低成本研发+高频迭代”策略，在1月内连发DeepSeek-V3和R1两代模型，搅动...

当AI遇上价格屠夫：DeepSeek开源革命如何撼动万亿芯片帝国？

一、一场来自东方的"技术政变"2025年1月的最后一周，荷兰ASML总部大楼彻夜灯火通明。工程师们盯着中国团队发布的DeepSeek技术白皮书，发现他们用三年前量产的RTX 4090显卡集群，跑出了接近GPT-5的推理能力。这份标注着"完全开源"的模型代码，像一颗精准的电磁脉冲弹，炸毁了半导体行业精心构筑的技术壁垒。高盛分析师在晨会中打了一个辛辣的比方："这相当于有人用诺基亚1110的零件，组装出...

DeepSeek的逆袭：国产AI巨头如何让英伟达蒸发5800亿美元？

人工智能（AI）技术的飞速发展正在重塑全球科技版图。然而，随着国产大模型DeepSeek R1的崛起，全球AI市场迎来了前所未有的震荡。DeepSeek凭借其卓越的技术突破和成本优势，成功挑战了行业巨头英伟达，导致其市值骤减5800亿美元。这一事件不仅引发了行业内的广泛关注，也引发了对AI价值本质的深刻反思。DeepSeek R1的技术突破与成本优势DeepSeek R1作为一款国产大模型，凭借其...

DeepSeek引领AI革命，震动全球市场，开启“聪明技术”时代

2025年1月20日，名为DeepSeek的中国公司悄然开源了其推理模型DeepSeek-R1，这一举动在全球范围内掀起了前所未有的震动，带来了对AI产业格局的深刻冲击。短短13天内，DeepSeek-R1凭借其优异的性能、低廉的价格和彻底开源的模式，迅速引起了全球关注。英伟达的市值一周内蒸发了5520亿美元，华尔街的焦虑情绪日益加剧，硅谷的巨头们开始感受到前所未有的压力。性能比肩OpenAI，价...

DeepSeek引领AI创新变革：开源、低成本与自主学习颠覆产业格局

2025年1月，AI领域迎来了一场风暴，这不仅仅是技术的突破，更是产业生态的重塑。中国的低调企业——深度求索（DeepSeek）通过其革命性推理模型DeepSeek-R1的发布，迅速引发了全球科技圈的震动。英伟达、OpenAI等全球AI巨头的市场反应，甚至震动了华尔街，而深度求索却凭借开源、低成本和创新的自主学习方式，挑战了“算力至上”的传统理论，撼动了AI产业的根基。性能突破与价格颠覆DeepS...

英伟达市值单周缩水5520亿美元，DeepSeek“黑马”引发算力市场震荡

2025年2月2日，英伟达（NVIDIA）作为全球领先的图形处理单元（GPU）制造商，其市值在短短一周内缩水了5520亿美元，折合人民币约4万亿元，这一剧烈波动令全球金融市场为之一震。背后的根本原因，指向了中国人工智能初创企业DeepSeek（深度求索）发布的新一代开源AGI大模型R1，这一技术突破给算力市场带来了前所未有的冲击，特别是在低成本、高效能的AI大模型领域，引发了科技界和投资者的广泛关...

首页 1 2 3 4 5 尾页