近日,非营利研究机构AI2(Allen Institute for AI)推出了全新开源大语言模型(LLM)——OLMo2,其在同等规模模型中表现出色,并在训练效率、透明度和环境友好性方面实现了重大突破。与Llama、Qwen等当前热门的开源模型不同,OLMo2不仅开放了模型权重,更开放了完整的训练数据、方法和代码,为全球研究人员和开发者提供了前所未有的资源支持。OLMo2:开源领域的重大突破在当...
人工智能(AI)正以前所未有的速度重塑全球,硅谷依然是这场科技革命的核心引擎。2025年,AI领域的最新趋势和挑战是什么?在近日举办的Scale With AI活动中,全球顶级AI研究员、投资人及创业者齐聚一堂,分享了关于人工智能的深度洞察。本文将带你解读60条关键洞察,揭示未来AI发展的核心趋势,帮助你把握行业风口。1. LLM预训练接近瓶颈,后训练成突破关键大模型开发进入新阶段预训练(Pre-...
近日,OpenAI因其最新大模型o3在数学基准测试FrontierMath中的“优异表现”而陷入争议。据悉,OpenAI不仅资助了FrontierMath的开发,还在o3发布前要求合作方Epoch AI对此测试进行严格保密。多方质疑其是否利用了“内部优势”进行针对性训练,进而在测试中取得异常领先的成绩。批评者认为,这种行为不仅破坏了AI技术评测的公正性,也为OpenAI的信誉蒙上了阴影。事件回顾:...
在国产AI崛起的关键时间点,深度求索(DeepSeek)创始人梁文锋近日频频走到公众视野:先是受邀出席高层专家、企业家代表座谈会,随后又在多场场合谈及“中国AI不可能永远跟随”的观点。其言论引发业内热议,也让外界更加关注这家以“R1模型”震撼全球的AI公司究竟有怎样的雄心壮志。01 从量化交易到通用AI,梁文锋的跨界之路1. 幻方量化起家,国内量化私募“四大天王”1985年出生于广东湛江的梁文锋,...
自 1 月 20 日正式发布 DeepSeek-R1 模型以来,这家中国 AI 黑马便以惊人的速度攀升至苹果 App Store 免费下载榜首,不仅在中国区更在美国区一度超越了 ChatGPT。DeepSeek-R1 以其在数学、编程和推理等关键领域的高性能、超低成本优势震撼全球,也引发资本市场连锁反应——Nvidia(英伟达)夜盘股价下挫 5%。在业界看来,DeepSeek 的崛起或将重塑 AI...
在生成式 AI 迅猛发展的当下,如何让企业在“繁复的 IT 基础”与“不可逆的智能化浪潮”之间实现无缝对接,成了产业界亟待破解的课题。近日举办的“2025 甲骨文中国创新峰会”上,甲骨文(Oracle)给出了它的答案:以 AI 为中心、砸掉中台、深度融合数据和云,重构企业级平台架构。这一思路不仅颠覆了传统“多中台+多数据库”的复杂模式,也为中国企业迈向“AI 原生”之路点亮新方向。01 企业架构变...
随着大模型与生成式 AI 的火速崛起,庞大的算力需求正给单一数据中心的承载能力带来前所未有的压力。当“在一栋楼里容纳无限 GPU”变得不可行,业界正萌生出全新思路——通过高速网络将多个数据中心互联,形成分布式超级计算架构。这样一来,不仅能源分配与冷却问题有望得到缓解,更可能打开全球性跨数据中心合作的新篇章。01 爆发式AI需要“超大规模”数据中心过去两年间,大规模生成式 AI 模型在研发和商业应用...
在全球AI竞争日益白热化的背景下,美国对华实施芯片禁令、美方豪掷巨资筹建“星际之门”计划等一系列动作,将国际视线再次聚焦在AI产业上。然而,就在此时,中国初创公司 DeepSeek 仅凭 2048 块显卡便训练出一款可媲美顶级大模型的 DeepSeek-V3,且选择完全开源。这样的“高效低耗+开放共享”范式,不仅打破了原有的行业竞争规则,也为中国AI的未来发展带来全新想象空间。一、从“巨额砸钱”到...
最近,名为 DeepSeek 的开源大模型项目在科技圈引发广泛关注。据悉,其团队采用自动推理训练的方案,将大模型的成本大幅降低,引来媒体和资本的高度追捧。许多分析人士纷纷猜测,这是否意味着中国 AI 技术已经赶上或正在超越美国。对此,硅谷资深技术专家王维嘉在接受采访时给出了他的冷静思考:DeepSeek 确实是一项有价值的突破,但从整体来看,中美之间的 AI 技术差距依然难以在短期内被撼动。一、D...
近日,一款来自中国的全新AI大模型——DeepSeek R1——在全球范围内引发了广泛关注。它不仅在多项技术指标上与欧美主流模型展开正面竞争,更以极低的训练成本和超强推理能力成为业界焦点。这个看似崛起速度惊人的“东方力量”,究竟如何颠覆AI世界的旧平衡?它又会如何改变每一个普通人的工作与生活?让我们走近这场堪称“技术奇迹”的新进化。一、DeepSeek R1:从“旋转球形弹球”测评脱颖而出在AI研...
2025年开年,中国AI战场硝烟再起。1月30日,阿里巴巴云智能集团高调发布千亿参数大模型Qwen 2.5,宣称其旗舰版本Qwen 2.5-Max在综合性能上“全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B”。这场技术亮剑直指近期异军突起的AI独角兽深度求索(DeepSeek),后者凭借“低成本研发+高频迭代”策略,在1月内连发DeepSeek-V3和R1两代模型,搅动...
一、一场来自东方的"技术政变"2025年1月的最后一周,荷兰ASML总部大楼彻夜灯火通明。工程师们盯着中国团队发布的DeepSeek技术白皮书,发现他们用三年前量产的RTX 4090显卡集群,跑出了接近GPT-5的推理能力。这份标注着"完全开源"的模型代码,像一颗精准的电磁脉冲弹,炸毁了半导体行业精心构筑的技术壁垒。高盛分析师在晨会中打了一个辛辣的比方:"这相当于有人用诺基亚1110的零件,组装出...
人工智能(AI)技术的飞速发展正在重塑全球科技版图。然而,随着国产大模型DeepSeek R1的崛起,全球AI市场迎来了前所未有的震荡。DeepSeek凭借其卓越的技术突破和成本优势,成功挑战了行业巨头英伟达,导致其市值骤减5800亿美元。这一事件不仅引发了行业内的广泛关注,也引发了对AI价值本质的深刻反思。DeepSeek R1的技术突破与成本优势DeepSeek R1作为一款国产大模型,凭借其...
2025年1月20日,名为DeepSeek的中国公司悄然开源了其推理模型DeepSeek-R1,这一举动在全球范围内掀起了前所未有的震动,带来了对AI产业格局的深刻冲击。短短13天内,DeepSeek-R1凭借其优异的性能、低廉的价格和彻底开源的模式,迅速引起了全球关注。英伟达的市值一周内蒸发了5520亿美元,华尔街的焦虑情绪日益加剧,硅谷的巨头们开始感受到前所未有的压力。性能比肩OpenAI,价...
2025年1月,AI领域迎来了一场风暴,这不仅仅是技术的突破,更是产业生态的重塑。中国的低调企业——深度求索(DeepSeek)通过其革命性推理模型DeepSeek-R1的发布,迅速引发了全球科技圈的震动。英伟达、OpenAI等全球AI巨头的市场反应,甚至震动了华尔街,而深度求索却凭借开源、低成本和创新的自主学习方式,挑战了“算力至上”的传统理论,撼动了AI产业的根基。性能突破与价格颠覆DeepS...
2025年2月2日,英伟达(NVIDIA)作为全球领先的图形处理单元(GPU)制造商,其市值在短短一周内缩水了5520亿美元,折合人民币约4万亿元,这一剧烈波动令全球金融市场为之一震。背后的根本原因,指向了中国人工智能初创企业DeepSeek(深度求索)发布的新一代开源AGI大模型R1,这一技术突破给算力市场带来了前所未有的冲击,特别是在低成本、高效能的AI大模型领域,引发了科技界和投资者的广泛关...