首页 > 3D标签蒸馏 相关文章
DeepSeek发布突破性推理模型K1.5:开源与性能革命,AI领域迎来新纪元

DeepSeek发布突破性推理模型K1.5:开源与性能革命,AI领域迎来新纪元

2025年1月21日,AI领域再次迎来了一项划时代的技术发布。DeepSeek团队推出了其最新的多模态推理模型——DeepSeek-R1,并伴随开源发布的同时,还带来了一个与市场预期大相径庭的亮点:这一全新大模型的推理性能与OpenAI的O1系列相媲美,但价格却仅为其1/50,为AI模型的普及和应用打开了新的大门。这一举措不仅震动了人工智能领域的核心圈层,也引发了广泛的讨论,尤其是在Reddit和...

DeepSeek免费对标OpenAI o1,究竟有何来头?一文带你在本地体验它的推理模型

DeepSeek免费对标OpenAI o1,究竟有何来头?一文带你在本地体验它的推理模型

中国初创公司 DeepSeek 近日公开推出了一系列大型语言模型(LLM),号称性能可与 OpenAI 的 o1 模型抗衡。成立仅两年的 DeepSeek 由创业者梁文锋创办,其背后有量化对冲基金「高飞资本」的资金支持。DeepSeek 模型以 MIT 许可的形式免费开放下载,宣称在推理、数学等方面达到与主流美系大模型相当的水平。本文将从模型亮点、推理表现、使用方法等角度,一探这款免费对标 o1 ...

DeepSeek挑战OpenAI?美国拟升级AI禁令,全球AI竞争进入“新冷战”

DeepSeek挑战OpenAI?美国拟升级AI禁令,全球AI竞争进入“新冷战”

一、DeepSeek横空出世,引发美方强烈反应中国人工智能公司DeepSeek(深度求索)凭借其最新发布的DeepSeek-R1推理模型,在多个技术指标上超越OpenAI,迅速成为全球科技界关注的焦点。然而,这一突破不仅在市场上掀起波澜,也在政治层面引发连锁反应。据《路透社》《彭博社》等外媒报道,美国总统特朗普提名的新任商务部长候选人霍华德·卢特尼克(Howard Lutnick)在1月29日的提...

DeepSeek引爆AI“下半场”?十条判断带你看穿未来

DeepSeek引爆AI“下半场”?十条判断带你看穿未来

自从DeepSeek R1横空出世,整个AI圈瞬间沸腾。有人说它证明了“智能下半场”已然开启,也有人觉得这只是阶段性爆点,谈不上颠覆。OpenAI、Anthropic、Google等第一梯队的反击、算力供应链的震荡、Agent应用的未来……一场AI大变局似乎正蓄势待发。本篇文章将聚焦DeepSeek在新范式下的深远影响,并尝试判断:智能竞赛如何继续上演?下一个“惊喜时刻”又会从哪里出现?01. D...

当初谴责,如今拥抱:AI 巨头为何争相“蒸馏”大模型?

当初谴责,如今拥抱:AI 巨头为何争相“蒸馏”大模型?

近期,关于人工智能模型的“蒸馏”技术再次成为业内关注焦点。尽管此前 OpenAI 曾在一起争议事件中抨击竞争对手涉嫌违规使用蒸馏,最新消息却显示,OpenAI、微软、Meta 等多家全球领先的 AI 公司正加速部署这一方法,用以降低模型运行成本并推动 AI 大规模普及。“蒸馏”技术:从前沿实验到行业常态“蒸馏”技术并非新鲜事物,但近期在大语言模型(LLM)上的应用突飞猛进。它的基本原理是:先利用一...

OpenAI呼吁美封禁中国AI,怒怼DeepSeek指控引发中美竞争争议

OpenAI呼吁美封禁中国AI,怒怼DeepSeek指控引发中美竞争争议

2025年3月15日,多家国外媒体报道称,OpenAI近日向白宫科学技术政策办公室提交了一份政策提案,呼吁美国政府对中国AI技术实施封禁。此次提案不仅将目标对准中国的人工智能发展,还特别指向竞争对手DeepSeek,指控其通过“蒸馏”技术复制OpenAI技术。这一举动迅速在全球范围内引发了广泛关注和热议。OpenAI的政策建议与指控根据报道,OpenAI在提案中提出了多项建议,其中最引人注目的便是...