首页 > 3D标签推理 相关文章
DeepSeek R1横空出世:东方AI新势力能否改写全球技术格局?

DeepSeek R1横空出世:东方AI新势力能否改写全球技术格局?

近日,一款来自中国的全新AI大模型——DeepSeek R1——在全球范围内引发了广泛关注。它不仅在多项技术指标上与欧美主流模型展开正面竞争,更以极低的训练成本和超强推理能力成为业界焦点。这个看似崛起速度惊人的“东方力量”,究竟如何颠覆AI世界的旧平衡?它又会如何改变每一个普通人的工作与生活?让我们走近这场堪称“技术奇迹”的新进化。一、DeepSeek R1:从“旋转球形弹球”测评脱颖而出在AI研...

激战中国AI之巅:阿里云Qwen2.5硬刚DeepSeek-V3,AGI竞赛进入白热化

激战中国AI之巅:阿里云Qwen2.5硬刚DeepSeek-V3,AGI竞赛进入白热化

2025年开年,中国AI战场硝烟再起。1月30日,阿里巴巴云智能集团高调发布千亿参数大模型Qwen 2.5,宣称其旗舰版本Qwen 2.5-Max在综合性能上“全面超越GPT-4o、DeepSeek-V3及Llama-3.1-405B”。这场技术亮剑直指近期异军突起的AI独角兽深度求索(DeepSeek),后者凭借“低成本研发+高频迭代”策略,在1月内连发DeepSeek-V3和R1两代模型,搅动...

深度求索崛起:中国AI先锋掀起全球科技风暴

深度求索崛起:中国AI先锋掀起全球科技风暴

上周,深度求索(DeepSeek)发布其AI推理模型后,梁文锋(Liang Wenfeng)在北京的一个研讨会上回答了行业专家的问题。本周,中国互联网充满了胜利主义的喜悦。正如2017年谷歌DeepMind战胜中国最强围棋选手展示了西方在人工智能领域的辉煌一样,深度求索本月发布的世界领先的AI推理模型在中国被誉为一次惊人的成功。一位中国科技高管表示,深度求索的更智能、更便宜的AI模型是“国运级别的...

DeepSeek的逆袭:国产AI巨头如何让英伟达蒸发5800亿美元?

DeepSeek的逆袭:国产AI巨头如何让英伟达蒸发5800亿美元?

人工智能(AI)技术的飞速发展正在重塑全球科技版图。然而,随着国产大模型DeepSeek R1的崛起,全球AI市场迎来了前所未有的震荡。DeepSeek凭借其卓越的技术突破和成本优势,成功挑战了行业巨头英伟达,导致其市值骤减5800亿美元。这一事件不仅引发了行业内的广泛关注,也引发了对AI价值本质的深刻反思。DeepSeek R1的技术突破与成本优势DeepSeek R1作为一款国产大模型,凭借其...

DeepSeek-R1 本地部署全攻略:使用 Ollama 轻松搭建 AI 环境

DeepSeek-R1 本地部署全攻略:使用 Ollama 轻松搭建 AI 环境

近年来,人工智能(AI)技术的迅猛发展让大型语言模型(LLM)成为科技行业的焦点。然而,许多开发者和企业希望能够在本地环境中部署 AI 模型,以满足数据隐私、定制化需求或离线使用的场景。DeepSeek-R1 作为国产高性能 AI 推理模型,专注于数学、代码和自然语言推理任务,而 Ollama 则是一款强大的本地化 AI 部署工具,能够帮助用户在本地轻松运行大型语言模型。本指南将详细介绍如何使用 ...

OpenAI o3-mini与DeepSeek R1全面对比:谁在推理能力与成本上占据优势?

OpenAI o3-mini与DeepSeek R1全面对比:谁在推理能力与成本上占据优势?

近期,OpenAI发布了全新推理模型o3-mini,这款模型专门针对科学、数学、编程等领域进行了优化,承诺在响应速度、准确度和成本上超越前代的o1-mini。随着o3-mini的问世,它立即引起了与深度推理模型DeepSeek R1的比较讨论。本文将深入对比这两款推理模型,从推理能力、性能和定价等多个维度,为用户提供一份全面的参考。一、o3-mini的核心亮点STEM优化:o3-mini在数学、编...

中国AI技术引领全球浪潮,外资重估中国资产价值

中国AI技术引领全球浪潮,外资重估中国资产价值

随着美国股市周四在尾盘阶段出现波动,中概股却表现亮眼,展现出强劲的市场反弹力。特别是在中国人工智能技术的强势崛起和全球资金流向中国资产的背景下,外资正在重估中国资产的真正价值。截至周四收盘,纳斯达克金龙指数大涨4.33%,创下自去年12月以来的最大单日涨幅。在众多表现突出的中概股中,阿里巴巴成为焦点之一,其股价涨幅达到6.22%。这背后,正是中国AI企业不断突破技术壁垒,吸引了大量国际投资者的关注...

OpenAI发布o3-mini:新一代推理模型挑战AI领域性能极限

OpenAI发布o3-mini:新一代推理模型挑战AI领域性能极限

2025年2月1日凌晨,OpenAI发布了其最新推理模型——o3-mini,并已在ChatGPT和API中上线。这一举措无疑将在AI技术应用的速度、准确性以及多样性方面带来全新的变革,尤其是在数学、科学、编码等复杂领域的应用。OpenAI的o3-mini不仅为不同用户群体提供了灵活的使用选项,而且在推理强度、网络搜索功能、深度思考过程展示等方面取得了技术突破。作为OpenAI首个支持函数调用、结构...

DeepSeek:打破成本与性能瓶颈,吸引全球投资和人才,探索AI行业未来发展

DeepSeek:打破成本与性能瓶颈,吸引全球投资和人才,探索AI行业未来发展

2025年2月3日——在AI行业日新月异的今天,DeepSeek无疑成为了全球科技圈最为瞩目的焦点。从其创新的模型架构到对硬件的巨大投资,这家公司正在以前所未有的速度推动AI技术的突破。在这一过程中,DeepSeek不仅大幅降低了AI推理的成本,还吸引了全球顶尖AI人才,成为了AI行业新兴力量中的佼佼者。革命性创新:MLA模式显著降低推理成本DeepSeek最为引人注目的创新之一是其推出的多头潜在...

OpenAI测试AI说服能力:过于强大的说服力可能带来危险

OpenAI测试AI说服能力:过于强大的说服力可能带来危险

在人工智能的快速发展过程中,AI的说服能力日益成为一个备受关注的话题。OpenAI近日通过其新发布的“推理”模型o3-mini,测试了AI在复杂社交互动中的说服能力,而这一测试通过利用Reddit的子论坛r/ChangeMyView进行。这个具有数百万用户的论坛是人们表达自己观点并试图通过讨论改变他人看法的地方,成为了训练AI模型的理想数据源。然而,随着AI在这一领域的强势表现,OpenAI也开始...

DeepSeek推理模型暴露弱点:频繁切换思路导致“欠思考”,最短答案常为正确

DeepSeek推理模型暴露弱点:频繁切换思路导致“欠思考”,最短答案常为正确

尽管DeepSeek等推理大模型在人工智能领域掀起了技术革命,但最新的研究揭示了这些模型在解决复杂问题时的明显弱点。研究表明,当DeepSeek等模型遇到高难度问题时,频繁切换思路而不深入探讨现有路径,导致了所谓的“欠思考”(Underthinking)现象。这种现象不仅降低了推理效率,还显著影响了模型的准确性。“三心二意”的问题:频繁思维切换降低推理质量近日,腾讯AI实验室、苏州大学和上海交通大...

中国大模型逆袭全球!DeepSeek引爆中美云巨头"抢滩战"

中国大模型逆袭全球!DeepSeek引爆中美云巨头"抢滩战"

当全球AI竞赛进入白热化阶段,一款中国大模型正以燎原之势重构国际云服务市场格局。2025年2月3日,随着百度、阿里、华为、腾讯四大云厂商同步官宣,DeepSeek大模型的商业化浪潮正式席卷全球云市场。更令人瞩目的是,英伟达、亚马逊、微软三大硅谷巨头罕见地在24小时内集体接入这款中国AI引擎,上演了一场横跨太平洋的"技术抢滩战"。国产大模型的"云上闪电战"在百度智能云千帆平台,开发者现可零门槛调用D...

华为昇腾910C挑战NVIDIA H100:AI推理性能突破性进展

华为昇腾910C挑战NVIDIA H100:AI推理性能突破性进展

2025年2月5日,随着AI芯片行业的竞争愈发激烈,华为最新的昇腾910C芯片正在引起业内的广泛关注。尽管DeepSeek尚未公布其硬件设施的详细配置,但一则最新消息显示,DeepSeek已成功验证了华为的昇腾910C芯片,并将其与NVIDIA的H100进行对比,取得了令人惊讶的成果。昇腾910C:国产芯片的强劲崛起昇腾910C作为华为在2024年晚些时候推出的最新AI芯片,已经引起了业内的广泛关...

字节跳动AI布局:从追赶者到引领者,如何以“慢思考、快执行”夺回未来科技制高点

字节跳动AI布局:从追赶者到引领者,如何以“慢思考、快执行”夺回未来科技制高点

近年来,人工智能(AI)技术飞速发展,全球科技巨头纷纷入场,争夺这一风口浪尖上的蛋糕。而在中国,字节跳动以其独特的“慢思考、快执行”策略,在短短一年间实现了令人瞩目的进展,迅速从大模型市场的追赶者跃升为领跑者之一。“慢思考,快执行”:字节跳动的AI战略揭秘字节跳动并非凭空涌现,而是在经历了长期的战略规划与技术储备后,通过一次次高效的执行步伐,终于打破了AI行业的技术壁垒,站在了全球领先的高地。这种...

百融云创与DeepSeek深度接入:开启AI智能体新时代

百融云创与DeepSeek深度接入:开启AI智能体新时代

百融云创正式接入DeepSeek,赋能企业级智能体平台2025年2月7日,北京——在中国人工智能行业不断突破的背景下,百融云创宣布与国产AI大模型DeepSeek完成全面深度接入,并将这一技术集成进其自研的企业级智能体平台——CybotStar Agent Builder。这一举措不仅进一步提升了CybotStar的性能,还为企业提供了更强大、更灵活的智能体解决方案。DeepSeek引领AI变革,...

深度对话:从 DeepSeek 技术突破到 AI 超级集群的未来

深度对话:从 DeepSeek 技术突破到 AI 超级集群的未来

编者注:本文根据美国知名播客主持人 Lex Fridman 与两位重量级嘉宾——半导体分析专家 Dylan Patel、AI 研究科学家 Nathan Lambert 之间的长达五小时访谈整理而成。原对话文字超十万字,我们在保留主要观点和思考深度的基础上进行了凝练和改写,希望给读者带来更流畅、更具可读性的阅读体验。01 | DeepSeek:从“黑马”到热议焦点1.1 DeepSeek 是什么?L...