训练_3D标签 - 大屏时代

DeepSeek：打破成本与性能瓶颈，吸引全球投资和人才，探索AI行业未来发展

2025年2月3日——在AI行业日新月异的今天，DeepSeek无疑成为了全球科技圈最为瞩目的焦点。从其创新的模型架构到对硬件的巨大投资，这家公司正在以前所未有的速度推动AI技术的突破。在这一过程中，DeepSeek不仅大幅降低了AI推理的成本，还吸引了全球顶尖AI人才，成为了AI行业新兴力量中的佼佼者。革命性创新：MLA模式显著降低推理成本DeepSeek最为引人注目的创新之一是其推出的多头潜在...

中国AI黑马DeepSeek遭全球围剿：美国科技霸权的黄昏？

副标题：从抄袭指控到芯片禁运，一场“东方技术闪电战”如何撕裂硅谷神话？一、DeepSeek的“技术闪电战”：用开源与低成本颠覆全球AI格局2025年春节，中国科技界上演了一场震撼全球的“技术奇袭”——AI初创企业DeepSeek凭借开源大模型DeepSeek-R1，以“性能比肩OpenAI旗舰模型、成本仅为1/20、训练时间仅两个月”的颠覆性数据，直接击穿了硅谷引以为傲的“技术护城河”86。更令西...

AI普惠时代来临：国产芯片万卡集群与DeepSeek模型掀起的革命性变革

2025年2月5日，开工第一天，AI产业传来振奋人心的消息：百度智能云成功点亮自研昆仑芯三代万卡集群，这不仅是国内首个正式启用的自研万卡集群，更标志着国产芯片技术的重大突破。这一举措不仅解决了百度自身的算力供应问题，还为降低大模型的训练和推理成本铺平了道路。而与此同时，DeepSeek的大爆发正在全球掀起价格战与技术革命，让AI普惠化的梦想逐渐成真。国产芯片万卡集群：降本提效，加速大模型普及万卡集...

李飞飞团队“50美元”训练AI模型真相曝光：基于阿里云Qwen模型的微调之路

近日，李飞飞团队及华盛顿大学的研究人员成功通过不到50美元的云计算费用，训练出了名为s1的人工智能推理模型，该模型在数学和编码能力测试中的表现与OpenAI的O1和DeepSeek的R1等顶尖推理模型相当。此消息一出，立刻引发了AI界的广泛关注，许多人纷纷为这种“低成本、高性能”的突破欢呼。然而，经过深入调查和业内专家的解读，这一现象的背后藏着更多的细节。真相：低成本背后的“强大基座”根据李飞飞团...

深度对话：从 DeepSeek 技术突破到 AI 超级集群的未来

编者注：本文根据美国知名播客主持人 Lex Fridman 与两位重量级嘉宾——半导体分析专家 Dylan Patel、AI 研究科学家 Nathan Lambert 之间的长达五小时访谈整理而成。原对话文字超十万字，我们在保留主要观点和思考深度的基础上进行了凝练和改写，希望给读者带来更流畅、更具可读性的阅读体验。01 | DeepSeek：从“黑马”到热议焦点1.1 DeepSeek 是什么？L...

AI算命爆火！DeepSeek成“赛博半仙”，Z世代迷上赛博玄学？

当AI大模型撞上东方玄学，Z世代迷上赛博算命？春节刚过，一个令人意想不到的现象席卷社交圈：年轻人不再满足于用AI写诗、编程、当导游，转而将DeepSeek捧成了“赛博算命大师”。小红书、微博上，#用DeepSeek算命到凌晨三点#的话题刷屏，有人晒出AI分析的“正缘画像”，从身高长相到职业资产，细节堪比言情小说；有人让AI预测事业运，结果细分到行业风口和贵人方位。“输入生辰八字，AI连我前任出轨都...

3200亿美元豪赌！科技四巨头开启AI“星际之门”：一场重塑人类未来的算力战争

当亚马逊、微软、谷歌、Meta四家巨头在2025年的资本支出计划中亮出“3200亿美元”这个天文数字时，全球科技界屏住了呼吸。这不仅是商业史上最疯狂的军备竞赛，更是一场关乎人类未来十年技术话语权的“算力战争”——从数据中心到芯片集群，从大模型训练到AI应用落地，每一块GPU的堆叠都在重塑未来的边界。一、四巨头“钞能力”全开：从云计算到星际之门亚马逊：千亿押注“云上帝国”“这是千载难逢的商业机会！”...

Oumi：开源AI平台的璀璨新星，打破开发与部署的传统界限

在人工智能领域，开源的力量正在悄然重塑着技术的开发与部署模式。今天，我们聚焦一款崭露头角的开源AI平台——Oumi，它凭借强大的功能和灵活的架构，正吸引着全球开发者和企业的目光。Oumi是什么？解构AI开发新生态Oumi是一个完全开源的AI平台，旨在简化从数据准备、模型训练、评估到最终部署的整个生命周期。它支持训练从1000万到4050亿参数的各种模型，包括文本和多模态模型（如Llama、Qwen...

AI的“幻觉”背后：如何让人工智能学会“我不知道”？

2025年2月13日，随着人工智能的迅猛发展，我们越来越依赖AI来解决复杂问题和进行日常交流。然而，随着AI应用的普及，我们也发现了一个令人担忧的现象——AI常常“胡说八道”，即便它错误的答案通常显得极其自信。这种现象被称为“AI幻觉”，它揭示了当前AI在处理事实时的局限性。《华尔街日报》报道称，在与全球最先进的AI聊天机器人进行对话时，记者询问了一些简单的问题，如“你的配偶是谁？”却得到了令人意...

DeepSeek发布NSA，革新长上下文训练与推理速度，打破性能瓶颈

2025年2月18日，人工智能领域又迎来了一项重磅技术突破。DeepSeek宣布推出其全新的技术——NSA（稀疏注意力机制），该技术专为超快速的长上下文训练和推理设计。NSA不仅与现代硬件高度兼容，并且能够在保持高性能的同时显著加速推理过程，同时降低了预训练成本。NSA的核心创新：高效的稀疏注意力机制随着AI模型对计算能力和内存需求的不断增长，长上下文任务的训练和推理一直是人工智能发展的瓶颈之一。...

中国首位！师炜踏上F1学院赛场，成为中国赛车历史的新标杆

中国赛车历史上再添新篇章！中国车手师炜将作为外卡车手参加即将于3月21日至23日在上海国际赛车场举办的F1学院赛季揭幕战，成为首位踏入F1学院赛场的中国车手。这不仅标志着中国女性车手在国际赛车领域的崭新突破，也为中国赛车运动注入了更多自信与力量。F1学院赛季：中国女性车手的新起点F1学院是F1在2023年推出的一项赛事，旨在为年轻女性车手提供一个进入更高级别赛车赛事的舞台。这一赛事的推出，旨在突破...

苹果自动驾驶技术自博弈突破，或为未来造车提供弯道超车机会

苹果公司近日公布其最新的自动驾驶技术突破，展示了基于自博弈（Self-play）技术的模拟训练系统，成功提升了自动驾驶性能，并显著降低了训练成本。这一技术突破不仅重新点燃了苹果在自动驾驶领域的热情，还可能为其在汽车产业中的未来布局提供关键支持。苹果的自博弈技术利用模拟数据生成和对抗训练，展示了无需依赖大量真实道路数据即可实现高性能自动驾驶的潜力。通过其创新的GIGAFLOW模拟器，苹果能够在短短1...

Grok 3：埃隆·马斯克发布新AI，挑战人工智能领域霸主地位

2025年2月22日，xAI公司宣布推出其全新人工智能模型——Grok 3，这一模型迅速引起了全球科技界的广泛关注。xAI创始人埃隆·马斯克表示，Grok 3“聪明得让人惊讶”，并预测它将超越目前的人工智能领军者，如OpenAI和DeepSeek等。尽管尚需时间验证这些宣言，早期的表现已显示出Grok 3可能具备改变AI行业格局的潜力。Grok 3在多个高难度领域表现出色，包括科学研究、编程和数学...

DeepSeek开源DeepEP通信库：为MoE模型训练和推理提供高效解决方案

2025年2月25日，DeepSeek在开源周第二日宣布，成功开源DeepEP，这是第一个专为Mixture of Experts（MoE）模型训练和推理设计的开源EP通信库。DeepEP旨在提升MoE模型的计算效率，提供高效的节点内和节点间通信，优化GPU资源管理，并为AI开发者提供更灵活、低延迟的解决方案。1. DeepEP通信库：MoE模型的高效支持DeepEP是专门为MoE（Mixture...

特斯拉FSD‘零本地训练’突袭中国市场！马斯克：网上视频模拟搞定中国路况

特斯拉全自动驾驶（FSD）功能以“闪电战”姿态正式登陆中国！2月26日，特斯拉中国官网悄然上线“FSD智能辅助驾驶功能”，CEO埃隆·马斯克在X平台高调回应技术路径争议：“我们仅用互联网公开的中国道路视频训练模型，无需本地数据采集！”技术路径引争议：模拟训练真能征服中国路况？针对中国用户对FSD本地化适配的质疑，马斯克在X平台直言：“特斯拉未在中国进行实体路测，而是通过公开可用的道路、交通标志视频...

DeepSeek开源“双响炮”：DualPipe算法破局训练效率，EPLB重构AI算力分配

——全球首个双轨并行优化方案开源，大模型训练成本或降40%北京时间今日午间，国内AI独角兽深度求索（DeepSeek）在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术，直击千亿参数大模型训练的算力瓶颈，GitHub首发5小时即登热榜首位，开发者社区惊呼“分布式训练的Game Changer来了...

首页 1 2 3 4 5 尾页