参数_3D标签 - 大屏时代

超参数科技：从游戏到生活，AI技术的探索与未来

在AI技术飞速发展的当下，诞生于2019年的超参数科技逐渐走入公众视野。这家公司从强化学习（RL）教AI玩游戏起步，一路将目光投向更广阔的领域，如大型语言模型（LLM）与RL结合的创新场景。他们的目标远不止于游戏，而是让AI从虚拟世界延伸到现实生活，成为未来人类生活的重要组成部分。从游戏Agent到“有温度”的智能体超参数科技的创始人刘永升，是腾讯围棋AI「绝艺」和王者荣耀AI「绝悟」的主要负责人...

微软论文再曝OpenAI模型参数，医疗AI评测意外暴露4o-mini只有8B参数

在一篇聚焦医疗AI评测的研究论文中，微软似乎再次“意外”披露了多个顶级大语言模型的参数规模。这篇论文发布于12月26日，不仅揭示了包括OpenAI、Anthropic等公司的模型参数信息，还引发了业内对大模型架构和技术实力的广泛讨论。主要内容亮点OpenAI的模型参数论文中提到，OpenAI的o1-preview模型约有300B参数，而GPT-4o模型的参数约为200B，令人震惊的是，GPT-4o...

微软开源Phi-4：超强小参数模型震撼登场，超越GPT-4o，商用无门槛

2025年1月9日，微软研究院发布了一款令人瞩目的AI模型——Phi-4。这一新型小参数模型，尽管只有140亿个参数，却在多个基准测试中超越了许多大型开源和闭源模型，甚至挑战了GPT-4o和其他顶级AI的性能。最令人振奋的是，Phi-4不仅开源，而且支持MIT许可证下的商业用途，给广大开发者和企业带来了巨大的机遇。Phi-4的惊人表现：超越GPT-4o，强悍实力不容小觑自从去年12月12日首次展示...

开源推理AI模型Sky-T1-32B：训练成本仅450美元的全新突破

近日，由加州大学伯克利分校天空计算实验室（NovaSky）发布的Sky-T1-32B-Preview推理模型，以其卓越的性能和超低的训练成本震撼了AI界。这一模型不仅在多个关键基准测试中表现优异，与OpenAI早期版本的模型性能相当，更以不到450美元的训练成本创造了AI推理模型的新里程碑。Sky-T1的诞生：开源与低成本的完美结合开源与透明的重大意义NovaSky团队首次全面公开了Sky-T1-...

Sky-T1：开源推理型AI模型，450美元训练成本开启新纪元

近日，加州大学伯克利分校 Sky Computing Lab 团队发布了一款名为 Sky-T1-32B-Preview 的开源推理型人工智能模型。这一模型的训练成本仅为450美元，其高效的开发模式与优异的推理能力标志着人工智能领域的一次重要突破。相比传统AI模型动辄数百万美元的训练成本，Sky-T1的低成本和高性能为AI技术的普及开辟了新的可能。Sky-T1的技术亮点1. 推理型模型：自我核查的智...

DeepSeek开源“双响炮”：DualPipe算法破局训练效率，EPLB重构AI算力分配

——全球首个双轨并行优化方案开源，大模型训练成本或降40%北京时间今日午间，国内AI独角兽深度求索（DeepSeek）在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术，直击千亿参数大模型训练的算力瓶颈，GitHub首发5小时即登热榜首位，开发者社区惊呼“分布式训练的Game Changer来了...

DeepSeek开源3FS文件系统：AI数据处理的“动力引擎” 刷新全球存储性能纪录

核心性能：重新定义AI时代存储效率上限在DeepSeek开源周第五天，这家中国AI领军企业正式发布革命性存储系统——Fire-Flyer文件系统（3FS）。作为专为数据密集型AI任务设计的并行文件系统，3FS在180节点集群测试中实现6.6 TiB/s聚合读取吞吐量，较主流Ceph系统提升近3倍；在25节点规模的GraySort基准测试中，以3.66 TiB/min吞吐量刷新全球排序性能纪录。技术...

首页 1 尾页