在AI技术飞速发展的当下,诞生于2019年的超参数科技逐渐走入公众视野。这家公司从强化学习(RL)教AI玩游戏起步,一路将目光投向更广阔的领域,如大型语言模型(LLM)与RL结合的创新场景。他们的目标远不止于游戏,而是让AI从虚拟世界延伸到现实生活,成为未来人类生活的重要组成部分。从游戏Agent到“有温度”的智能体超参数科技的创始人刘永升,是腾讯围棋AI「绝艺」和王者荣耀AI「绝悟」的主要负责人...
在一篇聚焦医疗AI评测的研究论文中,微软似乎再次“意外”披露了多个顶级大语言模型的参数规模。这篇论文发布于12月26日,不仅揭示了包括OpenAI、Anthropic等公司的模型参数信息,还引发了业内对大模型架构和技术实力的广泛讨论。主要内容亮点OpenAI的模型参数论文中提到,OpenAI的o1-preview模型约有300B参数,而GPT-4o模型的参数约为200B,令人震惊的是,GPT-4o...
2025年1月9日,微软研究院发布了一款令人瞩目的AI模型——Phi-4。这一新型小参数模型,尽管只有140亿个参数,却在多个基准测试中超越了许多大型开源和闭源模型,甚至挑战了GPT-4o和其他顶级AI的性能。最令人振奋的是,Phi-4不仅开源,而且支持MIT许可证下的商业用途,给广大开发者和企业带来了巨大的机遇。Phi-4的惊人表现:超越GPT-4o,强悍实力不容小觑自从去年12月12日首次展示...
近日,由加州大学伯克利分校天空计算实验室(NovaSky)发布的Sky-T1-32B-Preview推理模型,以其卓越的性能和超低的训练成本震撼了AI界。这一模型不仅在多个关键基准测试中表现优异,与OpenAI早期版本的模型性能相当,更以不到450美元的训练成本创造了AI推理模型的新里程碑。Sky-T1的诞生:开源与低成本的完美结合开源与透明的重大意义NovaSky团队首次全面公开了Sky-T1-...
近日,加州大学伯克利分校 Sky Computing Lab 团队发布了一款名为 Sky-T1-32B-Preview 的开源推理型人工智能模型。这一模型的训练成本仅为450美元,其高效的开发模式与优异的推理能力标志着人工智能领域的一次重要突破。相比传统AI模型动辄数百万美元的训练成本,Sky-T1的低成本和高性能为AI技术的普及开辟了新的可能。Sky-T1的技术亮点1. 推理型模型:自我核查的智...
——全球首个双轨并行优化方案开源,大模型训练成本或降40%北京时间今日午间,国内AI独角兽深度求索(DeepSeek)在开源周第四日祭出“王炸组合”——正式开源双向管道并行算法DualPipe与专家并行负载均衡器EPLB。这两项源自DeepSeek-V3训练体系的核心技术,直击千亿参数大模型训练的算力瓶颈,GitHub首发5小时即登热榜首位,开发者社区惊呼“分布式训练的Game Changer来了...
核心性能:重新定义AI时代存储效率上限在DeepSeek开源周第五天,这家中国AI领军企业正式发布革命性存储系统——Fire-Flyer文件系统(3FS)。作为专为数据密集型AI任务设计的并行文件系统,3FS在180节点集群测试中实现6.6 TiB/s聚合读取吞吐量,较主流Ceph系统提升近3倍;在25节点规模的GraySort基准测试中,以3.66 TiB/min吞吐量刷新全球排序性能纪录。技术...