谷歌 DeepMind 和谷歌研究团队推出了一款名为 InfAlign 的新型机器学习框架,旨在改善生成式语言模型在推理阶段的对齐能力。生成式语言模型在从训练到实际应用的过程中,经常面临不同程度的挑战,其中一个关键问题就是如何确保模型在推理阶段能够达到最佳表现。当前挑战:训练与实际应用的差距尽管现代语言模型通过强化学习和人类反馈(如RLHF)等方法不断提高其表现,这些方法往往侧重于提升模型的“胜率...
Jeffrey Wang的加入:OpenAI的又一战略布局近日,哈佛大学的杰出华人研究员Jeffrey Wang正式加入了OpenAI,担任基础团队的研究员,专注于人工智能领域的模型预训练和推理工作。此举不仅标志着Jeffrey个人职业生涯的又一里程碑,也再次凸显了OpenAI作为全球AI研究前沿机构的吸引力。卓越的学术背景:早年成就与深厚的研究基础Jeffrey Wang的学术成就令人瞩目。早在...
2025年,随着全球人工智能技术竞争的日益激烈,来自中国的AI创新力量正悄然崛起。其中,杭州的DeepSeek公司以其突破性的AI大模型技术,震惊了全球AI圈,尤其是在美国的科技界引起了广泛关注。作为一家成立仅一年多的初创公司,DeepSeek凭借其强大的研发实力与技术创新,展现了中国在AI领域的卓越潜力,成功缩短了与全球顶尖AI企业的差距,成为新一代AI技术的领跑者。突破性的开源项目:全球AI产...
2025年1月9日,微软研究院发布了一款令人瞩目的AI模型——Phi-4。这一新型小参数模型,尽管只有140亿个参数,却在多个基准测试中超越了许多大型开源和闭源模型,甚至挑战了GPT-4o和其他顶级AI的性能。最令人振奋的是,Phi-4不仅开源,而且支持MIT许可证下的商业用途,给广大开发者和企业带来了巨大的机遇。Phi-4的惊人表现:超越GPT-4o,强悍实力不容小觑自从去年12月12日首次展示...
2024年,生成式AI在全球科技领域掀起了巨大的波澜。以硅谷为核心,各大科技巨头一边加速研发大模型,另一边频频推出创新产品。与此同时,新锐力量也迅速崛起,为市场注入了新的活力。在大模型的参数极限、推理能力和多模态技术竞争中,生成式AI成为科技行业最耀眼的风口。OpenAI的多模态之战:数据与算法双翼齐飞2024年,OpenAI继续稳居生成式AI领域的核心地位。其发布的o1大模型首次将推理算法与预训...
2025年初,智源研究院发布了《2025十大AI技术趋势》,为全球科技界描绘了人工智能发展的未来路线图。这份报告不仅是对当前AI技术现状的深度剖析,更是对未来技术变革与应用的前瞻预测。从科学研究到大模型的优化,从具身智能到AI安全治理,这些趋势构成了一幅清晰的AI未来图景,为科技进步与社会发展注入新的动力。1. AI for Science(AI4S):科学研究的范式变革人工智能正迅速改变科学研究...
近日,由加州大学伯克利分校天空计算实验室(NovaSky)发布的Sky-T1-32B-Preview推理模型,以其卓越的性能和超低的训练成本震撼了AI界。这一模型不仅在多个关键基准测试中表现优异,与OpenAI早期版本的模型性能相当,更以不到450美元的训练成本创造了AI推理模型的新里程碑。Sky-T1的诞生:开源与低成本的完美结合开源与透明的重大意义NovaSky团队首次全面公开了Sky-T1-...
近日,加州大学伯克利分校 Sky Computing Lab 团队发布了一款名为 Sky-T1-32B-Preview 的开源推理型人工智能模型。这一模型的训练成本仅为450美元,其高效的开发模式与优异的推理能力标志着人工智能领域的一次重要突破。相比传统AI模型动辄数百万美元的训练成本,Sky-T1的低成本和高性能为AI技术的普及开辟了新的可能。Sky-T1的技术亮点1. 推理型模型:自我核查的智...
在人工智能技术席卷全球的背景下,半导体产业的地缘政治竞争正向一个更复杂的阶段演进。克里斯·米勒(Chris Miller),《芯片战争》一书的作者兼塔夫茨大学国际历史学教授,近期在台北的天下经济论坛上阐述了他对“特朗普2.0”时期中美半导体博弈的深刻洞察。他的分析不仅揭示了技术对未来全球格局的深远影响,也提供了对芯片行业新前沿的清晰预判。人工智能驱动下的技术转型扩展定律的失效米勒指出,尽管人工智能...
2024年,硅谷生成式AI领域继续保持高速发展,但这一年比2023年更加复杂多变。巨头间的技术竞赛、初创公司的起伏、市场对AI未来的分歧以及技术路径的探索,都让这一年的AI大战充满了戏剧性。这一年,有令人兴奋的技术突破,有巨头的多轮融资,还有初创公司的高调陨落与被收购。本文将带您回顾2024年硅谷生成式AI的关键时刻,并展望2025年可能出现的技术与市场趋势。一、OpenAI:风波之后的新路线1....
近日,OpenAI的推理模型o1被发现会在处理问题时切换语言,即使用户以英文提问,它在推理过程中可能会选择用中文、波斯语或其他语言“思考”。这一现象引发了广泛关注,也揭示了AI推理过程中的神秘一面。是什么让AI模型在不同语言之间切换?这背后隐藏着怎样的技术逻辑与文化背景?o1为何会“用中文思考”?在测试中,有用户发现,当用英文询问一个简单问题(例如“草莓里有几个字母R”)时,模型的最终答案虽然是英...
2025年1月15日,科大讯飞发布了一款备受瞩目的深度推理大模型——讯飞星火深度推理模型X1。这一新模型不仅在技术上突破了传统大模型的局限,还在解题方式上更接近人类的“慢思考”过程,标志着人工智能领域深度推理能力的最新进展。1. “慢思考”与深度推理:模型X1的独特之处与当前通用大模型的快速反应方式不同,讯飞X1的核心创新在于其模拟了人类“慢思考”的解题过程。人类在面对复杂问题时往往需要更多的时间...
在大模型领域,几乎每一次创新都意味着技术的飞跃。从Transformer的崛起到GPT系列的壮大,每一次进展都让人工智能朝着更强大的方向前进。而今天,MiniMax公司推出的MiniMax-01,再次让人看到了大模型架构和技术突破的巨大潜力。它不仅代表着国内在大模型领域的技术前沿,也标志着一个新的“大模型时代”的开始。400万Token上下文:大模型的突破1月15日,MiniMax正式发布了预告已...
2025年1月16日,阿里云通义团队宣布开源其最新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一创新的7B尺寸模型,凭借其卓越的推理错误检测能力,不仅在与同类模型的比较中取得了显著优势,甚至超越了GPT-4o,成为开源领域中的一颗璀璨新星。尤其值得关注的是,Qwen2.5-Math-PRM开创了一个全新的评估标准——ProcessBench,填补了大模型推理过程错误评估的空白,为...
在国产AI芯片厂商加速布局的背景下,沐曦集成电路(上海)股份有限公司(以下简称“沐曦”)近日完成了上市辅导备案,并计划在A股进行IPO。此举标志着沐曦在国内GPU市场的进一步深耕,而这一波国产GPU厂商的IPO潮也吸引了广泛关注。沐曦成立于2020年,其创始团队拥有深厚的技术背景。创始人陈维良曾任AMD全球GPGPU设计总负责人,联合创始人彭莉则是AMD首位华人女科学家。无论是硬件架构设计,还是G...
人工智能领域的新星DeepSeek再次引起广泛关注。最新消息显示,DeepSeek的DeepSeek-R1-Preview模型,尚未正式发布,但已经在全球知名的代码基准测试平台LiveCodeBench中霸榜前三,表现与OpenAI的o1中档推理能力相当,成为AI编程能力的新标杆。DeepSeek-R1-Preview:更强大的推理能力与之前发布的DeepSeek-R1-Lite-Preview(...