谷歌 DeepMind 和谷歌研究团队推出了一款名为 InfAlign 的新型机器学习框架,旨在改善生成式语言模型在推理阶段的对齐能力。生成式语言模型在从训练到实际应用的过程中,经常面临不同程度的挑战,其中一个关键问题就是如何确保模型在推理阶段能够达到最佳表现。当前挑战:训练与实际应用的差距尽管现代语言模型通过强化学习和人类反馈(如RLHF)等方法不断提高其表现,这些方法往往侧重于提升模型的“胜率...
在地球上的广袤生态系统中,动物们通过丰富多样的声音传递着信息。这些声音,或是海豚的口哨,或是大象的低沉隆隆声,或是鸟儿的清脆鸣叫,蕴含着无穷的智慧和情感。然而,对于人类来说,这些自然的“呼唤”常常难以解读。幸运的是,随着人工智能(AI)技术的飞速发展,我们正在越来越接近解码这些“动物语言”的可能。鲸鱼的“家庭对话”与“方言”:AI揭示海洋巨兽的秘密鲸鱼的交流方式一直以来是动物行为学家的研究热点。加...
尽管DeepSeek等推理大模型在人工智能领域掀起了技术革命,但最新的研究揭示了这些模型在解决复杂问题时的明显弱点。研究表明,当DeepSeek等模型遇到高难度问题时,频繁切换思路而不深入探讨现有路径,导致了所谓的“欠思考”(Underthinking)现象。这种现象不仅降低了推理效率,还显著影响了模型的准确性。“三心二意”的问题:频繁思维切换降低推理质量近日,腾讯AI实验室、苏州大学和上海交通大...
DeepSeek启动开源周,发布Flash MLA代码库助力GPU优化2025年2月24日,北京——DeepSeek今日宣布启动其“开源周”计划,正式发布首个开源代码库——Flash MLA。这是一个专为Hopper GPU优化的高效MLA(多级解码)解码内核,经过针对可变长度序列的优化,已成功投入生产,标志着DeepSeek在开源技术领域迈出了重要一步。Flash MLA代码库:专为Hopper...