随着2024年的结束,各大社交平台和音娱平台纷纷发布了年度报告,而在这个AI元年中,AI大模型无疑成为了焦点。从智源研究院发布的FlagEval“百模”评测结果来看,国内外的AI大模型竞争愈发激烈,而人工智能的技术进展也让人目不暇接。
2025年,AI技术的发展已不仅限于单一语言模型,多模态模型的出现无疑为AI的应用打开了新天地。此次评测数据显示,字节跳动的“豆包通用模型 Pro”和OpenAI的“GPT-4o”在综合评分上遥遥领先,尤其是在中文能力和视觉理解上,豆包视觉理解模型的表现更是超越了其他竞争者。
此外,AI技术在文生图和文生视频的能力上也取得了重大突破。腾讯Hunyuan Image和快手可灵1.5(高品质版)在生成图像和视频的技术上分别位居全球领先地位,标志着AI创意工具将逐步进入各行各业,尤其是影视制作和广告领域。
AI大模型在K12学科测验中的表现,揭示了一个有趣的现象:“文强理弱”。虽然AI在英语和历史等文科科目中超越了人类学生的平均成绩,但在数学、物理等理科领域,仍存在明显的不足。这一现象表明,虽然AI的多模态能力大幅提升,但在逻辑推理和抽象思维的处理上,仍有待突破。
尤其是在推理和数学能力方面,AI模型的表现与人类的逻辑思维存在差距,亟需在这些领域的强化训练。尽管如此,AI在文科领域的快速进步仍引起了广泛关注,甚至有预测认为,未来的AI可能在许多领域扮演类似学霸的角色,帮助学生提高学习效率。
值得一提的是,AI的应用已经扩展到了金融领域,尤其是在量化交易和辩论这两个高度专业化的领域。通过最新的评测,AI已经能够在量化交易中生成有效的策略代码,甚至能在回撤收益上与初级量化交易员相媲美。OpenAI的GPT-4o和深度求索的DeepSeek-V2.5等头部AI模型在金融量化交易的应用中显示出强大的能力,标志着AI不仅能替代传统的分析工作,甚至能参与到复杂的策略开发中。
在辩论领域,AI的表现也相当引人注目。尽管AI缺乏高效的辩论框架,并且容易出现“幻觉”现象,但它却能在反方辩论中表现突出,特别是在快速反驳对方观点时,展现了出乎意料的能力。这一发展预示着,未来的AI或许不仅是“答案机器”,还能够成为极具思维冲击力的辩论对手。
外资投行对于AI的热情不减,摩根大通、摩根士丹利等金融巨头早已部署AI工具来提升工作效率,减少重复性劳动。比如,摩根大通的LLM Suite平台帮助分析师总结报告和创作文档,而摩根士丹利的AI @ Morgan Stanley Debrief工具则能自动化生成会议纪要和邮件草稿。
这种AI助力不仅提高了工作效率,也使得分析师和投资经理能够将更多精力集中在决策分析和战略规划上,进一步推动了金融行业的数字化转型。尤其是在复杂的经济数据处理和金融建模中,AI已逐步成为不可或缺的得力助手。
虽然AI的进展令许多人兴奋不已,但与此同时,也有不少人对AI可能带来的职业威胁感到担忧。高盛和纽约梅隆银行等机构在其财报电话会议中表示,AI工具的应用并不会立刻引发大规模裁员,而是希望通过提升工作效率,减轻员工的重复性劳动。然而,随着AI在各个行业中越来越多的应用,未来无疑将面临更多的挑战。
从“人工智障”到能够参与量化交易和辩论的初级量化交易员,AI的大幅进步令人惊叹。在未来,AI将不仅是帮助人类完成繁重工作的工具,它将成为各行各业不可忽视的“卷王”。虽然AI带来了前所未有的机遇,但也迫使我们重新思考工作、教育与职业发展的未来。无论你是行业从业者,还是对科技感兴趣的普通人,都需要紧跟这一波AI浪潮,才能在这场变革中立足未来。