首页 > 3D快报内容详情

Gemini 2.0 全家桶来袭:低成本高性能,AI功能玩出新花样

1周前 138 大屏时代

去年底,Google DeepMind掀起了智能体时代的序幕,推出了面向未来的 Gemini 2.0 Flash 模型,标志着一只脚已经踏入2.0时代。时隔两个月,Gemini 2.0 系列全家桶终于正式亮相,这一次,不仅在性能上实现了进一步突破,还大举挥舞起AI性价比的大旗,并全面拥抱多模态能力。

1-1 (1).png

在DeepSeek的“鲶鱼效应”不断催化下,Google此次发布的 Gemini 2.0 系列产品各显神通:

  • Gemini 2.0 Pro Experimental这款顶级模型主打编码性能和处理复杂提示能力,在知识理解与逻辑推理上表现尤为突出。它拥有200万tokens的超大上下文窗口,相当于可以一次性处理约150万个单词,轻松消化整部《哈利·波特》系列。支持多模态输入、文本输出、结构化输出、函数调用和代码执行等全方位功能,在MMLU-Pro测试中获得了79.1%的优异得分,特别在数学(91.8%)和多语言能力(86.5%)方面表现抢眼,堪称目前全家桶中的“全能选手”。
  • Gemini 2.0 Flash专为开发者打造的API接口版,支持多模态输入和文本输出,拥有100万tokens的上下文窗口,并支持结构化输出、函数调用和代码执行。它以优越的响应速度和低廉的成本,使得开发者可以快速构建各类应用,满足实际业务场景需求。
  • Gemini 2.0 Flash-Lite作为性价比之王,这款轻量版虽然在部分功能上有所取舍,暂不支持多模态实时API、搜索工具和代码执行,但依然保留了100万tokens的上下文窗口、核心的多模态输入、文本输出以及函数调用能力。定价上,文本、图像和视频输入每百万tokens仅需0.075美元,几乎比标准版便宜了三分之一,使得更多开发者能够以极低的成本体验到高性能的AI能力。

此外,Google还推出了多模态实时API的beta版本,虽然图像和音频输出功能将在后续陆续推出,但已有的定价策略显示,文本、图像和视频输入费用为每百万tokens 0.10美元,音频输入为0.70美元,而输出费用则为每百万tokens 0.40美元。各类缓存费用也维持在较低水平,保证了整体成本优势。

性能测试方面,Gemini 2.0系列表现亮眼。除Pro Experimental版本在多项指标上表现卓越外,Flash和Flash-Lite版本也分别取得了71.6%和77.6%的成绩。尽管最强的Pro Experimental版本在某些方面仍稍逊于OpenAI o3模型,但总体上,Gemini 2.0 系列以其快速响应和低成本优势,已经在命名实体识别、分类任务等特定应用场景中展现出巨大的潜力。

新模型现已在Google AI Studio和Vertex AI平台向开发者全面开放,而Gemini高级用户也可在各自设备上选用。更令人兴奋的是,网友们已经迫不及待地用这些模型玩出了新花样——例如,通过代码操刀设计一个贪吃蛇游戏,让AI自己实现游戏对战,打破传统AI仅仅用于回答问题的刻板印象。

总之,随着Gemini 2.0 全家桶的发布,Google不仅在性能上实现了全方位提升,还通过亲民的定价策略和多模态支持,进一步扩展了AI的应用边界。对于开发者而言,这无疑是一次难得的机遇;而对于整个AI生态来说,低成本高性能的突破将为智能工作、自动化开发和多模态应用奠定坚实基础。未来,随着图像生成、文本到语音等功能陆续上线,Gemini 2.0 系列将在更多领域掀起一场技术革命。

相关标签: 20 Gemini AI 模态 tokens Google 开发者 文本 输出 输入