DeepSeek催生谷歌新一代推理模型：40分优势碾压GPT4.5横扫榜单，支持原生多模态，却折戟于"竹竿问题"

zhi 阅读：1578 2025-03-26 14:51:54 评论：0

再度抢跑OpenAI发布会，谷歌Gemini 2.5系列重磅登场。

首推版本Pro Experimental甫一亮相即斩获大模型竞技场榜首，以40分优势力压GPT-4.5！

作为迭代版推理模型，Jeff Dean评价其：
"这是我们最强AI模型，具备顶尖推理与代码生成实力。"

Be like，输入需求：
"帮我设计一款沉浸式无尽跑酷游戏。需包含操作指引浮层。采用p5js开发，禁用HTML。偏好像素风恐龙角色与趣味场景。"

约1分钟后输出：

谷歌多模态复杂任务标杆

官方披露，对比前代产品Gemini 2.0 Flash Thinking，Gemini 2.5在底层架构与训练框架实现双重升级。不仅在竞技场高分夺冠，更在逻辑推演、数理分析、科研模拟、程序开发等维度全面领先——编程能力可与Claude 3.7 Sonnet正面交锋，数学表现堪与Grok 3比肩而立。