谷歌突发Gemini 3.1 Pro!首次采用「.1」版本号,推理性能?×2

  更新时间:2026-02-20 11:49   来源:牛马见闻

吉报头条
重要新闻
国内新闻
国际新闻
图片精选

1 Pro已经在Gemini应用和API中上线Gemini 3 Pro不是还在Preview吗Gemini 3 Pro Preview持

<p></p> <blockquote id="4B678AT2">鱼[羊 梦瑶 发]自 凹非寺<br>量子位 | 公众号 QbitAI<br> </blockquote> <p id="4B678ARC">春节档国产大模型狂卷,谷歌也突然出手,<strong>Gemini 3.1 Pro</strong>直接深夜放大招!</p> <p id="4B678ARD">相较于去年11月才刚刚发布的3 Pro,别看只是「.1」的一小步,升级幅度肉眼可见:</p> <p id="4B678ARE">在官方给出的SVG对比展示中,3.1Pro在多模态生成和语义理解上都提升了一个level。</p> <p class="f_center"><br><br></p> <p id="4B678ARG">不仅如此,3.1 Pro还能将日常数据转为互动可视化内容,一个航空航天仪表盘也能轻松roll出:</p> <p class="f_center"><br><br></p> <p id="4B678ARI">玩起「模拟城市」来,也是地形生成、道路铺设、交通线路,一整套直接成型:</p> <p class="f_center"><br><br></p> <p id="4B678ARK">夯,是真夯,这不有网友们手搓体验完真·就只想说一句——其他家模型可以直接over了(doge)</p> <p class="f_center"><br><br></p> <p id="4B678ARM">闲话少叙,技术报告、模型卡更多细节,我们直接开扒——</p> <p id="4B678ARN">.1一小步,推理能力一大步</p> <p id="4B678ARO">此次升级,官方的说法是把上周发布的Gemini 3 Deep Think背后的核心智能给公开了:</p> <p id="4B678ARP">在Gemini 3的基础上,3.1 Pro在核心推理能力上更进一步。</p> <p id="4B678ARQ">在ARC-AGI-2基准测试中,3.1 Pro获得了<strong>77.1%</strong>的验证分数,在推理表现上达到3 Pro的<strong>2倍</strong>之多:</p> <p class="f_center"><br><br></p> <p id="4B678ARS">此外,3.1 Pro支持1M上下文,知识截止日期为2025年1月,在<strong>多模态理解能力、vibe coding、多语言性能</strong>和<strong>长上下文</strong>方面都同步增强。</p> <p id="4B678ART">在Arena的对比评测结果中,3.1 Pro的整体排名分数也比3 Pro高出<strong>13分</strong>,文本与代码维度的表现进步也相当明显:</p> <p class="f_center"><br><br></p> <p id="4B678ARV">在官方给出的<strong>多模态</strong>效果中,在同一句提示词下,3.1 Pro在动作连贯性和色彩输出上较3.0 Pro有明显提升:</p> <p class="f_center"><br><br></p> <p id="4B678AS1">在<strong>推理能力</strong>上,3.1 Pro相比上一代能应对结构更复杂、步骤更多的提示词需求。</p> <p id="4B678AS2">比如下面这个案例:3.1 Pro直接生成了一个3D版“椋鸟群飞”,视觉代码一次到位,还顺手做出了可交互玩法。</p> <p id="4B678AS3">用户可以直接通过手势追踪操控鸟群,而且画面还能够根据鸟群运动变化而生成的音乐~</p> <p class="f_center"><br><br></p> <p id="4B678AS5">整体上来看,在复杂主题的<strong>可视化</strong>方面,Gemini 3.1 Pro确有明显的进化。</p> <p id="4B678AS6">网友们也在第一时间对官方宣传进行了检验。</p> <p id="4B678AS7">比如用3.1 Pro直接生成一个《我的世界》:</p> <p class="f_center"><br><br></p> <p id="4B678AS9">再瞧这位网友,用3.1 Pro搓出来了个人网站(别说,感觉比Gemini官网效果还好?):</p> <p class="f_center"><br><br></p> <p id="4B678ASB">还有网友脑洞大开,让3.1 Pro开发了一款教育应用,直言模型在模拟光线效果上那叫一个逼真!</p> <p class="f_center"><br><br></p> <p id="4B678ASD">一圈体验下来,大家纷纷表示:</p> <p></p> <blockquote id="4B678AT3"><ul>Gemini没有在开玩笑。</ul></blockquote> <p class="f_center"><br><br></p> <p id="4B678ASF">目前,Gemini 3.1 Pro已经在Gemini应用和API中上线,Google AI Pro和Ultra用户还可以在NotebookLM中使用这一最新模型。</p> <p id="4B678ASG">智能成本还在呈数量级下降</p> <p id="4B678ASH">有意思的一点是,此次发布Gemini 3.1 Pro,是谷歌首次采用「.1」这样的小版本号。</p> <p id="4B678ASI">具有网友表示:不儿,Gemini 3 Pro不是还在Preview吗,这就出新模型啦?</p> <p class="f_center"><br><br></p> <p id="4B678ASK">不得不说,大模型的2026,注定还是要卷到飞起。</p> <p class="f_center"><br><br></p> <p id="4B678ASM">另外值得注意的是,谷歌这一小步,还又把大模型向帕累托前沿推了推。</p> <p id="4B678ASN">帕累托前沿(Pareto Front),可以简单理解为最小化成本,最大化性能。</p> <p id="4B678ASO">定价方面,Gemini 3.1 Pro Preview的输入价格为2美元(<200k tokens)/4美元(>200k tokens),输出价格为4美元(<200k tokens)/18美元(>200k tokens),跟Gemini 3 Pro Preview持平。</p> <p id="4B678ASP">从ARC-AGI基准的视角来看,则是每完成一次ARC-AGI-2任务花费0.96美元(约合人民币6.63元)——</p> <p id="4B678ASQ">相较之下,Gemini 3 Deep Think价格是3.1 Pro的10倍,而两者性能相差仅几个百分点。</p> <p class="f_center"><br><br></p> <p id="4B678ASS">有网友认为,这样的推进速度,「完全打破了传统的成本-智能曲线」。</p> <p class="f_center"><br><br></p> <p id="4B678ASU">相比于基准榜单上测试成绩的变化,对于高速进化中的大模型应用而言,成本方面的持续压缩更加值得关注。</p> <p id="4B678ASV">并且2026,这才刚刚开始呢。</p> <p id="4B678AT0">参考链接:<br>[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/<br>[2]https://deepmind.google/models/gemini/pro/</p>

编辑:海俊杰 Gabriel Harrison