而且这次迭代,颇像是狼披上了羊皮——从模型后缀的数字序号看,这是谷歌最“小”的一次迭代,之前都是从Gemini 2.0到Gemini 2.5这样的迭代,这次从Gemini 3.0到Gemini 3.1Pro Preview。 谷歌CEO皮查伊(Sundar Pichai)表示,新代模型非常擅长处理“超级复杂的任务”。例如将复杂概念可视化、将数据综合成单一视图或者将创意项目变为现实。 而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千丝万缕的关系,官方表示“直接构建在Gemini 3 Deep Think的经验和技术之上”。相当于把Deep Think的核心推理提升技术“下放”到更广泛可用的Pro模型中。 既然这次新代模型的突出能力在处理“超级复杂”的任务,那么普通的对话放一边,谷歌的官方博文中,重点给出了几种示例秀肌肉。 再比如提示词“生成一个滑动切换开关的SVG,当鼠标悬停在太阳图标上时,将其变成发光的月亮,同时背景从明亮平滑渐变到黑暗。采用干净的扁平UI风格。” Gemini 3 Pro给出的动画虽然完成了任务,图标可以随鼠标变化,但是主图标单一,是一个缺角的圆形图案,用黄色代表白天,白色代表夜间。 Gemini 3.1 Pro已经可以根据一段高复杂度的自然语言指令,直接生成一个集3D渲染、实时太阳星历计算、API异步拉取和物理光效于一体的完整交互系统,而不是简单页面demo。 谷歌给出的示例中,用户给出文字指令,Gemini 3.1 Pro生成了构建一个高保真、可交互的3D国际空间站(ISS)轨道追踪器。使用高分辨率的Blue Marble纹理贴图渲染一个精细的3D地球模型。 它不仅生成视觉代码,还构建了一个沉浸式体验,用户可以通过手部追踪操控鸟群,并聆听根据鸟群运动变化的生成式配乐。 当被要求为艾米莉·勃朗特(Emily Brontë)的《呼啸山庄》(Wuthering Heights)打造一个现代个人作品集网站时,该模型并未简单地总结文本内容,而是基于小说的氛围与情绪进行推理,设计出一个简洁、当代感十足的界面,创建出一个捕捉主人公精神内核的网站。 此外,专门做大模型基准测试与对比分析的第三方评测机构也发布了相关测试结果,大赞Gemini 3.1 Pro在构成Artificial Analysis Intelligence Index的10项评测中领先6项,相较于Gemini 3 Pro Preview在多项能力上显著提升,尤其是在推理与知识、代码能力以及降低幻觉方面进步最大。 目前,开发者可以在AI Studio、Gemini API、Gemini CLI、智能体开发平台Google Antigravity以及Android Studio使用3.1 Pro;企业用户则可以在Vertex AI和Gemini Enterprise使用;普通用户在Gemini应用和NotebookLM都能用上,不过后者仅限Pro和Ultra订阅用户。 有人用Gemini 3.1 Pro 生成了一个可交互的 3D 机械级汽车悬架系统模拟器,包含真实几何结构、连杆约束与实时转向和行程计算,相当于把机械工程建模、物理逻辑和3D可视化一次性写成可运行工具,接近工程级原型能力。 AI圈越来越现实了。模型再强,终究得看账单值不值。企业开始精打细算每个token的回报,开发者也得掂量掂量性价比。谷歌这一步,不仅是抢回王座,更是把竞争推向“谁更会过日子”的新阶段。







spider
spider
spider