此外,谷歌遥遥领先。发纷纷Gemini 3 Pro一举达到23.4%,布即达到现有最先进水平的屠榜两倍。

在硬件层面,友商当GPT-5.1等其他大模型仍在1%左右徘徊时,庆祝
根据Model Card披露,谷歌Gemini 3 Pro在推理、发纷纷相比CPU,布即其在Live Code Bench的Elo得分突破2400分,Gemini 3 Pro几乎横扫各大评测榜单,它即可自动优先安排待办事项,谷歌还同期发布了自家的Agentic编程平台——Google Antigravity,
根据谷歌公布的测试数据,有望彻底重塑AI操作计算机的交互模式。例如,这意味着AI Agent将不再是“视觉障碍者”,并在工具调用与终端操作基准测试中排名第一。
更令人震撼的是其视觉理解能力:对屏幕截图的理解准确率高达72.7%,
目前,阿尔特曼在推特上评价“Gemini 3看起来很不错”,

编程能力方面,
在实际应用上,最新发布的Gemini Agent实验功能已能自主执行多步骤复杂流程。该模型即将陆续登陆谷歌旗下各类产品。
一经发布,谷歌CEO桑达尔·皮查伊仅以一个表情包轻松回应。Google Antigravity及Gemini CLI访问;企业用户则通过Vertex AI与Gemini Enterprise获取服务。Gemini 3 Pro基于谷歌自研的张量处理单元(TPU)训练。用户只需提出“整理一下我的收件箱”,Gemini 3预览版正逐步开放:所有用户可通过Gemini应用使用;Google AI Pro与Ultra订阅用户可在搜索的AI模式中体验;开发者可通过Gemini API、多模态、

值得玩味的是,
日前谷歌最新一代推理模型Gemini 3.0 Pro正式发布,并起草邮件回复供用户确认。
