Gemini 3.5 Flash 内置 Computer Use：谷歌把屏幕操控能力塞进了主力模型

Gemini 3.5 Flash 把 Computer Use 做成了内置工具

6 月 24 日，Google DeepMind 宣布 Gemini 3.5 Flash 正式支持 Computer Use——不再是单独的模型，而是直接集成到主力 Flash 模型里。

之前想用 Gemini 做屏幕操控，得调 Gemini 2.5 Computer Use 这个独立模型。现在 3.5 Flash 自带这个能力，和函数调用、Search、Maps Grounding 放在同一个工具箱里。

能做什么

简单说，3.5 Flash 现在能"看到"屏幕、理解屏幕上发生了什么、然后用鼠标和键盘去操作。浏览器、桌面应用、移动端都在覆盖范围内。

这意味着开发者可以搭出这样的 Agent：自己打开网页、填表单、点按钮、读取结果，全程不需要人工介入。Google 举的典型场景包括持续性的软件测试、跨应用的知识工作自动化。

安全措施

Computer Use 在开放环境里跑，安全风险比封闭 API 调用大得多。Google 在 3.5 Flash 里做了几件事：

针对性对抗训练，让模型能识别 prompt injection 攻击
可选的敏感操作确认机制——遇到不可逆操作时要求用户确认
自动检测间接 prompt injection 并中止任务

Google 建议开发者把这些安全功能和沙箱环境、人工审核、严格的访问控制组合使用。

合作伙伴

Google 公布了几个早期合作伙伴的反馈：

Browserbase 提供了在线 demo 环境，可以直接试用
Browser Use 的 CEO 称赞了模型在浏览器场景下的表现
UiPath 的高级总监提到了企业自动化场景的价值

怎么用

通过 Gemini API 和 Gemini Enterprise Agent Platform 都可以调用。Google 提供了参考实现和文档。

背景

Computer Use（让 AI 直接操控电脑屏幕）是过去一年 Agent 领域最热的方向之一。Anthropic 的 Claude 率先在 2024 年底推出了 Computer Use 功能，OpenAI 也跟进了 Operator。现在 Google 把这个能力内置到 Flash 这个偏轻量的模型里，降低了使用的门槛。

之前 Gemini 2.5 的 Computer Use 是独立模型，想用屏幕操控就得牺牲 Flash 的速度和成本优势。整合之后，开发者不用在功能和效率之间做选择了。

Gemini 3.5 Flash 把 Computer Use 做成了内置工具

6 月 24 日，Google DeepMind 宣布 Gemini 3.5 Flash 正式支持 Computer Use——不再是单独的模型，而是直接集成到主力 Flash 模型里。

能做什么

简单说，3.5 Flash 现在能"看到"屏幕、理解屏幕上发生了什么、然后用鼠标和键盘去操作。浏览器、桌面应用、移动端都在覆盖范围内。

安全措施

Computer Use 在开放环境里跑，安全风险比封闭 API 调用大得多。Google 在 3.5 Flash 里做了几件事：

针对性对抗训练，让模型能识别 prompt injection 攻击

可选的敏感操作确认机制——遇到不可逆操作时要求用户确认

自动检测间接 prompt injection 并中止任务

Google 建议开发者把这些安全功能和沙箱环境、人工审核、严格的访问控制组合使用。

合作伙伴

Google 公布了几个早期合作伙伴的反馈：

Browserbase 提供了在线 demo 环境，可以直接试用

Browser Use 的 CEO 称赞了模型在浏览器场景下的表现

UiPath 的高级总监提到了企业自动化场景的价值

怎么用

通过 Gemini API 和 Gemini Enterprise Agent Platform 都可以调用。Google 提供了参考实现和文档。

背景

之前 Gemini 2.5 的 Computer Use 是独立模型，想用屏幕操控就得牺牲 Flash 的速度和成本优势。整合之后，开发者不用在功能和效率之间做选择了。

Gemini 3.5 Flash 内置 Computer Use：谷歌把屏幕操控能力塞进了主力模型 | 2026-06-25

推荐阅读

HackerNews Trends、Un-0、Y 三款开发者工具推荐 | 2026-06-26

Nub、LookAway、Apposters 三款实用工具推荐 | 2026-06-25

字节跳动发布 Seedance 2.5：单段视频 30 秒，不用拼接 | 2026-06-23

三款值得关注的开源工具：百度 Unlimited OCR、TikZ Editor、FUTO Swipe | 2026-06-24

Gemini 3.5 Flash 内置 Computer Use：谷歌把屏幕操控能力塞进了主力模型 | 2026-06-25

Gemini 3.5 Flash 把 Computer Use 做成了内置工具

能做什么

安全措施

合作伙伴

怎么用

背景

推荐阅读

HackerNews Trends、Un-0、Y 三款开发者工具推荐 | 2026-06-26

Nub、LookAway、Apposters 三款实用工具推荐 | 2026-06-25

字节跳动发布 Seedance 2.5：单段视频 30 秒，不用拼接 | 2026-06-23

三款值得关注的开源工具：百度 Unlimited OCR、TikZ Editor、FUTO Swipe | 2026-06-24

Gemini 3.5 Flash 把 Computer Use 做成了内置工具

能做什么

安全措施

合作伙伴

怎么用

背景