Computer Use 桌面控制
Computer Use 桌面控制
Section titled “Computer Use 桌面控制”Computer Use(桌面控制)是 Claude Code 里最像「科幻照进现实」的一项。之前的 Claude 只能读你的文件、跑你的命令——它活在终端里。Computer Use 把它从终端放出来:它能看屏幕、能点鼠标、能敲键盘,像一个坐在你旁边的同事,直接上手操作那台电脑。
在 best-practice 仓库的「Hot」概念表里,它和 Agent SDK、Computer Use 并列——属于「把 Claude 的手伸得更长」的那一类。
它解决了什么问题
Section titled “它解决了什么问题”很多活儿根本不在代码文件里——它们在浏览器、在桌面应用、在那些没有命令行接口的地方。要测一个网页登录流程、要在一款 GUI 工具里点出某个状态、要核对设计稿和实现是否一致……这些活以前只能你自己手动点。Computer Use 让 Claude 替你点。
怎么接:computer-use MCP server
Section titled “怎么接:computer-use MCP server”能力是通过一个 MCP 服务器接入的——computer-use MCP server。它给 Claude 提供了一组「操作电脑」的工具:截图、鼠标移动、点击、键盘输入等。
# 添加 computer-use MCP 服务器(具体命令以官方最新文档为准)claude mcp add --transport stdio computer-use -- npx -y @modelcontextprotocol/server-computer-use接上之后,Claude 就多了这些「手」——它能截当前屏幕看看现状、能按坐标点击、能输入文字。详见 MCP 连接器 的添加方式,和官方 Desktop 文档里「Let Claude use your computer」一节的最新说明。
工作原理:看一眼,动一下
Section titled “工作原理:看一眼,动一下”Computer Use 不是凭空操作,它是「感知—行动」循环:
截图当前屏幕 → Claude 看截图、判断要做什么 → 发一个操作(点哪、输入什么) → 执行操作 → 再截图看结果 → 循环,直到任务完成这就像人盯着屏幕干活——看一眼、动一下、再看一眼确认。所以它叫「use computer」,本质是让模型像人一样用电脑。
安全提示:让 Claude 用你的电脑,是件大事
Section titled “安全提示:让 Claude 用你的电脑,是件大事”把鼠标和键盘交给一个模型,意味着它真的能改你的东西。几条硬规矩:
- 重要操作别放手——删文件、付款、改系统设置,这些要么不让它做,要么全程盯着。
- 用权限闸住——配合 权限模式,把危险操作放
deny表。 - 最好在隔离环境里试——虚拟机、专用账号、别在主力工作机上放飞。
- 看截图复盘——Computer Use 的每一步都有截图可查,出问题能回溯。
心法:Computer Use 的便利和风险成正比。它的「能干」正是它的「危险」——会点鼠标的 Claude 比只会改文件的 Claude 强得多,也危险得多。
适合:
- 网页自动化——走一遍登录、点出一个状态、抓个截图。
- GUI 工具操作——没有 CLI 的桌面应用,让它替你点。
- 截图比对设计稿——跑起来后截一张图,和设计稿逐像素比对(详见 Chrome 集成 一节也讲截图)。
- 端到端测试——模拟真实用户点一遍流程,比单元测试更接近真人。
不适合:
- 改代码、跑命令——这些它本来就能干,不必绕道 Computer Use。
- 简单的文件读写——杀鸡用牛刀。
Computer Use 让 Claude 从终端走出来、像人一样用你的电脑——通过 computer-use MCP server 接入,看屏幕、动鼠标、敲键盘,循环「感知—行动」。便利和风险成正比,重要操作别放手、最好在隔离环境里试。
下一站,去看 Remote Control 与 Web Session——从别处控制这台 Claude。🌐