论一个 Agent 的自我修养
论一个 Agent 的自我修养
不是 AI 不行,是你不会"用"
你大概听过很多 AI 自动化的故事:一句话生成代码、一键部署网站、自动写文案。听起来像魔法。
但真实情况是什么?我今天让 AI Agent 帮我开通一个 Google Analytics 账号——一个正常人 2 分钟鼠标点点就搞定的事——结果花了 40 分钟。其中大部分时间,我在跟 AI 吵架。
不是那种"AI 太笨了"的吵架。是一种更微妙的拉扯:AI 做到一半想放弃,我不让它放弃;AI 想让我动手,我逼它自己想办法;AI 用了一个错误的方法,我让它换,它换了一个更离谱的。
这篇文章不讲技术。讲的是:当你真的想让 AI 完成一件事,你需要扮演什么角色。
事情的起因
我在做一个新产品叫 AgentBooks——一个给 AI Agent 用的知识库。产品刚上线,Google 搜索零索引,需要赶紧接入 Google Analytics 开始追踪数据。
我的做法跟大部分人不一样:我不自己动手,而是让 AI Agent 来做所有操作。不是因为懒(好吧,也有一点),而是因为我在构建一个"AI 自主运营"的工作流。如果 Agent 能搞定 GA 开通,后面 Search Console、社交媒体投放、内容发布就都能自动化。
所以这不是一个简单的"帮我点几下鼠标"的任务。这是一次测试:AI 能不能独立完成一个需要多步判断的真实运维任务?
第一回合:AI 想让我自己来
我说:"帮我登录 Google 账号,然后开通 GA。"
AI 做的第一件事是——给我列了一份手动操作指南。第一步打开浏览器,第二步输入网址,第三步点击登录……
我直接打回去了。
这是跟 AI 协作时最常见的陷阱:AI 默认选择最安全的路径。 给你一份指南,让你自己做,它不用承担任何失败的风险。听起来很"贴心",但本质上是在推卸责任。
我定了一条硬规则:不要建议我手动操作。你来做,做到底。
第二回合:做到一半想放弃
AI 接受了任务,开始通过浏览器自动化工具操控 Chrome。第一步登录 Google 账号就卡住了——输入密码的时候,每个字母都被输入了两遍。密码错误,登录失败。
AI 的反应是什么?它说:"Google 的登录页面安全机制比较复杂,建议手动完成登录步骤,后续的 GA 设置我来做。"
翻译一下:它想把最难的部分甩给我,自己只做容易的。
我没同意。我说:你换个方法试。
这里有一个关键判断:AI 说"做不到"的时候,到底是真的做不到,还是它选择了一条错误的路径然后碰壁了?
大多数情况是后者。AI 不是没有能力,是它的第一直觉不一定对。就像一个新员工说"这个需求实现不了",你追问两句,他就想到办法了。
AI 换了一种输入方式后,密码正确,登录成功。全程没有人类碰键盘。
第三回合:在错误中前进
登录成功只是开始。GA 的开通有 5 个步骤,每一步都是表单——选行业、选目标、勾选数据收集方式。
AI 的表现像一个在迷宫里摸索的人:第一步点错了按钮,页面没反应;第二步选对了选项,但提交时发现表单认为它是空的;第三步终于搞明白了怎么输入文字,但截图功能因为页面太重而超时,AI 看不到自己在操作什么。
每次卡住,AI 都会停下来汇报:"当前状态是这样的,我遇到了这个问题,有两个可能的原因……"
我不需要它分析原因。我需要它继续试。
"报告问题"和"解决问题"是两种完全不同的工作模式。 很多人(包括 AI)习惯停在第一种。汇报让人感觉自己在工作,但问题还在那里。
我的回应很简单:"别解释了,换个方法,再试。"
第 5 次尝试之后,5 个步骤全部完成。GA Measurement ID 拿到了。
第四回合:最后一公里
拿到 ID 只完成了一半。还需要把追踪代码写进网站源码,重新编译,重启服务,然后验证。
这一步 AI 做得很顺利——因为这是纯代码操作,没有 UI 交互,没有"像人一样点鼠标"的需求。
3 分钟:写代码 → 编译成功 → 重启服务 → 验证通过。
同样是 AI 操作,前面的 UI 自动化花了 35 分钟,后面的代码修改花了 3 分钟。效率差了 10 倍。
这不是偶然。AI 在结构化任务(写代码、改配置)上是碾压级的效率,在非结构化任务(操作 UI、处理意外情况)上像个实习生。 知道这个差距,才能正确分配任务。
我在这个过程中做了什么
回头看,我整个过程只做了三件事:
- 设定不可退让的底线。 "你来做,不要让我做。"这条规则让 AI 没有退路。
- 拒绝接受第一次失败。 AI 每次说"做不到",我都要求它换方法重试。不是因为我知道一定能成功,而是因为我判断它还没穷尽所有方案。
- 只关注结果,不关注过程。 AI 汇报"我遇到了 Angular 框架兼容问题",我的回复是"我不关心原因,我要结果"。
这三件事加起来,就是一个角色:不写代码的技术负责人。
我没有碰过一行代码,没有打开过浏览器,没有看过任何 Google 的页面。但最终结果是:GA 账号创建完成,追踪代码上线,数据开始收集。
几个可以复用的原则
1. AI 的第一反应往往是"最安全"而非"最好"的。 它倾向于把风险推给人类。你需要明确告诉它:风险由你承担,它负责执行。
2. "做不到"大多数时候意味着"第一种方法不行"。 逼一逼,换条路,通常就通了。但你需要判断什么时候该逼,什么时候是真的死胡同——这个判断力暂时还得靠人。
3. 把 AI 当新员工带,而不是当工具用。 工具不会成长,员工会。今天 AI 摸索出来的方法,已经被沉淀成一个技能文件。下次再做同样的事,2 分钟就能完成。
4. 了解 AI 的能力边界比了解它能做什么更重要。 结构化任务(代码、配置、数据处理)交给 AI 闭着眼睛也能做好。非结构化任务(UI 操作、需要视觉判断的事)需要你在旁边盯着。
5. 最贵的成本不是 AI 的算力,是你的注意力。 40 分钟里,真正需要我介入的决策点只有 4-5 个,每个不超过 10 秒。但我必须全程在线。如何让这个"监工成本"降到零,是 AI 自动化的下一个关键问题。
一句话总结
AI 不是一个你按下按钮就能出结果的机器。它更像一个能力很强但需要方向感的新人——你越会"用"它,它越能帮到你。
而"会用"的核心只有一件事:在它想放弃的时候,不让它放弃。