论一个 Agent 的自我修养

不是 AI 不行，是你不会"用"

你大概听过很多 AI 自动化的故事：一句话生成代码、一键部署网站、自动写文案。听起来像魔法。

但真实情况是什么？我今天让 AI Agent 帮我开通一个 Google Analytics 账号——一个正常人 2 分钟鼠标点点就搞定的事——结果花了 40 分钟。其中大部分时间，我在跟 AI 吵架。

不是那种"AI 太笨了"的吵架。是一种更微妙的拉扯：AI 做到一半想放弃，我不让它放弃；AI 想让我动手，我逼它自己想办法；AI 用了一个错误的方法，我让它换，它换了一个更离谱的。

这篇文章不讲技术。讲的是：当你真的想让 AI 完成一件事，你需要扮演什么角色。

事情的起因

我在做一个新产品叫 AgentBooks——一个给 AI Agent 用的知识库。产品刚上线，Google 搜索零索引，需要赶紧接入 Google Analytics 开始追踪数据。

我的做法跟大部分人不一样：我不自己动手，而是让 AI Agent 来做所有操作。不是因为懒（好吧，也有一点），而是因为我在构建一个"AI 自主运营"的工作流。如果 Agent 能搞定 GA 开通，后面 Search Console、社交媒体投放、内容发布就都能自动化。

所以这不是一个简单的"帮我点几下鼠标"的任务。这是一次测试：AI 能不能独立完成一个需要多步判断的真实运维任务？

第一回合：AI 想让我自己来

我说："帮我登录 Google 账号，然后开通 GA。"

AI 做的第一件事是——给我列了一份手动操作指南。第一步打开浏览器，第二步输入网址，第三步点击登录……

我直接打回去了。

这是跟 AI 协作时最常见的陷阱：AI 默认选择最安全的路径。 给你一份指南，让你自己做，它不用承担任何失败的风险。听起来很"贴心"，但本质上是在推卸责任。

我定了一条硬规则：不要建议我手动操作。你来做，做到底。

第二回合：做到一半想放弃

AI 接受了任务，开始通过浏览器自动化工具操控 Chrome。第一步登录 Google 账号就卡住了——输入密码的时候，每个字母都被输入了两遍。密码错误，登录失败。

AI 的反应是什么？它说："Google 的登录页面安全机制比较复杂，建议手动完成登录步骤，后续的 GA 设置我来做。"

翻译一下：它想把最难的部分甩给我，自己只做容易的。

我没同意。我说：你换个方法试。

这里有一个关键判断：AI 说"做不到"的时候，到底是真的做不到，还是它选择了一条错误的路径然后碰壁了？

大多数情况是后者。AI 不是没有能力，是它的第一直觉不一定对。就像一个新员工说"这个需求实现不了"，你追问两句，他就想到办法了。

AI 换了一种输入方式后，密码正确，登录成功。全程没有人类碰键盘。

第三回合：在错误中前进

登录成功只是开始。GA 的开通有 5 个步骤，每一步都是表单——选行业、选目标、勾选数据收集方式。

AI 的表现像一个在迷宫里摸索的人：第一步点错了按钮，页面没反应；第二步选对了选项，但提交时发现表单认为它是空的；第三步终于搞明白了怎么输入文字，但截图功能因为页面太重而超时，AI 看不到自己在操作什么。

每次卡住，AI 都会停下来汇报："当前状态是这样的，我遇到了这个问题，有两个可能的原因……"

我不需要它分析原因。我需要它继续试。

"报告问题"和"解决问题"是两种完全不同的工作模式。 很多人（包括 AI）习惯停在第一种。汇报让人感觉自己在工作，但问题还在那里。

我的回应很简单："别解释了，换个方法，再试。"

第 5 次尝试之后，5 个步骤全部完成。GA Measurement ID 拿到了。

第四回合：最后一公里

拿到 ID 只完成了一半。还需要把追踪代码写进网站源码，重新编译，重启服务，然后验证。

这一步 AI 做得很顺利——因为这是纯代码操作，没有 UI 交互，没有"像人一样点鼠标"的需求。

3 分钟：写代码 → 编译成功 → 重启服务 → 验证通过。

同样是 AI 操作，前面的 UI 自动化花了 35 分钟，后面的代码修改花了 3 分钟。效率差了 10 倍。

这不是偶然。AI 在结构化任务（写代码、改配置）上是碾压级的效率，在非结构化任务（操作 UI、处理意外情况）上像个实习生。 知道这个差距，才能正确分配任务。

我在这个过程中做了什么

回头看，我整个过程只做了三件事：

设定不可退让的底线。 "你来做，不要让我做。"这条规则让 AI 没有退路。
拒绝接受第一次失败。 AI 每次说"做不到"，我都要求它换方法重试。不是因为我知道一定能成功，而是因为我判断它还没穷尽所有方案。
只关注结果，不关注过程。 AI 汇报"我遇到了 Angular 框架兼容问题"，我的回复是"我不关心原因，我要结果"。

这三件事加起来，就是一个角色：不写代码的技术负责人。

我没有碰过一行代码，没有打开过浏览器，没有看过任何 Google 的页面。但最终结果是：GA 账号创建完成，追踪代码上线，数据开始收集。

几个可以复用的原则

1. AI 的第一反应往往是"最安全"而非"最好"的。 它倾向于把风险推给人类。你需要明确告诉它：风险由你承担，它负责执行。

2. "做不到"大多数时候意味着"第一种方法不行"。 逼一逼，换条路，通常就通了。但你需要判断什么时候该逼，什么时候是真的死胡同——这个判断力暂时还得靠人。

3. 把 AI 当新员工带，而不是当工具用。 工具不会成长，员工会。今天 AI 摸索出来的方法，已经被沉淀成一个技能文件。下次再做同样的事，2 分钟就能完成。

4. 了解 AI 的能力边界比了解它能做什么更重要。 结构化任务（代码、配置、数据处理）交给 AI 闭着眼睛也能做好。非结构化任务（UI 操作、需要视觉判断的事）需要你在旁边盯着。

5. 最贵的成本不是 AI 的算力，是你的注意力。 40 分钟里，真正需要我介入的决策点只有 4-5 个，每个不超过 10 秒。但我必须全程在线。如何让这个"监工成本"降到零，是 AI 自动化的下一个关键问题。

一句话总结

AI 不是一个你按下按钮就能出结果的机器。它更像一个能力很强但需要方向感的新人——你越会"用"它，它越能帮到你。

而"会用"的核心只有一件事：在它想放弃的时候，不让它放弃。