Lesson 1: Agent 是什么、不是什么

学习目标

一个 AI Agent 是能够自主感知环境、做出决策、采取行动来实现目标的系统。关键词是"自主"——它不是按固定脚本执行，而是根据上下文动态调整行为。

用一个类比：传统自动化像是流水线工人，按固定步骤操作；Agent 像是一个有经验的助理，能理解意图、判断情况、灵活应对。

传统自动化: IF condition THEN action（确定性）
AI Agent:    感知 → 推理 → 决策 → 行动 → 反馈循环（自适应）

Agent 通过 Tools 感知外部世界。一个邮件处理 Agent 能读取邮件内容、附件、发件人信息；一个客服 Agent 能理解客户的文字、语气、历史记录。

没有感知能力的 LLM 只是一个"大脑"——能思考但看不见、听不到、也碰不到外部世界。

这是 LLM 的核心价值。Agent 不是简单匹配关键词，而是理解意图。同一句"我要退货"，根据上下文可能需要完全不同的处理流程——是质量问题、尺寸不对、还是冲动消费后悔了？

推理能力让 Agent 处理模糊的、非结构化的、变化的输入，这是传统 RPA 做不到的。

Agent 通过 Tool Use / Function Calling 与外部系统交互。发邮件、更新数据库、调用 API、生成文件——这些都是行动。关键是 Agent 自己决定什么时候调用什么工具，而不是人类写好调用顺序。

RPA（机器人流程自动化）是"录制回放"模式——录一遍人类的操作步骤，然后精确重复。它的问题是脆弱性：网页改了布局、表单多了一个字段，RPA 就崩了。

Agent 理解意图而非步骤。你告诉 Agent "把这些发票录入系统"，它能适应不同格式的发票、处理异常情况、在遇到问题时寻求帮助。

Agent 的甜蜜区域：

不适合 Agent 的场景：

把 Agent 想象成你雇的一个远程助理：

这个思维模型会贯穿整个课程——好的 Agent 设计就像好的团队管理。