Lesson 6: 人机协作设计

学习目标

理解 Human-in-the-Loop 的设计原则
掌握 3 种人机协作模式
学会设计审批和反馈机制

为什么需要人机协作？

完全自动化是一个美好但危险的幻想。在实际业务中：

AI 会犯错（幻觉、误判、过时信息）
某些决策需要人类的直觉和经验
法律/合规要求人类参与关键决策
客户更信任有人类参与的服务

好的 Agent 系统不是"替代人"，而是"增强人"——让人专注于高价值判断，把重复性工作交给 Agent。

协作模式 1: 审批门（Approval Gate）

Agent 完成工作后，等待人类审批再执行。

[Agent 生成邮件草稿] → [人类审核] → [发送/修改/拒绝]

适用场景:

外部沟通（客户邮件、社交媒体回复）
财务操作（超过阈值的付款）
合同/法律文件

实现方式:

Agent 完成 → 发通知到 Slack/Email → 人类点击 Approve/Reject
                                    → Approve: Agent 继续执行
                                    → Reject: Agent 收到反馈，调整后重试

设计要点:

审批界面要显示足够的上下文（Agent 的推理过程、原始输入、建议操作）
设置超时机制（24 小时未审批自动提醒或取消）
提供快速操作（一键批准，而不是重新填表）
记录审批历史，用于优化 Agent 的准确率

协作模式 2: 置信度路由（Confidence Routing）

Agent 评估自己的置信度，高置信度自动处理，低置信度交给人。

[Agent 处理请求]
  → 置信度 > 90%: 自动执行
  → 置信度 60-90%: 执行但标记人工复查
  → 置信度 < 60%: 直接转给人工

适用场景: 客服系统、内容审核、数据分类

让 Agent 输出置信度的方法:

Prompt: "Process this request. Rate your confidence (0-100) in your response.
If below 60, explain what information you need to be more confident.

Return JSON: { response: string, confidence: number, uncertainReason?: string }"

设计要点:

阈值需要根据实际数据调整（不是拍脑袋定的）
初期设低阈值（保守），随着 Agent 表现改善逐渐提高
监控每个置信度区间的实际准确率

协作模式 3: 渐进式授权（Progressive Delegation）

随着 Agent 证明自己的能力，逐步给予更多自主权。

阶段 1（学习期）: Agent 建议，人做决定
阶段 2（验证期）: Agent 做，人复查
阶段 3（信任期）: Agent 自动做，人抽查
阶段 4（自主期）: Agent 自动做，异常时通知

适用场景: 新 Agent 上线、高风险业务场景

实现方式:

每个阶段有明确的晋级标准（如连续 100 次操作准确率 > 95%）
出现严重错误自动降级
保留人工覆盖能力

反馈循环设计

人机协作不是单向的。人的反馈应该改善 Agent 的表现。

显式反馈

在每次人工干预后收集：

人修改了什么？
为什么修改？
Agent 的建议有多接近？

隐式反馈

通过数据自动收集：

审批通过率随时间的变化
人工修改幅度的趋势
某类请求的处理成功率

反馈应用

收集反馈 → 分析模式 → 更新 Prompt / 调整阈值 → 验证改善

每周或每月做一次"Agent 复盘"：

审查被拒绝/修改最多的操作类型
分析原因（prompt 不够好？缺少上下文？场景没覆盖？）
针对性优化
观察下一周期的改善

通知设计

人机协作的效率很大程度取决于通知的设计：

不要刷屏: 合并通知，设置 quiet hours
信息充足: 通知中包含做决策需要的所有信息
操作便捷: 在通知中直接操作（Slack 按钮、Email 链接）
分级处理: 紧急的立即通知，不紧急的批量汇总

关键收获

三种模式：审批门、置信度路由、渐进式授权
人机协作的目标是"增强人"不是"替代人"
反馈循环是持续改善 Agent 的关键
通知设计决定协作效率