Lesson 6: 人机协作设计

学习目标

  • 理解 Human-in-the-Loop 的设计原则
  • 掌握 3 种人机协作模式
  • 学会设计审批和反馈机制

为什么需要人机协作?

完全自动化是一个美好但危险的幻想。在实际业务中:

  • AI 会犯错(幻觉、误判、过时信息)
  • 某些决策需要人类的直觉和经验
  • 法律/合规要求人类参与关键决策
  • 客户更信任有人类参与的服务

好的 Agent 系统不是"替代人",而是"增强人"——让人专注于高价值判断,把重复性工作交给 Agent。

协作模式 1: 审批门(Approval Gate)

Agent 完成工作后,等待人类审批再执行。

[Agent 生成邮件草稿] → [人类审核] → [发送/修改/拒绝]

适用场景:

  • 外部沟通(客户邮件、社交媒体回复)
  • 财务操作(超过阈值的付款)
  • 合同/法律文件

实现方式:

Agent 完成 → 发通知到 Slack/Email → 人类点击 Approve/Reject
                                    → Approve: Agent 继续执行
                                    → Reject: Agent 收到反馈,调整后重试

设计要点:

  • 审批界面要显示足够的上下文(Agent 的推理过程、原始输入、建议操作)
  • 设置超时机制(24 小时未审批自动提醒或取消)
  • 提供快速操作(一键批准,而不是重新填表)
  • 记录审批历史,用于优化 Agent 的准确率

协作模式 2: 置信度路由(Confidence Routing)

Agent 评估自己的置信度,高置信度自动处理,低置信度交给人。

[Agent 处理请求]
  → 置信度 > 90%: 自动执行
  → 置信度 60-90%: 执行但标记人工复查
  → 置信度 < 60%: 直接转给人工

适用场景: 客服系统、内容审核、数据分类

让 Agent 输出置信度的方法:

Prompt: "Process this request. Rate your confidence (0-100) in your response.
If below 60, explain what information you need to be more confident.

Return JSON: { response: string, confidence: number, uncertainReason?: string }"

设计要点:

  • 阈值需要根据实际数据调整(不是拍脑袋定的)
  • 初期设低阈值(保守),随着 Agent 表现改善逐渐提高
  • 监控每个置信度区间的实际准确率

协作模式 3: 渐进式授权(Progressive Delegation)

随着 Agent 证明自己的能力,逐步给予更多自主权。

阶段 1(学习期): Agent 建议,人做决定
阶段 2(验证期): Agent 做,人复查
阶段 3(信任期): Agent 自动做,人抽查
阶段 4(自主期): Agent 自动做,异常时通知

适用场景: 新 Agent 上线、高风险业务场景

实现方式:

  • 每个阶段有明确的晋级标准(如连续 100 次操作准确率 > 95%)
  • 出现严重错误自动降级
  • 保留人工覆盖能力

反馈循环设计

人机协作不是单向的。人的反馈应该改善 Agent 的表现。

显式反馈

在每次人工干预后收集:

  • 人修改了什么?
  • 为什么修改?
  • Agent 的建议有多接近?

隐式反馈

通过数据自动收集:

  • 审批通过率随时间的变化
  • 人工修改幅度的趋势
  • 某类请求的处理成功率

反馈应用

收集反馈 → 分析模式 → 更新 Prompt / 调整阈值 → 验证改善

每周或每月做一次"Agent 复盘":

  1. 审查被拒绝/修改最多的操作类型
  2. 分析原因(prompt 不够好?缺少上下文?场景没覆盖?)
  3. 针对性优化
  4. 观察下一周期的改善

通知设计

人机协作的效率很大程度取决于通知的设计:

  • 不要刷屏: 合并通知,设置 quiet hours
  • 信息充足: 通知中包含做决策需要的所有信息
  • 操作便捷: 在通知中直接操作(Slack 按钮、Email 链接)
  • 分级处理: 紧急的立即通知,不紧急的批量汇总

关键收获

  1. 三种模式:审批门、置信度路由、渐进式授权
  2. 人机协作的目标是"增强人"不是"替代人"
  3. 反馈循环是持续改善 Agent 的关键
  4. 通知设计决定协作效率