Lesson 6: 人机协作设计
学习目标
- 理解 Human-in-the-Loop 的设计原则
- 掌握 3 种人机协作模式
- 学会设计审批和反馈机制
为什么需要人机协作?
完全自动化是一个美好但危险的幻想。在实际业务中:
- AI 会犯错(幻觉、误判、过时信息)
- 某些决策需要人类的直觉和经验
- 法律/合规要求人类参与关键决策
- 客户更信任有人类参与的服务
好的 Agent 系统不是"替代人",而是"增强人"——让人专注于高价值判断,把重复性工作交给 Agent。
协作模式 1: 审批门(Approval Gate)
Agent 完成工作后,等待人类审批再执行。
[Agent 生成邮件草稿] → [人类审核] → [发送/修改/拒绝]适用场景:
- 外部沟通(客户邮件、社交媒体回复)
- 财务操作(超过阈值的付款)
- 合同/法律文件
实现方式:
Agent 完成 → 发通知到 Slack/Email → 人类点击 Approve/Reject
→ Approve: Agent 继续执行
→ Reject: Agent 收到反馈,调整后重试设计要点:
- 审批界面要显示足够的上下文(Agent 的推理过程、原始输入、建议操作)
- 设置超时机制(24 小时未审批自动提醒或取消)
- 提供快速操作(一键批准,而不是重新填表)
- 记录审批历史,用于优化 Agent 的准确率
协作模式 2: 置信度路由(Confidence Routing)
Agent 评估自己的置信度,高置信度自动处理,低置信度交给人。
[Agent 处理请求]
→ 置信度 > 90%: 自动执行
→ 置信度 60-90%: 执行但标记人工复查
→ 置信度 < 60%: 直接转给人工适用场景: 客服系统、内容审核、数据分类
让 Agent 输出置信度的方法:
Prompt: "Process this request. Rate your confidence (0-100) in your response.
If below 60, explain what information you need to be more confident.
Return JSON: { response: string, confidence: number, uncertainReason?: string }"设计要点:
- 阈值需要根据实际数据调整(不是拍脑袋定的)
- 初期设低阈值(保守),随着 Agent 表现改善逐渐提高
- 监控每个置信度区间的实际准确率
协作模式 3: 渐进式授权(Progressive Delegation)
随着 Agent 证明自己的能力,逐步给予更多自主权。
阶段 1(学习期): Agent 建议,人做决定
阶段 2(验证期): Agent 做,人复查
阶段 3(信任期): Agent 自动做,人抽查
阶段 4(自主期): Agent 自动做,异常时通知适用场景: 新 Agent 上线、高风险业务场景
实现方式:
- 每个阶段有明确的晋级标准(如连续 100 次操作准确率 > 95%)
- 出现严重错误自动降级
- 保留人工覆盖能力
反馈循环设计
人机协作不是单向的。人的反馈应该改善 Agent 的表现。
显式反馈
在每次人工干预后收集:
- 人修改了什么?
- 为什么修改?
- Agent 的建议有多接近?
隐式反馈
通过数据自动收集:
- 审批通过率随时间的变化
- 人工修改幅度的趋势
- 某类请求的处理成功率
反馈应用
收集反馈 → 分析模式 → 更新 Prompt / 调整阈值 → 验证改善每周或每月做一次"Agent 复盘":
- 审查被拒绝/修改最多的操作类型
- 分析原因(prompt 不够好?缺少上下文?场景没覆盖?)
- 针对性优化
- 观察下一周期的改善
通知设计
人机协作的效率很大程度取决于通知的设计:
- 不要刷屏: 合并通知,设置 quiet hours
- 信息充足: 通知中包含做决策需要的所有信息
- 操作便捷: 在通知中直接操作(Slack 按钮、Email 链接)
- 分级处理: 紧急的立即通知,不紧急的批量汇总
关键收获
- 三种模式:审批门、置信度路由、渐进式授权
- 人机协作的目标是"增强人"不是"替代人"
- 反馈循环是持续改善 Agent 的关键
- 通知设计决定协作效率