ai-courseware/课件资料/0.大纲.md

4.4 KiB
Raw Blame History

总大纲AI应用落地Agent + 工作流融合实战)

总时长72分钟1.2小时)

0 开场与目标3分钟

  • 主题与目标:让后端 Go 团队“又快又稳”做出可用的 AI 应用
  • 一句话定位Agent 负责“聪明与解释”,工作流保障“稳定与规模”
  • 贯穿案例:订单诊断(降低 MTTR/人工接管率、提升稳定性)

1 概念与融合10分钟

  • 什么是 Agent意图识别、工具选择、策略决策、结果解释与对话管理
  • 什么是工作流:确定性算子编排、状态与数据管理、幂等与重试、失败回退、审计与监控
  • 优缺点对比:
    • Agent灵活、可解释成本不稳定、可能不一致
    • 工作流:稳定、可控、低成本;表达复杂判断困难、解释弱
  • 融合方案(职责边界与组合模式):
    • 入口路由Agent 基于意图调用不同工作流
    • 工作流内嵌决策:复杂判断节点由 Agent 决策,其余节点确定性执行
    • 管理者-执行者Manager Agent 分配任务,工作流封装工具完成
  • 常见坑:多 Agent 过度设计、记忆与任务状态混淆、工具幂等缺失

2 技术演进6分钟

  • 手工时代 → 智能体时代 → 工业化时代(精简版)
  • 结论:从能用到好用,标准化与可观测是必经之路(不单设页面)

3 需求识别12分钟

  • 三招判断:频次、复杂度、容错
  • 适用与不适用:规则清晰/100%准确/一次性工作不适合 AI
  • 场景映射:订单诊断、商品分析、文库问答
  • 回退策略:从 AI 回退为代码/规则引擎的判断标准

4 选型建议12分钟

  • 部署方式供应商API/Agent/工作流) vs 私有化(云/本地)
  • 语言选择:阶段化策略(原型优先 Python生产优先 Go纯 Go 团队可直接上 Go
  • 框架推荐:
    • PythonLangChain/LangGraph原型与功能全
    • GoEino、LangChainGo生产与性能
  • 硬件与模型容量:
    • 7B16G 显存可行(量化更稳)
    • 14B建议 2448G 显存16G 需重度量化且质量折衷
  • 私有化阈值(简易测算):月 API 费用 ≈ 硬件折旧/月 + 运维人力/月 + 合规需求 → 达到阈值再考虑自建

5 实战演示24分钟

  • Python 快速原型10分钟
    • 用 LangChain/LangGraph 搭“订单诊断”工作流:订单查询→支付网关→风控规则→异常解释
    • 监控LangSmith 指标与问题定位
  • Go 生产化10分钟
    • 框架Eino / LangChainGoHTTP 层Gin/Hertz
    • 目录结构:
      • cmd/ 服务入口
      • internal/agent/ 意图识别与解释
      • internal/workflow/ 节点编排、重试与回退
      • internal/tools/ 订单/支付/风控等工具封装
      • internal/observability/ 指标、日志、trace
      • pkg/ 通用库;api/ 接口定义OpenAPI/gRPC
    • 工程要点:幂等、错误码、超时/熔断、重试与任务重放
  • 传输与体验4分钟
    • 流式对比SSE浏览器友好、单向 vs WebSocket双向、状态管理 vs HTTP Streaming解析复杂 vs gRPC 流(强类型、需网关)
    • 选择建议:前端优先 SSE双向需 WebSocket内网优先 gRPC/HTTP2
    • 降低等待焦虑:预热与缓存、渐进式输出(先要点后细节)、并行查询与最慢支路降级、心跳与重连

6 成本评估与阶段化私有化4分钟

  • 在线指标成功率、P95 延迟、令牌用量、调用成本、重试次数、人工接管率
  • 监控盲点:上下文与工具调用的隐性令牌、未分场景/版本统计
  • 阶段化决策:先供应商跑通 + 完整监控 → 达阈值再私有化;含合规与数据敏感评估

7 总结1分钟

  • 选择 > 实现,适合 > 先进Agent + 工作流是通用融合方案
  • 一套模板 + 一套度量与监控 → 快速落地、可持续优化

8 相关资源1分钟