89 lines
4.4 KiB
Markdown
89 lines
4.4 KiB
Markdown
# 总大纲:AI应用落地(Agent + 工作流融合实战)
|
||
|
||
总时长:72分钟(1.2小时)
|
||
|
||
## 0 开场与目标(3分钟)
|
||
|
||
- 主题与目标:让后端 Go 团队“又快又稳”做出可用的 AI 应用
|
||
- 一句话定位:Agent 负责“聪明与解释”,工作流保障“稳定与规模”
|
||
- 贯穿案例:订单诊断(降低 MTTR/人工接管率、提升稳定性)
|
||
|
||
## 1 概念与融合(10分钟)
|
||
|
||
- 什么是 Agent:意图识别、工具选择、策略决策、结果解释与对话管理
|
||
- 什么是工作流:确定性算子编排、状态与数据管理、幂等与重试、失败回退、审计与监控
|
||
- 优缺点对比:
|
||
- Agent:灵活、可解释;成本不稳定、可能不一致
|
||
- 工作流:稳定、可控、低成本;表达复杂判断困难、解释弱
|
||
- 融合方案(职责边界与组合模式):
|
||
- 入口路由:Agent 基于意图调用不同工作流
|
||
- 工作流内嵌决策:复杂判断节点由 Agent 决策,其余节点确定性执行
|
||
- 管理者-执行者:Manager Agent 分配任务,工作流封装工具完成
|
||
- 常见坑:多 Agent 过度设计、记忆与任务状态混淆、工具幂等缺失
|
||
|
||
## 2 技术演进(6分钟)
|
||
|
||
- 手工时代 → 智能体时代 → 工业化时代(精简版)
|
||
- 结论:从能用到好用,标准化与可观测是必经之路(不单设页面)
|
||
|
||
## 3 需求识别(12分钟)
|
||
|
||
- 三招判断:频次、复杂度、容错
|
||
- 适用与不适用:规则清晰/100%准确/一次性工作不适合 AI
|
||
- 场景映射:订单诊断、商品分析、文库问答
|
||
- 回退策略:从 AI 回退为代码/规则引擎的判断标准
|
||
|
||
## 4 选型建议(12分钟)
|
||
|
||
- 部署方式:供应商(API/Agent/工作流) vs 私有化(云/本地)
|
||
- 语言选择:阶段化策略(原型优先 Python;生产优先 Go),纯 Go 团队可直接上 Go
|
||
- 框架推荐:
|
||
- Python:LangChain/LangGraph(原型与功能全)
|
||
- Go:Eino、LangChainGo(生产与性能)
|
||
- 硬件与模型容量:
|
||
- 7B:16G 显存可行(量化更稳)
|
||
- 14B:建议 24–48G 显存;16G 需重度量化且质量折衷
|
||
- 私有化阈值(简易测算):月 API 费用 ≈ 硬件折旧/月 + 运维人力/月 + 合规需求 → 达到阈值再考虑自建
|
||
|
||
## 5 实战演示(24分钟)
|
||
|
||
- Python 快速原型(10分钟):
|
||
- 用 LangChain/LangGraph 搭“订单诊断”工作流:订单查询→支付网关→风控规则→异常解释
|
||
- 监控:LangSmith 指标与问题定位
|
||
- Go 生产化(10分钟):
|
||
- 框架:Eino / LangChainGo;HTTP 层(Gin/Hertz)
|
||
- 目录结构:
|
||
- `cmd/` 服务入口
|
||
- `internal/agent/` 意图识别与解释
|
||
- `internal/workflow/` 节点编排、重试与回退
|
||
- `internal/tools/` 订单/支付/风控等工具封装
|
||
- `internal/observability/` 指标、日志、trace
|
||
- `pkg/` 通用库;`api/` 接口定义(OpenAPI/gRPC)
|
||
- 工程要点:幂等、错误码、超时/熔断、重试与任务重放
|
||
- 传输与体验(4分钟):
|
||
- 流式对比:SSE(浏览器友好、单向) vs WebSocket(双向、状态管理) vs HTTP Streaming(解析复杂) vs gRPC 流(强类型、需网关)
|
||
- 选择建议:前端优先 SSE;双向需 WebSocket;内网优先 gRPC/HTTP2
|
||
- 降低等待焦虑:预热与缓存、渐进式输出(先要点后细节)、并行查询与最慢支路降级、心跳与重连
|
||
|
||
## 6 成本评估与阶段化私有化(4分钟)
|
||
|
||
- 在线指标:成功率、P95 延迟、令牌用量、调用成本、重试次数、人工接管率
|
||
- 监控盲点:上下文与工具调用的隐性令牌、未分场景/版本统计
|
||
- 阶段化决策:先供应商跑通 + 完整监控 → 达阈值再私有化;含合规与数据敏感评估
|
||
|
||
## 7 总结(1分钟)
|
||
|
||
- 选择 > 实现,适合 > 先进;Agent + 工作流是通用融合方案
|
||
- 一套模板 + 一套度量与监控 → 快速落地、可持续优化
|
||
|
||
## 8 相关资源(1分钟)
|
||
|
||
- LangChain:<https://docs.langchain.com/oss/python/langchain/overview>
|
||
- LangGraph:<https://docs.langchain.com/oss/langgraph/>
|
||
- Eino 框架:<https://github.com/cloudwego/eino>
|
||
- LangChainGo:<https://github.com/tmc/langchaingo>
|
||
- Coze(可视化):<https://www.coze.cn/opensource>
|
||
- Coze Studio(本地部署):<https://github.com/coze-dev/coze-studio>
|
||
- Coze Loop(监控):<https://github.com/coze-dev/coze-loop>
|
||
- 内部模板与评测集:公司知识库/代码模板(按团队链接补充)
|