ai-courseware/课件资料/0.大纲.md

332 lines
9.5 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 总大纲AI应用工业化智能体与流水线实战
## 【Part 0概念澄清】8分钟
**核心问题**
什么是智能体?
什么是工作流?
为什么需要AI工业化
### 🔄 **技术演进的三个时代**
**手工时代**(就像手工艺品)
- 每次都要重新写Prompt
- 结果靠运气,质量不稳定
- 一个人能做,但没法复制
7位定时任务表达式生成
**智能体时代**(像有了机器人助手)
- 能记住对话,会调用工具
- 但每个助手都要单独训练
- 还是作坊式生产,效率有限
例:查询天气
**工业化时代**(像现代工厂)
- 标准化流程,流水线作业
- 质量可控,批量生产
- 普通人也能操作,快速复制
直连天下AI助手
### 💡 **为什么要工业化?**
**从Demo到生产差的不只是代码**
- **Demo**:跑通就行,出问题人工重启
- **生产**7×24小时不能掉链子
- **Demo**:一个人搞定,懂技术就行
- **生产**:团队协作,业务技术都要懂
**工业化解决的核心问题**
**标准化**:不是每个项目都从零开始
**可维护**:出了问题能快速定位
**可扩展**:业务增长不用推倒重来
**可复制**:成功经验能快速推广
### 🚀 **一句话总结**
**"从Demo到生产从能用到好用工业化是必经之路"**
---
## 【第一部分需求识别篇】到底什么样的需求适合用AI
### 🎯 **AI最擅长的三件事**
| 场景类型 | 业务特征 | 典型案例 |
|---------|----------|----------|
| **重复性工作** | 每天都要做,流程相对固定 | 订单异常排查、客服问答 |
| **经验判断** | 靠人的经验,但有一定规律 | 商品好不好卖、订单有没有风险 |
| **信息整理** | 需要从大量文本中提取关键信息 | 政策解读、文档问答 |
### ❌ **这些情况别用AI**
| 场景特征 | 原因 | 替代方案 |
|---------|------|----------|
| **规则很清楚** | 用代码更简单、更便宜 | 直接写程序 |
| **要求100%准确** | AI做不到完美 | 规则引擎 |
| **一次性的活** | 开发成本太高 | 人工处理 |
### 🔍 **三招判断你的场景**
**第一招:频次测试**
- 这个问题**每天出现**吗?✅
- 这个问题**偶尔才遇到**?❌
**第二招:复杂度测试**
- 需要**看多个因素**才能判断?✅
- 只要**看一个指标**就知道答案?❌
**第三招:容错测试**
- 偶尔**判断错误**可以接受?✅
- **绝对不能出错**?❌
### 💡 **我们的三个场景,怎么判断的?**
**订单诊断:适合**
- 订单中断时,对研发同学打断较为频繁 ✅
- 要看订单金额、流水信息等 ✅
- 偶尔误判可以接受 ✅
**商品分析:适合**
- 从下游商品追踪到上游商品需要 2-3 步 ✅
- 商品名称模糊时需要更多步 ✅
- 分析错了影响不大 ✅
**文库问答:适合**
- 人事/研发同学**天天被问相同问题** ✅
- 要从**大量文档中找答案** ✅
- **回答错了可以纠正** ✅
---
## 【第二部分:选择篇】到底该用啥?
**核心问题:技术选型四维度,怎么选?**
### 🎯 **维度1部署方式供应商 vs 私有化)**
#### **供应商服务:三种玩法**
| 调用方式 | 技术门槛 | 开发周期 | 成本 | 数据安全 |
|---------|----------|----------|------|----------|
| **直接调API** | 中等 | 3-5天 | 按调用付费 | 数据在供应商 |
| **调用智能体** | 低 | 2-3天 | 按调用付费 | 数据在供应商 |
| **调用工作流** | 最低 | 1-2天 | 按调用付费 | 数据在供应商 |
**供应商优势**
- ✅ 无需买机器,零硬件投入
- ✅ 模型能力强,永远用最新版
- ✅ 运维简单,出问题有人管
#### **私有化部署:两种方案**
| 部署方式 | 硬件投入 | 模型能力 | 运维成本 | 数据安全 |
|---------|----------|----------|----------|----------|
| **买云主机** | 每月几千到几万 | 比供应商弱 | 需要专人 | 完全可控 |
| **买本地机器** | 一次性几万到几十万 | 比供应商弱 | 需要专人 | 完全可控 |
**私有化成本细算**14B
- **云主机**8核32G16G显存 ≈ 4500/月
- **本地机器**8核32G1万16G显存5000主机 ≈ 1.5-2万/台 + 运维
#### **数据安全对比**
| 安全维度 | 供应商服务 | 私有化部署 |
|---------|------------|------------|
| **数据出境** | ❌ 可能出境 | ✅ 完全境内 |
| **数据留存** | ❌ 供应商留存 | ✅ 自己掌控 |
| **审计合规** | ❌ 黑盒操作 | ✅ 完全透明 |
| **安全认证** | ✅ 有专业认证 | ❌ 需要自己搞 |
### 💻 **维度2语言选择Python vs Go**
| 对比维度 | Python | Go | 建议 |
|---------|----------|------|------|
| **学习成本** | 生态成熟,资料多 | 当前团队主要语言 | ✅ Go |
| **性能表现** | 解释型,相对慢 | 编译型,速度快 | ✅ Go |
| **部署运维** | 环境复杂 | 单文件部署 | ✅ Go |
| **AI生态** | 最丰富 | 快速发展中 | Python |
**结论**Go团队无脑选Go生态已够用优势明显
### 🔧 **维度3框架选择**
| 框架生态 | 代表框架 | 成熟度 | 学习成本 | 适用场景 |
|---------|----------|--------|----------|----------|
| **Python生态** | LangChain + LangGraph | ⭐⭐⭐⭐⭐ | 中等 | 快速原型、功能最全 |
| **Go生态** | LangChainGo、Eino | ⭐⭐⭐ | 低 | 生产环境、性能要求高 |
| **可视化** | Coze、Dify | ⭐⭐⭐⭐ | 最低 | 业务人员、快速上线 |
**Go生态推荐**
- **LangChainGo**:最成熟,社区活跃
- **Eino**:字节跳动开源,企业级
- **Coze-loop**:可视化+代码结合
### 🚀 **维度4落地策略**
| 落地方式 | 开发周期 | 总成本 | 适用场景 | 推荐程度 |
|---------|----------|--------|----------|----------|
| **供应商API** | 3-5天 | 最低 | 快速验证 | ⭐⭐⭐⭐⭐ |
| **Coze本地化** | 3-5天 | 低 | 标准化需求 | ⭐⭐⭐⭐⭐ |
| **私有化部署** | 2-4周 | 高 | 数据敏感 | ⭐⭐⭐ |
### 风险评估
#### 技术风险评估
**模型稳定性风险**
**集成复杂度风险**
**维护成本风险**
#### 产品风险评估
**效果预期风险**
**流程变更风险**
**合规性风险**
#### 财务风险评估
**成本控制风险**
### 🎲 **智能体 vs 工作流,怎么选?**
| 场景特征 | 用智能体 | 用工作流 |
|---------|----------|----------|
| 规则经常变 | ✅ 灵活调整 | ❌ 需要改代码 |
| 需要解释原因 | ✅ 能说清楚 | ❌ 黑盒操作 |
| 成本敏感 | ❌ 贵 | ✅ 便宜 |
| 准确要求高 | ❌ 可能错 | ✅ 稳定 |
### 🎯 **团队选型建议**
#### **决策流程:先选部署方式,再选技术栈**
**Step 1要不要私有化**
```
数据敏感? → 是 → 私有化(预算充足)
↓ 否
调用量大? → 是 → 私有化(长期省钱)
↓ 否
快速验证? → 是 → 供应商服务
```
**Step 2供应商服务怎么选**
```
业务标准化? → 是 → Coze可视化1-2天
↓ 否
技术能力强? → 是 → 直接调API3-5天
↓ 否
调工作流2-3天
```
#### **推荐方案**
**方案A快速验证**(推荐度:⭐⭐⭐⭐⭐)
- **组合**供应商API + Go + Eino
- **周期**3-5天
- **成本**:几千元/月
- **场景**80%的企业够用
**方案B标准化需求**(推荐度:⭐⭐⭐⭐⭐)
- **组合**Coze可视化 + 本地化导出
- **周期**1-2天
- **成本**:几千元/月
- **场景**:业务人员能维护
**方案C数据敏感**(推荐度:⭐⭐⭐)
- **组合**:私有化部署 + Go + Eino
- **周期**2-4周
- **成本**10万+/年
- **场景**:金融、医疗等强监管行业
#### **避坑指南**
**❌ 这些坑别踩:**
- 一上来就买机器,结果用不起来
- 担心数据安全,但根本没那么多敏感数据
- 追求100%自研,错过业务窗口期
**✅ 正确姿势:**
- 先用供应商服务跑通业务
- 真有需求再考虑私有化
- 监控数据先做好,方便后续决策
---
## 【第三部分:实战篇】实战演示篇
### Python LangChain生态展示
- 现场演示chain和graph的实际代码
- 重点展示langsmith监控界面
- 成果对比:用监控前后的问题排查效率
### Eino Go生态展示
- 现场演示graph和Workflow代码
- 重点展示coze-loop监控面板
- 性能对比Go vs Python的执行效率
### 方案3文库智能问答
- 现场操作vue3-frontend界面
- 用户体验从用户角度看AI应用
- 交互亮点:实时反馈、流式输出等
---
## 【第四部分:行动篇】听完就能动手
### 立即行动清单
1. **选一个场景**:自身主要负责的业务场景
2. **填一张表**:用选择表确定技术方案
3. **套一个模板**:直接用我们提供的代码模板
4. **算一笔账**:评估投入产出
### 成功标准
- 1周内完成技术选型
- 1个月上线第一个版本
- 3个月看到明显效果
---
## 【总结】一句话记住
**"技术不是越先进越好,而是越适合越有价值"**
选择 > 实现,适合 > 先进
听完就能选,看完就能用!
## 【第五部分:相关资源】
langchain<https://docs.langchain.com/oss/python/langchain/overview>
扣子:<https://www.coze.cn/opensource>
本地部署:<https://github.com/coze-dev/coze-studio>
扣子罗盘:<https://github.com/coze-dev/coze-loop>
Eino框架<https://github.com/cloudwego/eino>