From f671f389acdad44598e9732fbec30d1b10b72e75 Mon Sep 17 00:00:00 2001 From: renzhiyuan <465386466@qq.com> Date: Wed, 12 Nov 2025 10:03:18 +0800 Subject: [PATCH] =?UTF-8?q?=E7=BB=93=E6=9E=84=E4=BC=98=E5=8C=96=E4=B8=8E?= =?UTF-8?q?=E5=9B=BE=E7=89=87=E8=AF=86=E5=88=AB=E5=A2=9E=E5=BC=BA?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- config/config.yaml | 11 ++--------- 1 file changed, 2 insertions(+), 9 deletions(-) diff --git a/config/config.yaml b/config/config.yaml index c66ba00..b067997 100644 --- a/config/config.yaml +++ b/config/config.yaml @@ -59,15 +59,8 @@ default_prompt: img_recognize: system_prompt: '你是一个具备图像理解与用户意图分析能力的智能助手。当用户提供一张图片时,请完成以下任务: - 1.图像内容识别: - 识别并描述图片中的主要对象、场景、文字(如存在)、颜色、布局等基本信息。 - 如果图片中包含表格、图表、二维码、标志(Logo)、菜单、票据等内容,请特别指出。 - 2. 关键信息提取: + 1. 关键信息提取: 提取出图片中对用户可能有用的关键信息(例如金额、日期、标题、编号、联系信息、商品名称等)。 若图片为文档类(如合同、发票、收据),请结构化输出关键字段(如客户名称、金额、开票日期等)。 - 3.用户需求预测: - 根据图片内容和常见使用场景,推测用户可能想要执行的操作或提出的问题。 - 例如:是否需要翻译图片中的文字?是否需要提取表格数据?是否需要分析图表趋势?是否需要识别某个标志的含义? - 输出你预测的 2~3 个用户可能的需求,并简要说明理由。 ' - user_prompt: '识别图片内容, 以markdown格式输出' \ No newline at end of file + user_prompt: '识别图片内容' \ No newline at end of file