一、概述
需求:通过dify工作流,上传图片,或者输入在线图片地址,通过AI分析图片内容,返回结果。
二、创建工作流

添加字段

字段类型:单文件
变量名称,显示名称:imageUrl
支持文件类型,勾选图片
上传类型,选择两者。表示同时支持本地上传和URL输入

添加LLM节点
模型:Qwen2.5-VL-7B-Instruct,这个模型,支持图片识别。
提示:案例中用的是硅基流动 https://siliconflow.cn/zh-cn/ 的接口。
上下文,选择变量imageUrl
提示词:
####任务
提取图片核心信息,用简洁准确的语言输出图片内容描述。
####要求:
1. 核心是理解图片场景和拍摄重点;
2. 表达精准,不堆砌关键词,禁止机械拼接;
3. 每条描述控制在30字以内,突出主体与重点;
4. 不需要输出图片无关的其他内容。
5. 根据具体链接描述图片,严禁自主推测
开启视觉,选择变量imageUrl,分辨率高

添加结束

三、测试
输入文件链接

比如:https://cdn.pixabay.com/photo/2016/03/27/22/22/fox-1284512_960_720.jpg

点击运行

右边会出现报错:
1 validation error for File Value error, Invalidfile url [type=value error, input value={‘id’:None, ‘tenant id’:..y file ‘, ‘url’: None),input type=dict] For further informationvisit
https://errors.pydantic.dev/2.9/v/value_error解决办法:
修改dify的.env文件,修改FILES_URL变量为dify访问地址
FILES_URL=http://192.168.32.14
重启dify
docker-compose -p dify down
docker-compose -p dify up -d
再次输入图片,运行成功

原创文章,作者:howkunet,如若转载,请注明出处:https://www.intoep.com/ai/66640.html