大家吼,我是专注于AI学习的Piupiu~ 我不是高手,但想和你一起快乐学AI!

今天和大家分享的是一个生成产品模特图工作流!

但是目前我这个版本的效果还欠了些,在主体一致性上还有差距。

里面的坑我会提出来的,有底子的同学可以提提改进建议,无基础的同学可以看看学习一下基础的流程。

先一起看看效果,再上手!

01 效果展示产品为耳饰,模特由模型生成。

02 工作流截图03 搭建教程3.0 流程梳理【一定要先梳理一下流程,不要想一步搭一步,很容易漏流程】【分析】产品:耳饰需求效果:基础模式,纯白色背景,正脸、侧脸两个产品展示图核心流程:将产品从背景中抠出;生成模特形象图;按照需求效果,将产品与模特融合生图,模拟摄影师拍摄效果。

【流程设计】->工作流输入,产品名称、模特形象、产品图、生图个数->使用抠图节点,将产品从输入的产品图中提取出来->使用大模型节点,对输入的模型形象进行生图提示词生成-> 生成模特形象-> 两个角度的特写有不同的提示词->调用循环节点,生图节点生成两个角度模特产品效果图->所有组循环完成,工作流结束。

3.1 搭建工作流登录网站:https://www.coze.cn/按照图中的1、2、3、4的步骤创建。

名称不能是中文嗷。

3.2 开始节点mihe_hey:后面生图插件需要的密钥moTe_prompt_base:模特形象的基础描述product_name:产品名product_img:带产品的图片3.3 文本处理-抠图提示词调用产品名product_name,完善抠图节点的提示词。

3.4 大模型-图片提示词和模特提示词生成器调用大模型节点,这里模型要更换为视觉理解类的模型,因为视觉理解部分需引用抠出的产品图【原因见文末5.1】。

系统提示词如下。

用户提示词就是两个输入,输出为部位、图像提示词、模特提示词。

【系统提示词与用户提示词的区别见文末5.2,我也总是忘,记录一下】3.5 模特图片生成调用即梦的图像生成插件。

引用key和模特提示词。

将模特形象提前生成是十分重要的能极大提高后面做不同效果图模特形象的一致性(问什么知道,因为花了资源与精力生成了不一样的模特)3.6 代码节点-数据重组调用代码节点,将模特图url与产品抠图整合到一组数据中代码与输出,输出就是一个字符串数组,包含模特图和产品图方便在后面的生图插件引用3.7 大模型节点-产品与模特合成提示词生成器引用之前节点生成的生图提示词,生成包含正面、侧面角度的生图提示词。

理论上也可以用一个大模型来生成,但是分开生成的好处是,模型的定位更加准确、输出结果也更优质,而且出现效果问题更好排查。

系统提示词,截取了一部分,太长了,需要同学留言发你输出的话就是一个字符串数组,里面包含表述正面、侧面提示词的字符串3.8 循环节点因为需求生成两个图,采用循环节点来生图。

引用3.7大模型的output,该节点的输出可以等循环体搭建完再设置。

3.8.1 提示词优化节点这个节点就可以将中文的提示词转为英文并在一定程度上优化。

还是很需要的,比如后面使用的是nanobannao的生图模型,使用英文提示词生图效果是更好的。

效果实例如下。

3.8.2 na2图像生成检索na2,添加nanobanana生图插件输入key、提示词、还有参考图(模特、产品)记得将节点连接到循环框体嗷3.9 结束节点引用循环的输出就可以了~04 工作流测试测试用例产品图输入工作流输出直接点击output下面的链接下载即可。

效果展示反正就是耳环变了,正面的角度没完全明白我的意思,我理想的是全部正脸。

前面的节点输出也检查了,抠图没问题。

还是在提示词的生成上需要优化。

05 本章小知识点5.1 官方文档提示5.2 大模型节点中系统提示词与用户提示词的核心区别对比维度系统提示词用户提示词设置主体 & 用途开发者预先配置,是给大模型设定的全局规则:包括人设定位、回复风格、约束限制、输出格式要求等通常是动态传入的当前轮次请求:可以是用户的实时提问、上游节点输出的待处理任务,指导大模型本轮要执行的具体操作生效范围整个节点执行 / 会话过程中持续生效,所有回复都需要遵守这些规则仅作用于当前轮次请求,本轮执行完成后就失效优先级优先级更低,当和用户提示词无冲突时作为基础规则生效优先级高于系统提示词,如果两者要求冲突,大模型会优先遵循用户提示词的指令(安全规则除外)内容特点固定性强,一般不会频繁变动,比如「你是专业的代码助手,所有代码都要加详细注释」动态性强,每轮请求都可能不同,比如「帮我写一个 Python 实现的快速排序代码」今天的学习就结束啦!

辛苦了各位!

一起加油!