今天来介绍下基本的图生图工作流节点。我们先来对比下文生图,和图生图。
文生图:输入文字描述,AI 根据提示词生成一张全新的图像。
图生图:输入一张已有图片,AI 在此基础上进行重绘或修改,生成新的画面。
相比文生图,图生图更像是,让AI在已有的草稿、照片或设计上,进行二次创作。
图生图的基本原理
“图生图”任务中,首先为输入的参考图添加一定程度的“噪声”,
再根据用户提供的文本提示词作为引导,一步步地从这张加噪的图像中去除噪声,并在这个过程中融入提示词,
最终“恢复”出一张全新的、符合要求的图像。
通过控制初始噪声的添加程度,用户可以决定生成图像的重绘幅度。
图生图常见的应用场景
草图上色:提供一张简单的线稿,输入提示词(例如“二次元风格,彩色插画”),AI 就能自动生成上色版本。
风格迁移:将任意图片的风格(如水彩、素描、赛博朋克)应用到自己的照片上,创造出独一无二的艺术作品。
风格重绘:给一张普通照片,提示词里写“梵高油画风格”,AI 就能把照片改成油画风格。
局部修改:在一张图片上选择某个区域(比如人物的衣服),只修改这一部分,其余部分保持不变。
局部重绘:轻松移除照片中不需要的物体或人物,AI会自动填充背景,使其看起来天衣无缝。
图像拓展:扩展原始画面的边界,智能地生成画面之外的内容,让一张照片拥有更广阔的视野。
老照片修复:为黑白照片上色,修复划痕和模糊,让珍贵的历史影像重焕生机。
细节增强:对模糊、低清的图片,通过图生图进行重绘,得到更高清、更细节化的版本。
设计与创意:UI 界面、产品外观、海报草稿,都可以先画一个大概结构,再用图生图快速生成多种创意方案。
图生图工作流讲解
下面是一个最基本的图生图工作流。
模型使用的基于SD1.5的动漫风格模型primamix。没有的可以在文章最后找到下载链接。
可以看到,最大的差别,就是。
少了“空Latent”节点。
增加了VAE编码,和上传图片节点。
如果你对AI画图的原理比较清楚,其实更容易理解这里的改变。
文生图是在一个空的“画板上作画”。图生图,是一个已有的基础上。所以多了一个图片节点。替代空Latent
而VAE编码,是因为大模型处理图片都是在潜空间,所以传入的图片数据都需要先编码。

为了更好的阅读体验,来飞书看吧:
https://kqxyky8cqrw.feishu.cn/wiki/TRZEwq45aiuKK5keVjCcyUzAnJd
Comments on "【2025comfyUI教程】新手入门-图生图原理介绍,工作流解析" :