之前发了几个帖子,经常有朋友私信问这些图是怎么做的,秉着授人以鱼不如授人以渔的想法,出一期新手教学当做统一回复了。包括两部分,第一部分是新手怎么从零到一本地安装comfyui和作图,第二部分是个人作图的一些感想,我玩AI也没多久,纯粹抛砖引玉,欢迎一起讨论。
前提:有一台电脑,显卡最好是8G显存以上,硬盘空间100G以上,然后开一个夸克网盘会员,8块钱开一个月足够
第一步:安装comfyui
个人建议是直接到这个up的视频下载整合包
https://www.bilibili.com/video/BV171UZBmEzt,整合包夸克链接
https://pan.quark.cn/s/b5718d9933de,按照使用说明安装就行。
第二步:选择模型
个人建议新手只需要下2个模型,
Z-image-turbo和
Flux-2-klein,Z-image用来生图,Flux-2-klein用来编辑图片。还是建议到这个up的视频下模型,Z-image-turbo是这个链接
https://www.bilibili.com/video/BV1phF5zbELr,Flux-2-klein是这个链接
https://www.bilibili.com/video/BV1D7kjBPEF7。这个up主的视频下面的夸克链接已经根据需要放专门建了文件夹,挑需要的下。
Z-image-turbo用到3个模型文件:
z_image_turbo_bf16.safetensors——模型文件,大概11G。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\diffusion_models
qwen_3_4b.safetensors——编码器,大概7G。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\text_encoders
ae.safetensors——解码器,几百M。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\vae
Flux-2-klein用到4个模型文件:
flux-2-klein-9b-fp8.safetensors——模型文件,大概8G。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\diffusion_models
qwen_3_8b_fp8mixed.safetensors——编码器,大概8G。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\text_encoders
flux2-vae.safetensors——解码器,几百M。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\vae
flux-2-klein-NSFW.safetensors——绕过限制的lora,不用也能出图,但是效果差很多。放在这个目录:你安装的ComfyUI地址\ComfyUI\models\loras
第三部:出图
新手先别管各种节点干啥用的,先用别人做好的工作流出图,等玩够了再研究,不然很容易中途放弃。可以用官方模板的工作流,非常简单,只需要在输入框用中文写需求,再点击右上角运行就行。但我更推荐上面的链接已经附带的工作流,工作流的文件后缀是.json,用鼠标把文件拖拽到comfyui的工作页面,别的不用改,直接到文本框写你需要生成什么内容就行,这两个模型都支持中文。顺便说一下,生成的图片是.png格式,这种图片是包含工作流信息的,直接把生成的.png格式的图拖进comfyui的工作页面就能复原之前的的工作流。生成的图片在这个目录:你安装的ComfyUI地址\ComfyUI\output。
关于报错。出图的过程新手大概率会遇到报错,最常见的就是缺少节点,表现形式是红圈,可以直接通过页面操作页面提示跳转到GitHub安装,不过如果是用了整合包的一般不会缺少节点,另一个常见报错是爆显存,可以通过设置虚拟内存解决,这就是为什么硬盘空间要留多一点,实际上如果只下那两个模型甚至都用不到100G。遇到别的报错我是直接把日志丢给ai千问,让ai分析原因和给出解决办法,当然问豆包应该也行,只不过我想着千问和Zimage都是阿里的我想着他俩比较熟悉哈哈哈
好了,如果以上的步骤走通了基本就能玩一阵子了,下面是作图的感想。
Z-image。
官方出品的模型考虑到社会影响,本就不会用NSFW(涩涩)训练内容,所以用官方版本做的图通常胸部、阴部有缺陷,甚至错乱,这就需要加上一些NSFW的lora。lora可以简单理解为专门为某些风格、动作训练的小模型,让出图的胸部、阴部更正常,这些lora一般在Civitai下载,其实B站也能找到的。
还有一种办法就是下载融合模型,融合模型可以理解为网友在官方模型基础上融合了NSFW的lora。个人测试下来发现官方版的人物脸比较漂亮,身材纤细一些,但是私密部位一塌糊涂,融合模型私处效果好很多,但是人物会变丑,体型也会比原版偏丰满,偏日式,可能是因为训练数据用的日本片子比较多吧。个人觉得用lora的方式更灵活,因为可以调节权重,就看取舍吧。
https://www.sis001.uk/forum/thread-12460284-1-1.html我这个帖子用的就是融合模型Z-image-ZiT-moodyPornMix_zitV7.safetensors,大明星直接输入名字就行,明星的脸+比较好的私处算是取长补短了,想要帖子那种效果需要在提示词写上“POV视角、背景昏暗”这样的关键词,如果做的图效果不一样大概是模型不同,如果想做网红或者素人,就只能用编辑模型了。
Flux2klein。
这个模型虽然也能文生图,但是西方的模型做出来的人物还是不太符合我的审美,我一般用来做图片编辑,玩法就比Z-image丰富多了,比如换脸、去衣服、动漫转真人、本子上色等等。
https://www.sis001.uk/forum/viewthread.php?tid=12405255这个帖子就是去衣服,提示词只需要写“将图中女孩衣服去掉”即可,感觉可以做不少影视剧的经典片段(此处有本)。
我的经验是,原图如果像素低,做出来的图效果就差,或者人物脸部占画面比例比较低,做出来的图一致性就会差,所以最关键的还是原素材清晰度就要高。再一个就是换脸的话要解决一致性问题,可以加一致性lora,或者直接用Flux-2-klein-9b-darkBeastMar_dbkleinv2BFS.safetensors这个模型,人物一致性会好一些。
还有一些玩法就是给本子上色,一些老旧的本子通常都是黑白的,感觉上色效果也不错,再一个就是动漫转真人了,比如
https://www.sis001.uk/forum/viewthread.php?tid=12454617,因为目前真人模型要做指定动作或者场景比较麻烦,可以先用动漫模型做出来再转绘,当然不仅是动漫图片,动漫本子也是可以的,只不过人物多了以后一致性问题处理起来比较麻烦。
还有之前的自由角度相机lora感觉就很适合做分镜,拖动摇杆就能做出不同角度的图。
编辑模型对电脑硬件要求比较高,低显存的朋友可以用GGUF模型,就是在原版模型的基础上做的量化版,量化模型速度快一些,当然效果差一些。感觉显卡好一点的可以用qwen-2511,这个模型一致性比klein好,总之编辑模型玩法很多,如果硬盘空间有限只能下一个模型我是比较建议用Flux2klein。这里只是抛砖引玉,也希望有想法的朋友多多交流。
illustrious。
https://www.sis001.uk/forum/viewthread.php?tid=12415366这个是用waiIllustriousSDXL_v160.safetensors模型做的,和上面两个扩散模型不一样,illustrious是需要放在ComfyUI\models\checkpoints这个目录下的,illustrious模型优点就是对硬件要求低,出图极快,而且社区nsfw内容支持度很高,一些比较冷门的癖好可能只有通过动漫实现了。我看到也有私信问怎么做出特定的动作,如果单纯的通过文字描述试了很多次都实现不了,可以试试加lora,资源C站(
https://civitai.red/models需要科学上网)就挺多的,感觉很多lora都很有创意,因为平时不看动漫但是喜欢玩游戏,所以经常会再加一个游戏角色lora,实际上动漫角色lora比游戏角色多得多,各位有兴趣的可以找找。缺点嘛,不支中文,不持自然语言,需要按照单词组的格式,不过有个提示词助手插件很好用,英语不好也没啥影响。
玩了一段时间AI之后相信很多人一定会和我一样硬盘吃紧,与其瞎折腾下了一堆模型不用,不如只挑选最成熟最好用的几个模型。个人的体验是:本地作图闭源模型能做的大部分都能做,本地作视频效果和闭源模型差不少但是勉强能看,本地写小说和线上比就是一坨,而且就算是uncensored版也会有限制不能随心所欲,所以感觉本地大语言模型也就只适合用来识别图片,也就是看到别人做的图很不错也会下载下来,通过LLM反推提示词,所以留一个最小的就行。wan2.2生成几秒钟的视频还可以,但是想做长一点,一致性就很差了,所以只能做不同的分镜一点点拼,挺累的,逛C站久了下了很多模型,但是基本没怎么用过,视频模型和lora很吃硬盘空间,所谓的图生视频严格来说是图生动图没有声音,LTX2.3倒是有音频但是没什么nsfw内容,所以我现在只留了一个wan2.2的图生视频模型,其余都是生图模型。
[
本帖最后由 失忆空间 于 2026-6-7 22:16(GMT+8) 编辑 ]