当前位置:首页 > 每日看点 > 正文内容

comfyui如何学习?如何使用?

卡卷网7个月前 (01-08)每日看点151

最近在Linux的部署了ComfyUI,遇到一些小坑来记录下。

如果你遇到报错是:<>AttriuteError:'NoneType'ojecthasnoattriute'tokenize',建议看看这个文章。

<>另外,如果你找不到TripleCLIPLoader,也可以看看这个文章!!

ComfyUI是一个开源的、基于节点的图形用户界面(GUI),用于生成图像。它利用诸如StaleDiffusion等扩散模型,允许用户通过连接不同功能的节点来构建图像生成的工作流程。每个节点代表一个特定的功能模块,如加载模型、输入提示词、设置采样器等。所以相当于,他把模型整个调用的过程可视化了一下,只要修改图上的节点就行,如果你体验过一些机器学习深度学习的,那你肯定也熟悉这种作方式。

首ComfyUI的Githu链接:s://githu/comfyanonymous/ComfyUI

如果你也是Linux的,windows也是一样,那咱们就继续往下看安装流程:

按照GitHu里描述的(下图)

<>第一步,你可以anaconda开一个新的python虚拟环境,python版本是3.12。

<>第二步,Gitclone这个项目

<>第三步,将模型文件ckpt或safetensor放到models/checkpoints文件夹

stailityai在huggingface上给出了最新的stalediffusion3.5模型,你需要先提供自己的信息,得到获取模型的许可申请,然后去Filesandversions栏目下,找到你的模型:s://huggingface.co/stailityai/stale-diffusion-3.5-large/tree/main;如果你发现无法下载,那就是你没有申请access呢。

然后下载这个sd3.5_large.safetensors

<>第四步,VAE的文件放到models/vae文件夹

VAE的文件在:s://huggingface.co/stailityai/stale-diffusion-3.5-large/tree/main/vae

下载了这俩文件直接放文件夹就行。

<>这四步都整完以后,如果你是NVIDIA的GPU如4090啦,A100啦,你就继续下面这两步pipinstall,如果是AMD的GPU人家也有写命令行,看网页吧。

pipinstalltorchtorchvisiontorchaudio--extra-index-ls://download.pytorch.org/whl/cu124

pipinstall--pretorchtorchvisiontorchaudio--index-ls://download.pytorch.org/whl/nightly/cu124

<>GitHu页面上的最后一步就是安装requirements了。

pipinstall-rrequirements.txt

按照道理来说,接下来你就可以起了。

然后这里如果想把网页暴露在某个端口,你要上网搜搜怎么弄,我是在租的平台上设置一下

然后pythonmain.py---portXXXX,就行了。

<>结果!!这里报错了,说我:AttriuteError:'NoneType'ojecthasnoattriute'tokenize'

然后开始找怎么弄,也没看到主页写clip啥的呀,在issue里看到一个帖子:s://githu/comfyanonymous/ComfyUI/issues/5388

这个帖子里有个大哥po了另一个帖子:s://logfy.org/sd3-5-comfyui/

果然在里面找到了三个clipXXX.safetensors的链接,如果你没办法直接下载,那是因为你没申请许可。

Clip文件在:s://huggingface.co/stailityai/stale-diffusion-3-medium/tree/main/text_encoders

在StaleDiffusion模型中,CLIP文件起着至关重要的作用,主要用于文本与图像的关联和对齐。CLIP(ContrastiveLanguage–ImagePre-training)是由OpenAI开发的一种多模态模型,能够将文本和图像映射到同一个潜在空间中。它使用对学习的方法,使得描述同一事物的文本和图像在潜在空间中的距离更近,而无关的文本和图像距离更远。在StaleDiffusion模型中,CLIP的主要功能是:用户输入的文本(如提示词)会通过CLIP模型中的文本编码器进行编码,生成textemeddings。这些emeddings捕捉了文本的语义信息,便于模型理解用户的输入。接着,这些emedding会作为生成模型的条件输入。生成模型根据这些嵌入来引导其生成符合文本描述的图像。

怪不得是clip.tokenize(text)函数,原来在做textemedding呢。突然觉得有意思了,有没有。

好的,如果这个时候你下载好了clip文件,记得把他们放在models/clip文件夹下!

然后,你就可以重新开起server。

<>这个时候可能你还是报错。。。

然后你,就要看看这个帖子:s://githu/comfyanonymous/ComfyUI/issues/4868

原来是我的clip文件并没有很好的加载!!!我搜了好几个,都提到一个TripleCLIPLoader的东西,然后我看到下图里有这个从NodeTemplates点击进去到这个TripleCLIPLoader的方式,我就开始探索。

结果我发现我的NodeTemplates下面只有一个Manage,不好意思第一次玩ComfyUI,我着实不熟悉:

然后我就去探索了一下,ComfyUI的边栏,我,被我发现了NodeLirary!!!虽然没有直接找到,但是你可以搜到这个TripleCLIPLoader。

添加了以后,你就把三个clip文件改一下,然后node和node之间的线连接一下。如果你不会,你就应用一下你从小培养的电子产品第六感试试。连接的方式:

然后你就可以运行了,点击Queue。

然后你就发现有一个任务正在运行

然后就画出来啦!!

<>最后的最后,祝你成功!!!

扫描二维码推送至手机访问。

版权声明:本文由卡卷网发布,如需转载请注明出处。

本文链接:https://www.kajuan.net/ttnews/2025/01/7319.html

分享给朋友:

相关文章

为什么微服务一定要有网关?

为什么微服务一定要有网关?

网关一句话总结,网关的作用是上浮公共逻辑,下沉差异逻辑。公共逻辑就是所有接口都需要做的事,比如权限校验,限流算法等,这样业务就只需要关心业务逻辑即可。下面是一个对比图: 当然除了一些公共逻辑外,路由也是网关的核心功能,它可以进行流量转发。...

开发了个小程序,咋推广呢?

要是开发了个小程序,想推广的话,可以先从自己的朋友圈子下手,让亲戚朋友都帮忙转发宣传,这样能先有点人气。然后去一些跟你的小程序相关的论坛、社区啥的,发帖子介绍介绍,吸引有兴趣的人。还能找些网红、博主合作,要是他们觉得你的小程序不错,帮忙推荐...

小米15就要来了,不知道小米15值不值得买?

小米15就要来了,不知道小米15值不值得买?

俗话说得好,好饭不怕晚,看似有点姗姗来迟的小米15系列,一官宣就迅速登上热搜。在此次小米14发布会上,雷军曾说过小米14将是最后一代3999起的旗舰,那么这一次涨价了的小米15,值不值得买呢?下面为大家总结一下小米15将会有哪些升级点:软件...

拼多多,怎么就成为了年轻人的「赛博菜市场」?

拼多多,怎么就成为了年轻人的「赛博菜市场」?

可惜你不在拼多多买水果蔬菜,很难一句话跟你解释,我只能笨拙的用经历来慢慢讲。我们公司有微波炉,同事们几乎都是自己带饭来上班,便当荤素搭配、水果零食;都是好看又好吃。我自己本来就不喜欢外卖,当然也加入了带饭大军: 直到某一天深夜我闲着无聊刷了...

中国芯片产量达1399亿颗,这意味着什么?

美国并不是没有明白人,只是特朗普不懂芯片产业的情况,冒冒失失在ZZ正确下,开启了对中国芯片的掐脖子,结果没掐死,反而让人练出了铁肺。芯片是所有科技产业的上游,美国原本在上游呆得很舒服,靠英伟达、AMD、德州仪器、高通等这些几十年霸主地位的公...

如何评价小米14pro顶配可以选配卫星通话,小米15全系都无法选配?

如何评价小米14pro顶配可以选配卫星通话,小米15全系都无法选配?

雷总不是说了吗,我可以不用,但你不能没有。市面上OPPO Find X8 Pro和vivo X200 Pro的卫星通信版分别加价300,而荣耀Magic7和Magic7 Pro有卫星通信版且不加价,荣耀更显诚意。我觉得有是更好的,虽然使用卫...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。