FLUX.1 模型发布,最强开源文生图模型头衔或将易主
在开源文本图模型领域,StableDiffusion 模型一直处于领先地位,即便该公司经历了一段动荡时期,但仍然开源了 StableDiffusion 3 模型,虽然效果一般,但未来还是值得期待的。不过随着 FLUX.1 模型的发布,最强开源文本图模型的头衔或将被取代。
FLUX.1模式是由StableDiffusion原团队成立的新工作室黑森林工作室推出的,由从StableDiffusion离职的成员组成。可以说FLUX模式是对StableDiffusion模式的一次挑战,给了前东家两记重重耳光。
那么FLUX.1模型到底有什么特点呢?首先是画质增强,拉近了与最强图像处理软件Midjourney的差距,不过这是一款闭源软件,对开源模型有点不公平。第二个特点是手部细节的优化和增强,相比StableDiffusion模型的手指变形,FLUX.1模型就正常很多了。
然后就是关键词语义理解准确率的增强,也就是可以理解一段话的内容,更精准的生成带有文字描述的图片,而不需要单独的提示词。其次就是图片生成速度变快了,但由于最低配置机型需要16GB显存,仅靠消费级显卡很难体验到更快的图片生成速度。
目前FLUX.1已经发布了专业版、开发者版、快速版三个型号,开发者版已经超越SD3-Ultra,综合性能可以说是目前开源的最强,当然数据并不能完全说明这个型号的特点,下面列举一些图片作为例子。
FLUX官网放出了部分样张,可以看到人物动作非常逼真,也支持和SD3一样的模式,目前可以识别英文,并在画面中完整显示,画面格式也有不同风格,可以是写实的,也可以是卡通的。
生成的风景画与现实基本难以区分,如果不仔细看,很难猜出这是AI生成的图片。
二次元风格同样不成问题,可以说FLUX.1这款机型从上市到现在,表现都比SD3好很多。
对于想要体验的小伙伴,FLUX.1模型在官网上推出了三个开源链接,第一个是FLUX.1PRO,是最佳版本,但是无法本地下载,只支持调用API。第二个是FLUX.1Dev,是开源模型,支持下载,但是无法商用,如果你的显卡有16GB显存,可以下载这个版本的原始模型。第三个是FLUX.1Schnell,支持下载,在Apache2.0许可下可以商用,个人体验的话可以下载Dev版本,目前这个模型只支持ComfyUI,需要更新内核到最新版本,千万别忘了。
如果你的显卡不够大,可以下载网友精简过的FP8型号,体积只有原型号的一半,显卡的显存要求也会降低到8GB。但如果想要更好的画面表现,16GB显存的显卡是必须的。影驰RTX4070 Ti SUPER OC显卡刚好满足16GB显存的大小,是一款性价比非常高的AI进阶体验显卡。
影驰 RTX4070 Ti SUPER OC 采用 NVIDIA Ada Lovelace 架构,拥有 16GB 超大显存,可以满足各类 AI 原始图像的需求,并能快速制作 AI 图像。理论 AI 算力达到 706TOPS,游戏性能在 4K 分辨率下也能应付 3A 游戏。即将上线的《黑神话:悟空》也是毫无压力,在 DLSS 的支持下,可以达到很舒服的帧率水平。喜欢的朋友可以去影驰官方商城购买哦~
(8902652)
文章评论