AI作画风潮来袭:潜力无限但仍在路上,Wombo Dream等工具引领创作新趋势
很有潜力,但仍在路上。
最近,“AI 作画”产出的作品在互联网上形成了一股风潮。这些画作初看时令人惊艳,气氛也被拉满,然而仔细琢磨却又让人摸不着头脑,往往能给人留下深刻的印象。当人们得知这些画作是完全由 AI 绘制出来的,便又增添了一份惊异之感和危机感。
一些AI作画的成品效果的确十分惊艳
AI 作画的原理虽涉及复杂的机器学习算法,但解释起来并不复杂。用户能在平台上输入各类与风格、主题、氛围相关的关键词,AI 依据这些关键词,在互联网海量的资源和素材中进行搜索与学习,最后将其糅合并拼接成一些符合要求的画作。
以在移动端十分红火的 Wombo Dream 为例,它是一个供大众用户使用的 AI 作画工具,其界面可视化程度较高,操作较为简单。我在该界面中选择了“吉卜力风格”,接着输入了“梦中梦”这个主题,并且上传了一张湖中小船的图片作为参考基准。随后,AI 很快就为我生成了一张与吉卜力动画背景类似的成品。
移动端面向大众的 Wombo Dream 操作较为简便,生成图片的速度较为迅速。
除此外,存在很多更专业且侧重点各异的图像制作 AI。像谷歌的 Disco Diffusion,它的可调参数较多,能够细致地设定图片的大小和质量,对描述的要求也更为精细,能够涵盖画师风格、色调、主题等诸多方面。这致使它生成的一些图片看上去就像出自真人画师之手。Midjourney 模仿了各种用户可能向真人画师提出的需求,它是不少从事数字绘画的艺术家所喜爱的。Stable Diffusion 是一款开源软件,许多游戏开发者都对它广阔的应用前景很青睐。Artbreeder 由于对真人头像的模拟,在早几年就已经在网络上流行起来。
这项技术并非近年才出现。随着 AI 技术的发展以及互联网带来的更多素材,这一类产出作品的质量在不断提升,且提升得肉眼可见,效率也有了很大提高。今年年初,暂且不论画得如何,当时一些 AI 画图工具画一张图大概需要 1 小时左右,而现在这个时间已经缩短到了十几秒。
普通用户使用这类 AI 作画是为了满足自己内心对种种场景的幻想。而游戏开发者们从中看到了更多的潜力。
触乐找到了几位开发者,这些开发者有的在自己的游戏中进行探索,有的在自己的游戏中进行实验,他们都在寻找应用这项技术的可能。
从机械化的劳动中解放
“正义的史官”(化名)是某策略游戏的开发者。当联系上他时,他开玩笑表示自己正在朋友圈里进行“布道”,呼吁同行们都去尝试 AI 作画。他自己已经在项目中开始使用,并且觉得使用起来很顺手。在谈及 AI 画图的好处时,他提及最多的是“量大”和“速度快”,尤其是在开发初期寻找概念方向的时候,其效率比人工画图要高出很多。
在这个阶段,策划最关注的是画面的整体效果以及大感觉,然而很多具体的细节尚无法确定。例如,倘若他们打算制作一个具有黑暗奇幻背景的游戏,那么可能会有哥特风、中世纪风、工业风等好几个不同的方向。在无法明确哪些元素组合以及色彩搭配效果最为出色的情形下,反复提出需求很可能会导致人力的无端消耗。AI 作画情况不同,我们能够持续对关键词进行调整。调整一次后,让 AI 生成 100 张,以此来查看效果。史官说道:“倘若我让公司的美术人员或者进行外包,让他们先出 100 张看看效果,他们很可能会直接把我从窗口扔出去……”
在角色设计方面也是如此。假如我想要设计一个外星人的形象,那么可以先让 AI 生成 500 个以供查看效果,接着从这些当中挑选出一个,然后对其进行更细致的设计。他接着说道,真人画师不可能去承担这种试错的成本,然而 AI 却不会有任何怨言。
有艺术家已尝试借助 AI 来生成图片,并且将其用于参加数字艺术比赛,这其中有一幅作品获得了奖项。
AI 生成的图片不仅能提供灵感的大方向,还可以当作参考素材。邢峰(化名)身为文字类游戏制作人,他的游戏里有诸多涉及服装褶皱、布料质感以及飘逸动态的绘画。
这种东西无法让画师凭空去构思,他们平日里作画需寻找诸多参考。找到角度和姿势合适的参考着实麻烦。邢峰介绍道,输入关键字后,直接拿 AI 生成的图当作参考会便捷许多,同时也无需担忧潜在的动态、姿势等方面的侵权问题,因为 AI 是凭空创作出来的。更何况,AI 进行的 3D 渲染,通常在打光方面较为正确,无需你再自行进行想象补充。
AI 生成的概念图和人物图目前难以直接加以使用。邢峰表示,最终还是需要让画师来进行绘制,因为 AI 生成的东西较为破碎,不存在一个统一的设计,若直接拿来使用,不太能满足他们的项目需求。
目前最接近直接可用的 AI 作画的成品,主要集中在某些相对简单的方面。一是平面图案设计,二是 3D 素材贴图。这类图片一旦生成,开发者只需进行一些简单处理,比如裁切、调色等,就能够将其应用到游戏中。
我尝试用 AI 生成了一幅写实风景。这种写实风景的效果,对于一些文字类游戏中不太重要的背景来说,已经接近于可以直接使用了。
简单的平面图案设计涵盖了各种旗帜图标、徽章、法阵等。倘若这些图案与游戏的世界观以及情节并非紧密相连,并且不需要专门进行设计,那么就能够将其交给 AI 去进行批量产出。
史官开发的游戏需要用到大量的勋章图案和供玩家选择的旗帜图标。这些美术素材在游戏中并非重要部分,若让画师人工设计绘制,一个人一天最多能画出十几个,投入与产出严重不平衡。“用 AI 画的话,画勋章,一晚上能产出大几千个,画图标一天能产出 1 万个。拿到成品后再用脚本切图打包,比人力快得多得多。””他如此形容效率的巨大差距。
他计算了不同设备下 AI 的出图效率。他说现在主要租用的是谷歌云。以一张图 512×512 像素为标准,AI 画图工具 Stable Diffusion 出的图,在 Stable Diffusion 里走 50 步时,用 T4 显卡大概需 15 秒;走 64 步时,大概需 20 秒,且步数越多时间越长。如果有 V100 的显卡,大概 50 步只需几秒就能完成。出图的数量能够由自己进行设置。电脑的显存会决定是否能够生成足够大的图,而 GPU 则决定生成的速度有多快。
Stable Diffusion 本身是免费的开源软件。谷歌云的开销方面,每月需 10 美元。更高的配置时,每月仅需 50 美元。
邢峰提及了一些类似于一次性使用且在游戏中作用不显著的图案。比如要制作一个兽人小兵,那种出来不到一分钟就被打回去的,他身上的纹身完全可以通过 AI 生成。还有各种魔法阵,设计起来着实麻烦,在游戏里的作用却不大,而直接找素材又很容易引发版权纠纷……AI 作画能够让画师从这类机械化的劳动中解脱出来。
并不是所有平面纹样都能适用于 AI 。最终起决定作用的是开发者的需求。例如衣服上的刺绣以及布料上的花纹,这些在游戏中涉及到世界观、文化、阵营等方面,是比较重要的。邢峰表示,所以对于这些,我们还是采用人工设计的方式,不会使用 AI 来绘制。
开发者们认为 AI 生成的 3D 贴图素材用起来负担最小,尤其是石头花纹、花草树木等普遍适用的东西。若他们只需写实背景,这些逼真、无特殊风格且无版权的自然外观,可算作最便捷的素材,甚至生成后无需太多人工修正。
独立开发者叶兰舟一直对 AI 作画予以关注。他进一步阐释了当下厂商运用 AI 作画工具的关键所在:“AI 现今是一个处于混沌状态的黑箱。在图像呈现出来之前,人们很难知晓自己将会获得怎样的结果,对于每一个关键字在其中会起到何种作用,也是不甚明了的。”
现在开发者们对 AI 作画进行调试时,更像是在履行“关键词猎手”的职责。其实核心主要有两点:一是找到与自己游戏风格相匹配的关键词组;二是筛选出适合在游戏中发挥的图。
他拿出一个例子,这个例子很接近游戏原画,是一位白发女性人像。要生成这样的图,除了“超级长发女孩,头发雪白”这个基本关键词之外,还需要加上各种其他的限制。例如“细节较为丰富”“以数字形式进行绘画”“在 Artstation 平台上”“从事概念设计工作”“表面光滑”“聚焦较为清晰”“运用虚幻引擎 5”“达到 8K 分辨率”等。最后,还需加入“由 Artgerm 以及 Greg Rutkowski 和 Alphonse Mucha 等著名画家”来对图画的风格进行调整。
开发者要调整多次关键词才能生成自己想要的效果
所以,关键词如同咒语一般,需要持续地进行调换尝试,去探究怎样才能得到最能表达自身想法的风格。叶兰舟表示,通常情况下,依据成图的复杂程度,对关键词进行调整的过程大概在 15 分钟到 1 小时之间。
无法代替人类,也确实存在问题
目前,AI 作画技术处于不断变化发展的状态,这种变化可以用“日新月异”来描述。今年年初的 AI 作画与现在的 AI 作画相比,效果差异极大。
叶兰舟回忆了一些印象深刻的例子。今年三四月左右,运用 DDV5 这一 AI 作画工具,凭借“德鲁伊”“Pablo Amaringo”“Artstation 流行”等关键词所绘制的图画,在氛围以及画面元素方面已经能够给人留下深刻印象,然而在当时,基本上还无法生成正常的人脸。几个月之后,DALL-E2 能够生成较为准确的五官。同时,Stable Diffusion 在画面表现方面更进一步,达到了更高的水平。
大约5个月前,DDV5生成的德鲁伊主题图片效果
几个月发展之后,DALL-E2 的图片生成质量有了很大提升,同时 Stable Diffusion 的图片生成质量也有了很大提升。
另一个例子是在两个月的时间内,Midjourney 以同样的关键词生成了以鱼为主题的图片。
AI 进化的速度极为惊人,就好像发生了超人般的剧变,每天甚至每小时都在产生变化。叶兰舟做出了这样的评价。
时隔两个月,Midjourney对同组关键词生成的不同画面
AI 作画像所有能引起人们注意的新兴事物那样,在让人惊叹的同时,也引发了不少争议。
首先存在一种长久以来的担忧:AI 的发展以及广义上机器学习的发展,是否最终会替代人工呢?这个问题带有一定的形而上性质,进行讨论时是比较复杂的。然而从开发者们最为务实的角度去看,答案实际上较为简单:当下而言,“远远还没达到可以被代替的程度”。
前文曾提到,AI 仅仅是工具,仅能辅助美术方面的重复性劳动,是用于解放画师而非替代画师的。邢峰称:“或者说,被它们替代的是缺乏创造性的劳动。”并且强调,对 AI 生成的素材进行筛选,以及最终的设计和绘画,仍需由真人来完成,只是简化了之前那些会让真人画师感到烦恼的步骤。
史官称,依据他在同行圈子中进行宣传推广的经验来看,策划和制作人在尝试 AI 作画方面的积极性最为突出,而画师的积极性则最为低下。不过,这并非是因为画师觉得自己会被替代。他们真正关心的是能够利用 AI 来辅助进行绘画的实际案例。
另外,AI 能够画出各种精致的图片。在实际应用方面,开发者们仍然处于探索和研究的阶段。他们距离真正的工业化以及大规模应用还有一段距离。
工业化的开发者工具通常需要与其他常用工具的接口,以便创作者能在不同软件间随时进行素材的拷贝和编辑。然而,目前大部分 AI 作画工具都不具备这项功能。许多人已经察觉到了这个问题,并且正在积极努力地去解决它。例如,我们所使用的 Stable Diffusion 如今已经开源了,以后预计会有更多的优化以及工具接入。现在已经有接入Photoshop的视频了。”史官说。
史官提及的这段演示视频效果令人惊讶。把 Stable Diffusion 接入 Photoshop 后,画师几乎可以随时通过输入关键词,让 AI 生成的内容去填补画布上的空白,接着还能直接用画笔在上面进行修改,就好像多了一个随时能满足需求的绘图助理。
画面上的建筑和植物都是先用AI生成,再手动绘制调整出来的
邢峰希望有更多可供开发者定制的内容,例如定制素材库。他说:“倘若我们原先制作了一个极具风格化的游戏,随后想要制作一个类似的,是否能够将我们自己的素材上传上去用于训练 AI,让 AI 为我们作画呢?”
叶兰舟把这个过程称作针对某一画师或特定画风的小规模机器训练,然而目前多数渴望使用的游戏厂商尚不具备进行该训练的能力。“不过,大家已经在开展研究了,就像现在 Stable Diffusion 的开发者所说,训练包最终会被压缩至 100MB……如此一来,我们或许就能够用其来进行训练了。” 此趋势的发展速度较为迅速。这两天史官下载的版本,训练包已经从7GB变成了2.7GB。
在形而上层面关于“AI 是否会取代人类”的讨论之外,AI 作画确实存在一些尚未解决的灰色地带。这些问题给它在商业化和工业化方面的应用前景蒙上了一层阴影。
一般而言,开发者们对 AI 生成的纹样、姿势等是否存在版权问题不太担忧。因为 AI 生成的事物是自然“生长”出来的,就如同一棵树不会长出两片一模一样的叶子一样,即便使用同一组关键词,AI 也会为不同的人绘制出不同的东西。邢峰表示。
有些版权概念较为模糊,例如画风。目前 AI 作画存在争议,这其中的焦点就是画风。因为在训练 AI 时,很多关键词都与画师的风格相关。使用者既可以直接输入现有著名画师的姓名,也可以输入像“吉卜力”“迪士尼”这样已经相对稳定的商业流派。这样一来,当 AI 作画的成品与这些参考图的风格越来越相似时,画师们难免会觉得自己被冒犯了。
8 月底,有许多日本画师在社交平台上进行了声明,禁止 AI 学习他们的画风。抗议所涉及的 AI 作画平台 Mimic 主要以二次元头像为主,他们展示的对比图乍一看确实很难分辨真假。
用户上传已有画师的作品,Mimic 利用 AI 生成新的头像,且新头像的画风与已有作品类似
叶兰舟从开发者角度指出,若要应用于游戏,AI 生成的角色在面部表情以及形象的连续性(即角色长相在不同场景中不会“一人千面”)等方面存在不少瑕疵。然而仅从静态图来看,AI 过强的模仿能力似乎瞬间就让画师们十几年的努力处于岌岌可危的境地。
Mimic 现在已经宣布终止测试,这是因为争议过大。同时,Mimic 声称将在正式版中加入保护画师版权的措施。
欧美一些游戏厂商的概念设计师站出来指责这类 AI 工具为“版权洗衣机”,他们觉得这些工具对画风的模仿空洞且华而不实。同时,也有设计师认为,或许行业大佬确实不会被 AI 取代,然而初出茅庐的新手画师就不一定了。
此外,AI 作画中出现的人像会涉及肖像权方面的问题。有网友表明,倘若 AI 训练所使用的数据是从网络上抓取而来的,若要进行商用,就必须确保所抓取的并非是禁止抓取数据的网站。在通常情形下,对人脸等这类敏感数据进行抓取是需要获得授权以及知情同意的。
目前,各大 AI 作画平台对于图像使用的规定表述得不够清晰明确。有些平台只是笼统地规定不能制作色情类的内容,不能把图片用于有害的用途。还有些平台规定只有成为付费会员,才能够将制作好的图片用于商业用途。大体而言,还是让使用者自行承担风险的意思。
这一块依旧处于法律的灰色区域,邢峰表示,日后或许需要一到两场规模较大的官司,以此来推动大家的认知以及促成变革。
潮流难以阻挡
总的来说,AI 作画被游戏开发者们视为很有潜力的工具。然而,无论是由于现有的技术限制,还是因为版权上的争议,它都还处于探索阶段。所以,它目前无法大规模使用,并且在短期内也难以替代人工。
《疯狂之源》这款已上架 Steam 的游戏是目前所知的唯一将完全用 AI 生成怪物和场景这一技术进行密集运用的例子。它本身属于克苏鲁题材,能够容纳各种奇异的怪物形象,并且最终的视觉效果与通常意义上的商业游戏存在一定距离。
《疯狂之源》具有克苏鲁风格,AI 生成了一些形象,这些形象给人一种“不明觉厉”的感觉,二者相当搭配
不管怎样,AI 作画的潮流难以被忽视,开发者们也不会舍弃能够降低成本、提升效率的新生产方式。很多独立游戏开发者乐意去拥抱并研究这种变化。“毕竟阻止技术进步的脚步是很困难的。”邢峰说道。AI 作画就如同现代建筑工人所拥有的起重机,被解放的是古代那些需要亲自扛运石料的三千名苦工,然而工人自身是无法被替代的。随之而来的其他摩擦以及潜在的纠纷,或许是所有新事物在刚开始普及的时候都必须要经历的一种状况。新事物普及伊始往往会面临这样的情况,包括其他摩擦和潜在的纠纷。这些可能都是新事物普及过程中不可避免的阵痛。
触乐正在招聘文字编辑,欢迎。
编辑丨祝思齐
咖啡因驱动型码字机。
文章评论