中国资本网 > 资讯 > 科技频道 > 正文
互联网科技公司加码布局AI绘画 专家分析未来AI绘画的发展前景
2022-05-31 08:11:12来源: 南方都市报

——"一片向日葵花海在星空下闪烁。"

本来只是在有限的想象力之内挑了梵高的两幅名画加以简单概括,结果AI吞掉这句描述后,居然就吐出了一张张极富冲击力的图像:

图源:Simon_阿文 微博

没有参考图像,也并非简单的两幅图像的拼接融合,而是真正基于文字描述,在充分的想象力下,从无到有地进行了绘画创作。

而就在不到一年的时间内,这样的AI画手开始井喷式地出现——

近期在海内外爆火的免费AI作画工具Disco Diffusion,输入简单的文字描述就能在线生成图像,其画面之精细,想象力之超绝让不少人直呼“AI比我都浪漫”:

图源:开发者推特

一度登上苹果应用商店的图形与设计排行榜榜首的Wombo,只要下载App,上传图片或输入关键词,再选择平台给予的风格,几秒之后就能生成图片,其超绝的想象力被无数用户玩出了花:

图源:网络

还有通过聊天出画的Midjourney,用户进入聊天软件Discord,并被邀请到相应的小组中后,就能像是真的与画手隔着网线交流一样,说出自己的需求,而AI也会在群中实时更新的绘画进度:

图源:网络

OpenAI上个月刚刚推出的Dall-E2,其生成结果的精准度、对人物的识别能力震惊了整个技术圈,甚至都有读者用这一AI出了一整本画集,整整1000张图片:

图源:作者个人主页

更不用说谷歌新鲜出炉的Imagen,不管多长,多具体,多不符合现实逻辑的离奇描述词,都可以精准地从文字生成真实准确的图像:

图源:谷歌官网

惊人的技术迭代速度、破圈式的热度、震惊了绘画圈的色彩、构图、想象力和创作力,似乎都在表示,这些AI画手们,正在逐渐在绘画领域中掌握”画语权“。

对此,有人欢欣鼓舞,认为技术的革新将为艺术领域带来全新的思考方式和改变,有人惶惶不安,担忧来势汹汹的AI画手将摧毁一大批中低端绘画岗位,甚至有人怒斥AI将艺术变为了单纯的数据游戏,使得绘画失去了意义和灵魂......

议论连续不断,热度居高不下,AI绘画这一名词开始逐渐出圈,在谷歌的关键词搜索趋势中,AI painting的搜索热度自去年下半旬就开始逐渐高涨,到现在已经达到了一个新的高峰:

热议之下,已经有这样的声音出现:

AI绘画,元年已至。

···

且先不论这一发言是否正确,所谓的AI画作,到底是严格按照代码逻辑运行,风格单一的产物,是AI的随机拼接游戏,抑或是真能如人类画手一般依照主题构想画作?

AI们都画了什么,它们又能画多少?

AI画手的第一批体验者们,当时就抱有着这样的疑惑。PPT设计师阿文就是其中之一。

今年4月份时,他偶然看到一个画手朋友在微博展示了一组AI作画的作品,效果惊人,朋友作为专业画手也给予了很高的评价,他便也对这个叫做Disco Diffusion的工具起了兴趣。

这是一款基于谷歌的技术框架开发的AI作画工具,部署在谷歌Colab(一个可以通过浏览器编写和执行代码的线上托管平台)上,训练画作所需的算力也由谷歌免费提供,而只需要修改代码中的一个部分的文字描述,就能生成画作:

文字描述拥有画种描述、内容描述、画家描述、参考渲染方式、颜色描述五个维度,用户不用修改代码,而是只要从这几个方面进行调整和修改,就可以生成图像。

不过,鉴于是初玩,阿文只谨慎地修改了默认文本中的两个关键词:A beautiful painting of astarry night(原singular lighthouse), shining its light across asunflower sea(原tumultuous sea)by greg rutkowski and thomas kinkade, Trending on artstation.” "yellow color scheme“,也就是将默认的”一座在惊涛骇浪中闪耀的奇异灯塔”改成了“一片在星空下闪耀的向日葵花海”。

而AI吐出的第一张图片是这样的:

图源:Simon_阿文 微博

这是一张超乎了阿文想象的画作,色彩、构图都拥有超绝的美感和想象力。

而Disco Diffusion本身可以根据一句描述产出多张不同的图片,于是,阿文在无比期待中,迎来了挂机渲染之后的另外几幅作品:

图源:Simon_阿文 微博

简单的文字描述外加一点点天赐般的运气,诞生了数张色彩构图丰富大胆,如同梦境般的画作,最终一举出圈,在微博超过两万人转发,并纷纷表示震惊“给跪”。

也因此,大批用户纷纷涌入,开启了脑洞大开的AI花式作画。

有将参考画师改为吴冠中,直接得到一张水墨画:

图源:网络

还有应用了虚幻引擎风格,生成的仿佛游戏页面一样的画作:

图源:网络

当然,偶尔也会有人喂出了一些有些诡异的图片:

图源:推特Mike Franchina

......

在那之后,阿文也试用了另一款叫做Midjourney的工具,同样是“星空下的向日葵海“的描述,不过这次的生成结果则恰如其分地落在了他的想象力内:

图源:Simon_阿文 微博

“就像是一个听话版的Disco Diffusion。”阿文笑道。

在尝试多次后,他觉得Midjourney的想象力是比不上Disco Diffusion的,但好处是速度够快,五分钟就能成图,而且不至于像Disco Diffusion那样,有抢夺创作主导权的“野心”,是更适合艺术创作者的辅助工具。

还有更多像阿文这样的艺术创作者,走上了探索AI绘画工具的道路,并开始逐步挖掘各自的潜力。

比如主阵地是移动端的Dream,它的整体作画风格更偏向于梦幻柔和:

图源:网络

而诸如DALL·E2、Imagen之类的画手,则是在如何更准确地理解文字描述、更好地组合绘画风格,最后生成更精确而言之有物的事物和人物的方向努力。

当然,除了这些从无到有的“高端创作者”,近几年也火过一批更加亲民的AI画手们。

比如在去年一度火爆外网AnimeGAN,可以实时地将人像转为漫画模样,也是在线部署,火到要排队几个小时才能玩到:

图源:网络

去年在日推被疯转的AI,简陋的草图一经它手就会变成精致可爱的二次元萌妹:

图源:高坂 推特视频

还有可以任意推断两张人物图像的子世代长相的Artbreeder,不仅几秒就能出图,还可以通过超多参数微调产出人物的长相:

图源:网络

再出圈一点,抖音、微信或QQ中的将人物照片转变为其他风格的AI滤镜,也能被算进AI作画的范畴里。

这样看来,AI画手们作画内容的范围覆盖之广,比起一些人类画手也是不遑多让。

其屡屡出圈的热度,更证明了在普通观众眼中,AI的画作们有着足够的冲击力和观赏价值。

···

接下来,让我们换一个角度来看AI绘画。一张成品画作由什么组成?在现实中是纸张和各种材料制成的笔墨水彩,而储存在电子设备中的一张图像,本质上则是一个像素点矩阵,每个都由 RGB(Red、Green、Blue)三个颜色通道组成。

图源:网络

因此,AI绘画也就相当于一个可以逐渐产生像素,进行图像生成的计算机模型。

模型是人工智能中的一个概念,我们可以将其通俗地理解为一种从输入到输出的函数。

要让这个函数输出我们期待的像素点矩阵,首先需要赋予它很多“参数”,相当于函数中的变量,这些变量涉及绘画中每一笔的位置、形状、颜色,甚至是覆盖关系、笔触组合等多个属性。

有了这样一个拥有庞大“变量”的“函数”,还要再基于海量的已有图像进行训练,也就是找到效果最好,最合适的一组参数的过程。

而这样一个绘画模型所需的参数量和训练数据集非常庞大,不仅如此,也很难让计算机去理解“创作”这种比较抽象的概念。

因此,诞生之初的AI作画,说是依照逻辑执行任务也并无不妥。

关键词: 什么是AI绘画 AI绘画前景 梵高名画临摹 AI绘画训练 最新绘画应用

相关新闻
专题新闻
  • 河南最大扶贫搬迁社区飘起幸福“年味儿”
  • 虽说万物皆可盘 但盘得住时光的才是王牌
  • 霍尔果斯:冯小刚等明星资本大撤离
  • 开心麻花电影频出
  • 男频IP为何“武不动乾坤,斗不破苍穹”
  • 《铁血战士》北美市场票房跳水 又玩坏一个大IP?

豫ICP备20022870号-9

Copyright © 2011-2020  资本网   All Rights Reserved. 联系网站:553 138 779@qq.com