张海

{$title}

时间:2022-07-31 22:04:52  作者:张海   来源:对话西樵:AI绘画中人们关心的几件事-米乐体育m6,米乐体育app下载  

米乐体育m6,米乐体育app下载原标题:对话西樵:AI绘画中人们关心的几件事

米乐体育m6,米乐体育app下载图片来源@视觉中国

米乐体育m6,米乐体育app下载正文|网络指南

米乐体育m6,米乐体育app下载上个月,我在文章中提到AI绘画工具Disco Diffusion(以下简称DD)时,只是作为一个例子来证明AI在创意内容上的局限性,因为它直接用于生成人脸。 ,动物还是有缺陷的,需要人工处理。但AI绘画工具的迭代升级,远远超出我的想象。 DDv5.6新更新的人像生成器模块,大大提升了人脸生成的效果。虽然有些角度还是变形了,或者看起来像“玻尿酸”,但越来越像“人”了。

虽然在人工智能发展的时间线上,训练人工智能画画并不是什么新鲜事。早在 2015 年,谷歌就推出了 DeepDream,以测试 AI 的“艺术能力”。但2022年,以DD为代表的最新一批AI绘画工具将出圈,不仅是因为技术上的突破,更在于生成的图片带来的视觉冲击力。

人们越来越重视人工智能绘画是否会对艺术产业产生影响——即使它可能无法真正取代人类艺术家,但它目前展现的生产力足以有效辅助人类创作,成为手稿、材料、和一个灵感。

AI绘画除了作为设计师和插画师的工具外,还将画布传播给普通人。无需美术基础,通过对比教程、编写描述符、调整参数,可以将图像结果与文字想象进行交流。而且它还有一些“平易近人”的应用,比如和菜头就用它画了公众号的封面。两个月的时间,封面图的来源从某画廊/版权变成了“和菜头的小肉手”。

针对科普原理行业已经有专业对口的情况,介绍各种AI绘画工具和教程。我比较好奇的是,AI绘画给人们带来了什么变化,人们在变化中是如何行动的。

带着这些疑问,我找到了西樵。她是漫画《神秘程序员》的设计师和创作者。从今年5月开始,她几乎全心全意地投入到AI绘画的尝试中。除了每天跑图,她还看论文、写科普。她对人工智能绘画寄予厚望,认为“人工智能对艺术和插画的影响相当于另一个‘照相机的发明’,艺术史可以再分卷。”

如果你想找到“什么是AI绘画工具”的答案,建议阅读更专业、更系统的文章,比如西樵公众号的教程(神秘程序员:coderstory)。但如果你对“AI绘画跟我有什么关系”、“我能用它做什么”、“它会带来什么”感到好奇,不妨继续往下看。

AI绘画为何突然出圈?

中文网关于AI绘画的讨论主要出现在今年4月。随着美术界和编程界从业者的使用和交流,AI绘图工具DD逐渐为更多人所熟知。这是一个GitHub开源项目,尚未打包。它在 Google Colab 中以代码的形式呈现。绘图过程可以简单概括为输入关键字生成图像。相对于早期AI绘画的刻板风格,缺乏整体美感,完成度不高,DD在构图、色彩、氛围等方面都有了很大的突破。

同时,今年4月OpenAI结合扩散模型和CLIP提出的DALL·E 2、DD作者Somnai公司推出的Midjourney等工具也开始进入人们的讨论和使用。设计师和插画师开始制作“从0开始学AI绘画”的教程,比如@JZ_,比如在B站发教学视频,@Simon_Awen在微博上持续更新AI绘画素材,或者如果人们知道了几乎讨论“什么样的像迪斯科传播这样的人工智能绘画会对艺术行业产生什么影响?”

和大多数职业画家一样,西乔之所以被AI绘画击中,也是因为“可能性”。这种“可能性”不仅可以改变PS、3D辅助软件等工具带来的创作过程,还可以带来内容上的解放,“它可以帮助我创作出我以前不知道,甚至不敢做的东西. 创造风格。”

但与其将 AI 视为“创造者”,茨乔认为更恰当的说法是 AI 是她画布上的另一只手。有时候可以“放手”,让AI自己跑,会带来很多意想不到的惊喜。例如,在她的系列《西藏往事》中,AI 在雪山上放置了一台塔式起重机。

除了 Prompt 设计和无尽的参数分析机器调整之外,还有另一种方式可以发挥高可控性。当美术师对生成图的结果有预期目标时,可以通过设计底图,设置底图跳过步数(跳过步数越多,AI生成的地图越接近底图)。或者获取生成过程中的中间步骤,修改中间步骤放回AI中继续生成。也可以根据同一提示调整参数,输出多组结果,手动选择更符合创作者期望的部分进行合成甚至重绘,进行后期二次创作。

用两只手画画,带给她的是创作的解放,是探索和学习新知识的快乐,是打开盲盒的快乐。幸福是一样的。”并且相比盲盒的有限选择,AI绘画所能完成的组合理论上是无限的。

依托专业爱好者编写的中文资料、奶妈式的教程、打包程序以及支持中文描述符的AI绘画工具,AI绘画逐渐“出圈”,进入大众讨论的语境。比如,何菜头从今年 5 月开始就多次发推谈 AI 绘画。

技术的向后兼容让AI绘画为更多普通人打开了绘画的可能。毕竟对于大多数人来说,绘画要么是一扇从未打开过的门,要么就是门槛很高。但是通过人工智能,一些从未尝试过绘画的人可以不依赖多年的学习和经验积累,就可以创作出图像。

“人们创造图像的直觉是与生俱来的,你会发现很多人的绘画高峰其实是在童年时期。随着他的成长,接受越来越多的现有视觉绘画模式,后天的输入就变成了覆盖那种直觉。”

当图像创作的先天直觉被现实约束时,“大多数人试图创作,不是用直觉去画出自己脑海中的东西,而是尽可能地让自己画的东西符合现有的画作,比如模仿照片,我模仿别人的画,画着色书,当我逐渐意识到我的模仿太落后时,我就放弃了绘画。”

当“绘画”可以像“自拍”一样用于分享,满足成就感时,人工智能绘画工具或许可以帮助普通人找回被偷走的自由,享受创作的乐趣。为此,一些AI绘画平台也在利用这一价值实现商业回报,例如提供将AI生成的绘画打印成挂画的服务,供用户购买实物。

AI绘画工具如何“懂”

DD等通过文本生成图像的AI绘图工具无法绕过称为“CLIP”的模型,这是AI如何“理解”人类语义的关键。 CLIP(Contrastive Language-Image Pre-training)是一种基于对比图文学习的跨模态预训练模型,由 OpenAI 于去年 1 月发布。同时发布的还有独创的DALL·E图像生成模型。

DD 使用 CLIP 来“理解”用户输入的文本,然后使用扩散模型生成图像。这个过程可以理解为:将文本关键词输入AI,AI基于对训练数据集的学习,从一堆噪声点中推导出图像,通过不断匹配文本和图片。 ,然后逐渐去除噪点,添加细节,最后生成图像。

“宇航员骑马”和“骑马宇航员”是解释 AI 对语义理解的常见例子。 AI有描述前者的能力,但因为后者的“反经验”,实现起来并不那么容易。

AI 生成风格化图像的能力也源于大型训练数据集灌输的画家风格。以 DD 为例,提示是影响生成图形的重要组成部分,包括作品的媒介、描绘的对象或主题、各种风格和纹理的修饰符以及参考艺术家。

根据西樵的实验和理解,AI会提炼出艺术家绘画的特征,比如整体创作的主题和对象、笔触、质感、亮度、调色板等。一些画家作品的主题多样性。比如AI理解的塞尚、雷诺阿等画家,可能所有作品都有其特征衍生出来,但如果有些画家有特别出名的作品,那么图片的特征权重会比较高。

比如西樵用DD生成了一幅蓝色的海洋山水画,将画家设置为Caspar David Friedrich,发现生成的很多作品都是黑色背景。她推断这个元素来自弗里德里希的《雾海上的旅行者》。

除了学习艺术作品,画家的国籍和文化背景也会影响对AI的理解。例如,如果一个中国艺术家被用来画一座建筑,它看起来就像中国风格。如果用画日本漫画的画师来输出人像,人物很可能是锥子脸,眼睛比平时大。

了解AI如何“思考”来调整写描述符的方式和技巧,也是让AI更好地“理解”创作者的意图。

(如何编写描述符是教程的主要部分)

给绘画行业带来什么

从行业现有的应用来看,AI绘画工具向“绘画”的转变将是系统性的——在创作过程中,作为提供新技能点的生产工具;它将成为艺术的新变量,影响作品创造风格和价值;以NFT、拍卖画作等形式直接参与艺术市场交易。

在AI绘画工具辅助创作的维度,可以用来生成底图,艺术家可以作为二次创作的底图,也可以直接作为透视图使用。

艺术家还可以用简单的色块绘制草稿,交给AI生成“奇幻生物”作为灵感素材。

在AI绘画工具的介入下,工具链可能面临重新整合,从AI生成的十几个结果中进行选择,作为插画创作中的局部素材,再使用PS或其他鼠标绘画工具调光调光颜色、边缘处理、纹理整合等

另一方面,人工智能也正在成为影响艺术评价的新变量。

“艺术品价值的评价标准是非常主观的,而且这种评价不是一成不变的。在一个新的流派、新的媒介诞生之初,必然有一个接受和过渡的时期。”人们对AI绘画的评价,眼下肯定会有很多争议。

但随着AI绘画的普及,人们是否会继续使用现有的评价体系来看待AI绘画,或者是否会有一套适合AI绘画的评价标准,还很难说。慈桥认为,这可能会成为未来几年艺术史研究和艺术评论家的主题。学者会找到一套他的评价体系,大众也会选择自己的标准。

(用于对 AI 生成图的两极分化评估)

在她看来,虽然 AI 绘画工具表现出了不错的生产力,但在实际应用场景中还是存在较大差异的。比如AI特别擅长制作场景概念图,这会使其在游戏、动画、设计等领域表现出色,辅助创作。但是,如果用于工业设计、产品生成或服装设计,还没有表现出足够的应用能力。

此外,影响一项技术是否投入商业使用需要考虑两个因素,一是是否满足需求,二是衡量投入产出比。目前来看,AI输出图像的尺寸还是比较小的。由于切片算法和模型的限制,在生成宽边超过1280的图像时布局会很不理想,MidJourney最大值为(1664,1664),DALL·E 2 (1024,1024)。如果要制作可以打印的尺寸,则需要稍后放大或重新生成。

至于直接使用 AI 生成的画作出售,已经有行业先例。 2018 年,巴黎艺术团体 Obvious 使用 GAN(生成对抗网络)完成的一幅肖像以 432,500 美元的价格售出。

也有 AI 绘画平台和创作者将生成的绘画投射到 NFT 中,但这项交易也面临着很大的不确定性。 AI挑战画廊业务可能比通过NFT赚大钱更现实。

可能的负面影响

随着AI绘画工具的普及,一些功能也可能被盗用,造成负面影响。例如,通过添加“蒙版”,您可以重新绘制部分图像,将大象的背面改为大象的正面,或者将一个苹果自然地放在空咖啡桌上。

该工具对每个人的想象都是开放的,这意味着它可以用于艺术创作和表达,也可能被别有用心的人利用,成为假图片和假新闻的“杀手”。

警告是,可以替代视频视听内容的“Deepfakes”用于伪造名人色情视频、欺诈性勒索、假新闻等内容,其使用受到限制。 2019年,在国内一夜爆红的AI换脸App“ZAO”也受到了用户隐私、信息安全等问题的质疑。

除了用户使用带来的可见“垃圾内容”,在AI图像学习的过程中,也不可避免地吸收了人类认知中对性别、职业、种族的刻板印象和偏见,潜移默化地体现在图像的生成上。人工智能绘画。结果。

为了应对上述可能产生的负面影响,AI绘画工具的开发者采取了谨慎开放、更长的内测周期、调试图像描述符的过滤器等,加上控制。

国内开发者设计的AI绘画工具Tiamat向用户解释了内测周期长的原因,并写道:“AI生成艺术是一个相对敏感的全新领域,其中的不可控性、合规性、用户体验都需要我们多次迭代,包括云部署、模型调整等。我们也希望TIA尽快与大家见面,但客观上是技术不允许的。”

OpenAI 的订阅邮件显示,在最近更新的 DALL·E 中,“减少了对种族的偏见,更准确地反映了世界人口的多样性”。未来将根据用户反馈和评分进一步优化。

至于开发者对过滤器的调试,目前还处于探索阶段。从希乔的亲身经历来看,她曾多次被滤镜“绊倒”。

(系统似乎将《悬崖上的祈祷》判定为“负面内容”)

AI绘画的另一大诟病是“侵权边界”,目前属于灰色地带,尚无行业定论。

以DD为例,该工具遵循MIT开源协议,理论上生成的图可以免费商用。但在实际使用中也会存在,因为描述符的使用导致画风相同,很可能引发抄袭纠纷。此外,“如果用别人的作品‘垫’作为底图,然后将skip设置为高电平,最终的结果将难以界定是否构成对作品的侵权。”

事实上,对于真正的画家是否抄袭以及是否构成侵权,存在各种复杂的争议。说到AI绘画的侵权,可能还需要足够的经验和案例来形成行业意识。

最后,西乔还补充说,AI绘画也可能面临“负反馈”的可能,即人们使用AI绘画工具生成的图像进一步用于AI的优化和训练,“AI模型可能会表现出类似于放大器的效果,最终会发生什么,我们现在不知道。”

结语

西樵喜欢用“相机”来比喻AI绘画。 “相机刚诞生的时候,成像很慢,在暗房里洗也很麻烦,携带和使用设备不方便,成像效果也不一定好。”当时的肖像画家,对于用相机拍摄人像有很多批评和嘲笑。

“但我们知道,几十年后,画家在绘画时几乎总是使用相机中的照片作为参考。因为一天中光线变化如此之快,你的模特不会想在那里坐几个小时。”

不仅是人像、山水画,还有基于照片进行后期处理的数字绘画创作,或多或少的相机应用带来了艺术形式的变化。

在社会层面,“摄影”也从特定阶级背靠的特定生活方式走向市民阶层,记录社会变迁和普通人的日常生活。这种技术力量的解放和扩散在智能手机发展的今天尤为繁荣。普通人可以以更低的成本、更方便的使用来掌握相机的拍照能力。

可以预见,AI绘画工具的技术迭代不会花费“相机”发展所需的数十年或数百年时间。除了上述DD、DALL·E 2、Midjourney等工具外,各大互联网厂商也纷纷入局,如谷歌的Imagen/Parti、Meta的Make a scene、微软的NUWA等等.国内的开发者也致力于接壤全球AI艺术的浪潮,比如正在举办“万人共创-AI艺术创作大赛”的Tiamat。

人们对AI绘画的使用和认知还很短暂,其影响还更多地存在于艺术圈和程序圈。但在未来,AI绘画能否像“相机”一样跨阶级、跨圈、渗透到普通人的生活中,是一件引发足够遐想的事情。

更多精彩内容,关注钛媒体微信(ID:taimeiti),或下载钛媒体App。回到搜狐看更多

编辑:

11183快递查询网

竞技宝官网官方网站入口,竞技宝官网网页版

copyright © 2016 powered by 对话西樵:AI绘画中人们关心的几件事-米乐体育m6,米乐体育app下载