铠侠·未来记忆系列|手塚篇(四)依靠人工智能创造手塚治虫笔下的作品角色,向这一前所未闻的创举发起挑战(二)

来源: KIOXIA铠侠中国社 2022-07-22 20:14:48

   

  上一篇内容——铠侠·未来记忆系列|手塚篇(四)依靠人工智能创造手塚治虫笔下的作品角色,向这一前所未闻的创举发起挑战(一)中介绍了“手塚 真”与“石渡 正人”两位参与者,并采访了他们对于TEZUKA项目的心得。本篇将继续介绍“迎山 和司”与“栗原 聪”,两位对AI与人类的合作有何看法与心得?阅读文章为你揭晓答案。

   

  发展为AI与人类的

  共创型合作

  

   

  迎山 和司

  公立函馆未来大学教授

  迎山和司毕业于京都市立艺术大学媒体艺术博士课程。1998 年至2000年担任加州大学圣地亚哥分校计算机研究所(现为 Arthur C. Clarke 中心)访问艺术家,他的作品曾于2000年获得.net 类别电子艺术大奖,于2011年入选国际电子语言艺术节(圣保罗,巴西)。

   

  2016年迎山和司被聘为巴黎东-马恩拉瓦莱大学 IMAC客座讲师。为了研究创意活动中的信息处理过程,迎山和司利用人工智能绘制图片,发表了有关人类认知特征的论文。迎山和司小时候是靠看《铁臂阿童木》漫画来学习汉字的。

   

  手塚治虫描绘的面部

  在AI眼中并非如此

  迎山教授正在公立函馆未来大学,从事着让电脑代替人类画图的研究。

  
 

  “深入研究的话,我认为有些东西是无法被电脑取代的。那就是只有人类才能做到的‘创造性的事情’,为了了解这一点,我还在继续研究。”

   

  在这一项目中,迎山教授受手塚制作委托,用识别器将手塚治虫原稿数据分成分镜和对白框等,并让AI学习。

   

  “为了让AI进行机器学习,首先要告诉它们什么是面部。由于手塚先生所画的角色是变形后的,所以至今为止仅用于识别人脸的识别器并不适用。结果我们不得不自己选择可以使用的面部图像,而这个数量并非1、2张,而是数以万计。于是这项工作便从和学生一起收集面部图像开始了。”

   

  工作内容极为繁杂。首先需要从《怪医黑杰克》、《火之鸟》、《铁臂阿童木》等作品中逐一提取面部图像,这需要大量的时间。在这项工作告一段落后,再开始着手于其他作品。

   

  倘若AI能与人类合作
 

  未来人类的创造性会有何改变?

   

  “机器的不懂变通让我们很痛苦(笑)。我们反复进行了试错,比如让AI学习手塚作品以外的角色的面部以及真人的面部,并通过将同一个角色左右反转来使它增强记忆。”

   

  为了提高AI生成的图像的精确度,迎山教授从多方面作出了尝试。对这次项目,他作出了如下的感想。

   

  “即使将来AI能够绘制漫画,我也不认为人类的创造力会变为零。因为漫画不仅有作者,还有读者。纵观漫画的发展历史,很多新的拟声词和对话框的表现形式被创造出来,但如果读者不接受的话,它们也不会存续。我认为这次项目也会发生同样的事情。多少工作将由AI完成,多少将由人类完成?我想这个标准总有一天会诞生。也许会是1万年以后,到那个时候,人类的创造性会变成什么样子?我表示期待。

   

   

  为了让AI学习手塚式角色而准备的,是手塚治虫留下的15万页的原稿数据。

   

   

  这些原稿在经过函馆未来大学的识别器识别之后,被分类并标记为“分镜”、“对话框”、“面部”、“身体”。为了提高生成的图像质量,团队进行了反复试错,如通过反转图像以增加识别张数,或只读取女性角色等,直到生成理想的图像。

 

  “迁移学习”

  为角色生成打开突破口

  

   

  栗原 聪
庆应义塾大学 理工学部 教授/电气通信大学 人工智能最尖端研究中心 特聘教授

  从庆应义塾大学理工学研究科毕业后,就任于NTT基础研究所、后担任过大阪大学产业科学研究所副教授、电气通信大学信息理工学研究所教授后至今。工学博士。喜欢的手塚作品为《森林大帝》、《蓝宝石王子》、《怪医黑杰克》,认为这些故事和设定触动了他的心。著有《人工智能与社会》(欧姆社)、编辑《人工智能学事典》(共立出版)等多部作品。最近著作有《AI兵器与社会未来 杀手机器人的真面目》(朝日新书)。

  使用AI生成黑白漫画属于首次尝试。对于我们,也是一系列未知的挑战

  在这次项目中,技术团队的课题是,如何从图片和场景中提取数据,以便AI学习手塚式风格,以及如何让已经使用数据学习了手塚式风格的AI,生成新的情节和图片。起初的策略是使用现有的技术来生成角色图像,但实际过程中却遇到了各式各样的难题。

  “这次用于图像生成的AI,可以通过输入庞大数量的脸部图像来学习‘面部’这一特征,从而生成并不存在却极其真实的人脸。最初只是单纯地让AI学习了手塚治虫所绘的角色。这可能是让AI生成漫画单色线条的首次尝试,对我们来说也是一个未知的挑战。”

  仅就结果而言,所设想的角色并未被生成,栗原教授表示这在“意料之中”。

  铠侠助力TEZUKA项目

  ”迁移学习“助力AI角色生成

  “我们也没有期望从一开始就能生成出完美的面部图像。但确实在这个像面部又不是面部的图像中,看到了一丝手塚式的影子。或许可以在这个基础上,再由人类来加工完成角色。当时可能也萌生过这样的想法。”

  由于手塚漫画中角色的正面镜头极少,因此让AI学习“手塚治虫式风格”是有限的。

  “虽然话是这么说,但我们使用的AI可以生成相当高质量的人脸,如果再不创造出点像样的东西,可就有点说不过去了......当时确实大家都怀揣着这样的想法(笑)。于是,在铠侠的帮助下,我们决定使用一种叫作迁移学习的技术,对通过数十万人脸数据学习的AI所获得的面部特征数据加以利用。”

  
 

  创造出无限接近

  手塚治虫的角色

  什么是生成式对抗网络(GAN)的深度学习

  
 

   

  角色生成的核心是一种叫做对抗生成网络的AI技术,俗称生成式对抗网络,它可以使AI通过学习“真实的样子”以生成尽可能逼真的图像。
它以“对抗”的方式进行学习,识判别生成数据与输入数据的接近程度,然后生成更高质量的数据,直到识别器无法将其与输入数据区分开来。
通过重复生成和识别的过程,可以输出与生成数据几乎一致的数据。这个系统最初是由铠侠用于提高半导体设计和制造品质上的,但在本项目中被应用于角色生成。
然而实际应用并没有这么容易,但这也是AI的乐趣所在。在“手塚2020(TEZUKA 2020)”项目中,将已经学习了手塚式风格的生成式对抗网络,进一步导入至2种类型的AI中来生成角色。得到了如下3个结果。

   

  最初提出的生成式对抗网络通过一次处理就能生成整个面部图像,因此细节的完成度不高。生成式对抗网络①通过从轮廓等粗略部分开始,阶段性地生成眼口鼻等细节部分的新方法,试图生成完成度更高的图像。
最初让AI尝试学习了约4500张图像后,得到了类似图像的生成结果,之后将已学习的图像进行左右反转,通过进一步学习反转后的数据,使学习数据达到了4倍左右,约1万8000张。由于学的数据越多,精确度就越高,项目因此取得了很大的进步。

   

  但这仍然不够理想。团队决定从头开始,只采用手塚漫画中的女性角色让AI进行学习。也许是因为女性角色图案较为完整,所以得到了较好的结果。之后团队还尝试了各种方法,如对混合角色图像进行学习等。

专题

查看更多
IC品牌故事

IC 品牌故事 | 三次易主,安世半导体的跨国迁徙

IC 品牌故事 | 开放合作+特色深耕,华虹的突围之路

IC 品牌故事 | Wolfspeed:从LED到SiC,被中国厂商围追堵截的巨头

人形机器人

市场 | 全球首家机器人6S店在深圳龙岗开业

方案 | Allegro解决方案助力机器人应用提升效率、可靠性和创新

方案 | 爱仕特SiC三电平方案:突破工商储能PCS高效极限

毫米波雷达

毫米波雷达 | 智能驾驶不可或缺的4D毫米波雷达技术全解析

毫米波雷达 | 有哪些热门毫米波雷达芯片和解决方案?

毫米波雷达 | 超百亿美元的毫米波雷达都用在了哪里?

0
收藏
0