您的位置:首页>AI>

算法在大都会博物馆发现绘画之间的隐藏联系

人们常将艺术视为过去的最伟大旅程,巩固时空中的一刻。让我们暂时逃避现在的美丽交通工具。

有了无穷无尽的绘画宝库,这些来自不同时间和空间的艺术品之间的联系常常会被忽略。即使是最有知识的艺术评论家,也不可能跨越数千年的时间吸收数百万幅画作,并且无法在主题,主题和视觉风格上找到意想不到的相似之处。

为了简化此过程,麻省理工学院计算机科学与人工智能实验室(CSAIL)和微软的一组研究人员创建了一种算法,以发现大都会艺术博物馆(大都会博物馆)与阿姆斯特丹国立博物馆之间的绘画之间的隐藏联系。

受国立博物馆特别展览“伦勃朗和贝拉克斯兹”的启发,新的“ MosAIc”系统通过使用深层网络了解两个图像的“接近” 程度,发现了来自不同文化,艺术家和媒体的成对或“类似”作品。在那次展览中,研究人员受到了一种不太可能但相似的配对的启发:弗朗西斯科·德·祖巴兰(Francisco deZurbarán)的《圣塞拉皮翁The难》和扬·阿瑟琳(Jan Asselijn)的《受威胁的天鹅》,这两幅作品描绘了深刻的利他主义场面与令人毛骨悚然的视觉相似度。

CSAIL博士说:“这两位艺术家一生中没有通信或彼此见面,但他们的画作暗示着丰富的,潜伏的结构,构成了他们两人的作品。” 学生马克·汉密尔顿(Mark Hamilton)是有关“ MosAIc”的论文的主要作者。

为了找到两幅相似的画作,该团队使用一种新的图像搜索算法来发现特定艺术家或文化的最接近的匹配。例如,响应于有关“哪种乐器最接近此蓝白色连衣裙的绘画”的查询,该算法检索了蓝白色瓷小提琴的图像。这些作品不仅在样式和形式上相似,而且源于荷兰人和中国人之间更广泛的瓷器文化交流。

汉密尔顿说:“图像检索系统使用户能够找到语义上与查询图像相似的图像,作为反向图像搜索引擎和许多产品推荐引擎的基础。” “将图像检索系统限制为特定的图像子集,可以对视觉世界中的关系产生新的见解。我们的目标是鼓励与创造性人工制品的互动达到新的水平。”

这个怎么运作

对于许多人来说,艺术与科学是不可调和的:一种基于逻辑,推理和经证实的真理,另一种则基于情感,美学和美感。但是最近,人工智能和艺术有了新的调情,在过去的十年中,这种调情变得更加严重。

例如,这项工作的很大一部分以前集中于使用AI生成新艺术。有一个由麻省理工学院,NVIDIA和加州大学伯克利分校的研究人员开发的GauGAN项目。汉密尔顿和其他人以前的GenStudio项目;甚至是AI生成的艺术品,在苏富比以51,000美元的价格售出。

但是,MosAIc的目的不是创造新艺术,而是帮助探索现有艺术。谷歌的“ X分离度 ”是一种类似的工具,可以找到将两条艺术品连接起来的艺术路径,但是MosAIc的不同之处在于,它仅需要一张图像即可。它没有找到路径,而是发现用户感兴趣的任何文化或媒体中的联系,例如找到共享的艺术形式“ Anthropoides paradisea”和“ Seth杀死蛇,Hibis的阿蒙神庙”。

汉密尔顿(Hamilton)指出,建立他们的算法是一项艰巨的尝试,因为他们希望找到不仅颜色或样式相似,而且含义和主题相似的图像。换句话说,他们希望狗与其他狗靠近,人们与其他人靠近,等等。为了实现这一目标,他们在大都会博物馆和国家博物馆的组合开放访问集合中,针对每个图像探究了深层网络的内部“激活”。他们如何判断图像相似性,就是通常称为“功能”的这种深层网络“激活”之间的距离。

为了找到不同文化之间的相似图像,该团队使用了一种新的图像搜索数据结构,称为“条件KNN树”,该结构将相似图像组合成树状结构。为了找到匹配的对象,他们从树的“树干”开始,然后跟随最有前途的“分支”,直到他们确定找到最接近的图像为止。数据结构通过允许树快速将其自身“修剪”到特定的文化,艺术家或收藏品,快速产生对新型查询的答案,从而改善了其前身。

汉密尔顿和他的同事感到惊讶的是,这种方法也可以用于帮助发现现有的深层网络的问题,这些问题与最近涌现的“深造假”有关。他们应用此数据结构来查找概率模型(例如通常用于创建深造品的生成对抗网络(GAN))崩溃的区域。他们将这些有问题的区域称为“盲点”,并指出它们使我们对GAN的偏见有所了解。这样的盲点进一步表明,即使大多数伪造品可以骗人,GAN仍难以代表数据集的特定区域。

测试MosAIc

该团队评估了MosAIc的速度,以及它与人类对视觉类比的直觉之间的接近程度。

对于速度测试,他们希望确保其数据结构在通过快速,强力搜索简单地搜索整个集合中提供价值。

为了了解系统与人类直觉的协调程度,他们制作并发布了两个新的数据集,用于评估条件图像检索系统。一个数据集挑战了算法以找到具有相同内容的图像,即使它们已经使用神经样式转移方法进行了“样式化”。第二个数据集挑战了算法以恢复不同字体的英文字母。不到三分之二的时间,MosAIc能够一次从5,000张图像的“干草堆”中猜测出正确的图像。

汉密尔顿说:“展望未来,我们希望这项工作能激发其他人思考信息检索工具如何帮助艺术,人文科学,社会科学和医学等其他领域。” “这些领域充满了从未被这些技术处理过的信息,可以为计算机科学家和领域专家带来巨大的灵感。这项工作可以在新的数据集,新的查询类型和新方式方面得到扩展了解作品之间的联系。”

免责声明:本文由用户上传,如有侵权请联系删除!