人工智能好像现在能做很多事情。AlphaGo 能打败人类的围棋冠军,Google 旗下的 Deepmind 读唇的正确率还能达到 93.34%……但受制于它的思维方式,人工智能也有很多做不了的事情。
马里兰大学帕克分校最近的一项研究显示,人工智能在看漫画这件事上,似乎学起来很困难。
为了规避版权问题,马里兰大学教授 Mohit Iyyer 和团队用 1930 到 1950 年代的 120 万张漫画,并且把漫画里面的字都单独拿出来做成文本方便识别,利用总共 120GB 数据对现有的人工智能和人类做了一个对比测试。测试的内容是阅读前一格的内容之后预测下一格的内容。
结果显示,人工智能的准确率只有 30% 到 70% 左右,人类的数值大约是 84% 到 87%。
原来看漫画是这么有挑战的事情。
在测试之前,研究者准备的是能够识别真实物体照片的人工智能,然后把单张的漫画一张张喂给人工智能学习,目标是让它们认识这些画面之间的连续关系。人工智能们遇到的第一个问题是识别漫画中抽象化的人物和其他物体。
实际上,漫画除了画还有字,要看懂画面上画的是什么,需要分别理解画和字,还要加上对话框的位置,以及这些元素之间的相关性才能看懂。而且,不同作者之间的绘画风格差异非常大,这些作品之间的阅读经验可能不能互通。
同时,漫画和视频不一样,不同作者的分镜风格很不一样,在很跳跃的叙事风格下,每一格之间的关系可能非常微弱。人工智能需要非常概括的认知模式才能完成看漫画这个目标。研究结果显示,把单张画面和旧情节抽象联系起来的这种能力,目前还是人类专属的。
这种能力仰赖的是人类大脑中的常识和逻辑,以目前人工智能领域里流行的机器学习这种方法来说,它更适合解决专门的问题,比如下围棋、认人脸,看漫画这么有趣的事情还是交给人类来做好了。
本文转自好奇心日报 链接:http://www.qdaily.com/articles/34896.html