主持人:“我问一个外行话,如果机器都无法准确识别对象怎么能去寻找它存在于……嗯,所谓时空结构中的信息呢?”
宋教授:“你这个问题提得非常好。就像照片里的小猫,你是先知道什么是猫,再去找猫在哪儿,还是先知道猫在哪儿,再去识别什么是猫?这就是一个鸡生蛋蛋生鸡的悖论。目前我们的神经科学和生理学知识尚无法解释人类的认知过程是如何发生的,更不用说教会机器了。于是我们采用了另一种思路。”
主持人:“这听起来就像是推理小说啊。”
宋教授:“呵呵,这个比喻有意思。我们是这么做的,从语义上给定一个对象,通过对接外部数据库去抓取相关的信息,包括语义和图像,并按时间序列构建起意义连续体,然后我们把真实的对象摆到机器面前。比如说,一只猫,机器会在捕捉到的动态画面与意义连续体之间寻找可能的流形映射,当它确定两者之间能够建立映射时,也就是说它‘认出’这只猫时,就会‘咔嚓’一下,按下快门。当然这只是个简化的比喻,背后有许多艰深的算法,我们希望以这种倒推方式找到提升机器识别能力的办法,它更多的是一个数学上的问题。”
主持人:“听起来蛮有意思的,那怎么会想到把这项技术从实验室里带到CCES呢?”