人工智能与一次性学习

林育中
2018-07-12
分享
Line

机器人如何按人的一次性演示依样画葫芦、达成相同工作目标，是今年AI一次性学习的重点。(图片来源：Pixabay)

一次性学习(one-shot learning)存在于人工智能(AI)领域至少有十几年了，去年又开始加温，今年实作的应用更令人惊艳。

一次性学习的源起其实是向人类学习，人类很多新的技能是在看过别人演示过一、两次后，就可以八九不离十的学上手，这当然不是发生在心智相对空白的婴儿身上。它的前提是已经学过一些工作技巧－术语叫先验知识(prior knowledge)，然后基于先前学的诸多工作技巧形成的知识架构，依他人演示一次而学得新工作技巧。

今年一次性学习的重要工作却是要机器人依按人的一次性演示依样画葫芦、达成相同工作目标。机器人的动作和人不同，怎样从人的演示学习执行新工作？这就要先建立之前所说的先验知识，这个步骤叫元学习(meta-learning)，这步骤还有个似绕口令的说法：学习怎样学习(learn to learn)。这阶段的目标就是要建立让机器人能从一次性人类演示学习新工作的能力，方法是透过人类演示一些结构相似的工作以及机器遥控操作深度监督学习，这基本上会建立人类执行工作与机器人执行工作中间的对应关系。

接下来就是从一次性的人类演示录影带学习执行新工作。这部份的困难在于，影片中可能会有譬如视角不同、背景不同等差异－术语叫域名转移(domain-shift)，这容易造成学习的混淆。解决方法叫域自适应(domain-adaption)－这又是一个佶屈聱牙的术语，基本上就是将从一组数据学习来的结果应用于另一组不同数据之上，属于机器学习中的移转学习(transfer learning)领域。

这个实作还没办法让机器人一次性地从人类的演示学习崭新工作，因为元学习时用的工作数据具有相似的结构，因此限制了学习全新工作的能力，但是这个实作却让人对AI发展有新的感悟。首先是这颠覆了AI需依赖大数据的想法，一次性学习基本上需要的数据不多，虽然在元学习的阶段可能需要数量较大的数据。另一个启示是对于人的认知与脑的结构、功能还有很多知识待探索，因而AI可以监镜真正智能继续发展的空间还大着呢！