
随著摄影镜头的普及以及安全防护的需求,近来人脸識別相关技术成为产业界关心的对象。搭配运算速度的提升、深度学习技术的突破、以及许多使用者端、企业端、政府端各种实质应用情境,也触发除了指纹、虹膜等生物特征識別之外的产业机会。
人脸識別的定义常有许多混淆,一般是为了了解拍照的目标为何人。举例来说,进来银行的人是谁,如果直接可以識別,我们会有多几秒的时间可以知道他是VIP吗?黑名单?喜欢什么样的商品?该找谁服务呢?
但是也容易与其他技术混淆。例如人脸属性侦测,目的是为了了解标的年龄、性别、人种、打扮等,用途在于购物安全(如自动贩卖机的年龄限制)、目标群众大致统计等。
另一非常类似的领域为表情侦测:区分微笑、严肃、生气等表情,可以用于客服或是使用者满意度分析;目前驾驶安全技术上,也会有驾驶打瞌睡、不专心等透过人脸判断的技术。
人脸識別核心可以大致区分为两个问题:人脸确认(face verification)以及人脸识别(face identification)。前者的定义主要是给两张人脸,必须回答是否为同一人,例如自动通关时扫描护照,同时比对摄影以及官方人脸數據;或是iPhone解锁等安全确认情境。
人脸识别主要是在大规模的人脸數據库中(可能每人有一到多张)照片,找出提供的照片是否在數據库内?是哪一个人?警政的人脸查找、安全监控、或是进出管制等,大多属于这个范畴。
虽然两个问题看起来类似,但是后者较为挑战,当數據库内需要识别的人变多时,比对速度会变慢、特征值(表示人脸的高纬度數據)间会大大的混淆。
識別的信號来源也不局限于2D的人脸照片,包括大家已熟知在手机上的3D点云、走路的姿势(声音)、甚至是在空间移动对Wi-Fi信號的影响等,都有不同的应用。
这几年精进的人脸識別技术早已跳脱早期仅限安防使用的局限性,并且看到原本在云端的功能,逐渐落地到设备端。例如具有識別功能(自动开锁)的门铃、利用人脸来提供个人化服务、广告内容、存取功能、开关设备等。
诸多应用发现,人脸識別更需要软硬整合,如光线变化时如何自动调整镜头硬件?識別用的影像(视讯)该如何压缩?我相信在智能应用转型的契机,对于产业界也是另一个相当大的机会!