云达
社团法人台湾电子设备协会
 

【专家观点】AI人才难找怎自强? 一解自动化机器学习之谜

【本篇精彩重点】

1.多数企业难聘雇合适人工智能(AI)人才,自动化机器学习(AutoML)是解方?

2.要了解AutoML,先了解机器学习(ML)的运行流程。

3.AutoML可完全取代人类知识?

4.需纳入考量却容易被忽略的因素?

沛星科技首席人工智能科学家孙民。 沛星

制造业转型,是近年来台湾既有供应链面临的重大挑战,也是台湾传统产业最应关注的议题。然而,近年全球制造业局势变化快速,对于制造业在生产与营运管理上形成莫大挑战,为了帮助制造业快速跟进最新变革浪潮,IoT与AI堪称智能制造的两大圣杯。

而近年来,ML在优化资料收集和分析工具的技术不断进步,不只在制造业,甚至在各个产业都能看到相关的应用,而现在一股新的趋势又趁势兴起,那就是自动化机器学习(Auto Machine Learning),简称AutoML。

因为一名优秀的资料科学家需要具备高度专业的技能组合,而能够符合条件的人才相对稀少,使得多数企业难以聘雇到合适的人才,而AutoML的出现能适时地降低对资料科学家的依赖。话虽如此,人们对AutoML仍然存在一些误解,其中最主要的一个就是认为AutoML完全不需要资料科学家的参与。

ML是一项非常强大的通用技术,相关应用数量十分惊人。要想了解AutoML能耐,首先要了解ML如何运行。

ML包含了以下几个步骤:首先,需要收集相关资料并进行资料清理,才能厘清能从这些资料中学到什么。下一步则是定义资料的特征表述,将放入模型并训练模型来最佳化精确度,以达到预期的目标。由于整体作业极为复杂,需要大量的人力参与,为了让ML发挥最大效益,需要一个训练有素的资料科学家团队来协助创建、应用和优化模型,并且参与在整个作业流程当中。

AutoML的终极目标是要让流程中的所有步骤都能自动执行,才能在提高效率的同时降低成本。若能顺利实现,AutoML可望在各产业中发挥不同用途,为社会的不同面向带来全面性变革。这便是近期备受瞩目的原因。

改变资料科学家的角色

然而,如同许多新兴技术所面临的处境,实际运用的状况往往比想象中更为复杂。

AutoML的好用程度取决于涉及的产业、资料的类型和模型的种类。在资料收集和清理方面,数码营销是可以从AutoML获益的领域之一。当顾客与公司的营销活动进行互动后,资料卷标将自动生成,成熟的AutoML工具会进一步针对这些卷标进行处理,确保没有杂讯或误差。

虽然其它产业较难从资料收集和清理中受益,但仍然可适用于自动化特征工程。举例而言,训练自驾车需要人们协助标注行人和停止号志;同理,训练医疗显像工具需要经验老到的医师协助定位肿瘤。不过,自从神经网络能以原始显像图自动建构特征后,许多资料科学家的工作量已有所减轻。

即便如此,还是必须提醒科学家们不要天真的使用AutoML。毕竟,无论想达到的目的为何,AutoML仍无法完全取代人类知识。相反的,将改变原先利用知识的焦点。

以营销任务为例,只有自动化机器执行的效果远比人为作业流程更有效率。通常这些适合自动化的流程是有高度重复性,或是有高度复杂性却有充足的资料给予支持。藉由自动化工具的协助,人们可以从重复性的任务中摆脱,并将知识应用到资料较少的领域。

因此目前的技术仍需仰赖资料科学家的支持。有人将这种人类与机器携手合作的方式,称为「半自动化机器学习(Semi-AutoML)」。对照作业流程中的实际执行模式,这样的称谓可说是名符其实。

权衡效益和成本

企业只要能够了解AutoML的能力和运行方式,便能在应用过程中有所获益。

由于这项技术不需要人类专家时刻参与其中,所以能更有效率地进行作业,且速度将大幅提升。只要善加利用,机器的表现不仅能超越人类,更能将人为错误的风险降到最低。

将流程自动化之后,机器执行所能产生的效益将达到人力所难以企及的程度。不过,其中仍有其它需纳入考量却容易被忽略的因素,也就是「成本」。

神经网络结构查找可说是AutoML领域中的「圣杯」,也就是编写出一套AI程序,以自动找出最能解决特定问题的神经网络结构。目前已有研究人员提出证据,认为确实有机会能使神经网络结构查找完全自动化(且超越人类执行相同任务的表现),然而,届时将需要庞大的运算量才能达到目的,甚至还得使用十几个CPU进行训练才足以应付。

总而言之,整体投入成本将十分可观。因此,任何公司若想寻求AutoML的协助,都应先针对可能的获益、财务以及时间成本进行权衡和评估,才能更明智地加以运用。

尽管AutoML能降低人为错误的风险,却无法根除。这项技术仅能最佳化人类设计的衡量标准,但是当衡量标准不正确时,所产出的模型自然也无法解决问题。这不仅会发生在AutoML上,人类也可能在采用标准ML时犯下相同的错误。

不过,如果人类有参与开发过程,至少能察觉模型行为的错误并协助改正。因此,虽然完全由机器执行作业流程能获得极高的效益,但若未经考量便直接排除人为参与,可能会在无意中导致更多潜在错误发生。

付诸实践

要维持人类与机器的平衡并不简单。企业必须评估人类高度参与下的可能利弊,并决定何者为最适合自身的商业模式。例如,让人员全程参与流程阶段的发展时,意味著模式将难以规模化,可同时,为了让整个流程自动化而逐一建立特定的模型,又会浪费太多时间。实际案例好比营销人员需要实时推出营销活动,因此往往无法等上太久。他们追求的是时效性,在最佳的时刻吸引到顾客的关注。

如今,最佳的解决方案往往是借助在某些特定领域采用AutoML的资料科学平台(如同前面所提及的「半自动化机器学习(Semi-AutoML)」)。藉由自动执行特定步骤,企业便能专心研究如何将运算量集中用在提高效率,而成果又不会因精准度降低而大打折扣。

以上建议不仅能协助营销人员了解AutoML的潜能,更能专注于AutoML能为企业成就带来的实质效益。否则,即使采用了这项技术,也只是徒有其表而已。

只要正确地运用AutoML,企业便能享受带来的众多好处,尤其是对营销人员而言更是如此。唯有确实了解AutoML的运行方式、涉及范围,以及对企业提供的支持,才能充分发挥AutoML最大潜能。

(本文作者为沛星科技(Appier)首席人工智能科学家孙民)

  •     按赞加入DIGITIMES智能应用粉丝团
更多关键字报导: 沛星 人工智能 机器学习