巨量数据即将进入应用实作层面 智能应用 影音
Microchip
ADI

巨量数据即将进入应用实作层面

  • DIGITIMES企划

回顾过去的两年,「巨量数据(Big Data)」可谓IT业界最炙手可热的话题之一,热门指数堪与云端运算、移动化等量齐观;然以往众人初次碰触此议题,难免会把焦点置于信息处理层次,展望后续,即将进入知识应用的务实层面。

从2012年开始,Big Data声势跃起,成为各大报导、专题、评论、研讨会、论坛、研究报告争相簇拥的热门题材,伴随此一洗礼,多数企业对它的认知,也从原本的一知半解,变成如今的兴致勃勃,体认到这确实是一门炼金术,有助于企业挖掘出先前隐含在各个角落、却从未善加利用的大量信息,从其中淬炼出知识与智能,致令企业茅塞顿开,获取赖以创新致胜的关能量。

由此观之,巨量数据分析应用,实为一帖帮助企业蜕变的灵丹妙药,也触动了一股足以扭转市场优胜劣败的活水,也就是说,愈能从巨量数据里头看出端倪,并具体落实在商业决策的企业,即使原本只是屈居中后段班的公司,也能无惧于列强环伺而杀出重围,一跃成为市场领导者;因此,巨量数据的爆红,绝非人为刻意炒作,背后真的有诸多硬道理。

但话说回来,仔细咀嚼巨量数据分析技术的内涵,某种程度上,与过往广获企业采用的在线分析处理(OLAP)、数据探勘(Data Mining)等商业智能(BI)技术,颇有神似之处,既然已有BI,又何以需要再多出巨量数据这一门功课?事实上,若以巨量数据3V特性当中的「多样性(Variety)」作为基准,再套用大家都常听闻的80/20法则,便可窥见其间差异。

环绕于企业营运环境的所有数据洪流中,以往为IT人所擅长处理的,充其量仅止于约莫20%占比的结构化数据,而过去的BI分析范围,都落在这个区间,另外80%更为大量的数据,则散落在文字、邮件、网页、声音、图片、影像、日志档(Log)…等包罗万象且散居四处的非结构化数据,这些素材,以往并无法有效加以分析处理,因此形同「垃圾」般遭致淹没,殊不知有许多攸关企业营运绩效浮沈的线索,都深埋在这些非结构化数据之中,只顾及20%结构化数据,反而流于冰山一角,看不出玄机;因此巨量数据技术的现身,便足以帮助企业明察秋毫,让过去一些单凭BI无力挖掘的失落宝藏,得以重见天日。

制造或医疗业CIO 可望因巨量数据得利
此一趋势的成形,对于企业CIO无疑是一大契机。主因在于,针对服务于诸如制造业、医疗业等行业领域的CIO,由于企业营运绩效的好坏,主要取决于制程、研发、医术、医疗仪器等关键,IT部门虽说与这些核心命脉不无关联,但充其量仅位居后援角色,其在服务机构的影响力,并不如金融、电信等领域的CIO来得显着,影响所及,CIO很难跻身决策核心,也无法对企业挹注更大贡献,然而有了巨量数据分析这道利器,CIO即可化被动为主动,凭藉创新领导者的角色定位,引领商业创新、产品开发、生产制造、市场行销、客户服务等…各项商务运作之革新进化,从而促使IT团队的地位与影响力大跃进。

面对难能可贵的契机,许多IT主管不免怦然心动,亟欲尽速在企业内部推动巨量数据应用;但IT人终究是IT人,总习惯Bottom-up角度来解读新的技术与应用,于是乎,只见CIO要求旗下子弟兵,开始钻研过往不甚熟悉的Hadoop、MapReduce、NoSQL…等技术项目,也开始评估进大量平行处理(MPP)系统、In-Memory数据库,心想一旦搭建起巨量数据分析平台,有了武器后,于内部探索现存的Big Data究竟有哪些,接着再思考这些Data该怎麽运用,殊不知这般进取模式,恐陷入莫大迷思,最终极可能一事无成,徒然增添一些大而无用的IT配备,惹来投资报酬率的非议。

如此一来,IT团队仍无法对于企业做出更大贡献,导致仍然屈居救火队角色,其地位及影响力并未提升,而企业亦与巨量数据趋势潮流渐行渐远,无力获取创新致胜的养分。

从制高点找应用题材 避免沦于技术本位
那麽应该如何是好?首先应当从Top-down角度来看待巨量数据应用,一方面CIO不妨试图站在企业经营的制高点,认真检视企业一路走来的过程中,有哪些事情,是一直想做、却始终做不好,甚至是做不到,即可将之视为阻碍企业持续成长的最大路障,亟需加以清除,接着便将这些事项列为推动巨量数据应用的优先题目,有了题目后,再来思考应当汇集哪些数据、执行哪些分析,最终才进入技术与系统的评估阶段,如此才不致陷入本末倒置的失焦窘境。

其次,IT团队亦需认真研读各项巨量数据应用案例,从中汲取前人的智能结晶,将之转化为有助于增强企业营运动能的灵感,再透过脑力激荡产生不同题目。与此同时,IT与业务部门的互动合作模式,也有亟待检讨与转变的必要性,只因过去长期以来,特别是制造业或医疗业,IT部门都是被动接收业务部门传递而来的需求,根据这些需求着手部署所需IT资源,并产制相对应的应用程序,等到做出初步成果后,再由原本提案的业务部门验收成果,检视是否合乎预期,但业务单位并非技术本位,很难在一开始把需求说清楚,导致双方出现认知落差,因此IT部门所提供的成果未若预期,只能勉强接受,长此以往,企业本该建立的竞争力,就这麽遭到蹉跎、延宕,因此进入巨量数据时代,IT人员应自许成为商业顾问,必须预先掌握商业脉动、探测风向球,主动帮助业务部门设计适当的Use Case,而非被动接收指令。

在此前提下,某种程度,IT团队就像是企业内部的创业者,不断发想适合的发展题目,致力创造几个Pilot run,先做出一些成功案例,等到展现成绩后,不论业务主管、营运长、总经理、董事长甚至整个董事会,才会认同巨量数据确实有其价值,后续才能大刀阔斧地迈开步伐。

但不可讳言,从题目发想一直到概念验证(PoC),不是一群人闭门讨论、少盘推演,就能获得结论,仍必须依附在适当的技术平台,进行必要的实作,才足见真章,其间难免又牵扯到鸡生蛋、蛋生鸡的问题,假使企业先投资引进了平台,最终又证实概念并不可行,而任凭公司上上下下绞尽脑汁,又想出不更好的题目,仍可能导致相关投资效益趋于低落。

值此时刻,CIO不妨善用外部厂商的力量,利用厂商提供的资源来推动PoC,如此便可在做出重大采购决策之前,预先判断此一投资的必要性与合理性。但不可否认,放眼现今市场,与巨量数据分析相关的解决方案,多局限于少数大厂,不仅选项有限,且个个要价不菲,就连代理夥伴本身都未必有能力部署相关产品,连带导致企业借测的难度不低,所幸已有若干业者意识到这个问题,开始着手投资成立巨量数据体验中心,并预先针对不同产业需求,设计不同的模拟测试情境,帮助企业进入Big Data初体验,诸如此类的资源,颇值得善加运用。

当然,由于巨量数据议题火红,厂商也开始推出愈来愈多富含实用性的工具,IT人员亦应时时留意相关信息。举例来说,有些厂商提供一种精通数十种语言的探针,以利用户推动社交媒体的舆论及情感分析,也获得若干从事代工业务的制造业者采用,当任何新品推出市面,便随时观测消费者对此产品的好恶走向,万一察觉消费者已然酝酿埋怨情绪,便能抢先在客户有所动作(例如要求更换制程或零件)之前,尽速展开因应对策,以避免后续的订单流失。