驾驭大数据 驱动企业创新致胜能量 智能应用 影音
工研院
member

驾驭大数据 驱动企业创新致胜能量

  • DIGITIMES企划

Uber运用大数据分析,每日实时更新热点地图,借此协助车主减少空载时间,顺势帮助乘客降低等候时间。Uber
Uber运用大数据分析,每日实时更新热点地图,借此协助车主减少空载时间,顺势帮助乘客降低等候时间。Uber

事实上,企业藉助信息科技力量执行商业决策,并非此刻才发生,过往已为人熟知的商业智能(BI)、数据采矿(Data Mining),然而如今在市场掀起阵阵波澜的大数据(或称巨量数据),却与往昔的分析技术有所不同,宜以不同的思维看待大数据应用价值。

早在2011年,知名的管理谘询机构麦肯锡(McKinsey),即已透过「大数据:创新、竞争和生产力的下一个领域」报告,清楚昭告世人,大数据(Big Data)将成为宰制竞争力高下的关键性基础,并跃居下一波赖以提振生产力、推动创新、创造顾客价值的支柱。

紧接着,在2012年于瑞士举行的世界经济论坛中,也揭櫫一份名为「大数据、大影响」的报告,强调过去数据被视为不甚有用的积累,但如今已成为一种全新的经济资产型态,亦是今后极其重要的生产要素,所以现在即是大数据时代的开端;而且更重要的,论及过往的实体生产要素,不管是厂房或机械设备,都会伴随使用次数的增加而折旧,然而大数据恰好相反,其价值反倒会随着重复利用而增长,帮助使用者掌握更多的线索、商机或趋势。

也许有人对于大数据时代的来临感到不解,多年以来,不少企业已经陆续布建了数据仓储、数据超市、在线分析处理(OLAP)、数据采矿、报表系统、仪表板、战情室系统...等广义的BI工具,也就是早就藉由IT来辅助决策制定,为何如今又迸出大数据这个新辞汇?它与过去的BI有何不同?事实上,前后真的大不相同。

旧方法难以处理的数据  即可称之大数据

姑且先撇开大数据的3V(Volume、Variety、Velocity)特性不谈,所谓大数据,蕴含了多种数据型态,包括交易记录(Transactions)、互动数据(Interactions)与观察数据(Observations);其中人们较熟知的部份是交易记录,通常意指由ERP、CRM或SCM所产生的高度结构化数据,例如ERP里头的采购明细、采购记录或付款记录,乃至于CRM里头的交易明细、客户接触记录、维护合约等等,并储存于关联式数据库系统,综观过去的各类型BI技术,分析的元素多落在这些范畴。

至于互动数据,则譬如是使用者点击流量、Web日志、社交互动与反馈...等等,意指人与物之间彼此的互动,抑或业务交流;有关观察数据,系由时下最夯的物联网所产生,不论是温度、湿度、压力、动作、RFID传感,甚至是手机当中的GPS芯片,都可繁衍出大量的观察数据。持平而论,环顾以往的BI分析,涉及互动数据与观察数据的机率极为有限,甚至可谓趋近于零,此乃由于,这些数据几乎都属于非结构化或半结构化性质,单凭这点,即能充分凸显BI与大数据分析之差异。

换言之,举凡人们接收信息、点击鼠标、浏览网页、在线购物...等各式各样的行为,都足以产生并累积庞大数据,因此不管在于数量、格式乃至传输速度,皆与传统BI所面对的结构化交易型数据大不相同。

然而若欲区隔BI与大数据,其实还有更加简单明确的指标。一是从技术观点来看,只要是传统的方式无法处理的数据量,都可视之为大数据,简单来说,企业的分析人员将所欲分析的数据汇入服务器的主存储器,如果因数量过大而摆不进去,就可把它当做大数据,接着寻求有别以往的新工具来予以处理。

企业欲将IT进化为DT  需仰赖数据科学家

另外,BI与大数据两种分析技术的出发点,其实也截然不同。有关BI,主要是用以处理已知的问题,也就是凭藉过往营运轨迹记录理出脉络,呈现于视觉化报表,藉以帮助高端主管制定下一步的商业决策,但综观整个决策过程,分析之结果,乃是居于辅助地位,赖以判断决策走向的关键因子,是来自于经营者的脑袋;然而大数据则是用于处理没经过事前定义的未知问题,其关键答案,埋藏在一堆看似无用的数据里头,并非任何人的脑袋。

比方说,企业经营者依据其经验与智能的累积,不假思索即预知产品品质的好坏,与公司营业额的消长,呈现正向关系,因而要求同仁运用BI工具,藉由过往数据描绘趋势图,从中深入探索可能影响产品品质的因子,接着研拟改善精进的方案;如今同样维持「如何促进公司营业额增长」问题不变,转而采用大数据分析方法找答案,则无需预先界定问题(例如先做好产品品质攸关业绩好坏的假设),由相关同仁从偌大数据洪流理出头绪,接着发挥创意巧思,设计出最有机会一击中的、提振业绩的好方案,而最终方案可能依旧围绕于产品品质,但也可能攸关销售人力配置、行销计划、库存管理..等等许许多多的可能性。

所以过去即曾有专家建议,企业实施大数据分析的理想做法,应是领域专家负责发问、或是提出大方向,至于定义问题、寻找答案等重责大任,则落在数据团队身上。但不可否认,欲提出正确且关键的问题,已然具备不低难度,后续再谈到如何界定问题范围,并尝试将无限的想像空间,收敛为有限空间,再从这个有限空间搜索答案,也同样具备相当难度;这些能量的养成过程,肯定比如何部署Hadoop分散式运算架构、如何写好MapReduce程序,还来得更为艰辛,同时也具有更大价值与意义。

大陆阿里巴巴集团董事长马云曾经说道,我们正在从一个以控制为起点的IT时代,迈向一个以激活生产为目标的DT(Data Technology)时代,这个移动的过程,绝非仅仅仗恃技术的升级,更重要的,乃是思想意识的重大变革。也就是说,将Hadoop、MapReduce甚或Data Mining等技艺练就得炉火纯青,充其量都只是培养IT方面的高手,顶多是孕育杰出的数据工程师,仍非对于公司深具价值的DT战将、或是数据科学家。

哈佛商业评论曾将数据科学家喻为「21世纪最性感的工作」,此话绝非无的放矢,因为展望未来,多数企业都需要这般人才,数据科学家愈齐备,就愈能协助企业将垃圾转化为黄金,进而挹注源源不断的创新转型能量,以致能够在虚实世界界线愈趋模糊之际,确使企业能稳定地朝向致胜的目标前进。

Uber及Airbnb  皆靠大数据打造创新利基

放眼全球,几乎所有引领风骚的成功企业,都离不开大数据,背后皆有一群人,有能力将大量数据转变为富含价值的金矿,无论是Google的查找结果、定向广告,Amazon的精准商品推荐,或是Facebook列出可能认识的好友,皆是拜大数据分析所赐。

除此之外,近年来「共享经济」概念响彻云霄,两家最常被引为相关经典案例的新创企业「Uber」与「Airbnb」,个个都深具大数据分析能量。以Uber而论,旗下车主与顾客的共同期望,便是缩短时间,车主想尽可能缩短空车时间,乘客则希望将等待时间降至最低,着眼于此,Uber的数据科学家悉心建构Location-based需求模型,将运算结果实时更新于热点地图(Heatmaps),帮助车主减少空载时间,也一并协助顾客降低等候时间,甚至未来还将进一步指引车主,可以提前到哪些热点进行等待,便能够载运到更多乘客。

至于Airbnb,不仅拥有旅游地、用户评论、社群信息、房源描述等等巨量数据,甚至还配置专责团队,负责汇集某些地点的人文、宗教或历史数据,再加上内部Discovery Team擅长使用自然语言处理与机器学习,得以深入洞察客户键入的搜索关键字,据此产生推荐结果;因此当顾客查找住宿地方之时,Airbnb的Location Relevance Model总是能精准提示最契合客户需求的住宿地点,可说是纯熟运用大数据的典型个案。