巨量数据与商务营运:从商管与技术的双面观点
巨量数据如今已经成为最新的竞争趋势,台北商业大学信息与决策科学研究所数据科学应用研究中心(Data Science Applications Research Center)主任邹庆士认为,原因在于数据数量汗牛充栋,所以也让整个世界之间异常通透,影响范围无远弗届,企业必须要随时留意那些业务受到巨量数据的影响。
如健康照护服务及定位数据如果加以混搭,虽然可以提供更进一步的价值,但如何说动使用者开放或分享,其实需要更细致的说服过程。此外,巨量数据分析所呈现的世界,客户需求会更加清晰,但市场区隔也会变小,产品及服务必须要更加定制化。
邹庆士认为,许多蒐集数据的工具或技术,如传感器、通讯装置、解析软件的价格不断下降,形成物联网与数码油田的世界绝非梦想。但数据分析技术愈精细复杂,决策考量虽然也会更加全面,可能遭遇的风险也会变得比较小,但邹庆士指出,就连美国也缺乏分析人才,而且在扩大巨量数据管理的同时,会不会反而取代原来的管理,也是必须注意的课题。
尽管如此,巨量数据分析仍会为企业带来许多机会,可以洞察出原本被隐藏的信息,进而做出更明智的决策。例如消费者在购物网站上的点击串流,与社群网络信息结合起来,会形成更可靠的推荐品项;或是蒐集各地天候与土壤数据,以评估地域特殊性层级的农作物风险等。
邹庆士认为,如果能将数据分析融入作业流程中,甚至可能帮助企业进行自动化决策。如麦当劳的高速影像解析系统,可以直接提供管理者所需要的作业信息,随时进行调整,而不用再像过去一样,依赖色纸与卡尺来控制产品的品质。
透过巨量数据分析技术,更可看到过去可能看不到的信息,如电邮、保证卡、客服电话录音、医嘱及来自社群媒体及政府的公开数据等,都可能为企业带来更多的商业价值。
但企业的商业模式,也会因为巨量数据分析而有所改变。邹庆士指出,企业要开始思考,可以通过什麽方式或途径来赚钱,如何运用巨量数据产生差异化的产品或服务,例如企业是否能够依天气型态、付款量与热销商品类别,协助供应商适时发现真正的需求。
从目前云端或巨量数据有关的创新应用案例中,邹庆士认为解决方案的发展趋势有下列几点,首先就是有能力整合结构性及非结构性数据,尤其是非结构化数据,重要性正在与日俱增,但由于不是每个使用者都熟悉工具的使用,因此应用界面一定要做到简单化,而且要能善用开放数据及群众外包(Crowdsourcing)的资源。
应用巨量数据的产业类别,目前以零售、健康与医疗、城市与运输、制造业、金融服务业为主,邹庆士认为,台湾如果想要发展巨量数据服务创新,当务之急就是要设法培育数据分析人才及导入云端服务。
邹庆士强调,企业如果想要建立与巨量数据相关的商业模式,一定要先建构出传递数据的网络,以适地适时的传递数据,并加以整合、交换、重组。重点在于何种商业模式适合企业当前的组织,才能迎向下一波潮流的康庄大道。
企业如果想要运用巨量数据建立商业模式,邹庆士认为,在解决方案的使用技术方面,储存与实现技术都要兼顾,而且储存数据的技术最好能够朝向分析的方向迈进;其次是数据类型,虽然非结构性的数据类型居多,但仍需要设法与结构化数据结合,因为许多演算法只能处理结构化数据;最后则是要有更多的数据解析任务类型,包括叙述性统计分析、(实时)预测建模、集群、推荐系统、声纹分析及在线广告等。
邹庆士认为,企业要建立巨量数据商业模式,必须要与许多合作夥伴共同承担风险,而且形成规模经济后,才能掌握相当的自主策略控制与更大的收益潜力。
至于巨量数据业务的的获利方式,往往需要取决于数据的定制化程度,以及分析出来的数据与客户的关系,才能让客户掏钱出来。如何做好数据建模,变得相当重要,需要融合统计、机器学习、作业研究(运筹学)等各种领域。
以文字数据探勘的过程为例,数据分析的过程常常需要相似性衡量,依此找出真正有价值的信息。邹庆士指出,数据科学的通用手法,除了要能明确说明理论与模型外,假设较少的机器学习的领域也需要加以注意。而模拟与数学规划是常用作业研究工具,建立模型规格,并运用模型产生数据、预测值或推荐。
但邹庆士也强调,巨量数据其实也潜藏着许多虚假与危机,所以一定要做好数据前处理的工作,以及慎选适合数据性质的模型进行分析。这些要务先要有优质、开放及灵活的工具,才能具体实现各种创意,并做到跨领域且抓住知识的源头,才能深入数据价值萃取的核心。
邹庆士最后强调,企业只要「一」心向着数据理解的根本要务前进,精通至少「两」种弹性的分析工具,掌握统计、机器学习与运筹学等「三」大类模型,就可大步迈向数据驱动的决策厘订新纪元。