美商敏博系统存储股份有限公司
台湾技术顾问
吴铭哲
英特内软件股份有限公司
专案二部经理
潘慧君
痞客邦
研发中心总监
林瑞男
大数软件有限公司
CEO
丘佑玮
我们提供本研讨会主讲者同意授权的演讲档案,欢迎参与来宾下载。
如果遇到档案无法下载,请检查您的电脑是否有以下状况,而造成下载问题:
毋庸置疑,尽管几个年头过去,「Big Data」热度依旧不减,称得上是当今企业不容轻忽的显学。究其主因,乃在于这门经常翻译为「巨量数据」或「大数据」的课题,委实创造了许多让人动容的传奇故事,包括老生常谈的Target预测女性消费者怀孕、Walmart发现啤酒与尿布的销售量呈现高度正相关,以及Netflix藉由大数据分析观众收视习惯,决定纸牌屋剧情走向,进而创造收视热潮。
影响所及,举凡精准行销、精准医疗、智能制造、智能交通、智能家庭、智能建筑、智能社区、智能城市等伟大题材,都拜Big Data画龙点睛所赐,因而漫天飞舞。
撇开前述若干流于高远的意境不
信息爆炸时代来临,网络与社群媒体大量涌现,使传统媒体的经营益发困顿。5年前,老字号华文媒体联合报系有监于媒体生态转变,不宜眷恋旧有成功模式,决定找新出路,积极推动数码汇流新服务概念,希望深入了解用户行为偏好,进而做到「任何时间、任何地点、合适载具,在同一载具上,可精准提供用户需要的服务」,让自己转型蜕变为「精准媒体」。
这个创新求变愿景,驱使联合报系踏上大数据(Big Data)之路。5年后的今天,该报系拥有联合报、经济日报、联合晚报、Upaper等4份为人熟知的台湾纸媒,及联合新闻网、联合知识库、联合影音网、udn读书吧等众多数码媒体,亦先后孵化其他多元事业如udn买东
持平而论,大数据非此刻才诞生的新议题,经过几年激荡延烧,各产业皆已认同其运用价值,亟思加以导入,希望让行销与业务拓展更加精准。但以往多数企业碍于资源不足,加上工具不完善,导致相关应用推动不顺;直至近两年,愈来愈多企业懂得借力使力,纷纷评估采用公有云服务,以化解种种难题,此风潮可望在2017年达到新高峰。
伊云谷数码科技云端事业单位总经理林仪指出,大数据之所以难为,一方面因为涉及大量运算,需动用众多服务器,对企业可谓财务负担,尤其当运算资源不足以应付临时性分析应用需求时,更令企业不知所措,另一方面,企业想做好大数据分析,需要延揽数据科学家,建构许多数据模型,并针对诸多工具进
不可讳言,Big Data分析议题不仅火热,且已延烧到各产业。就一般人认知,积极投入此道的用户,要嘛是如同商场等钱多的单位,要嘛是犹如制造业等自动化程度较高的单位;但事实上,两大族群以外的业态,即便经费与资源相对不足,照样有大数据应用需求。
英特内软件知识策略处知识长赵孝伦指出,多年前,为了提供农业生产、食品加工、冷链运输、连锁代理等一站式服务,藉由生产端到消费端层层把关,使民众吃得安心健康,该公司与其余4家资服业者齐力打造食品安全供应链解决方案,成立「产联国际」公司,推出「登就保」业主自我管理系统(旨在建立加工食品追踪溯源机制),使英特内开始与食品业大数据结下不解之缘。
工欲善其事,必先利其器,任何人要挖掘Big Data背后涵义,都必须懂得运用一些程序语言,例如深受数据科学界喜爱的R与Python,即是不可不识的关键项目。
回顾5年前,台湾企业或学界对这些大数据程序语言所知有限,症结在于英文界面产生学习阻碍;为此一群有志推动大数据、数据科学商业应用的人,决定推动汉化教学与培训工作,遂在2012年成立中华R软件学会,并在隔年(2013)成立台湾数据科学与商业应用协会。
前述两会,算是台湾最早设立的Big Data推动组织,而国立台北商业大学信息与决策科学研究所教授暨数据科学应用研究中心主任邹庆士博士,同时担任两会的理
今时今日,基于第三平台衍生的应用主题,着实多不胜数,但不论是物联网、工业4.0、智能电动车、智能家庭…等等看似型态互异的应用,背后皆需高度倚赖大量数据蒐集、整理与分析;此乃Big Data题材持续发酵多年,迄今热度不减的原因所在。
日立数据系统(HDS)台湾分公司技术经理梁万宇指出,以往HDS在日立集团的角色定位,尽管已偏向IT基础设备的提供者,但侧重于储存系统一环,尔后集团着眼于第三平台崛起,创新转型的浪潮势不可挡,单凭储存一块不足以涵盖总体需求,故HDS顺势蜕变为含括更多元软硬件工具的IT基础供应者,也意识到Big Data重要性,于两年前购并Pentaho,补强大数
深究台湾中小企业推动跨境贸易的过程,往往因为遍寻不到新买家,及不知如何提升询单量、开创新业务、强化升品牌曝光度,因而坐困愁城,将台湾外贸推向连续走黑的低迷氛围。
为此,阿里巴巴国际交易市场(以下简称「阿里巴巴B2B」)在去年(2016)偕同生态圈夥伴共创「台湾外贸生态圈」,希冀阿里巴巴B2B之于全球化平台及大数据优势,辅以各夥伴分别在跨境物流、通关、金流、电商人才培育媒合等方面的能量展现,让中小企业不再孤军奋战,而将彼此优秀产品与服务凝聚在一起,共同迎战全世界竞争对手。
具体而言,所谓的「台湾外贸生态圈」,里头包含了一环、一圈两大精髓,「一环」意指跨
毋庸置疑,包括大数据(Big Data)、人工智能(AI)、机器学习(Machine Learning;ML),乃至深度学习(Deep Learning;DL),都是当今热明显学,伴随这些议题相继引领风骚,不仅造就了许多颠覆市场的独角兽企业,也可望为百年企业注入新的DNA,彻底改善竞争体质。
换句话说,无论新创公司或老牌企业,只要真正进入数据分析之堂奥,都可望从中挖掘致胜线索,洞见未来趋势浪潮,获取源源不断的创新养分;因此包括Big Data、AI、ML或DL等泛数据科学的技术项目,不管问世时间长或短,亦不管先前发展态势是快或慢,至少在此时此刻,甚至是今后5年、10年,它
从过去「巨量数据」,直到现在「大数据」,不论辞汇如何演变,Big Data发展力道始终不减,愈来愈多企业也坚信,只要善用Big Data,不管想要降低营运成本、增裕收益来源,所有美好事物都可望手到擒来。
因此Big Data的触角已扩张到各个垂直领域,举凡制造业的工业4.0,金融业的金融科技(FinTech),医疗业的精准医疗,零售业的O2O全代理,种种新的商业模式,都需倚靠大数据分析来支撑。
但不可讳言,企业想真正从Big Data淘金,绝非一蹴可几之事,首先需要订定明确目标,知道自己想要解决什麽难题,或满足什麽需求,此厘清所需蒐集数据范围,据以打
在2007跨年之际,大陆知名网红罗胖,说了一句发人深省的话,每个人的时间只有固定24小时,消费者为何要有限时间分配给你?故时间已成为各家企业争相抢夺的稀少资源,而对于行销工作者,时间尤其是最大的敌人。
电通安吉斯集团台湾集思总经理夏雨农表示,身处动态竞争时代,企业必须不断跟内部自我竞争,及跟外部市场竞争,因此需要借助大数据分析找出关键洞见,藉以改变竞争力;决胜之道有二,一是对内,合理支配自己的时间,二是对外,实时掌握消费者关键决策时机。
欲展现大数据价值,背后亟需一个闭环架构予以支撑,以「数据驱动」为起点,先藉由集中化数据回答明确问题,接着进入「大数
大数据服务许多企业都想导入,但当企业钻研愈深,就会发现大数据并不简单,特别是应用情境变化莫测。每秒20万笔Request,明天可能就飙升到400万笔。今天靠着批次处理就已足够,明天却需要做实时串流分析,才能满足效能需求。面对类似的问题,企业常难以适时应变。
各种大数据应用场景,所需运算速度、储存空间、处理技术都不同,企业实在无法一一追逐,此时公有云服务就是很好的寄托。伊云谷数码科技资深解决方案架构师江蕙芸指出,该公司代理的AWS(Amazon Web Services),因应各式各样大数据应用,提供相当丰富的工具,包括用来处理数据转换(ETL)的Amazon EMR,免伺
现今企业蒐集到的数据,多经由人工程序(如Key-in)产生,展望未来随着物联网、工业4.0之发展,分分秒秒都将涌入由机器产生的数据,且数量愈趋庞大,使数据来源益发繁杂,若企业未能建立有效混合不同数据,唯恐阻碍大数据分析应用进程。
日立数据系统(HDS)顾问陈建玮指出,当前企业普遍存在两个数据世界,一是以交易数据、客户基本数据为主的结构化数据,企业通常运用现有ETL(萃取转换加载)工具,将这些数据汇入数据仓储,再进行商业分析,整段历程耗时且辛苦。
另一世界是基于网络、社群媒体或地理位置的非结构化数据,企业往往利用现有工具,将数据整理后汇入NoSQL
不可讳言,论及大数据应用历程,不管数据的读取或写入,都亟需良好的I/O效能支撑,一旦效能不彰,恐让整体应用价值大打折扣;因此凡是欲推动大数据的企业,为了避免败笔出现,都必须扎稳基本功,全力优化I/O效能。
但可惜的是,无论SAN或NAS等传统储存技术,皆有不短的发展历史,凭藉早期设计的架构,能否因应Flash、云端或大数据分析等不同新元素的加入,依然达到最佳化效率?确实值得商榷。
有监于此,创始于2008年的美商敏捷存储系统(Nimble),便以消除储存效能瓶颈为初衷,希冀藉由突破性技术发展成果,有效运用Flash特性,另搭配奠基于云端的人工智能分析
对经营百货、量贩零售、连锁加盟店或电子商务的企业而言,不时面对为数庞大、忠诚度未必很高的顾客群,如何让广大顾客愿意在自己的场域消费,甚至扩大消费规模,无疑是一门不得不做、却不易做的苦功,故推动巨量数据加值应用的迫切性很高;但事实上,需要做大数据的行业不仅止于此。
英特内软件专案二部经理潘慧君指出,以其深耕的团膳市场而论,同样亟需实践大数据。她说,几年前英特内着眼食安事件不断,于是植基于该公司Dream Maker开发工具,打造出贯穿农业生产、食品安全制造、冷链物流、营运管理、餐饮连锁、食品安全云等环节的「食品一条龙」解决方案。
尔后英特内拓展应用触角
毋庸置疑,包括物联网(IoT)、人工智能(AI),都可谓当今显学;深究它们之所以备受关注,在于不仅能解决诸多社会挑战,更有助强化产业竞争力,终至实现一个安全且安心的价值社会。
台湾恩悌悌(NTT Taiwan)资深经理森一浩指出,NTT集团基于前述愿景,近年持续加码推动大数据,一方面发展IA(Intelligence Amplifier),旨在提升人类的能力,二方面发展AI,设法借助科技模拟人类的智力与思想,帮助人们解决更多问题。
针对AI,NTT已推出corevo平台,主要研究方向含括「助理(Agent)-AI」、「心动(Heart-Touchin
毋庸置疑,对于社群网站、内容创作平台,乃至其他型式网络服务业者而言,若能善用大数据,即可望增收益来源、提升作业效能、优化使用者体验,重要性不言可喻。因此一向自许成为台湾「生活百科全书」的痞客邦(PIXNET),对大数据分析着力甚深。
痞客邦研发中总监林瑞男表示,PIXNET收集的大数据,涵盖查找、浏览、分享、按赞、留言等网络行为数据,其将累积的大数据汇整、分析、归纳后,运用至站内系统的广告推送、行销活动、社群商务各种面向,致力创造出更好、更精准的服务。
林瑞男接着说,所谓社群行销与大数据的关联性,主要发生在4个关键项目,分别是族群轮廓、族群标签、声
社群媒体的兴起,使信息的传递更加无远弗届;此一发展态势,对于从事公关或行销工作的人,影响可谓重大,只因正所谓水能载舟、亦能覆舟,如果善用社群媒体,固然有助创造行销价值,但相反的若是处理不当,唯恐造成公关危机,比方说近期包括某某求职交流平台、某某烘焙坊,以及某某连锁咖啡店,都因而吃上大亏。
大数软件公司CEO丘佑玮指出,时值「后真相」时代,社群媒体是一个典型的同温层,大家乐于在里头建立自己的世界,不同的世界,诠释与解读真相的角度都不一样。你只要合乎他们的喜好,你就是网红,但哪天你不慎惹怒他们,就可能发生公关危机;而且即使是再小的声音,都可以让危机在网络世界快速散布。