运用开放数据与大数据 启动高值化新创事业
环顾全球各国,若针对政府开放数据指标之评比,台湾已被英国开放数据基金会评定为第一名,此乃不争的事实。
细究台湾之所以击退地主国英国而夺得冠军,最主要的关键,乃是能够在Global Open Data Index评比的13项指标中,拿下了多达9个第一,分别是「国家统计」、「地理图资」、「立法规范」、「公司登记」、「政府预算」、「污染物排放」、「采购招标」、「选举结果」与「水质」;至于其他4项指标,台湾则在「天气」名列第7,在「政府支出」排名第8,在「邮递区号」排名49,在「土地所有权」名列第53位。
而形成前述各项评比的分数,则取决于9项开放程度权重公式;换言之,举凡数据的存在与否、数据可否被公开取得、数据是否上网、数据格式是否支持机器读取,乃至于数据是否有公开授权等等重要项目,都是台湾政府赖以争取高分的关键。
听闻此信息,相信不少民众与业者备感惊讶,因为他们过去不见得关注政府究竟开放了哪些数据,也错失了善用开放数据、创造加值效益的良机。然而正所谓亡羊补牢、为时未晚,此刻仍是端详与厘清政府数据开放内容的好时机。
政府数据开放平台 公开近1.5万笔数据集
截至2016年2月1日为止,经由「政府数据开放平台」(data.gov.tw)显示,迄今开放的数据集总数达到14,252,其中「原始数据」以11,404笔位居绝对大宗,接着依序是「系统介接程序」(346笔)、「移动化应用软件」(9笔),以及「其他」(2,873笔);上述9笔移动化应用软件,含括了「环境实时通」、「学名书写形式校对工具」、「2016年度医疗药品基金附属单位预算案」、「宜兰县人工空气品质监测站基本数据」、「法务部全球信息网_组织架构-法制司」...等等项目。
依据主题分类,以「政府统计」占2,380笔为最多,「政府支出」、「政府预算」各以千余笔分居亚、季军,其余不管是「生活品质」、「观光旅游」、「艺文活动」、「生活地图」或「防救灾」等项目,内含数据集笔数都尚未超过300。按服务分类,目前由「公共信息」(9,809笔)呈现遥遥领先态势,「生活及安全品质」(1,166笔)、「投资理财」(1,156笔)则分居二、三位。
观察这些开放数据的贡献者,若以中央部会而论,法务部以开放1,797笔数据集居冠,其余已经建立逾千笔开放数据实绩的单位,尚包括财政部(1,472)、经济部(1,341)与金管会(1,033);若以地方政府来看,则由台北市挟1,790笔成绩领先群雄,但其余县市皆未突破500笔,形成颇为巨大的落差。
不动产买卖实价登录 为最受欢迎的Open Data
如果以浏览次数多寡,据以排序热门数据集,则由「不动产买卖实价登录批次数据」以90,030次浏览拔得头筹,「劳工体格及健康检查认可医疗机构」以71,043次居次,其余热门项目还包括了「原乡旅游路线」(54,017次)、「CNS11643中文标准交换码全字库(简称全字库)」(50,906次)、「iTaiwan中央行政机关室内公共区域免费无在线网热点查询服务」(44,660次)、「行政院所属中央及地方机关代码」(43,644次)、「中央气象局雨量站观测数据」(36,856次)、「铁路时刻表」(35,643次)、「乡镇市区界线(TWD97经纬度)」(31,172次),以及「易发生妇幼被害犯罪地点」(30,685次)。
前述十大热门数据集当中,被下载次数最多者,仍为「不动产买卖实价登录批次数据」,高达27,249次,紧追在后的则是「中央气象局雨量站观测数据」,下载次数为26,196。值得一提的,在浏览次数排名未跻身前十大的若干数据集,其实也不乏被频繁下载者,例如「空气品质实时污染指标」达到24,412次之多,此与近一年多来细悬浮微粒(PM2.5)指标明显飙升,多次达到「不良」的紫爆等级之现象,理当息息相关,此外「县市乡镇中英对照档」也被累积下载达26,183次。
然而就下载次数而论,还有一项数据集,比起上列4项数据集更加热门,即是由行政院原委会提供的「全国环境辐射侦测」,下载次数为39,973,直逼4万大关。
在政府数据开放平台中,也提供「活化应用展示」区域,象徵经由这些开放数据所孕育而成的后续应用,其间不乏民间业者的创意巧思,颇值得其他既有企业或新创公司加以借镜。
譬如恒鼎科技,透过蒐集各大社群网站并结合政府所公布Open Data数据,藉由自行研发的智能评价情绪分析技术,将数据进行处理与分析,进而打造出「药妆品大数据与社群知识全都露平台」,好让消费者借此获取所有社群媒体口碑统计分析汇总数据,亦得知药粧品广告是否不实、含有那些药品成分、是否有GMP、厂商揭露数据是否属实等重要信息,进一步作为采购依据。
此外,由名为michael80321的创作者悉心建立的「开放数据也可以饱肚子」,则以行政院农委会公开数据平台上的美食数据为基底,再结合地理信息,帮助使用者轻松吃遍台湾大大小小的农产美食。由Mark App design所创作的「台湾登革热疫情速报」,善用卫生福利部疾病管制署近期开放的「登革热近12个月每日确定病例统计」数据集,协助民众快速了解各地区疫情病例数,更可透过颜色及地图的结合,深入理解该地区疫情情况。
由亚东纪念医院推出的「Health健康+云端医疗服务」,系运用国民健康署健康量表及卫教文章,并结合医院及社区之资源,成功从线上照护概念扩大涵盖提供健康管理服务,让民众可透过App获得相关健康信息,轻松进行自我健康管理。由npes87184创作的「台湾环境通」App,则结合经济部水利署的「台湾地区主要水库蓄水量报告系统」、行政院原子能委员会的「全国环境辐射侦测」数据集、行政院环境环保署的「空气品质」及「紫外线实时监测数据」等数据集,帮助民众轻松掌握各地区的辐射、紫外线与空气品质等多项信息。
妙用地理图资 繁衍新兴商业模式
反观国外,利用开放数据、结合大数据分析,终至实现创业的例子,更可谓多不胜数,个中相关案例,相当值得国人加以参酌仿傚。单单以GPS与地理位置数据为例,连带衍生的成功应用案例已经不少,譬如赫赫有名的谷歌(Google),即运用GPS数据集与政府开放数据,先后产出多项应用程序,包括已为人熟知的Google Maps、Google Earth,比较有趣的是,Google也将这些应用程序转化为开放数据来源,而迄今累计有超过100万个应用程序与网站,都已采用Google Maps开放数据。
同样让消费者备感熟悉的Uber实时叫车服务,也算是开放数据应用的好例子,其透过开放数据发现犯罪率与叫车需求之间的关联性,藉以改善行进路线规划,增进顾客满意度,同时研发出App叫车的全新商业模式。
以供应社交导航App闻名的Waze,早在2014年期间便决定启动Connected Citzens计划,旨在与多个政府机关建立合作关系,借此获取这些单位所拥有的道路建设、道路侦测器,以及道路封闭计划等信息,而Waze则以提供匿名的实时群众交通信息作为交换代价。
成立于2009年的Foursquare,其主要服务可让使用者登入打卡与提供城市指南,分享附近好店家、好去处等信息,因而广受消费者青睐,其赖以支撑事业推展的基础,有很大一块,也源自于OpenStreetMap与MapBox等开放式地理图资。