巨量数据推波助澜 储存设备商机畅旺 智能应用 影音
vishay
DForum1101

巨量数据推波助澜 储存设备商机畅旺

  • DIGITIMES企划

企业用户可藉由NAS供应商的App市集,查找并安装所需应用程序,让NAS不仅是储存装置,同时具备多元应用价值。QNAP
企业用户可藉由NAS供应商的App市集,查找并安装所需应用程序,让NAS不仅是储存装置,同时具备多元应用价值。QNAP

前言:
研究机构预测,时至2020年,全球累计数据量将达40ZB,较诸2010年初估算值,足足成长50倍,等于每隔两年就翻一倍;意谓历史上前所未见的数码银河时代,正在你我身旁上演,因而衍生莫大的巨量数据分析商机,更带动储存需求水涨船高。

本文:
曾有人做过统计,每天在地球中,上传至YouTube影片共计103,680小时,亚马逊售出商品达440,640项,谷歌(Google)提供的查找服务达500万则,阿里巴巴集团因网购交易产生1,200万个包裹,脸书(Facebook)处理25亿则发文。

具备横向扩展利基的丛集式NAS设备,是颇能契合巨量数据应用情境的储存架构,因而成为市场关注焦点。Tweak Town

具备横向扩展利基的丛集式NAS设备,是颇能契合巨量数据应用情境的储存架构,因而成为市场关注焦点。Tweak Town

上述数据,并非强调相关业者的事业兴隆,而是象徵信息爆炸的时代已经来临。这些生生不息的数据,个中多蕴含消费者的行为与好恶,具有深厚分析价值,那怕一家再小的公司,只要懂得从数据里头淘金,都可能繁衍出憾动市场的创意,从而跃升领导厂商;正因如此,近几年巨量数据分析议题趋于火红,甚至与当红的云端运算等量齐观。

但不可讳言,当企业机构亟欲靠巨量数据(Big Data)发财,光靠现有IT系统是不够的,必须为此进行相关系统的优化与扩充,势将无可避免加重IT基础架构的负担,需针对3S设备-服务器(Server)、网络交换器(Switch)及储存装置(Storage)加码投资;根据研究机构预测,若以2012~2015年为周期,则企业对于3S投资额度的增长趋势,以储存最为显着,是唯一复合成长率逾四成的项目。

为何想做Big Data,就得加码部署储存设备?道理很简单,爆炸性增长的数据,都需要善加保存,以利后续进阶分析,既然要保存,势必得占用庞大储存空间,然而综观智能手机、平板电脑、桌机、笔记本电脑等等个人装置,却随着机种愈趋短小轻薄,以致于内建储存容量愈来愈小,因此偌大的储存空间需求,绝非倚靠个人装置来满足,而是落脚于机房储存设备里头的硬盘!

具灵活扩展弹性 Scale-Out NAS逐成宠儿
论及巨量数据应用,其赖以挖掘商业价值的数据来源,通常指的是并未被标注、且以档案为基础的非结构性数据,一直以来,这些数据多不在企业数据中心管理范畴内,如今通通加以纳管,最显而见的冲击,就是数据量较过往大增逾十倍,无怪乎如前所述,会加重IT基础架构负担;在此情况下,企业必定会竭尽所能降低IT支出,譬如实施虚拟化及云端运算技术,以提升IT资源的使用效率。

而当企业迈向云端应用,就必须满足虚拟化环境下的大量复制与镜像需求,亦将对储存系统构成沈重负荷,此时企业基于成本考量,绝无可能会倾向以昂贵的FC SAN设备,来应付巨量数据管理、云端储存等庞大需求,因此支持横向扩张(Scale-Out)架构的网络附加储存(Network Attached Storage;NAS)设备,逐渐趋于走红,这对于台湾为数不少的NAS设备供应商,堪称是值得着力发展之标的。

业者指出,Scale-Out NAS系以丛集式档案系统为运作基础,由多台NAS控制器组合成为丛集架构,其间每组控制器背后皆有对应储存空间,因此当用户遭遇储存容量或性能不足的问题,即可善用这些空间执行在线扩充;换言之,只要NAS控制器的节点数量愈多,储存空间就愈大、存取性能愈佳,愈能协助企业克服巨量数据管理挑战。

反观传统的NAS设备,走的是纵向扩展(Scale-Up)路线,看似也具有扩充容量的空间,然限制性相对较大。综观多数企业级Scale-Up NAS装置,均内含1或2组控制器,再由控制器串接JBOD扩充磁碟柜,因此只要能在控制器后端串接更多JBOD,便可扩大储存容量,但受限于I/O埠数量与I/O控制芯片效能,此一架构所能承载的磁碟数量并不可能无限上纲,就算企业采用高端双控NAS系统,也不易承载超过千颗的磁碟,若巨量数据管理需求逾越此承载上限,此时别无他法,只能继续部署第二台、第三台甚至第四台设备,徒增管理复杂性。

至于Scale-Out NAS设备,多不仅可提供相对灵活的扩展弹性,且通常会提供阶层式储存、数据生命周期管理(ILM)等加值功能,以利满足数据自动迁移需求,但也意谓档案路径可能趋于多变,为避免对使用者存取产生困扰,因此在Scale-Out NAS所建构的丛集环境中,皆会加入全域命名空间(Global Namespace)虚拟路径功能,意即可横跨多个控制器节点建立单一命名空间,同时可将来自前端的存取I/O需求予以打散,交由多个控制器节点协作执行。

至于Scale-Out NAS控制器与后端装置之间的连接方式,不外有两种,一是由NAS控制器节点透过SAN网络、再连结SAN磁碟设备,依此做法,一方面扩充弹性较大,用户要想增NAS控制器或SAN磁碟装置容量皆可,二方面也助于提升IOPS效能;另一做法则是DAS连接,也就是由每组控制器节点各自连接本机磁碟装置,包括Master主机内接的SATA或SAS硬盘,以及透过SAS HBA卡串接的外接磁碟柜JBOD,尽管在效能方面不如第一种做法,但成本相对讨喜。

例如宏普科技的色卡司(Thecus),推出别具创意的菊花链(Daisy Chaining)扩充模式,即较偏向上述DAS连接架构。以Thecus为菊花链所设计的N16000PRO 16-Bay机型为例,若依此作为Master,后续只消藉由简易的卷册扩充模式,即能利用10GbE交换器堆叠另8台N16000PRO,而每台N16000PRO各可串接4台D16000 DAS,因而利用相同架构、最低投资,最大即可扩展至高达2.5PB容量,并提高数据传输速率,颇适用于巨量数据情境。

NAS设备App化 满足多样应用需求
除了横向扩充储存容量外,现今NAS设备对于无论是大型企业、中型企业、小型企业或SOHO工作室等不同用户而言,应用价值并不仅止于此。另一个显而易见的特质,其开始走向App化,意即用户可从供应商的App市集中,选择安装其所需要的应用程序,例如电子布告栏、电子商务、内容管理、安全监控、工具程序…等等,让NAS不再仅是储存设备,而可适度扮演应用服务器角色。

此外,储存设备厂商提供「企业档案同步与分享(Enterprise File Synchronization and Sharing;EFSS)」方案,也就是所谓的企业级Dropbox,好让用户端的员工享有弹性磁碟空间配置,并实现跨越终端装置之档案同步分享,创造「Data Follow Me」效果,亦是另一备受瞩目的发展路线。

综观市面上已然现身的EFSS产品,对于用户都具备多重价值。一来,可与企业既有的NAS设备协同作业,既不改变前端使用者存取数据的习性,又可顺势建立另一道数据备份机制(当使用者存入档案至NAS,将自动同步到EFSS装置);二来,可取代传统FTP服务器,利用群组分享的做法,不需将同一份档案数据多次复制,便能同时传递予群组内的众多对象;再者,可将E-mail附件转化为分享连结,帮助用户节省网络带宽与邮件服务器容量;最后,可就地为企业创造移动存取应用环境,让前端使用者藉由移动设备分享连结、进而存取实际档案,MIS不再需要为原始档案如何转换为Web Services而伤脑筋。

总而言之,企业要想妥善因应结构化数据、非结构化数据或串流数据等不同层次的Big Data分析处理需求,如何权衡效能与成本,建立最合宜的储存架构,无疑是至关重大的课题,连带给予储存设备莫大发挥空间。

关键字
议题精选-COMPUTEX 2014