双子星推BDaaS方案 助台湾推展AI大数据应用 智能应用 影音
Event
member

双子星推BDaaS方案 助台湾推展AI大数据应用

2016年AlphaGo战胜世界围棋冠军,带给世人莫大震撼,使人工智能(AI)迅速蔚为显学,不仅成为产业界群起抢攻的商机题材,政府也期许将台湾打造为AI发展重镇。

双子星云端运算公司(Gemini)CEO符儒嘉表示,对于政府誓言将AI打造成为台湾的下一个明星产业,他深表认同、亦看好发展前景,只因为台湾若能有效汇聚云端、大数据、AI等多方技术能量,再结合一向擅长的硬件技术根基,孕育出诸如AI Appliance等整合性方案,确实是台湾适合前进的发展道路。

双子星云端运算公司CEO符儒嘉强调,该公司期望借助GOC PaaS与定制化服务入口网站,提供完整的云端服务生命周期管理功能。来源:双子星

双子星云端运算公司CEO符儒嘉强调,该公司期望借助GOC PaaS与定制化服务入口网站,提供完整的云端服务生命周期管理功能。来源:双子星

为顺应AI趋势浪潮,双子星于日前举办技术论坛,以AI、机器学习、数据科学、大数据等讲题内容,作为贯穿论坛活动的轴心。其间符儒嘉以「大数据下的云端架构」为题发表演说,一方面细数近20年从高效能(HPC)、大数据而至AI的演进脉络,二方面透过大数据云(Big Data as a Service;BDaaS)概念之铺陈,点出一个可望加速AI发展的重要方向。

大数据与云端 开始有交集

符儒嘉说,过去20年内的多数时间,HPC/大数据、云端运算鲜少有交集,但随着近年来诸多重大里程碑出现,已使情况产生变化。他认为经由AlphaGo示范效应,证明只要透过复杂的多层次神经元、搭配高效率平行处理,即可展现绝佳决策速度,而GPU无疑是加速深度神经网络(DNN)、机器学习等新技术发展的关键推手。

尽管GPU的助攻,使AI运算效率大跃进,但毕竟GPU资源的取得成本偏高,即使用户仅是因应专案需求,在特定期间内透过公有云虚拟机器(VM)运行GPU,依然不符经济效益;换言之,尽管云端凭藉虚拟化、多租户等技术,使计算资源得以被弹性运用,带动许多应用的发展,但举凡AI、大数据或HPC,以往并不在受惠范围之列。

可喜的是,伴随2014年容器(Container)技术问世,隔年容器管理平台Kubernetes现身,开始让情势逆转,在Kubernetes丛集内,可藉由单一Host统一支持CUDA Library,使个别容器均可加载不同Toolkit,分别支应TensorFlow、Caffe等等不同任务需求;自此GPU开始成为适合共享的资源,假设A使用者利用这些资源、跑完自己的Job,尔后这些资源将被快速释放,以供B、C、D等等其他使用者接续采用,不同Job的转换过程,Context Switch效率极高高,此即Utility Computing概念,让「GPU as a Service」从不可能变成可能。

符儒嘉补充,GPU as a Service的落地实现,固然称得上重大突破,但欲赢得数据科学家青睐,尚欠缺临门一脚,主要是因为,这群使用者不熟悉云端技术,且惯用Batch Job作业型态;所幸2014年AWS(Amazon Web Services)推出无服务器运算服务Lambda,让数据科学家只要把Job送上云端,皆可透过缺省条件触发执行,不必随侍在侧紧盯Job的实际执行,只要Job作业结束,便能在第一时间接获最终运算成果,这般运作模式,无论对数据科学家或HPC使用者,都具有莫大吸引力,让他们原本对于GPU as a Service抱持的观望态度,迅速消弭于无形。

透过BDaaS,催生大数据或AI服务

符儒嘉归纳,从GPU、Dockers容器、Kubernetes、无服务器运算等一个个技术因子接踵而至,终于让原先各走各路的HPC/大数据、云端运算,开始出现交集。而深具OpenStack PaaS技术优势的双子星,也顺应这股趋势潮流,开始透过其Gemini Open Cloud(GOC)平台,提供大数据解决方案。

综观双子星的GOC PaaS结构,个中蕴含一大核心要素、即是Solution Foundry,可允许SI或第三方软件厂商(ISV)藉由服务定义范本,定义自己想要的服务整合方式;除此之外,GOC PaaS支持Ansible、SaltStack等常见管理工具,确保用户所需之大数据服务内容,可被自动安装配置,双子星亦提供支持定制化的服务入口网站,俾使三种类型的使用者,皆能实时掌握各自关切的信息,比方说数据中心的维护者,可透过这个Portal了解硬件设备的健康状态,服务提供者可了解缺省的额度(Quota)是否用尽,至于数据科学家、数据分析师等最终使用者,则可借此监控各项Job执行状况。

双子星植基于前述PaaS架构催生的大数据云(BDaaS)解决方案,基本上是站在第三方角色,提供强大补给库,帮助有志经营HPC、Big Data或AI云端服务事业者开疆辟土。首先用户(服务提供者)必须把前述的服务定义范本、即是GSP(Gemini Solution Package)档案上传GOC,此后GOC PaaS便根据范本,自动架设用户所预期的TensorFlow、Spark或Hadoop等等服务架构,一旦架构底定,最终使用者(例如数据科学)就可随需透过Portal快速启动大数据运算丛集环境,像是建立ETL(Extract-Transform-Load)环境等繁琐复杂的底层架构事务,皆可交由GOC PaaS自动执行,使他们能真正心无旁鹜聚焦在核心巨量分析演算法。

值得一提的,双子星巧妙利用滚动更新(Rolling update)方式,让大数据云端服务商既能兼顾更新升级,亦可避免中断服务。符儒嘉强调,由此显而易见,双子星想做的,并非如同许多国际大品牌般、仅止于云端虚拟化方案的供应,而是一举提供完整的云端服务生命周期管理机能,从定义云端服务、部署暨编排、Portal管理界面、监控暨报表,一直到SOP暨优化服务定义等整个正向循环,都可望透过GOC平台全面满足。

瞄准云端服务生命周期 提供完整管理功能

他进一步表示,截至目前,包括OpenStack、Hadoop,乃至于人工智能、机器学习相关的诸多软件技术,都具备开源特质,但用户欲利用这些开源工具建构生产环境,依然需要顾及稳定性、高可用度、高效能等原则,并深切理解架构瓶颈何在,总体来说绝非轻松任务;惟双子星拥有丰富的开源软件安装经验,对于个中技术细节均能深度掌握,更擅长查找潜在效能瓶颈,因此能够为用户提供的价值,并不是随着VM顺利开启便了事,而是扩及整个生命周期管理,故而轻易与其他云端虚拟化方案供应商产生区隔,建立差异化竞争优势。

前述的差异化利基,单单从Service Portal即可表露无遗。据了解,不少云端虚拟化方案供应商,并未将Portal列为基本配备,假使客户有此需要,才动员旗下开发人员,临时撰写一套Web界面,不见得具备产品化的成熟度与稳定性,反观双子星,对于Service Portal精益求精的态度,显得独树一格。

符儒嘉说,双子星云端运算团队从早期工研院一路推进,迄今已累积逾3年历练,也证明当初决定主攻PaaS、而非竞争惨烈的SaaS,乃是正确方向,今后仍将在PaaS这个既定方向持续精进。

目前双子星已透过GOC PaaS基础,推出BDaaS(大数据)、DRaaS(异地灾备)、VSaaS(视讯监控)、ITaaS(企业IT数据)等四大应用方案,展望2018年,该公司将致力把这四大方案的内容,做得更加完备;但符儒嘉坦言,双子星的最大强项并不在于发展应用解决方案,因此未来不排除透过异业结盟方式,与夥伴共同打造其他应用方案,例如云端直播服务、云端IoT服务等等。

以近期主推的BDaaS方案为例,现阶段已在学术界开花结果,位在台南湾的国立成功大学、台南市教育网络中心皆已采用。然而双子星不管为BDaaS或其他方案所设立的推广目标,都不局限于台湾本地市场,未来将透过不同接触管道,争取海外商机,让台湾自主研发的云端系统软件站上世界舞台。