下一代家用存取点与闸道器
当今家用闸道器架构,在对外连接网际网络,对内连接平板电脑、智能手机、笔记本电脑、桌上型电脑、游戏机、联网电视等众多联网装置,以及造成爆量带宽的社群网络与多媒体应用下,已经出现效能瓶颈。因此,SoC厂商以云端运算与服务器平台规划的经验,以双核心处理器搭配卸除负载(Offloads)引擎的设计思维,辅以封包分级转派、应用程序特性的优先权?流量控管机制,以及读写加速机制,提出新一代的家用闸道器平台架构…
美商应用微电路(Applied Micro Circuits Corporation;APM)产品行销经理Pravin Bathija,以为何需要下一代家用闸道器开场,深入探究下一代家用闸道器技术、应用,以及产业基础的模块建立,及如何选择正确的SoC芯片解决方案等,做为这场演讲的讨论议题。
首先他以一张动态示意图,呈现当今无线家用闸道器所扮演的角色:不仅对外连接网际网络,同时要传输大量的多媒体视讯?音讯?封包数据,藉由有线或无线方式连接到平板电脑、笔记本电脑,以及连接大屏幕电视的游戏机(如XBOX Live),连接你的智能手机以Wi-Fi方式提供Skype网络通话服务,以及连接智能联网电视以观看NETFLIX网络频道商提供的影片内容。无线闸道器扮演着这些联网装置与网络存储装置(Network Attach Storage;NAS)的中介角色,藉由无线闸道器来对NSA进行撷取或存储大量数据。
Pravin Bathija提到,当前家用闸道器架构已经出现瓶颈,无法因应社群网络、多媒体应用、连接NAS存储装置与其他应用所带来的爆量带宽的需求,很少或根本没注意到在带宽与数据传输延迟的问题;许多主要闸道器内CPU设计封包处理,没有充足的运算余裕空间应付新兴应用,自然也无法针对当前爆量带宽与未来应用增添延展性。
他认为下一代家用闸道器,必须要具备Gbps(Gigabit)等级的Wi-Fi无线与有线联网能力,以因应多用户端装置高速存取需要;同时要具备高速网际网络与网络存储装置,具备流量整形(Traffic Shaping)且符合QoS服务质量的优先权流程管控机制,以及以应用程序类型为优先权的流程管控机制,深度的封包防骇检测,可延展的应用机制,具备网络位址转译(Network Address Translation)、内容过滤机制,以及跨接支持USB 3.0的高速网络存储装置来存储、串流化传输与对外共享数据。
建构Gbps高速网络应用的规格区块
Pravin Bathija指出,为了达到Gigabit(Gbps)等级IP的封包转发能力,以往的闸道器仅设计单一GE(Gigabit Ethernet)界面埠输入?输出,藉由1.2GHz等级CPU做封包过滤的带宽管控功能,在一般以仅64Bytes大小的网络封包流,里面参杂许多无优先权、QoS管控的数据封包,即便以1.2GHz CPU来做封包处理,仍有可能因为需要一个一个封包的循序处理,造成处理器被庞大的Gbps封包流呛住(Processor Chokes),而出现断断续续的延迟现象。
APM设计的入门闸道器SoC架构,采用四埠输入?输出设计Gbps Ethernet以太网络界面,后端以双通道连接2组封包分类硬件加速器(Classfier),以关闭负载(off load)方式实时过滤封包并切换其流向,即便闸道器SoC为600MHz的APM86791 Keelback单核心CPU架构,处理Gbps爆量封包数据仍然游刃有余。
他列出一个以IPv4做512、256与64Bytes封包下的比较数据,分别以Linux OS在线负载,以及Linux OS搭off load关闭负载方式进行效能测试,在512Bytes大封包的情况下,CPU耗用率从26%降到4%;以256Bytes中型封包传输时,CPU耗用率从100%降为7%;当切换至64Bytes最小封包传输时,CPU耗用率从居高不下的100%降到84%。
高端APM闸道器SoC像是APM86290 PacketPro处理器,具备双核心PowerPC与250MHz ARM架构的SLIMPro辅助处理器设计,当从NAS或电脑DDR3传输不同优先权的封包时,藉由前端GE界面内置的IPSec、MACsec对低优先权但需低延迟的封包流量进行切割、在线检核;中段级别判断线路(Classfier)则识别封包流向、具备可程序化、动态切换、MAC固定网或虚拟区网,以及支持IPv4与IPv6、TCP与OoS要求;在后面的PQ0~PQn可程序化优先权过滤器,则可依照优先权设定进一步判断封包走向,依照优先权设定给予快速通关或者暂候,以协助做流量整形;最后端四埠GE界面再进行实时IP编码、MAC安全编码与检核码产生,完成最后封包重组传出。
Pravin Bathija指出,APM设计以应用程序为基准的QoS与DPI服务质量与数据速率控管机制,可以针对Skype、NETFLIX、Xbox Live与Bit Torrent(P2P)软件,分别设定不同的传输速率与封包优先权,例如针对Skype把封包序列优先权设为1、数据带宽10Mbps;NETFLIX网络电影设优先权为2、带宽20Mbps;Xbox Live优先权3、带宽40Mbps;BT设为优先权4、带宽2Mbps;如此在这四种应用下,都能享有最适合各种应用程序的QoS服务质量与带宽流量。
而APM设计的内容过滤与安全防护机制,从封包进入闸道器前端就实时针对无效封包、恶意分享?下封包、转译埠封包、DDoS延迟反应?阻断式封包实时过滤剃除,不会增加闸道器分配流量的负担。
他也提到,APM的家用闸道器内建USB 3.0界面,可以直接连接支持USB 3.0高速界面的NAS网络存储设备,享有5Gbps的界面传输速度;同时若搭配闸道器内Linux核心建置的最佳化的档案系统与SATA驱动程序,即便存取大型档案也能够最佳化处理。同时在读取过程启动大型封包接收关闭负载(Large Receive Offload;LRO)模式,以及写入数据过程启用TCP封包分段卸载(TCP Segmentation Offload;TSO)模式下,均能够有效的加速大型档案的读写速度,并降低CPU耗用率。
他列举一个测试示意图,以一个单一档案长度为4GB的档案,以单线绪(Single Thread)进行读写测试,在未开启LRO模式下读取速度为100MB/s,CPU耗用率100%,开启LRO读取速度提升为120MB/s,CPU耗用率降为70%;未开启TSO模式下写入速度为65MB/s,CPU耗用率100%,开启TSO模式下写入速度加速到120MB/s,CPU耗用率降至82%。
Pravin Bathija接着表示,APM闸道器SoC所规划的内建NAT网络位置转译机制,可以使各连接到闸道器的各联网装置的真实IP,跟透过闸道器NAT转译后对外的真实IP有所隔绝,外头无法探索得知联网装置的真实IP与MAC网络位址,杜绝被植入木马或成为殭屍代理装置,而成为黑客线上遥控的跳板。
选择正确的闸道器SoC芯片解决方案
Pravin Bathija认为,传统闸道器平台架构或SoC,只是一昧的追求多核心CPU的设计,没有协助CPU卸除负载(Offload)的设计思维;而美商应用微电路设计的一系列APM86xxx闸道器SoC,除了导入多核心CPU,并加入Offloads卸除负载、封包级别派发电路(Classfier)、数据流量控管(DPI)、IP转发、流量整形、TCP SAR、TCP/UDP CSUM、Security安全机制与NAT位址转译功能的加入。
由APM开发的APM86290 PacketPro闸道器SoC芯片的架构方块图,内建双核1.4GHz 32位元460 PowerPC CPU,搭配SLIMpro ARM 250MHz定制化卸除负载引擎架构,提供1组PCIe x4、1组PCIe x1汇流排控制器,SATA 2.0与USB 3.0界面,足以用来规划、设计出下一时代家用无线闸道器平台。
Pravin Bathija最后总结,单纯以CPU运算能力,已不足因应目前与下一代闸道器运算处理与低延迟的封包分派需求,设计专属且以应用程序为导向的负载卸除引擎,能符合经济且有效率的延展闸道器平台效能,减少CPU工作频率与整体功耗;负载卸除(Offloads)引擎在主要应用情境,以及经常使用的应用程序下,可以释放更多CPU耗用率给其他应用程序使用,而精心设计的SoC芯片能大幅改善应用程序的反应时间,增进用户的联网使用体验。








