在灾备建设中往往需要考虑两个指标:RTO、RPO。在数据中心和灾备中心网络中,我们往往已采用高性能的灾备系统以及千兆甚至万兆网络,从端点上为灾备运转高效打下了良好的基础。但是在真正进行灾备数据传输时,却遭遇到了以下几种尴尬场景:
画面一,每日需传输的灾备数据量大,以百G来计,但从主数据中心的到灾备中心的专线只有仅仅10Mbps,数据无法在指定时间内完成传输。随着业务的不断增多,数据滞后也越来越多,数据的丢失风险也不断攀升,RPO难保证……
画面二,多数据中心拉了1Gbps的公网带宽进行实时远程复制或灾备数据传输,但受到公网丢包延时的限制,尤其在跨运营商情况下,虽然带宽高达1G,但数据传输速度一直上不去,效率受到了大大制约……
画面三,主数据中心和灾备中心之间通过1Gbps的专线互联,延时只有25ms,网络带宽足质量好,但是灾备系统在运作时,速度极限只能跑到尴尬的180Mbps,徒有大带宽却白白浪费,RTO不达标……
以上场景都体现了一个问题,在高性能的灾备系统和局域网络面前,广域网络成为了整个灾备运转的瓶颈。需要获得高效率灾备及数据恢复,就需要解决容灾网络效率低下的问题。
那该如何解决?
深信服WOC容灾网络优化方案给出了很好的答案。
针对场景一,主要是数据量大与窄带宽之间的矛盾。深信服WOC容灾网络优化方案采高细粒度冗余数据消除技术解决,无损数据削减的方式,减少网络中需要传输容灾数据总量,在有限的带宽内实现高效的传输,从而提升灾备速率。数据削减采用的技术为基于码流特征的数据优化技术,以及无损数据流压缩技术,实现bit级重复数据删除,灾备需传输流量可达到60%-90%的削减。
某检验检疫局,主数据中心在省会城市A,并在地市局B建立灾备中心,A到B之间只有4Mbps的专线互联,每日灾备数据需要从晚上完成到A到B的传输。但由于数据量大,往往在规定的备份时间窗口之内无法完成传输,需要到第二天中午才把灾备数据传输完。而灾备数据和业务链路为共用专线,导致第二天上网B局人员访问业务系统速度非常慢。通过深信服WOC容灾网络优化方案对灾备传输进行优化,原有需要传输整晚甚至到第二天中午才传完的数据,部署后两三个小时既已完成灾备数据的传输,加快了灾备效率,降低数据灾难风险。
针对场景二,灾备效率的瓶颈主要在网络的质量上。在丢包存在、延时较高的情况下,网络实际吞吐性能将大打折扣;同时,灾备需传输的数据量大,也是耗时长、RTO不达标的一个原因。针对这个问题,深信服WOC容灾网络优化提出链路质量优化+无损数据削减的方案解决。针对公网线路,尤其跨运营商线路中的丢包延时问题,通过链路质量优化功能,采用改进性的HTP算法优化TCP协议,在丢包延时环境下大大提升网络的吞吐性能;并通过基于码流特征的数据优化技术,以及无损数据流压缩技术,大大消除灾备需传输的数据量,提升带宽吞吐、削减传输数据量,从而实现灾备网络的加速。
某媒体集团,主数据中心在北京,灾备中心在广州,出口分别电信和联通的公网线路,主要传输的数据类型为音视频数据。由于受到跨运营商的影响,原有NetApp 灾备系统受到网络影响比较严重,传输速度平均为6Mbps,峰值只有10Mbps。通过深信服WOC容灾网络优化方案的部署,解决网络质量问题,传输速度从6Mbps一下提高到了50Mbps,网络性能得到显著的提高。
针对场景三,主要是因为TCP本身的制约导致传输速度受限。在一对灾备系统之间,往往是通过单TCP连接或是仅几条TCP连接相连,而TCP本身因为受到传输窗口等协议本身的限制,速度存在上限值。传统的TCP协议传输窗口为64KB,在网络延时为20ms时,单条TCP连接吞吐仅为25Mbps。虽然许多灾备系统基于Unix开发,对TCP协议进行了一部分优化,但相对于1Gbps这样的大带宽,吞吐还是出于160Mbps-200Mbps这样的低位,无法完全利用带宽保障RTO。
针对TCP本身的低效性,深信服WOC灾备优化方案通过TCP协议优化+无损冗余数据削减功能,可大大提升整个网络的吞吐。在某金融机构实际测试中,对于一对灾备设备之间的广域网传输,性能从160Mbps大幅提升至600Mbps,并可扩展提升至2.5Gbps,满足大带