曾经一度被认为是难以实施(即并不是完全不可能)的高性能云存储正在成为某些企业IT部门中的实际存在。
现在有云存储,有高性能存储,但是是否真正存在高性能的云存储呢?
长期以来,对于这个问题的回答是否定的。
“无论何时用户把他们的基础设施移出数据中心以外,总是会涉及延迟问题,这样他们就不得不面对速度问题了,”总部位于马萨诸塞州Milford的企业战略集团的分析师Scott Sinclair说。“速度,似乎是个不小的问题。”
“如果那些用户寄希望于他们的云供应商能够提供高性能的云存储,那么他们就要学会妥协,要么部分地放弃对高性能的要求,要么就只有选择内部部署。但是,现在有越来越多的新兴技术纷纷问世,它们可以让用户鱼与熊掌兼得,也就是说用户可以使用基于云的基础设施运行IO密集型和对延迟敏感型的应用。
高性能云存储可以让企业用户在受到云存储限制所制约的云中运行高要求的数据库应用。它不仅可以让用户实现应用的本地部署,而且能够通过广域网利用廉价的可扩展云存储。最后,它能够让用户在云中通过访问私有数据中心中的存储基础设施实现重要的计算。
但是,与大多数的存储问题不同的是,实现高性能云存储的关键并不只是在于投巨资购买更多的硬盘或闪存设备,Sinclair说。当我们要解决速度问题时,新技术“需要依靠特定的创新来解决问题,”Sinclair说,即将数据部署在离计算较近的位置、或者引入某种形式的网络优化或缓存机制。一些解决方案综合了上述这三种方式。虽然这一新技术仍处于其发展的初期阶段,但是一些早期的试水者已经得到了可观的回报。
本地计算、云存储
“一直以来,我们业内似乎存在着一个共识,存储是一种成本较低的资源,如果需要更多的存储资源,那么只需要去多买一些存储设备就是了,”Sentinel Benefits &Financial Group 的COO David Scarpello说,这是一家总部位于马萨诸塞州Wakefield的福利管理公司。“之后,我就逐渐意识到存储其实并不便宜,之前的认知是非常错误的。”
Sentinel每年在购买额外的硬件、支持与维护、人员、备份、维持一个数据中心和灾难恢复站点上的投入在25万美元以上,公司维持的本地存储资源约为40TB,那么其单位投入为六千美元/TB。“这是一笔巨大的投入,”他说,那么这么做的意义何在?
“存储是非常重要的,它会让我们感到安全,但是这并不是我们真正想要有大投入的方向。”
与此同时,公共云供应商提供的存储资源足以媲美消费类硬盘。亚马逊网络服务(AWS)所提供的简单存储服务(S3)的定价为每月每GB 3美分起——这适用于较多容量较低访问频率的应用,或者托管复制TB级的存储服务为每年240美元。
但低价高容量存储服务是基于对象存储的,其性能表现并不稳定,有时可以表现良好,但是在跨广域网进行访问时其速度之慢简直令人难以忍受。因此,众多IT企业所面临的挑战是如何在用好云可扩展性和低成本这两大优势的同时,还能保持较高的性能表现。
对于Sentinel来说,一个潜在的解决方案就是使用总部位于波士顿的初创公司ClearSky所提供的数据缓存与加速工具,这个工具包括了一个本地缓存设备和一个位于入网点(POP)位置直接连接至高容量公共云存储服务的孪生设备。通过在本地对热点数据进行缓存和使用专用低延迟连接来访问云计算,用户们能够针对本地计算应用充分利用好廉价的云存储服务,而且还不会牺牲性能表现。
在最初的发布版本中,ClearSky向其位于波士顿、费城和拉斯维加斯POP以外的客户承诺,他们的IOPS指标可以接近于本地用户,其延迟时间低于2毫秒。这个计划就是要增加其地理分布,为更多的云存储供应商提供支持,ClearSky数据公司的联合创始人兼CEO Ellen Rubin说。
Sentinel已经开始通过ClearSky向AWS迁移了约7TB的测试和开发数据,相关开发人员对此全无怨言。在理想情况下,公司将会逐渐地迁移它的所有数据,从而省去支付给NetApp每月五千美元的维护费用,同时还不需要实施备份和异地灾难恢复。
云和云存储
如果用户正在云中运行一个对延迟敏感的数据库应用程序,那么最佳实践建议使用云计算供应商的块存储产品,例如AWS的弹性块存储(EBS)。这类服务曾经对于大型数据库工作负载来说就如同墓地丧钟一般,因为其运行性能会受到有限IOPS和更小容量存储单元的极大影响。
当房地产数据公司的母公司——国家房地产公司在2012年宣告破产时,它不得不快速地针对它的数据中心作出决策:选择另一家数据中心、租用托管空间或者选择云。
“做出这样的决定是颇费思量的,其中选择云是最具经济意义的,”这家总部位于伊利诺伊州Naperville的企业的经理Craig Loop说。
首先,房地产数据公司匆忙对其应用进行了迁移,但是对其40TB的图像数据库却犹犹豫豫地从EMC存储阵列迁往云。S3的延迟时间和性能表现是无法让用户接受的,这就意味着应当对其内部应用程序进行重新开发以支持对象存储方式。
“即便是使用Shim,我们也无法让它正常工作,”Loop说。同时,AWS的EBS也不是一个真正的可选项,因为在当时EBS支持的存储硬盘区容量只有区区1TB。“EBS就成为了管理人员的一个心病,” Loop说。
在得到云咨询公司RightBrain Networks的帮助后,房地产数据公司使用了一个Zadara 虚拟专用存储阵列(VPSA),这是一个毗邻云数据中心的专用单租户存储服务,两者通过光纤链路连接,其购买模式为所用即所付。Zadara的VPSA使用了与我们所熟悉的SAN和NAS相类似的接口,开发人员认为其存储性能与一台内部部署的EMC存储阵列相同。Zadara与其他云供应商合作推出了VPSA服务 ,而其本地部署版也采用了与云类似的所用即所付的消费方式。
本地云块存储服务供应商也提升了他们的竞争硬实力。例如,AWS EBS现在可支持的存储硬盘区容量已高达16TB,而采用固态硬盘备份的EBS布建IOPS硬盘区可提供高达每区20000的IOPS。不过,虽然这样的技术指标已经足以应对很多数据库工作负载了,但是还是有些工作负载是它们无法承担的。
Lawter公司是一家总部设在伊利诺伊州芝加哥市的特种化学用品公司,这家企业于近期将其SAP和SharePoint基础设施迁往了Dimension数据公司提供的一个公共云服务,它选择Zadara VPSA的原因是它需要确保它的SAP环境能够具有最低20,000的 IOPS。“Dimension数据公司的标准存储服务无法满足我们对于IOPS的要求,”该公司的全球网络和虚拟化总监Antony Poppe说。
同时,传统的存储厂商也看到了他们在云计服务供应商那里的大商机。不仅一些云块存储产品无法满足IOPS和延迟性的需求,很多云用户也纷纷表示在多租户环境中饱受“IOPS竞争”(与其他租户竞争IOPS资源)之疼,EMC公司弹性云存储产品营销总监Varun Chhabra说。
让云和专用存储设备两者相结合就能够实现可预测的性能表现。
同时,针对基于云工作负载使用专用存储设备也能够让一些企业用户感到放心,Virdata公司业务开发、渠道和合作伙伴负责人Catherine Van Aken说。Virdata公司是一家为物联网(IoT)应用程序开发大数据与分析平台的企业,它的平台是基于运行在NetApp FlexPod融合基础设施上的OpenStack的。
“并不是所有的客户都对使用公共云做好了准备,”Van Aken说。“这个市场正在经历从无到有的发展历程,但是随着时间的推移市场还是最终会选择云计算的,”她说,援引IDC的一个预测,在五年内九成以上的物联网数据都将在云中托管。通过这中方式,Virdata公司为其客户提供了一个阶梯式的渐进方法,从而实现从全内部部署环境到在云中计算(存储设备在一边)的转变。
此外,在云中使用专用存储设备可为管理人员提供熟悉的管理方式,Data Fabric集团NetApp副总裁Phil Brotherton说。他说:“即便计算是在云中进行的,但是数据还是存储在专用存储设备中的。”数以百计的NetApp客户拥有着NetApp专用服务器,它们可提供媲美“近乎云”的高速度和低延迟性能,其中包括了AWS、微软Azure、IBM Softlayer以及阿里巴巴集团,Brotherton说。
云、本地存储
但是,对于一些企业来说,云中的任何存储都是难以接受的。数据容量越大,对于本地存储基础设施的投入也就越大,或者考虑到企业行为规定过于严格而完全不会考虑把数据置于云中。
但是,计算则是另一个故事了。有很多应用场景是企业可能想要在云中运行应用,但把其数据保留在企业内部,一家主要从事数据与应用去耦合化工作的初创公司Velostrata 的CEO Issy Ben-Shaul说。他们可能想要使用云的计算资源实现应用程序现代化,以供测试或开发使用,或者应对使用率高峰的出现。同时,把数据保留在企业内部可以实现投资保护、满足合规性要求,或者实现在不同云中的应用迁移以免受制于某一云供应商,而且不需要对他们的数据存储做出任何修改。
“对计算和存储实现去耦合化有着很大的影响,” Ben-Shaul说。
除了切断存储与计算之间的连接以外,Velostrata软件流和换成应用都要从本地存储映射至云计算。它包含了两台虚拟机:一台运行VMware vCenter控制对本地存储的访问以供读写操作使用,而另一台在云中与正在运行的计算过程进行通信,并与监控引擎集成。“整个想法就是要与云无关,并且允许虚拟机能够在目标云环境中实现本地运行,” Ben-Shaul说。
企业战略集团的Sinclair预测,存储业将继续提出创造性的解决方案以便于推出高性能云存储。根据其研究表明,使用外部云资源是IT企业在2016年的首选。
“很显然,这是一个大金矿,但是同时,你必须要解决这个速度的问题。”
微信扫描二维码,关注公众号。