通过采用云爆发的能力,混合云平台能够提供强大的计算灵活性。但是如何科学适当地部署混合云数据,以及实现对公共云和私有云的跨平台快速访问成为了摆在IT团队面前的两个难题。幸运的是,存储即服务能够帮助解决这两个问题。
云爆发的困境
云爆发的根本问题是数据往往都被部署在错误的云环境中。对于很多应用程序(例如网络服务和媒体传送等)来说,最好的做法是将数据复制至公共云和私有云中。无论是哪种应用程序,只要其数据集大部分都是静态的,那么就适用于这种模式,此外还有相关软件可实现复制过程的自动化。
但是,当应用程序的数据集主要都是动态时,该怎么办呢?一些IT团队选择容忍延迟问题。但是这种做法也让用户无法享受到云爆发技术的许多红利。或者,企业可以探索使用某些数据定位技术来减少延迟现象。
可以把云计算想象成为一个连续的服务。如果在混合云平台的多个区域中存在着多个数据副本,它可支持弹性特性和不间断计算。如果内部私有云部分发生故障,那么用户可以将整个工作负载都迁移至公共云且不会丢失服务。
这就为用户提供了两个数据管理选项。一个是将主要数据部署在企业内部,然后将数据连续复制至公共云。在云爆发过程中,将数据写入云平台并执行具体计算任务,然后将计算结果同步至其他的数据副本。但是这种模式仍然存在写操作延迟,以及数据无法同步的小问题。这将是编程工作变得更为复杂。
另一个数据管理选项则是将主要的数据部署在公共云中,并找出一种能够加速内部计算工作负载访问数据的方法。这就是存储即服务(SaaS)成为混合云有效模式的表现。
SaaS在混合云平台中的作用
诸如Zadara Storage公司和Velostrata这样的SaaS供应商在公共云领域都占据了一席之地,他们通常是将大型公共云(例如亚马逊网络服务或谷歌)以租赁的方式提供给用户。这种方式解决了云爆发过程中数据的可用性问题和延迟性问题,它还允许用户在多个地理区域之间复制数据,以提高灾难恢复能力。
为了解决内部延迟问题,SaaS供应商会在客户站点中部署缓存系统,同时该系统针对快速传输和深度缓存进行了优化。缓存系统会为内部系统保留一个常用数据的副本,并用作内部部署私有云中数据交换的写操作缓存区。
这些缓存系统是很智能的。它们会学习数据流模式并预测工作负载需求以实现较高的缓存命中率。是否提供这种缓存功能是SaaS供应商的主要特点。
为了实施这些缓存系统,SaaS供应商会提供或推荐缓存引擎配置。那些具有最高性能级别的配置会使用采用非易失性存储器或快速串行连接SCSI固态驱动器的全闪存存储系统。它们还会使用大量的动态RAM,用于存储索引表和压缩原语,上述这些都是在众多对象中被多次使用的数据段。
数据以高压缩比的形式在内部缓存和公共云之间传输,可显著降低混合云平台中的延迟现象和数据流量。写入缓存引擎的数据是压缩的,然后存储在公共云中,在那里被复制。通常来说,这个数据被认为是常用数据,所以至少会在一段时间内被保存在缓存引擎中。
SaaS架构中的所有数据在被写入缓存引擎时都需要经过加密处理。在更先进的系统中,用户拥有符合HIPAA标准的密钥。在压缩之前,用户还有机会试用扩展元数据对数据进行标记。诸如Rubrik之类的一些系统会使用这种方法来提供增强的搜索和数据操作。
Velostrata和Zadara Storage那些SaaS供应商会提供各种级别的服务。在一般情况下,租用公共云计算空间的成本是相对较低的,特别在采用数据压缩方法时更是如此,所以经济性让SaaS更具吸引力。尝试使用这些服务的成本也很低,企业用户可以选择试用期的方式来进行一些试运行的工作。
在用户为混合云平台部署SaaS之前,同样也值得从感兴趣的供应商那里获取一些客户参考。
本文作者:佚名
来源:51CTO