您的位置: 网界网 > 网络学院-存储 > 正文

华为Dorado助力英国RPMI公司焕发新的活力

2014年08月01日 14:03:51 | 作者:佚名 | 来源:企业网D1net | 查看本文手机版

摘要:“我们已经能够将夜班团队重新分配到其他业务领域,这让集团的IT团队在核心工作时间段内可以专注于提供更好的服务,并可释放资源支持企业的发展。这种性能的提升显而易见且具有戏剧性,它带给我们的商业利益是非常明确的。” ...

标签
存储
华为
金融

“我们已经能够将夜班团队重新分配到其他业务领域,这让集团的IT团队在核心工作时间段内可以专注于提供更好的服务,并可释放资源支持企业的发展。这种性能的提升显而易见且具有戏剧性,它带给我们的商业利益是非常明确的。”

---- Brian Scorer,RPMI公司技术服务经理

客户简介

RPMI(Railways Pensions Management Ltd.)是英国的一家为雇主企业提供退休金管理服务的基金管理公司,其前身是1965年成立的英国铁路局企业退休金部。1993年,RPMI随着英国铁路的私有化而改制为公司。目前,RPMI管理的退休基金超过200亿英镑,服务的雇主企业超过200家,共为超过500,000人提供退休金管理服务。

业务挑战

对退休基金进行有效的管理与经营,实现基金的保值与增值,是RPMI的基本企业责任。与此同时,在竞争激烈的信托投资市场,RPMI也需要通过良好的经营业绩来争取更多的雇主企业客户以促进公司的发展。为实现上述目标,对退休基金的收入、支付、投资、债务、收益等运营情况进行例行的统计与分析是十分必要的,因为这是RPMI从事各类管理与经营活动的基矗

退休金管理是一个相对保守的金融业务,它建立在长期的连续性和信任的基础上,因此,保存有与参保人员及投资者相关信息的数据库便成为RPMI的核心资产。基于这个数据库,通过运行一些专门的应用程序,RPMI即可对退休基金的运营情况进行统计与分析,并提供相关的报表。这些应用程序专门针对RPMI的基金管理业务而设计,历经多年的使用,目前这些应用程序在功能上仍然能够很好的满足RPMI的业务需求。

改善应用程序的运行效率迫在眉睫

然而,随着业务的持续发展,RPMI的数据库容量也日益增长,这使得上述这些应用程序需要统计与分析的数据量也随之水涨船高。由于数据量的快速增长,导致应用程序的运行效率每况愈下。到了2013年,这种低效率的情况已经开始恶化到令人难以接受的地步。

例如,“日产量管理报告”是一个常见但很重要的报告,相关的应用程序(如RPS系统)通过执行“批处理脚本”需要一次性从一个连续的数据库中读取超过2百万条数据记录,历时8小时才能读完,且在这个时间内需要独占数据库资源。因为这个报告是要求每天输出的,为了不对正常工作时间段的其他IT应用造成影响,RPMI不得不安排一个夜班团队在每天的22:00至第二天的6:00执行这个任务。

又如,为了获得对企业经营决策有重要参考价值的“估值报告”,相关的应用程序从数据库中需要读取的数据记录更是数以千万计,需要历时46小时才能完成任务。由于执行该任务时需要独占数据库资源,导致其他的应用程序只能离线等待,因此,该任务只能安排在周末执行。

显然,应用程序对数据库的读取效率已经成为制约应用程序运行效率的关键瓶颈。而要改变这种局面,可以有两种基本的方案:一是从软件层面进行改进,主要是采用运行效率更高的数据库软件进行改造;二是从IT基础设施层面进行改进,主要是提升数据中心存储设备的IOPS性能。

对于第一种方案,由于现有的应用程序基于SQL Server数据库运行,如果切换新的数据库软件,则势必带来上层应用程序的重新开发与调试。这对于已经运行十分成熟的现有软件系统来说,无异于是一次革命性的改变,不仅投资不菲,而且会极大的改变现有的软件使用习惯。对于这一方案,RPMI认为目前暂时不具备实施的必要性,因此把目光投向了第二种方案。

存储设备的改造所面临的主要挑战

RPMI现有三个数据中心,两个生产中心(均位于达林顿)、一个灾备中心(位于纽卡斯尔)。2011年,针对RPMI数据中心的VMware使用环境,RPMI对数据中心的SAN存储系统进行了技术升级,升级的重点是采用FalconStor的网络存储服务器(NSS)解决方案对SAN存储系统实施了虚拟化和灾备保护,初步形成了“两地三中心”的格局。

自此次技术升级以来,RPMI对VMware与FalconStor的运行效果一直感到很满意。两年以后,当数据中心的SAN存储设备再次面临性能升级时,RPMI首先考虑的是通过对现有的SAN存储系统扩展机框或硬盘来提升IOPS性能,因为这可以保持上层的VMware与FalconStor等软件的运行不受影响。但受传统硬盘的技术限制,该方案无法产生显著的效果,反而会引入更高的机房改造与功耗成本。

于是,RPMI开始考虑选择一个SSD解决方案来大幅提升存储设备的IOPS性能。然而选择一个什么样的SSD解决方案才是最佳的呢?为此,RPMI开始向其长期IT顾问C>Ways公司寻求帮助。C>Ways与RPMI之间有着紧密的合作关系,双方的合作包括弹性数据中心、服务器虚拟化、存储虚拟化[注]等多个重大项目的咨询与设计。

在对RPMI的IT系统现状、业务需求、新的绩效目标、技术改造方向等进行了全面的分析以后,C>Ways和RPMI一起梳理了对新SSD解决方案的相关要求,并将其主要关注点聚焦在以下几个方面:

良好的IOPS性能。新的SSD解决方案应能够大幅提升相关应用程序在访问数据库时的运行速度,以提升工作效率,减少不必要的夜班行为。

 

稳定的可靠性。新的SSD解决方案将用于承载RPMI的核心业务数据,其必须具备7*24小时的可靠性,以满足RPMI对业务连续性的要求。

 

支持虚拟化:新的SSD解决方案应能够保持现有IT基础架构及上层业务(如备份业务)的稳定,新SSD设备应兼容VMware的Vsphere5.0接口,以及FalconStor的SafeCache、HotZone等功能。

 

优秀的总拥有成本(TCO):在竞争激烈的金融服务行业,降低TCO对RPMI是很重要的。TCO包括购买成本、长期维护成本、数据中心空间占用及功耗。

 

“RPMI需要一种新的方法,以获得比他们现有的SAN存储系统更出色的性能,我们知道这意味着SSD。华为有能力交付同时满足成本与性能要求的SSD解决方案,这将帮助RPMI在市场中获得更好的竞争优势”,C>Ways公司项目经理Nick Jackson说。

解决方案

C>Ways公司是华为在英国的合作伙伴,在网络基础设施、存储和虚拟化等领域具备丰富的咨询与设计经验。为了找到符合RPMI要求的SSD解决方案,华为与C>Ways密切合作,针对RPMI的特定要求进行了量身定制的设计。经过审慎而全面的评估,2012年12月,RPMI最终选择了基于华为Dorado2100 G2的SSD解决方案来实施本次技术改造。

根据这个方案,RPMI将在达林顿的两个生产中心各部署1套Dorado2100 G2固态存储系统,每个Dorado2100 G2配置24块100GB的SSD硬盘。这两套SSD设备投入运行后,将分别接管生产中心现有两套SAN存储设备所承载的核心数据库业务;而现有的两套SAN存储设备,一套退役,一套保留用于承载其他非核心业务的数据。

华为Dorado2100 G2采用久经市场考验、成熟可靠的全闪存阵列系统专属架构,具备最高60万的IOPS性能,可充分满足RPMI在数据库应用场景下对存储设备的性能与可靠性要求。同时,与同等性能下的传统存储阵列相比,Dorado2100 G2在机柜空间占用、功耗等方面也具有明显的优势,空间节省与功耗节省均超过90%。

而在软件兼容性方面,华为Dorado2100 G2为标准的SAN形态共享式存储(+微信关注网络世界),兼容VMware的Vsphere5.0接口,并支持SafeCache、HotZone等功能。在本项目中,RPMI可直接使用Dorado2100 G2替换现有的SAN存储设备,RPMI目前使用的存储虚拟化等软件功能均保持不变,从而避免了额外的改造成本。

此外,考虑到备份性能的问题,RPMI还在纽卡斯尔的灾备中心部署了一套华为2600T存储阵列,配置95%的SAS硬盘和5%的SSD硬盘,用于替换现有的SAN存储设备(其全部采用SATA硬盘)。

客户收益

2013年3月,基于华为Dorado2100 G2的SSD解决方案正式交付运行。经过一系列的对比测试,相对于现有的SAN设备,新SSD设备的IOPS性能提升了10倍、访问时延则降低至1/10。

首先,得益于Dorado2100 G2出色的IOPS性能,RPMI公司技术服务经理Brian Scorer先生已经欣喜的感受到这次升级所带来的明显好处:

 

对于每天输出的“日产量管理报告”,原来需要8小时才能完成,现在已提速到2小时内即可完成。基于此,RPMI已经释放了夜班人员。

 

对于大型报告“估值报告”,原来需要46小时才能完成,现在已提速到12小时内即可完成。基于此,RPMI可以不安排员工周末加班完成此类任务。

 

这些释放出来的人力,一方面为RPMI节约了不必要的人力成本;更为重要的是,RPMI可以重新安排这些人力的投入方向,大幅改善了人力资源的使用效率。对比前后的巨大变化,Brian Scorer先生感慨道:

“我们已经能够将夜班团队重新分配到其他业务领域,这让集团的IT团队在核心工作时间段内可以专注于提供更好的服务,并可释放资源支持企业的发展。这种性能的提升显而易见且具有戏剧性,它带给我们的商业利益是非常明确的”。

其次,在总体拥有成本(TCO)方面,RPMI认为华为的解决方案明显优于其考虑的其他任何解决方案。相比传统的磁盘阵列,虽然SSD提供了极大的性能改进,但其成本居高不下也是不争的事实。因此,RPMI不得不谨慎地选择解决方案供应商,除满足性能要求以外,解决方案在整个生命周期拥有有竞争力的TCO是RPMI的关注重点。

 

初始费用:Dorado2100 G2不仅具有良好的性价比,同时能很好的兼容VMware与FalconStor等软件,它在帮助RPMI提升数据中心IOPS性能的同时,也保持了现有IT基础架构的稳定,避免不必要的附加改造成本。

 

功耗与机柜安装空间:与同等性能下的传统存储阵列相比,Dorado2100 G2在机柜空间占用、功耗等方面具有明显的优势,空间节省与功耗节省均超过90%。

 

可扩展性:Dorado2100 G2最大支持3个扩展机框,当机框的数量增加时,整个设备的IOPS性能可以近似线性的增加,而访问延迟几乎没有变化。Dorado2100 G2的这种容量与性能特性,可帮助RPMI从容应对未来的挑战,提升了投资回报率。

 

最后,RPMI和C>Ways还对由华为提供的全面服务表示赞赏。在项目实施的各个方面,华为会确保RPMI和C>Ways的员工均能够全面接受新技术的培训。此外,华为还通过“above and beyond”的做法来确保该解决方案是适合英国市场的。例如,与典型的英国数据中心的环境相比,Dorado2100 G2风扇转速的设置适合于更温暖的地区,显然,这样的设置是不必要的,不仅浪费电力,更产生了多余的噪音。

“华为快速确认了问题现象、定位了问题原因,并在2周内修复了它。而其他供应商在最终确认问题之前,往往可能会迫使我们先去寻求二线甚至三线的技术支持”,Brian Scorer先生说。

参考资料

1.软件定义存储:如同云计算的概念刚刚出现时一样,也没有一个确切的定义,但软件定义存储普遍代表了一种趋势,那就是软件和硬件的分离。对于数据中心用户来说,只需要通过软件来实现对自身...详情>>

[责任编辑:孙可 sun_ke@cnw.com.cn]