您的位置: 网界网 > 网络学院-服务器 > 正文

易思捷:国产服务器虚拟化提升清华大学图书馆服务质量

2015年05月25日 13:43:20 | 作者:佚名 | 来源:

摘要:随着信息技术尤其是计算机技术的发展,图书馆的信息服务越来越依赖于计算机系统和网络。从最初利用计算机来进行纸本图书、期刊和资料的管理,到现在利用计算机直接提供电子图书、电子期刊论文和资料的服务,图书馆用于支持自身...

标签
清华大学
国产服务器

随着信息技术尤其是计算机技术的发展,图书馆的信息服务越来越依赖于计算机系统和网络。从最初利用计算机来进行纸本图书、期刊和资料的管理,到现在利用计算机直接提供电子图书、电子期刊论文和资料的服务,图书馆用于支持自身运行和读者信息服务的服务器数量已经增长到较大规模,配套设施也得到了相应增加。以清华大学图书馆为例,服务器从1996年的几台发展到2013年在使用的服务器数量达到110台,机房空间2次扩建,UPS和电源进行了3次改建和扩容,机房使用的空调也进行了3次扩容。

服务器数量的增加,虽然提升了图书馆的服务质量和水平,但是另一方面也带来了设备成本、维护成本、运行成本和人员成本地增加。为了应对这个问题,各个图书馆分别寻求不同的解决方法,例如服务外包、服务整合和虚拟化技术等。服务外包是指将图书馆的信息服务外包给第三方公司,以减少图书馆自己的计算机设备数量和维护人员数量;但是目前来说还无法达到降低成本的目的,并且通常第三方无法提供图书馆所需要的服务质量。服务整合是指将图书馆的多项信息服务整合到同一台服务器上运行;考虑到目前图书馆的应用多为第三方应用,分别有不同的需求,整合时需要考虑太多因素,或者需要花费很长时间。虚拟化技术允许在一台物理服务器上运行多个平台,从而实现将不同服务整合到同一台物理服务器的目标。近年来随着PC服务器性能的大幅度提升,基于PC服务器的虚拟化技术得到了广泛应用,越来越多的图书馆采用这项技术来控制服务器总体成本。

虚拟化技术

随着虚拟化技术的不断流行,市场上出现了许多不同的虚拟化产品,包括免费产品和商业产品。常见的软件产品有VMWare的vSphere,思杰公司的XenServer,微软公司的HyperV和易思捷基于KVM的UniServer等。

通过实施服务器虚拟化,可以将多个服务整合到一台物理服务器上,具有如下一些优点:(1)提高服务器资源利用率,节省服务器购置成本;(2)减少服务器数量,从而减少配套设施成本及运行成本;(3)可以实现操作系统级别的隔离,使得各种应用互不干扰;(4)可以根据需要动态调整虚拟机的资源分配,实现快速、动态的业务调度;(5)可以实现零宕机时间的迁移、灾难备份和业务恢复,保证业务连续性;(6)将旧服务器系统迁移到虚拟机,从而维持老系统业务持续运行;(7)采用虚拟化平台,可以快速部署应用,有助于加快开发和测试进度;(8)采用虚拟化平台,可以简化或整合服务器的管理,降低服务器的管理成本。

虚拟化规划

为了通过实施服务器虚拟化达到降低运行成本的目的,需要进行良好的规划,包括现状调查、确定目标、费用估计、实施方法及周期等。

现状分析

在图书馆2012年开始实施服务器虚拟化之前,图书馆共有110台服务器。这些服务器的用途主要包括三大类:第一种是作为CALIS工程中心,与数据库厂商合作建立的镜像站点,用于为全国高校读者提供文献服务;第二种是本校所购买数据库产品的镜像服务器,用于为本校读者提供文献服务;第三种是业务支持服务器,包括主页、自动化管理系统、整合检索、开放链接、馆际互借、虚拟参考咨询等应用服务器。

这些服务器的购置成本接近500万元,每年的维护费用按照10%计算,也需要近50万元。

另外,为了支持这些服务器运行,图书馆多次对空调、电源和UPS进行了改造和扩容。这些配套设施的购置和运行成本对于图书馆来说都是不小的负担。

配合这些服务器的部署和运行,图书馆系统部的工作人员数量也相应增加。

确定目标

考虑到图书馆服务器数量近年来不断增长,设备的购置成本、运行成本以及人员成本都相应增加,对于图书馆已经成为不小的负担。与此同时,图书馆技术人员也一直在跟踪服务器的相关技术,了解到服务器虚拟化技术已经发展成熟。

针对图书馆的现状,三种类型的应用中,后面二种应用都只对校内读者提供服务,用户数量是有限的,很多应用都不需要消耗太多的系统资源。根据图书馆多年来服务器的运行经验,90%以上服务器的平均CPU资源利用率都低于10%。因而从系统需求方面具备了进一步整合的客观条件。另一方面,由于这些系统大多由第三方开发,很多时候相互冲突,或者在发生问题相互推诿责任,所以这些服务又需要操作系统级别的隔离。

因此,图书馆确定了通过部署服务器虚拟化技术来达到缩减图书馆运行服务器数量,进而达到缩减相应购置成本、维护成本、运行成本和人员成本的目标。

预算估计

确定目标之后,需要进一步考虑实施虚拟化所需要的资金、人力等资源。首先需要考虑购买虚拟化软件的费用,以及为了实施虚拟化需要增加硬件的投资。除了软件和硬件资金投入之外,还需要考虑实施虚拟化额外需要的人员、培训等。

实施方法及周期

一般来说实施方法分为二种:一种方法是集中实施,迁移现有服务器。另一种方法是逐渐实现迁移。前一种方法的周期短,见效快,短期内需要投入较多人力和财力资源。后一种方法周期长,见效慢,但是过渡更加平滑。考虑到短时期内的人力投入有限,并且有些应用不能很快整合到虚拟化平台上,所以我们选择了逐步实施虚拟化的方案。另外,对于存储量需求很大或系统资源需求较大的系统,暂时不考虑迁移到虚拟化平台上。

平台选型

目前市场上服务器平台虚拟化厂商有很多,例如VMWare,易思捷,微软,RedHat等厂商。

对于VMWare,之前图书馆已经有一些基于Workstation版本的使用经验。它与服务器硬件具有良好的兼容性,但是它的成本较高,另外经过测试表示它对于IO密集型应用表现不够好。对于易思捷UniServer也进行了一些测试,结果表明它也具有很好的兼容性,在虚拟机上的IO性能具有更好的表现,而且它的成本更低。

经过讨论,图书馆最后决定采用性价比更好的的易思捷产品。一方面图书馆的预算有限,短期内没有太多的IT预算来支持虚拟化迁移方案;另一方面前面已经决定选择逐步实施虚拟化的方案,采用易思捷可以更好地控制项目初期成本。

为了实施虚拟化,必须要增加一些硬件服务器。根据现有服务器的数量,考虑到每台服务器整合8~10个应用,初步估计需要10台左右的双插座、四核虚拟化主机。每台服务器配置双插座、四核CPU,32GB内存。因为计划逐步实施虚拟化,所以暂时不考虑集中的刀片方案。

在存储设备的选型方面,对于虚拟化平台,存储设备的选型也非常重要,因为在虚拟服务器上存储设备的I/O性能通常是瓶颈所在。对于比较重要的应用,我们选择使用SAN光纤存储设备,以保证虚拟服务器的存储性能。对于一些次重要的应用系统(+本站微信networkworldweixin),图书馆则选择了IP-SAN存储设备,通过专用IP网络来访问存储设备,更具灵活性。

部署及实施

准备好初始阶段所需要的虚拟化平台软件和服务器硬件之后,就可以开始着手进行虚拟化迁移了。

对于大部分系统,图书馆没有考虑直接进行物理服务器到虚拟服务器的迁移,而是在虚拟平台上构建新的服务器,重新部署该应用,然后再迁移数据。这种重新部署的方法要求准备好原来应用系统的部署和安装文档,并且在部署之后要进行仔细测试。其优点是原来的系统不受任何影响,并可以暂时保留,如果新部署平台发现任何问题,可以随时切换回原来的平台,待问题解决之后进继续进行虚拟化迁移工作。

对于要迁移到虚拟化平台上的应用,应该考虑询问应用软件开发商,了解他们是否支持虚拟化架构。

在进行虚拟化迁移时,图书馆同时考虑了这个应用系统的灾难备份方案。有些应用系统在原来部署时受某些条件限制,没有考虑灾难备份,迁移到虚拟化平台之后,可以很容易地实现灾难备份,从而提高原来系统的可用性。对于关键应用还可以考虑负载均衡或高可用解决方案。

图书馆还有开发任务,基于服务器虚拟化平台,可以快速部署一个新系统,用于开发或测试目的。通过将开发系统和测试系统快速部署到虚拟化平台上,不仅可以节省开发环境的硬件投资,还能加快应用系统的开发进度。

经验

图书馆从初期几台用于测试的虚拟服务器开始,到现在部署的虚拟服务器数量已经达到30多台。尽管这二年图书馆新部署了一些应用系统,但是有些系统直接部署到虚拟化平台上,所以现在物理服务器总数已经下降到了90台。后期图书馆还将可以考虑将更多应用迁移到虚拟化平台上。

根据对UPS电源的监测,服务器机房的能源消耗有一定下降,近期内不存在容量不足的问题;根据温度监测,机房内部的空调也运行良好,近期不需要考虑扩容。所以总体来说实施虚拟化达到了绿色节能的目标。

另外,在实施虚拟化时也需要注意一些问题。首先,虚拟化平台并不是免费的,有些厂商产品的授权甚至比物理服务器还要昂贵,在规划时需要考虑周全;其次,虚拟化平台将多个系统整合到一台服务器上运行,使得服务器硬件故障会导致多个系统停止运行;再次,虚拟化平台系统维护更加复杂,需要提高维护人员的技术水平;还有,虚拟化平台会产生额外的系统开销,硬件配置需要适度提高;最后,需要加强虚拟服务器的管理,避免虚拟服务器泛滥。

[责任编辑:孙可 sun_ke@cnw.com.cn]

我也说几句

热点排行