您的位置: 网界网 > 网络学院-软件 > 正文

科来:业务性能管理构筑高效运维系统

2014年09月22日 10:56:18 | 作者:佚名 | 来源: | 查看本文手机版

摘要:7月1日,宁夏银行核心系统数据库出现故障,导致该行存取款、转账支付、借记卡、网上银行、ATM和POS业务中断37小时40分钟。

标签
金融
科来
业务性能管理

7月1日,宁夏银行核心系统数据库出现故障,导致该行存取款、转账支付、借记卡、网上银行、ATM和POS业务中断37小时40分钟。16日,工商银行由于网络设备发生硬件故障导致银证系统异常,部分银证转账交易出现单边账现象。人们不禁要问,为何在信息化技术相对发达、一向重视安全的金融行业中,仍会频频出现宕机等问题呢?到底是什么阻碍了金融行业业务系统的高效运行?我们又该如何去应对?

银行面临运维难题

金融机构在抢占市场份额、扩大客户基础、创新产品和业务模式的过程中,整个业务系统的组成也变得愈发复杂,从前端的网银、外部系统到核心前置,乃至跟第三方的相连,其中涉及的服务器、主机、应用、网络系统越来越庞大,系统之间的耦合也越来越复杂,运维难度明显加大。另一方面,大集中给总行数据中心带来的不仅是数据的大集合,还包括技术、人力,甚至业务的集合,由此带来的运维压力可想而知。而金融机构面向激烈的市场竞争不得不做出应用和业务变更,也成为了业务运维低效的原因之一。

从运维能力和运维手段来看,系统之间业务上相互独立,但维护上需要相互关联,而银行目前的运维是割裂的,不难想象各家自扫门前雪的结果将是网络、应用、数据库、主机等“各自为阵”,一旦出现故障,各个系统之间的配合难以协调。从运维人员来看,他们受制于缺乏业务知识,排查故障往往需要首先弄清业务的网络路径,再挨个筛查对业务产生影响的应用,导致故障处置周期长、效率低,不能很好地满足监管机构、银行客户,乃至银行自身的要求。由此看来,支撑核心业务系统的网络系统的运维工作,包括网络基础设施、相关的应用系统、数据库以及安全保障系统的运维已经变成一个至关重要的工作,网络系统的运维必须和企业的核心业务活动完全融合起来。金融机构网络运维需要一种基于业务网络的性能管理系统,能让网络的运维和业务的保障紧密结合起来,帮助用户提升以业务为核心的主动网络运维能力,提升业务保障工作和故障处置的效率。

形势严峻亟需更专业的运维手段

银行要保证业务持续、高效运行,有效的运维平台和工具必不可少。各个网络设备厂商虽然在其网络设备产品中集成了网络管理的功能,但这些功能仅限于对自家产品进行管理,对于其他厂家的设备则“爱莫能助”。面对现代众多金融行业用户的期望和需求,仅是对网络设备进行管理的网管系统已经不合时宜,将服务器、网络设备、中间件、数据库等纳入统一监控才是用户所需要的。另外,在我国强调自主可控的大论调下,国内厂商跟国外厂商相比,能够给用户更多安心。但不论是国外厂商,还是国内厂商,他们目前所提供的运维产品内容主要集中在ITIL流程管理、自动化和综合监控等方面,其中综合监控主要是对应用的监控,需要开发,只能做到浅层次的结合。总体来说,主要是以物理网络作为运行维护对象,而缺乏以业务网络为对象的运行维护模式。科来业务性能管理解决方案则是围绕业务系统进行的主动分析,能够做到对业务网络的实时监控及迅速定位故障点,帮助金融机构建立高效的运维系统。

当金融机构发生业务故障,它的根本需求即提高发现问题、分析问题、解决问题的效率。根据《银行业重要信息系统突发事件应急管理规范(银监办发【2008】53号)》规定,银行业金融机构在一个省无法正常开展业务半小时(含)以上便算作较大突发事件。“这意味着3个10分钟,即第一个10分钟内知道是什么问题,第二个10分钟进行讨论、做出决策,最后10分钟采取行动。但实际情况往往是10分钟内不能发现问题点,最后10分钟领导决定是否进行切换或者重启,而在不清楚问题源头的情况下就做出决定是非常冒险的。”科来技术总监高彦刚告诉记者,“科来的业务性能管理解决方案能做到在5分钟内定位故障点,这对之后快速、准确地解决问题至关重要。”据悉,至今国外各大厂商的标准维护合同中绝大部分都没有承诺修复时间。

科来业务性能管理为业务运维“保驾护航”

2009年,某银行核心业务系统出现问题,分行发生访问速度缓慢、交易堵塞等现象。在找不到问题点的情况下,银行决定进行切备,根据切换后的结果(+本站微信networkworldweixin),银行判断是主机出现了问题,这时,距离问题发生早已超过了半小时。据相关人员介绍,科来进行排查分析发现,问题在于数据中心的核心交换机的传输链路上出现丢包,针对此问题的解决过程几乎只用了“一杯茶”的时间。而银行经验主义的做法导致之前的整个决策链出现错误,无法准确、快速地定位问题,解决问题更是“无据可依”。

不同于其他厂商以物理网络为对象的运行维护模式,科来业务性能管理解决方案最大特色之一是以业务网络为运维对象。在部署之后系统会预先梳理各业务逻辑关系,建立支撑业务的应用服务、主机系统、网络路径之间的关联关系,再围绕业务系统部署分析设备,制定针对性的监控分析策略和警报策略。数据上报至UPM分析中心后,对业务网络的应用响应性能、主机服务性能、网络传输性能和交易处理性能进行智能化分析,提供集成的业务网络性能监控视图(见图1),把所有与业务相关联的分析结果(如性能异常警报、关键性能指标、多段数据对比等)集成到一起,进行图形化显示和关联挖掘,一旦发生异常,即使是不熟悉业务知识的运维人员也能根据视图快速定位问题点。“预先的业务逻辑梳理和针对性的监控分析,相当于为金融机构提供了定制化的解决方案。”高彦刚这样告诉记者。

图1

科来作为一家专注于网络分析技术和产品研发10多年的企业,其业务性能管理解决方案以最大提升业务网络的运维效率和故障处置能力为研发目标,在国内多家大型金融机构都有成功案例。科来的网络分析技术服务于全球97个国家和地区,超过87家财富500强企业都选择了科来的产品。

在最后,高彦刚表示,“帮助客户迅速、准确地定位故障点,保证业务持续高效运行是科来带来的价值,我们的产品和服务体现了科来‘为客户创造价值’的理念。现在金融机构的业务系统和网络的集成度越来越高。我们的目标是融入用户的业务网络里(包括基础网络架构、应用、主机等),使用户能够对每一个影响业务系统的网络运行环境进行实时化、智能化分析,这是科来业务性能管理系统的基础,也是金融业网络运维的未来。”

[责任编辑:孙可 sun_ke@cnw.com.cn]