西部证券股份有限公司涉及全国100多家分支机构,网络规模庞大。日常的证券交易都在交易网上进行,保证网络稳定、安全、可靠是该公司IT部门日常的核心工作。信息技术部网络维护团队负责西部证券股份有限公司总部数据中心整个网络运维工作,包含日常网络故障处理、设备故障处理、设备日常巡检,设备定时备份,设备维护等。信息技术部网络维护团队不仅要保障数据中心网络通畅,及时解决问题故障,同时还要负责日常办公网及外联区网络的正常运转。
行业特性
作为券商,西部证券在全国各地都有分支机构,总部与分支机构之间,分支机构与分支机构之间都有网络数据交互,因此必须确保网络通畅,才能保障各种业务交易正常进行。办公网、交易网和外联网,共同构成了一个庞大复杂的网络,维护难度很大。
随着西部证券股份有限公司的信息化建设规模不断扩大,其业务迅猛发展, IT业务应用也不断增多。IT网络环境复杂化使网络维护难度成几何倍数增长,IT信息科技方面的风险及隐患也在不断的加大,如何保证整个IT系统稳定安全的运行,也逐渐成为西部证券股份有限公司的管理层和工程师日益关注的问题。
在过去的IT运维管理中,由于没有一套先进的IT运维监控管理系统,使得西部证券股份有限公司对业务系统的运维管理比较被动且滞后。当系统出现严重故障时才能发现该异常,导致故障处理速度较慢,有时甚至会影响业务系统的正常运行,所以及时准确的了解设备性能、资源利用率、业务系统运行瓶颈等指标对于信息化建设有不可或缺的参考价值。
综上所述,西部证券对信息中心各项运维工作提出了更高的要求,系统管理人员的工作压力越来越大。因此,对于西部证券股份有限公司,建设一套功能先进、安全可靠的IT监控系统势在必行。
现状描述及需求分析
通过对西部证券股份有限公司的信息化建设和运维管理现状进行调研和深入分析后,了解到目前的IT运维现状:
v IT应用不断扩大,越来越多的应用和业务在网络上运行,对网络的依赖越来越大,缺少一套针对IT网络全面统一监控系统,无法及时了解IT网络的运行趋势,故障处理效率低。
v 核心网络设备重要配置文件缺乏自动备份机制,单纯的人工备份操作费时费力已经无法满足并支撑现有的运维要求。
v 重要设备syslog日志缺少有效的采集手段,当设备出现故障后无法追溯故障源头,缺少故障定位的信息来源。
v 链路故障缺少主动的监控手段,当出现故障以后只有被动相应,急需有效的监控工具来实现链路监控故障告警。
v 缺少流量分析工具,无法对流量进行详细分析,无法具体分析网络上最忙的设备/端口、设备的利用率如何、哪些设备基本闲置等,对后期的网络规划没有有效的数据支撑。
v 缺乏能够真实反映网络设备和设备运行情况与运行质量的统计分析报表,无法为决策层提供数据依据;日常设备人工巡检,人工生产巡检报告,占用大量的人力缺乏自动巡检机制。
需求分析
西部证券运维服务需要改变传统的运维管理模式,变被动式为主动式运维,切实达到7*24小时不间断运维,在保障证卷交易日常的业务网络正常运转的同时减少网络运维人员的压力。因此西部证券股份有限公司信息中心运维服务管理平台的具体要求如下:
v 建设全面的网络监控
对西部证券交易网、办公网、外联网络中所有的设备,包括路由器、交换机、防火墙以及其他安全设备的全面统一监控,故障告警、主动预警。
v syslog日志监控自动采集故障告警
能够对核心设备的Syslog日志进行收集,关键报错告警。
v 重要设备自动备份
对重要设备配置文件如Config、Startup等进行定制备份。
v 设备自动巡检
满足西部证券日常设备巡检的需求,能够定时获取网络设备Cpu、内存、相应时间(延时)等数据,并生成相应报表,支持报表导出。
v 流量监控需求
对各种主流的流量设备进行自动发现和流量分析功能。
v 对运营商链路监控
对运营商端对端链路监控,监控链路的可用性,能及时发现链路故障。
解决方案
针对网络、流量以及核心设备Syslog监控等需求,西部证券股份有限公司提引进勤智ITM基础监控、Netqt(流量分析模块)两个模块,分别部署在Windows和Linux系统上。考虑到对个别监控指标如链路监控(Remoteping)监控频度高的要求,系统采集器采用了分布式部署的方式,从而提升系统的负载能力与扩展能力。
配置备份管理
配置变更提醒
链路监控
设备运行负载
流量分析监控
方案收益
通过集中监控系统的部署,实现对西部证券数据中心,交易网、办公网、外联网等网络中的设备监控。目前,共监控网络设备400余台,运营商链路15条、核心设备Syslog日志监控34台,重要设备配置文件备份144台。
通过对设备各类数据的统一采集、分析、处理,实现了西部证券IT基础s设施网络的全面监控、主动预警。同时,通过系统自带的报表工具与指标巡检功能,实现了数据中心设备自动巡检,大大减轻了运维人员日常工作量。
通过监控系统的部署,实现了西部证券网络监控自动化,故障发现更加及时,运维不再被动。现在没有监控系统就像盲人看不见路,运维无从下手。配置备份功能、报表统计,以及指标巡检等功能,大大减轻了西部证券IT运维人员的工作量,很大程度上缓解了运维工作压力。
案例亮点
1、对于不同型号的设备编写了不同的配置备份脚本。
2、通过Remoteping实现对运营商链路的监控。
Copyright ©2005-2021 勤智数码科技股份有限公司 川公网安备 51019002003506号 蜀ICP备11012966号-7