电力行业将企业信息化列为安全生产的一个重要环节,在信息化建设的各个方面都走在前列。但是,随着电力网的不断延伸,网络管理人员不得不面对不断新增的电源点和不断增加的信息业务量,如信息工程、电力综合宽带数据网、电力电视会议系统、“95598”客户服务系统、办公自动化系统、电力市场支持系统等。众多的应用和复杂的网络导致通信的“瓶颈”时常存在,网络问题也不断发生。 手工管理和维护几乎是超出网管运维人员控制范围内的,可想而知其部门工作压力和工作负荷量是多么庞大。在传统的手工维护阶段,整个电力网络的运行对网管部门来说是黑暗的、不透明,他们经常无法在第一时间发现问题,解决问题也往往比较被动。 一、建设方案 在电力行业的计算机网络里,运行了众多的应用系统,包括对电力生产设备监控系统等应用,数据采集、视频应用等,若是这些系统出故障,将极大地影响电力行业的正常工作。一旦某一台设备没有运转,或者出现故障,贻误时间,都将是非常巨大的损失。 所以电力行业需要网管系统要具有以下几个特点: 减轻网络运维部门的工作压力,为电网的安全生产和企业信息化提供保障。 要求它可以7X24小时监测服务器和网络设备的运行状况,采集其运行的详细参数信息。 并可以对一些关键应用进行定制开发更加精确的监测; 能够将网络设备、服务器及关键业务关联起来,一旦发生故障,可以第一时间告知故障根源及影响的业务范围,将故障损失减到最低; 网管系统具备远程监测和报警功能; 可提供丰富的性能报告和图表报告; 可以进行远程浏览和维护。 二、主要功能 1. 全面的立体式监测
功能名称 | 功能描述 | 监测保姆 | 系统内所监测与管理的任意资源,均可由用户自行定制资源归属,之后,由系统辅助其进行该资源的管理、跟踪、运维、实时监控。 | 全网集中监测 | 可通过分布式、地域划分等,通过一台监测主机可以对遍布全市的大型网络进行集中管理,它不仅实现了数据采集和用户管理的分离,而且实现了大规模网络的分层分级管理。 | 关注监测 | 将重要的监测信息设置在定制化主页显示,随时随地在一个视图上了解多个重要监测信息的运行情况。 | 个性化监测 | 睿达设备监控管理平台提供的开放式的A PI接口,可以让系统管理员十分便利的添加满足需求的监控设备,满足用户特有的 监测需求。 |
2. 业务系统监测
功能名称 | 功能描述 | 视图 | 以业务系统组成结构为基础,通过图形、表格、动态变化等展现方式,表现业务系统全貌。可根据行政区域、分支结构、人员组织结构、类别等多种方式监控与展现整个IT环境内业务运行状况。 | 监测范围 | 针对业务系统主要功能是否可以正常使用、登录异常、安全性、访问量、可用性等方面进行深入监控。 | 监测种类 | 门户网站、运营系统、邮件系统、OA、DNS解析服务器等。 |
3. 数据库监测
功能名称 | 功能描述 | 应用层管理 | 全面监测数据库的运行状况正常与否,保障业务系统正常运转。 | 数据库系统资源管理 | 监测数据库的进程,数据库本身有4-5个关键进程,管理员如果不监测这些进程,很难发现问题。 | 数据库性能指标监测 | 平台的数据库监测模块支持对业界应用广泛的数据库系统的监测,包括Oracle、MSSQL Server、Informix、Sybase、DB2、mysql等,涵盖了IT应用中的主流数据库系统。 |
4. 中间件监测
功能名称 | 功能描述 | 应用层管理 | 全面监测中间件的运行状况正常与否,保障业务系统正常运转。 | 中间件性能指标监测 | 平台的中间件监测模块支持对业界应用广泛的中间件监测,包括Websphere 、BEA Weblogic、JBOSS、Tomcat、MQ、Tuxedo等,涵盖了IT应用中的主流中间件系统。 |
5. 服务器监测管理
功能名称 | 功能描述 | 主机运行管理 | 平台的服务器监测模块不但可以监测到Windows系统的相关性能,还可以监测到几乎所有主 流的UNIX 平台(例如Linux、Solaris、AIX、ScoUNIX、HPUnix等)的相关性能。 | 服务、进程管理 | 监测 Windows平台和UNIX 平台上运行的进程、服务的运行状况,例如指定进程的运行实例总数。对于Windows平台,不但能监测指定进程的实例总数,还能监测线程总数及内存总占用量。 | 安全监控 | 实时监测服务器内安全隐患,包括常见木马、病毒、漏洞等进行针对性预警,同时提供内网专用安全防病毒软件进行安全维护。 | 网络状况和日志管理 | 1)、对服务器的网卡的运行状况的监测,可以监测服务器的网卡的流量(接收速率和发送速率)、状态和丢包率等。 2)、可以监测Windows平台和UNIX平台的日志变化情况,而且对监测结果支持匹配查询、设置过滤条件等方式进行更深层次的分析。 |
6. 网络设备监测管理
功能名称 | 功能描述 | 网络设备可用性、性 能管理 | 1)、网络设备的可用性主要表现于网络设备的接口的相关状态信息,包括接口状态、接口流量、接口丢包率等。 2)、网络设备的可用性还包括cpu 利用率、内存利用率、当前连接数、会话数(session)、防火墙的性能指标(如拒绝的数据包数、丢弃的数据包、IP 欺骗攻击数、ICMP 攻击数等性能参数)、配置文件的变化情况等。 3)、对于网络设备的性能参数,提供网络设备的 CPU负载、内存使用率以及剩余内存空间等等。 | 网络流量监控管理 | 通过SNMP、netflow 协议,对网络进行实时业务流量分析,通过各种数据指标、性能报表和性能趋势图,为企业网络提供网络的容量规划、趋势分析以及数据的优先级方面的信息。 | 网络业务分析 | 平台通过CISCO 路由器的NETFLOW 协议,可以统计有固定 IP PORT的业务的流量情况,实时地了解网络中的业务分布情况。 | 异常状况管理 | 平台通过定义 (例如根据事件的来源、类型、报警级别等)实现对事件的过滤和分析、按照设置,新生成的事件可以自动识别前面的相关事件等进行管理。 |
7. 安全设备监测管理
功能名称 | 功能描述 | 基本监测 | 1)、安全设备的可用性主要表现于安全设备相关状态信息,包括接口状态、接口流量、接口丢包率、内部管理平台有效性、连通性等。 2)、安全的可用性还包括cpu 利用率、内存利用率、当前连接数、会话数(session)、防火墙的性能指标(如拒绝的数据包数、丢弃的数据包、IP 欺骗攻击数、ICMP 攻击数等性能参数)、配置文件的变化情况等。 3)、对于安全的性能参数,提供网络设备的 CPU负载、内存使用率以及剩余内存空间等等。 | 安全监测 | 防火墙流量显示主机IP、接收数据流量、发送数据流量、数据总流量、请求数。 防火墙VPN使用情况显示,VPN接收数据流量、发送数据流量、数据总流量、数据请求数。 滤掉不安全服务和非法用户,控制对特殊站点的访问,提供监视Internet安全和预警的方便端点。 | 监测种类 | 支持思科、华为、联想、绿盟等品牌安全产品监测。 |
8. 存储设备监测管理
功能名称 | 功能描述 | 基本监测 | IBM7133系列:对物理磁盘、enclosure容器及其子设备、RAID监控。 IBM FASTT系列:FastT设备名称、IP地址、轮询周期(分钟)、本次轮询时间、物理磁盘个数(个)、总容量(GB)、未配置容量(GB)、主机可使用容量(GB)、本周期可用性、本周期健康性、连续时间、设备修改。 San网络FC SWITH:固件版本、软件版本、端口、硬件传感器、工作单元。 | 监测种类 | 支持IBM7133系列、IBM FASTT系列、EMC、hp、H3C存储监控。 |
9. 机房环境监测管理
功能名称 | 功能描述 | 机房设备可用性 | 机房环境设备的可用性主要表现于该机房当日的可用性的状态信息。 | 机房设备各指标监测 | 平台的机房设备监测模块支持对多种机房环境设备进行监测,包括温度、湿度、水浸、烟感、UPS、精密空调、电压等。 | 机房全景视图 | 以真实物理机房模型为依据,实现动态、美观、试用的机房环境全景视图,可实时在线观看机房温度、水侵、电压等的变化,及时作出7*24防护预警。 |
10. 故障与告警管理
功能名称 | 功能描述 | 丰富的告警方式 | 平台提供短信息、邮件、办公助手等多种方式及时发出警报。 | 报警控制台 | 睿达设备监控管理平台报警控制台包括四个方面:配置文件及接口数据、故障事件搜集、故障事件过滤、告警呈现。 可根据用户自身需要,灵活定制各种告警阈值、发送方式、发送时间段。 | 准确的故障定位 | 可实现快速的实现故障定位,能一步定位到故障发生的设备。在报警监控界面中通过双击某报警条目,弹出报警设备的详细信息同时给出处理方式,并以醒目标记 ——不同的颜色来显示报警发生的设备,从而为企业定位故障点节省了时间。 | 故障事件处理 | 针对系统中出现的故障,系统管理人员可以及时通过故障确认、故障自动恢复、故障连锁诊断等方式做出处理。系统管理人员更可以将各种故障处理的步骤和方法写入系统中,形成知识库,这样可以有效帮助其它系统管理人员及时、有效地处理故障。 |
11. 报表管理
功能名称 | 功能描述 | 丰富的报表类型 | 可以将统计数据以 word格式或者PDF格式展现出来。报表以图标方式,从各个角度直观分析IT环境运行状况。 | 性能分析报告 | 可以为指定的监测器生成实时的报告,根据监测器监测到的数据进行统计和分析,在报告中显示监测数据的最大值、平均值和最近一次监测的结果,并可以按照不同的要求生成各种图形,以便网络管理人员随时查看各个监测器的监测数据。 | 历史趋势分析报告 | 可以根据管理员的不同层次的管理需求,定制不同监测参数的组合,选择任意的监测时间段,自动生成符合要求的历史性能分析报告。从而从宏观上把握IT资源运行情况,对报修、放弃等提供参考依据。 | 运维工单报表 | 统计每个运维人员的工作量、工作成果、检修率等,提供用户方运维管理能力与工作绩效考虑依据。 | 资产报表 | 统计资产详情、资产检修、报修、保修、报废、维护、购买等信息,辅助管理人员控制开支,节约预算,并合理规划采购流程。 | 故障综合分析报表 | 对系统中产生的各种故障信息,按照类别、时间、发生源、次数、设备管理员等方式进行分析并产生报表。 | 数据非法性报表 | 对被监测系统内,用户关注的数据进行审计与分析,对非法情况作出及时预警,并能产生统计报表。 | 入侵攻击报表 | 对非法入侵指定网络的行为作出记录、跟踪、预警通知。 |
12. 运维管理
功能名称 | 功能描述 | 强大的资产管理 | 可以记录企业中各资产情况,这些资产可以是物理存在的,也可以是逻辑存在的,并能够与设备管理中设备进行交互。 | 派工单 | 处理各类告警,详细的记录各个告警的处理人以及处理内容,不同处理人处理的情况,同类问题的处理结果。 | 知识库 | 记录各个告警的处理结果以及处理的详细信息,已备以后出现相同情况有待参考。 |
三、系统部署 REDA可以采用为分布式结构部署,小型规模的系统可以部署在一台服务器上,中大型系统可以根据需要部署在2台以上的服务器上。 根据被管元素的数量,REDA系统配置不同的服务器设备,下表仅列出目前REDA环境的最低配置。 REDA 服务器的典型配置 项目 | 参数 | 服务器型号及配置 | 当被管对象数<=50时 使用PC Server服务器GX520MT GX520MT DELL GX520MT P4 2.8G/1G Memory/80G HD/19" LCD/56K/10/100/1000M
当被管对象数>50时,推荐使用V240 Sun Fire V240 CPU: 2x1.5GhZ UltraSPARC IIIi 内存:4x512MB DIMMS 硬盘:2x73GB 4*10/100/1000M Gigabit Ethernet | 操作系统 | Windows server 2003/2008 Redhat Linux 9以上 |
四、建设目标 统一集中管理 将通常被分割管理的网络、系统、应用软件、直至企业内外依赖于IT网络的各项业务和服务,都整合于一个综合支撑管理平台,实现统一集成管理,还原其原本就不可分割的相互依赖性和统一性。 可伸缩的灵活平台架构 系统能够在网络、系统、应用等各个方向上不断扩展,在适应不断进化的IT环境的同时,不会破坏系统结构的延续性和完整性。基于插件模式的结构,可以十分容易地将新增的被管IT对象代理和监测器“插入”到系统中,扩展管理范围和能力。 系统考虑到IT环境的复杂性,采用灵活的软件结构保证了从小规模应用管理(如30个管理对象)到数万个管理对象的超大规模应用的适应性。 从业务应用出发的管理视图 通过从业务应用入口,将通常被分割管理的网络、系统、应用软件、直至企业内外依赖于IT网络的各项业务及服务,都整合于一个综合支撑管理平台,实现集中集成管理。 高度自动化的,友善的用户互操作界面 基于Web的集中管理模式,采用符合中国人员操作习惯的界面安排方式, 全中文界面和完备的帮助。 系统大量采用高度自动化器件以辅助IT管理工作,可以自动发现网络资源、资源配置、可监测项目和服务;自动生成应用拓扑;系统事件的自动实时通知;自动提取专家知识库;自动排除故障;自动触发脚本;自动执行系统任务。 五、典型案例 某省电力公司是国家电网公司的全资子公司。公司以建设运营电网为核心业务,下设多个个市级供电企业、县级供电企业,另设有电力科学研究、建设和修造等企业多个个。其电力调度数据网是各级调度中心及电力生产运行单位和有关部门进行数据通信的基础设施。电调数据网作为一个先进、统一的综合业务网络平台,承载着电度量计费系统、电力市场支撑系统、保护故障信息系统、生产计划考核与检修工作票处理系统、EMS系统、MIS系统以及RTU上网等多项业务应用系统。 随着信息技术在电力电力调度数据网的深化应用,全网所采用的网络技术日益复杂、网络设备也日趋多样化。在安徽电力快速发展的今天,公司IT网络上运行的应用系统不断增多,电力的各项业务系统对信息网络的依赖性越来越高,对系统与网络的可用性、可靠性和稳定性也提出了更高的要求。为保证诸多关键应用系统稳定运行,急需建设网络管理中心,以便及时监控信息系统状态,为公司信息系统的高效运行提供可靠保证。
|