IT运维监控管理系统招标文件可行性研究报告

1 招标要求 ....................................................................................... 3

1.1

1.2 总体设计要求 ................................................................... 3 项目建设目标与原则 ....................................................... 3

2 IT运维管理平台功能要求 .......................................................... 6

2.1 网络监控与管理要求 ....................................................... 6

2.1.1 系统工作模式 .............................................................. 6

2.1.2 网络安全设备管理 ..................................................... 6

2.1.3 面向网络的一体化管理 ............................................. 7

2.1.4 网络拓扑管理 .............................................................. 7

2.1.5 设备管理 ...................................................................... 9

2.1.6 性能管理 .................................................................... 10

2.1.7 故障管理 .................................................................... 12

2.1.8 流量管理 .................................................................... 13

2.1.9 报表管理 .................................................................... 16

2.1.10 安全边界管理 ............................................................ 17

2.2 资源监测管理 ................................................................. 18

2.2.1 服务器系统管理........................................................ 18

2.2.2 数据库管理 ................................................................ 19

2.2.3 中间件管理 ................................................................ 23

2.2.4 基础应用平台及通用服务管理 ............................... 24

2.2.5 基础运行环境管理 ................................................... 26

2.3 告警监控管理 ................................................................. 26

2.3.1 告警管理 .................................................................... 26

2.3.2 告警通知 .................................................................... 27

2.4 统一监控展现 ................................................................. 27

2.4.1 灵活拓扑展现 ............................................................ 28

2.4.2 网络监控展现 ............................................................ 29

2.4.3 业务监控展现 ............................................................ 29

2.4.4 资源监测展现 ............................................................ 30

2.4.5 节点监测展现 ............................................................ 31

2.4.6 告警信息展现 ............................................................ 31

2.4.7 灵动可视化平台........................................................ 32

2.4.8 扩展展现集成接口 ................................................... 32

2.5

报表管理 ......................................................................... 32

1 招标要求

1.1 总体设计要求

(1) 系统平台设计应该符合信息行业和本行业的标准,系统内部

数据采用标准的格式,系统构架采用标准开放的应用框架和组件结构。

(2) 为保证系统平台的统一性,要求软件/模块必须使用同一品牌,

所有软件/模块必须拥有完全自主知识产权,不能依托于其他第三方的平台。支持主流操作系统和ORACLE数据库,全中文界面,提供友好、直观、易懂的图形呈现,提供强大的信息交互与管理能力。

(3) 系统要求运行在开放的TCP/IP网络环境下,基于J2EE平台

开发,结合C++、CORBA标准和技术,采用B/S + C/S架构,支持IE7,IE8等标准浏览器,实现系统界面、业务逻辑、数据集成等功能,采用标准接口进行系统间的数据交换与数据共享。

(4) 监控子系统要求支持远程监控和代理、CLI等多种方式监测。

支持对Windows、Linux、Unix(HPUX、AIX、Solaris?)平台系统的监测,支持Syslog安全日志的管理;支持多种告警方式,能够以Email、NetSend、外部命令、Snmp设置、Trap转发、Agent执行脚本、短信等通知方式进行告警;支持对所

有监控范围内IT资源的当前和历史运行情况进行统计,并生成各种分析报表和图表。

(5) 平台要求支持统一身份认证的单点登录、统一权限管理和统

一界面展现功能;

(6) 系统平台要求提供友好的操作管理,能够根据不同管理层次

的管理要求灵活定制不同的管理界面。

(7) 系统要能够提供良好的集成接口,支持与第三方标准产品的

集成部署;

1.2 项目建设目标与原则

IT运维管理系统平台项目建设的总体目标是实现对企业的网络、设备、主机、安全系统、数据库、中间件、应用系统等IT资源的可视、可控、可管理,从根本上提高IT运维管理水平,为企业核心业务系统提供有利保障;加强对IT系统及IT资源的监控与维护能力、提高维护工作效率、改善维护工作的质量,进而保证各系统维护水平的可持续性提升。

IT运维管理平台的建设应遵循开放性、先进性、安全性、可靠性、易用性等原则:

1. 战略性原则

a) 提供具有针对性、可行性和可靠性的技术解决方案

2. 开放性原则

a) 采用符合国际国内通用的标准协议

b) 支持主流计算机平台、操作系统以及数据库厂商的各

类软硬件产品。

3. 先进性原则

a) 采用国内外监控和服务管理领域先进的技术和解决方

b) 在方案中要将监控和服务有机的结合起来,实现无缝

集成。

4. 安全性原则

a) 保证数据安全

b) 不增加现有应用系统的复杂性,更不会降低现有应用

系统的稳定性。

c) 有严格的身份认证,实施对用户真实身份鉴别

d) 采取分级用户结构,提供用户权限管理,防止未授权

的用户访问;

e) 有安全审计功能,配置审计时对生产系统不产生影响; f) 日志安全存放,并有格式化的输出,便于检索和查询

5. 可靠性原则

a) 管理系统应该在系统结构、设计方案、设备选择、技

术服务等方面综合考虑,保证系统能够安全无故障运行

b) 安装在被监控对象上的代理或探测工具占用被监控对

象的资源在5%以内;

6. 易用性原则

a) 提供简洁、方便、有效的管理工具和界面,有完整的

系统文档。

b) 提供可扩充性的接口设计以便于维护人员的日常管理

和维护;

c) 采用CS+B/S结构;用户界面应有容错能力,所用术语

应具有一致性;

d) 用户进入系统的相应功能模块后,该模块所涉及的各

项功能尽量在统一的一个界面中显示和完成,减少新界面的弹出;

e) 系统采用集中、无需代理的方式运行,无需在被监测

信息系统、服务器上安装任何代理软件,只需在一台网管机上安装,即可自动对整个信息系统进行监测和管理,不改变现有系统的应用配置,对现有系统性能影响甚微,安装实施、维护使用十分方便。

7. 知识产权保护原则

a) 要求本项目涉及的所有产品符合国家对软件产品的有

关规定,并具有相应的产品认证或许可,无版权纠纷。

2 IT运维管理平台功能要求

2.1 网络监控与管理要求

2.1.1 系统工作模式

系统采用多层架构、信息总线技术,具备良好的性能和扩展性,系统为用户提供了C/S和B/S的两种展现模式,为不同关注层面的用户服务。以方便管理人员使用C/S对网络进行专业管理,运维人员使用B/S对网络进行值班监控。

系统具有拥有灵活、高效的网络采集引擎,通过对象识别、采集并发及针对的厂商扩展脚本,可准确、可靠的提供网络设备交互服务。系统利用ICMP、ARP、SNMP、NetBIOS、CLI等标准进行网络探测和信息采集,对发现的网元对象进行识别、分析、保存,形成统一的网管资源库,并在此基础上进行拓扑计算,生成物理、网络等不同层次的拓扑结构。

通过主动(ICMP、SNMP、CLI)与被动(Trap、、NetFlow、SFlow、镜像、NetStream)两种方式,系统可以从设备上获得各类性能指标和流量数据,经过长时间数据的跟踪记录,最终挖掘分析生成各种报表,展现网管部门需要的网络流量与负荷信息,以供对网络状态的合理评估与决策。

在对网络的不间断实时监测中,系统能够收集针对网络、设

备、终端及链路的各种事件,并利用过去在网管过程中学习得到的处理规则,系统可以对这些事件进行智能分析,并关联所有符合故障特征的相关事件,最终在故障发生前、或故障发现时发出正确告警,以便网络管理人员高效、及时的定位并解决问题。

2.1.2 网络安全设备管理

全面支持CISCO、华为、中兴、北电、Foundry、Extreme、Avaya、H3C 、DLink 等各种不同厂商、不同型号的网络与安全设备,提供各类设备的基本信息、CPU / MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义SNMP监测内容。

网络设备监测项主要包括:

? 设备CPU利用率:监测网络设备的CPU使用率。

? 设备内存利用率:监测网络设备的内存使用量、内存使用率。 ? 端口速率监测:监测网络设备中指定端口的入速率、出速率、

入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速。

? 端口上下线监测:监测网络设备指定的端口的上下线状态。 ? 自定义SNMP监测:可监测多个SNMP表达式(支持四则运

算、时间差值运算等)对应的采集结果。

? ICMP连通性监测:监测与网络设备的连通性。

2.1.3 面向网络的一体化管理

管理界面友好,能够提供实时的底层网络、设备、系统、数据库和应用服务运行状态的有效监控和统计、网络边界安全保障、告警事件列表及IP资源管理等功能,每个区域可以把各功能管理项获取的底层数据按照IT基础设施内在的关联关系,根据运维人员的使用习惯进行了人性化的重新整合呈现,改变过去传统网管生硬的专业指标分割罗列的风格。

在支持典型功能外,还可以从管理人员的角度出发,把平时经常关注的设备监测视图进行重新组织显示,从管理人员的角度进行查看。

提供web客户端,管理员在网络的任何位置,甚至是外网,都可以通过浏览器访问网络监控系统的后台服务器,实现随时、随地统揽全局。

2.1.4 网络拓扑管理

提供能够提供准确直观的

1. 发现的设备种类全面

系统支持多厂商的网络设备,可以支持的厂商包括CISCO、Juniper、Huawei华为、ZXR中兴、H3C、Enterasys凯创、Extreme、Foundry、Harbour港湾、CDRS神州数码、AVAYA、 Nortel北电、3COM、ARRAY、D-Link、Maipu迈

普、Red-Giant锐捷、NetScreen、Topsec天融信、Riverstone等。

2. 拓扑发现技术手段先进

支持通过SNMP、ICMP、NetBIOS、ARP、Traceroute、Telnet等多种手段自动发现、识别设备。在支持众多国内外设备的基础上,系统还对网络类型有很好的兼容性,可以很好的发现VPN、VLAN网络拓扑,提供拓扑的动态跟踪和更新功能,能够更加有效的反应网络拓扑现状。

提供网络拓扑动态发现和跟踪技术,可以通过单设备拓扑、多设备拓扑、网段拓扑、种子节点拓扑等多种方式的拓扑发现网络拓扑准确地展现出网络的当前拓扑情况。

3. 拓扑显示视图多样

系统基于Java平台,支持远程管理协议采集,系统对B/S、C/S混合支持。支持大规模的网络管理问题,系统支持将大型网络通过按照地域、部门等划分成多个相对较小的子网实现分级管理、提供远程管理工具辅助用户对大型网络进行监控和管理。用户可以根据自己的使用习惯选择合适的拓扑视图加以监控。能够提供以下拓扑图:

? 物理拓扑——反映被管网络的实际连接的二层网络拓

扑图,方便用户直观掌控网络的实际连接情况;

? 网络拓扑——反映被管网络各个子网之间的连接关系

拓扑图,方便用户从IP层逻辑组织网络的管理;

? 子网拓扑——反映同一网段内终端与二、三层设备的连

接关系拓扑,方便用户进行终端设备连接状态的监控及故障诊断;

? Web拓扑——系统支持网络拓扑图基于浏览器的展现,

通过浏览器的方式监测网络的运行情况,WEB拓扑图通过3-N级的方式展现网络拓扑、设备状态、端口状态。用户可以通过浏览器访问,通过浏览器来查看网络运行的情况。这种显示方式的好处是方便用户穿过防火墙,随时随地进行拓扑浏览监控。

? 全屏拓扑——可以提供全屏拓扑,以便可以更为方便的

全局浏览拓扑,同时也方便进行大屏展现

4. 拓扑显示信息丰富

在拓扑图上可以浏览网络资源的详细信息,包括:

? 在拓扑图上集成设备状态、链路带宽流量、告警故障的

展现,使用不同颜色、粗细、图标表示被管理对象的状态信息;

? 提供快速查找和定位设备功能,可以通过设备名称、IP

地址、MAC地址等信息,在拓扑图上准确定位设备,并显示出此设备的网络连接信息;

? 自动记录设备的所有活动情况,如接入网络、设备迁移

及上下线信息。

? 便捷的浮动信息显示,浮动显示各类设备和链路的关键

信息;

? 集成丰富的右键管理菜单;

? 集成一些常用管理工具,如多实例ping、remote ping、

traceroute、telnet、MIB浏览器

? 拓扑图无级缩放、全屏显示以及背景图设置。

? 手工修改网络设备的配置信息

2.1.5 设备管理

系统设备管理全面及时,能够提供设备管理的快照,提供管理的设备列表,并能够提供手、自动可选的设备配置备份功能。

1. 设备管理的快照

在拓扑中可以轻松点击被监控设备进入设备运行监控界面,以Dashboard的方式浏览网络设备状态的CPU、内存、链路流量等当前运行参数,若设备出现告警事件或阈值告警,则在网络拓扑图上相关网络设备节点图标以不同的颜色显示,提示管理员进行处理。

2. 直观清晰的设备列表

设备管理将系统所发现的所有设备以列表形式展现出来,用户可以方便的查看到设备的名称、类型、IP地址、MAC地址。用户即可以查看所有设备,也可以按类型查看或按子网查看。

用户可以查询所管理的各子网网段内IP地址的分配、使用情况,以及占用该IP地址设备的上联设备及端口的详情等。

3. 手、自可选的设备配置备份

系统集成主流厂商思科、华为、华三和神码等网络设备的配置备份功能,管理员可以设置备份策略,根据管理员配置的策略,系统自动将网络设备的配置信息备份到备份服务器上。减少设备出现故障时进行设备配置恢复的时间。

对于非主流厂商设备,可以通过TCL脚本编写交互工具的方式获取相应设备配置备份来实现兼容性的扩展。

系统提供了手动备份与自动备份两种备份功能。

4. 详细的设备信息分析统计

系统可以帮助用户统计网络设备及终端设备的详细信息,不仅包括设备名称、别名、厂商、型号等基本信息,也包括设备端口的类型、端口号、IP地址、MAC地址、端口速率、MTU、端口状态以及对端端口的详细信息,此外还支持SNMP

设备的端口各类出入栈二层桢传输统计情况,如丢包率、错包率等。

系统还提供动态的网管信息展现,如端口列表、ARP表、TCP/UDP表、转发表、CDP表、STP表、设备部件表等。

2.1.6 性能管理

本系统管理平台提供了完善的被管理网络数据采集,分

析,统计和报表功能,能够通过SNMP、ICMP采集方式,对网络设备的CPU、内存、流量等运行性能指标进行轮询采集。系统进行实时采集数据分析,并保持对网络性能和设备性能的跟踪和趋势分析。

1. 监测指标丰富

系统支持网络性能实时监测,能监测所有网络设备的当

前运行负荷状况,包括:当前CPU利用率、当前内存利用率、入流速、出流速、入包速率、出包速率,到网络设备的端口流量、丢包率、错包率、Ping延时和丢包等运行参数超过预设阈值时,并能在拓扑图上根据用户定义阈值以醒目颜色显示。同时,系统提供对主机操作系统CPU、内存和硬盘使用情况的实时监控。此外,系统还提供对典型Web服务的可用性监控,如HTTP/HTTPS、FTP、DNS、DHCP、LDAP等常见应用服务,并且系统同样支持对主机和Web服务监控的阈值告警功能。在实时监测的基础上,系统还提供对历史性能数

据进行统计分析功能。

网管系统提供的实时性能监视可以实时监控网络设备的

端口流量和丢包率等性能指标,并可以方便的给出这些指标的趋势、平均值和最大值,为故障的预测提供有力的分析工具。

通过系统能够设置性能的采样周期,能够以图形方式显示性能指标,并可根据用户的需要定义监测的指标。

2. 多层面性能监测

系统为网络管理员提供多角度的监测。除了提供网络、物理拓扑显示的图形性能提示外、还为网管员提供主动的面向设备的负荷监测、面向链路的流量监测、面向终端的活跃度监测等多层面的性能监测。

? 面向网络设备的负荷监测

能够监控到网络设备的CPU和内存使用情况,通过监控网络设备的负荷情况,将被动管理化为主动预警,随时可发现网络的隐患。

? 面向链路的流量监测

链路性能直接体现网络上数据传输质量。网络上的延迟过长、瓶颈或丢包错包率增高都将会影响网络提供服务的质量。在拓扑图上通过节点的颜色变化、链路的颜色变化、总览列表的带宽占比统计,可以让用户从集成化界面中全面评估网络的

整体性能状态,快速定位出网络的瓶颈和隐患。

? 面向终端的活跃度监测

终端活动快照列表记录了所有终端设备的当前运行状况,内容包括:设备名称、设备IP地址、上联交换机端口、当前在线状态、上次Poll时间、当前流速、当前包速、平均包大小,方便用户进行故障诊断和病毒分析。此外,还提供终端活跃度历史统计。

3. 监测配置简单

系统配置界面友好、过程简单,且配置完即可生效。同时,系统具有自动评估监测的能力,能够自动生成配置。另外,性能的阈值可在配置时设定,性能达到或超过阈值可触发各种形式的告警,如:邮件、短信、声音等。

2.1.7 故障管理

通过系统故障管理,系统能够对故障信息进行搜集、分类、归并、压缩及告警通知,帮助网络管理人员即使定位故障源、故障类型及故障波及范围等,帮助管理员来解决日常出现的各种故障,从而确保在规定的时间期限内使网络重新投入运行。

系统能够自动获得整个IT环境的各种事件,包括网络设备的故障,性能的过载,流量的异常,服务器的异常性能,各类应用的故障,各类终端的变更等等。通过系统故障监控台,用户能

够对整个IT环境的运行情况一目了然。

1. 统一的故障分析引擎

系统通过内置的事件分析引擎,对获取的事件进行实时的压缩、归并,建立集中化的以故障为导向的集中告警展现。方便运维人员实时查看网内所产生的故障。

? 通过对事件进行过滤、归并、相关性分析、传递等分析处

理。将处理过的事件保存在数据库中。支持对故障持续时间较长的告警级别自动升级处理,支持用户自定义故障类型。

? 对事件的严重级别加以分类,并分别通知相关人员(如:

普通故障就只通知网络管理员,重大故障同时通知主管领导和网络管理员);不同的用户可以为自己定义自己的过滤和通知策略。

? 故障管理能够实时监视并截获网络运行过程中所出现的

故障,确定故障位置,以声音、电子邮件、短消息等多媒体方式通知网络管理员,并给出故障原因。

2. 多种告警类型

系统根据故障来源及故障信息所属专业将告警信息分为以下几类:

? 网络故障告警

监测到链路或设备故障时,尤其是骨干链路Up-Down、核心设备离线等,发出故障告警信息。

? 网络性能告警

监测到网络设备、服务器的端口流量、丢包率、错包率、Ping延时和丢包、CPU利用率、内存利用率、磁盘利用率等运行参数超过预设阈值时,发出故障预警信息。

? 网络安全告警

? 非法设备接入告警:未经过合法登记的设备接入网络

后,系统自动进行告警,并根据配置采取主动拦截等

联动处理。

? IP地址变更告警:IP/MAC/PORT地址绑定之后,如果

出现用户私自更改IP地址的情况,系统发现将主动发

送告警。

? 主动接收设备Trap信息

系统能够主动接收网络设备、防火墙等设备发出的Trap故障信息,并在告警台统一展现给用户。

3. 直观的告警列表

系统把告警事件按节点和严重级别进行排序,并提供包括来源、描述、发生时间、告警名称、告警等级在内的详细列表。

4. 灵活的告警通知

系统提供了丰富的故障通知方法,包括:声、光、Windows消息、EMAIL、短信等方法,用户也可自己编写处理程序进行处理。

5. 集成多种故障诊断工具

系统提供了各种工具帮助用户进一步监测故障的原因,包括:SNMP工具、Telnet、Ping、Tracert、NetBIOS、RemotePing等等,辅助用户排除故障。

2.1.8 流量管理

系统为用户提供了细颗粒度的流量分析管理工具Flowmon,实现从端口到应用的广泛流量分析和统计。

通过Flowmon,系统能够实时监控系统流量,而不是历史数据回放;系统无须配置成本高昂的硬件探针即可实现设备实时流量的采集分析,从而避免在网络中引入新的故障点。

1. 支持多种流量采集手段

系统提供多种流量采集的方式,支持端口镜像流量、

sFlow流量、Netflow流量等,Flowmon可以同时支持多个网卡和多种采集并行的流量分析,并为数据分析提供一致的访问界面。

考虑到网络数据流量分析的数据量十分庞大,系统不会保存所有的原始流量数据信息,而是仅仅保存分析加工后的归并

信息,从而降低服务器的存储要求。

2. 多维度实时流量分析

系统支持对流量实时分析,当流量数据采集到Flowmon之后,系统会对流量数据开始进一步的分析,提取有效的数据信息,主要通过以下处理过程:

? 数据过滤:可以通过地址、端口、协议等条件设置数据过

滤器,滤去不需要的干扰数据。

? 流向分析:对数据包包头或者xFlow的包信息进行解码,

获取数据包的流向信息,用于分析数据的来源和目的地,通过分析矩阵获取每个网络节点的流向情况。

? 层次分析:系统对数据包进行1-7层的划分,用于分析全

局的数据流量。

? 协议分析:系统会进行协议级别的数据分析,系统采用了

CSPAE分析引擎进行TCP/UDP数据流分析,可以分析大多数的常见TCP/UDP协议,包括:HTTP、POP3、SMTP、FTP、SNMP、DNS等常见协议。

? 应用分析:系统会对一些动态协议进行应用级别的7层包

头分析,从而可以掌握BitTorrent、eDonkey、MSN等P2P和即时通讯协议的流量情况。

3. 通过流量分析辅助网络的异常判断

? 全局统计

通过对流量的分析,Flowmon可以对采集到的数据进行整体的评估分析,让用户了解网络的整体情况,主要包括:

? 全局流量统计:从整体角度对网络流量的数据包情况进

行统计,包括数据包的长度、TTL、总体流量、总体协议分布、总体TCP/IP协议分布、TCP/UDP端口分布等。 ? 终端流量统计:从整体对终端流量的进行统计和排序。 ? 协议统计

系统从协议角度对网络数据行为进行分析,并按照终端形成排名,便于管理员掌握网络中协议的分布和重点终端的数据行为。通过协议流量排名分析,可以有效地发现ARP病毒、蠕虫异常流量、BT流量、网络异常流量等行为。

? 协议整体分布:从全局协议、TCP/IP协议两个级别提供

协议的分布。

? 全局协议的排名分析:从终端角度对全局的协议进行排

名分析(按照TCP/UDP/ARP/ICMP/IPX/IGMP/OSPF等分类)

? TCP/IP协议排名分析:从终端角度对TCP/IP协议的组

成进行排名分析(按照HTTP/FTP/Mail/Telnet/…/SNMP/BitTorrent/eDonkey/Messenger等进行分类)

? 会话统计

系统通过对流量的流向进行分析,并对TCP会话进行监测,从而获取各个网络节点的流量和会话统计信息。主要包括:

? 终端流量通讯矩阵:以矩阵的方式展现终端之间的通讯

关系和通讯流量。

? 终端流向统计:本地网络和外部网络,多个VLAN之间

各个终端的流量统计排名和总流量。

? 终端会话统计:终端TCP建立会话的统计,按照TCP

的端口进行展现。

? 终端统计

系统从单个终端节点的角度,分析单个终端的网络数据行为,主要包括以下几个方面:

? 终端总体分析:包括活动时间、总的数据流量和包数、

基本协议对比等

? 最近24小时的流量统计:每小时的发送、接收流量的统

? 数据包的统计:从TCP会话、TCP 标志包、异常数据

包三个方面对数据包进行统计

? 终端协议分布:终端使用的各种协议的分布图

? 其他统计:包括ICMP协议统计、最后一次的数据通讯

统计等。

2.1.9 报表管理

系统能够为用户提供性能、告警、状态、资源多个角度的统计和分析报表。

系统具备报表自定义扩展能力,通过报表设计器,可以定制更符合需求的报表。用户对相应的系统监测数据进行统计后,能够以报表形式展现分析统计结果。报表包括:网络运行统计、节点延时统计、节点端口流量统计、设备CPU负载统计、设备内存占用统计、主机CPU负载统计、主机内存占用统计、Oracle数据库运行统计、服务运行统计等

1. 端口I/O流量报表

通过网络设备的端口对流量进行统计,并以报表的形式进行展现统计结果。

2. 设备故障日/月报表

系统平台提供统一事件管理来解决分割管理的数据融合问题,通过以告警事件为导向,提供了清晰的、集中的事件管理。可以让管理人员对整个IT环境的各种硬件和软件系统的实时事件信息收集,对各类事件信息进行过滤、、压缩、归并等相关性分析与处理,智能化压缩处理海量告警事件,分析出真正的问题所在,实时呈现出完整的事件信息,并将

这些信息分发给负责服务水平监视的操作管理员。

系统支持以日/月为单位实时呈现所有的网络、系统、应用、安全、桌面等被关注的资源。

3. 设备清单报表

以直观的方式显示设备当前的运行状态。

系统能够根据设定,统计指定的子网内各设备上端口的运行情况。让管理员能够直观的掌握设备上的端口数量以及端口的使用情况,科学有效地分配设备的端口使用,提高网络环境的运行效率。

4. 性能报表

系统能够根据不同层次管理员设定的不同监测参数组

合,自动生成所需的性能分析报告,提供的性能报告能够针对网络所有的被管理资源(服务器、数据库、中间件)的关键性能指标(CPU、内存、磁盘、进程使用情况)进行详细的展现,系统还能根据设定自动将历史报告发送给相关人员,提高决策效率。

5. 自定义报表

系统提供的内置报表,若无法满足现有需要,可以通过客户化工作。

2.1.10 安全边界管理

系统提供IP地址资源管理,对网络边界的安全和IP地

址的户籍进行管理。系统通过内置的设备合法性监测引擎,在不额外消耗网络带宽的情况下,自动发现和监测网内终端设备的基本属性(IP地址、MAC地址、主机名、连接的交换机端口等),系统能够通过IP/MAC/主机/组织/人等信息绑定,建立IP资源信息库。IP地址使用情况详细列举出系统发现的各子网内IP地址的使用情况,包括IP地址、设备

名、端口号、端口名称、IP状态、上联设备、上联设备IP、上联设备端口等。

边界按照IP地址的“户籍表”,监控网络中IP的使用情况,对非法使用的IP地址进行拦截,将非法的IP终端隔离出网络,确保用户不能随意修改IP地址和防止IP地址盗用。

网络边界管理提供了IP地址使用的高级审计功能,方便对IP地址的使用进行历史审计和追查。

系统能自动跟踪终端的变化情况。发现有未经登记的设备、或违反IP/MAC/交换机端口绑定规则的终端设备进行告警。

系统能够通过IP/MAC/PORT绑定实时发现是否有非法设备接入局域网络及是否有用户私自更改IP地址的行为;根据安全策略配置通过手动或者自动的方法将非法接入设备隔离出网络,或者将已被拦截的设备重新开通网络连接。有效保障了网络的安全。

? 拦截与放行设备:手动或者自动(根据安全策略配置)将

非法设备隔离出网络,或者将已被拦截的设备重新开通网络连接。

? IP/MAC/PORT绑定:IP/MAC/PORT地址绑定之后,能够

实时发现是否有非法设备接入网络及是否有用户私自更改IP地址的行为,如果用户私自更改IP地址,系统主动发送告警信息。

? 终端合法性监控:系统通过业务监控系统的合法性监测引

擎,能在不额外消耗网络带宽的情况下,自动监测网内终端设备的基本属性(IP地址、MAC地址、主机名、连接的交换机端口等),对私自变更设备信息进行告警。

2.2 资源监测管理

系统集网络安全设备、应用服务和基础支撑系统等监测管理于一体,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX等远程监控手段和Broadview UniAgent代理监测,各类标准应用协议仿真,拥有了500多种监测器,提供对整个业务网络的7X24不间断监控。

? 强大监测插件体系

无需二次开发,通过监测插件,不断增加监测器数量,扩展监测范围与内容。众多监测器工作独立,互不影响,保证整个监

测体系的稳定运行。

? 灵活的监测时间调度机制和智能化的监测阈值模型

自定义监测时间与监测阈值,形成多样化、组合型监测策略,满足复杂环境下不同的监测任务要求。

? 主机代理Agent监测和远程无代理监测两种监测模式

多方式、多手段的自由组合,兼顾业务网络各部分性能影响,适应不同监测条件。

2.2.1 服务器系统管理

系统能够管理和监测Windows、Linux、IBM AIX、AS/400、HP-UX、SUN Solaris、SCO Unix等不同操作系统的服务器或集群的运行状态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等信息的分析与监视。帮助用户及早发现服务器系统的性能瓶颈与故障隐患。

服务器监测项主要包括:

? 主机基本信息采集:主机的基本信息,包括:CPU数目、机

器型号、系统名称、系统版本、IP地址、内存大小、总线程数目、磁盘名称等。

? 主机CPU使用率:监测主机系统的CPU使用率。

? 主机内存使用率:监测主机系统的内存使用量、内存使用率。 ? 主机磁盘使用率:监测主机系统的指定磁盘使用率。

? 主机磁盘IO监测:监测主机系统的磁盘TPS数、磁盘写操

作速率等、每秒完成IO读写次数、每秒读写扇区数、每秒读K字节数、平均I/O队列长度等。

? 应用进程监测:监测主机系统中指定应用进程的内存使用量、

内存使用率、CPU使用率。

? 系统服务监测:监测主机系统中指定服务的运行状态

? 主机当前登陆用户信息:当前登录用户登陆的时间、终端IP、

终端名称

? 主机端口速率监测:监测主机系统中指定端口的入速率、出

速率、入丢帧速、出丢帧速、单播入帧速、单播出帧速、非单播入帧速、非单播出帧速、入错误帧速、出错误帧速等。 ? 主机重要文件监测:监测主机系统中指定的文件大小。

? Job基本信息采集(AS/400):监测Job的名称、CPU使用率、

类型、状态、所属用户等。

? ICMP连通性监测:监测与主机的连通性。

? HACMP集群状态监测:监测集群的可用状态及子节点的状

态。

? 自定义指标监测:系统提供了通用监测器,用户可以通过编

写shell或者groovy脚本自定义监测指标

2.2.2 数据库管理

根据预定义的监测项目对Oracle、SQL Server、Sybase、DB2、Informix 、MySQL等多种数据库,按照属性相关性分为数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监测组,分组监测数据库系统的性能、事务、连接等性能数据。

? DB2数据库监测

? 基础监测:最后一次备份时间、数据库状态、数据库激活

时间、当前连接数、连接总次数

? 缓冲池信息监测:各缓冲读写次数、命中率

? 锁监测:死锁数、锁等待率、锁升级率

? 锁表信息:锁状态、锁模式、表空间、Schema

? 排序信息监测:应用排序数、排序溢出百分比

? 表空间监测:已使用页、表空间类型、页长、总页数、表

空间状态、空闲率、空闲页、使用率、预取大小、扩展数据块大小

? 表空间容器监测:使用率、总页数、已使用页、容器类型、

表空间名称

? Oracle数据库监测

? 基础监测:表空间使用率、连接会话数

? 高级队列监测:ready消息数、错误的消息数、消息平均

访问时间、消息总数

? 归档目的地监测:归档目的地类型、归档目的地状态、归

档目的地可用空间、归档目的地可用空间百分比、归档目的地位置

? 基本信息采集:使用spfile启动、只读模式、归档路径、

例程开始时间、限制模式、归档模式、例程名、并行状态、位长、DB版本、DB名称、主机名、实例状态

? 检查点监测:发生检查点数、完成检查点数

? 数据文件监测:文件大小、读次数、写次数、读时间、写

文件块数、读文件块数、读写文件块数、写时间

? 全表扫描配置: RSRATIO值、LTSCANRATIO值 ? 资源锁定监测:锁定时长

? 碎片监测: FSFI值

? PGA配置:PGA内存及各区域大小、实例处理性能等

? 进程资源消耗监测: 可用PGA百分比、可用PGA、已

分配PGA、已使用PGA

? 命中率监测:共享区字典缓存区命中率、多次解析(重装)

的条目比率、高速缓存区命中率、共享区库缓存区命中率、磁盘排序与内存排序比率、回退段等待次数与获取次数比率

? 递归调用信息监测: 递归调用百分比、时间间隔的递归

调用百分比、用户调用数、递归调用数、递归-用户调用比率、递归调用速率

? Redo日志配置:重做条目的平台大小、多种请求成功/失

败比率、错误次数等

? Rman备份监测: 增量备份大小、全备份大小

? 回滚段:大小命中率、等待率、等待次数、活动事务数、

翻转次数 、扩展次数、一致更改率、收缩次数、用户回滚率

? 会话监测:会话ID、用户名、CPU时间、排序次数、缓

冲区命中率、读次数、写次数、提交次数、占用游标数、扫描次数

? SGA配置:共享库缓存大小、SQL缓存大小、数据字典

缓存大小、共享池大小、重做日志缓冲区大小、高速缓冲

区大小

? SQL监测:使用内存、执行时间、SQL语句、用户 ? 转存空间监测:转储空间使用率

? 表空间监测:未使用Extent数量读时间、最大Extent数量、

已使用率、已使用量、未使用量、未使用百分率、允许最大空间、是否自动扩展、写时间、Segment管理方式、表空间类型、当前Extent数量、下一个Extent大小

? 表状态监测:增长速度、索引大小、数据大小、表空间、

用户

? 撤销空间监测状态监测:快照太旧错误计数、无空间计数 ? 作业队列监测:破损作业数量、过期作业数量、失败作业

数量

? MySQL数据库监测

? 基础监测:缓存查询数、连接数

? 数据库大小监测:数据库大小

? SQL Serve

? 基础监测:连接会话数、CPU使用率、数据文件大小、日

志文件大小

? 基本信息:阻塞进程数、处理器名称、Windows版本、处

理器数目、主机名、内存(MB)、数据库数目、会话数目、启动时间

? 数据库大小:数据大小、数据库大小、未分配大小、未使

用大小、索引大小、保留大小

? 文件监测:路径、增长方式、容量、文件组、数据库、大

? 会话监测:最后处理时间、命令、数据库、CPU时间(ms)、

内存(KB)、程序、建立时间、用户、状态、主机

? Informix数据库监测

? 基础监测:回滚数、死锁数、写缓存命中率、读缓存命中

率、数据库连接数

? 检查点监测:检查点速率、检查点等待速率

? DbSpace监测:数据空间使用率

? 磁盘读写监测:页写速率、页读速率、物理磁盘写速率、

物理磁盘读速率

? 锁监测:锁请求速率、锁超时率、锁等待率、死锁率

? 日志读写监测:物理日志页面写速率、物理日志写速率、

逻辑日志页面写速率、逻辑日志写速率、逻辑日志记录写速率

? 共享内存监测:块写速率、缓冲区写命中率、缓冲刷新到

磁盘速率、Foreground写速、缓冲区等待速率、LRU写速率、顺序扫描速率、Latch等待速率、缓冲区读命中率

? 排序监测:内存排序速率、磁盘排序速率

? 事务监测:事务提交速率、事务回滚速率

? Sybase数据库监测

? 基本信息采集:DBMS名称、DBMS版本、系统信息、产

品版本、主版本号、产品名称、次版本号

? 数据库监测:使用百分比、已使用大小、数据大小、空间

大小、索引大小、未使用段大小、数据段大小、段总大小、索引段大小

? 会话监测:数据库、命令、已用内存、CPU时间、IO读

写次数、程序、主机、用户、状态

? 事务监测:系统事务交易总数、每秒回滚事务数、每秒事

务数

? 设备监测:属性值

? 数据库:CPU使用率、数据库空闲表空间、数据库表空间、

连接会话数

2.2.3 中间件管理

产品支持对Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Tibco、Resin、TongWeb、等各类不同中间件,提供包括配置信息、连接池、线程队列、负载监测、通道情况监测等多类监测组,分析与监测中间件的各项运行状态参数。

中间件监测项主要包括:

? 系统信息采集:监测中间件基本信息,包括:操作系统、操

作系统版本、当前可用堆栈及大小、当前目录、重启次数、开启线程数。

? JVM使用监测:监测JVM的堆栈大小和使用率。

? JDBC链接池监测:监测指定JDBC连接池资源连接情况。 ? JTA事务监测:监测中间件中数据处理事务的活动情况。 ? 线程池监测:监测指定线程类的线程平均数、空闲线程平均

数以及线程吞吐量。

? Servlet监测:监测指定Servlet执行和调用情况。

? EJB监测:监测指定EJB激活次数、钝化次数、缓存个数、

事务提交次数、事务回滚次数、事务超时次数、访问次数。 ? WEB应用监测:监测指定Web应用中Session的当前个数、

最大值以及累积个数。

? JMS队列深度监测:监测中间件中JMS消息队列活动情况。 ? MQ通道情况监测:监测MQ的通道情况,包括:每秒接收

字节、每秒发送字节、通道状态、发送间隔、事务数。

? MQ队列深度监测:监测MQ服务的消息队列的队列深度。 ? Tuxedo负荷监测:监测Tuxedo的机器状态是否被激活、每

秒处理的队列服务数每秒入队的队列服务数、当前客户端数、当前WorkStation客户端数。

? TongWeb数据连接池监控:监测国产中间件Tongweb数据库

连接信息,如最大、最小连接数,可用、创建、关闭、等待连接数等

? TongWeb应用性能监控:主要监测系统线程情况、请求队列

情况、吞吐量、发送接收字节数等信息;

2.2.4 基础应用平台及通用服务管理

状态提供对IIS、Apache 、-Domino等基础应用平台的基础信息、连接测试、基本负载等重要信息的监测。

有效实时地分析HTTP/HTTPS 、DNS、FTP、DHCP、LDAP等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本上解决服务响应性能的问题。 ? Domino服务器监测

? 基础监测:监测Domino服务器的内存占用值、指定数据

库的使用率、待发邮件数、僵死邮件。

? 基本信息采集:采集Domino服务器的基本信息,包括:

Domino版本、数据库存放路径、CPU个数和CPU类型信息。

? 负载监测:监测Domino服务器当前负载情况,包括:每

分钟交易数、每分钟最大交易数、交易总数、当前用户数、最大用户数、当前任务数。

? 复制(Replication)监测:监测Domino服务器复制情况,包

括:成功复制次数、失败复制次数、删除文档总数、增加文档总数、修改文档总数。

? 邮件服务监测:监测Domino邮件服务情况,包括:死邮

件数、路由邮件数、待路由邮件数、已投递邮件数、待投递邮件数、平均邮件大小、最大邮件大小。

? 缓冲池监测:监测Domino缓冲池的使用情况,包括:缓

冲池大小、缓冲池使用值、缓冲池最大值、扩展管理池使用值、扩展管理池最大值、NSF使用值、NSF最大值。

? 扩展管理池监测:监测Domino扩展管理池的使用值、最

大值。

? Apache负载监测:监测服务器是否连接,采集CPU负载、正

常运行时间、响应时间、累计访问数、累计访问数据处理、每秒请求数、每秒处理字节数、每请求处理字节、忙作业数、空闲作业数等指标。

? IIS监测主要包括:

? 连接监测:监测IIS服务运行时间、服务运行时间、尝试

登陆/秒、尝试连接/秒、当前连接数、最大连接数。

? 传输字节监测: 发送字节/秒、接收字节/秒、传输字节/秒、

服务运行时间、接收文件/秒、发送文件/秒、找不到文件的错误数、服务运行时间、传输文件/秒。

? 用户监测:服务运行时间、最大非匿名用户数、非匿名用

户/秒、匿名用户/秒、当前非匿名用户数、当前匿名用户数、最大匿名用户数。

? WEB请求监测:post请求/秒、head请求/秒、其他请求/

秒、服务运行时间、get请求/秒。

? WEB服务器可用性监测:监测http、https和Web Service服

务器是否连接以及是否正常运行,可以监测指定http的URL路径是否包含或者不包含指定内容。

? 标准邮件服务器监测:监测pop3、smtp邮件服务器是否连接

以及是否正常运行,可以监测具体的邮箱的邮件数以及邮箱使用量。

? 基础服务监测主要包括:

? DNS服务监测:监测DNS服务器是否连接以及是否正常运

行,可以监测指定域名是否正确解析。

? FTP服务监测:监测FTP服务器是否连接以及是否正常运

行,设定已FTP方式登录该资源的阈值,监测指定文件是否存在。

? 通用资源监测主要包括:

? TCP端口监测:可监测多个TCP端口,并采集连接时间,可

指定端口开启或者关闭时告警。

? 通用SNMP监测:可监测多个SNMP表达式(支持四则运算、

时间差值运算等)对应的采集结果,并可设定告警阈值。

2.2.5 基础运行环境管理

对于IT环境系统,系统支持各种智能设备的快速监测,同时通过SNMP、数据库接口等其他接口方式可以实现客户化的扩展监控,监测内容包括基础运行环境的温度、湿度、漏水、烟感和电源、UPS、智能空调等。

2.3 告警监控管理

2.3.1 告警管理

? 事件分析

系统具有强大灵活的事件分析功能,能够智能识别各类不同来源的原始事件。通过内建的智能事件分析引擎,对标准化后的原始事件进行可靠过滤、重复压缩、对齐归并与依赖关联,自动修正告警记录,最终形成有效告警。

? 自定义事件解析规则

用户可自定义编辑和导入解析规则库文件,自主制定事件解析规则,同时支持第三方MIB库的装载与自动解析。

? 基于iBDM的事件关联分析

事件的产生以及其影响都不是独立的。基于业务影响依赖模型iBDM的事件关联分析,自动发现关联,追溯事件影响、定位问题,发现问题根源。

? 告警台

作为告警管理平台,呈现最新告警信息,并以最近24小时、最近一周、最近一个月等不同区间统计最近的告警记录,提供自定义刷新、告警确认与消除等告警管理操作。

? 分等级告警

产生的告警信息分为提醒、警告、次要、重要、紧急五个等级,用户可以根据告警等级安排告警处理的优先次序。

? 分类查询

借助按资源与按节点的分类导航,快速搜索分类告警记录;支持通过告警信息的事件等级、时间、类别、名称、资源等组合

条件进行自定义查询。

? 告警的关联特性

点击具体告警,会列举告警关联的事件,同时展现事件的详细信息、问题资源信息和依赖关系图等,方便分析故障详情。

2.3.2 告警通知

? 多样的通知方式

支持短信、邮件、语音等告警通知手段。

支持外部命令、UniAgent执行脚本、NetSend、 Snmp设置、Trap转发等告警处理动作。告警处理动作将按预定义,自动在告警发生后执行,先一步尝试恢复业务正常运行。

? 灵活的通知策略

根据不同的告警事件来源为它们指定不同的通知和处理方式,组成全面告警通知策略。

? 强大的扩展功能

2.4 统一监控展现

通过统一监控展现功能,能够将不同类型的设备、系统、应用等资源的监控平台进行集成,避免使用多个系统进行监控管理。通过综合的展现平台来同事展示各种监控视图,以便于运维人员在一套系统上统揽全局。

运维监控通过集成底层监控产品,能够提供从资源、节点、网络、业务等多角度、层次化的监控信息集中展现,并可通过服务台和个人桌面集成底层监控平台的监控界面和数据,以支持上层的运维工作。

2.4.1 灵活拓扑展现

IT运维管理系统中的灵动拓扑展现与灵动可视化平台实现同步,系统可以根据运维人员在灵动平台中创建的各类视图来显示资源配置、运行状态等信息。

灵动拓扑展现不仅可以展现IT资源的逻辑物理关系,还可以查看视图中资源的运行状态。拓扑图中的任一设备或者链路都会以浮动框的形式显示其基本信息与运行状态。同时,通过点击节点,可跳转至相关联的视图或相关联资源的详细监控界面。

IT运维管理系统作为运维与监控平台,其自身收集与处理了大量IT部门运维所需要的各方面信息,包括:资源配置库、监控性能与状态等。这些信息需要通过多种方式进行展现,而IT运维管理系统正是通过灵动可视化平台来提供此能力。

灵动可视化平台集模型编辑和模型展现于一体,方便用户绘制网络拓扑、业务拓扑、机房视图及其他结构图。其使用最新的Flex富客户端展现技术实现,可以自由的组合数据源提供的信息,以图形、表格、拓扑等形式,提供于用户,并支持用户的操作交互,以进一步挖掘数据。

2.4.1.1 展现能力

灵动可视化平台提供了超过600个基础模具库,涵盖了普通图形、各种厂商设备图标、设备面板等各类图形组件。通过将这些图形组件组合在一起,并为其关联恰当的业务数据源,按需表现多种逻辑物理环境。如局域网络拓扑图、业务系统图、机房布局图、设备面板图等。

2.4.1.2 交互挖掘

系统具有基于Flex展现技术,还具有基于WEB的交互能力,在平台提供的图中,用户可以通过鼠标点击,与图中的元素(图形、表格)等进行交互,可以获取到进一步的资源详情、挖掘数据与切换观察视角。

用户也可自定义图表事件,进一步扩展图形交互,集成其它监控系统的页面功能。

2.4.1.3 编辑扩展能力

由于系统的业务架构经常会产生变化,因此系统实施时确定的各种拓扑图也会随之改变。为了提供现场的编辑能力,系统需提供所见即所得的编辑工具,无须使用各种复杂的配置脚本,而通过WEB上的画图工具,完成图形的编辑与创造。

2.4.1.4 数据可视化感知

灵动可视化平台可展现的信息,通过数据源的支持,可以让灵动图形中的各类对象有了灵活生动的展现,平台可以通过数据信息、状态的绑定,实现拓扑可视化的动态展现和交互,灵动平台支持多数据源提供,默认采用CMDB配置资源库,根据CMDB配置库提供的定义信息分类组织数据对象,用户可直接拖动这些数据对象到图中,以完成用户理想的视图。

2.4.2 网络监控展现

IT运维管理系统中的网络运行监测与网络监控平台实现同步,集成网络监控平台的相关功能,系统可以将各种网络监控指标进行统计后分类以视图的方式显示。

? 网络拓扑

网络拓扑不仅可以展现网络主拓扑图,还可以递进式挖掘多级子拓扑,进行逐层嵌套组织显示。拓扑图中的任一设备或者链路都会以浮动框的形式显示其基本信息与运行状态。同时,通过点击节点或资源链接,可跳转至相关对象的详细监控界面。 ? 网络监控视图

网络监控视图提供了关注网络整体运行表现的全局视角,网络的各类指标均在其中得到体现,如反映管理对象的系统统计信息、反映端口速率排行前10位、CPU使用率前10位、内存使

用率前10位、节点连通延时前10位的列表信息、最新网络告警事件列表及统计排名等。内容的增减与组织方式可根据用户的需要与习惯随意调整。

2.4.3 业务监控展现

IT运维管理系统的业务监测视图以业务系统为核心,集成业务监控系统的相关功能,统一展现支持业务系统的网络/安全设备、系统、中间件、数据库、通用服务和基础应用等各类资源,紧贴用户思维,由粗线条到细颗粒度地逐层展现业务系统的运行状况,满足企业或单位以业务为最终服务目标的IT管理思想。

2.4.3.1 业务应用拓扑

业务应用拓扑支持有向关联,业务系统各关联资源根据业务影响方向组成业务支撑网络。针对业务网络的告警事件,依靠基于iBDM的事件关联分析,自动分析判断节点间依赖关系,快速定位业务故障根源。

2.4.3.2 业务监测视图

业务监测视图提供业务系统的基本信息、资源组成和运行状态,并通过平均修复时间(MTTR)和平均无故障时间(MTBF)等SLA综合指标评估业务服务水平。通过业务监测视图,用户可深入浅出地分析业务系统当前的运行状况,大大降低IT系统管理难度。

2.4.4 资源监测展现

为了便于查找故障,分析故障根本原因,往往需要查看故障产生的具体对象。IT运维管理系统的资源监控视图集成业务监控系统的相关功能,从资源总览、资源汇总和资源详情视图分层分类地细致展现各类资源的性能详细指标。

? 资源总览

汇总所有监测资源信息,以全局和分类统计其可用状态和健康状态,并列举当前问题资源。

? 资源汇总

针对具体资源类型,统计展现所有该类资源的运行状态,包括:该类资源的可用性和健康性、可用资源比率与健康资源比率、当前出现问题的具体资源等常规指标和该类自有的其他指标。 ? 资源详情

针对业务应用的具体资源,根据不同的资源分类(如网络设备、服务器 、数据库、中间件等),详细展现资源的基本信息、负荷状况、稳定性、响应延时各项关键性能指标和健康度与可用度的状态分析,轻松掌握资源当前的运行状况。

2.4.5 节点监测展现

网络中拥有独立IP的网络实体,我们称之为节点。单个节

点可能部署了多项被监测资源,如操作系统、数据库、中间件等。IT运维管理系统通过集成业务监控系统的相关功能,提供了基于节点的整体监测,汇聚节点内各资源的监测数据,从总览视图、详情视图(一级、二级视图),递进式地展现被监测资源的详细参数。

? 节点总览视图

节点总览视图从总体上统计各个分类节点的不可用节点数、节点总数、及总资源数等,同时以柱图方式直观显示节点的不可用节点数占节点总数的比例。

? 一级节点视图

一级节点视图集合了同分类的所有节点,各节点单独展现内部资源健康状态。

? 二级节点视图

二级节点视图详细给出节点所包括单个资源的详细运行情况,如图所示,此

服务器节点不仅监测了服务器的Windows 操作系统的运行状态,还包括其网络设备、DNS服务和POP3 服务的运行情况。

2.4.6 告警信息展现

为了查找发生故障的原因,往往需要查看一段时间内的告警信息来进行分析。告警管理可以对告警信息按资源、按节点

的进行查询,并展示了各个时间段的告警信息。

2.4.7 灵动可视化平台

2.4.8 扩展展现集成接口

扩展展现集成(SSO)通过Portal技术,以B/S方式实现IT运维管理系统与其他监控产品的融合,为用户提供可扩展、多元化的信息汇聚与功能集成。

借助统一身份登录和权限验证,IT运维管理系统可以深度集成其它监控系统,为不同角色的管理和技术人员提供相应的个性化工作界面,提高IT运维服务效率。

2.5 报表管理

? 全面的性能与告警报表

依据对监测数据的自动汇聚、抽取、分析,提供基础架构性能与告警、资源比较、指标排名、指标趋势等各类层次化统计分析报表。从业务运行状态到微观性能指标,自定义查询业务应用系统及其关联资源的当前和历史运行情况。

? 业务运行报表

支持按业务的方式对业务应用可用性、MTTR和MTBF进行统计。

? 节点报表

支持按节点的方式对其监测数据的进行汇总分析,提供基础架构性能指标趋势等各类层次化统计分析报表,并支持自定义时间段进行查询。

? “所见即所得”的报表

支持报表收藏功能和订阅。支持导出为Excel、PDF文件和立即发送报表到指定Email邮箱,还能够为不同的用户订阅相关报表,自动定时发送到指定Email邮箱,提供系统优化、决策分析和业务规划的量化参考。

相关推荐