天元网络IT服务管理平台——IT综合监控系统MetarITIM3.5

政府与企业事业部 刘会永
<% '根据数据库中的时间降序排列出,以备随后取出全部新闻记录,只取type=a即天元动态类新闻 Set rs = Server.CreateObject("ADODB.Recordset") sql = "Select * From news Where newstype='a' Order By ID DESC;" On Error Resume Next '执行查询 rs.Open sql,conn,1,1 rs.MoveFirst '分页显示,并调用onepage.asp输出页面 rs.PageSize = 10 Page = CLng(Request("Page")) If Page < 1 Then Page = 1 If Page > rs.PageCount Then Page = rs.PageCount If rs.RecordCount = 0 Then Response.Write "没有相关的新闻记录!" Else ShowOnePage rs, Page End If If Err <> 0 Then Response.Write "数据库读取文件出错 " & Err.Description &"" rs.Close conn.Close Set rs = Nothing Set conn = Nothing Response.End End if %>

背景

今天,信息技术在各个行业中的应用都得到了前所未有的重视,各个行业都进行了大量的IT系统建设和应用开发,IT系统已经成为企业发展的强大支撑力量。
在企业对IT系统依赖程度提升的同时,企业对IT环境的管理水平却并没有得到相应的提升,大多数企业的IT管理仍处于混乱无绪的情况。具体来说:

  1. 管理思路不清晰。部分企业缺乏对IT管理方法论的了解,不了解IT管理的先进理念,不了解业界的管理经验,只能靠自己摸索。大部分企业对ITIL等管理理念有一定的了解,但缺乏实践经验的支持,普遍感觉找不到着力点,无从下手。
  2. 管理体系不明确。企业的IT环境越来越复杂,IT资源越来越繁多,但没有一个适合自己的量身定做的管理制度,没有形成合理的管理体系。大多数企业仍处于盲目、被动救火式的管理阶段中,每天疲于奔命,投诉和抱怨却越来越多。
  3. 管理工具不完善。部分企业没有完善的管理工具,缺乏技术支撑手段,只能靠人工进行管理,管理效率较低并且容易出错。大多数企业虽然有一些支撑工具,能完成部分管理功能,但工具比较分散,不能进行信息共享,无法从宏观的角度统一的进行管理。同时,大多数企业缺乏可以把管理体系固化下来流程管理系统,不能规范化的执行整个IT管理过程。另外,企业目前用到的多数工具侧重于从技术角度监控IT资源状态,真正以客户为中心,从业务使用的角度进行管理的工具较少。当面对整体架构复杂的各种系统,多层次、多环节的问题出现时,往往出现处理滞后的现象。系统停用时间越长,最终用户的体验感受越差,直接影响到企业的运营,甚至有可能会造成到企业的客户和利润流失。
  4. 管理经验不可用。由于缺乏合适的工具,也缺乏合适的管理体系以及对应的流程管理系统,企业的宝贵管理经验无法保留下来,对管理人员的技术门槛要求一直比较高,只有在发生问题的时候,不断的重复问题的分析、解决过程,对对人力、物力都是很大的浪费。
  5. 管理收益不可知。企业没有量化的统计考核办法,无从得知管理人员平时的工作情况和工作效果。同时对于管理者而言,由于没有手段提供足够的数据支持,决策时只能依赖少数技术人员的意见,使其管理职能的发挥在速度和准确性上都大打折扣,决策所带来的风险和收益基本不可预知。

因此,企业迫切需要一套涵盖管理理念咨询、管理体系梳理和优化、管理工具提供等环节整体解决方案,用来全面提升企业的IT管理水平,逐步规范IT环境的使用,使得企业的IT管理由混乱向有序演进,以期最大化的获取IT资源的投入所产生的价值和收益。

天元网络IT服务管理平台解决方案的理念

天元网络针对各行业企业的 IT支持和管理部门实际需求,基于 ITIL(IT Infrastructure Library)的 IT 服务管理思想,结合天元网络在网络管理领域的丰富经验,提出了一套“三位一体”完整的解决方案,如下图所示:
1
图1 天元网络IT服务管理平台解决方案
天元网络的IT服务管理平台解决方案中包括管理咨询、IT监控、服务流程三个组成部分。结合ITIL提出的IT管理三要素:人员、技术、流程,三个组成部分的作用分别为:管理咨询用来提升人员的能力并且梳理优化企业合适的管理体系;IT监控作为技术手段,用来全面监控企业IT环境中各种各样的IT资源;服务流程用来固化管理体系,把人员、技术工具组成一个有机的整体,根据实践情况进行流程优化,持续提升企业IT管理水平。

IT综合监控系统概述

IT综合监控系统是天元网络经过多年在IT监控管理领域的专注耕耘,研发出的符合中国国情和用户习惯的新一代IT综合监控产品。系统突破了传统监控管理工具的局限性,并实现了IT监控管理理念的提升。产品设计的核心理念包括:
(1)实现一站式IT管理
IT综合监控系统定位于实现企业IT环境中网络资源、系统资源、基础应用资源、业务应用资源等各种资源统一管理的综合监控平台,还原IT环境中各个组成部分之间不可分割的相互依赖;为各级IT管理人员提供从资源规划、资源收集、性能分析、故障定位与处理、统计分析等管理过程的支持。
(2)实现面向业务的综合管理
通过应用Agent、日志分析、模拟拨测等各种采集技术,可以完成基础应用及组成组件的运行状态监控,也可以完成由基础应用组合、承载的企业特有业务应用的服务质量的监控。支持测量客户真正可感知的指标,对企业服务水平管理提供支撑依据。支持图形化的业务影响分析,可以直观了解业务故障影响的范围和影响到的客户。
(3)自动化的管理方式
从提高运行维护效率出发,为管理人员提供自动化管理的技术支持手段。通过自动化的方式来提升日常维护工作的规范性,以此来降低人为故障发生的概率,并降低对管理人员的技术依赖。
近期,该平台产品的3.5版本已正式发布,包括资源管理、网络管理、系统管理、应用管理、终端安全、智能巡检、综合分析和增强工具等8个子系统,涵盖了企业IT基础设施监控的各个方面,成为支持企业IT运维管理的有力工具。
MetarITIM3.5是一个平台产品,有两层含义:MetarITIM3.5具有丰富的产品特性,可以直接用于企业的IT管理;MetarITIM3.5也具有良好的平台特性,在该平台之上,可以方便的进行编程或非编程的定制,来更好的满足企业的特殊化需求。
下文分别简单介绍一下MetarITIM3.5的产品特性和平台特性。

MetarITIM3.5产品特性

光盘化产品安装部署

MetarITIM3.5支持简单的光盘化的安装部署方式,可以快速完成软件的安装和初始化配置。如下图所示为光盘安装界面:
2
图1 安装步骤
如图所示,软件的安装部署共包括4个环节:初始化数据存储环境、安装消息中间件、安装服务器端应用处理模块、安装客户端呈现模块。
四个步骤安装完成后,在快速入门手册的帮助下可以快速的完成系统设置,即可开始使用系统。

任务化资源自动发现流程

MetarITIM3.5支持灵活的任务化的资源自动发现功能,通过创建资源发现任务,可以自动化的把企业各类可管IT资源识别出来。包括以下主要步骤:

  1. 创建资源发现任务:设置资源发现相关参数,如IP地址范围、发现周期等。
  2. 手工执行/周期执行:通过手动触发的方式或是周期性触发的方式执行发现任务。
  3. 执行结果管理:自动或人工的对资源发现结果进行接受或拒绝的处理。
  4. 设置资源静态属性:设置必要的资源静态属性,如资源产权归属。至此,企业IT环境中的资源已经被静态的管理起来了。
  5. 设置并启动资源管理信息获取任务:设置资源的管理信息获取方式、获取周期的参数,完成本步骤后,IT资源从简单的静态管理演变为实时的动态监控。

层次化视图呈现

MetarITIM3.5提供层次化的视图呈现功能,其呈现模式为:

  1. 三类拓扑:行政拓扑、逻辑拓扑、物理拓扑。分别展现经纬度地理信息、逻辑连接关系信息、物理分布信息。
  2. 两条主线:行政主线、逻辑主线。通过该两条主线把所有的拓扑图串接起来。
  3. 逐层钻取:在两条主线中,均支持视图逐层深入的钻取呈现方式。

3
图2 层次化视图呈现

可视化IT设备运行情况监视

MetarITIM3.5提供可视化的IT设备运行情况监视功能:

  1. 可视化管理:提供直观的设备关键指标的可视化监控功能,可以直观、快速了解设备的运行情况。
  2. 真实设备面板图功能:提供真实设备面板功能,支持在设备面板上进行相关控制操作,包括开启端口、关闭端口、端口限速等功能。
  3. 设备当日运行情况分析:提供图形化的当日运行报告功能,方便查看设备当天的运行情况。
  4. 设备历史运行情况分析:提供图形化的历史运行趋势分析功能,方便查看一段时间内设备的运行趋势。

4
图3 可视化设备运行情况监视

多角度流量使用情况分析

MetarITIM3.5提供网络流量使用情况的多角度分析功能:

  1. 支持环境:支持NetFlow等厂家流量分析协议,同时提供自主研发的流量分析探针,满足在不支持NetFlow等协议的环境以及局域网流量的分析需求。
  2. 企业应用流量分析:支持企业流量特征定义,针对定义的特征进行流量分析,准确了解企业应用的使用情况。
  3. 应用协议分析:针对流量的所采用的应用协议进行分析,了解网络上各类应用流量的分布情况。
  4. 流量来源分析:分析网络流量的来源IP地址。
  5. 流量目的分析:分析网络流量的目的IP地址。
  6. 流量会话分析:分析网络流量会话间的流量。
  7. 其它维度深入分析:在上述某项分析结果的基础上,再进行进一部分的深入分析。如了解来自某IP的流量中,各类应用的分布情况。

5
图4 多角度流量使用情况分析

闭环告警处理流程

MetarITIM3.5提供完善的闭环告警处理机制,包括告警生命中期各环节的管理:

  1. 告警接收和生成:支持三种形式的告警来源方式,包括被动接收、主动轮询、性能越限。
  2. 告警预处理:提供告警重定义、告警升级、告警压缩等预处理环节。
  3. 告警处理:分为四种处理模式。
  4. 有人职守:可以通过查看设备可视化监控、查看历史处理经验快速定位问题原因,可以人工进行告警清除、告警确认操作。
  5. 无人职守:支持灵活设置前转策略,支持延时前转和升级前转。符合前转规则的告警可以通过短信、邮件等形式前转给相关人员。管理人员可以通过回复短信或回复邮件的形式进行远程处理。
  6. 工单流转:支持监控系统向流程系统的自动或手动派发工单,工单状态改变后,支持告警的自动清除。
  7. 自动处理:告警长时间仍未恢复,可以由系统根据设定规则自动完成清除操作。

IP地址使用情况监控

MetarITIM3.5提供企业IP资源的管理功能,包括IP段规划分配、IP地址分配、修改、回收、异常处理等功能。通过该功能,可以改变企业IP地址使用的混乱局面,逐步提升IP资源的使用规范化程度。
支持设置监视白名单,对于在白名单内部的地址,不予监控。
IP地址监控所发现的使用异常,支持以告警的形式通知管理人员,并提供异常处理功能,包括关闭端口、开启端口、限制网络速度等。
6
图5 IP地址使用情况监控

立体化应用运营情况监控

MetarITIM3.5应用监控采用立体化的监控理念,支持从业务、支撑应用、主机等层面的逐层钻取监控,方便准确定位问题真正原因。
7
图6 立体化业务运行情况监控
通过应用Agent、日志分析、模拟拨测等各种采集技术,MetarITIM3.5可以完成基础应用及复杂业务应用运行状态的监控。

MetarITIM3.5平台特性

作为一个平台产品,MetarITIM3.5具有良好的平台性,在该平台上可以进行方便的管理模型、管理功能的扩展。包括如下几点:

  1. 资源管理模型动态可视化维护:MetarITIM3.5提供管理模型维护工具,可以完成资源模型的可视化的维护,包括资源类型的增加、修改、删除;资源管理指标的增加、修改、删除,以及资源管理指标采集算法的可视化调整;资源之间依赖关系的调整。
  2. 功能入口可视化维护:MetarITIM3.5提供专用的工具,用于设计、组装定制产品,满足客户化的需求。
  3. 拓扑任意定制:MetarITIM3.5提供强大的拓扑定制功能,可以通过多种方式定制出美观的符合实际需要的各类拓扑图。

8
图7 MetarITIM3.5平台特性

通过这样的平台特性,可以使MetarITIM3.5充分适应企业不断变化的需求,体现MetarITIM3.5的强大生命力,同时也可以一定程度上保护企业的投资。