随着通信技术的发展,网络规模不断扩大,网络复杂性日益提高。现代通信网复杂度的增加以及对自动化管理的要求,迫切需要一种结构化的网络管理方法,以便对不同类型的通信网络、设备和业务进行有效的管理,综合网管系统就应运而生了。
由于获取并实时显示各专业网管设备的告警信息并进行故障工单传递是综合网管系统要实现的一个主要功能,本文就这方面进行介绍。
一、与各类网管设备的接入方式和数据采集方式 综合网管系统网络拓扑图如图1所示。网管中心内包括数据库服务器、中介应用服务器(适配层数据处理)、Web服务器/GIS文件服务器、远程访问服务器、数据采集机、PC操作终端以及打印机。除PC操作终端外其他硬件设备都安放在固定机架内,以利于整齐美观。
图1综合网管中心网络拓扑示意图 选用2台中高端UNIX小型机服务器分别作为数据库服务器和综合网管处理机,双机热备作为该系统的核心服务器,同时配备双控制器的磁盘阵列作为数据存储系统。
为保证整个综合网管系统的可靠性,整个局域网采用双网模式,配备2台网络交换机。当某一个网络交换机出现故障时,系统仍可通过另外1台交换机进行网络通信,保证系统正常运行。
对电话交换机可配备1台交换设备采集机并配有专用的串口采集设备;对NECSDH、ATM系统、马可尼SDH系统的接入,可通过1台采集机完成;对电源设备可专门配备电源监控采集机。
由于不同专业网管的对外接口各不相同,所以,对不同的设备和专业网管,需要采取不同的方法进行数据采集。
下面列3个有代表性的设备,介绍串行采集接口、数据库接口、API接口的接入方法。
NECSDH专业网管的后台是Sybase数据库,可使用采集机实时监视它的告警日志表的变化以获取该设备的实时告警信息。
马可尼SDH设备的网管具有串口数据通道,可通过修改相应的配置文件,并设置发送和接收具有相同的波特率和校验位等来进行告警数据的串行传送。
NortelATM网管具有专门的API(ApplicationProgrammingInterface),可依据API的要求编程获取告警信息和状态信息。
二、告警数据的入库与显示 综合网管系统能够通过各专业网管系统,24小时实时采集各种网元(NE)的告警信息,进行信息的过滤、格式匹配、模型转换,统一转换为综合网管数据模型,并进行实时显示。
1.综合网管系统定义的告警信息项
(1)告警ID;
(2)网元:产生告警的网元;
(3)警类别(根据接入综合网管的专业网管而定,例如有交换、传输、信令、光缆、电源等);
(4)首发告警时间;
(5)最新告警时间;
(6)清除告警时间;
(7)告警状态(产生、确认、受理、网元报告清除、定时清除、人工清除、系统清除);
(8)网管告警级别:(严重、重要、一般、提示);
(9)网管告警类型:X.733告警类型,有通讯告警(communicationalarm)、设备告警(equipment alarm)、服务质量告警 (quality of service alarm)、运行错误告警 (processing error alarm)、环境告警 (environmental alarm);
(10)故障单生成标志。
综合网管系统一般提供告警列表实时监视方式和告警拓扑图实时监视方式,当有告警产生时,系统用不同的颜色表示不同级别的告警,对于重大告警进行声音提示。用户可以根据需要开关相应告警指示。
三、与办公系统互联:告警邮件与故障工单 1.告警邮件
综合网管系统通常要与办公系统结合起来,当符合发送条件的告警发生时,可以电子邮件形式发送到指定电子信箱,提醒用户处理。
2.故障工单
故障工单的传递采用远程管理方式。故障工单的当前状态确定了它下一步的操作类型,工单的操作类型选择可采用较为智能方式(即根据当前工单状态显示下一步可操作的类型),以避免操作流程的混乱。
用户登录系统后,通过“本部门查询”功能可以查看到本部门需要处理的工单,对于处于不同状态的工单可以执行不同的操作。点击某条故障工单,可对其进行操作,也可查看该故障工单以往的操作历史,以得到当前工单的有效信息。
四、软件的程序设计 1.对不同网管设备实际告警数据的提取
(1)马可尼SDH的告警提取
使马可尼网管系统(EM-OS)向串口发送告警信息。
修改马可尼网管服务器上的/emos/hpux/release/.emosrc文件,将“startup=”设为EHSSerialMainR和EHSSerialHandlerMainR -b 500000。
设置串口发送的波特率和传送的数据位等,以便于在自己程序中进行接收。
在串口配置文件(/emos/hpux/release/EHSSerialPort.cfg)中设置串口发送告警时的波特率9600波特(即:baud16),传送的数据位为8位(即:cs8),使用串口Port0。
使用自己开发的JAVA程序,获取串口吐出的字符流(串口文件为一般文本文件),使用JDBC技术将之写入ORACLE数据库表中。
(2)NECSDH的告警提取
NECSDH专业网管的告警信息存储在Sybase数据库的CurAlarm表中。通过在JSP程序中建立计时器,系统将按照确定的时间间隔(1秒)自动采集CurAlarm表中记录的个数以确定是否有新的告警。若记录个数增加,则说明有新告警产生。这时,通过JDBC方式取得最新的记录,然后将之写到ORACLE数据库中。同时,将该条告警追加到屏幕上的告警列表中,并将网元控件根据告警级别变化相应颜色。
(3)NortelATM的告警提取
通过ATMAPI获取告警。与NortelATM的告警和状态API会话,需要先在ATM网管服务器调用/opt/MagellanNMS/bin/gmdrapi命令进行API的初始化。如果通过输入文件的形式将请求发送给API并希望发送告警到输出文件中,使用命令/opt/MagellanNMS/bin/gmdrapi+O -f -w -d –a,表示使用后台异步方式将输入的请求文件发送给API,然后将告警输出到文件中。
2.采用Java语言开发串口采集程序
利用Java开发串口程序,要用到javax.comm.API软件包。该软件包实现对基于RS-232的串行设备和IEEE1284的并行设备的支持。
类javax.comm.SerialPort表示1个RS-232串行通信端口,它包含许多方法。方法getBaudrate()获取当前配置的波特率;方法getDataBits获取当前配置的数据位的数目。
类SerialPortEvent表示1个串行端口事件,它的构造方法表示以指定的串行端口、事件类型、旧的和新的值构造1个SerialPortEvent。通过方法getEventType获得事件的类型,方法getNewValue()获得引起SerialPortEvent传播的状态变化的新值,getOldValue()获得旧值。
3.应用J2EE技术构建三层架构的Web程序
J2EE技术是一种典型的三层结构的分布式技术。三层结构是指客户相关处理层、业务逻辑处理层、数据库存储层的三个层次。J2EE的WEB应用技术(JSP、Servlet、JavaBean)和RMI技术是三层结构的第一层即客户层技术,J2EE的EJB(EnterpriseJavaBean,企业Java组件)技术以及相关的技术是三层结构的第二层即中间层。J2EE的第三层是后面的数据库层。在综合网管系统中,使用EJB隔离应用和数据库。当需要存取数据库数据时,不是直接使用JDBC连接到数据库进行操作,而是调用一个实体EJB,该实体EJB对应着需要存取数据的数据库表和视图。应用程序通过调用实体EJB的方式,间接存取数据库。
4.使用LotusDomino/Notes实现与办公系统的互连和工作流管理
由于LotusDomino/Notes强大的群件(“群组工作软件”的简称)功能和工作流机制,在国内许多政府机关和大型企事业单位都采用LotusDomino/Notes作为办公自动化系统的基础平台。在综合网管系统中,为了实现与办公系统的互连和工作流管理,可以采用LotusDomino/Notes进行编程,实现告警邮件和故障工单的传递。
5.使用LotusDomino/Notes进行故障工单管理的设计方法
在综合网管系统中,为实现故障工单的工作流管理和查询、统计,可设计3个表单(故障工单、流程环节、查询)和2个视图(按故障生成时间、按超时门限)。
故障工单(GZGD)表单包含:故障类型、故障级别、当前状态、故障生成时间、清除时间、超时门限、故障位置、故障描述、网管部门意见、派修部门意见、维修处理意见等域。还包含:填写意见、下一步处理、发送、保存、返回、帮助等操作按钮。
流程环节设置表单(LCHJ)包含:流程环节名称、序号、是否循环返回环节、下一步处理等域。还包含:保存、返回、帮助等操作按钮。
查询表单(CHXU)包含:故障类型、故障级别、当前状态、故障产生时间、超时门限、故障位置等域。还包含:查询、返回等操作。
为使Web画面美观,采用CSS样式表。当故障工单发送时,同时给下一步处理人发送电子邮件。当下一步处理人收到电子邮件“请您处理某日某时发生的XX故障工单”后,可直接点击邮件中的“请处理”按钮,进入“通信网故障工单管理”系统的“故障工单”处理画面,进行故障工单的处理。
网管人员在登记故障工单时可根据“帮助”大体确定故障的原因后进行故障描述,填写建议的处理意见发送给派修部门。还可以作为超级监控人,随时监视每个故障工单的处理,“催办”当前处理人,“转发”工单给另一处理人。
为实现