网游行业背景
随着Internet的发展,网络游戏的发展也变得如火如荼,各种各样的网络游戏层出不穷。作为互联网应用的后起之秀,网络游戏具有信息双向交流、速度快、不受空间限制等优势,从根本上提高了游戏的互动性、仿真性和竞技性,使游戏玩家在虚拟世界里可以发挥现实世界无法展现的潜能,改变了单机版游戏固定、呆板、与机器对话的状况。因此,网络游戏成为网络业利润优厚的领域之一。同时,如何提高自身的运维水平,保证全国各地的网络、主机、应用的良好运行,提高用户体验,同时降低运维成本,成了各个网游公司亟待解决的问题。针对这种情况,我们提出了针对网游行业的运维管理解决方案。
网游行业应用特征
网游行业具有以下显著特征:
1、网络结构异常复杂
网络游戏的支撑系统网络结构比较复杂,有些数据通过公网传输,有些数据通过专线传输,一般全国各地有很多个IDC中心,并且全国各地很多个子网络,包含各种各样的网络设备。
2、主机数量多,集群化大规模化,操作系统多种多样
一款成功的网游,往往会受到大量网民玩家的追捧。居高不下的并发连接数,大规模的数据运算需求,大流量的数据吞吐量给网游服务器的CPU,I/O系统提出了近乎苛刻的要求。为了给玩家提供稳定流畅的游戏环境,运营商往往在各个游戏分区采用服务器组群的方式进行服务。
这些网络游戏主机数量众多,少则几百台,多则几千台,分布在全国各地,并且操作系统多种多样,既有Window主机,也有商用的UNIX主机,还有开源的Linux主机等等。
3、监控策略
对成百上千台的主机和网络设备,需要对其进行分类,用几条监控策略即可对其进行监控,如果需求发生变化,也可以批量的进行修改。如对某一逻辑单元(组)内的设备都设置为每5分钟检查一次TCP 80端口。
4、集中管理,分散分布
网游公司的网络设备和主机分布在全国各地,但是网游管理员都希望监控中心在总部,但是要管理全国的主机和网络。这需要网管软件有灵活的架构适应这种情况。
5、负载均衡
网络游戏的用户数量众多,跟互联网行业一样,有很多四层的针对流量的负载均衡设备,对这些设备的管理,是网络游戏支撑系统不可回避的问题。
6、数据库和中间件的监控
每个服务器组中包括存放地图和环境参数的场景服务器,存放角色资料的数据服务器以及数据备份服务器。这些服务器组群不但要在每个固定的时间片进行增量数据备份,还需要保存近一周内的所有数据以备游戏管理人员处理玩家争议。这样一来,就对运维监控软件提出了更高的要求,不仅要求可以监控各种各样的数据库,还要对数据库的具体运行情况有个确实的详细的了解。同时还要监控的各种各样的中间件。
7、网管软件自身的安全性。
网络游戏的安全性毋需多言,如果采用的运维管理软件不安全,对整个网络游戏的危害很大。
方案功能
作为国内最大IT产品和解决方案提供商之一,摩卡软件始终关注客户最急迫的需求,以客户需求为导向来开发产品和设计方案。通过对目前网游行业的深入调研,摩卡软件基于强大的技术实力和突出的方案整合能力,推出了面向网游行业的完整的网游行业运维管理解决方案,集经济和高效于一身,是网游行业理想解决方案。
网络拓扑自动发现与绘制
针对网游公司网络结构复杂的情况,提供对企业内部网段(部分网络或某一地区网络)的自动发现功能,可以自动生成用户关心的网络拓扑图,并且随着网络的变化,自动更新。针对企业内部安全限制过多,无法有效自动生成网络拓扑的情况,方案提供了手工定制拓扑图的功能,可以针对用户的情况,自己定制拓扑图,并提供了针对拓扑图导入导出功能。
网络拓扑图
Agent与Agentless部署
针对网游公司数据数量众多、分布分散,操作系统多种多样的情况,我们提供了Agent和Agentless两种监控方式,Agent需要在被管理主机安装代理软件,而Agentless不需要。针对一些核心和重要的主机,可以采用Agent的监控方式,提供对主机的全面的监控方案。针对数量众多,重要性相对小的主机,提供Agentless的监控方式,提供关键但是粗略的全面有效监控。
对于Agent的部署,产品也提供了远程部署,远程维护的功能,不需要到每一个被管理主机上安装代理软件, Agentless监控方式提供了批量监控功能,可以批量导入一批主机,实现对其监控。
主机的可视化监控
针对网游行业监控策略需要批量监控主机和网络设备的需求,我们提供了针对某一类主机和网络设备的监控策略。针对某一类型的主机,只需要设置一条监控策略即可进行监控,如果监控需求发生变化,也可以很方便的批量进行修改。如针对所有的AIX主机,只需要设置一条策略即可,如果要改变所有AIX主机的监控需求,只需要修改这一条策略,当然也可以针对其中的一部分主机进行修改。
分布式监控
针对网游公司集中管理、分散分布的需求,方案提供了灵活的三层架构来适应这种情况。
1.总部只需要部署一台中心管理服务器和数据汇聚服务器。中心服务器统一分发各个地区的监控策略,对所有的节点进行统一管理
2.各个地区部署不同的分布式采集服务器,各个分区分布式采集服务器的数据通过数据汇聚服务器集中到中心服务器。
3.所有的展现通过总部的Mocha BSM Portal统一展现。
在分布式采集服务器和中心服务器传输书籍之间,系统也采用了重传机制,保证了在公网部署的条件下有很好的连通性。
Mocha BSM分布式部署图
监控关键的设备与应用
负载均衡设备,系统通过SNMP实现对其的管理。并且会通过负载均衡设备的mib库,定期轮询相关指标。同时,系统也实时接收snmp 的trap信息,实时解析,迅速产生事件,立刻发送告警给系统管理员。
针对网游的众多的数据库应用,我们也提供了对市面上流行的几乎所有数据库系统的监控(包括My SQL、DB2、ORACLE等等),提供针对数据库的表空间、数据文件、进程、文件系统、缓存命中率、连接会话数、事务数等数十个指标的监控,涉及数据库监控的方方面面。并且,也提供了针对数据库的可视化监控功能(Visualized Management),可以实时的查看数据库的
运行情况,并通过不同的颜色来区分不同组件的运行情况。针对网游行业中间件的监控需求,我们不仅提供了针对WebSphere Application Server, WebSphere Portal Server,MQ等中间件的监控,甚至对中间件的分布式部署的架构,都可以自动的产生,清晰的展现给系统管理员。
Websphere Application Server分布式部署架构
网络安全
网络安全一直是互联网行业最关心的问题,Mocha BSM从四个方面来提高自身的安全性。
严格安全测试
各个组件之间的传输都是通过SSH加密的
HTTPS的访问方式
登入安全措施——当用户密码输入错误三次后,系统会锁定此用户30分钟
方案亮点
方案具有以下显著优点
1、B/S架构
采用灵活的B/S架构,不需要安装任何的客户端,全国各地的系统管理员就可以随时随地的访问系统。
图5 统一的登录界面
2、统一登录,易于管理和使用
整个网络环境中,所有的设备,所有的功能都统一展现在Mocha Portal中,统一登录。
3、权限管理清晰,系统自身安全
采用视图和资源两层权限控制体系,视图管理控制用户可以看到哪些页签,资源管理可以控制用户管理哪些资源。各个系统管理员看到的内容和权限都可以做灵活的定制。
4、系统架构灵活,易于修改和扩展
采用灵活的三层架构,展现层展现数据,收集层收集数据,分布式的采集服务器采集数据。适应各种网络的情况,易于扩展和维护。
5、可视化监控VM
针对主机和应用的可视化监控VM提供对主机和应用的实时监控功能,通过可视化的方式来展现整个系统的运行情况,让用户一目了然,降低了系统管理的门槛。
6、超强整合能力
提供了超强的整合能力,针对部分用户已经使用过某些网管产品的情况,我们提供了针对这些产品的适配器(adapter)可以从事件、数据和展现三个层面对第三方产品的数据做全面整合,保护用户的投资。
4.1服务器
服务器:
PC英特尔Pentium III 以上服务器
UNIX服务器
内存: 512MB以上
磁盘空间: 10GB以上
操作系统支持:
微软Windows 2000、2003
Linux – CentOS 4.x
Sun Solaris 8、9
IBM AIX 5.x
4.2客户端
PIII 以上计算机,128MB内存
IE 5.5或更高版本
摩卡业务服务管理(Mocha BSM)介绍
摩卡业务服务管理(Mocha Business Service Management),简称Mocha BSM,它基于ITIL(IT Infrastructure Library)的理念, 以实现用户端到端BSM为目的,倡导IT服务4+1的管理思想。
Mocha BSM采用了可视化的人机交互方式,不仅降低了IT维护部门管理维护的技术门槛,同时为用户的领导决策层、信息化部门领导等人提供全面、直观、图形化的数据信息。通过业务流程管理这一核心支柱,实现基础架构管理、应用管理、端到端反应时间/事务监控以及端到端的BSM。
Mocha BSM 4+1的管理思想图
在基础架构管理方面,Mocha BSM提供了包括IT资产管理在内的各种IT基础服务的管理,包括网络设备、主机、操作系统,并提供整个用户的网络拓扑管理,通过摩卡可视化管理(Visualized Management),为IT管理员提供一览式的主机运行状况报告。
Mocha BSM的应用管理,涵盖对各种应用服务器(包括Lotus Domino、WebSphere、Weblogic、SunOne 等)、Web服务器(包括Apache、IIS等)以及数据库服务器(包括SQL Server、DB2、Oracle等)
端到端的反应时间/事务监控,为用户的跨应用平台的事务提供监控,帮助IT管理员获取在各个应用阶段的事务反应时间,找出整个应用服务的瓶颈。
端到端BSM为用户整合不同监控系统的数据和事件,以清晰的仪表盘形式,展现各种指标状况和服务支持状况,最终帮助领导实现IT规划与决策。
规范化的IT服务管理,需要完整的流程支持,业务流程管理(BPM)的到来,帮助用户实现故障申报、故障解决、问题管理等IT服务管理的完整流程,最终记录完整的问题解决过程进入用户的知识库中,成为宝贵的知识资产。
著名分析公司Gartner Group推出了IT管理过程成熟度模型,将IT管理过程划分为以下5个阶段:
IT管理过程的5个阶段图
Mocha BSM 4+1的管理思想,希望帮助用户迅速摆脱混乱、被动的局面,最终达到“IT管理过程成熟度模型”的价值阶段。