1、NMC培训,用友软件股份有限公司 刘建波 2011年 1月4 日,主题,概述 部署和使用 实时监控 离线分析 管理功能,第一部分:概要,背景 NMC是什么? 核心特性 带来哪些好处? 技术架构 基于NMC的插件开发,背景,企业信息化发生了深刻的变革,ERP系统已经成为业运营的平台,IT面临巨大的压力。 大部分情况,对系统的运行状况只能来自于终端客户的反馈,无法主动探知风险 系统为什么慢?为什么宕机?系统现在运行的怎么样? 解决问题的成本太高,开发和技术顾问经常连续几天昼夜在客户现场。 系统的维护复杂,比如打补丁,故障恢复 ,NMC是什么,核心特性,集成了性能监控、问题分析、系统管理的平台,支持
2、HTTP、Email等多种接入方式,事件驱动的主动监控主动管理,支持多层信息的穿透,强大的实时监控和离线的分析能力,提供灵活的监控服务的安全保护,端到端的监控体系,带来哪些好处?,技术架构,监控域和服务中心的关系,监控域:一个服务中心和一组受管于这个服务中心的监控实例的集合。服务中心(Service Center) :一个监控域的核心管理进程。一个监控域内有且只有一个服务中心,监控客户端只需要连接服务中心服务器即可访问整个监控域的服务资源。,服务的关系,基于NMC的插件开发,第二部分:部署和使用,配置服务端环境 单个实例 集群 注意事项 NMC客户端的获取 启动客户端 客户端使用的几种模式,配
3、置服务端环境,Nmc/server/bin/configure.bat,单个实例,Unix/Linux ./startmonitor.sh Windows ./startmonitor.bat Was启用安全管理 ./startmonitor0.sh(bat),集群,为每个监控实例设置服务中心 启动服务中心服务器 启动节点服务器,服务器端部署的几个注意事项,对中间件的监控依赖于%NCHOME%/ierp/bin/prop.xml文件, 要保证同步。 Linux/UNIX环境特别注意要有执行权限。将nmc/server/bin和nmc/server/目录下的文件赋予可执行权限。 JRE_HOME
4、要设置为jdk1.5或者以上的版本。 如果是数据库是RAC环境,需要prop.xml文件中将数据源拆分成两个针对单个实例的数据源。 修改端口需要nmc/server/conf/server.conf,nmc/server/conf/services.xml,%NCHOME%/resource/monitor.properties三个文件。,NMC客户端的获取,直接使用%NCHOME%/nmc/client. 或者从服务器上下载一个最新的客户端。下载地址为http:/servicecenterhost:port/nmc/client.exe 比如:http:/192.168.8.112:9999
5、/nmc/client.exe,启动客户端,设置JAVA_HOME 进入客户端目录,执行monitorconsole.bat,客户端使用的几种模式,HTTP(默认):使用HTTP协议访问监控服务 EMAIL:使用邮件传输协议来访问监控服务 OFFLINE:离线模式,主要用于基于消息和日志的分析,第三部分:实时监控,优势 服务 Overview 进程监控 线程监控 数据库 客户端监控 CPU 和 内存,实时监控的优势,可多层信息穿透 客户端-中间件-数据库 的端到端的监控 从系统底层到业务层的全面监控,实时监控主要服务,OverView 进程监控 线程监控 数据库监控 CPU 内存 客户端监控,
6、OverView,提供一个部署结构样式的全局的系统运行状况视图。包括系统运行状态、每个中间件的jvmheap信息、线程信息、数据库的活动会话等。当系统出现异常,会有警告提示。,进程监控,线程监控,数据库监控,客户端监控,CPU 和 Memory,最佳实践一,监控进程来看中间件或者数据库是否健康。主要指标为负载均衡,响应时间,GC状况等。 通过全局或者单个实例模式监控线程。定位中间件问题还是数据库的问题。 如果是数据库的问题则将有问题的线程穿透到数据库,在数据库进行分析。,最佳实践二,进程监控关注中间件整体运行是否健康。主要的指标是负载均衡,后台服务线程数、响应时间、jvm heap使用情况,最
7、核心的指标是响应时间。联查业务可获得业务信息,联查操作员可获得当前操作员的联系方式,如有必要可直接和这位操作员沟通。 如果定位单个任务的问题,使用线程监控的“单个线程“的功能。在一个视图中可以监控到这个线程的所有信息。客户端监控用于定位NC客户端的问题。通过从客户端收集到信息,我们可以确定特定的一个NC客户端网络、JVM、CPU、IO、压缩、缓存等等影响客户端性能的指标是否正常。如果不正常,我们可以马上采取行动。对每个监控数据的理解程度决定了实时监控的效果。,第四部分:离线分析,优势 主要服务 消息中心 日志导入 日志录制 日志分析,离线分析的优势,问题分析和监控分离 消息中心是一种事件驱动的
8、主动发现问题的机制 日志分析可精确地定位问题或者分析系统整体指标 基于数据库的分析提供了足够的灵活性 基于图形的分析更加直观 日志录制提供了一个简单高效的问题响应工作流,主要服务,消息中心 日志导入 日志录制 日志分析,消息中心,消息驱动的主动监控主动管理,消息中心,日志抽取,NC log JVM log CPU log MEMORY log Online user log Client log,以上日志都是可以在日志数据库中导入的!,日志录制,Step1遇到问题,Step3将打包的日志发给服务中心,Step4借助NMC日志分析找到问题优化,step5反馈,step2借助NMC 录制日志,日志
9、分析,日志分析-日志数据库,./logdb/logdb.mdf日志数据库,默认为ACCESS,可以选择oracle作为分析库。 可直接删除 ./conf/resource/logdb.xml 定义表结构 ./conf/resource/logdb.mdf 原始日志库,日志分析-主要的表,Summary NCLOG性能统计表 Logdetail NCLOG明细表 Jvmlog 进程监控日志表 CPUlog CPU日志表 Memorylog 内存日志表 Operator 操作员信息表 Onlineuser 在线用户表 Client 客户端性能表 Message 消息表 Snapshot 快照表,日
10、志分析-对NC日志分析最佳实践,最佳实践,大部分性能问题都可以通过消息中心来定位。 对某个特定客户或者特定操作的问题(性能或者错误),最有效率的办法是日志录制。它提供了简单高效的工作流。加深对系统和日志数据库字典的理解可帮助提高离线分析的能力,第五部分:管理,优势 主要服务 进程管理 补丁管理 安全管理 参数设置,优势,简化管理员成本的最高的管理任务 监控安全和目标系统安全的分离 提高系统可用性,主要服务,进程监控 补丁管理 安全管理 参数设置,进程管理,启动 停止 重启 定时,补丁管理,支持补丁上传,应用,回滚 对服务器代码版本检查,补丁管理,补丁管理架构,安全管理,增加操作员 为操作员赋予权限 默认管理员admin/admin生产系统必须改密码!,参数设置,NMC客户端修改参数实时生效 nmc/server/configure.bat修改参数,需要重启实例,最佳实践,用补丁管理工具来管理补丁可以把管理员彻底地从打补丁中解放出来。 比如,补丁应用后,设置晚上自动重启,每隔5分钟重启一个中间件。 为不同管理员赋予不同的权限。,最新资料获取方式,公司局域网: ftp:/172.16.3.112/nmc 外网: ftp:/125.35.5.209/nmc注意:使用前阅读readme.txt以及NMC使用手册,支持,刘建波 曹建侬 ,Q&A,