收藏 分享(赏)

1JKB主动式端到端应用运维监控平台V1.pptx

上传人:精品文库 文档编号:1485568 上传时间:2018-07-22 格式:PPTX 页数:35 大小:9.36MB
下载 相关 举报
1JKB主动式端到端应用运维监控平台V1.pptx_第1页
第1页 / 共35页
1JKB主动式端到端应用运维监控平台V1.pptx_第2页
第2页 / 共35页
1JKB主动式端到端应用运维监控平台V1.pptx_第3页
第3页 / 共35页
1JKB主动式端到端应用运维监控平台V1.pptx_第4页
第4页 / 共35页
1JKB主动式端到端应用运维监控平台V1.pptx_第5页
第5页 / 共35页
点击查看更多>>
资源描述

1、主动式端到端应用运维监控平台,监控宝介绍,企业IT运维监控面临的挑战,内部(系统)视角,外部(用户)视角,从被动到主动,从外到内,从局部到全局,从无序到有序,随着企业业务的增长以及IT系统复杂度的不断提升,传统以内部视角的“离散化”IT运维正面临巨大的挑战,而解决这些问题必须要从企业IT运维平台的角度统一考虑,全面规划并建设从外到内的一体化监控质量体系。,自外向内的主动式端到端应用运维监控平台,云智慧IT运维监控平台是面向IT应用系统可靠性和性能监控的一体化主动监控平台,帮助使用者从最终用户体验出发,监控和分析网站、网络、服务、数据库和服务器性能,通过强大的告警及可视化界面帮助用户第一时间发现

2、应用性能问题,平台通过持续的IT性能监控和预警确保系统稳定可靠,降低维护成本,推动企业业务增长。,业务流程,视频直播,数据库,服务,内网安全,页面性能,防火墙,用户,云智慧主动式端到端应用运维监控平台模块集合,DNS解析状态,网络链路质量,CDN效果评估,网站或应用是否宕机,访问速度是否理想,分布式监测点实时监测各地和运营商线路,网站监控基于全球分布式网络主动感知用户体验,网站监控数据统计分析,整体性能数据实时展现 响应时间及可用率统计 世界和中国地图 细化数据到地级市 国家及城市排名 各运营商数据统计 报警与故障信息汇总,网站监控数据统计分析(续),网站监控故障分析,记录所有监测点故障快照

3、评估故障影响的范围 访问的全过程数据记录 快速定位故障和性能瓶颈 故障的类型分析 故障持续时间分析 故障汇总统计,网站监控网站SLA证书,网站监控全球分布式监测网络,业务流程(API接口)监控/功能与价值,通过遍布全球的分布式监控网络以可量化、可视化、自动化技术手段,实时监控业务服务的响应性能,帮助用户准确感知整体业务的性能和质量状况。API监控支持接口可用性、正确性和响应时间判断,同时支持多步接口构成的业务流程监控。,业务流程(API接口)监控全面多维度数据分析,端到端视频直播性能监控整体解决方案,主播端监控,CDN网络实时监控与加速效果评估,观众端体验监控,针对视频采集、传输网络及移动端播

4、放质量的全链路监控与实时分析,帮助定位并优化直播卡顿等多种问题。,端到端视频直播性能监控观众端直播体验监控,通过嵌入SDK,在直播应用中实时采集用户体验数据,如果出现卡顿或延时大的情况可立即触发告警,同时提供多维度数据统计,帮助分析用户观看体验问题。,用户每次访问网站都会对网站的资源进行加载,有时候图片过大、JS脚本错误等都会造成网站加载时间过长,影响用户体验。通过网页性能监控,对网站的加载情况进行全方位分析,针对响应情况进行评分并提供优化建议。,页面性能管理,大文件下载速率监控,针对用户IDC机房选型、文件下载质量监测等需求,通过周期性的模拟用户行为,对监测下载速率、下载正确性、访问质量及网

5、络质量情况进行综合统计,提供专业多维度分析报告。,安全监控平台,安全监控功能与价值,自动化收集业务系统安全数据,以漏洞为主要维度对业务系统安全进行全面监控、分析与处理,可对公网服务器进行检测,也支持VPN方式对内网服务器进行扫描。,实时告警,在线报告,邮件报告,主机漏洞检测,主机端口检测,漏洞白名单,任务数据比对,加固率统计,安全态势统计,安全数据采集,全面掌握业务系统安全状况,0day扫描帮助发现最新漏洞,落实安全工作考核制度,节约定期安检的人力物力成本,安全监控典型应用场景,监管部门安全检查,设备入网验收,日常安全检查,为用户提供服务组件监控,及时掌握组件工作状态,发现组件异常及时告警;

6、监控Apache、Tomcat、Lighttpd、Nginx、IIS、Docker等主流服务组件; 监控MySQL、Oracle、SQLServer、MongoDB、Redis、Memcache等主流关系型及非关系型数据库;,服务性能监控,服务器性能监控,CPU 监控CPU使用比例,包括User、System、IOWait以及Idle等,磁盘 监控所有磁盘分区的空间使用率 所有磁盘分区的I/O流量,负载 监控服务器的平均负载,包括最近1分钟、5分钟、15分钟负载,内存 内存使用率、包括空闲内存、高速缓存、页面缓存、应用程序内存,网卡 监控网络设备的流量,包括网卡流入与流出分析,系统进程 监控系

7、统当前的进程数量,CPU,内存,磁盘,网卡,负载,进程,服务器,可视化监控大屏,可视化监控大屏(续),实时性能告警功能及原理,平台提供了强大的实时告警功能,满足企业级用户对于告警分级、合并、事件响应与处理、分析需求。,实时性能告警基于事件模型的告警处理,同一项目,不同项目,不同项目,不同时段,同一时段,不同时段,VS,VS,VS,监控项目,监控项目,监控项目,监控项目,监控项目,监控项目,v,多维度对比分析报告,云智慧IT运维监控平台移动端APP,监控平台提供移动端APP,支持iOS、Android双重版本,告警Push通知、快照详情、概览统计一应俱全,帮助运维人员突破时间和地域的限制轻松监控

8、性能。,实时推送告警通知,深入分析性能问题,随时随地自由监控,云智慧IT运维监控平台价值,基于SaaS的一体化IT运维监控监控解决方案,被动运维转为主动服务,避免与减少风险,提升企业业务价值。,客户服务水平协议保障 IT风险可视、可控,服务能力标准化 避免用户业务损失,提升服务质量 增加业务收入,综合电商行业案例(小米商城),小米商城是小米的关键在线服务,作为小米产品及手机智能硬件周边设备的销售平台,拥有大量的注册用户和在线交易,配备小米完备的电商体系和物流体系,尝试建立在各环节的竞争优势,客户体验对于业务保障至关重要。,实时掌握各地用户的网站访问体验,及时发现性能问题;为故障解决提供完整素材

9、,促进故障快速定位,减少故障平均解决时间;掌握外部系统接口的服务情况,为保障和提升整体SLA提供依据;监测频繁上线引发的页面性能问题,及时发现和修复问题;,模拟网站首页和关键交易,监测可用性和业务流程完整性; 检测运营商网络质量,识别网络性能问题; 实时监测系统API接口,掌握接口服务性能; 监控网页性能,及时发现程序更新产生的性能问题。,通过部署云智慧监控平台,帮助小米实时发现性能问题,快速定位故障原因,有效保障客户体验,避免因性能不佳造成的客户流失。双十二前发现小米社区用户访问性能急剧下降,原因是DNS域名解析服务响应慢,运维及时调整后得以恢复。,外资企业案例(星巴克),星巴克作为国际知名

10、连锁咖啡集团,2015年12月天猫旗舰店正式上线,由于网店的基础服务由第三方提供,因此需要第一时间发现电商平台及电商App运行卡顿、响应缓慢、无法访问等问题,而不是等用户投诉后再亡羊补牢。,实时掌握各地移动端和Web端用户的平台访问体验,及时发现性能问题;快速定位系统故障,减少故障平均解决时间;掌握支付、登录和定位系统等API服务情况,为保障和提升整体SLA提供依据;监测频繁上线引发的页面/应用性能问题,及时发现和修复问题;诊断应用系统在高负载、高并发访问压力下的性能状况;性能数据的Dashboard大屏呈现;,监控涵盖了网站、服务器、服务、API和自定义日志监控,每天都能发现监控项出现的问题

11、,监控宝完善的告警功能让客户第一时间发现问题、判断问题、并解决问题。 特别是和第三方支付相关的API监控和自定义订单日志监控,能够让客户得到准确的故障信息和订单详情,最大限度地避免了客户的损失。,在星巴克咖啡天猫旗舰店正式上线一个月前开始部署和实施监控宝平台项目,前期需要客户提供所有需要监控的站点、服务器、服务、API等信息,部署完成后,测试阶段主要调整所有监控项的告警线阀值和告警通知设定。,传统行业案例(长虹),长虹以智慧家庭为重点,基于社区线下刚性生活服务设施的智能化/物联化,建设社区用户开放服务与社交平台,广泛对接医疗、教育、生活等第三方社区O2O服务,从而打造完善的智慧社区生态链。但是

12、与互联网结合来实现供应链整合和业务模式创新也给企业带来巨大挑战,企业内部传统IT架构向云端和移动互联网转型同样存在较大风险。,智能监控,监控所有技术栈的运行状态,预测性能瓶颈;智能分析,实时分析整体性能指标、监控各项指标性能状态,实现宏观管控;准确定位,从外网到内网快速发现端到端的性能问题,准确定位问题;智能关联,某个环节出现性能问题,自动关联涉及到此问题的各个环节,逐个排查;智能告警,对事件进行分级告警,通过短信-电话-邮件-App-微信方式实现;智能统计,对监控结果实现大数据分析和统计,形成统计报表;,实时监控全国各地区对长虹网站的访问,通过分析用户访问的整体情况,智能感知全国区域运行状态

13、; 实时监控后端服务器、数据库等组件,即时发现可能产生性能瓶颈的环节; 通过网络质量直观判断性能状况,判断故障发生的区域分布及故障类型; 智能统计结果,监控结果与各业务环节对应,对性能进行全方位的诊断。,通过分布式监测网络,实时监控长虹网站运行状态,结合服务器和服务监控,准确定位后端性能问题。,在线教育行业案例(环球教育),环球教育专注于提供雅思、托福、SAT等留学考试培训,其官方网站负责与教学相关的在线咨询、在线测试、在线选课,以及myieltslab和mytoefllab课外学习课程。平台每日会有TB乃至PB级的海量多媒体数据通过网络分发出去,任何环节出现问题都会导致用户端显示错误,如视频

14、卡顿、视频音频不同步、图片打不开、文字加载不全等。,由于互联网的普及,网络已经成为环球教育获得生源和学生培训的最主要渠道,因此高质量的在线服务体验直接关系着公司的业务收入:实时监控各分支机构所在地访问官网的情况,确保不同网络运营商接入的网站用户均可正常访问网站;监控网站咨询、测试等业务模块的可用性,第一时间发现故障问题;监控问答、课程等API接口的性能状况和正确性;监控基础设施性能状态,提前发现和预警性能瓶颈;,对北京、上海、广州等重点城市的联通、电信、移动运营商网络进行重点监控,即时发现各地用户不可访问的故障并进行告警; 对在线课程、在线测试等模块和相关API接口的可用性、正确性进行长期监控

15、,确保学生在线学习体验; 对服务器、数据库等IT基础设施的运行状态进行监测,提前发现空间、内存不足等性能瓶颈,确保网站访问体验。,通过分布式监测网络,对环球教育所有技术栈进行全面的分钟级监控和告警服务,达到了如下目的:,在线医疗行业案例(寻医问药网),寻医问药网是一站式互联网医疗服务平台,随着网站服务越来越多,IT架构日趋复杂,加上用户流量的暴增,经常出现网站/应用响应缓慢或部分服务不可用的问题。虽然寻医问药网不断优化IT架构,采用分布式架构设计,部署服务器集群、CDN和负载均衡,但仍不能解决问题。,提供有效的真实用户问题监控和复现手段;提供真正基于业务的应用性能监控工具;能够第一时间发现发现

16、问题,而不是等待业务运营部门的用户反馈;能够快速追踪问题根源,及时处理问题,缩短响应时间;,生产环境下对物理层、存储层、应用组件层、网络层和业务应用层进行7*24小时监控; 根据预设的阈值获得报警信息,及时掌握运营平台的运行情况; 通过详细的数据报告准确发现故障点,大大提高了运维效率; 根据每周和每月数据报告,掌握基础设施平台的资源状况,提前发现资源瓶颈,有针对性的进行资源扩容和系统优化。,利用云智慧全栈性能管理解决方案,无需对寻医问药网现有的IT架构做任何修改,就获得了以下能力:,云智慧业务运维支撑平台介绍,面向新时代与技术背景下的运维管理,云智慧在业界首次提出了业务运维三维关注度模型与实施

17、方法体系,业务运维支撑平台就是该业务运维理念的践行方案,平台以用户体验为核心,关注在产品交付全生命周期下的业务质量以及应用性能对业务的支撑作用,是促进IT部门的角色定位转变与价值重塑的有效途径。,聚焦驱动因素,促进业务增长,运营性能分析,适应市场变化,快速定位问题,降低运维成本,提供决策依据,管理与技术简单可靠,业务容量规划,支撑业务高速增长,关于云智慧,IT性能监控神器监控宝问世,国内监控服务市场占有率第一,在线活跃用户达到200,000,获得戈壁A轮数百万美元融资,获得红杉领投的1500万美元B轮融资 国内首个端到端APM解决方案透视宝问世,压测宝上线 业务运维支撑平台发布,建成全球最大的监测网络,企业用户数达到300,000 获得红杉领投的1230万美元B融资,Thanks,,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 教育学

本站链接:文库   一言   我酷   合作


客服QQ:2549714901微博号:道客多多官方知乎号:道客多多

经营许可证编号: 粤ICP备2021046453号世界地图

道客多多©版权所有2020-2025营业执照举报