方案落地
数据支柱
追踪(Tracing )
链路追踪主要为分布式应用提供完整的调用链路还原、调用请求量统计、链路拓扑、应用依赖分析等能力。链路追踪的主要目的详细记录应用组件之间的调用过程, 帮助开发者、系统管理员在系统故障时,快速定位和排除统故障。
日志(Logging )
日志的职责是记录离散事件,通过这些记录,事后回溯程序的行为和执行过程,譬如曾经调用过什么方法,曾经操作过哪些数据等等。日志的作用主要是在错误发生时,管理人员能够通过日志回溯系统的运行过程,快速定位错误。
度量(Metrics )
度量是指对系统中某一类信息的统计聚合。度量的主要目的是监控(Monitoring )和预警(Alert),如某些度量指标达到风险阈值时触发事件,以便自动处理或者提醒管理员介入。
系统架构
全方位资源管控
针对业务系统特性,预置常用监控项模板,包括主机监控、JVM监控、SpringBoot监控、Nginx监控、Rabbitmq监控、MongoDB监控、Redis监控及Mysql监控
定制化监控指标
·支持监控资源的扩展,可快速搭建监控服务;
·支持自定义扩展监控探针,确保全面监控各类服务满足用户多样化的监控需求。
全链路深度监控
自动绘制服务间的调用关系,直观展示服务的调用状态,完整显示请求的代码内部执行情况,快速定位代码问题
代码级性能剖析
提供代码级性能剖析,利用方法栈快照结合分布式追踪端点上下文,对代码执行速度进行估算,协助用户定位业务系统性能问题
一站式日志管理
分布式收集、集中化管理日志;日志信息可视化展示;强大的搜索能力,可根据关键词进行模糊匹配,快速筛选数据并统计筛选结果
错误日志精准定位分析
自定义搜索字段,快速过滤错误日志,辅助相关人员及时采取措施纠正错误,规避潜在业务风险
智能化告警管理
资源告警:针对业务特性设置主机、应用、服务等报警规则
调用链告警:基于业务视角设置服务响应时间、http请求成功率SLA、每分钟的吞吐量等报警规则
多样化告警通知
支持邮箱告警推送,可自定义告警分发策略,并根据策略推送报警信息。支持扩展微信、钉钉等多种推送方式。
日常巡检
快速概览业务状况
快速了解业务异常
一键导出巡检报告
异常快速定位与处理
异常信息全聚合
服务报警信息、调用信息、日志信息全聚合,有效帮助运维人员进行深度异常分析
全链路追踪
请求链路追踪,快速定位异常,缩短异常问题的排除时间以及判断问题影响范围
可视化追踪
可视化链路各阶段的耗时,进行性能分析,排除业务瓶颈
辅助服务优化
梳理服务依赖关系,协助运维人员优化依赖的合理性
产品优势
实时监控信息
实时获取主机CPU、内存、磁盘、负载、网络及服务运行状态等全方位数据,实时监控资源运行情况
数据可视化展示
支持图形化展示监控数据及应用调用关系,方便直观的查看监控信息;支持巡检报告一键导出,有效提升运维效率
资源监控可扩展
可依据业务需求自定义扩展监控探针,全面满足用户各类监控需求
全链路追踪业务调用
快速定位应用缓慢、错误和异常,确保业务质量
深度性能剖析
可对业务进行代码级的性能剖析,提供基于堆栈的分析结果,帮助运维人员有针对性地进行业务优化
日志统一管理
提供一站式的日志管理服务,支持对多源、离散日志的统一采集、处理、存储与查询分析,提升运维人员日志管理效率,专注挖掘日志数据价值
快速智能告警
提供个性化资源监控告警和调用链告警,可自主根据业务情况及实际应用场景设置规则,并及时发送告警通知,确保运维人员快速有效处理问题
产品价值