【监控】监控到底要监控哪些东西

😎对于运维来说,老生常谈的就是监控.
那么我们该监控哪些东西才能才能及时的发现问题,不会背锅,才不会事后弥补呢

名人名言

  • 监控大法好,谁也跑不了

  • 业务有问题,监控帮助您!

    架构梳理图:

从以上图可以看出作者这边把监控分为从入口到底部的一个分层:

  • 服务监控
  • 中间件监控
  • 业务监控
  • 入口监控
  • 接入监控

服务监控

针对服务器的基础监控:

中间件/容器

针对服务依赖中间件/载体:

K8S集群

当前K8S已经有很多公司使用中,对于它的监控也是至关重要

业务监控(集成)

如果有公司使用proemtheus的可以试试在不影响服务性能的情况下继承Prometheus客户端,官方提高了不同语言的客户端

  • golang
  • java(jmx_exporter\pom)
  • python等等

业务监控(日志)

针对组件日志监控一般需要规范格式.

  • nginx日志
  • 组件日志
  • 请求日志
  • 链路日志
    一般组件日志常用状态码或者耗时进行监控,而组件业务日志包含很多敏感信息或不同类型,常用大数据聚合统计监控

调用监控

针对业务做链路拨测

  • 全链路拨测
  • 重点客户拨测
  • 全业务模块拨测
  • 核心组件拨测