ElasticSearch使用Grafana监控服务状态

[toc]

# 版本信息

ElasticSearch：7.14.2

elasticsearch_exporter：1.7.0（latest）

下载地址：https://github.com/prometheus-community/elasticsearch_exporter/releases (opens new window)
下载版本：1.7.0

Grafana：10.0.10

# 构建`docker-compose.yml`

创建并进入目录

mkdir /opt/docker-es-monitor
cd /opt/docker-es-monitor

1
2

创建配置文件

vim /opt/docker-es-monitor/docker-compose.yml

注意：配置文件中不能使用tab，需要是用空格

version: '3'

services:
  prometheus:
    image: prom/prometheus
    container_name: prometheus
    deploy:
      resources:
        limits:
          cpus: '0.8' # cpus: '0.8'表示该服务的CPU使用限制为主机CPU的80%。这意味着，无论主机的CPU有多强大，该服务只能使用其80%的计算能力。
          memory: 12G # memory: 12G表示该服务的内存使用限制为12GB。这意味着，该服务使用的内存不会超过12GB。
    privileged: true # privileged: true是一个选项，它允许容器访问主机系统的所有设备，并允许容器中的进程获取几乎与主机系统相同的权限。在某些情况下，你可能需要容器具有更高的权限来执行特定的任务，例如直接操作网络设备或硬件，或者访问主机系统的特定文件。在这些情况下，你可以在Docker Compose文件中为特定的服务设置privileged: true。
    ports: # ports字段用于定义容器的端口映射。格式为- <主机端口>:<容器端口>
      - 9090:9090
    volumes: # volumes字段用于定义容器的卷映射。格式为- <主机路径>:<容器路径>
      - /etc/prometheus/prometheus.yml:/etc/prometheus/prometheus.yml
    depends_on: # depends_on字段用于定义服务的启动顺序，grafana服务会在当前服务之前启动
      - grafana
    environment:
      - TZ=Asia/Shanghai # 设置服务的时区
  grafana:
    image: grafana/grafana
    hostname: grafana
    container_name: grafana
    ports:
      - 3000:3000
    environment:
      - TZ=Asia/Shanghai
  elasticsearch_exporter1:
    image: quay.io/prometheuscommunity/elasticsearch-exporter:latest
    command:
     - '--es.uri=http://172.16.24.199:9200' # ElasticSearch集群地址
     - '--es.all' # 通过es.uri获取全部节点状态，如果不设置，仅仅获取了配置的那个节点信息
     - '--es.indices' # 查询集群中所有索引的统计信息
     - '--es.indices_settings' # 查询集群中所有索引的设置统计信息
     - '--es.indices_mappings' # 查询集群所有索引映射的统计信息
     - '--es.shards' # 查询集群中所有索引的统计信息，包括分片级别的统计信息
     - '--es.snapshots' # 查询集群快照的统计信息
     - '--es.timeout=20s'
    restart: always
    ports:
     - "172.16.24.224:9114:9114" # elasticsearch_exporter 对外提供的端口，通过该端口可以获取到监控信息，ip为部署docker的机器IP
  elasticsearch_exporter2:
    image: quay.io/prometheuscommunity/elasticsearch-exporter:latest
    command:
     - '--es.uri=http://elastic:Avris2222@172.16.24.191:9200' # ElasticSearch集群地址
     - '--es.all' # 通过es.uri获取全部节点状态，如果不设置，仅仅获取了配置的那个节点信息
     - '--es.indices' # 查询集群中所有索引的统计信息
     - '--es.indices_settings' # 查询集群中所有索引的设置统计信息
     - '--es.indices_mappings' # 查询集群所有索引映射的统计信息
     - '--es.shards' # 查询集群中所有索引的统计信息，包括分片级别的统计信息
     - '--es.timeout=20s'
    restart: always
    ports:
     - "172.16.24.224:9115:9114" # elasticsearch_exporter 对外提供的端口，通过该端口可以获取到监控信息，ip为部署docker的机器IP

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55

# 参数说明

scrape_interval: 指定 Prometheus 抓取数据的时间间隔，默认为 15 秒。这意味着 Prometheus 每隔 15 秒抓取一次数据。
evaluation_interval: 指定规则评估的时间间隔，默认为 15 秒。这影响了 Prometheus 对规则的评估频率。
alertmanagers: 告警管理器配置，这里定义了一个静态的告警管理器的目标地址为 10.0.0.101:9093。这是 Alertmanager 的地址，Prometheus 会将告警发送到这里。
rule_files: 规则文件的配置，这里指定了一个名为 "node_down.yml" 的规则文件。这个文件用于定义 Prometheus 告警的规则。
scrape_configs: 抓取配置的主要部分。Prometheus 通过这里的配置定期从目标服务抓取指标数据。
- Job 'prometheus': 针对 Prometheus 本身的抓取配置，指定了抓取的目标为 10.0.0.101:9090。这个是用于监控 Prometheus 本身的指标。
- Job 'node': 针对节点的抓取配置，设置了较短的抓取间隔（8 秒）并指定了两个目标节点 10.0.0.101:9100 和 10.0.0.102:9100。这用于监控节点的指标。
- Job 'cadvisor': 针对 cAdvisor 的抓取配置，同样设置了较短的抓取间隔并指定了两个 cAdvisor 实例的目标地址。

# elasticsearch_exporter参数说明

https://www.cnblogs.com/qianyuliang/p/15410892.html

# 创建Prometheus配置文件

vim /etc/prometheus/prometheus.yml

这个位置对应docker-compse.ymlPrometheus配置文件挂载的目录

修改内容

global:
  scrape_interval:     5s
  evaluation_interval: 5s

scrape_configs:
 
  - job_name: 'prometheus' # prometheus默认的
    static_configs:
    - targets: ['172.16.24.224:9090']

  - job_name: 'elasticsearch' # 监控ElasticSearch的job名称，自定义即可
    scrape_interval: 60s 
    scrape_timeout:  30s
    metrics_path: "/metrics" # 监控后缀
    static_configs:
    - targets: ['172.16.24.224:9114'] # 刚刚配置的elasticsearch_exporter监控地址

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

# 启动

docker-compose -f docker-compose.yml up -d

# 验证

访问Prometheus UI ：http://172.16.24.224:9090 可以看到是否监控成功

可以看到状态为UP，说明Prometheus监控到了ElasticSearch信息

# 配置Grafana

访问地址：http://172.16.24.224:3000 可以进入Grafana页面，默认账号密码：admin/admin

首次登录需要修改密码

创建数据源

选择Prometheus

输入地址

点击保存

会提示成功

# 导入监控模板

# 模板说明

官方模板：编号为2322

推荐模板：

13071: Dashboard for Elasticsearch Cluster Stats
13072: Dashboard for Elasticsearch Index Stats
13073: Dashboard for Elasticsearch Node Stats
13074: Dashboard for Elasticsearch History Stats

这里我们使用推荐的模板，比较全

输入模板编号，并点击load

选择数据源，并点击Import

导入完成后可以看到监控信息

其他三个模板安装上面方式导入即可。

# 中文显示监控模板

# 集群监控中文版

下载地址：https://download.csdn.net/download/zhangshenghang/88719538 (opens new window)

# 参考资料

参考：https://download.csdn.net/blog/column/12357358/131353971

官网说明：https://github.com/prometheus-community/elasticsearch_exporter

https://blog.csdn.net/u011487470/article/details/124302479

上次更新: 2024/02/01, 21:00:05

← Docker安装ElasticSearchDump备份数据 Grafana配置ElasitcSearch监控-独立部署版本→