ElasticSearch的集群管理命令

ElasticSearch版本

{
  "name" : "data-slave1",
  "cluster_name" : "data-es",
  "cluster_uuid" : "xxxxxxxxxx-eMwxw",
  "version" : {
    "number" : "7.2.1",
    "build_flavor" : "default",
    "build_type" : "rpm",
    "build_hash" : "fkg6eb20",
    "build_date" : "2021-07-24T17:58:29.979462Z",
    "build_snapshot" : false,
    "lucene_version" : "8.0.0",
    "minimum_wire_compatibility_version" : "6.8.0",
    "minimum_index_compatibility_version" : "6.0.0-beta1"
  },
  "tagline" : "You Know, for Search"
}

集群管理命令

Cat API

cat aliases

cat aliases 命令用于显示索引的别名，也包括过滤器和路由信息。

GET /_cat/aliases?v

alias 别名
index 索引别名指向
filter 过滤规则
routing.index 索引路由
routing.search 搜索路由

cat allocation

cat allocation命令可以查看每个节点分配的分配数量以及它们所使用的硬盘空间大小

GET /_cat/allocation?v

shards 分片数
disk.indices 索引index占用的空间大小
disk.used 已用磁盘空间
disk.avail 可用磁盘空间
disk.total 磁盘空间总量
disk.percent 磁盘已使用百分比
host 节点主机地址
ip 节点ip
node 节点名称

cat count

cat count 命令可以快速查询整个集群或者单个索引的文档数量。

GET /_cat/count?v

epoch 自标准时间（1970-01-01 00:00:00）以来的秒数
timestamp 时间，存在8小时时间差问题
count 文档总数

GET /_cat/count/[索引名称]?v

cat fielddata

cat fielddata命令用于查看当前集群中每个数据节点上被fielddata所使用的堆内存大小。

GET /_cat/fielddata?v

在Elasticsearch中，Field Data是用于在聚合（aggregation）和排序（sorting）操作中对文档字段进行分析和处理的一种数据结构。它是一个缓存在内存中的数据结构，用于快速访问和处理字段值。

Field Data可以被认为是对文档字段进行预处理的一种形式，它将字段值从原始的文本形式转换成可供聚合和排序操作使用的数据类型。例如，将一个字符串形式的日期字段转换成一个时间戳，或将一个字符串形式的数字字段转换成一个数字。

使用Field Data可以有效地提高聚合和排序操作的性能，因为它可以避免在每次操作中都对原始字段值进行解析和转换。此外，Field Data还可以通过使用缓存来进一步提高性能，以便更快地访问和处理字段值。

然而，Field Data也有一些限制和注意事项。首先，Field Data需要占用一定的内存空间，因此在处理大量数据时可能会导致内存消耗过高。其次，Field Data只能在不可变的字段上使用，因为一旦字段值发生变化，就需要重新生成Field Data。

为了使用Field Data，可以在字段映射中将字段的fielddata属性设置为true。例如，以下是一个将timestamp字段设置为可使用Field Data的映射示例：

{
  "mappings": {
    "properties": {
      "timestamp": {
        "type": "date",
        "fielddata": true
      }
    }
  }
}

需要注意的是，在大多数情况下，Elasticsearch会自动选择合适的字段数据存储方式。因此，只有在确实需要对字段进行聚合和排序操作时，才需要显式地启用Field Data。

cat health

cat health 命令用于显示集群的健康信息。

GET /_cat/health?v

epoch 自标准时间（1970-01-01 00:00:00）以来的秒数
timestamp 时间
cluster 集群名称
status 集群状态
node.total 节点总数
node.data 数据节点总数
shards 分片总数
pri 主分片总数
repo 复制节点的数量
init 初始化节点的数量
unassign 未分配分片的数量
pending_tasks 待定任务数
max_task_wait_time 等待最长任务的等待时间
active_shards_percent 活动分片百分比

cat indices

cat indices命令可以查看索引信息，包括索引健康状态、索引开关状态、分片数、副本数、文档数量、标记为删除的文档数量、占用的存储空间等信息

GET /_cat/indices?v

health 索引的健康状态
status 索引的开启状态
index 索引名字
uuid 索引的uuid
pri 索引的主分片数量
rep 索引的复制分片数量
docs.count 索引下的文档总数
docs.deleted 索引下删除状态的文档数
store.size 主分片+复制分片的大小
pri.store.size 主分片的大小

cat master

cat master命令可以显示master节点的节点ID、绑定的IP和节点名

GET /_cat/master?v

cat nodeattrs

cat nodeattrs命令可以显示指定节点的属性信息。

GET /_cat/nodeattrs?v

cat nodes

cat nodes命令可以查看集群拓扑结构

GET /_cat/nodes?v

ip es节点ip
heap.percent 堆内存占比
ram.percent 内存使用占比
cpu cpu使用率
load_1m 1分钟内平均load情况，单位ms
load_5m 5分钟内平均load情况，单位ms
load_15m 15分钟内平均load情况，单位ms
node.role 节点权限
master 是否master节点，*为master节点
name 节点名称

cat pending_tasks

cat pending_tasks命令用于查看正在执行的任务列表。

GET /_cat/pending_tasks?v

insertOrder 任务插入顺序
timeInQueue 任务排队了多长时间
priority 任务优先级
source 任务源

cat plugins

cat plugins命令用于查看每一个节点所运行插件的信息

GET /_cat/plugins?v

cat recovery

cat recovery命令是一个索引分片恢复的视图，包括恢复中的先前已完成的。

GET /_cat/recovery?v

index 索引名称
shard 分片名称
time 恢复时间
type 恢复类型
stage 恢复阶段
source_host 源主机
source_node 源节点名称
target_host 目标主机
target_node 目标节点名称
repository 仓库
snapshot 快照
files 要恢复的文件数
files_recovered 已恢复的文件数
files_percent 恢复文件百分比
files_total 文件总数
bytes 要恢复的字节数
bytes_recovered 已恢复的字节数
bytes_percent 恢复字节百分比
bytes_total 字节总数
translog_ops 要恢复的translog操作数
translog_ops_recovered 已恢复的translog操作数
translog_ops_percent 恢复的translog操作的百分比

cat repositories

cat repositories 命令用于展示集群中注册的快照库

GET /_cat/repositories?v

cat thread_pool

cat thread_pool命令用于展示集群中每一个节点线程池的统计信息。默认情况下返回所有线程池的active、queue和rejected的统计信息

GET /_cat/thread_pool?v

由结果发现有很多种类的线程池，询问了一下AI

elasticsearch的线程池很多种类吗？

是的，Elasticsearch的线程池名字有很多个。每个线程池都有自己的名称，用于标识和区分不同的线程池。以下是一些常见的线程池名称：

index：用于执行索引操作的线程池。

search：用于执行搜索操作的线程池。

bulk：用于执行批量操作的线程池。

get：用于执行获取操作的线程池。

suggest：用于执行自动补全操作的线程池。

snapshot：用于执行快照和恢复操作的线程池。

此外，Elasticsearch还支持自定义线程池，可以根据需要创建自己的线程池并提供相应的名称。可以通过Elasticsearch的管理接口查看和监控线程池的状态和性能指标。

Elasticsearch中的线程池是用于处理各种任务的线程池。线程池是一种管理和复用线程的机制，可以提高系统的效率和性能。

Elasticsearch中有几种不同类型的线程池，每种类型都用于处理特定类型的任务。以下是一些常见的线程池类型：

线程池类型：用于处理索引操作。这种线程池用于执行索引操作，如文档的索引、更新和删除。它的线程数通常会根据可用的处理器核心数自动调整。

搜索线程池：用于处理搜索请求。这种线程池用于执行搜索操作，包括查询、聚合和排序。它的线程数也会根据可用的处理器核心数自动调整。
获取线程池：用于处理获取请求。这种线程池用于执行获取操作，如根据ID获取文档或检索文档的字段。类似于搜索线程池，其线程数也会根据可用的处理器核心数自动调整。
刷新线程池：用于处理刷新请求。这种线程池用于处理刷新操作，该操作用于将内存中的索引数据写入磁盘。

除了以上列出的线程池类型，Elasticsearch还有其他一些专用的线程池，用于处理一些特殊的任务，如批量操作线程池、监听器线程池和管理任务线程池等。

总的来说，线程池在Elasticsearch中是非常重要的，它可以高效地管理系统的资源，并提供并发处理能力，从而提高系统的性能和吞吐量。

cat shards

cat shards 命令用于查看节点包含的分片信息，包括一个分片是主分片还是一个副本分片、文档的数量、硬盘上占用的字节数、节点所在的位置等信息。

GET /_cat/shards/.monitoring-es-7-2024.01.23?v

index 索引名称
shard 分片序号
prirep 分片类型 p 表示是主分片 r 表示是复制分片
state 分片状态
docs 该分片存放的文档数量
store 该分片占用的存储空间大小
ip 该分片所在的服务器ip
node 该分片所在的节点名称

cat segments

cat segments 命令用于查看索引的段信息

GET /_cat/segments/.monitoring-es-7-2024.01.23?v

index 索引名称
shard 分片名称
prirep 主分片还是副本分片
ip 所在节点ip
segment segments段名
generation 分段生成
docs.count 段中的文档数
docs.deleted 段中删除的文档数
size 段大小，以字节为单位
size.memory 段内存大小，以字节为单位
committed 段是否已提交
searchable 段是否可搜索
version 版本
compound compound模式

cat templates

cat templates命令用于查看集群中的模板

GET /_cat/templates?v

name 模板名称
index_patterns 模板匹配规则
order 模板优先级
version 模板版本

Cluster API

Cluster Health

利用ElasticSearch的集群健康API可以查看当前集群的健康信息

GET _cluster/health

cluster_name 集群名称
status 集群的健康状态，green 所有主分片和从分片都可用，yellow 所有主分片可用，但存在不可用的从分片，red 存在不可用的主分片
timed_out 是否超时
number_of_nodes 节点数，包括master节点和data节点
number_of_data_nodes data节点数
active_primary_shards 活动的主分片
active_shards 所有活动的分片数，包括主分片和副本
relocating_shards 正在发生迁移的分片
initializing_shards 正在初始化的分片
unassigned_shards 没有被分配的分片
delayed_unassigned_shards 延迟未被分配的分片
number_of_pending_tasks master节点任务队列中的任务数
number_of_in_flight_fetch 正在进行迁移的分片数量
task_max_waiting_in_queue_millis 队列中任务最大等待时间
active_shards_percent_as_number 活动分片的百分比

获取一个或多个索引的健康信息

GET /_cluster/health/.monitoring-es-7-2024.01.23

Cluster State

Cluster State（集群状态）API 可以对整个集群的信息进行一个全面的了解，包括集群信息、集群中每个节点的信息、元数据、路由表等。

GET /_cluster/state

version 返回集群状态版本信息
master_node 只返回master节点的状态信息
nodes 返回集群中的节点的配置信息，主要包括节点名称、IP、是否是master节点
routing_table 返回每个节点的路由信息
metadata 返回元数据信息，包括每个索引的mapping、setting等信息
blocks 返回集群中的块数据信息

Cluster Stats

Cluster Stats （集群统计）API用于从集群中获取各种统计数据。该API的返回信息主要有两部分，一部分是索引层面，包括分片数、存储大小、内存使用情况等指标，另一部分是节点层面，包括节点数量、节点角色、操作系统、jvm版本、内存、CPU、安装的插件等指标。

GET /_cluster/stats

_nodes 节点信息
cluster_name 集群名称
cluster_uuid 集群ID
timestamp 时间戳
status 集群状态
indices
- count 索引数
- shards 分片信息：总数、主分片数、副本分片数、以及最大、最小、均值
- docs 文档信息：文档数、删除的文档数
- store 存储大小
- fielddata 字段缓存信息
- query_cache 查询缓存信息
- completion 自动补全信息
- segments 段信息
nodes
- count 节点总数、以及各角色节点数
- versions 版本
- os 操作系统信息：处理器数量、系统名称、内存
- process 进程信息
- jvm java虚拟机信息：版本、内存、线程
- fs 文件系统信息
- plugins 插件信息
- network_types 网络信息
- discovery_types 自动发现信息
- packaging_types 发布包信息

Pending Cluster Tasks

Pending Cluster Tasks API 用于返回一个正在添加到更新集群状态的任务列表。集群中的变化通常是很快的，通常这个操作会返回一个空的列表

GET /_cluster/pending_tasks

Cluster Reroute

reroute命令可以明确地执行集群重新路由分配命令。例如，把一个分片从一个节点移动到另一个节点，把未分配的分片移动到一个指定的节点

POST /_cluster/reroute
{
	"commands":[
		{
		 "move":{
		 	"index":"test",
		 	"shard":0,
		 	"from_node":"node1",
		 	"to_node":"node2"
		 }
		},
		{
		 "allocate_replica":{
          "index":"test",
          "shard":1,
          "node":"node3"
         }
	    }
	]
}

Cluster Update Settings

Update Settings命令可以更新集群中的配置，如果是永久配置，就需要重启集群；如果是瞬时配置，就不需要重启集群。例如，更新最小master节点数

PUT /_cluster/settings
{
	"persistent":{
		"discovery.zen.minimum_master_nodes": 1
	}
}

Nodes Stats

Cluster Nodes Stats（集群节点统计信息） API可以获取集群中一个或者多个节点的统计信息。

GET /_nodes/stats

获取nodeId1 和 nodeId2节点的统计信息

GET /_nodes/nodeId1,nodeId2/stats

Nodes Info

Cluster Nodes Info API 可以获取集群中一个或多个节点的信息，包括设置、操作系统、虚拟机、线程池等信息。

GET /_nodes

GET /_nodes/os,jvm

Task Management API

Task Management API 可用于获取ElasticSearch集群中一个或多个节点正在执行中的任务信息。

GET /_tasks

Cluster Allocation Explain API

Cluster Allocation Explain API 用于解释分片没有被分配的原因。

GET /_cluster/allocation/explain
{
  "index":".monitoring-es-7-2024.01.23",
  "shard":0,
  "primary":true
}