Elasticsearch 生産環境叢集部署最佳實踐

連結

1、記憶體

Elasticsearch 和 Lucene 都是 Java 語言編寫，這意味着我們必須注意堆記憶體的設定。

Elasticsearch 可用的堆越多，它可用于過濾器（filter）和其他緩存的記憶體也就越多，更進一步講可以提高查詢性能。

但請注意，過多的堆可能會使垃圾回收暫停時間過長。請勿将堆記憶體的最大值設定為 JVM 用于壓縮對象指針（壓縮的 oops）的臨界值之上，确切的臨界值有所不同，但不要超過 32 GB。

推薦：幹貨 | 吃透Elasticsearch 堆記憶體

常見記憶體配置坑 1：堆記憶體設定過大

舉例：Elasticsearch 主控端：64 GB 記憶體，堆記憶體恨不得設定為 64 GB。

但，這忽略了堆的另一部分記憶體使用大戶：OS 檔案緩存。

Lucene 旨在利用底層作業系統來緩存記憶體中的資料結構。Lucene 段存儲在單獨的檔案中。

由于段是不可變的（immutable），是以這些檔案永遠不會更改。這使它們非常易于緩存，并且底層作業系統很樂意将熱段駐留在記憶體中，以加快通路速度。

這些段包括反向索引（用于全文搜尋）和doc values 正排索引（用于聚合）。Lucene 的性能取決于與 OS 檔案緩存的互動。

如果你将所有可用記憶體配置設定給 Elasticsearch 的堆，則 OS 檔案緩存将不會剩下任何可用空間。這會嚴重影響性能。

官方标準建議是：将 50％的可用記憶體（不超過 32 GB，一般建議最大設定為：31 GB）配置設定給 Elasticsearch 堆，而其餘 50％留給 Lucene 緩存。

圖檔來自網絡

可以通過以下方式配置 Elasticsearch 堆：

方式一：堆記憶體配置檔案 jvm.options

# Xms represents the initial size of total heap space

# Xmx represents the maximum size of total heap space

-Xms16g

-Xmx16g

方式二：啟動參數設定

ES_JAVA_OPTS="-Xms10g -Xmx10g" ./bin/elasticsearch

2、CPU

運作複雜的緩存查詢、密集寫入資料都需要大量的CPU，是以選擇正确的查詢類型以及漸進的寫入政策至關重要。

一個節點使用多個線程池來管理記憶體消耗。與線程池關聯的隊列使待處理的請求得以保留（類似緩沖效果）而不是被丢棄。

由于 Elasticsearch會做動态配置設定，除非有非常具體的要求，否則不建議更改線程池和隊列大小。

線程池和隊列的設定，參見：

Elasticsearch 線程池和隊列問題，請先看這一篇。

繼續閱讀