Elasticsearch Basic Concepts

Near Realtime

インデックスには単一ノードのハードウェア制限を超える可能性のあるデータが格納される可能性がある
ディスクフルになった単一ノードだけの場合、検索が非常に遅くなる
この問題を解決するために ES は index を shards と呼ばれる複数のピースに分割する機能がある
インデックスを作成するときに、シャードの数を単純に指定できる。
それぞれのシャード自体が完全に機能的で独立した “index”
- それはクラスタ内の任意のノードでホストできる
シャードが重要な2つの主要な理由
- コンテンツの量を水平に分割、拡大ができる
- シャードにまたがった操作を分散及び並列化できるため、パフォーマンスが向上する

障害がいつでも発生する可能性があるネットワークやクラウド環境
- シャードやノードがなんらかの理由でオフラインになったり消えたりした場合
- フェイルオーバーメカニズムが有用で、強く推奨される
- このようなバイのために ES はインデックスのシャードのコピーをする
- これはレプリカシャードであり、レプリカと短く呼ぶ
レプリケーションが重要な2つの主要な理由
- シャードやノードに障害が発生した場合に備えて HA を提供する
  - レプリカシャードはオリジナルや主要なシャードと同じノードに決して割り当てられないようにするのが重要
- 検索容量やスループットをスケールアウトできる
各インデックスは複数のシャードに分割できる
インデックスは 1回以上複製することができる
複製すると、各インデックスにプライマリーシャードとレプリカシャードが保持される
インデックスを作成した後でも動的にレプリカの数を変更できる
- しかし簡単な作業ではないため、事前に計画するのが最適
default では primary/replica が1つずつ
- 2ノードのクラスタの場合、1つのノードにプライマリ、もう1つレプリカが保持されることを意味している