2024년 8월 24일
출처: 313DEVGRP
분산 개발을 위해서
분산 시스템 = 클러스터
미러링
레이드 (0 , 5, 10)
노드 개수에 따라서 샤드의 형태는 달라질 수 밖에 없다.
인덱스 = 테이블이 맞지만 인덱스는 많을 수 없다.
단, 인덱스는 1개만 두면 파일이 하나만 생긴다. 그렇다면 어떻게 구분하나? 시계열 데이터베이스이다. 같은 인덱스지만 일자별로 인덱스를 나누어서 사용한다. → 이 인덱스들을 Alias(별칭)으로 사용한다.
3000개 이상의 인덱스가 생긴다면 Merge가 필요하다. ES에게는 크리티컬하다. 리미트 3000개 이상 넘어가면 멈추고 더 늘릴 것인가 Merge 것인가 설정하도록 하지만 늘리면 느려지고 하드웨어가 더 필요하다.
샤드는 분산, 리플리카는 복제 → 리플리카가 높아야 장애상황에 대처 및 복구가 가능하다.
리플리카가 0이면 데이터는 유실되기 때문에 무조건 리플리카 설정이 필요하다.
인덱스 첫 세팅이 중요하다. 즉 리인덱스 작업이 발생할 때 샤드, 리플리카를 인덱스 전체가 돌며 진행되는데 이 작업에서 문제가 생기면 돌이킬 수가 없다
keyword 타입은 관리 대상 - 너무 길면 메모리를 많이 먹는다.