Distributed Systems
Ceph Erasure Coding 데이터 조회 흐름
Ceph EC 읽기 경로와 복구 읽기(degraded read) 비용을 정리합니다.
EC 읽기는 정상 경로와 복구 경로를 구분해 이해해야 합니다.
정상 읽기
필요 데이터 조각이 모두 있으면 단순 조합으로 응답합니다.
Degraded read
일부 조각이 없으면:
- 최소 복구 조합 선택
- 추가 조각 요청
- 디코딩 연산 수행
- 원본 응답 생성
이때 지연과 네트워크 비용이 크게 증가합니다.
운영 포인트
- 디스크 장애 시 degraded read 비율을 별도 모니터링
- 복구 작업(backfill/recovery)과 사용자 읽기 간 자원 경쟁 제어
- 핫 오브젝트는 읽기 패턴에 맞게 계층/풀 전략 분리
결론
EC 읽기 성능은 평시 평균보다 장애 시 최악 지연을 봐야 합니다. SLO는 degraded 상황 기준으로 설정하는 것이 안전합니다.
다음 읽기
이 생각이 이어지는 방향
읽은 뒤의 대화
읽은 뒤의 생각을 이어갑니다
질문, 반론, 조용한 후속 메모를 이 글 아래에 남길 수 있습니다.