Distributed Systems
Ceph Erasure Coding 메타데이터 관리
Ceph EC 메타데이터를 프로파일, 매핑, 복구 관점에서 요약합니다.
Ceph Erasure Coding 메타데이터 관리
EC 운영에서 실제로 어려운 부분은 인코딩보다 메타데이터 일관성입니다.
핵심 메타데이터
- EC 프로파일(
k,m, 알고리즘) - CRUSH 규칙/실패 도메인
- 객체-청크 매핑 정보
- PG/OSD 상태 로그
왜 중요한가
- 데이터는 있어도 매핑 정보가 깨지면 복구가 어려워집니다.
- 클러스터 확장/교체 시 규칙 변경이 기존 데이터 배치에 영향 줍니다.
운영 원칙
- 프로파일/CRUSH 변경은 변경 이력과 함께 관리
- 장애 복구 플레이북에 메타데이터 검증 절차 포함
- 스크럽/딥스크럽 결과를 메타데이터 오류와 연결해 분석
- 버전 불일치 감지 시 자동 조치보다 격리 우선
결론
EC 메타데이터는 제어면(control plane)의 핵심 자산입니다. 데이터 복구 계획보다 먼저 메타데이터 신뢰성을 보장해야 합니다.