Kim Seogyu
Distributed Systems

Ceph Erasure Coding 데이터 저장 흐름

Ceph EC 쓰기 경로를 인코딩, CRUSH 배치, 쿼럼 관점에서 정리합니다.

Published 2025년 12월 27일1 min read130 words

Ceph Erasure Coding 데이터 저장 흐름

Ceph EC 쓰기 흐름은 "객체를 분할하고, 인코딩하고, 실패 도메인을 고려해 배치하는 과정"입니다.

단계 요약

  1. 객체 -> PG 매핑
  2. primary OSD 수신
  3. 데이터 k 조각 + 패리티 m 조각 생성
  4. CRUSH 규칙으로 OSD 배치
  5. 쓰기 쿼럼 충족 시 성공 응답

운영에서 중요한 포인트

1) k/m 비율

  • 저장 효율 vs 복구 비용의 균형점
  • 대규모 워크로드는 읽기 패턴까지 함께 고려

2) 실패 도메인 설계

host/rack 단위 분산이 잘못되면 장애 한 번에 복구 가능성을 잃습니다.

3) 작은 쓰기 비용

EC는 작은 random write에서 비용이 큽니다. 워크로드 특성에 따라 replicated pool 병행이 필요할 수 있습니다.

결론

EC 저장 경로는 단순 공간 절감 기능이 아니라 가용성 정책입니다. k/m, CRUSH 규칙, 워크로드를 분리해서 설계해야 합니다.

Share

Related Articles

Comments

이 블로그는 제가 알고 있는 것들을 잊지 않기 위해 기록하는 공간입니다.
직접 작성한 글도 있고, AI의 도움을 받아 정리한 글도 있습니다.
정확하지 않은 내용이 있을 수 있으니 참고용으로 봐주세요.

© 2026 Seogyu Kim