Data Engineering·2026-01-02데이터 엔지니어링 시리즈 #5: PySpark 실전 - 데이터 처리 패턴과 최적화실무에서 자주 사용하는 PySpark 패턴을 배웁니다. DataFrame 연산, UDF 최적화, 조인 전략, 캐싱, 그리고 피해야 할 안티패턴까지.