Stream Processing과 Apache Flink 프레임워크에 대한 내용을 알아보고, Flink를 사용하여 실시간 데이터 처리 및 분석을 수행하는 방법과 주요 특징에 대해 설명합니다.
Apache Flink
Apache Airflow
Apache Airflow에 대한 개요와 핵심 용어, 아키텍처, DAG(Directed Acyclic Graph)의 생성 및 실행 과정, Web UI, 내장 및 외부 Operator, Catch Up과 Backfill과 같은 데이터 처리 및 실행 제어 기능에 대해 설명합니다.
Spark Backend Service – Optimizer
Spark Backend Service – Optimizer에 대해 알아봅니다.
Spark의 Catalyst Project는 데이터 처리 작업 최적화와 실행 계획 생성을 담당하며, Catalyst Pipeline은 분석과 최적화로 쿼리 성능을 향상시킵니다.