⏱ 2시간 30분 📚 25개 레슨 🎧 오디오 버전

Apache Spark ETL 파이프라인 설계 및 실행

PySpark 및 Hadoop을 사용하여 확장 가능한 데이터 파이프라인을 구축, 최적화 및 관리하는 방법을 배우고 데이터 엔지니어링 여정을 시작하세요.

💬 AI 강사
어떤 강의든 질문하면 언제든 즉시 명확한 답을 받을 수 있어요.
🕐 언제든지 시작
정해진 일정이나 마감이 없어요 — 원할 때 자신의 속도로 배우세요.
🌐 한국어로
강의, 과제, 수료증까지 — 모두 완전히 당신의 언어로.

이 과정 소개

현대 조직은 방대한 양의 데이터를 생성하므로 효율적인 데이터 통합 및 변환은 모든 데이터 전문가에게 중요한 기술입니다. Apache Spark는 대규모 데이터셋을 빠르고 안정적으로 처리하는 업계 표준입니다.

이 서면 과정은 강력한 추출, 변환, 로드(ETL) 파이프라인을 설계, 실행 및 모니터링하는 데 필요한 기본 개념과 실질적인 단계를 안내합니다. 기본 데이터 엔지니어링 용어를 이해하는 것부터 데이터를 정리, 집계 및 최신 스토리지 시스템에 로드하는 구조화된 파이프라인을 구축하는 것까지 진행됩니다.

학습 내용:
- 핵심 Apache Spark 아키텍처, DataFrame 및 에코시스템 구성 요소를 이해합니다.
- MySQL과 같은 관계형 데이터베이스 및 플랫 파일을 포함한 다양한 소스에서 데이터를 추출합니다.
- 필터링, 조인 및 집계를 위한 PySpark 함수를 사용하여 데이터셋을 변환합니다.
- 처리된 데이터를 대상 데이터베이스 및 Parquet와 같은 최신 스토리지 형식으로 효율적으로 로드합니다.
- 파이프라인 성능 및 리소스 활용도를 개선하기 위한 최적화 기술을 적용합니다.
- 깨끗하고 유지 관리 가능한 데이터 엔지니어링 프로젝트 환경을 구성하고 구조화합니다.

여정은 필수 정의 및 환경 설정으로 시작하여 견고한 개념적 기반을 보장합니다. 그런 다음 단계별 서면 설명 및 코드 분석을 통해 기능적이고 종단 간 ETL 파이프라인을 구축하고 실행합니다.

이 과정은 데이터 엔지니어링 분야에 진입하고자 하는 초보자를 위해 설계되었습니다. Apache Spark에 대한 사전 경험은 필요하지 않지만 Python에 대한 기본적인 이해는 도움이 됩니다.

확장 가능한 첫 번째 데이터 파이프라인을 구축하기 위해 오늘 바로 읽기 시작하세요.

받게 되는 것

📜 수료증
LinkedIn 프로필에 추가
💬 개인 AI 튜터
강좌에서 막혔나요? 내장 튜터에게 언제든지 무엇이든 물어보세요.
🎧 오디오 버전 포함
화면 없이 어디서나 학습
♾️ 평생 이용
언제든 다시 보세요, 만료 없음
📱 휴대폰 또는 컴퓨터
어디서든 모든 기기에서
💸 14일 환불
이유 묻지 않음
⚡ 짧고 핵심적
2시간 30분의 실용 학습

수료증

PickAClass에서 수료하는 모든 강좌는 이런 자격증을 발급합니다 — 원본, 고유 코드, URL 검증 가능, 그리고 실제로 입증한 내용을 상세히 기재.

PickAClass

스킬 프로필 · 검증 가능

문서

숙달 인증서

다음을 증명합니다

이름 성

의 숙달을 성공적으로 입증했습니다

Apache Spark ETL 파이프라인 설계 및 실행

입증된 스킬

✓

행동 패턴 분석

기초

1.2 시간

✓

의사결정 아키텍처 프레임워크

숙련

1.4 시간

✓

A/B 테스트 설계

숙련

1.7 시간

✓

행동 심리학 카피라이팅

고급

1.9 시간

PickAClass — 이름 성

Apache Spark ETL 파이프라인 설계 및 실행

2/2 페이지

성과 상세

수강 내용 요약

완료한 레슨 14 / 14

연습 문제 26 / 28

제출 과제 4 (평균 4.5 / 5)

캡스톤 프로젝트 검토됨 — 4.6 / 5

총 연습 6.2 시간

성과 벤치마크

코호트 순위 1,625명 중 상위 12%

완료까지 시간 11일 (중앙값: 22)

숙달 점수 91 / 100

연습 문제 점수 94%

스킬 검증 검증된 스킬 경로

샘플 인증서 보기 →

리뷰

아직 리뷰가 없습니다 — 첫 경험을 공유해 보세요.

다른 학습자도 수강

🌟 수강생이 선택한 🎓 수료증 제공

자주 묻는 질문

이 과정을 듣는 데 무엇이 필요한가요? +

인터넷이 되는 휴대폰이나 컴퓨터만 있으면 됩니다. 설치나 특별한 장비는 필요 없습니다.

결제는 어떻게 하나요? +

Stripe를 통한 카드로. 카드 정보는 저장하지 않으며 Stripe가 안전하게 처리합니다.

환불받을 수 있나요? +

네 — 14일 이내 전액 환불, 이유를 묻지 않습니다.

얼마나 오래 이용할 수 있나요? +

평생. 구매하면 과정은 당신의 것이며 언제든 다시 볼 수 있습니다.

수료증을 받을 수 있나요? +

네. 수료 시 LinkedIn 프로필에 추가할 수 있는 수료증을 받습니다.

이런 분야 학습자에게

테크 디자인 금융 마케팅 의료 교육 호스피탈리티 제조업

⭐ 학습자가 선택 🎓 수료증 제공

$9.99

✓ 단일가 $9.99 — 모든 코스, 영구 이용. 만료 없음.

바로 구매 →

또는

멤버십으로 $0에 받기

매달 10개 강의 · 월 $49.99 · 언제든 해지

✓ 수료증
✓ 오디오 버전 포함
✓ 평생 이용
✓ 일회성 결제 · 자동 갱신 없음
✓ 14일 환불 보장
✓ 휴대폰 또는 컴퓨터

Stripe로 안전하게 결제

Apache Spark ETL 파이프라인 설계 및 실행

이 과정 소개

받게 되는 것

수료증

리뷰

리뷰 쓰기

다른 학습자도 수강

시스템 분석 및 데이터 웨어하우징 기본 사항

빅 데이터의 기초: 용어, 아키텍처, 현대적인 파이프라인

분석 엔지니어링의 기초: dbt와 Snowflake

데이터 엔지니어링의 기초

자주 묻는 질문