Dataflow 및 Dataproc을 활용한 배치 데이터 파이프라인 엔지니어링

신뢰할 수 있는 비즈니스 인텔리전스를 위해 서버리스 클라우드 도구를 사용하여 대규모 데이터셋을 변환하는 확장 가능한 ETL 워크플로우 설계 및 구축

4.4 (30) ⏱ 57분 📚 12개 레슨 🎧 오디오 버전

이 과정 소개

대규모 데이터셋을 효율적으로 처리하는 것은 현대 비즈니스 인텔리전스 및 보고의 핵심입니다. 이 과정은 간단한 데이터 스크립트에서 대규모 변환을 쉽게 처리하는 견고하고 자동화된 배치 파이프라인을 설계하는 방법으로 전환하는 방법을 가르칩니다. 업계 표준 클라우드 기술을 사용하여 대규모 데이터 이동 및 변환을 관리하는 데 필요한 기술을 습득하게 될 것입니다. 학습 내용: - ETL/ELT 패턴 및 배치 처리 아키텍처를 포함한 기본적인 데이터 엔지니어링 개념 이해 - 통합 데이터 처리를 위해 Dataflow에서 Apache Beam을 사용하여 서버리스 데이터 처리 작업 구축 - 기본 인프라 관리 없이 Spark 애플리케이션을 실행하도록 Dataproc Serverless 구성 - 파이프라인의 신뢰성과 정확성을 보장하기 위해 데이터 품질 검사 및 관측 가능성 패턴 적용 - 복잡한 워크플로우를 오케스트레이션하고 다양한 데이터 처리 단계 간의 종속성 관리 - 파이프라인 오류를 사전에 식별하고 해결하기 위한 최신 모니터링 및 알림 구현 이 과정은 핵심 정의 및 아키텍처 원칙으로 시작하여 SQL 및 Python 기반 로직을 사용한 실용적인 구현 전략으로 넘어갑니다. 파이프라인 설계에 대한 자세한 설명을 읽고 유지 관리 및 성능을 위한 코드 구조화 방법을 탐색하게 됩니다. 이 프로그램은 SQL 및 Python에 대한 기본적인 이해를 가지고 있으며 해당 기술을 클라우드 규모 데이터 처리에 적용할 준비가 된 데이터 엔지니어링 초보자를 위해 설계되었습니다. 오늘 바로 프로덕션 준비가 된 데이터 파이프라인 구축을 시작하세요.

받게 되는 것

  • 📜 수료증
    LinkedIn 프로필에 추가
  • 🎧 오디오 버전 포함
    화면 없이 어디서나 학습
  • ♾️ 평생 이용
    언제든 다시 보세요, 만료 없음
  • 📱 휴대폰 또는 컴퓨터
    어디서든 모든 기기에서
  • 💸 30일 환불
    이유 묻지 않음
  • 짧고 핵심적
    57분의 실용 학습

리뷰

아직 리뷰가 없습니다 — 첫 경험을 공유해 보세요.

리뷰 쓰기

보낸 뒤 로그인을 안내합니다 — 임시저장됩니다.

다른 학습자도 수강

자주 묻는 질문

이 과정을 듣는 데 무엇이 필요한가요? +

인터넷이 되는 휴대폰이나 컴퓨터만 있으면 됩니다. 설치나 특별한 장비는 필요 없습니다.

결제는 어떻게 하나요? +

Stripe를 통한 카드 또는 암호화폐로. 카드 정보는 저장하지 않으며 Stripe가 안전하게 처리합니다.

환불받을 수 있나요? +

네 — 30일 이내 전액 환불, 이유를 묻지 않습니다.

얼마나 오래 이용할 수 있나요? +

평생. 구매하면 과정은 당신의 것이며 언제든 다시 볼 수 있습니다.

수료증을 받을 수 있나요? +

네. 수료 시 LinkedIn 프로필에 추가할 수 있는 수료증을 받습니다.

이런 분야 학습자에게
테크 디자인 금융 마케팅 의료 교육 호스피탈리티 제조업