빅데이터 기초: Hadoop, Apache Spark, MapReduce

분산 데이터 처리의 기초를 마스터하고, 확장 가능한 파이프라인을 구축하며, Hadoop, MapReduce, Apache Spark를 사용하여 대규모 데이터셋을 분석하세요.

2.7 (154) ⏱ 1시간 34분 📚 12개 레슨

이 과정 소개

조직에서 매초 엄청난 양의 데이터를 생성함에 따라 기존 데이터베이스 및 처리 시스템은 속도를 따라잡기 어렵습니다. 대규모로 데이터를 저장, 처리 및 분석하는 방법을 이해하는 것은 현대 개발자 및 데이터 전문가에게 필수적인 기술입니다. 이 텍스트 기반 과정은 빅데이터의 기본 개념부터 분산 시스템 설계 및 쿼리까지 안내합니다. 단일 머신 처리에서 분산 아키텍처로 전환하고 현대 데이터 파이프라인을 지원하는 핵심 프레임워크를 마스터하는 방법을 배우게 됩니다. 학습 내용: - 빅데이터의 핵심 차원과 HDFS와 같은 분산 스토리지 시스템이 대규모 데이터셋을 관리하는 방법을 이해합니다. - 대규모 정형 및 비정형 데이터를 처리하기 위해 MapReduce 프로그램을 작성합니다. - Pig 및 관계형 SQL 데이터베이스를 사용하여 효율적으로 데이터를 쿼리하고 변환합니다. - RDD 및 최신 DataFrame API를 모두 사용하여 Apache Spark로 빠르고 인메모리 데이터 파이프라인을 구축합니다. - 확장 가능한 데이터 아키텍처를 위한 최신 데이터 레이크하우스 개념 및 클라우드 스토리지 통합을 탐색합니다. - 효율적인 작업 실행을 보장하기 위해 YARN을 사용하여 클러스터 리소스를 구성하고 최적화합니다. 빅데이터 용어 및 분산 시스템 아키텍처를 탐색하는 것으로 시작합니다. 거기에서 쿼리 작성, 데이터 스트림 처리 및 복잡한 데이터 워크플로를 오케스트레이션하는 방법을 보여주는 실습 연습을 진행합니다. 이 과정은 빅데이터 경험이 없는 상태에서 분산 컴퓨팅의 강력한 기반을 구축하려는 초보 개발자, 지망하는 데이터 엔지니어 및 데이터베이스 관리자를 대상으로 합니다. 오늘 읽기를 시작하여 대규모 데이터 처리의 잠재력을 발휘하고 엔지니어링 기술을 향상시키세요.

받게 되는 것

  • 📜 수료증
    LinkedIn 프로필에 추가
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • ♾️ 평생 이용
    언제든 다시 보세요, 만료 없음
  • 📱 휴대폰 또는 컴퓨터
    어디서든 모든 기기에서
  • 💸 30일 환불
    이유 묻지 않음
  • 짧고 핵심적
    1시간 34분의 실용 학습

리뷰

아직 리뷰가 없습니다 — 첫 경험을 공유해 보세요.

리뷰 쓰기

보낸 뒤 로그인을 안내합니다 — 임시저장됩니다.

다른 학습자도 수강

자주 묻는 질문

이 과정을 듣는 데 무엇이 필요한가요? +

인터넷이 되는 휴대폰이나 컴퓨터만 있으면 됩니다. 설치나 특별한 장비는 필요 없습니다.

결제는 어떻게 하나요? +

Stripe를 통한 카드 또는 암호화폐로. 카드 정보는 저장하지 않으며 Stripe가 안전하게 처리합니다.

환불받을 수 있나요? +

네 — 30일 이내 전액 환불, 이유를 묻지 않습니다.

얼마나 오래 이용할 수 있나요? +

평생. 구매하면 과정은 당신의 것이며 언제든 다시 볼 수 있습니다.

수료증을 받을 수 있나요? +

네. 수료 시 LinkedIn 프로필에 추가할 수 있는 수료증을 받습니다.

이런 분야 학습자에게
테크 디자인 금융 마케팅 의료 교육 호스피탈리티 제조업