빅 데이터 분석을 위한 Scala 및 Spark

Scala의 함수형 프로그래밍과 Apache Spark의 분산 컴퓨팅 엔진을 결합하여 대규모 데이터 세트를 처리하는 방법을 배워보세요.

4.6 (2,600) ⏱ 1시간 48분 📚 5개 레슨

이 과정 소개

데이터 세트가 단일 머신에 너무 커지면서 현대 개발자와 데이터 엔지니어는 기존의 로컬 처리에서 분산 컴퓨팅으로 전환해야 합니다. 이 텍스트 기반 교육 과정에서는 빅 데이터 처리의 핵심 개념을 설명하고 Scala의 우아하고 기능적인 패러다임을 사용하여 Apache Spark의 속도를 활용하는 방법을 보여줍니다. 기본 로컬 코드 작성에서 클러스터 전반에 걸쳐 확장할 수 있는 강력한 분산 데이터 파이프라인 설계로 전환합니다. 명확한 개념 설명을 읽고 실제 코드 예제를 분석하여 분산 시스템의 강력한 기반을 구축합니다. 무엇을 배울 것인가: - 분산 컴퓨팅, 클러스터 실행 및 Spark의 메모리 모델의 기본 원리를 이해합니다. - Scala의 기능적 프로그래밍 개념을 적용하여 분산 데이터 컬렉션을 안전하고 효율적으로 조작합니다. - 최적화된 데이터 변환을 위해 DataFrames 및 Datasets를 포함한 Spark의 구조화된 API를 숙지합니다. - 대규모 구조화 및 반구조화 데이터를 분석하기 위해 표현적 Spark SQL 쿼리를 작성합니다. - Parquet 및 Delta Lake와 같은 최신 스토리지 형식에서 읽고 쓰기 위해 데이터 파이프라인을 구성합니다. - 분산 데이터 작업에서 일반적인 성능 병목 현상을 식별하고 해결하는 방법을 연습합니다. 이 과정은 필수 빅 데이터 용어, Scala 기본 구문, 핵심 분산 개념으로 시작하여 직접적인 데이터 조작, 구조화된 API 설계, 실용적인 최적화 워크플로우로 이동합니다. 이 교육 과정은 클러스터 경험 없이도 처음부터 분산 처리를 배우고 싶은 개발자, 데이터 분석가, 꿈꾸는 데이터 엔지니어를 포함한 빅 데이터 초보자를 위해 설계되었습니다. 오늘 읽기를 시작하여 Scala 및 Spark를 사용하여 분산 데이터 분석의 힘을 활용하십시오.

받게 되는 것

  • 📜 수료증
    LinkedIn 프로필에 추가
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • ♾️ 평생 이용
    언제든 다시 보세요, 만료 없음
  • 📱 휴대폰 또는 컴퓨터
    어디서든 모든 기기에서
  • 💸 30일 환불
    이유 묻지 않음
  • 짧고 핵심적
    1시간 48분의 실용 학습

리뷰 (2)

Andrew Owusu GH 인증된 학습자
★ 4 · 2026-03-17T08:44:08+00:00

꽤 유익했어요. 실용적인 적용 예시가 좋았지만, 초기 설정이 예상보다 오래 걸렸어요.

فريد DZ 인증된 학습자
★ 4 · 2026-02-14T08:30:08+00:00

전반적으로 괜찮아요. 어떤 부분은 예상보다 좀 빨랐지만, 예시가 도움이 됐어요. 대체로 탄탄한 강의입니다.

리뷰 쓰기

보낸 뒤 로그인을 안내합니다 — 임시저장됩니다.

다른 학습자도 수강

자주 묻는 질문

이 과정을 듣는 데 무엇이 필요한가요? +

인터넷이 되는 휴대폰이나 컴퓨터만 있으면 됩니다. 설치나 특별한 장비는 필요 없습니다.

결제는 어떻게 하나요? +

Stripe를 통한 카드 또는 암호화폐로. 카드 정보는 저장하지 않으며 Stripe가 안전하게 처리합니다.

환불받을 수 있나요? +

네 — 30일 이내 전액 환불, 이유를 묻지 않습니다.

얼마나 오래 이용할 수 있나요? +

평생. 구매하면 과정은 당신의 것이며 언제든 다시 볼 수 있습니다.

수료증을 받을 수 있나요? +

네. 수료 시 LinkedIn 프로필에 추가할 수 있는 수료증을 받습니다.

이런 분야 학습자에게
테크 디자인 금융 마케팅 의료 교육 호스피탈리티 제조업