Phân tích dữ liệu thực tiễn với Python và Spark

Nắm vững các nguyên tắc cơ bản của xử lý dữ liệu phân tán và xây dựng các quy trình phân tích mạnh mẽ với PySpark, ngay cả khi bạn chưa có kinh nghiệm về dữ liệu lớn.

4.5 (1,117) ⏱ 1 giờ 1 phút 📚 12 bài 🎧 Phiên bản âm thanh

Về khóa học này

Bạn cảm thấy choáng ngợp trước các tập dữ liệu quá lớn hoặc quá chậm đối với các công cụ truyền thống? Hãy tìm hiểu cách khai thác sức mạnh của điện toán phân tán để xử lý lượng thông tin khổng lồ một cách hiệu quả với Python và Apache Spark. Khóa học này cung cấp nền tảng thực tiễn, dựa trên văn bản về PySpark, hướng dẫn bạn từ các khái niệm cốt lõi đến việc xây dựng và chạy các ứng dụng phân tích dữ liệu thực tế. Bạn sẽ thực hành chuyển đổi dữ liệu thô, thực hiện các phép tổng hợp phức tạp và cấu trúc mã của mình để thực thi có khả năng mở rộng trên các hệ thống phân tán, tất cả đều thông qua các giải thích bằng văn bản rõ ràng và các bài tập thực hành. Những gì bạn sẽ học: - Hiểu các khái niệm cốt lõi về kiến ​​trúc của Spark, bao gồm thực thi phân tán và đánh giá lười biếng. - Nắm vững API DataFrame hiện đại để thao tác, lọc và tổng hợp dữ liệu có cấu trúc một cách hiệu quả. - Xây dựng các đường dẫn xử lý dữ liệu thực tế bằng cách sử dụng bộ chuyển đổi và hành động phong phú của PySpark. - Truy vấn các tập dữ liệu lớn một cách tương tác bằng công cụ Spark SQL mạnh mẽ. - Tìm hiểu các nguyên tắc cơ bản về xử lý dữ liệu thời gian thực với Structured Streaming của Spark. - Khám phá những điều cơ bản về kiến ​​trúc Lakehouse và các khái niệm lưu trữ dữ liệu giao dịch. - Thực hành chuẩn bị và chạy các ứng dụng Spark trên cụm máy tính để đạt hiệu suất có thể mở rộng. Khóa học bắt đầu với các thuật ngữ thiết yếu và nguyên tắc cơ bản của Spark trước khi tiến đến các bài tập thực hành với DataFrames, SQL và xử lý dữ liệu luồng. Bạn sẽ xây dựng kỹ năng của mình từng bước, chuẩn bị cho bạn giải quyết các thách thức dữ liệu phức tạp. Khóa học này được thiết kế cho người mới bắt đầu. Không yêu cầu kinh nghiệm trước đó về các framework dữ liệu lớn hoặc điện toán phân tán, mặc dù kiến ​​thức cơ bản về Python sẽ có lợi. Hãy bắt đầu hành trình của bạn vào thế giới phân tích dữ liệu lớn ngay hôm nay.

Bạn sẽ nhận được

  • 📜 Chứng chỉ hoàn thành
    Thêm vào hồ sơ LinkedIn
  • 🎧 Bao gồm phiên bản âm thanh
    Học mọi lúc mọi nơi — không cần màn hình
  • ♾️ Truy cập trọn đời
    Quay lại bất cứ lúc nào, không hết hạn
  • 📱 Điện thoại hoặc máy tính
    Hoạt động mọi nơi, mọi thiết bị
  • 💸 Hoàn tiền 30 ngày
    Không cần lý do
  • Ngắn gọn, đi vào trọng tâm
    1 giờ 1 phút nội dung thực hành

Đánh giá (1)

نادية القادري TN
★ 4 · 2026-01-17T19:58:52+00:00

Thực sự thích cách trình bày của khóa học này. Các ứng dụng thực tế được thảo luận rất đúng trọng tâm. Khóa học tuyệt vời!

Viết đánh giá

Sau khi gửi, chúng tôi sẽ yêu cầu đăng nhập — bản nháp được lưu.

Học viên cũng học

Câu hỏi thường gặp

Tôi cần gì để học khóa này? +

Chỉ cần điện thoại hoặc máy tính có kết nối internet. Không cần cài đặt hay thiết bị đặc biệt.

Tôi thanh toán bằng cách nào? +

Bằng thẻ qua Stripe, hoặc tiền điện tử. Chúng tôi không lưu thông tin thẻ — Stripe xử lý an toàn.

Tôi có thể được hoàn tiền không? +

Có — hoàn tiền đầy đủ trong 30 ngày, không cần lý do.

Tôi sẽ có quyền truy cập trong bao lâu? +

Mãi mãi. Sau khi mua, khóa học là của bạn để xem lại bất cứ lúc nào.

Tôi có nhận được chứng chỉ không? +

Có. Sau khi hoàn thành, bạn sẽ nhận được chứng chỉ và có thể thêm vào hồ sơ LinkedIn.

Dành cho người học trong
Công nghệ Thiết kế Tài chính Marketing Y tế Giáo dục Khách sạn-Dịch vụ Sản xuất