Những kiến ​​thức cơ bản về PySpark: Xử lý và phân tích dữ liệu lớn với Python

Hãy chuyển đổi kỹ năng Python và SQL của bạn sang PySpark để làm sạch, tổng hợp và phân tích các tập dữ liệu khổng lồ bằng cách sử dụng các quy trình xử lý dữ liệu lớn hiện đại.

4.5 (8,727) ⏱ 36 phút 📚 12 bài 🎧 Phiên bản âm thanh

Về khóa học này

Khi các tập dữ liệu ngày càng lớn đối với các công cụ truyền thống như Pandas, xử lý dữ liệu lớn trở thành kỹ năng thiết yếu đối với bất kỳ chuyên gia dữ liệu nào. PySpark kết hợp sự đơn giản của Python với sức mạnh của Spark để xử lý phân tích dữ liệu khổng lồ một cách liền mạch. Khóa học dựa trên văn bản này sẽ hướng dẫn bạn chuyển đổi các kỹ năng thao tác dữ liệu của mình sang môi trường điện toán phân tán. Bạn sẽ tự tin hơn trong việc tải, làm sạch, chuyển đổi và xuất dữ liệu quy mô lớn bằng cách sử dụng các phương pháp PySpark hiện đại. Những gì bạn sẽ học: - Hiểu kiến ​​trúc nền tảng của Spark và cách thức hoạt động của điện toán phân tán - Đọc và ghi dữ liệu từ nhiều định dạng khác nhau, bao gồm CSV, JSON và các tệp Parquet hiện đại - Làm sạch và chuyển đổi tập dữ liệu bằng cách xử lý các giá trị thiếu, lọc hàng và đổi tên cột - Tổng hợp và xoay trục dữ liệu bằng cách sử dụng API PySpark DataFrame và các truy vấn Spark SQL - Áp dụng các phương pháp thực hành tốt nhất hiện đại, chẳng hạn như tận dụng API pandas trên Spark để chuyển đổi liền mạch Bạn sẽ bắt đầu bằng cách nắm vững các khái niệm và thuật ngữ cốt lõi trước khi đi sâu vào các kỹ thuật thao tác dữ liệu thực tế. Thông qua các giải thích bằng văn bản và các đoạn mã rõ ràng, bạn sẽ tiến bộ từ việc tải dữ liệu cơ bản đến các phép tổng hợp phức tạp và viết các đầu ra được tối ưu hóa. Khóa học này được thiết kế dành cho người mới bắt đầu tìm hiểu về dữ liệu lớn, bao gồm các nhà phân tích dữ liệu và lập trình viên Python muốn nâng cao khả năng xử lý dữ liệu của mình. Không yêu cầu kinh nghiệm sử dụng Spark trước đó. Hãy bắt đầu học ngay hôm nay để khai phá sức mạnh của dữ liệu lớn với PySpark.

Bạn sẽ nhận được

  • 📜 Chứng chỉ hoàn thành
    Thêm vào hồ sơ LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Bao gồm phiên bản âm thanh
    Học mọi lúc mọi nơi — không cần màn hình
  • ♾️ Truy cập trọn đời
    Quay lại bất cứ lúc nào, không hết hạn
  • 📱 Điện thoại hoặc máy tính
    Hoạt động mọi nơi, mọi thiết bị
  • 💸 Hoàn tiền 30 ngày
    Không cần lý do
  • Ngắn gọn, đi vào trọng tâm
    36 phút nội dung thực hành

Đánh giá (7)

Idris Lawal NG
★ 3 · 2026-04-14T12:53:52+00:00

Thiết kế khóa học xuất sắc. Cách các khái niệm xây dựng lẫn nhau rất liền mạch. Rất thực tế và giải thích rõ ràng.

লায়লা বেগম BD Học viên đã xác minh
★ 5 · 2026-02-06T10:35:52+00:00

Wow, khóa học này vượt xa mong đợi của tôi. Thông tin được trình bày rất rõ ràng và khả năng áp dụng rất lớn.

مريم الكندري KW Học viên đã xác minh
★ 5 · 2025-06-24T16:58:52+00:00

Khóa học này vượt xa mong đợi của tôi! Các ví dụ rất liên quan và giúp củng cố các khái niệm. Rất thú vị.

Camila Sánchez AR Học viên đã xác minh
★ 4 · 2025-06-06T19:02:52+00:00

Khóa học này thực sự giúp tôi củng cố một số khái niệm quan trọng. Giải thích xuất sắc và các ví dụ rất minh họa. Rất thích!

Eva Palková SK Học viên đã xác minh
★ 3 · 2025-04-10T09:22:52+00:00

Giới thiệu tốt. Tôi đánh giá cao các bước rõ ràng, mặc dù một số mô-đun sau có thể cần thêm ví dụ.

Hannah Meyer AT
★ 4 · 2025-03-15T17:14:52+00:00

Đây là một phần giới thiệu khá ổn. Có thể thêm nhiều ví dụ đa dạng hơn và cải thiện luồng giữa các mô-đun một chút.

Axel Jónasson IS Học viên đã xác minh
★ 4 · 2025-01-27T07:50:52+00:00

Tôi rất vui vì đã tham gia khóa học này. Cách các khái niệm được giải thích đã giúp nó trở nên cực kỳ dễ tiếp cận. Rất đáng công sức bỏ ra.

Viết đánh giá

Sau khi gửi, chúng tôi sẽ yêu cầu đăng nhập — bản nháp được lưu.

Học viên cũng học

Câu hỏi thường gặp

Tôi cần gì để học khóa này? +

Chỉ cần điện thoại hoặc máy tính có kết nối internet. Không cần cài đặt hay thiết bị đặc biệt.

Tôi thanh toán bằng cách nào? +

Bằng thẻ qua Stripe, hoặc tiền điện tử. Chúng tôi không lưu thông tin thẻ — Stripe xử lý an toàn.

Tôi có thể được hoàn tiền không? +

Có — hoàn tiền đầy đủ trong 30 ngày, không cần lý do.

Tôi sẽ có quyền truy cập trong bao lâu? +

Mãi mãi. Sau khi mua, khóa học là của bạn để xem lại bất cứ lúc nào.

Tôi có nhận được chứng chỉ không? +

Có. Sau khi hoàn thành, bạn sẽ nhận được chứng chỉ và có thể thêm vào hồ sơ LinkedIn.

Dành cho người học trong
Công nghệ Thiết kế Tài chính Marketing Y tế Giáo dục Khách sạn-Dịch vụ Sản xuất