Asas PySpark: Pemprosesan Data Besar dengan Python

Belajar untuk memproses, kueri, dan menganalisis set data besar menggunakan PySpark, memindahkan kemahiran Python dan SQL anda ke persekitaran data besar terdistribusi.

4.8 (2,385) ⏱ 1 jam 1 min 📚 10 pelajaran 🎧 Versi audio

Tentang kursus ini

Sebagai set data tumbuh terlalu besar untuk ditangani oleh alat tradisional, pengkomputeran terdistribusi menjadi penting untuk profesional data moden. Kursus berasaskan teks ini memperkenalkan anda kepada PySpark, API Python untuk Spark, membolehkan anda memproses dan menganalisis set data besar dengan kelajuan dan kecekapan. Anda akan berpindah dari pemprosesan data mesin tunggal ke aliran kerja data besar yang diedarkan. Dengan membaca penjelasan yang jelas dan berlatih dengan snippet kod dunia sebenar, anda akan menguasai konsep asas penyimpanan yang diedarkan, pelaksanaan pertanyaan, dan manipulasi data. Apa yang anda akan belajar: - Mengerti dasar-dasar pengkomputeran terdistribusi, arsitektur Spark, dan transisi dari pustaka data tradisional. - Cipta dan manipulasikan Dataset Terdistribusi Bertahan (RDD) dan Spark DataFrames berkelajuan tinggi. - Tanya set data besar menggunakan Spark SQL untuk menjalankan pertanyaan hubungan biasa pada data terdistribusi. - Laksanakan API Pandas moden pada Spark untuk skala aliran kerja Pandas sedia ada anda kepada data besar. - Optimumkan paip pemprosesan data menggunakan caching, partitioning, dan definisi skema yang berkesan. - Mengeksplorasi asas aliran terstruktur untuk pemprosesan suapan data masa nyata. Kursus ini bermula dengan terminologi data besar yang penting dan arsitektur teras Spark sebelum beralih ke operasi DataFrame dan pertanyaan SQL yang praktikal. Anda akan maju ke teknik pengoptimuman prestasi dan API penskalaan data moden melalui penjelasan tertulis yang terstruktur dan latihan kod. Kursus ini direka untuk jurutera data pemula, penganalisis data, dan pemaju Python yang ingin memasuki dunia data besar. Tiada pengalaman sebelumnya dengan sistem terdistribusi diperlukan, walaupun pemahaman asas Python dan SQL akan membantu. Mula membaca hari ini untuk membuka kuasa pengkomputeran terdistribusi dan skala kemahiran pemprosesan data anda.

Apa yang anda dapat

  • 📜 Sijil tamat
    Tambah ke profil LinkedIn anda
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Termasuk versi audio
    Belajar sambil bergerak — tanpa skrin
  • ♾️ Akses seumur hidup
    Kembali bila-bila masa, tiada tamat tempoh
  • 📱 Telefon atau komputer
    Berfungsi di mana-mana, mana-mana peranti
  • 💸 Pulangan 30 hari
    Tanpa soalan
  • Pendek dan fokus
    1 jam 1 min kandungan praktikal

Ulasan (4)

Mateo Torres UY Pelajar disahkan
★ 3 · 2026-03-01T20:20:24+00:00

Strukturnya logik, tapi saya harap ada lebih banyak latihan selain contoh asas.

جميلة بن حسن TN Pelajar disahkan
★ 4 · 2026-03-01T05:16:24+00:00

Sangat informatif. Saya suka contoh aplikasi praktikal, walaupun tetapan awal mengambil masa lebih lama daripada yang saya jangkakan.

Chernet Mekonnen ET Pelajar disahkan
★ 5 · 2026-01-05T06:03:24+00:00

Saya sangat menikmati kursus ini. Cara maklumat disampaikan adalah cemerlang, dan aplikasi praktikalnya ditonjolkan dengan berkesan. Kerja yang bagus!

Олександр Коваленко UA Pelajar disahkan
★ 2 · 2024-12-18T10:12:24+00:00

Ia pengenalan yang baik. Boleh mendapat manfaat daripada contoh yang lebih pelbagai dan aliran yang sedikit lebih baik antara modul.

Tulis ulasan

Selepas hantar kami akan meminta anda log masuk — draf disimpan.

Pelajar lain juga mengambil

Soalan lazim

Apa yang saya perlukan untuk mengikuti kursus ini? +

Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.

Bagaimana untuk membayar? +

Dengan kad melalui Stripe, atau kripto. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.

Bolehkah saya dapatkan bayaran balik? +

Ya — pulangan penuh dalam 30 hari, tanpa soalan.

Berapa lama saya akan mempunyai akses? +

Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.

Adakah saya akan mendapat sijil? +

Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.

Direka untuk pelajar dalam
Teknologi Reka bentuk Kewangan Pemasaran Kesihatan Pendidikan Hospitaliti Pembuatan