PySpark Foundations: praktyczne przetwarzanie dużych danych za pomocą Pythona

Naucz się przetwarzać, zapytać i analizować ogromne zbiory danych za pomocą PySpark, przenosząc swoje umiejętności Pythona i SQL do rozproszonych środowisk big data.

4.8 (2,385) ⏱ 1 godz 1 min 📚 10 lekcji 🎧 Wersja audio

O tym kursie

Ponieważ zbiory danych stają się zbyt duże, aby tradycyjne narzędzia mogły sobie z nimi poradzić, obliczenia rozproszone stają się niezbędne dla nowoczesnych specjalistów od danych.Ten kurs tekstowy wprowadza Cię do PySpark, interfejsu API Pythona dla Sparka, umożliwiając przetwarzanie i analizowanie ogromnych zbiorów danych z szybkością i wydajnością. Przejdziesz od przetwarzania danych na jednej maszynie do rozproszonych przepływów pracy Big Data.Czytając jasne wyjaśnienia i ćwicząc z fragmentami kodu w świecie rzeczywistym, opanujesz podstawowe pojęcia rozproszonego przechowywania, wykonywania zapytań i manipulacji danymi. Czego się nauczysz: - Zapoznaj się z podstawami przetwarzania rozproszonego, architekturą Spark i przejściem z tradycyjnych bibliotek danych. - Twórz i manipuluj odpornymi rozproszonymi zestawami danych (RDD) i wysokowydajnymi ramami danych Spark. - Zapytaj duże zbiory danych za pomocą Spark SQL, aby uruchomić znane zapytania relacyjne na rozproszonych danych. - Zastosuj nowoczesny interfejs API Pandas na Sparku, aby płynnie skalować istniejące przepływy pracy Pandas do dużych danych. - Zoptymalizuj potoki przetwarzania danych za pomocą buforowania, partycjonowania i wydajnych definicji schematu. - Poznaj podstawy uporządkowanego przesyłania strumieniowego do przetwarzania kanałów danych w czasie rzeczywistym. Kurs rozpoczyna się od podstawowej terminologii big data i podstawowej architektury Sparka, zanim przejdziemy do praktycznych operacji DataFrame i zapytań SQL.Następnie przejdziesz do technik optymalizacji wydajności i nowoczesnych interfejsów API skalowania danych poprzez uporządkowane pisemne wyjaśnienia i ćwiczenia kodowe. Ten kurs jest przeznaczony dla początkujących inżynierów danych, analityków danych i programistów Pythona, którzy chcą wejść w świat dużych danych.Nie jest wymagane wcześniejsze doświadczenie z systemami rozproszonymi, chociaż pomocne jest podstawowe zrozumienie Pythona i SQL. Zacznij czytać już dziś, aby odblokować moc obliczeń rozproszonych i skalować swoje umiejętności przetwarzania danych.

Co otrzymasz

  • 📜 Certyfikat ukończenia
    Dodaj do profilu LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Wersja audio w zestawie
    Ucz się w drodze — bez ekranu
  • ♾️ Dożywotni dostęp
    Wracaj, kiedy chcesz — bez wygaśnięcia
  • 📱 Telefon lub komputer
    Działa wszędzie, na każdym urządzeniu
  • 💸 Zwrot w 30 dni
    Bez pytań
  • Krótko i konkretnie
    1 godz 1 min praktycznej treści

Recenzje (4)

Mateo Torres UY Zweryfikowany kursant
★ 3 · 2026-03-01T20:20:24+00:00

Szkolenie: Struktura była logiczna, ale chciałbym, aby było więcej praktycznych ćwiczeń poza podstawowymi przykładami.

جميلة بن حسن TN Zweryfikowany kursant
★ 4 · 2026-03-01T05:16:24+00:00

Pretty informative. I liked the practical application examples, though the initial setup took longer than I expected.

Chernet Mekonnen ET Zweryfikowany kursant
★ 5 · 2026-01-05T06:03:24+00:00

Szkolenie: Podobał mi się ten kurs. Sposób przedstawienia informacji był doskonały, a praktyczne zastosowania zostały skutecznie podkreślone.

Олександр Коваленко UA Zweryfikowany kursant
★ 2 · 2024-12-18T10:12:24+00:00

It's a decent introduction. Could benefit from more diverse examples and a slightly better flow between modules.

Napisz recenzję

Po wysłaniu poprosimy o zalogowanie — szkic zostanie zapisany.

Inni uczyli się też

Najczęstsze pytania

Czego potrzebuję, by wziąć udział w tym kursie? +

Wystarczy telefon lub komputer z internetem. Bez instalacji i specjalnego sprzętu.

Jak zapłacić? +

Kartą przez Stripe lub kryptowalutą. Nie przechowujemy danych karty — robi to bezpiecznie Stripe.

Czy mogę otrzymać zwrot? +

Tak — pełen zwrot w 30 dni, bez pytań.

Jak długo będę mieć dostęp? +

Na zawsze. Po zakupie kurs jest twój — wracaj, kiedy chcesz.

Czy dostanę certyfikat? +

Tak. Po ukończeniu otrzymasz certyfikat, który możesz dodać do profilu LinkedIn.

Stworzony dla uczących się w
IT Design Finanse Marketing Ochrona zdrowia Edukacja Hotelarstwo Produkcja