Inżynieria potoków danych wsadowych z Dataflow i Dataproc
Projektuj i twórz skalowalne przepływy pracy ETL za pomocą bezserwerowych narzędzi chmurowych, aby przekształcać duże zestawy danych w niezawodne analizy biznesowe.
O tym kursie
Wydajne przetwarzanie ogromnych zbiorów danych jest podstawą nowoczesnej analizy biznesowej i raportowania. Ten kurs uczy, jak przejść od prostych skryptów danych do projektowania niezawodnych, zautomatyzowanych potoków wsadowych, które z łatwością obsługują transformacje na dużą skalę.Zdobędziesz umiejętności potrzebne do zarządzania przenoszeniem i transformacją danych na dużą skalę przy użyciu standardowych technologii chmurowych.
Czego się nauczysz:
- Zrozum podstawowe koncepcje inżynierii danych, w tym wzorce ETL / ELT i architektury przetwarzania wsadowego
- Twórz bezserwerowe zadania przetwarzania danych za pomocą Apache Beam na Dataflow w celu ujednoliconej obsługi danych
- Skonfiguruj Dataproc Serverless do uruchamiania aplikacji Spark bez konieczności zarządzania bazową infrastrukturą
- Zastosuj kontrole jakości danych i wzorce obserwacji, aby zapewnić niezawodność i dokładność rurociągu
- Orkiestruj złożone przepływy pracy i zarządzaj zależnościami między różnymi etapami przetwarzania danych
- Wdrożyć nowoczesne monitorowanie i ostrzeganie, aby proaktywnie identyfikować i rozwiązywać awarie rurociągów
Kurs zaczyna się od podstawowych definicji i zasad architektonicznych, zanim przejdzie do praktycznych strategii implementacji przy użyciu logiki opartej na SQL i Pythonie. Przeczytasz szczegółowe wyjaśnienia dotyczące projektowania rurociągów i dowiesz się, jak zbudować kod dla łatwości utrzymania i wydajności. Ten program jest przeznaczony dla początkujących w inżynierii danych, którzy mają podstawową wiedzę na temat SQL i Pythona i są gotowi zastosować te umiejętności do przetwarzania danych w chmurze.
Co otrzymasz
-
📜
Certyfikat ukończenia
Dodaj do profilu LinkedIn -
🎧
Wersja audio w zestawie
Ucz się w drodze — bez ekranu -
♾️
Dożywotni dostęp
Wracaj, kiedy chcesz — bez wygaśnięcia -
📱
Telefon lub komputer
Działa wszędzie, na każdym urządzeniu -
💸
Zwrot w 30 dni
Bez pytań -
⚡
Krótko i konkretnie
57 min praktycznej treści
Recenzje
Brak recenzji — bądź pierwszą osobą, która podzieli się doświadczeniem.
Inni uczyli się też
Dowiedz się, jak skutecznie indeksować, zapytać i zoptymalizować dane w Elasticsearch, umożliwiając tworzenie zaawansowanych rozwiązań wyszukiwania i analizy.
$4.99$9.99
Naucz się projektować, budować i zarządzać skalowalnymi chmurowymi potokami danych i schematami przy użyciu Snowflake SQL i nowoczesnych zasad hurtowni danych.
$4.99$9.99
Dowiedz się, jak dane przepływają przez nowoczesne organizacje, badając architektury potoków, rozwiązania pamięci masowej i procesy czyszczenia danych zaprojektowane dla początkujących profesjonalistów.
$4.99$9.99
Poznaj podstawowe zasady hurtowni danych, modelowania wymiarowego i nowoczesnych architektur chmurowych, aby zaprojektować wydajne analityczne bazy danych.
$4.99$9.99
Najczęstsze pytania
Czego potrzebuję, by wziąć udział w tym kursie? +
Wystarczy telefon lub komputer z internetem. Bez instalacji i specjalnego sprzętu.
Jak zapłacić? +
Kartą przez Stripe lub kryptowalutą. Nie przechowujemy danych karty — robi to bezpiecznie Stripe.
Czy mogę otrzymać zwrot? +
Tak — pełen zwrot w 30 dni, bez pytań.
Jak długo będę mieć dostęp? +
Na zawsze. Po zakupie kurs jest twój — wracaj, kiedy chcesz.
Czy dostanę certyfikat? +
Tak. Po ukończeniu otrzymasz certyfikat, który możesz dodać do profilu LinkedIn.
Stworzony dla uczących się w
IT
Design
Finanse
Marketing
Ochrona zdrowia
Edukacja
Hotelarstwo
Produkcja