Инженерная разработка пакетных потоков данных с помощью Dataflow и Dataproc
Разрабатывайте и создавайте масштабируемые рабочие процессы ETL с помощью бессерверных облачных инструментов для преобразования больших наборов данных в надежные бизнес-аналитики.
О курсе
Эффективная обработка больших массивов данных является основой современной бизнес-аналитики и отчетности. Этот курс научит вас переходить от простых сценариев данных к разработке надежных, автоматизированных пакетных конвейеров, которые легко обрабатывают крупномасштабные преобразования. Вы приобретете навыки, необходимые для управления перемещением и преобразованием данных в масштабе, используя отраслевые стандартные облачные технологии.
Что вы узнаете:
- Понимание основных концепций инженерии данных, включая модели ETL / ELT и архитектуры пакетной обработки
- Создание бессерверных задач по обработке данных с использованием Apache Beam на Dataflow для унифицированной обработки данных
- Настройте Dataproc Serverless для запуска приложений Spark без необходимости управления базовой инфраструктурой
- Проведение проверок качества данных и моделей наблюдаемости для обеспечения надежности и точности трубопроводов
- Оркестрировать сложные рабочие процессы и управлять зависимостями между различными этапами обработки данных
- внедрение современных систем мониторинга и оповещения для упреждающего выявления и устранения аварий на трубопроводах;
Курс начинается с основных определений и принципов архитектуры, а затем переходит к практическим стратегиям реализации с использованием логики на основе SQL и Python. Вы прочитаете подробные объяснения по проектированию конвейера и изучите, как структурировать код для обслуживания и производительности. Эта программа предназначена для начинающих в области обработки данных, которые имеют базовое понимание SQL и Python и готовы применить эти навыки к обработке данных в облачном масштабе. Начните создавать готовые к производству конвейеры данных сегодня.
Что вы получите
-
📜
Сертификат об окончании
Добавьте в профиль LinkedIn -
🎧
Аудиоверсия включена
Учитесь в дороге — экран не нужен -
♾️
Пожизненный доступ
Возвращайтесь в любое время, без срока -
📱
Телефон или компьютер
Работает везде и на любом устройстве -
💸
Возврат в течение 30 дней
Без вопросов -
⚡
Кратко и по делу
57 мин практического материала
Отзывы
Отзывов пока нет — поделитесь своим первым.
Студенты также прошли
Узнайте, как эффективно индексировать, запрашивать и оптимизировать данные в Elasticsearch, что позволит вам создавать мощные решения для поиска и анализа.
$4.99$9.99
Научитесь проектировать, создавать и управлять масштабируемыми облачными конвейерами данных и схемами, используя Snowflake SQL и современные принципы хранилищ данных.
$4.99$9.99
Узнайте, как данные проходят через современные организации, изучая архитектуры конвейеров, решения для хранения и процессы очистки данных, предназначенные для начинающих профессионалов.
$4.99$9.99
Изучите основные принципы хранилищ данных, многомерного моделирования и современных облачных архитектур для проектирования эффективных аналитических баз данных.
$4.99$9.99
Часто спрашивают
Что нужно для прохождения курса? +
Только смартфон или компьютер с доступом в интернет. Никаких установок и оборудования.
Как оплатить? +
Банковской картой через Stripe или криптовалютой. Данные карты обрабатывает Stripe — мы их не храним.
Можно ли вернуть деньги? +
Да — полный возврат в течение 30 дней, без вопросов.
Как долго будут доступны материалы? +
Навсегда. После покупки курс остаётся с вами — возвращайтесь в любое время.
Получу ли я сертификат? +
Да. По окончании выдаётся сертификат, который можно добавить в профиль LinkedIn.
Подходит для специалистов в
IT
Дизайн
Финансы
Маркетинг
Медицина
Образование
HoReCa
Производство