⏱ 2 h 30 min 📚 25 aulas 🎧 Versão em áudio

Projeto e Execução de Pipelines ETL com Apache Spark

Aprenda a construir, otimizar e gerenciar pipelines de dados escaláveis usando PySpark e Hadoop para iniciar sua jornada em engenharia de dados.

💬 Instrutor de IA
Pergunte sobre qualquer aula e receba uma resposta clara na hora, quando quiser.
🕐 Comece quando quiser
Sem horários nem prazos: aprenda no seu ritmo, quando quiser.
🌐 Em português
Aulas, tarefas e certificado: tudo totalmente no seu idioma.

Sobre este curso

Organizações modernas geram volumes massivos de dados, tornando a integração e transformação de dados eficientes uma habilidade crítica para qualquer profissional de dados aspirante. Apache Spark é o padrão da indústria para processar grandes conjuntos de dados de forma rápida e confiável.

Este curso escrito o guiará pelos conceitos fundamentais e passos práticos necessários para projetar, executar e monitorar pipelines robustos de Extração, Transformação e Carga (ETL). Você transitará do entendimento da terminologia básica de engenharia de dados para a construção de pipelines estruturados que limpam, agregam e carregam dados em sistemas de armazenamento modernos.

O que você aprenderá:
- Entender a arquitetura central do Apache Spark, DataFrames e componentes do ecossistema.
- Extrair dados de diversas fontes, incluindo bancos de dados relacionais como MySQL e arquivos planos.
- Transformar conjuntos de dados usando funções PySpark para filtragem, junção e agregação.
- Carregar dados processados de forma eficiente em bancos de dados de destino e formatos de armazenamento modernos como Parquet.
- Aplicar técnicas de otimização para melhorar o desempenho do pipeline e a utilização de recursos.
- Configurar e estruturar um ambiente de projeto de engenharia de dados limpo e de fácil manutenção.

A jornada começa com definições essenciais e configuração do ambiente, garantindo uma base conceitual sólida. Em seguida, você progredirá através de explicações escritas passo a passo e análise de código para construir e executar um pipeline ETL funcional e de ponta a ponta.

Este curso é projetado para iniciantes que desejam entrar no campo da engenharia de dados; nenhuma experiência prévia com Apache Spark é necessária, embora um entendimento básico de Python seja útil.

Comece a ler hoje para construir seu primeiro pipeline de dados escalável.

O que você vai receber

📜 Certificado de conclusão
Adicione ao seu perfil do LinkedIn
💬 Tutor AI pessoal
Travou em uma aula? Pergunte ao seu tutor integrado qualquer coisa, a qualquer hora.
🎧 Versão em áudio incluída
Estude em qualquer lugar, sem tela
♾️ Acesso vitalício
Volte quando quiser, sem expirar
📱 Celular ou computador
Funciona em qualquer dispositivo
💸 Reembolso em 14 dias
Sem perguntas
⚡ Curto e focado
2 h 30 min de conteúdo prático

Certificado de conclusão

Cada curso que você conclui na PickAClass emite uma credencial como esta — original, com seu próprio código, verificável por URL e detalhada sobre o que foi de fato demonstrado.

PickAClass

Perfil de habilidades · verificável

Documento

Certificado de Maestria

Isto certifica que

Nome Sobrenome

demonstrou com sucesso o domínio de

Projeto e Execução de Pipelines ETL com Apache Spark

Habilidades demonstradas

✓

Análise de padrões comportamentais

Fundamental

1.2 h

✓

Estruturas de arquitetura de decisão

Proficiente

1.4 h

✓

Design de testes A/B

Proficiente

1.7 h

✓

Redação comportamental

Avançado

1.9 h

PickAClass — Nome Sobrenome

Projeto e Execução de Pipelines ETL com Apache Spark

Página 2 de 2

Detalhe de desempenho

Resumo do curso

Aulas concluídas 14 / 14

Questões de prática 26 / 28

Tarefas enviadas 4 (méd. 4.5 / 5)

Projeto final Avaliado — 4.6 / 5

Prática total 6.2 h

Benchmark de desempenho

Posição na coorte Top 12% de 1,625

Tempo até concluir 11 dias (mediana: 22)

Pontuação de domínio 91 / 100

Pontuação das questões de prática 94%

Verificação de habilidade Trilha de habilidade verificada

Ver um certificado de exemplo →

Avaliações

Ainda não há avaliações — seja o primeiro a compartilhar sua experiência.

Outros também fizeram

🌟 Favorito dos estudantes 🎓 Com certificado

Perguntas frequentes

O que preciso para fazer este curso? +

Só um celular ou computador com internet. Sem instalações nem hardware especial.

Como faço para pagar? +

Com cartão via Stripe. Não guardamos dados do cartão — o Stripe processa com segurança.

Posso pedir reembolso? +

Sim — reembolso integral em 14 dias, sem perguntas.

Por quanto tempo terei acesso? +

Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.

Vou receber um certificado? +

Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.

Feito para profissionais em

Tecnologia Design Finanças Marketing Saúde Educação Hotelaria Indústria

⭐ Escolhido por alunos 🎓 Com certificado

$9.99

✓ Preço único $9.99 — qualquer curso, para sempre. Sem prazo de validade.

Comprar agora →

Leve por $0 com a assinatura

10 cursos por mês · $49.99/mês · Cancele quando quiser

✓ Certificado de conclusão
✓ Versão em áudio incluída
✓ Acesso vitalício
✓ Pagamento único · sem renovação automática
✓ Reembolso em 14 dias
✓ Celular ou computador

Pagamento seguro via Stripe

Projeto e Execução de Pipelines ETL com Apache Spark

Sobre este curso

O que você vai receber

Certificado de conclusão

Avaliações

Escrever uma avaliação

Outros também fizeram

Fundamentos de análise de sistemas e armazenamento de dados

Fundamentos de Big Data: terminologia, arquitetura e pipelines modernos

Fundamentos de Engenharia de Análise: dbt e Snowflake

Fundamentos de Engenharia de Dados

Perguntas frequentes