PySpark Foundations: Processamento de Big Data com Python

Aprenda a processar, consultar e analisar conjuntos de dados massivos usando o PySpark, fazendo a transição de suas habilidades em Python e SQL para ambientes de big data distribuídos.

4.8 (2,385) ⏱ 1 h 1 min 📚 10 aulas 🎧 Versão em áudio

Sobre este curso

Como os conjuntos de dados crescem muito grandes para as ferramentas tradicionais lidarem, a computação distribuída torna-se essencial para os profissionais de dados modernos.Este curso baseado em texto apresenta o PySpark, a API Python para o Spark, permitindo que você processe e analise conjuntos de dados massivos com velocidade e eficiência. Você fará a transição do processamento de dados de uma única máquina para fluxos de trabalho de big data distribuídos.Ao ler explicações claras e praticar com trechos de código do mundo real, você dominará os conceitos fundamentais de armazenamento distribuído, execução de consultas e manipulação de dados. O que você vai aprender: - Entenda os fundamentos da computação distribuída, a arquitetura Spark e a transição das bibliotecas de dados tradicionais. - Crie e manipule conjuntos de dados distribuídos resilientes (RDDs) e Spark DataFrames de alto desempenho. - Consulte grandes conjuntos de dados usando o Spark SQL para executar consultas relacionais familiares em dados distribuídos. - Aplique a API Pandas moderna no Spark para dimensionar perfeitamente seus fluxos de trabalho Pandas existentes para big data. - Otimize pipelines de processamento de dados usando cache, particionamento e definições de esquema eficientes. - Explore os conceitos básicos de streaming estruturado para processar feeds de dados em tempo real. O curso começa com a terminologia essencial de big data e a arquitetura central do Spark antes de passar para as operações práticas de DataFrame e consultas SQL.Você progredirá para técnicas de otimização de desempenho e APIs modernas de dimensionamento de dados por meio de explicações escritas estruturadas e exercícios de código. Este curso é projetado para engenheiros de dados iniciantes, analistas de dados e desenvolvedores de Python que desejam entrar no mundo de big data.Não é necessária experiência prévia com sistemas distribuídos, embora uma compreensão básica de Python e SQL seja útil. Comece a ler hoje para desbloquear o poder da computação distribuída e dimensionar suas habilidades de processamento de dados.

O que você vai receber

  • 📜 Certificado de conclusão
    Adicione ao seu perfil do LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Versão em áudio incluída
    Estude em qualquer lugar, sem tela
  • ♾️ Acesso vitalício
    Volte quando quiser, sem expirar
  • 📱 Celular ou computador
    Funciona em qualquer dispositivo
  • 💸 Reembolso em 30 dias
    Sem perguntas
  • Curto e focado
    1 h 1 min de conteúdo prático

Avaliações (4)

Mateo Torres UY Aluno verificado
★ 3 · 2026-03-01T20:20:24+00:00

A estrutura era lógica, mas eu gostaria que houvesse mais prática prática além dos exemplos básicos.

جميلة بن حسن TN Aluno verificado
★ 4 · 2026-03-01T05:16:24+00:00

Machine Translated Eu gostei dos exemplos de aplicação prática, embora a configuração inicial tenha demorado mais do que eu esperava.

Chernet Mekonnen ET Aluno verificado
★ 5 · 2026-01-05T06:03:24+00:00

Machine Translated Gostei muito deste curso. A maneira como as informações foram apresentadas foi excelente e as aplicações práticas foram destacadas de forma eficaz.

Олександр Коваленко UA Aluno verificado
★ 2 · 2024-12-18T10:12:24+00:00

É uma introdução decente, mas poderia se beneficiar de exemplos mais diversos e um fluxo ligeiramente melhor entre os módulos.

Escrever uma avaliação

Pediremos para fazer login após enviar — o rascunho fica salvo.

Outros também fizeram

Perguntas frequentes

O que preciso para fazer este curso? +

Só um celular ou computador com internet. Sem instalações nem hardware especial.

Como faço para pagar? +

Cartão via Stripe ou criptomoeda. Não guardamos dados do cartão — o Stripe processa com segurança.

Posso pedir reembolso? +

Sim — reembolso integral em 30 dias, sem perguntas.

Por quanto tempo terei acesso? +

Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.

Vou receber um certificado? +

Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.

Feito para profissionais em
Tecnologia Design Finanças Marketing Saúde Educação Hotelaria Indústria