Scala e Spark para análise de Big Data

Aprenda a processar conjuntos de dados massivos combinando o poder da programação funcional do Scala com o mecanismo de computação distribuída do Apache Spark.

4.6 (2,600) ⏱ 1 h 48 min 📚 5 aulas

Sobre este curso

À medida que os conjuntos de dados crescem demais para uma única máquina, os desenvolvedores e engenheiros de dados modernos devem fazer a transição do processamento local tradicional para a computação distribuída.Este curso baseado em texto orienta você através dos principais conceitos de processamento de big data, mostrando como aproveitar a velocidade do Apache Spark usando os paradigmas elegantes e funcionais do Scala. Você fará a transição da escrita de código local básico para o projeto de pipelines de dados distribuídos robustos que podem ser dimensionados em clusters.Ao ler explicações conceituais claras e analisar exemplos de código práticos, você construirá uma base sólida em sistemas distribuídos. O que você vai aprender: - Entenda os princípios fundamentais da computação distribuída, execução de cluster e modelo de memória do Spark. - Aplique conceitos de programação funcional no Scala para manipular coleções de dados distribuídas com segurança e eficiência. - Domine as APIs estruturadas do Spark, incluindo DataFrames e Datasets, para transformações de dados otimizadas. - Escreva consultas expressivas do Spark SQL para analisar dados estruturados e semiestruturados em grande escala. - Configure pipelines de dados para ler e gravar em formatos de armazenamento modernos, como Parquet e Delta Lake. - Pratique identificar e resolver gargalos comuns de desempenho em tarefas de dados distribuídas. O curso começa com a terminologia essencial de big data, sintaxe fundamental da Scala e conceitos distribuídos principais antes de passar para a manipulação prática de dados, design de API estruturado e fluxos de trabalho práticos de otimização. Este curso é projetado para iniciantes em big data, incluindo desenvolvedores, analistas de dados e aspirantes a engenheiros de dados que desejam aprender processamento distribuído desde o início, sem precisar de experiência prévia em cluster. Comece a ler hoje para desbloquear o poder da análise de dados distribuídos com Scala e Spark.

O que você vai receber

  • 📜 Certificado de conclusão
    Adicione ao seu perfil do LinkedIn
  • ♾️ Acesso vitalício
    Volte quando quiser, sem expirar
  • 📱 Celular ou computador
    Funciona em qualquer dispositivo
  • 💸 Reembolso em 30 dias
    Sem perguntas
  • Curto e focado
    1 h 48 min de conteúdo prático

Avaliações (2)

Andrew Owusu GH Aluno verificado
★ 4 · 2026-03-17T08:44:08+00:00

Machine Translated Eu gostei dos exemplos de aplicação prática, embora a configuração inicial tenha demorado mais do que eu esperava.

فريد DZ Aluno verificado
★ 4 · 2026-02-14T08:30:08+00:00

Machine Translated Bom no geral. Algumas partes foram um pouco mais rápidas do que eu esperava, mas os exemplos foram úteis.

Escrever uma avaliação

Pediremos para fazer login após enviar — o rascunho fica salvo.

Outros também fizeram

Perguntas frequentes

O que preciso para fazer este curso? +

Só um celular ou computador com internet. Sem instalações nem hardware especial.

Como faço para pagar? +

Cartão via Stripe ou criptomoeda. Não guardamos dados do cartão — o Stripe processa com segurança.

Posso pedir reembolso? +

Sim — reembolso integral em 30 dias, sem perguntas.

Por quanto tempo terei acesso? +

Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.

Vou receber um certificado? +

Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.

Feito para profissionais em
Tecnologia Design Finanças Marketing Saúde Educação Hotelaria Indústria