Apache Spark 3 et l'ingénierie Big Data avec Scala

Créez des applications de données distribuées à l'aide de DataFrames, de Spark SQL et de RDD tout en maîtrisant les fondamentaux du traitement des mégadonnées avec Scala.

4.8 (2,299) ⏱ 36 min 📚 7 leçons 🎧 Version audio

À propos de ce cours

Les exigences modernes en matière de données nécessitent des outils capables de gérer des ensembles de données massifs sur des clusters distribués avec rapidité et fiabilité. Ce cours fournit aux programmeurs un chemin clair pour la transition vers l'ingénierie des données massives en maîtrisant les composants de base de l'écosystème Spark.Vous passerez de la compréhension des structures de données de base à la création de pipelines de traitement distribués complexes pouvant gérer des téraoctets d'informations. À la fin de ce cours, vous aurez un modèle mental solide du fonctionnement des systèmes distribués et les compétences pratiques pour écrire du code Scala prêt à la production pour des tâches intensives en données.Vous serez en mesure de naviguer dans les compromis entre les différentes API Spark et de mettre en œuvre des optimisations qui garantissent que vos applications fonctionnent efficacement à grande échelle. Ce que vous apprendrez: - Comprendre l'architecture de Spark et la façon dont elle gère le calcul distribué sur un cluster. - Traitez efficacement les données structurées à l'aide des API Spark SQL et DataFrame. - Appliquer des transformations de données de type sécurisé avec Datasets pour un développement d'applications robuste et maintenable. - Gérer les abstractions de données de bas niveau et la logique personnalisée à l'aide de Resilient Distributed Datasets (RDD). - Optimisez les performances de l'application en utilisant des techniques modernes telles que l'exécution de requête adaptative et le mélange efficace. - Mettre en œuvre des stratégies complexes de filtrage, d'agrégation et de jointure de données pour des ensembles de données à grande échelle. - Pratiquer le débogage et la surveillance des applications distribuées pour assurer l'intégrité et les performances des données. Le cours commence par des définitions fondamentales de l'informatique distribuée et des composants internes de Spark avant de progresser à travers le traitement de données structurées et les optimisations de bas niveau.Chaque module se concentre sur la lecture et l'analyse des implémentations de code pour vous assurer que vous pouvez appliquer ces concepts à des scénarios réels. Ce cours est conçu pour les développeurs qui ont une compréhension de base de Scala et qui souhaitent entrer dans le monde du big data.Aucune expérience préalable avec Spark ou les systèmes distribués n'est requise. Commencez dès aujourd’hui à créer des solutions de données hautes performances avec Spark et Scala.

Ce que vous recevez

  • 📜 Certificat de fin
    Ajoutez-le à votre profil LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Version audio incluse
    Apprenez en déplacement, sans écran
  • ♾️ Accès à vie
    Revenez quand vous voulez, sans expiration
  • 📱 Téléphone ou ordinateur
    Fonctionne partout, sur tout appareil
  • 💸 Remboursement 30 jours
    Sans poser de questions
  • Court et ciblé
    36 min de contenu pratique

Avis (3)

Nomusa Buthelezi ZA Apprenant vérifié
★ 5 · 2026-02-23T04:20:53+00:00

Les exemples du monde réel étaient inestimables. Je peux réellement utiliser ces connaissances maintenant.

Dawit Abebe ET Apprenant vérifié
★ 4 · 2025-10-23T16:48:53+00:00

C'est un cours solide. La structure est logique et la plupart des exemples étaient utiles.Peut utiliser quelques scénarios plus réels.

محمد DZ
★ 4 · 2025-10-04T23:48:53+00:00

Dans l'ensemble, une bonne expérience d'apprentissage.La structure avait du sens et les exemples étaient pertinents, bien que j'aie estimé que certains sujets auraient pu être explorés plus en profondeur.

Écrire un avis

Nous vous demanderons de vous connecter après envoi — votre brouillon est sauvegardé.

Autres apprenants ont aussi suivi

Questions fréquentes

De quoi ai-je besoin pour suivre ce cours ? +

Un téléphone ou un ordinateur avec internet, c'est tout. Aucune installation, aucun matériel spécial.

Comment payer ? +

Carte via Stripe ou cryptomonnaie. Nous ne stockons pas les données de carte — Stripe les gère de manière sécurisée.

Puis-je obtenir un remboursement ? +

Oui — remboursement complet sous 30 jours, sans question.

Combien de temps aurai-je accès ? +

À vie. Une fois acheté, le cours est à vous, vous pouvez y revenir quand vous voulez.

Vais-je obtenir un certificat ? +

Oui. À la fin, vous recevez un certificat à ajouter à votre profil LinkedIn.

Conçu pour les apprenants en
Tech Design Finance Marketing Santé Éducation Hôtellerie Industrie