PySpark: des bases aux DataFrames

Apprenez à traiter et analyser de gros ensembles de données à l'aide de Python et de l'API Spark DataFrame, même si vous êtes novice en matière de big data.

4.4 (42) ⏱ 1 h 30 min 📚 8 leçons 🎧 Version audio

À propos de ce cours

Ce cours est votre point de départ pour exploiter la puissance du calcul distribué avec PySpark, la bibliothèque Python pour Spark. Vous construirez une base solide dans le traitement des données volumineuses en apprenant à écrire un code de transformation de données propre, efficace et évolutif.À la fin du cours, vous serez en mesure d'aborder en toute confiance les tâches d'ingénierie de données courantes et de préparer les données pour une analyse à grande échelle. Ce que vous apprendrez: - Comprendre les concepts de base de l'informatique distribuée et de l'architecture Spark. - Traitez et manipulez efficacement les données structurées à l'aide de l'API PySpark DataFrame. - Interrogez vos données avec Spark SQL pour une analyse puissante et familière. - Appliquer des transformations et des actions courantes pour nettoyer, agréger et joindre des ensembles de données. - Apprenez à lire et à écrire dans des formats de données standard tels que CSV, JSON et Parquet. - Structurez et exécutez vos premières applications PySpark autonomes. - Explorez les ensembles de données distribués résilients (RDD) fondamentaux pour comprendre les mécanismes de base de Spark. Le programme commence par la terminologie clé et les bases de l'écosystème Spark, puis vous progresserez à travers des exercices pratiques écrits axés sur les DataFrames et Spark SQL pour développer des compétences pratiques. Ce cours est conçu pour les débutants avec une certaine expérience de Python.Aucune connaissance préalable de Spark ou de l'informatique distribuée n'est requise. Commencez votre parcours dans le traitement des données massives dès aujourd'hui.

Ce que vous recevez

  • 📜 Certificat de fin
    Ajoutez-le à votre profil LinkedIn
  • 🎧 Version audio incluse
    Apprenez en déplacement, sans écran
  • ♾️ Accès à vie
    Revenez quand vous voulez, sans expiration
  • 📱 Téléphone ou ordinateur
    Fonctionne partout, sur tout appareil
  • 💸 Remboursement 30 jours
    Sans poser de questions
  • Court et ciblé
    1 h 30 min de contenu pratique

Avis (3)

Samuel King AU Apprenant vérifié
★ 4 · 2025-08-22T15:30:07+00:00

Je ne suis pas sûr que ce serait le meilleur point de départ pour un débutant complet, en fait.

Esteban Herrera PA
★ 3 · 2025-05-14T04:35:07+00:00

Hmm, je ne suis pas sûr que ce soit pour les débutants absolus. Cela suppose un peu de connaissances préalables qui n'ont pas été explicitement enseignées.

Oliver Wilson NZ Apprenant vérifié
★ 3 · 2025-03-08T22:31:07+00:00

C'est un bon cours si vous avez des connaissances préalables. Pour les débutants absolus, certains concepts peuvent être un peu difficiles, mais la structure est logique.

Écrire un avis

Nous vous demanderons de vous connecter après envoi — votre brouillon est sauvegardé.

Autres apprenants ont aussi suivi

Questions fréquentes

De quoi ai-je besoin pour suivre ce cours ? +

Un téléphone ou un ordinateur avec internet, c'est tout. Aucune installation, aucun matériel spécial.

Comment payer ? +

Carte via Stripe ou cryptomonnaie. Nous ne stockons pas les données de carte — Stripe les gère de manière sécurisée.

Puis-je obtenir un remboursement ? +

Oui — remboursement complet sous 30 jours, sans question.

Combien de temps aurai-je accès ? +

À vie. Une fois acheté, le cours est à vous, vous pouvez y revenir quand vous voulez.

Vais-je obtenir un certificat ? +

Oui. À la fin, vous recevez un certificat à ajouter à votre profil LinkedIn.

Conçu pour les apprenants en
Tech Design Finance Marketing Santé Éducation Hôtellerie Industrie