Deep Learning pour les modèles de légendes d'images

Maîtrisez les bases de la vision par ordinateur et du traitement du langage naturel pour créer des modèles qui génèrent automatiquement des descriptions textuelles pour les images.

4.7 (32) ⏱ 32 min 📚 6 leçons 🎧 Version audio

À propos de ce cours

Combler le fossé entre la vision et la description est l'un des défis les plus passionnants de l'intelligence artificielle moderne.Ce cours fournit un chemin clair pour comprendre comment les machines interprètent les données visuelles et les traduisent en langage humain significatif.Vous explorerez l'intersection de la vision par ordinateur et du traitement du langage naturel pour construire des systèmes capables de comprendre le contexte d'une image. Vous passerez de l'apprentissage de la terminologie de base à la compréhension des architectures complexes qui rendent possible la génération d'images en texte.À la fin de ce cours, vous serez en mesure de concevoir, de former et d'évaluer des modèles qui produisent des descriptions précises pour diverses entrées visuelles. Ce que vous apprendrez: - Comprendre les concepts fondamentaux de l'apprentissage profond multimodal et des réseaux de neurones. - Construire des architectures d'encodeur-décodeur utilisant des structures convolutionnelles et récurrentes. - Appliquer des mécanismes d'attention pour aider les modèles à se concentrer sur des parties spécifiques d'une image lors de la génération de texte. - Implémenter des techniques modernes basées sur Transformer pour améliorer les performances de sous-titrage. - Pratiquer l'extraction de caractéristiques d'image et le prétraitement de texte pour les pipelines d'apprentissage automatique. - Évaluer la qualité du modèle à l'aide de mesures standard de l'industrie telles que BLEU et CIDEr. Le cours commence par les définitions essentielles et l'histoire de la technologie image-texte avant de passer aux composants techniques de l'architecture du modèle.Vous progresserez ensuite à travers le cycle de vie de la formation, de la préparation des données au réglage et à l'évaluation des performances. Ce cours est conçu pour les débutants intéressés par l'intelligence artificielle et l'apprentissage automatique.Aucune expérience préalable avec la vision par ordinateur ou la modélisation complexe n'est requise pour commencer. Commencez dès aujourd'hui à construire vos propres systèmes de description d'images intelligents.

Ce que vous recevez

  • 📜 Certificat de fin
    Ajoutez-le à votre profil LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Version audio incluse
    Apprenez en déplacement, sans écran
  • ♾️ Accès à vie
    Revenez quand vous voulez, sans expiration
  • 📱 Téléphone ou ordinateur
    Fonctionne partout, sur tout appareil
  • 💸 Remboursement 30 jours
    Sans poser de questions
  • Court et ciblé
    32 min de contenu pratique

Avis

Pas encore d'avis — soyez le premier à partager votre expérience.

Écrire un avis

Nous vous demanderons de vous connecter après envoi — votre brouillon est sauvegardé.

Autres apprenants ont aussi suivi

Questions fréquentes

De quoi ai-je besoin pour suivre ce cours ? +

Un téléphone ou un ordinateur avec internet, c'est tout. Aucune installation, aucun matériel spécial.

Comment payer ? +

Carte via Stripe ou cryptomonnaie. Nous ne stockons pas les données de carte — Stripe les gère de manière sécurisée.

Puis-je obtenir un remboursement ? +

Oui — remboursement complet sous 30 jours, sans question.

Combien de temps aurai-je accès ? +

À vie. Une fois acheté, le cours est à vous, vous pouvez y revenir quand vous voulez.

Vais-je obtenir un certificat ? +

Oui. À la fin, vous recevez un certificat à ajouter à votre profil LinkedIn.

Conçu pour les apprenants en
Tech Design Finance Marketing Santé Éducation Hôtellerie Industrie