Deep Learning per modelli di didascalia delle immagini

Padroneggia i fondamenti della visione artificiale e dell'elaborazione del linguaggio naturale per creare modelli che generano automaticamente descrizioni testuali per le immagini.

4.7 (32) ⏱ 32 min 📚 6 lezioni 🎧 Versione audio

Informazioni sul corso

Colmare il divario tra vedere e descrivere è una delle sfide più eccitanti nella moderna intelligenza artificiale.Questo corso fornisce un percorso chiaro per capire come le macchine interpretano i dati visivi e li traducono in un linguaggio umano significativo. Esplorerai l'intersezione della visione artificiale e dell'elaborazione del linguaggio naturale per costruire sistemi in grado di comprendere il contesto di un'immagine. Alla fine di questo corso, sarai in grado di progettare, addestrare e valutare modelli che producono descrizioni accurate per vari input visivi, come immagini, video, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagini, immagin Cosa imparerai: - Comprendere i concetti fondamentali del deep learning multimodale e delle reti neurali. - Costruisci architetture encoder-decoder utilizzando strutture convoluzionali e ricorrenti. - Applicare meccanismi di attenzione per aiutare i modelli a concentrarsi su parti specifiche di un'immagine durante la generazione del testo. - Implementare moderne tecniche basate su Transformer per migliorare le prestazioni dei sottotitoli. - Pratica l'estrazione delle funzionalità delle immagini e la preelaborazione del testo per le pipeline di apprendimento automatico. - Valuta la qualità del modello utilizzando metriche standard del settore come BLEU e CIDEr. Il corso inizia con le definizioni essenziali e la storia della tecnologia image-to-text prima di passare alle componenti tecniche dell'architettura del modello.Poi progredirai attraverso il ciclo di vita della formazione, dalla preparazione dei dati alla messa a punto e alla valutazione delle prestazioni. Questo corso è progettato per i principianti interessati all'intelligenza artificiale e all'apprendimento automatico.Non è richiesta alcuna esperienza precedente con la visione artificiale o la modellazione complessa per iniziare. Inizia a costruire i tuoi sistemi di descrizione delle immagini intelligenti oggi.

Cosa otterrai

  • 📜 Certificato di completamento
    Aggiungilo al tuo profilo LinkedIn
  • 🎧 Versione audio inclusa
    Impara ovunque, senza schermo
  • ♾️ Accesso a vita
    Torna quando vuoi, senza scadenza
  • 📱 Telefono o computer
    Funziona ovunque, su qualsiasi dispositivo
  • 💸 Rimborso entro 30 giorni
    Senza domande
  • Breve e mirato
    32 min di contenuto pratico

Recensioni

Ancora nessuna recensione — sii il primo a condividere la tua esperienza.

Scrivi una recensione

Ti chiederemo di accedere dopo l'invio — la bozza viene salvata.

Altri hanno seguito anche

Domande frequenti

Cosa serve per seguire questo corso? +

Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.

Come si paga? +

Con carta via Stripe o con criptovaluta. Non conserviamo i dati della carta — Stripe li gestisce in sicurezza.

Posso ottenere un rimborso? +

Sì — rimborso completo entro 30 giorni, senza domande.

Per quanto tempo avrò accesso? +

Per sempre. Una volta acquistato, il corso è tuo e puoi rivederlo quando vuoi.

Riceverò un certificato? +

Sì. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.

Pensato per chi lavora in
Tech Design Finanza Marketing Sanità Istruzione Ospitalità Produzione