Apprendimento profondo con rinforzo in Python: un'introduzione moderna

Padroneggia i fondamenti del training di agenti intelligenti utilizzando Python, PyTorch e moderni algoritmi di apprendimento per rinforzo come A2C e DDPG.

4.7 (3,889) ⏱ 1 h 46 min 📚 6 lezioni 🎧 Versione audio

Informazioni sul corso

Il deep reinforcement learning combina reti neurali con framework decisionali per creare agenti in grado di risolvere sfide che vanno dalla robotica ai giochi strategici. In questo corso basato su testo, passerai dalla comprensione della teoria di base dell'apprendimento per rinforzo all'implementazione di sofisticati algoritmi in Python.Impara come strutturare ambienti, progettare sistemi di ricompensa e addestrare reti neurali per ottimizzare le politiche decisionali. Cosa imparerai: - Comprendere la matematica fondamentale dell'apprendimento per rinforzo, inclusi i processi decisionali di Markov e l'equazione di Bellman. - Crea e addestra le politiche della rete neurale utilizzando le moderne convenzioni PyTorch. - Implementare metodi avanzati di gradiente di politica tra cui Advantage Actor-Critic (A2C) e Deep Deterministic Policy Gradient (DDPG). - Applicare strategie di evoluzione come alternativa al tradizionale apprendimento di rinforzo basato su gradienti. - Configurare gli ambienti di simulazione utilizzando la moderna libreria Gymnasium. - Esplora i fondamenti concettuali dell'apprendimento del rinforzo dal feedback umano (RLHF) che alimenta i modelli di linguaggio moderni. Il viaggio inizia con le definizioni di base e i concetti fondamentali prima di passare alle implementazioni pratiche di codice di algoritmi classici e all'avanguardia.Analizzerai spiegazioni scritte e studierai frammenti di codice Python puliti e moderni per costruire un modello mentale pratico di addestramento degli agenti. Questo corso è progettato per i principianti nell'apprendimento per rinforzo che hanno una conoscenza di base di Python e delle reti neurali.Non è richiesta alcuna esperienza precedente con gli algoritmi di apprendimento per rinforzo. Inizia a creare agenti intelligenti e autoapprendimento oggi stesso.

Cosa otterrai

  • 📜 Certificato di completamento
    Aggiungilo al tuo profilo LinkedIn
  • 🎧 Versione audio inclusa
    Impara ovunque, senza schermo
  • ♾️ Accesso a vita
    Torna quando vuoi, senza scadenza
  • 📱 Telefono o computer
    Funziona ovunque, su qualsiasi dispositivo
  • 💸 Rimborso entro 30 giorni
    Senza domande
  • Breve e mirato
    1 h 46 min di contenuto pratico

Recensioni (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, non sono sicuro che questo sia per principianti assoluti. Assume un po 'di conoscenza precedente che non è stata insegnata esplicitamente.

Ruby Owens NZ Studente verificato
★ 5 · 2026-04-22T20:00:52+00:00

Mi è piaciuto molto il flusso di questo. Le applicazioni pratiche discusse erano al punto giusto.

Eko Prasetyo ID Studente verificato
★ 4 · 2025-04-14T00:22:52+00:00

Corso: È un corso solido. La struttura è logica e la maggior parte degli esempi sono stati utili.

Camila Pérez AR Studente verificato
★ 4 · 2025-03-16T06:19:52+00:00

Corso: Una buona introduzione. La struttura era per lo più chiara, ma vorrei che ci fossero alcuni esempi più reali.

Scrivi una recensione

Ti chiederemo di accedere dopo l'invio — la bozza viene salvata.

Altri hanno seguito anche

Domande frequenti

Cosa serve per seguire questo corso? +

Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.

Come si paga? +

Con carta via Stripe o con criptovaluta. Non conserviamo i dati della carta — Stripe li gestisce in sicurezza.

Posso ottenere un rimborso? +

Sì — rimborso completo entro 30 giorni, senza domande.

Per quanto tempo avrò accesso? +

Per sempre. Una volta acquistato, il corso è tuo e puoi rivederlo quando vuoi.

Riceverò un certificato? +

Sì. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.

Pensato per chi lavora in
Tech Design Finanza Marketing Sanità Istruzione Ospitalità Produzione