Diepgaand leren met versterking in Python: een moderne introductie

Leer de basisprincipes van het trainen van intelligente agenten met Python, PyTorch en moderne algoritmen voor leren door versterking, zoals A2C en DDPG.

4.7 (3,889) ⏱ 1 u 46 min 📚 6 lessen 🎧 Audioversie

Over deze cursus

Hoe leren moderne kunstmatige intelligentiesystemen om beslissingen te nemen in complexe, dynamische omgevingen?Diepgaand versterkingsleren combineert neurale netwerken met besluitvormingskaders om agenten te bouwen die uitdagingen oplossen, van robotica tot strategisch gamen. In deze tekstgebaseerde cursus ga je van het begrijpen van de basistheorie van versterkingsleer naar het implementeren van geavanceerde algoritmen in Python.Je leert hoe je omgevingen structureert, beloningssystemen ontwerpt en neurale netwerken traint om het besluitvormingsbeleid te optimaliseren. Wat je leert: - Begrijp de fundamentele wiskunde van versterkingsleren, inclusief Markov Decision Processes en de Bellman-vergelijking. - Bouw en train neurale netwerkbeleid met behulp van moderne PyTorch-conventies. - Implementeer geavanceerde beleid gradiënt methoden, waaronder Advantage Actor-Critic (A2C) en Deep Deterministic Policy Gradient (DDPG). - Pas evolutiestrategieën toe als alternatief voor traditioneel gradiëntgebaseerd versterkingsleren. - Configureer simulatieomgevingen met behulp van de moderne Gymnasium-bibliotheek. - Verken de conceptuele fundamenten van Reinforcement Learning from Human Feedback (RLHF) die moderne taalmodellen aandrijven. De reis begint met kerndefinities en fundamentele concepten voordat u doorgaat naar hands-on code-implementaties van klassieke en geavanceerde algoritmen.U analyseert geschreven uitleg en bestudeert schone, moderne Python-codefragmenten om een praktisch mentaal model van agenttraining te bouwen. Deze cursus is bedoeld voor beginners in versterkingsleer die een basiskennis hebben van Python en neurale netwerken.Ervaring met versterkingsleeralgoritmen is niet vereist. Begin vandaag nog met het bouwen van intelligente, zelflerende agents.

Wat je krijgt

  • 📜 Voltooiingscertificaat
    Voeg toe aan je LinkedIn-profiel
  • 🎧 Audioversie inbegrepen
    Leer onderweg — geen scherm nodig
  • ♾️ Levenslange toegang
    Kom altijd terug, geen einddatum
  • 📱 Telefoon of computer
    Werkt overal, op elk apparaat
  • 💸 30 dagen retour
    Geen vragen
  • Kort en gericht
    1 u 46 min praktische inhoud

Beoordelingen (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, ik weet niet zeker of dit voor absolute beginners is. Het veronderstelt een beetje voorkennis die niet expliciet werd onderwezen.

Ruby Owens NZ Geverifieerde leerling
★ 5 · 2026-04-22T20:00:52+00:00

Ik heb echt genoten van de stroom hiervan. De praktische toepassingen die werden besproken waren precies goed.

Eko Prasetyo ID Geverifieerde leerling
★ 4 · 2025-04-14T00:22:52+00:00

Het is een solide cursus. De structuur is logisch en de meeste voorbeelden waren nuttig, maar zouden een paar meer scenario's uit de echte wereld kunnen gebruiken.

Camila Pérez AR Geverifieerde leerling
★ 4 · 2025-03-16T06:19:52+00:00

Een goede introductie. De structuur was meestal duidelijk, maar ik wou dat er een paar meer voorbeelden uit de echte wereld waren.

Schrijf een beoordeling

Na verzenden vragen we je in te loggen — je concept blijft bewaard.

Lerenden namen ook

Veelgestelde vragen

Wat heb ik nodig voor deze cursus? +

Alleen een telefoon of computer met internet. Geen installaties of speciale hardware.

Hoe betaal ik? +

Met kaart via Stripe of met cryptocurrency. We bewaren geen kaartgegevens — Stripe handelt dit veilig af.

Kan ik een terugbetaling krijgen? +

Ja — volledige terugbetaling binnen 30 dagen, zonder vragen.

Hoe lang heb ik toegang? +

Voor altijd. Eenmaal gekocht is de cursus van jou en kun je hem altijd opnieuw bekijken.

Krijg ik een certificaat? +

Ja. Bij voltooiing ontvang je een certificaat dat je aan je LinkedIn-profiel kunt toevoegen.

Voor leerlingen in
Tech Design Financiën Marketing Gezondheidszorg Onderwijs Horeca Productie