Głębokie uczenie się wzmacniające w Pythonie: nowoczesne wprowadzenie

Opanuj podstawy szkolenia inteligentnych agentów za pomocą Pythona, PyTorch i nowoczesnych algorytmów uczenia się wzmacniania, takich jak A2C i DDPG.

4.7 (3,889) ⏱ 1 godz 46 min 📚 6 lekcji 🎧 Wersja audio

O tym kursie

W jaki sposób nowoczesne systemy sztucznej inteligencji uczą się podejmować decyzje w złożonych, dynamicznych środowiskach?Głębokie uczenie się wzmacniające łączy sieci neuronowe z ramami podejmowania decyzji w celu budowania agentów, które rozwiązują wyzwania od robotyki po strategiczne gry. W tym kursie tekstowym przejdziesz od zrozumienia podstawowej teorii uczenia się wzmacniania do wdrażania zaawansowanych algorytmów w Pythonie.Dowiesz się, jak strukturyzować środowiska, projektować systemy nagród i trenować sieci neuronowe w celu optymalizacji polityk podejmowania decyzji. Czego się nauczysz: - Zrozum podstawową matematykę uczenia się wzmacniającego, w tym procesy decyzyjne Markova i równanie Bellmana. - Buduj i trenuj zasady sieci neuronowej przy użyciu nowoczesnych konwencji PyTorch. - Wdrażaj zaawansowane metody gradientu polityki, w tym Advantage Actor-Critic (A2C) i Deep Deterministic Policy Gradient (DDPG). - Zastosuj strategie ewolucji jako alternatywę dla tradycyjnego uczenia się wzmacniania opartego na gradiencie. - Skonfiguruj środowiska symulacyjne za pomocą nowoczesnej biblioteki Gymnasium. - Poznaj koncepcyjne podstawy uczenia się wzmacniającego z ludzkiej informacji zwrotnej (RLHF) zasilających nowoczesne modele językowe. Podróż zaczyna się od podstawowych definicji i podstawowych pojęć, zanim przejdziesz do praktycznych implementacji kodu klasycznych i najnowocześniejszych algorytmów.Będziesz analizować pisemne wyjaśnienia i studiować czyste, nowoczesne fragmenty kodu Pythona, aby zbudować praktyczny model mentalny szkolenia agentów. Ten kurs jest przeznaczony dla początkujących w uczeniu się wzmacniającym, którzy mają podstawową wiedzę na temat Pythona i sieci neuronowych.Nie jest wymagane wcześniejsze doświadczenie z algorytmami uczenia się wzmacniającego. Zacznij tworzyć inteligentnych, samouczących się agentów już dziś.

Co otrzymasz

  • 📜 Certyfikat ukończenia
    Dodaj do profilu LinkedIn
  • 🎧 Wersja audio w zestawie
    Ucz się w drodze — bez ekranu
  • ♾️ Dożywotni dostęp
    Wracaj, kiedy chcesz — bez wygaśnięcia
  • 📱 Telefon lub komputer
    Działa wszędzie, na każdym urządzeniu
  • 💸 Zwrot w 30 dni
    Bez pytań
  • Krótko i konkretnie
    1 godz 46 min praktycznej treści

Recenzje (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, I'm not sure this is for absolute beginners. It assumes a bit of prior knowledge that wasn't explicitly taught. Some examples were confusing.

Ruby Owens NZ Zweryfikowany kursant
★ 5 · 2026-04-22T20:00:52+00:00

Really enjoyed the flow of this. The practical applications discussed were spot on. Great course!

Eko Prasetyo ID Zweryfikowany kursant
★ 4 · 2025-04-14T00:22:52+00:00

It's a solid course. The structure is logical and most of the examples were helpful. Could use a few more real-world scenarios though.

Camila Pérez AR Zweryfikowany kursant
★ 4 · 2025-03-16T06:19:52+00:00

A good introduction. The structure was mostly clear, but I wish there were a few more real-world examples. Still, learned a lot.

Napisz recenzję

Po wysłaniu poprosimy o zalogowanie — szkic zostanie zapisany.

Inni uczyli się też

Najczęstsze pytania

Czego potrzebuję, by wziąć udział w tym kursie? +

Wystarczy telefon lub komputer z internetem. Bez instalacji i specjalnego sprzętu.

Jak zapłacić? +

Kartą przez Stripe lub kryptowalutą. Nie przechowujemy danych karty — robi to bezpiecznie Stripe.

Czy mogę otrzymać zwrot? +

Tak — pełen zwrot w 30 dni, bez pytań.

Jak długo będę mieć dostęp? +

Na zawsze. Po zakupie kurs jest twój — wracaj, kiedy chcesz.

Czy dostanę certyfikat? +

Tak. Po ukończeniu otrzymasz certyfikat, który możesz dodać do profilu LinkedIn.

Stworzony dla uczących się w
IT Design Finanse Marketing Ochrona zdrowia Edukacja Hotelarstwo Produkcja