Pembelajaran Penguatan Mendalam dalam Python: Pengantar Modern

Kuasai dasar-dasar pelatihan agen cerdas menggunakan Python, PyTorch, dan algoritma pembelajaran penguatan modern seperti A2C dan DDPG.

4.7 (3,889) ⏱ 1 jam 46 mnt 📚 6 pelajaran 🎧 Versi audio

Tentang kursus ini

Bagaimana sistem kecerdasan buatan modern belajar mengambil keputusan di lingkungan yang kompleks dan dinamis? Pembelajaran penguatan mendalam (deep reinforcement learning) menggabungkan jaringan saraf dengan kerangka kerja pengambilan keputusan untuk membangun agen yang memecahkan tantangan mulai dari robotika hingga permainan strategis. Dalam kursus berbasis teks ini, Anda akan beralih dari memahami teori dasar pembelajaran penguatan ke mengimplementasikan algoritma canggih dalam Python. Anda akan belajar cara menyusun lingkungan, merancang sistem penghargaan, dan melatih jaringan saraf untuk mengoptimalkan kebijakan pengambilan keputusan. Apa yang akan Anda pelajari: - Memahami matematika dasar pembelajaran penguatan, termasuk Proses Keputusan Markov dan persamaan Bellman. - Membangun dan melatih kebijakan jaringan saraf menggunakan konvensi PyTorch modern. - Mengimplementasikan metode gradien kebijakan tingkat lanjut termasuk Advantage Actor-Critic (A2C) dan Deep Deterministic Policy Gradient (DDPG). - Menerapkan strategi evolusi sebagai alternatif untuk pembelajaran penguatan berbasis gradien tradisional. - Mengkonfigurasi lingkungan simulasi menggunakan pustaka Gymnasium modern. - Menjelajahi dasar-dasar konseptual Pembelajaran Penguatan dari Umpan Balik Manusia (RLHF) yang mendukung model bahasa modern. Perjalanan dimulai dengan definisi inti dan konsep fundamental sebelum berlanjut ke implementasi kode langsung dari algoritma klasik dan mutakhir. Anda akan menganalisis penjelasan tertulis dan mempelajari cuplikan kode Python modern yang bersih untuk membangun model mental praktis tentang pelatihan agen. Kursus ini dirancang untuk pemula dalam pembelajaran penguatan (reinforcement learning) yang memiliki pemahaman dasar tentang Python dan jaringan saraf. Tidak diperlukan pengalaman sebelumnya dengan algoritma pembelajaran penguatan. Mulailah membangun agen cerdas yang belajar sendiri hari ini.

Apa yang Anda dapatkan

  • 📜 Sertifikat penyelesaian
    Tambahkan ke profil LinkedIn Anda
  • 🎧 Termasuk versi audio
    Belajar di mana saja — tanpa layar
  • ♾️ Akses seumur hidup
    Kembali kapan saja, tanpa kedaluwarsa
  • 📱 Ponsel atau komputer
    Berfungsi di mana saja, perangkat apa saja
  • 💸 Pengembalian 30 hari
    Tanpa pertanyaan
  • Singkat dan fokus
    1 jam 46 mnt konten praktis

Ulasan (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, aku tidak yakin ini untuk pemula, itu mengasumsikan sedikit pengetahuan sebelumnya yang tidak secara eksplisit diajarkan, beberapa contohnya membingungkan.

Ruby Owens NZ Pelajar terverifikasi
★ 5 · 2026-04-22T20:00:52+00:00

Sangat menikmati aliran ini. aplikasi praktis yang dibahas tepat sasaran. kursus yang hebat!

Eko Prasetyo ID Pelajar terverifikasi
★ 4 · 2025-04-14T00:22:52+00:00

itu adalah kursus yang solid strukturnya logis dan kebanyakan contohnya membantu bisa menggunakan beberapa skenario dunia nyata.

Camila Pérez AR Pelajar terverifikasi
★ 4 · 2025-03-16T06:19:52+00:00

pengenalan yang bagus strukturnya jelas, tapi aku berharap ada beberapa contoh dunia nyata lagi, belajar banyak.

Tulis ulasan

Setelah mengirim kami akan meminta masuk — draf Anda tersimpan.

Pertanyaan umum

Apa yang saya butuhkan untuk mengikuti kursus ini? +

Cukup ponsel atau komputer dengan internet. Tidak ada instalasi atau perangkat khusus.

Bagaimana cara membayar? +

Dengan kartu via Stripe, atau kripto. Kami tidak menyimpan detail kartu — Stripe menanganinya dengan aman.

Bisakah saya mendapat refund? +

Ya — refund penuh dalam 30 hari, tanpa pertanyaan.

Berapa lama saya akan punya akses? +

Selamanya. Setelah membeli, kursus jadi milik Anda untuk dikunjungi lagi kapan saja.

Apakah saya akan mendapat sertifikat? +

Ya. Setelah selesai, Anda akan menerima sertifikat yang bisa ditambahkan ke profil LinkedIn.

Dibuat untuk pelajar di
Teknologi Desain Keuangan Pemasaran Kesehatan Pendidikan Perhotelan Manufaktur