Asas Pembelajaran Pengukuhan untuk Ejen Bijaksana

Menguasai prinsip membuat keputusan automatik dengan memahami bagaimana agen berinteraksi dengan persekitaran untuk menyelesaikan masalah kompleks melalui maklum balas dan pengalaman.

4.8 (2,901) ⏱ 1 jam 31 min 📚 4 pelajaran 🎧 Versi audio

Tentang kursus ini

Dalam dunia yang semakin didorong oleh sistem autonomi, memahami bagaimana mesin belajar untuk membuat keputusan optimum adalah kemahiran penting bagi mana-mana ahli AI yang bercita-cita. Kursus ini menyediakan asas yang kukuh dalam mekanik pembelajaran pengukuhan, mengubah konsep teori menjadi pemahaman praktikal bagaimana agen menavigasi persekitaran. Anda akan memperoleh pandangan komprehensif tentang bagaimana sistem belajar dari percubaan dan kesilapan untuk mencapai matlamat jangka panjang. Melalui penjelasan terperinci dan latihan konseptual, anda akan mengembangkan intuisi yang diperlukan untuk memodelkan masalah dunia sebenar sebagai tugas pembelajaran. Apa yang anda akan belajar: - Mengerti kerangka dasar agen, lingkungan, negara, dan hadiah. - Belajar mekanik Proses Keputusan Markov (MDPs) untuk memodelkan pembuatan keputusan berturut-turut. - Gunakan strategi penjelajahan dan eksploitasi untuk menyeimbangkan penemuan jalan baru dengan memaksimumkan ganjaran. - Latihan menyelesaikan masalah menggunakan nilai-berdasarkan dan kaedah berpandukan dasar. - Mengerti aplikasi modern pembelajaran penguat, termasuk penyesuaian melalui maklum balas manusia (RLHF). - Menganalisis cabaran assignment kredit dan ganjaran tertunda dalam sistem dinamik. Kurikulum bermula dengan terminologi asas dan asas matematik pembuatan keputusan sebelum bergerak ke pendekatan algoritma tertentu dan kes penggunaan industri moden. Kursus ini direka untuk pemula yang berminat dengan pembelajaran mesin dan sistem automatik, tidak memerlukan pengalaman sebelumnya dengan pembelajaran pengukuhan. Mulakan membina pemahaman anda tentang reka bentuk agen pintar hari ini.

Apa yang anda dapat

  • 📜 Sijil tamat
    Tambah ke profil LinkedIn anda
  • 🎧 Termasuk versi audio
    Belajar sambil bergerak — tanpa skrin
  • ♾️ Akses seumur hidup
    Kembali bila-bila masa, tiada tamat tempoh
  • 📱 Telefon atau komputer
    Berfungsi di mana-mana, mana-mana peranti
  • 💸 Pulangan 30 hari
    Tanpa soalan
  • Pendek dan fokus
    1 jam 31 min kandungan praktikal

Ulasan (2)

Maarten de Boer NL
★ 4 · 2026-02-11T09:26:02+00:00

Kursus yang baik. Strukturnya jelas, walaupun beberapa contoh mungkin memerlukan lebih banyak butiran. Masih, belajar banyak.

Elias Korhonen FI Pelajar disahkan
★ 4 · 2025-09-04T06:27:02+00:00

Pengenalan yang baik. Strukturnya jelas, tapi saya harap ada beberapa contoh dunia sebenar. Masih, belajar banyak.

Tulis ulasan

Selepas hantar kami akan meminta anda log masuk — draf disimpan.

Pelajar lain juga mengambil

Soalan lazim

Apa yang saya perlukan untuk mengikuti kursus ini? +

Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.

Bagaimana untuk membayar? +

Dengan kad melalui Stripe, atau kripto. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.

Bolehkah saya dapatkan bayaran balik? +

Ya — pulangan penuh dalam 30 hari, tanpa soalan.

Berapa lama saya akan mempunyai akses? +

Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.

Adakah saya akan mendapat sijil? +

Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.

Direka untuk pelajar dalam
Teknologi Reka bentuk Kewangan Pemasaran Kesihatan Pendidikan Hospitaliti Pembuatan