Asas Pembelajaran Pengukuhan dan Pembuatan Keputusan

Fahami konsep teras pembuatan keputusan berurutan, daripada teori utiliti dan multi-armed bandits kepada algoritma pembelajaran pengukuhan moden.

4.4 (24) ⏱ 1 jam 17 min 📚 3 pelajaran 🎧 Versi audio

Tentang kursus ini

Memahami bagaimana sistem automatik membuat pilihan optimum dalam persekitaran yang kompleks dan berubah adalah kemahiran kritikal dalam kecerdasan buatan moden. Pembelajaran pengukuhan menyediakan rangka kerja matematik untuk melatih agen bagi memaksimumkan ganjaran melalui percubaan dan kesilapan. Dalam kursus asas ini, anda akan meneroka mekanik pembuatan keputusan berurutan. Anda akan bermula dengan prinsip asas teori utiliti dan maju ke arah membina algoritma yang membolehkan agen pintar belajar daripada persekitaran mereka, mengimbangi penerokaan dengan eksploitasi. Apa yang akan anda pelajari: • Memahami terminologi teras, teori utiliti, dan cara memodelkan keutamaan mesin. • Menyelesaikan cabaran keputusan mudah menggunakan strategi multi-armed bandit. • Memodelkan persekitaran kompleks menggunakan Proses Keputusan Markov (MDPs) terhingga. • Mengaplikasikan teknik pengaturcaraan dinamik untuk menilai dan menambah baik dasar keputusan. • Mengamalkan penyusunan algoritma asas menggunakan persekitaran simulasi Python moden. • Meneroka konsep asas yang menghubungkan kaedah jadual klasik kepada pembelajaran pengukuhan mendalam moden. Kurikulum ini mengalir daripada definisi asas dan model matematik kepada reka bentuk algoritma praktikal. Anda akan membaca penjelasan bertulis langkah demi langkah dan mengkaji cebisan kod yang jelas yang menterjemahkan teori abstrak kepada logik yang berfungsi. Kursus ini direka untuk pemula dalam kecerdasan buatan; tiada pengalaman pembelajaran pengukuhan terdahulu diperlukan. Mulakan perjalanan anda ke dalam pembuatan keputusan pintar hari ini dan bina asas untuk pembangunan AI moden.

Apa yang anda dapat

  • 📜 Sijil tamat
    Tambah ke profil LinkedIn anda
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • 🎧 Termasuk versi audio
    Belajar sambil bergerak — tanpa skrin
  • ♾️ Akses seumur hidup
    Kembali bila-bila masa, tiada tamat tempoh
  • 📱 Telefon atau komputer
    Berfungsi di mana-mana, mana-mana peranti
  • 💸 Pulangan 30 hari
    Tanpa soalan
  • Pendek dan fokus
    1 jam 17 min kandungan praktikal

Ulasan

Belum ada ulasan — jadilah yang pertama berkongsi pengalaman anda.

Tulis ulasan

Selepas hantar kami akan meminta anda log masuk — draf disimpan.

Pelajar lain juga mengambil

Soalan lazim

Apa yang saya perlukan untuk mengikuti kursus ini? +

Hanya telefon atau komputer dengan internet. Tiada pemasangan, tiada perkakasan khas.

Bagaimana untuk membayar? +

Dengan kad melalui Stripe, atau kripto. Kami tidak menyimpan butiran kad — Stripe menguruskannya dengan selamat.

Bolehkah saya dapatkan bayaran balik? +

Ya — pulangan penuh dalam 30 hari, tanpa soalan.

Berapa lama saya akan mempunyai akses? +

Selamanya. Setelah membeli, kursus adalah milik anda — boleh lawat semula bila-bila masa.

Adakah saya akan mendapat sijil? +

Ya. Setelah tamat, anda akan menerima sijil yang boleh ditambah ke profil LinkedIn anda.

Direka untuk pelajar dalam
Teknologi Reka bentuk Kewangan Pemasaran Kesihatan Pendidikan Hospitaliti Pembuatan