การเรียนรู้แบบเสริมแรงลึกในภาษาไพทอน: การแนะนำแบบสมัยใหม่

เรียนรู้พื้นฐานการฝึกสายลับอัจฉริยะ ใช้ภาษาไพทอน, ไพทอร์ช และอัลกอริทึมการเรียนรู้แบบเสริมแรงสมัยใหม่ เช่น A2C และ DDPG

4.7 (3,889) ⏱ 1 ชม. 46 นาที 📚 6 บทเรียน 🎧 เวอร์ชันเสียง

เกี่ยวกับคอร์สนี้

ระบบปัญญาประดิษฐ์สมัยใหม่เรียนรู้ที่จะตัดสินใจในสภาพแวดล้อมที่ซับซ้อนและเปลี่ยนแปลงได้อย่างไร? ในวิชานี้ คุณจะเรียนรู้การสร้างระบบการเรียนรู้แบบเสริมแรง (reinforcement learning) ด้วยภาษาไพธอน คุณจะเรียนรู้การสร้างโครงสร้างของสภาพแวดล้อม ออกแบบระบบการตอบแทน และฝึกระบบประสาทให้สามารถตัดสินใจได้ดีที่สุด คุณจะเรียนรู้อะไร เข้าใจหลักการของการเรียนรู้แบบเสริมแรง รวมถึง กระบวนการตัดสินใจของมารคอฟ และสมการของเบลแมน - สร้างและฝึกกลยุทธ์ของระบบประสาท ใช้กฎของ PyTorch สมัยใหม่ - ใช้วิธีการปรับนโยบายขั้นสูง รวมถึง Advantage Actor-Critic (A2C) และ Deep Deterministic Policy Gradient (DDPG) - ใช้กลยุทธ์วิวัฒนาการ เป็นทางเลือก ในการเรียนรู้แบบเสริมแรงแบบดั้งเดิม - ปรับแต่งสภาพแวดล้อมการจำลอง ใช้ไลบรารี Gymnasium สมัยใหม่ สำรวจพื้นฐานของแนวคิด การเรียนรู้จากการเสริมสร้างจากผลตอบรับของมนุษย์ (RLHF) ขับเคลื่อนแบบจำลองภาษาสมัยใหม่ เริ่มต้นด้วยการอธิบายและความคิดพื้นฐานก่อนที่จะไปสู่การปฏิบัติการโค้ดของอัลกอริทึมคลาสสิกและอัลกอริทึมที่ทันสมัยที่สุด คุณจะวิเคราะห์คำอธิบายที่เขียนไว้และศึกษาโค้ด Python สมัยใหม่เพื่อสร้างแบบจำลองทางจิตใจที่ใช้ได้จริงในการฝึกอบรมตัวแทน หลักสูตรนี้ถูกออกแบบมาสำหรับผู้เริ่มต้นในการเรียนรู้แบบเสริมแรง ซึ่งมีความเข้าใจพื้นฐานเกี่ยวกับภาษาไพธอนและระบบประสาท โดยไม่ต้องมีประสบการณ์ก่อนหน้านี้กับอัลกอริทึมการเรียนรู้แบบเสริมแรง เริ่มสร้างสายลับที่ฉลาด เรียนรู้ได้เองวันนี้

สิ่งที่คุณจะได้รับ

  • 📜 ใบประกาศนียบัตร
    เพิ่มในโปรไฟล์ LinkedIn ของคุณ
  • 🎧 รวมเวอร์ชันเสียง
    เรียนได้ทุกที่ ไม่ต้องดูจอ
  • ♾️ เข้าถึงตลอดชีพ
    กลับมาเรียนได้ตลอด ไม่มีหมดอายุ
  • 📱 โทรศัพท์หรือคอมพิวเตอร์
    ใช้งานได้ทุกที่ ทุกอุปกรณ์
  • 💸 คืนเงิน 30 วัน
    ไม่ต้องอธิบาย
  • กระชับและตรงประเด็น
    1 ชม. 46 นาที เนื้อหาเชิงปฏิบัติ

รีวิว (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

อืม ไม่แน่ใจว่าเหมาะสำหรับมือใหม่จริงๆ ไหม มันเหมือนจะคาดหวังความรู้พื้นฐานมาก่อน ซึ่งไม่ได้สอนไว้ ตัวอย่างบางอันก็งงๆ

Ruby Owens NZ ผู้เรียนที่ยืนยันแล้ว
★ 5 · 2026-04-22T20:00:52+00:00

ชอบการดำเนินเรื่องของคอร์สนี้มาก การนำไปใช้จริงที่พูดถึงก็ตรงเป๊ะ คอร์สดีมาก!

Eko Prasetyo ID ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2025-04-14T00:22:52+00:00

เป็นคอร์สที่ดีเลยครับ โครงสร้างสมเหตุสมผล ตัวอย่างส่วนใหญ่มีประโยชน์ แต่อาจจะต้องมีสถานการณ์จริงเพิ่มอีกหน่อย

Camila Pérez AR ผู้เรียนที่ยืนยันแล้ว
★ 4 · 2025-03-16T06:19:52+00:00

เป็นการแนะนำที่ดี โครงสร้างส่วนใหญ่ชัดเจนดี แต่ก็อยากให้มีตัวอย่างในโลกจริงมากกว่านี้หน่อย แต่ก็ได้เรียนรู้อะไรเยอะเลย

เขียนรีวิว

หลังจากส่ง เราจะขอให้คุณเข้าสู่ระบบ — ฉบับร่างของคุณถูกบันทึก

คำถามที่พบบ่อย

ฉันต้องใช้อะไรในการเรียนคอร์สนี้? +

แค่โทรศัพท์หรือคอมพิวเตอร์ที่มีอินเทอร์เน็ต ไม่ต้องติดตั้งหรือใช้อุปกรณ์พิเศษ

ฉันชำระเงินอย่างไร? +

ผ่านบัตรด้วย Stripe หรือคริปโต เราไม่เก็บข้อมูลบัตร — Stripe จัดการอย่างปลอดภัย

ฉันขอคืนเงินได้ไหม? +

ใช่ — คืนเงินเต็มจำนวนใน 30 วัน ไม่ต้องอธิบาย

ฉันมีสิทธิ์เข้าถึงนานเท่าไร? +

ตลอดไป เมื่อซื้อแล้วคอร์สเป็นของคุณ กลับมาเรียนได้ตลอด

ฉันจะได้ใบประกาศนียบัตรไหม? +

ได้ เมื่อเรียนจบจะได้รับใบประกาศนียบัตรที่เพิ่มในโปรไฟล์ LinkedIn ได้

ออกแบบสำหรับผู้เรียนใน
เทคโนโลยี ดีไซน์ การเงิน การตลาด สาธารณสุข การศึกษา ธุรกิจการบริการ อุตสาหกรรม