Học tăng cường sâu trong Python: Một giới thiệu hiện đại

Nắm vững các nguyên tắc cơ bản về huấn luyện tác nhân thông minh bằng Python, PyTorch và các thuật toán học tăng cường hiện đại như A2C và DDPG.

4.7 (3,889) ⏱ 1 giờ 46 phút 📚 6 bài 🎧 Phiên bản âm thanh

Về khóa học này

Làm thế nào các hệ thống trí tuệ nhân tạo hiện đại học cách đưa ra quyết định trong môi trường phức tạp, năng động? Học tăng cường sâu (Deep reinforcement learning) kết hợp mạng nơ-ron với các khung quyết định để xây dựng các tác nhân giải quyết các thách thức từ robot đến trò chơi chiến lược. Trong khóa học dựa trên văn bản này, bạn sẽ chuyển từ việc hiểu lý thuyết học tăng cường cơ bản sang triển khai các thuật toán phức tạp bằng Python. Bạn sẽ học cách cấu trúc môi trường, thiết kế hệ thống phần thưởng và huấn luyện mạng nơ-ron để tối ưu hóa các chính sách ra quyết định. Những gì bạn sẽ học: - Hiểu toán học nền tảng của học tăng cường, bao gồm Quy trình Quyết định Markov và phương trình Bellman. - Xây dựng và huấn luyện các chính sách mạng nơ-ron bằng cách sử dụng các quy ước PyTorch hiện đại. - Triển khai các phương pháp gradient chính sách nâng cao bao gồm Advantage Actor-Critic (A2C) và Deep Deterministic Policy Gradient (DDPG). - Áp dụng các chiến lược tiến hóa như một giải pháp thay thế cho học tăng cường dựa trên gradient truyền thống. - Cấu hình môi trường mô phỏng bằng thư viện Gymnasium hiện đại. - Khám phá nền tảng khái niệm của Học tăng cường từ phản hồi của con người (RLHF) hỗ trợ các mô hình ngôn ngữ hiện đại. Hành trình bắt đầu với các định nghĩa cốt lõi và các khái niệm cơ bản trước khi tiến đến phần thực hành lập trình các thuật toán kinh điển và hiện đại. Bạn sẽ phân tích các giải thích bằng văn bản và nghiên cứu các đoạn mã Python hiện đại, dễ hiểu để xây dựng mô hình tư duy thực tiễn về huấn luyện tác nhân. Khóa học này được thiết kế dành cho người mới bắt đầu học về học tăng cường, những người có hiểu biết cơ bản về Python và mạng nơ-ron. Không yêu cầu kinh nghiệm trước đó về các thuật toán học tăng cường. Hãy bắt đầu xây dựng các tác nhân thông minh, tự học ngay hôm nay.

Bạn sẽ nhận được

  • 📜 Chứng chỉ hoàn thành
    Thêm vào hồ sơ LinkedIn
  • 🎧 Bao gồm phiên bản âm thanh
    Học mọi lúc mọi nơi — không cần màn hình
  • ♾️ Truy cập trọn đời
    Quay lại bất cứ lúc nào, không hết hạn
  • 📱 Điện thoại hoặc máy tính
    Hoạt động mọi nơi, mọi thiết bị
  • 💸 Hoàn tiền 30 ngày
    Không cần lý do
  • Ngắn gọn, đi vào trọng tâm
    1 giờ 46 phút nội dung thực hành

Đánh giá (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, tôi không chắc khóa này dành cho người mới bắt đầu hoàn toàn. Nó giả định một số kiến thức trước đó không được dạy rõ ràng. Một số ví dụ gây khó hiểu.

Ruby Owens NZ Học viên đã xác minh
★ 5 · 2026-04-22T20:00:52+00:00

Thực sự thích cách trình bày của khóa học này. Các ứng dụng thực tế được thảo luận rất đúng trọng tâm. Khóa học tuyệt vời!

Eko Prasetyo ID Học viên đã xác minh
★ 4 · 2025-04-14T00:22:52+00:00

Đây là một khóa học chắc chắn. Cấu trúc logic và hầu hết các ví dụ đều hữu ích. Tuy nhiên, có thể thêm một vài tình huống thực tế nữa.

Camila Pérez AR Học viên đã xác minh
★ 4 · 2025-03-16T06:19:52+00:00

Một lời giới thiệu tốt. Cấu trúc khá rõ ràng, nhưng tôi ước có thêm vài ví dụ thực tế. Dù sao thì cũng học được nhiều điều.

Viết đánh giá

Sau khi gửi, chúng tôi sẽ yêu cầu đăng nhập — bản nháp được lưu.

Câu hỏi thường gặp

Tôi cần gì để học khóa này? +

Chỉ cần điện thoại hoặc máy tính có kết nối internet. Không cần cài đặt hay thiết bị đặc biệt.

Tôi thanh toán bằng cách nào? +

Bằng thẻ qua Stripe, hoặc tiền điện tử. Chúng tôi không lưu thông tin thẻ — Stripe xử lý an toàn.

Tôi có thể được hoàn tiền không? +

Có — hoàn tiền đầy đủ trong 30 ngày, không cần lý do.

Tôi sẽ có quyền truy cập trong bao lâu? +

Mãi mãi. Sau khi mua, khóa học là của bạn để xem lại bất cứ lúc nào.

Tôi có nhận được chứng chỉ không? +

Có. Sau khi hoàn thành, bạn sẽ nhận được chứng chỉ và có thể thêm vào hồ sơ LinkedIn.

Dành cho người học trong
Công nghệ Thiết kế Tài chính Marketing Y tế Giáo dục Khách sạn-Dịch vụ Sản xuất