Глубокое обучение с подкреплением на Python: современное введение

Освойте основы обучения интеллектуальных агентов с использованием Python, PyTorch и современных алгоритмов обучения с подкреплением, таких как A2C и DDPG.

4.7 (3,889) ⏱ 1 ч 46 мин 📚 6 уроков 🎧 Аудиоверсия

О курсе

Как современные системы искусственного интеллекта учатся принимать решения в сложных, динамичных средах? Глубокое обучение с подкреплением сочетает нейронные сети с системами принятия решений для создания агентов, решающих задачи от робототехники до стратегических игр. В этом текстовом курсе вы перейдете от понимания базовой теории обучения с подкреплением к реализации сложных алгоритмов на Python. Вы научитесь структурировать среды, проектировать системы вознаграждения и обучать нейронные сети для оптимизации стратегий принятия решений. Что вы узнаете: - Поймете основы математики обучения с подкреплением, включая марковские процессы принятия решений и уравнение Беллмана. - Создадите и обучите стратегии нейронных сетей, используя современные соглашения PyTorch. - Реализуете продвинутые методы градиентного анализа стратегий, включая метод «преимущество-актор-критик» (A2C) и метод глубокого детерминированного градиентного анализа стратегий (DDPG). - Примените эволюционные стратегии в качестве альтернативы традиционному градиентному обучению с подкреплением. - Настроите среды моделирования, используя современную библиотеку Gymnasium. — Изучите концептуальные основы обучения с подкреплением на основе обратной связи от человека (RLHF), лежащего в основе современных языковых моделей. Путешествие начинается с основных определений и фундаментальных концепций, а затем переходит к практической реализации кода классических и передовых алгоритмов. Вы будете анализировать письменные объяснения и изучать чистые, современные фрагменты кода на Python для построения практической ментальной модели обучения агентов. Этот курс предназначен для начинающих в области обучения с подкреплением, имеющих базовое понимание Python и нейронных сетей. Предварительный опыт работы с алгоритмами обучения с подкреплением не требуется. Начните создавать интеллектуальных, самообучающихся агентов уже сегодня.

Что вы получите

  • 📜 Сертификат об окончании
    Добавьте в профиль LinkedIn
  • 🎧 Аудиоверсия включена
    Учитесь в дороге — экран не нужен
  • ♾️ Пожизненный доступ
    Возвращайтесь в любое время, без срока
  • 📱 Телефон или компьютер
    Работает везде и на любом устройстве
  • 💸 Возврат в течение 30 дней
    Без вопросов
  • Кратко и по делу
    1 ч 46 мин практического материала

Отзывы (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Хмм, я не уверен, что это для абсолютного новичка. Это предполагает немного предварительных знаний, которые не были явно преподаны. Некоторые примеры были запутанными.

Ruby Owens NZ Подтверждённый учащийся
★ 5 · 2026-04-22T20:00:52+00:00

Очень понравилось течение этого. Практические приложения, обсуждаемые были на месте. Отличный курс!

Eko Prasetyo ID Подтверждённый учащийся
★ 4 · 2025-04-14T00:22:52+00:00

Это солидный курс. Структура логична и большинство примеров были полезны. Хотя можно было бы использовать несколько более реальных сценариев.

Camila Pérez AR Подтверждённый учащийся
★ 4 · 2025-03-16T06:19:52+00:00

Хорошее введение. Структура была в основном ясна, но мне хотелось бы, чтобы было несколько более реальных примеров.

Написать отзыв

После отправки попросим войти — черновик сохранится.

Студенты также прошли

Часто спрашивают

Что нужно для прохождения курса? +

Только смартфон или компьютер с доступом в интернет. Никаких установок и оборудования.

Как оплатить? +

Банковской картой через Stripe или криптовалютой. Данные карты обрабатывает Stripe — мы их не храним.

Можно ли вернуть деньги? +

Да — полный возврат в течение 30 дней, без вопросов.

Как долго будут доступны материалы? +

Навсегда. После покупки курс остаётся с вами — возвращайтесь в любое время.

Получу ли я сертификат? +

Да. По окончании выдаётся сертификат, который можно добавить в профиль LinkedIn.

Подходит для специалистов в
IT Дизайн Финансы Маркетинг Медицина Образование HoReCa Производство