Aprendizagem por reforço profundo em Python: uma introdução moderna

Domine os fundamentos do treinamento de agentes inteligentes usando Python, PyTorch e algoritmos modernos de aprendizado por reforço, como A2C e DDPG.

4.7 (3,889) ⏱ 1 h 46 min 📚 6 aulas 🎧 Versão em áudio

Sobre este curso

O aprendizado profundo por reforço combina redes neurais com estruturas de tomada de decisão para criar agentes que resolvem desafios de robótica a jogos estratégicos, e o aprendizado profundo por reforço é uma tecnologia de aprendizado profundo que usa redes neurais para aprender a tomar decisões. Neste curso baseado em texto, você fará a transição da compreensão da teoria básica de aprendizado por reforço para a implementação de algoritmos sofisticados em Python.Você aprenderá a estruturar ambientes, projetar sistemas de recompensa e treinar redes neurais para otimizar as políticas de tomada de decisão. O que você vai aprender: - Entenda a matemática fundamental da aprendizagem por reforço, incluindo Processos de Decisão de Markov e a equação de Bellman. - Construa e treine políticas de rede neural usando convenções modernas do PyTorch. - Implemente métodos avançados de gradiente de política, incluindo Advantage Actor-Critic (A2C) e Gradiente de Política Determinística Profunda (DDPG). - Aplicar estratégias de evolução como uma alternativa à aprendizagem de reforço tradicional baseada em gradiente. - Configure ambientes de simulação usando a moderna biblioteca Gymnasium. - Explore os fundamentos conceituais do Aprendizado por Reforço do Feedback Humano (RLHF) que alimenta modelos de linguagem modernos. A jornada começa com definições básicas e conceitos fundamentais antes de progredir para implementações práticas de código de algoritmos clássicos e de ponta.Você analisará explicações escritas e estudará trechos de código Python limpos e modernos para construir um modelo mental prático de treinamento de agentes. Este curso é projetado para iniciantes em aprendizado por reforço que têm uma compreensão básica de Python e redes neurais.Não é necessária experiência prévia com algoritmos de aprendizado por reforço. Comece a criar agentes inteligentes e de autoaprendizagem hoje mesmo.

O que você vai receber

  • 📜 Certificado de conclusão
    Adicione ao seu perfil do LinkedIn
  • 🎧 Versão em áudio incluída
    Estude em qualquer lugar, sem tela
  • ♾️ Acesso vitalício
    Volte quando quiser, sem expirar
  • 📱 Celular ou computador
    Funciona em qualquer dispositivo
  • 💸 Reembolso em 30 dias
    Sem perguntas
  • Curto e focado
    1 h 46 min de conteúdo prático

Avaliações (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, não tenho certeza se isso é para iniciantes absolutos. Ele assume um pouco de conhecimento prévio que não foi explicitamente ensinado.

Ruby Owens NZ Aluno verificado
★ 5 · 2026-04-22T20:00:52+00:00

Gostei muito do fluxo disso. As aplicações práticas discutidas foram no local.

Eko Prasetyo ID Aluno verificado
★ 4 · 2025-04-14T00:22:52+00:00

É um curso sólido. A estrutura é lógica e a maioria dos exemplos foram úteis.Poderia usar alguns cenários mais reais.

Camila Pérez AR Aluno verificado
★ 4 · 2025-03-16T06:19:52+00:00

Uma boa introdução. A estrutura era principalmente clara, mas eu gostaria que houvesse mais alguns exemplos do mundo real.

Escrever uma avaliação

Pediremos para fazer login após enviar — o rascunho fica salvo.

Outros também fizeram

Perguntas frequentes

O que preciso para fazer este curso? +

Só um celular ou computador com internet. Sem instalações nem hardware especial.

Como faço para pagar? +

Cartão via Stripe ou criptomoeda. Não guardamos dados do cartão — o Stripe processa com segurança.

Posso pedir reembolso? +

Sim — reembolso integral em 30 dias, sem perguntas.

Por quanto tempo terei acesso? +

Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.

Vou receber um certificado? +

Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.

Feito para profissionais em
Tecnologia Design Finanças Marketing Saúde Educação Hotelaria Indústria