Fundamentos de aprendizagem por reforço: crie agentes de IA inteligentes

Domine os conceitos fundamentais de aprendizagem por reforço e escreva código Python para treinar agentes inteligentes capazes de resolver problemas complexos de tomada de decisão.

4.7 (3,588) ⏱ 1 h 40 min 📚 12 aulas

Sobre este curso

O aprendizado por reforço é a força motriz por trás de sistemas de direção autônoma, IA para jogos e robótica adaptativa, e é uma das principais tecnologias de aprendizado de máquina. Este curso baseado em texto guia você desde o iniciante absoluto até o design e treinamento confiáveis de seus próprios agentes de aprendizado de reforço.Você entenderá os fundamentos matemáticos da tomada de decisão e aprenderá a traduzir essas teorias em código Python funcional. O que você vai aprender: - Entenda os elementos centrais da aprendizagem por reforço, incluindo agentes, ambientes, estados, ações e recompensas - Formular processos de tomada de decisão usando Processos de Decisão de Markov e equações de Bellman - Implemente algoritmos clássicos de aprendizado por reforço, como Q-Learning e SARSA, do zero - Explore APIs de ambiente moderno como o Gymnasium para simular e testar seus agentes inteligentes - Aprenda a transição de métodos tabulares para fundações de aprendizado de reforço profundo - Analise aplicativos do mundo real e considerações de segurança no treinamento moderno de agentes Você começará com a terminologia básica e os conceitos básicos de aprendizado baseado em recompensas antes de avançar para implementações algorítmicas.Através de explicações claras e passo a passo, você verá como os agentes aprendem com tentativa e erro para maximizar seu desempenho. Este curso é projetado para aspirantes a desenvolvedores de IA, cientistas de dados e engenheiros de software que são novos para o aprendizado por reforço.Uma familiaridade básica com o Python é recomendada, mas nenhuma experiência prévia de aprendizado de máquina é necessária. Comece a ler hoje para construir e treinar seu primeiro agente de tomada de decisão inteligente.

O que você vai receber

  • 📜 Certificado de conclusão
    Adicione ao seu perfil do LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • ♾️ Acesso vitalício
    Volte quando quiser, sem expirar
  • 📱 Celular ou computador
    Funciona em qualquer dispositivo
  • 💸 Reembolso em 30 dias
    Sem perguntas
  • Curto e focado
    1 h 40 min de conteúdo prático

Avaliações (7)

Isabella Rossi KE Aluno verificado
★ 4 · 2025-10-28T10:03:15+00:00

Isso excedeu minhas expectativas. As lições fluíram logicamente e as aplicações do mundo real estavam no local.

Akua Gyan GH Aluno verificado
★ 4 · 2025-08-24T23:53:15+00:00

Uma boa introdução. A estrutura era principalmente clara, mas eu gostaria que houvesse mais alguns exemplos do mundo real.

Grainne Browne IE
★ 5 · 2025-08-09T05:59:15+00:00

Machine Translated Uma experiência de aprendizado verdadeiramente excelente. O fluxo era lógico e os exemplos eram super úteis.

Elin Nilsen NO Aluno verificado
★ 4 · 2025-05-06T18:39:15+00:00

É um bom curso se você já tiver algum conhecimento prévio. Para iniciantes, alguns conceitos podem ser um pouco desafiadores, mas a estrutura é lógica.

Anna Müller DE Aluno verificado
★ 5 · 2025-04-09T08:00:15+00:00

Machine Translated Experiência de aprendizado fantástica. O ritmo era perfeito e os exemplos realmente solidificaram os conceitos.

Lucas Jiménez PE
★ 3 · 2025-03-23T19:14:15+00:00

Hmm, não tenho certeza se isso é para iniciantes absolutos. Ele assume um pouco de conhecimento prévio que não foi explicitamente ensinado.

ليلى DZ Aluno verificado
★ 2 · 2024-12-19T18:08:15+00:00

Os exemplos nem sempre eram diretamente aplicáveis ao que estava sendo ensinado. Um pouco confuso tbh.

Escrever uma avaliação

Pediremos para fazer login após enviar — o rascunho fica salvo.

Outros também fizeram

Perguntas frequentes

O que preciso para fazer este curso? +

Só um celular ou computador com internet. Sem instalações nem hardware especial.

Como faço para pagar? +

Cartão via Stripe ou criptomoeda. Não guardamos dados do cartão — o Stripe processa com segurança.

Posso pedir reembolso? +

Sim — reembolso integral em 30 dias, sem perguntas.

Por quanto tempo terei acesso? +

Para sempre. Uma vez comprado, o curso é seu para revisar quando quiser.

Vou receber um certificado? +

Sim. Ao concluir, você recebe um certificado que pode adicionar ao seu perfil do LinkedIn.

Feito para profissionais em
Tecnologia Design Finanças Marketing Saúde Educação Hotelaria Indústria