Aprendizaje profundo por refuerzo en Python: una introducción moderna

Domine los fundamentos de la formación de agentes inteligentes mediante Python, PyTorch y algoritmos modernos de aprendizaje por refuerzo como A2C y DDPG.

4.7 (3,889) ⏱ 1 h 46 min 📚 6 lecciones 🎧 Versión en audio

Sobre este curso

El aprendizaje profundo por refuerzo combina redes neuronales con marcos de toma de decisiones para crear agentes que resuelven desafíos que van desde la robótica hasta los juegos estratégicos. En este curso basado en texto, pasará de comprender la teoría básica del aprendizaje por refuerzo a implementar algoritmos sofisticados en Python.Aprenderá cómo estructurar entornos, diseñar sistemas de recompensa y entrenar redes neuronales para optimizar las políticas de toma de decisiones. Lo que aprenderás: - Comprender las matemáticas fundamentales del aprendizaje por refuerzo, incluidos los procesos de decisión de Markov y la ecuación de Bellman. - Construir y entrenar políticas de red neuronal utilizando convenciones PyTorch modernas. - Implementar métodos avanzados de gradiente de políticas, incluidos Advantage Actor-Critic (A2C) y Deep Deterministic Policy Gradient (DDPG). - Aplicar estrategias de evolución como alternativa al aprendizaje de refuerzo tradicional basado en gradientes. - Configurar entornos de simulación utilizando la moderna biblioteca Gymnasium. - Explore los fundamentos conceptuales del aprendizaje de refuerzo de la retroalimentación humana (RLHF) que impulsa los modelos de lenguaje moderno. El viaje comienza con definiciones básicas y conceptos fundamentales antes de avanzar a las implementaciones de código prácticas de algoritmos clásicos y de vanguardia.Analizará explicaciones escritas y estudiará fragmentos de código Python limpios y modernos para construir un modelo mental práctico de entrenamiento de agentes. Este curso está diseñado para principiantes en aprendizaje por refuerzo que tengan un conocimiento básico de Python y redes neuronales, no se requiere experiencia previa con algoritmos de aprendizaje por refuerzo. Comience a crear agentes inteligentes y de autoaprendizaje hoy mismo.

Lo que obtendrás

  • 📜 Certificado de finalización
    Añádelo a tu perfil de LinkedIn
  • 🎧 Versión en audio incluida
    Aprende en cualquier momento, sin pantalla
  • ♾️ Acceso de por vida
    Vuelve cuando quieras, sin caducidad
  • 📱 Teléfono o computadora
    Funciona en cualquier dispositivo
  • 💸 Reembolso de 30 días
    Sin preguntas
  • Breve y enfocado
    1 h 46 min de contenido práctico

Reseñas (4)

Toyin Odumosu NG
★ 2 · 2026-04-26T11:50:52+00:00

Hmm, no estoy seguro de que esto sea para principiantes absolutos. Asume un poco de conocimiento previo que no se enseñó explícitamente.

Ruby Owens NZ Estudiante verificado
★ 5 · 2026-04-22T20:00:52+00:00

Realmente disfruté el flujo de esto. Las aplicaciones prácticas discutidas fueron perfectas.

Eko Prasetyo ID Estudiante verificado
★ 4 · 2025-04-14T00:22:52+00:00

Es un curso sólido. La estructura es lógica y la mayoría de los ejemplos fueron útiles.Podría usar algunos escenarios más del mundo real.

Camila Pérez AR Estudiante verificado
★ 4 · 2025-03-16T06:19:52+00:00

Una buena introducción. La estructura era en su mayoría clara, pero me gustaría que hubiera algunos ejemplos más del mundo real.

Escribir una reseña

Te pediremos iniciar sesión después de enviar — tu borrador se guarda.

Otros también tomaron

Preguntas frecuentes

¿Qué necesito para tomar este curso? +

Solo un teléfono o computadora con internet. Sin instalaciones ni hardware especial.

¿Cómo pago? +

Con tarjeta a través de Stripe, o con criptomonedas. No almacenamos datos de tarjeta — Stripe los gestiona de forma segura.

¿Puedo obtener un reembolso? +

Sí — reembolso completo en 30 días, sin preguntas.

¿Por cuánto tiempo tendré acceso? +

Para siempre. Una vez comprado, el curso es tuyo para revisarlo cuando quieras.

¿Obtendré un certificado? +

Sí. Al finalizar recibirás un certificado que puedes añadir a tu perfil de LinkedIn.

Diseñado para profesionales en
Tecnología Diseño Finanzas Marketing Salud Educación Hostelería Manufactura