PySpark Foundations: Procesamiento práctico de Big Data con Python

Aprenda a procesar, consultar y analizar conjuntos de datos masivos usando PySpark, haciendo la transición de sus habilidades de Python y SQL a entornos de big data distribuidos.

4.8 (2,385) ⏱ 1 h 1 min 📚 10 lecciones 🎧 Versión en audio

Sobre este curso

A medida que los conjuntos de datos crecen demasiado para que las herramientas tradicionales puedan manejarlos, la computación distribuida se vuelve esencial para los profesionales de datos modernos.Este curso basado en texto lo presenta a PySpark, la API de Python para Spark, que le permite procesar y analizar conjuntos de datos masivos con velocidad y eficiencia. Al leer explicaciones claras y practicar con fragmentos de código del mundo real, dominará los conceptos fundamentales del almacenamiento distribuido, la ejecución de consultas y la manipulación de datos, y aprenderá a usar los algoritmos de aprendizaje automático para crear y administrar flujos de trabajo de Big Data. Lo que aprenderás: - Comprender los fundamentos de la computación distribuida, la arquitectura Spark y la transición de las bibliotecas de datos tradicionales. - Cree y manipule conjuntos de datos distribuidos resilientes (RDD) y marcos de datos Spark de alto rendimiento. - Consulte grandes conjuntos de datos utilizando Spark SQL para ejecutar consultas relacionales familiares en datos distribuidos. - Aplique la API moderna de Pandas en Spark para escalar sin problemas sus flujos de trabajo de Pandas existentes a Big Data. - Optimice las tuberías de procesamiento de datos utilizando almacenamiento en caché, particionamiento y definiciones de esquema eficientes. - Explore los conceptos básicos de la transmisión estructurada para procesar fuentes de datos en tiempo real. El curso comienza con la terminología esencial de big data y la arquitectura central de Spark, antes de pasar a las operaciones prácticas de DataFrame y las consultas SQL.Luego, avanzará a las técnicas de optimización del rendimiento y las API modernas de escalado de datos a través de explicaciones escritas estructuradas y ejercicios de código. Este curso está diseñado para ingenieros de datos principiantes, analistas de datos y desarrolladores de Python que desean ingresar al mundo de los grandes datos.No se requiere experiencia previa con sistemas distribuidos, aunque es útil una comprensión básica de Python y SQL. Comience a leer hoy mismo para desbloquear el poder de la computación distribuida y escalar sus habilidades de procesamiento de datos.

Lo que obtendrás

  • 📜 Certificado de finalización
    Añádelo a tu perfil de LinkedIn
  • 🎧 Versión en audio incluida
    Aprende en cualquier momento, sin pantalla
  • ♾️ Acceso de por vida
    Vuelve cuando quieras, sin caducidad
  • 📱 Teléfono o computadora
    Funciona en cualquier dispositivo
  • 💸 Reembolso de 30 días
    Sin preguntas
  • Breve y enfocado
    1 h 1 min de contenido práctico

Reseñas (4)

Mateo Torres UY Estudiante verificado
★ 3 · 2026-03-01T20:20:24+00:00

La estructura era lógica, pero me hubiera gustado que hubiera habido más práctica práctica más allá de los ejemplos básicos.

جميلة بن حسن TN Estudiante verificado
★ 4 · 2026-03-01T05:16:24+00:00

Me gustaron los ejemplos de aplicación práctica, aunque la configuración inicial tomó más tiempo de lo que esperaba.

Chernet Mekonnen ET Estudiante verificado
★ 5 · 2026-01-05T06:03:24+00:00

Disfruté mucho de este curso. La forma en que se presentó la información fue excelente, y las aplicaciones prácticas se destacaron de manera efectiva.

Олександр Коваленко UA Estudiante verificado
★ 2 · 2024-12-18T10:12:24+00:00

Es una introducción decente, pero podría beneficiarse de ejemplos más diversos y un flujo ligeramente mejor entre los módulos.

Escribir una reseña

Te pediremos iniciar sesión después de enviar — tu borrador se guarda.

Otros también tomaron

Preguntas frecuentes

¿Qué necesito para tomar este curso? +

Solo un teléfono o computadora con internet. Sin instalaciones ni hardware especial.

¿Cómo pago? +

Con tarjeta a través de Stripe, o con criptomonedas. No almacenamos datos de tarjeta — Stripe los gestiona de forma segura.

¿Puedo obtener un reembolso? +

Sí — reembolso completo en 30 días, sin preguntas.

¿Por cuánto tiempo tendré acceso? +

Para siempre. Una vez comprado, el curso es tuyo para revisarlo cuando quieras.

¿Obtendré un certificado? +

Sí. Al finalizar recibirás un certificado que puedes añadir a tu perfil de LinkedIn.

Diseñado para profesionales en
Tecnología Diseño Finanzas Marketing Salud Educación Hostelería Manufactura