Scala y Spark para el análisis de Big Data

Aprenda a procesar conjuntos de datos masivos combinando el poder de la programación funcional de Scala con el motor de computación distribuida de Apache Spark.

4.6 (2,600) ⏱ 1 h 48 min 📚 5 lecciones

Sobre este curso

A medida que los conjuntos de datos crecen demasiado para una sola máquina, los desarrolladores e ingenieros de datos modernos deben hacer la transición del procesamiento local tradicional a la computación distribuida.Este curso basado en texto lo guía a través de los conceptos básicos del procesamiento de big data, mostrándole cómo aprovechar la velocidad de Apache Spark utilizando los paradigmas elegantes y funcionales de Scala. Al leer explicaciones conceptuales claras y analizar ejemplos prácticos de código, construirá una base sólida en sistemas distribuidos, y aprenderá a usar los conceptos básicos de la programación para diseñar y ejecutar sistemas distribuidos. Lo que aprenderás: - Comprender los principios fundamentales de la computación distribuida, la ejecución de clústeres y el modelo de memoria de Spark. - Aplicar conceptos de programación funcional en Scala para manipular colecciones de datos distribuidos de manera segura y eficiente. - Domine las API estructuradas de Spark, incluidos DataFrames y Datasets, para transformaciones de datos optimizadas. - Escriba consultas Spark SQL expresivas para analizar datos estructurados y semiestructurados a gran escala. - Configurar las tuberías de datos para leer y escribir en formatos de almacenamiento modernos como Parquet y Delta Lake. - Practique la identificación y resolución de cuellos de botella comunes en las tareas de datos distribuidos. El curso comienza con la terminología esencial de big data, la sintaxis fundamental de Scala y los conceptos distribuidos básicos antes de pasar a la manipulación práctica de datos, el diseño estructurado de API y los flujos de trabajo prácticos de optimización. Este curso está diseñado para principiantes en big data, incluidos desarrolladores, analistas de datos y aspirantes a ingenieros de datos que desean aprender el procesamiento distribuido desde cero sin necesidad de experiencia previa en clústeres. Comience a leer hoy mismo para desbloquear el poder del análisis de datos distribuidos con Scala y Spark.

Lo que obtendrás

  • 📜 Certificado de finalización
    Añádelo a tu perfil de LinkedIn
  • ♾️ Acceso de por vida
    Vuelve cuando quieras, sin caducidad
  • 📱 Teléfono o computadora
    Funciona en cualquier dispositivo
  • 💸 Reembolso de 30 días
    Sin preguntas
  • Breve y enfocado
    1 h 48 min de contenido práctico

Reseñas (2)

Andrew Owusu GH Estudiante verificado
★ 4 · 2026-03-17T08:44:08+00:00

Me gustaron los ejemplos de aplicación práctica, aunque la configuración inicial tomó más tiempo de lo que esperaba.

فريد DZ Estudiante verificado
★ 4 · 2026-02-14T08:30:08+00:00

Bueno en general. Algunas partes fueron un poco más rápidas de lo que esperaba, pero los ejemplos fueron útiles.

Escribir una reseña

Te pediremos iniciar sesión después de enviar — tu borrador se guarda.

Otros también tomaron

Preguntas frecuentes

¿Qué necesito para tomar este curso? +

Solo un teléfono o computadora con internet. Sin instalaciones ni hardware especial.

¿Cómo pago? +

Con tarjeta a través de Stripe, o con criptomonedas. No almacenamos datos de tarjeta — Stripe los gestiona de forma segura.

¿Puedo obtener un reembolso? +

Sí — reembolso completo en 30 días, sin preguntas.

¿Por cuánto tiempo tendré acceso? +

Para siempre. Una vez comprado, el curso es tuyo para revisarlo cuando quieras.

¿Obtendré un certificado? +

Sí. Al finalizar recibirás un certificado que puedes añadir a tu perfil de LinkedIn.

Diseñado para profesionales en
Tecnología Diseño Finanzas Marketing Salud Educación Hostelería Manufactura