Scala e Spark per l'analisi dei Big Data

Impara a elaborare enormi set di dati combinando la potenza della programmazione funzionale di Scala con il motore di calcolo distribuito di Apache Spark.

4.6 (2,600) ⏱ 1 h 48 min 📚 5 lezioni

Informazioni sul corso

Questo corso basato su testo ti guida attraverso i concetti fondamentali dell'elaborazione dei big data, mostrandoti come sfruttare la velocità di Apache Spark utilizzando i paradigmi eleganti e funzionali di Scala.Questo corso ti aiuterà a comprendere i concetti fondamentali dell'elaborazione dei big data, mostrandoti come sfruttare la velocità di Apache Spark utilizzando i paradigmi eleganti e funzionali di Scala. Passando dalla scrittura di codice locale di base alla progettazione di robuste pipeline di dati distribuiti che possono scalare tra i cluster.Leggendo chiare spiegazioni concettuali e analizzando esempi di codice pratici, costruirai una solida base nei sistemi distribuiti. Cosa imparerai: - Comprendere i principi fondamentali del calcolo distribuito, dell'esecuzione del cluster e del modello di memoria di Spark. - Applicare concetti di programmazione funzionale in Scala per manipolare raccolte di dati distribuite in modo sicuro ed efficiente. - Master API strutturate di Spark, inclusi DataFrames e Datasets, per trasformazioni di dati ottimizzate. - Scrivi query SQL Spark espressive per analizzare dati strutturati e semi-strutturati su larga scala. - Configurare le pipeline di dati per leggere e scrivere in formati di archiviazione moderni come Parquet e Delta Lake. - Praticare l'identificazione e la risoluzione dei colli di bottiglia delle prestazioni comuni nelle attività di dati distribuiti. Il corso inizia con la terminologia essenziale dei big data, la sintassi fondamentale di Scala e i concetti distribuiti di base prima di passare alla manipolazione pratica dei dati, alla progettazione di API strutturate e ai flussi di lavoro pratici di ottimizzazione. Questo corso è progettato per i principianti dei big data, inclusi sviluppatori, analisti di dati e aspiranti ingegneri di dati che desiderano apprendere l'elaborazione distribuita da zero senza bisogno di precedenti esperienze di cluster. Inizia a leggere oggi stesso per scoprire la potenza dell’analisi dei dati distribuiti con Scala e Spark.

Cosa otterrai

  • 📜 Certificato di completamento
    Aggiungilo al tuo profilo LinkedIn
  • 💬 Personal AI tutor
    Stuck on a lesson? Ask your built-in tutor anything, any time.
  • ♾️ Accesso a vita
    Torna quando vuoi, senza scadenza
  • 📱 Telefono o computer
    Funziona ovunque, su qualsiasi dispositivo
  • 💸 Rimborso entro 30 giorni
    Senza domande
  • Breve e mirato
    1 h 48 min di contenuto pratico

Recensioni (2)

Andrew Owusu GH Studente verificato
★ 4 · 2026-03-17T08:44:08+00:00

Mi sono piaciuti gli esempi di applicazione pratica, anche se la configurazione iniziale ha richiesto più tempo del previsto.

فريد DZ Studente verificato
★ 4 · 2026-02-14T08:30:08+00:00

Corso: Alcune parti erano un po 'più veloci di quanto mi aspettassi, ma gli esempi erano utili. In generale un corso solido.

Scrivi una recensione

Ti chiederemo di accedere dopo l'invio — la bozza viene salvata.

Altri hanno seguito anche

Domande frequenti

Cosa serve per seguire questo corso? +

Basta un telefono o un computer con internet. Niente installazioni, nessun hardware speciale.

Come si paga? +

Con carta via Stripe o con criptovaluta. Non conserviamo i dati della carta — Stripe li gestisce in sicurezza.

Posso ottenere un rimborso? +

Sì — rimborso completo entro 30 giorni, senza domande.

Per quanto tempo avrò accesso? +

Per sempre. Una volta acquistato, il corso è tuo e puoi rivederlo quando vuoi.

Riceverò un certificato? +

Sì. Al completamento riceverai un certificato da aggiungere al tuo profilo LinkedIn.

Pensato per chi lavora in
Tech Design Finanza Marketing Sanità Istruzione Ospitalità Produzione