Apache Spark: un unico motore per il Big Data Processing

Siamo lieti di invitarvi all’evento

Apache Spark: un unico motore per il Big Data Processing

Con la crescita dei volumi dei dati, l’approccio al calcolo distribuito ha posto da subito in evidenza il problema del modello di programmazione. Nel tempo sono nati molti sistemi, ciascuno di essi specializzato per supportare al meglio uno specifico workload: elaborazioni batch, query SQL interattive, navigazione di grafi, streaming sono solo alcuni degli aspetti che questi framework indirizzano e risolvono.Nelle applicazioni del mondo reale è però sempre necessario far convivere molti workload differenti. In questo contesto un modello di programmazione unificato facilita lo sviluppo e la manutenzione delle applicazioni. Spark è una risposta al problema di unificazione del modello e di garanzia di performance e velocità di elaborazione.

Argomenti

Introduzione ad Apache Spark
Il modello di programmazione
Fault Tolerance
Integrazione con i sistemi di storage
Librerie di alto livello (Spark SQL, Spark Streaming, MLib, GraphX)
Applicazioni e casi d’uso (Batch processing, Query interattive, Streaming)
SparkR e PySpark
Focus: Integrazione con Apache Kafka per lo streaming strutturato e l’end-to-end real-time

Nel corso di questo evento avrai la possibilità di:

Aggiornarti su una delle più significative innovazioni tecnologiche nel mondo Big Data
Confrontarti con i maggiori esperti delle tecnologie Hadoop
Conoscere il percorso formativo e di certificazione offerto da GCI – Brain Management e Cloudera

AGENDA

09.30 – 10.00
Registrazione e welcome coffee
10.00 – 12.15
Apache Spark: un unico motore per il Big Data Processing
(coffee break 11.00 – 11.15)
12.15 – 13.00
A con i nostri esperti Big Data