Apache Spark: un unico motore per il Big Data Processing

Siamo lieti di invitarvi all’evento

Apache Spark: un unico motore per il Big Data Processing

Con la crescita dei volumi dei dati, l’approccio al calcolo distribuito ha posto da subito in evidenza il problema del modello di programmazione. Nel tempo sono nati molti sistemi, ciascuno di essi  specializzato per supportare al meglio uno specifico workload: elaborazioni batch, query SQL interattive, navigazione di grafi, streaming sono solo alcuni degli aspetti che questi framework indirizzano e risolvono.Nelle applicazioni del mondo reale è però sempre necessario far convivere molti workload differenti. In questo contesto un modello di programmazione unificato facilita lo sviluppo e la manutenzione delle applicazioni. Spark è una risposta al problema di unificazione del modello e di garanzia di performance e velocità di elaborazione.

Argomenti
  • Introduzione ad Apache Spark
  • Il modello di programmazione
  • Fault Tolerance
  • Integrazione con i sistemi di storage
  • Librerie di alto livello (Spark SQL, Spark Streaming, MLib, GraphX)
  • Applicazioni e casi d’uso (Batch processing, Query interattive, Streaming)
  • SparkR e PySpark
  • Focus: Integrazione con Apache Kafka per lo streaming strutturato e l’end-to-end real-time

Nel corso di questo evento avrai la possibilità di:

  • Aggiornarti su una delle più significative innovazioni tecnologiche nel mondo Big Data
  • Confrontarti con i maggiori esperti delle tecnologie Hadoop
  • Conoscere il percorso formativo e di certificazione offerto da GCI – Brain Management e Cloudera
AGENDA

09.30 – 10.00
Registrazione e welcome coffee
10.00 – 12.15
Apache Spark: un unico motore per il Big Data Processing
(coffee break 11.00 – 11.15)
12.15 – 13.00
A con i nostri esperti Big Data