Struttura del corso

Introduzione

  • Database e librerie a grafo

Informazioni sui dati del grafico

  • Il grafo come struttura dati
  • Utilizzo di vertici (punti) e bordi (linee) per modellare scenari reali

Utilizzo di Graph Databases per modellare, rendere persistente ed elaborare i dati del grafico

  • Algoritmi/attraversamenti di grafi locali
  • neo4j, OrientDB e Titan

Esercizio: Modellazione di dati grafici con neo4j

  • Modellazione dei dati su lavagna

Oltre Graph Databases: Graph Computing

  • Informazioni sul grafico delle proprietà
  • Modellazione grafica di diversi scenari (grafico software, grafico di discussione, grafo concettuale)

Risoluzione dei problemi del mondo reale con gli attraversamenti

  • Percorso algoritmico/diretto sul grafico
  • Determinazione delle cependenze circolari

Caso di studio: Classificazione dei contributori alla discussione

  • Classificazione per numero e profondità delle discussioni a cui hanno contribuito
  • Una nota sull'analisi del sentiment e dei concetti

Graph Computing: toolkit di grafici locali in memoria

  • Analisi e visualizzazione dei grafici
  • JUNG, NetworkX e iGraph

Esercizio: Modellazione di dati grafici con NetworkX

  • Utilizzo di NetworkX per modellare un sistema complesso

Graph Computing: Framework di grafici per l'elaborazione batch

  • Utilizzo di Hadoop per l'archiviazione (HDFS) e l'elaborazione (MapReduce)
  • Cenni preliminari sugli algoritmi iterativi
  • Hama, Giraph e GraphLab

Graph Computing: Calcolo parallelo a grafo

  • Unificare l'ETL, l'analisi esplorativa e il calcolo iterativo dei grafi all'interno di un unico sistema
  • GraphX

Configurazione e installazione

  • Hadoop e Scintilla

GraphX Operatori

  • Proprietà, strutturale, join, aggregazione di quartiere, caching e uncaching

Iterazione con l'API Pregel

  • Passaggio di argomenti per l'invio, la ricezione e il calcolo

Creazione di un grafico

  • Utilizzo di vertici e spigoli in un RDD o su disco

Progettazione di algoritmi Scalable

  • GraphX Ottimizzazione

Accessalgoritmi aggiuntivi

  • PageRank, Componenti collegati, Conteggio triangoli

Esercis: Page Rank e Top Users

  • Creazione ed elaborazione di dati grafici utilizzando file di testo come input

Distribuzione nell'ambiente di produzione

Osservazioni conclusive

Requisiti

  • Una rifinitura della programmazione e dei framework Java
  • Una comprensione generale di Python è utile ma non obbligatoria
  • Una comprensione generale dei concetti relativi ai database

Pubblico

  • Gli sviluppatori
  28 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (2)

Corsi relativi

Categorie relative