Struttura del corso
Introduzione
- Database e librerie a grafo
Informazioni sui dati del grafico
- Il grafo come struttura dati
- Utilizzo di vertici (punti) e bordi (linee) per modellare scenari reali
Utilizzo di Graph Databases per modellare, rendere persistente ed elaborare i dati del grafico
- Algoritmi/attraversamenti di grafi locali
- neo4j, OrientDB e Titan
Esercizio: Modellazione di dati grafici con neo4j
- Modellazione dei dati su lavagna
Oltre Graph Databases: Graph Computing
- Informazioni sul grafico delle proprietà
- Modellazione grafica di diversi scenari (grafico software, grafico di discussione, grafo concettuale)
Risoluzione dei problemi del mondo reale con gli attraversamenti
- Percorso algoritmico/diretto sul grafico
- Determinazione delle cependenze circolari
Caso di studio: Classificazione dei contributori alla discussione
- Classificazione per numero e profondità delle discussioni a cui hanno contribuito
- Una nota sull'analisi del sentiment e dei concetti
Graph Computing: toolkit di grafici locali in memoria
- Analisi e visualizzazione dei grafici
- JUNG, NetworkX e iGraph
Esercizio: Modellazione di dati grafici con NetworkX
- Utilizzo di NetworkX per modellare un sistema complesso
Graph Computing: Framework di grafici per l'elaborazione batch
- Utilizzo di Hadoop per l'archiviazione (HDFS) e l'elaborazione (MapReduce)
- Cenni preliminari sugli algoritmi iterativi
- Hama, Giraph e GraphLab
Graph Computing: Calcolo parallelo a grafo
- Unificare l'ETL, l'analisi esplorativa e il calcolo iterativo dei grafi all'interno di un unico sistema
- GraphX
Configurazione e installazione
- Hadoop e Scintilla
GraphX Operatori
- Proprietà, strutturale, join, aggregazione di quartiere, caching e uncaching
Iterazione con l'API Pregel
- Passaggio di argomenti per l'invio, la ricezione e il calcolo
Creazione di un grafico
- Utilizzo di vertici e spigoli in un RDD o su disco
Progettazione di algoritmi Scalable
- GraphX Ottimizzazione
Accessalgoritmi aggiuntivi
- PageRank, Componenti collegati, Conteggio triangoli
Esercis: Page Rank e Top Users
- Creazione ed elaborazione di dati grafici utilizzando file di testo come input
Distribuzione nell'ambiente di produzione
Osservazioni conclusive
Requisiti
- Una rifinitura della programmazione e dei framework Java
- Una comprensione generale di Python è utile ma non obbligatoria
- Una comprensione generale dei concetti relativi ai database
Pubblico
- Gli sviluppatori
Recensioni (2)
Broad coverage and deep knowledge about Semantic Web
XINJIAN GUO - Yale University
Corso - Semantic Web Overview
Very nice training