Contattataci

Struttura del corso

Programma dettagliato del corso

  1. Introduzione al NLP
    • Comprensione del NLP
    • Framework del NLP
    • Applicazioni commerciali del NLP
    • Scraping di dati dal web
    • Utilizzo di varie API per recuperare dati testuali
    • Gestione e archiviazione di corpora testuali, salvando il contenuto e i metadati rilevanti
    • Vantaggi dell'uso di Python e corso accelerato su NLTK
  2. Comprensione pratica di un Corpus e di un Dataset
    • Perché abbiamo bisogno di un corpus?
    • Analisi del corpus
    • Tipi di attributi dei dati
    • Diversi formati di file per i corpora
    • Preparazione di un dataset per applicazioni NLP
  3. Comprensione della Struttura delle Frasi
    • Componenti del NLP
    • Comprensione del linguaggio naturale
    • Analisi morfologica - radice, parola, token, etichette grammaticali
    • Analisi sintattica
    • Analisi semantica
    • Gestione dell'ambiguità
  4. Pre-elaborazione dei dati testuali
    • Corpus - testo grezzo
      • Tokenizzazione delle frasi
      • Stemming per testo grezzo
      • Lemmatizzazione del testo grezzo
      • Rimozione delle stop word
    • Corpus - frasi grezze
      • Tokenizzazione delle parole
      • Lemmatizzazione delle parole
    • Lavorare con matrici Termine-Documento/Documento-Termine
    • Tokenizzazione del testo in n-grammi e frasi
    • Pre-elaborazione pratica e personalizzata
  5. Analisi dei Dati Testuali
    • Caratteristiche di base del NLP
      • Parser e parsing
      • Tagging POS e tagger
      • Riconoscimento di entità nominate
      • N-grammi
      • Bag of words
    • Caratteristiche statistiche del NLP
      • Concetti di algebra lineare per il NLP
      • Teoria probabilistica per il NLP
      • TF-IDF
      • Vettorizzazione
      • Encoder e Decoder
      • Normalizzazione
      • Modelli probabilistici
    • Ingegneria avanzata delle caratteristiche e NLP
      • Introduzione a word2vec
      • Componenti del modello word2vec
      • Logica del modello word2vec
      • Estensione del concetto di word2vec
      • Applicazione del modello word2vec
    • Studio di caso: Applicazione del bag of words: riassunzione automatica del testo utilizzando gli algoritmi semplificati e veri di Luhn
  6. Clustering di Documenti, Classificazione e Modellazione Tematica
    • Clustering di documenti e mining di pattern (clustering gerarchico, k-means, clustering, ecc.)
    • Confronto e classificazione di documenti utilizzando misure di distanza TFIDF, Jaccard e coseno
    • Classificazione dei documenti utilizzando Naïve Bayes e Massima Entropia
  7. Identificazione di Elementi Testuali Importanti
    • Riduzione della dimensionalità: Analisi delle Componenti Principali, Scomposizione ai Valori Singoli, fattorizzazione non negativa della matrice
    • Modellazione tematica e recupero di informazioni tramite Analisi Semantica Latente
  8. Estrazione di Entità, Analisi del Sentiment e Modellazione Tematica Avanzata
    • Positivo vs negativo: grado del sentiment
    • Teoria della risposta agli items
    • Tagging POS e sue applicazioni: individuazione di persone, luoghi e organizzazioni menzionati nel testo
    • Modellazione tematica avanzata: Allocazione Dirichlet Latente
  9. Studi di caso
    • Analisi dei recensioni non strutturate degli utenti
    • Classificazione del sentiment e visualizzazione dei dati delle recensioni di prodotto
    • Analisi dei log di ricerca per modelli di utilizzo
    • Classificazione del testo
    • Modellazione tematica

Requisiti

Conoscenza e consapevolezza dei principi del NLP e apprezzamento dell'applicazione dell'IA in ambito aziendale

 21 ore

Numero di Partecipanti


Prezzo per partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative