Struttura del corso

Schema di formazione dettagliato

  1. Introduzione all'NLP
    • Cos'è l'NLP
    • Framework NLP
    • Applicazioni commerciali dell'NLP
    • Raccolta dati dal web
    • Lavoro con varie API per ottenere dati testuali
    • Gestione e archiviazione di corpora di testo, salvando contenuti e metadata rilevanti
    • Vantaggi dell'utilizzo del corso accelerato Python e NLTK
  2. Comprensione pratica di un corpus e dataset
    • Perché abbiamo bisogno di un corpus?
    • Analisi del corpus
    • Tipi di attributi dei dati
    • Diversi formati di file per i corpora
    • Preparazione di un dataset per applicazioni NLP
  3. Comprensione della struttura delle frasi
    • Componenti dell'NLP
    • Comprensione del linguaggio naturale
    • Analisi morfologica - stema, parola, token, tag di parlata
    • Analisi sintattica
    • Analisi semantica
    • Gestione dell'ambiguità
  4. Predisposizione dei dati testuali
    • Corpus - testo grezzo
      • Tokenizzazione delle frasi
      • Radicazione per il testo grezzo
      • Lemmatizzazione del testo grezzo
      • Rimozione delle parole vuote
    • Corpus-frasi grezze
      • Word tokenizzazione
      • Word lemmatizzazione
    • Lavoro con matrici Term-Document/Document-Term
    • Predisposizione del testo in n-grammi e frasi
    • Predisposizione pratica e personalizzata
  5. Analisi dei dati testuali
    • Caratteristiche di base dell'NLP
      • Parser e parsing
      • Tagging POS e tagger
      • Riconoscimento delle entità nominali
      • N-grammi
      • Bolsa di parole
    • Caratteristiche statistiche dell'NLP
      • Concetti di algebra lineare per NLP
      • Teoria probabilistica per NLP
      • TF-IDF
      • Vettorizzazione
      • Codificatori e decodificatori
      • Normalizzazione
      • Moderelli probabilistici
    • Ingegneria avanzata delle caratteristiche e NLP
      • Nozioni di base del word2vec
      • Componenti del modello word2vec
      • Logica del modello word2vec
      • Espansione del concetto di word2vec
      • Applicazione del modello word2vec
    • Caso studio: Applicazione della bolsa di parole: riepilogo automatico del testo utilizzando gli algoritmi semplificati e veri di Luhn
  6. Clustering, classificazione dei documenti e modellizzazione tematica
    • Clustering e ricerca di pattern nei documenti (clustering gerarchico, k-means, clustering, ecc.)
    • Confronto e classificazione dei documenti utilizzando misure TFIDF, Jaccard e distanza coseno
    • Classificazione dei documenti utilizzando Naïve Bayes e Massima Entropia
  7. Rilevamento di testi importanti Element
    • Minimizzazione della dimensionalità: Analisi degli Componenti Principali, Decomposizione del Valore Singolare, fattorizzazione matriciale non negativa
    • Modellazione tematica e recupero dell'informazione utilizzando l'Analisi Semantica Latente
  8. Estrazione di entità, Sentiment Analysis e modellazione avanzata dei temi
    • Positivo vs negativo: grado di sentimento
    • Teoria delle risposte agli item
    • Tagging POS e sue applicazioni: trovare persone, luoghi e organizzazioni menzionate nel testo
    • Modellazione avanzata dei temi: Allocazione Dirichlet Latente
  9. Casi di studio
    • Scatolamento recensioni utenti non strutturate
    • Classificazione e visualizzazione del sentimento sui dati delle recensioni prodotto
    • Scatolamento registri di ricerca per pattern d'uso
    • Classificazione testuale
    • Modellazione tematica

Requisiti

Conoscenza e consapevolezza dei principi dell'NLP e apprezzamento delle applicazioni dell'IA nel mondo degli affari

 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (1)

Corsi in Arrivo

Categorie relative