Struttura del corso

Schema di formazione dettagliato

    Introduzione alla PNL Capire la PNL Quadri di PNL Applicazioni commerciali della PNL Scraping di dati dal Web Utilizzo di varie API per recuperare dati di testo Lavorare e memorizzare corpora di testo, salvare il contenuto e i metadati rilevanti Vantaggi dell'utilizzo di Python e corso intensivo NLTK Comprensione pratica di un corpus e di un set di dati Perché abbiamo bisogno di un corpus? Analisi dei Corpus Tipi di attributi dei dati Diversi formati di file per corpora Preparazione di un set di dati per applicazioni NLP Comprendere la struttura di una frase Componenti della PNL Comprensione del linguaggio naturale Analisi morfologica - gambo, parola, gettone, tag vocali Analisi sintattica Analisi semantica Gestione dell'ambiguità Pre-elaborazione dei dati di testo Corpus- testo grezzo Tokenizzazione delle frasi Stemming per il testo non elaborato Lemmizzazione del testo non elaborato Rimozione di parole non significative Frasi corpus grezze Word tokenizzazione Word lemmatizzazione Utilizzo delle matrici Term-Document/Document-Term Tokenizzazione del testo in n-grammi e frasi Pre-elaborazione pratica e personalizzata Analisi dei dati di testo Caratteristiche di base della PNL Parser e analisi Tagging e tagger POS Riconoscimento dell'entità del nome N-grammi Sacco di parole Caratteristiche statistiche della PNL Concetti di algebra lineare per la PNL Teoria probabilistica per la PNL TF-IDF Vettorizzazione Encoder e decoder Normalizzazione Modelli probabilistici Progettazione avanzata delle funzionalità e NLP Nozioni di base su word2vec Componenti del modello word2vec Logica del modello word2vec Estensione del concetto word2vec Applicazione del modello word2vec Caso di studio: Applicazione di un sacco di parole: riassunto automatico del testo utilizzando algoritmi di Luhn semplificati e reali Clustering, classificazione e modellazione degli argomenti dei documenti Clustering di documenti e pattern mining (clustering gerarchico, k-means, clustering, ecc.) Confronto e classificazione di documenti utilizzando misure di distanza TFIDF, Jaccard e coseno Classificazione dei documenti utilizzando Naïve Bayes e massima entropia Identificazione di elementi di testo importanti Riduzione della dimensionalità: analisi delle componenti principali, scomposizione a valori singolari, fattorizzazione di matrici non negative Modellazione di argomenti e recupero di informazioni utilizzando l'analisi semantica latente Estrazione di entità, analisi del sentiment e modellazione avanzata degli argomenti Positivo vs. negativo: grado di sentiment Teoria della risposta dell'articolo Parte del tagging vocale e la sua applicazione: trovare persone, luoghi e organizzazioni menzionati nel testo Modellazione avanzata degli argomenti: Allocazione di Dirichlet latente Casi di studio Mining di recensioni utente non strutturate Classificazione del sentiment e visualizzazione dei dati delle recensioni dei prodotti Estrazione dei log di ricerca per i modelli di utilizzo Classificazione del testo Modellazione degli argomenti

Requisiti

Conoscenza e consapevolezza dei principi della PNL e apprezzamento dell'applicazione dell'IA nel business

 21 ore

Numero di Partecipanti



Prezzo per Partecipante

Recensioni (2)

Corsi relativi

Smart Robots for Developers

84 ore

Categorie relative