Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Programma dettagliato del corso
- Introduzione al NLP
- Comprensione del NLP
- Framework del NLP
- Applicazioni commerciali del NLP
- Scraping di dati dal web
- Utilizzo di varie API per recuperare dati testuali
- Gestione e archiviazione di corpora testuali, salvando il contenuto e i metadati rilevanti
- Vantaggi dell'uso di Python e corso accelerato su NLTK
- Comprensione pratica di un Corpus e di un Dataset
- Perché abbiamo bisogno di un corpus?
- Analisi del corpus
- Tipi di attributi dei dati
- Diversi formati di file per i corpora
- Preparazione di un dataset per applicazioni NLP
- Comprensione della Struttura delle Frasi
- Componenti del NLP
- Comprensione del linguaggio naturale
- Analisi morfologica - radice, parola, token, etichette grammaticali
- Analisi sintattica
- Analisi semantica
- Gestione dell'ambiguità
- Pre-elaborazione dei dati testuali
- Corpus - testo grezzo
- Tokenizzazione delle frasi
- Stemming per testo grezzo
- Lemmatizzazione del testo grezzo
- Rimozione delle stop word
- Corpus - frasi grezze
- Tokenizzazione delle parole
- Lemmatizzazione delle parole
- Lavorare con matrici Termine-Documento/Documento-Termine
- Tokenizzazione del testo in n-grammi e frasi
- Pre-elaborazione pratica e personalizzata
- Corpus - testo grezzo
- Analisi dei Dati Testuali
- Caratteristiche di base del NLP
- Parser e parsing
- Tagging POS e tagger
- Riconoscimento di entità nominate
- N-grammi
- Bag of words
- Caratteristiche statistiche del NLP
- Concetti di algebra lineare per il NLP
- Teoria probabilistica per il NLP
- TF-IDF
- Vettorizzazione
- Encoder e Decoder
- Normalizzazione
- Modelli probabilistici
- Ingegneria avanzata delle caratteristiche e NLP
- Introduzione a word2vec
- Componenti del modello word2vec
- Logica del modello word2vec
- Estensione del concetto di word2vec
- Applicazione del modello word2vec
- Studio di caso: Applicazione del bag of words: riassunzione automatica del testo utilizzando gli algoritmi semplificati e veri di Luhn
- Caratteristiche di base del NLP
- Clustering di Documenti, Classificazione e Modellazione Tematica
- Clustering di documenti e mining di pattern (clustering gerarchico, k-means, clustering, ecc.)
- Confronto e classificazione di documenti utilizzando misure di distanza TFIDF, Jaccard e coseno
- Classificazione dei documenti utilizzando Naïve Bayes e Massima Entropia
- Identificazione di Elementi Testuali Importanti
- Riduzione della dimensionalità: Analisi delle Componenti Principali, Scomposizione ai Valori Singoli, fattorizzazione non negativa della matrice
- Modellazione tematica e recupero di informazioni tramite Analisi Semantica Latente
- Estrazione di Entità, Analisi del Sentiment e Modellazione Tematica Avanzata
- Positivo vs negativo: grado del sentiment
- Teoria della risposta agli items
- Tagging POS e sue applicazioni: individuazione di persone, luoghi e organizzazioni menzionati nel testo
- Modellazione tematica avanzata: Allocazione Dirichlet Latente
- Studi di caso
- Analisi dei recensioni non strutturate degli utenti
- Classificazione del sentiment e visualizzazione dei dati delle recensioni di prodotto
- Analisi dei log di ricerca per modelli di utilizzo
- Classificazione del testo
- Modellazione tematica
Requisiti
Conoscenza e consapevolezza dei principi del NLP e apprezzamento dell'applicazione dell'IA in ambito aziendale
21 ore
Recensioni (1)
Supporto individuale
Simon the 2nd - Cboost
Corso - ROS: Programming for Robotics
Traduzione automatica