Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Schema di formazione dettagliato
- Introduzione all'NLP
- Cos'è l'NLP
- Framework NLP
- Applicazioni commerciali dell'NLP
- Raccolta dati dal web
- Lavoro con varie API per ottenere dati testuali
- Gestione e archiviazione di corpora di testo, salvando contenuti e metadata rilevanti
- Vantaggi dell'utilizzo del corso accelerato Python e NLTK
- Comprensione pratica di un corpus e dataset
- Perché abbiamo bisogno di un corpus?
- Analisi del corpus
- Tipi di attributi dei dati
- Diversi formati di file per i corpora
- Preparazione di un dataset per applicazioni NLP
- Comprensione della struttura delle frasi
- Componenti dell'NLP
- Comprensione del linguaggio naturale
- Analisi morfologica - stema, parola, token, tag di parlata
- Analisi sintattica
- Analisi semantica
- Gestione dell'ambiguità
- Predisposizione dei dati testuali
- Corpus - testo grezzo
- Tokenizzazione delle frasi
- Radicazione per il testo grezzo
- Lemmatizzazione del testo grezzo
- Rimozione delle parole vuote
- Corpus-frasi grezze
- Word tokenizzazione
- Word lemmatizzazione
- Lavoro con matrici Term-Document/Document-Term
- Predisposizione del testo in n-grammi e frasi
- Predisposizione pratica e personalizzata
- Corpus - testo grezzo
- Analisi dei dati testuali
- Caratteristiche di base dell'NLP
- Parser e parsing
- Tagging POS e tagger
- Riconoscimento delle entità nominali
- N-grammi
- Bolsa di parole
- Caratteristiche statistiche dell'NLP
- Concetti di algebra lineare per NLP
- Teoria probabilistica per NLP
- TF-IDF
- Vettorizzazione
- Codificatori e decodificatori
- Normalizzazione
- Moderelli probabilistici
- Ingegneria avanzata delle caratteristiche e NLP
- Nozioni di base del word2vec
- Componenti del modello word2vec
- Logica del modello word2vec
- Espansione del concetto di word2vec
- Applicazione del modello word2vec
- Caso studio: Applicazione della bolsa di parole: riepilogo automatico del testo utilizzando gli algoritmi semplificati e veri di Luhn
- Caratteristiche di base dell'NLP
- Clustering, classificazione dei documenti e modellizzazione tematica
- Clustering e ricerca di pattern nei documenti (clustering gerarchico, k-means, clustering, ecc.)
- Confronto e classificazione dei documenti utilizzando misure TFIDF, Jaccard e distanza coseno
- Classificazione dei documenti utilizzando Naïve Bayes e Massima Entropia
- Rilevamento di testi importanti Element
- Minimizzazione della dimensionalità: Analisi degli Componenti Principali, Decomposizione del Valore Singolare, fattorizzazione matriciale non negativa
- Modellazione tematica e recupero dell'informazione utilizzando l'Analisi Semantica Latente
- Estrazione di entità, Sentiment Analysis e modellazione avanzata dei temi
- Positivo vs negativo: grado di sentimento
- Teoria delle risposte agli item
- Tagging POS e sue applicazioni: trovare persone, luoghi e organizzazioni menzionate nel testo
- Modellazione avanzata dei temi: Allocazione Dirichlet Latente
- Casi di studio
- Scatolamento recensioni utenti non strutturate
- Classificazione e visualizzazione del sentimento sui dati delle recensioni prodotto
- Scatolamento registri di ricerca per pattern d'uso
- Classificazione testuale
- Modellazione tematica
Requisiti
Conoscenza e consapevolezza dei principi dell'NLP e apprezzamento delle applicazioni dell'IA nel mondo degli affari
21 ore
Recensioni (1)
I feel I get the core skills I need to understand how the ROS fits together, and how to structure projects in it.