Struttura del corso
Introduzione
- Definire "Natural Language Processing di livello industriale"
Installazione di spaCy
Componenti spaCy
- Part-of-speech tagger
- Riconoscitore di entità nominate
- Analizzatore di dipendenze
Panoramica delle funzionalità e della sintassi di spaCy
Comprendere la modellazione dello spazio
- Modellazione statistica e previsione
Utilizzo dell'interfaccia della riga di comando (CLI) di SpaCy
- Comandi base
Creazione di una semplice applicazione per prevedere il comportamento
Addestramento di un nuovo modello statistico
- Dati (per l'addestramento)
- Etichette (tag, entità nominate, ecc.)
Caricamento del modello
- Mescolamento e iterazione
Salvataggio del modello
Fornire commenti e suggerimenti al modello
- Gradiente di errore
Aggiornamento del modello
- Aggiornamento del riconoscitore di entità
- Estrazione di token con rule-based matcher
Sviluppo di una teoria generalizzata per i risultati attesi
Caso di studio
- Distinguere i nomi dei prodotti dai nomi delle aziende
Perfezionamento dei dati di training
- Selezione di dati rappresentativi
- Impostazione del dropout rate
Altri stili di allenamento
- Passaggio di testi grezzi
- Passaggio di dizionari di annotazioni
Utilizzo di spaCy per pre-elaborare il testo per Deep Learning
Integrazione di spaCy con le applicazioni legacy
Test e debug del modello spaCy
- L'importanza dell'iterazione
Distribuzione del modello nell'ambiente di produzione
Monitoraggio e regolazione del modello
Risoluzione dei problemi
Riassunto e conclusione
Requisiti
- esperienza di programmazione.
- Una conoscenza di base della statistica
- Esperienza con la riga di comando
Pubblico
- Sviluppatori
- Data scientist
Recensioni (3)
Il fatto di avere più esercizi pratici utilizzando dati più simili a quelli che utilizziamo nei nostri progetti (immagini satellitari in formato raster)
Matthieu - CS Group
Corso - Scaling Data Analysis with Python and Dask
Traduzione automatica
Very good preparation and expertise of a trainer, perfect communication in English. The course was practical (exercises + sharing examples of use cases)
Monika - Procter & Gamble Polska Sp. z o.o.
Corso - Developing APIs with Python and FastAPI
Trainer develops training based on participant's pace