Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Fondamenti della Classificazione Audio
- Tipi di eventi sonori: ambientali, meccanici, generati da esseri umani
- Panoramica sui casi d'uso: sorveglianza, monitoraggio, automatizzazione
- Classificazione audio vs rilevazione vs segmentazione
Dati Audio e Estrazione delle Caratteristiche
- Tipi di file e formati audio
- Rate di campionamento, finestra temporale, considerazioni sulla dimensione del frame
- Estrazione di MFCCs, caratteristiche cromatografiche, mel-spettrogrammi
Preparazione dei Dati e Annotazione
- UrbanSound8K, ESC-50 e set personalizzati di dati
- Etichettatura degli eventi sonori e dei limiti temporali
- Bilanciamento dei dataset e l'aumento dell'audio
Costruzione di Modelli di Classificazione Audio
- L'utilizzo di reti neurali convolutive (CNN) per l'audio
- Input del modello: onda sonora grezza vs caratteristiche
- Funzioni di perdita, metriche di valutazione e overfitting
Rilevamento degli Eventi e Localizzazione Temporale
- Strategie di rilevazione basate su frame e segmenti
- Eseguire il post-processing delle rilevazioni utilizzando soglie e lisciatura
- Visualizzazione delle previsioni sulle linee temporali dell'audio
Temi Avanzati e Elaborazione in Tempo Reale
- Apprendimento transfer per scenari a basso volume di dati
- Distribuzione dei modelli con TensorFlow Lite o ONNX
- Elaborazione audio in streaming e considerazioni sulla latenza
Sviluppo del Progetto e Scenari di Applicazione
- Progettare una pipeline completa: dal rilevamento alla classificazione
- Sviluppare un concetto pilota per la sorveglianza, il controllo qualità o il monitoraggio
- Registrazione, notifica e integrazione con pannelli di controllo o API
Riepilogo e Passaggi Successivi
Requisiti
- Una comprensione dei concetti di machine learning e della formazione del modello
- Esperienza con la programmazione Python e il preprocessamento dei dati
- Familiarità con i fondamenti dell'audio digitale
Pubblico
- Data scientists
- Ingegneri di machine learning
- Ricercatori e sviluppatori in elaborazione del segnale audio
21 ore