Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Fondamenti della Classificazione Audio
- Tipi di eventi sonori: ambientali, meccanici, generati da esseri umani
- Panoramica sui casi d'uso: sorveglianza, monitoraggio, automatizzazione
- Classificazione audio vs rilevazione vs segmentazione
Dati Audio e Estrazione delle Caratteristiche
- Tipi di file e formati audio
- Rate di campionamento, finestra temporale, considerazioni sulla dimensione del frame
- Estrazione di MFCCs, caratteristiche cromatografiche, mel-spettrogrammi
Preparazione dei Dati e Annotazione
- UrbanSound8K, ESC-50 e set personalizzati di dati
- Etichettatura degli eventi sonori e dei limiti temporali
- Bilanciamento dei dataset e l'aumento dell'audio
Costruzione di Modelli di Classificazione Audio
- L'utilizzo di reti neurali convolutive (CNN) per l'audio
- Input del modello: onda sonora grezza vs caratteristiche
- Funzioni di perdita, metriche di valutazione e overfitting
Rilevamento degli Eventi e Localizzazione Temporale
- Strategie di rilevazione basate su frame e segmenti
- Eseguire il post-processing delle rilevazioni utilizzando soglie e lisciatura
- Visualizzazione delle previsioni sulle linee temporali dell'audio
Temi Avanzati e Elaborazione in Tempo Reale
- Apprendimento transfer per scenari a basso volume di dati
- Distribuzione dei modelli con TensorFlow Lite o ONNX
- Elaborazione audio in streaming e considerazioni sulla latenza
Sviluppo del Progetto e Scenari di Applicazione
- Progettare una pipeline completa: dal rilevamento alla classificazione
- Sviluppare un concetto pilota per la sorveglianza, il controllo qualità o il monitoraggio
- Registrazione, notifica e integrazione con pannelli di controllo o API
Riepilogo e Passaggi Successivi
Requisiti
- Una comprensione dei concetti di machine learning e della formazione del modello
- Esperienza con la programmazione Python e il preprocessamento dei dati
- Familiarità con i fondamenti dell'audio digitale
Pubblico
- Data scientists
- Ingegneri di machine learning
- Ricercatori e sviluppatori in elaborazione del segnale audio
21 ore