Struttura del corso

Fondamenti della Classificazione Audio

  • Tipi di eventi sonori: ambientali, meccanici, generati da esseri umani
  • Panoramica sui casi d'uso: sorveglianza, monitoraggio, automatizzazione
  • Classificazione audio vs rilevazione vs segmentazione

Dati Audio e Estrazione delle Caratteristiche

  • Tipi di file e formati audio
  • Rate di campionamento, finestra temporale, considerazioni sulla dimensione del frame
  • Estrazione di MFCCs, caratteristiche cromatografiche, mel-spettrogrammi

Preparazione dei Dati e Annotazione

  • UrbanSound8K, ESC-50 e set personalizzati di dati
  • Etichettatura degli eventi sonori e dei limiti temporali
  • Bilanciamento dei dataset e l'aumento dell'audio

Costruzione di Modelli di Classificazione Audio

  • L'utilizzo di reti neurali convolutive (CNN) per l'audio
  • Input del modello: onda sonora grezza vs caratteristiche
  • Funzioni di perdita, metriche di valutazione e overfitting

Rilevamento degli Eventi e Localizzazione Temporale

  • Strategie di rilevazione basate su frame e segmenti
  • Eseguire il post-processing delle rilevazioni utilizzando soglie e lisciatura
  • Visualizzazione delle previsioni sulle linee temporali dell'audio

Temi Avanzati e Elaborazione in Tempo Reale

  • Apprendimento transfer per scenari a basso volume di dati
  • Distribuzione dei modelli con TensorFlow Lite o ONNX
  • Elaborazione audio in streaming e considerazioni sulla latenza

Sviluppo del Progetto e Scenari di Applicazione

  • Progettare una pipeline completa: dal rilevamento alla classificazione
  • Sviluppare un concetto pilota per la sorveglianza, il controllo qualità o il monitoraggio
  • Registrazione, notifica e integrazione con pannelli di controllo o API

Riepilogo e Passaggi Successivi

Requisiti

  • Una comprensione dei concetti di machine learning e della formazione del modello
  • Esperienza con la programmazione Python e il preprocessamento dei dati
  • Familiarità con i fondamenti dell'audio digitale

Pubblico

  • Data scientists
  • Ingegneri di machine learning
  • Ricercatori e sviluppatori in elaborazione del segnale audio
 21 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative