Struttura del corso

Introduzione a AIOps con Strumenti Open Source

  • Panoramica dei concetti e dei vantaggi di AIOps
  • Prometheus e Grafana nell'infrastruttura di osservabilità
  • Dove si colloca l'ML in AIOps: analisi predittiva vs. reattiva

Configurazione di Prometheus e Grafana

  • Installazione e configurazione di Prometheus per la raccolta delle serie temporali
  • Creazione di dashboard in Grafana utilizzando metriche in tempo reale
  • Esplorare gli exporter, il relabeling e la discovery dei servizi

Preprocessing dei Dati per ML

  • Estrazione e trasformazione delle metriche di Prometheus
  • Preparazione degli insiemi di dati per la rilevazione delle anomalie e le previsioni
  • Utilizzo delle trasformazioni in Grafana o pipeline di Python

Applicazione di Machine Learning per la Rilevazione delle Anomalie

  • Modelli ML di base per la rilevazione degli outliers (ad esempio, Isolation Forest, One-Class SVM)
  • Addestramento e valutazione dei modelli sui dati di serie temporali
  • Visualizzazione delle anomalie nei dashboard di Grafana

Metriche con ML per Forecasting

  • Costruzione di semplici modelli di previsione (ARIMA, Prophet, introduzione ai LSTM)
  • Previsione del carico del sistema o dell'uso delle risorse
  • Utilizzo delle previsioni per l'allarme preventivo e le decisioni di scalabilità

Integrazione ML con i Segnalibri Automazione

  • Definizione di regole di allarme basate sull'output dell'ML o su soglie
  • Utilizzo del Alertmanager e la rotazione delle notifiche
  • Attivazione di script o workflow di automazione in caso di rilevazione delle anomalie

Scalabilità ed Operationalizzazione di AIOps

  • Integrazione con strumenti di osservabilità esterni (ad esempio, stack ELK, Moogsoft, Dynatrace)
  • Operationalizzazione dei modelli ML nelle pipeline di osservabilità
  • Best practice per AIOps a larga scala

Riepilogo e Passaggi Successivi

Requisiti

  • Una comprensione dei concetti di monitoraggio del sistema e osservabilità
  • Esperienza nell'uso di Grafana o Prometheus
  • Familiarità con Python e principi di base dell'apprendimento automatico

Destinatari

  • Ingegneri di osservabilità
  • Team di infrastruttura e DevOps
  • Architetti della piattaforma di monitoraggio e ingegneri per la affidabilità del sito (SRE)
 14 ore

Numero di Partecipanti


Prezzo per Partecipante

Corsi in Arrivo

Categorie relative