Struttura del corso

Introduzione a AIOps con Strumenti Open Source

  • Panoramica dei concetti e dei vantaggi di AIOps
  • Prometheus e Grafana nell'infrastruttura di osservabilità
  • Dove si colloca l'ML in AIOps: analisi predittiva vs. reattiva

Configurazione di Prometheus e Grafana

  • Installazione e configurazione di Prometheus per la raccolta delle serie temporali
  • Creazione di dashboard in Grafana utilizzando metriche in tempo reale
  • Esplorare gli exporter, il relabeling e la discovery dei servizi

Preprocessing dei Dati per ML

  • Estrazione e trasformazione delle metriche di Prometheus
  • Preparazione degli insiemi di dati per la rilevazione delle anomalie e le previsioni
  • Utilizzo delle trasformazioni in Grafana o pipeline di Python

Applicazione di Machine Learning per la Rilevazione delle Anomalie

  • Modelli ML di base per la rilevazione degli outliers (ad esempio, Isolation Forest, One-Class SVM)
  • Addestramento e valutazione dei modelli sui dati di serie temporali
  • Visualizzazione delle anomalie nei dashboard di Grafana

Metriche con ML per Forecasting

  • Costruzione di semplici modelli di previsione (ARIMA, Prophet, introduzione ai LSTM)
  • Previsione del carico del sistema o dell'uso delle risorse
  • Utilizzo delle previsioni per l'allarme preventivo e le decisioni di scalabilità

Integrazione ML con i Segnalibri Automazione

  • Definizione di regole di allarme basate sull'output dell'ML o su soglie
  • Utilizzo del Alertmanager e la rotazione delle notifiche
  • Attivazione di script o workflow di automazione in caso di rilevazione delle anomalie

Scalabilità ed Operationalizzazione di AIOps

  • Integrazione con strumenti di osservabilità esterni (ad esempio, stack ELK, Moogsoft, Dynatrace)
  • Operationalizzazione dei modelli ML nelle pipeline di osservabilità
  • Best practice per AIOps a larga scala

Riepilogo e Passaggi Successivi

Requisiti

  • Una comprensione dei concetti di monitoraggio del sistema e osservabilità
  • Esperienza nell'uso di Grafana o Prometheus
  • Familiarità con Python e principi di base dell'apprendimento automatico

Destinatari

  • Ingegneri di osservabilità
  • Team di infrastruttura e DevOps
  • Architetti della piattaforma di monitoraggio e ingegneri per la affidabilità del sito (SRE)
 14 ore

Numero di Partecipanti


Prezzo per partecipante

Corsi in Arrivo

Categorie relative


Fatal error: Uncaught TypeError: _isl_get_excluded_site(): Return value must be of type ?array, none returned in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc:38 Stack trace: #0 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(30): _isl_get_excluded_site() #1 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc(17): isl_get_excluded_site() #2 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(51): get_outline_isls() #3 /apps/hitra7/backdrop/modules/_custom/frontend/islc7/islc7.module(7): islc_prepare_links() #4 /apps/hitra7/npfrontend/nptemplates/default.php(272): islc7_sites_links_array_v3() #5 /apps/hitra7/npfrontend/modules/course/course.php(143): require_once('...') #6 /apps/hitra7/npfrontend/core/routes.php(15): course_menu_callback() #7 /apps/hitra7/npfrontend/__index.php(81): require_once('...') #8 /apps/hitra7/npfrontend/index.php(15): include_once('...') #9 /apps/hitra7/index.php(66): include_once('...') #10 {main} thrown in /apps/hitra7/backdrop/modules/_custom/frontend/islc7/isl_common.inc on line 38