Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Introduzione a AIOps con Strumenti Open Source
- Panoramica dei concetti e dei vantaggi di AIOps
- Prometheus e Grafana nell'infrastruttura di osservabilità
- Dove si colloca l'ML in AIOps: analisi predittiva vs. reattiva
Configurazione di Prometheus e Grafana
- Installazione e configurazione di Prometheus per la raccolta delle serie temporali
- Creazione di dashboard in Grafana utilizzando metriche in tempo reale
- Esplorare gli exporter, il relabeling e la discovery dei servizi
Preprocessing dei Dati per ML
- Estrazione e trasformazione delle metriche di Prometheus
- Preparazione degli insiemi di dati per la rilevazione delle anomalie e le previsioni
- Utilizzo delle trasformazioni in Grafana o pipeline di Python
Applicazione di Machine Learning per la Rilevazione delle Anomalie
- Modelli ML di base per la rilevazione degli outliers (ad esempio, Isolation Forest, One-Class SVM)
- Addestramento e valutazione dei modelli sui dati di serie temporali
- Visualizzazione delle anomalie nei dashboard di Grafana
Metriche con ML per Forecasting
- Costruzione di semplici modelli di previsione (ARIMA, Prophet, introduzione ai LSTM)
- Previsione del carico del sistema o dell'uso delle risorse
- Utilizzo delle previsioni per l'allarme preventivo e le decisioni di scalabilità
Integrazione ML con i Segnalibri Automazione
- Definizione di regole di allarme basate sull'output dell'ML o su soglie
- Utilizzo del Alertmanager e la rotazione delle notifiche
- Attivazione di script o workflow di automazione in caso di rilevazione delle anomalie
Scalabilità ed Operationalizzazione di AIOps
- Integrazione con strumenti di osservabilità esterni (ad esempio, stack ELK, Moogsoft, Dynatrace)
- Operationalizzazione dei modelli ML nelle pipeline di osservabilità
- Best practice per AIOps a larga scala
Riepilogo e Passaggi Successivi
Requisiti
- Una comprensione dei concetti di monitoraggio del sistema e osservabilità
- Esperienza nell'uso di Grafana o Prometheus
- Familiarità con Python e principi di base dell'apprendimento automatico
Destinatari
- Ingegneri di osservabilità
- Team di infrastruttura e DevOps
- Architetti della piattaforma di monitoraggio e ingegneri per la affidabilità del sito (SRE)
14 ore