Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Introduzione a AIOps con Strumenti Open Source
- Panoramica dei concetti e dei vantaggi di AIOps
- Prometheus e Grafana nell'infrastruttura di osservabilità
- Dove si colloca l'ML in AIOps: analisi predittiva vs. reattiva
Configurazione di Prometheus e Grafana
- Installazione e configurazione di Prometheus per la raccolta delle serie temporali
- Creazione di dashboard in Grafana utilizzando metriche in tempo reale
- Esplorare gli exporter, il relabeling e la discovery dei servizi
Preprocessing dei Dati per ML
- Estrazione e trasformazione delle metriche di Prometheus
- Preparazione degli insiemi di dati per la rilevazione delle anomalie e le previsioni
- Utilizzo delle trasformazioni in Grafana o pipeline di Python
Applicazione di Machine Learning per la Rilevazione delle Anomalie
- Modelli ML di base per la rilevazione degli outliers (ad esempio, Isolation Forest, One-Class SVM)
- Addestramento e valutazione dei modelli sui dati di serie temporali
- Visualizzazione delle anomalie nei dashboard di Grafana
Metriche con ML per Forecasting
- Costruzione di semplici modelli di previsione (ARIMA, Prophet, introduzione ai LSTM)
- Previsione del carico del sistema o dell'uso delle risorse
- Utilizzo delle previsioni per l'allarme preventivo e le decisioni di scalabilità
Integrazione ML con i Segnalibri Automazione
- Definizione di regole di allarme basate sull'output dell'ML o su soglie
- Utilizzo del Alertmanager e la rotazione delle notifiche
- Attivazione di script o workflow di automazione in caso di rilevazione delle anomalie
Scalabilità ed Operationalizzazione di AIOps
- Integrazione con strumenti di osservabilità esterni (ad esempio, stack ELK, Moogsoft, Dynatrace)
- Operationalizzazione dei modelli ML nelle pipeline di osservabilità
- Best practice per AIOps a larga scala
Riepilogo e Passaggi Successivi
Requisiti
- Una comprensione dei concetti di monitoraggio del sistema e osservabilità
- Esperienza nell'uso di Grafana o Prometheus
- Familiarità con Python e principi di base dell'apprendimento automatico
Destinatari
- Ingegneri di osservabilità
- Team di infrastruttura e DevOps
- Architetti della piattaforma di monitoraggio e ingegneri per la affidabilità del sito (SRE)
14 ore