Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Introduzione a AIOps
- Cosa è AIOps e perché è importante
- Monitoraggio tradizionale vs. osservabilità guidata da AIOps
- Architettura di AIOps e componenti chiave
Raccolta e Normalizzazione dei Dati Operativi
- Tipi di dati di osservabilità: metriche, log e tracce
- Ingestione di dati da varie fonti (server, contenitori, cloud)
- Utilizzo degli agenti ed exporter (Prometheus, Beats, Fluentd)
Correlazione dei Dati e Rilevamento delle Anomalie
- Correlazione delle serie temporali e metodi statistici
- Utilizzo di modelli ML per il rilevamento delle anomalie
- Rilevamento degli incidenti in sistemi distribuiti
Allarme e Riduzione del Rumore
- Disegnare regole intelligenti di allarme e soglie
- Suppressione, deduplicazione e raggruppamento degli avvisi
- Integrazione con Alertmanager, Slack, PagerDuty o Opsgenie
Analisi delle Cause Radici e Visualizzazione
- Utilizzo di dashboard per visualizzare le metriche e rilevare tendenze
- Esplicitazione degli eventi e dei cronologi per l'analisi delle cause radice (RCA)
- Percorsi tracciati attraverso i livelli con strumenti di tracing distribuito
Automazione e Rimedi
- Attivazione di script o workflow automatizzati dagli incidenti
- Integrazione con sistemi ITSM (ServiceNow, Jira)
- Casi d'uso: auto-healing, scaling, rerouting del traffico
Piattaforme Open Source e Commerciali per AIOps
- Panoramica degli strumenti: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criteri di valutazione per la scelta di una piattaforma AIOps
- Demo e pratica con un'infrastruttura selezionata
Riepilogo e Passaggi Successivi
Requisiti
- Una comprensione dei concetti di operazioni IT e monitoraggio del sistema
- Esperienza con strumenti o dashboard di monitoraggio
- Familiarità con formati di base di log e metriche
Pubblico
- Squadre operative responsabili dell'infrastruttura e delle applicazioni
- Site Reliability Engineers (SRE)
- Squadre di monitoraggio IT e osservabilità
14 ore