Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Introduzione a AIOps
- Cosa è AIOps e perché è importante
- Monitoraggio tradizionale vs. osservabilità guidata da AIOps
- Architettura di AIOps e componenti chiave
Raccogliere e Normalizzare i Dati Operativi
- Tipologie di dati di osservabilità: metriche, log e tracce
- Ingestione dei dati da sorgenti multiple (server, contenitori, cloud)
- Utilizzo di agenti ed exporter (Prometheus, Beats, Fluentd)
Correlazione e Rilevamento delle Anomalie dei Dati
- Correlazione delle serie temporali e metodi statistici
- Utilizzo di modelli ML per il rilevamento delle anomalie
- Rilevamento degli incidenti in sistemi distribuiti
Notifiche e Riduzione del Rumore
- Progettazione di regole intelligenti delle notifiche e soglie
- Suppressione, deduplicazione e raggruppamento delle notifiche
- Integrazione con Alertmanager, Slack, PagerDuty o Opsgenie
Analisi della Causa Radice e Visualizzazione
- Utilizzo di dashboard per visualizzare le metriche e rilevare tendenze
- Esplorazione degli eventi e dei tempi per l'analisi della causa radice (RCA)
- Tracciamento delle problematiche attraverso strati con strumenti di traccia distribuita
Automazione e Rimozione degli Anomali
- Attivare script o workflow automatizzati dagli incidenti
- Integrazione con sistemi ITSM (ServiceNow, Jira)
- Casistiche: auto-riparazione, scalabilità e ridirezionamento del traffico
Piattaforme Open Source e Commerciali per AIOps
- Panoramica degli strumenti: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criteri di valutazione per selezionare una piattaforma AIOps
- Demo e pratica con un insieme di strumenti selezionato
Riepilogo ed Esecuzione dei Passaggi Successivi
Requisiti
- Comprendere i concetti delle operazioni IT e del monitoraggio dei sistemi
- Esperienza con strumenti o dashboard di monitoraggio
- Familiarità con formati base di log e metriche
Destinatari
- Team operativi responsabili dell'infrastruttura e delle applicazioni
- Site Reliability Engineers (SREs)
- Team di monitoraggio IT e osservabilità
14 ore