Thank you for sending your enquiry! One of our team members will contact you shortly.
Thank you for sending your booking! One of our team members will contact you shortly.
Struttura del corso
Introduzione a AIOps
- Cosa è AIOps e perché è importante
- Monitoraggio tradizionale vs. osservabilità guidata da AIOps
- Architettura di AIOps e componenti chiave
Raccogliere e Normalizzare i Dati Operativi
- Tipologie di dati di osservabilità: metriche, log e tracce
- Ingestione dei dati da sorgenti multiple (server, contenitori, cloud)
- Utilizzo di agenti ed exporter (Prometheus, Beats, Fluentd)
Correlazione e Rilevamento delle Anomalie dei Dati
- Correlazione delle serie temporali e metodi statistici
- Utilizzo di modelli ML per il rilevamento delle anomalie
- Rilevamento degli incidenti in sistemi distribuiti
Notifiche e Riduzione del Rumore
- Progettazione di regole intelligenti delle notifiche e soglie
- Suppressione, deduplicazione e raggruppamento delle notifiche
- Integrazione con Alertmanager, Slack, PagerDuty o Opsgenie
Analisi della Causa Radice e Visualizzazione
- Utilizzo di dashboard per visualizzare le metriche e rilevare tendenze
- Esplorazione degli eventi e dei tempi per l'analisi della causa radice (RCA)
- Tracciamento delle problematiche attraverso strati con strumenti di traccia distribuita
Automazione e Rimozione degli Anomali
- Attivare script o workflow automatizzati dagli incidenti
- Integrazione con sistemi ITSM (ServiceNow, Jira)
- Casistiche: auto-riparazione, scalabilità e ridirezionamento del traffico
Piattaforme Open Source e Commerciali per AIOps
- Panoramica degli strumenti: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criteri di valutazione per selezionare una piattaforma AIOps
- Demo e pratica con un insieme di strumenti selezionato
Riepilogo ed Esecuzione dei Passaggi Successivi
Requisiti
- Comprendere i concetti delle operazioni IT e del monitoraggio dei sistemi
- Esperienza con strumenti o dashboard di monitoraggio
- Familiarità con formati base di log e metriche
Destinatari
- Team operativi responsabili dell'infrastruttura e delle applicazioni
- Site Reliability Engineers (SREs)
- Team di monitoraggio IT e osservabilità
14 ore