Grazie per aver inviato la tua richiesta! Uno dei nostri team membri ti contatterà a breve.
Grazie per aver inviato il tuo prenotazione! Uno dei nostri team membri ti contatterà a breve.
Struttura del corso
Introduzione all'AIOps
- Cos'è l'AIOps e perché è importante
- Monitoraggio tradizionale vs. osservabilità guidata da AIOps
- Architettura AIOps e componenti chiave
Raccolta e Normalizzazione dei Dati Operativi
- Tipi di dati per l'osservabilità: metriche, log e tracce
- Ingesta di dati da sorgenti multiple (server, container, cloud)
- Utilizzo di agenti ed exporter (Prometheus, Beats, Fluentd)
Correlazione dei Dati e Rilevamento delle Anomalie
- Correlazione di serie temporali e metodi statistici
- Utilizzo di modelli ML per il rilevamento delle anomalie
- Rilevamento degli incidenti in sistemi distribuiti
Avvisi e Riduzione del Rumore
- Progettazione di regole e soglie di avviso intelligenti
- Soppressione, deduplicazione e raggruppamento degli avvisi
- Integrazione con Alertmanager, Slack, PagerDuty o Opsgenie
Analisi delle Cause Radicate e Visualizzazione
- Utilizzo di dashboard per visualizzare metriche e rilevare tendenze
- Esplorazione degli eventi e delle linee temporali per l'analisi delle cause radicate (RCA)
- Tracciamento di problemi attraverso i livelli con strumenti di tracciamento distribuito
Automazione e Remediation
- Attivazione di script o flussi di lavoro automatizzati da incidenti
- Integrazione con sistemi ITSM (ServiceNow, Jira)
- Casistiche: autoguarigione, scalabilità, rerouting del traffico
Piattaforme AIOps Open Source e Commerciali
- Panoramica degli strumenti: Prometheus, Grafana, ELK, Moogsoft, Dynatrace
- Criteri di valutazione per la selezione di una piattaforma AIOps
- Demo e pratica con un stack selezionato
Riepilogo e Prossimi Passi
Requisiti
- Una comprensione delle operazioni IT e dei concetti di monitoraggio del sistema
- Esperienza con strumenti di monitoraggio o dashboard
- Familiarità con formati log e metriche di base
Pubblico Obiettivo
- Team operativi responsabili dell'infrastruttura e delle applicazioni
- Ingegneri di Affidabilità del Sito (SREs)
- Team di monitoraggio IT e osservabilità
14 ore