Contattataci

Struttura del corso

Introduzione ad AlphaFold e il suo impatto sulla ricerca biologica

  • Evoluzione della previsione della struttura proteica: dalla modellazione per omologia ai progressi del deep learning
  • Il ruolo di AlphaFold nell'accelerare la biologia strutturale, la scoperta di farmaci e l'annotazione funzionale
  • Definizione delle aspettative: capacità, limitazioni e punti di integrazione sperimentale
  • Esercitazione pratica: Esplorazione dell'interfaccia del Database delle Strutture Proteiche AlphaFold (AFDB) ed esecuzione delle prime ricerche di sequenza

Come funziona AlphaFold? Architettura e componenti principali

  • Architettura delle reti neurali: Evoformer, modulo di struttura e modellazione delle sequenze basata sull'attenzione
  • Generazione dell'allineamento multiplo di sequenze (MSA) e corrispondenza dei template (PDB, UniRef, BFD)
  • Metriche di confidenza: spiegazione del pLDDT (confidenza per residuo) e del PAE (errore allineato previsto)
  • Esercitazione pratica: Mappatura delle fasi del flusso di lavoro di AlphaFold utilizzando una sequenza proteica di esempio e tracciando gli input MSA/template

Accesso ad AlphaFold: piattaforme, notebook e distribuzione

  • Opzioni ufficiali di distribuzione: AlphaFold DB, API pubblica, notebook Colab e ambienti locali/GPU
  • Configurazione di un ambiente Colab riproducibile: installazione delle dipendenze, assegnazione della GPU e formattazione degli input
  • Preparazione delle sequenze proteiche: struttura FASTA, gestione delle catene e considerazioni per le proteine multi-dominio
  • Lab pratico: Distribuzione del notebook ufficiale AlphaFold su Colab, caricamento di un file FASTA personalizzato ed avvio della prima esecuzione di previsione

AlphaFold Protein Structure Database e risorse pubbliche

  • Navigazione in AFDB: copertura degli organismi, qualità delle strutture, formati di download (PDB/mmCIF, file non rilassati/pLDDt)
  • Incrocio dei dati tra AFDB e database come UniProt, PDB e database funzionali (GO, KEGG, CATH)
  • Gestione di dataset su larga scala: limiti per le previsioni in batch, linee guida per le citazioni e licenze dei dati
  • Esercitazione pratica: Estrazione di modelli AFDB ad alta confidenza per un pathway target e preparazione dei file per l'analisi successiva

Interpretazione delle previsioni di AlphaFold e delle metriche di confidenza

  • Lettura delle mappe termiche pLDDT: identificazione dei nuclei strutturati, regioni disordinate e domini a bassa confidenza
  • Decodifica delle matrici PAE: rilevamento dei confini di dominio, interazioni intra/inter-catena e regioni potenzialmente mal ripiegate
  • Quando le previsioni sono affidabili: copertura della sequenza, profondità evolutiva e omologi strutturali noti
  • Esercitazione pratica: Valutazione degli output pLDDT/PAE per una proteina multi-dominio, segnalazione delle regioni a bassa confidenza e pianificazione degli obiettivi di mutagenesi/validazione

Codice open source di AlphaFold e percorsi di personalizzazione

  • Struttura del repository: moduli core, pipeline dei dati e file di configurazione
  • Modifica degli input: MSA personalizzati, override dei template e aggiustamenti delle soglie di confidenza
  • Ottimizzazione delle prestazioni: riduzione del tempo di esecuzione, gestione della memoria e salvataggio dei checkpoint
  • Lab pratico: Esecuzione di una pipeline AlphaFold modificata in Colab con un vincolo di template personalizzato ed esportazione dei file PDB raffinati

Casi d'uso di AlphaFold nella ricerca biologica e integrazione sperimentale

  • Orientamento della mutagenesi, della cristallizzazione e della pianificazione delle griglie per la crio-EM utilizzando i modelli previsti
  • annotazione funzionale: mappaggio dei siti attivi, preparazione per il docking dei ligandi e previsione delle interfacce
  • Limitazioni e verifica: quando fidarsi delle previsioni, quando validare sperimentalmente e errori comuni
  • Workshop: Progettazione di un flusso di lavoro di validazione sperimentale per una struttura prevista e mappatura degli output dell'AI sugli assaggi in laboratorio (wet-lab)

Riepilogo, applicazione finale e prossimi passi

  • Consolidamento dei concetti chiave: architettura, interpretazione e distribuzione pratica
  • Progetto finale (Capstone): I partecipanti selezionano una proteina di interesse, eseguentro/recuperano una previsione, interpretano le metriche di confidenza e delineano un piano di applicazione di ricerca
  • Q&A aperto, risoluzione degli errori comuni e distribuzione delle risorse
  • Prossimi passi: integrazione avanzata di AlphaFold3, RoseTTAFold, trRosetta e strumenti della comunità in evoluzione

Requisiti

  • Conoscenza e comprensione delle strutture proteiche
  • Si raccomanda familiarità con i concetti base di biologia molecolare (sequenze di amminoacidi, principi di ripiegamento, formati PDB/mmCIF)
  • Confidenza nell'uso di notebook basati su web e nell'esecuzione di celle di codice nel browser

Pubblico target

  • Biologi, ricercatori molecolari e investigatori di biologia strutturale
  • Scienziati sperimentali che cercano previsioni computazionali della struttura per guidare i flussi di lavoro in laboratorio (wet-lab)
  • Professionisti delle scienze della vita che integrano la modellazione basata sull'AI nella generazione di ipotesi e nel disegno sperimentale
 7 ore

Numero di Partecipanti


Prezzo per partecipante

Corsi in Arrivo

Categorie relative