Struttura del corso

I. Introduzione e preliminari

1. Panoramica

  • Rendere R più amichevole, R e le GUI disponibili
  • Rstudio
  • Software e documentazione correlati
  • R e statistiche
  • Uso interattivo di R
  • Una sessione introduttiva
  • Ottenere assistenza per funzioni e caratteristiche
  • Comandi R, distinzione tra maiuscole e minuscole, ecc.
  • Richiamo e correzione dei comandi precedenti
  • Esecuzione di comandi da o deviazione dell'output su un file
  • Permanenza dei dati e rimozione di oggetti
  • Good pratica di programmazione: script autonomi, buona leggibilità, ad esempio script strutturati, documentazione, markdown
  • installazione di pacchetti; CRAN e Bioconduttore

2. Lettura dei dati

  • File Txt (read.delim)
  • File CSV

3. Semplici manipolazioni; Numeri e vettori + matrici

  • Vettori e assegnazione
  • Aritmetica vettoriale
  • Generazione di sequenze regolari
  • Vettori logici
  • Valori mancanti
  • Vettori di personaggi
  • Vettori indice; Selezione e modifica di sottoinsiemi di un set di dati
    • Matrici
  • Indicizzazione delle matrici. Sottosezioni di un array
  • Matrici indice
  • La funzione array() + semplici operazioni sugli array, ad esempio moltiplicazione, trasposizione
  • Altri tipi di oggetti

4. Elenchi e frame di dati

  • Lizza
  • Costruzione e modifica di elenchi
    • Concatenazione di elenchi
  • Fotogrammi di dati
    • Creazione di frame di dati
    • Utilizzo dei frame di dati
    • Allegare elenchi arbitrari
    • Gestione del percorso di ricerca

5. Manipolazione dei dati

  • Selezione, sottoinsiemi di osservazioni e variabili
  • Filtraggio, raggruppamento
  • Ricodifica, trasformazioni
  • Aggregazione, combinazione di set di dati
  • Formazione di matrici partizionate, cbind() e rbind()
  • La funzione di concatenazione, (), con array
  • Manipolazione dei caratteri, pacchetto stringr
  • Breve introduzione a Grep e Regexpr

6. Ulteriori informazioni sulla lettura dei dati

  • File XLS, XLSX
  • Pacchetti readr e readXL
  • SPSS, SAS, Stata,... e altri formati di dati
  • Esportazione dei dati in txt, csv e altri formati

6. Raggruppamento, cicli ed esecuzione condizionale

  • Espressioni raggruppate
  • Istruzioni di controllo
  • Esecuzione condizionale: istruzioni if
  • Esecuzione ripetitiva: cicli for, repeat e while
  • Introduzione a Apply, Lapply, Sapply, Tapply

7. Funzioni

  • Creazione di funzioni
  • Argomenti facoltativi e valori predefiniti
  • Numero variabile di argomenti
  • Ambito di applicazione e sue conseguenze

8. Grafica semplice in R

  • Creazione di un grafico
  • Grafici di densità
  • Grafici a punti
  • Terreni Bar
  • Grafici a linee
  • Grafici a torta
  • Boxplot
  • Grafici Scatter
  • Combinazione di grafici

II. Analisi statistica in R

1. Distribuzioni di probabilità

  • R come insieme di tabelle statistiche
  • Esame della distribuzione di un set di dati

2. Verifica delle ipotesi

  • Test su una media della popolazione
  • Test del rapporto di verosimiglianza
  • Test a uno e due campioni
  • Chi-Quadrato GoTest di Odness-of-Fit
  • Statistica di un campione di Kolmogorov-Smirnov
  • Test di rango firmato Wilcoxon
  • Test a due campioni
  • Test della somma dei ranghi di Wilcoxon
  • Mann-Whitney Test
  • Kolmogorov-Smirnov Test

3. Verifica multipla delle ipotesi

  • Errore di tipo I e FDR
  • Curve ROC e AUC
  • Procedure di test multiple (BH, Bonferroni ecc.)

4. Modelli di regressione lineare

  • Funzioni generiche per l'estrazione delle informazioni sul modello
  • Aggiornamento dei modelli montati
  • Modelli lineari generalizzati
    • Famiglie
    • La funzione glm()
  • Classificazione
    • Regressione logistica
    • Analisi discriminante lineare
  • Apprendimento non supervisionato
    • Analisi dei componenti principali
    • Metodi di clustering (k-means, clustering gerarchico, k-medoids)

5. Analisi di sopravvivenza (pacchetto di sopravvivenza)

  • Oggetti di sopravvivenza in r
  • Stima di Kaplan-Meier, test log-rank, regressione parametrica
  • Bande di confidenza
  • Analisi dei dati censurati (interval censored)
  • Modelli di Cox PH, covariate costanti
  • Modelli di Cox PH, covariate tempo-dipendenti
  • Simulazione: Confronto tra modelli (Confronto di modelli di regressione)

6. Analisi della varianza

  • ANOVA unidirezionale
  • Classificazione a due vie dell'ANOVA
  • MANOVA

III. Problemi lavorati in bioinformatica

  • Breve introduzione al pacchetto limma
  • Flusso di lavoro per l'analisi dei dati dei microarray
  • Download dati da GEO: https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Elaborazione dei dati (CQ, normalizzazione, espressione differenziale)
  • Trama del vulcano
  • Esempi di Custering + mappe di calore
 28 ore

Numero di Partecipanti


Prezzo per Partecipante

Recensioni (5)

Corsi in Arrivo

Categorie relative