Programma Didattico
Master 2021-2023 in "Genomic Data Science"
Il Master in “Genomic Data Science” si sviluppa in 10 moduli (5+5), per un totale biennale di 3000 ore, ognuno svolto in una settimana (lunedì-venerdì dalle ore 9.30-12.30 e 14.30-17.00) da Febbraio ad Ottobre, suddivise tra didattica frontale, esercitazioni pratiche, stage formativo presso Università di Pavia ed enti convenzionati, seminari presso il Dipartimento di Scienze del Sistema Nervoso e del Comportamento, attività di studio e preparazione individuale. La frequenza è obbligatoria per almeno il 75% delle lezioni.
La valutazione dell’apprendimento verrà effettuata sulla base di verifiche del profitto per ogni anno e di una prova finale di accertamento delle competenze complessivamente acquisite. La prova finale consisterà nella discussione di una tesi sperimentale o trattazione di un tema di rilevante interesse relativa al progetto svolto durante il tirocinio. A conclusione del Master, agli studenti verrà rilasciato il Diploma di Master universitario di II livello in “Genomic Data Science”.
Obiettivo del Master
Lo scopo del Master, unico in Italia, è di provvedere alla formazione completa dello Statistico medico-genomico, figura professionale della quale gli istituti di ricerca, in ambito pubblico o privato, fanno sempre più pressante richiesta dato sia per il crescente fabbisogno di progettazione, analisi e valutazione di sperimentazioni cliniche, sia per il continuo aumento e la veloce diffusione degli studi genomici.
Il programma didattico è strutturato nei seguenti moduli:
I ANNO
INSEGNAMENTO/MODULO | DOCENTI | CONTENUTI |
A1) Statistica con R | Davide Gentilini | 1) L’ambiente di programmazione R 2) Data import e data mining con R 3) Visualizzazione grafica dei dati con R 4) Inferenza statistica con R |
B1) Modelli di Regressione | Mario Comelli | 1) Regressione lineare 2) Regressione logistica 3) Modelli lineari misti 4) Analisi di sopravvivenza |
C1) Metodi di Ricampionamento | Alessandra Retico | 1) Permutazione e randomizzazione 2) Simulazione Monte Carlo 3) Ricampionamento e bootstrap 4) P-values empirici e FDR |
D1) Epidemiologia genetica | Luisa Bernardinelli Davide Gentilini Teresa Fazia Andrea Nova | 1) Disegno di studi sperimentale e studi osservazionali 2) Disegno ed analisi di studi di linkage parametrico e non parametrico 3) Disegno ed analisi di studi di associazione familiare 4) Disegno ed analisi di studi di associazione di popolazione |
E1) Statistica genetica | Luisa Bernardinelli Davide Gentilini Teresa Fazia | 1) Disegno e analisi genome-wide(GW) 2) Pre-processing, controllo di qualità, imputazione e analisi statistica GW 3) Analisi GW di dati di metilazione 4) Analisi GW di dati di espressione |
II ANNO
INSEGNAMENTO/MODULO | DOCENTI | CONTENUTI |
A2) Gestione e analisi dei BIG DATA | Luigi Corsaro | 1) Ambiente di lavoro Cloud e calcolo parallelo 2) Tools di lavoro (Databases SQL e NoSQL) 3) Esplorazione delle librerie di Python 4) Casi di studio |
B2) Bioinformatica applicata alla genetica | Davide Gentilini | 1) Next generation sequencing (NGS) 2) DNA sequencing and variant calling 3) Metodi per analisi di associazione con varianti rare 4) RNA sequencing e differential expression analysis (limma) |
C2) Statistica Genomica | Saveria Mazzara | 1) PCA e Clustering 2) Supervised learning methods: SVM,RF 3) ROC curves 4) RNASeq: from fastq to downstream analysis |
D2) POST-GWAS | Giovanni Cugliari | 1) Polygenic risk score e validazione incrociata (cross-validation) 2) Metanalisi di studi GWA 3) Randomizzazione Mendeliana 4) Metodi per l’integrazione di dati omics |
E2) Machine Learning (ML) | Emanuele Fabbiani | 1) Introduzione a ML 2) Unsupervised Learning 3) Supervised Learning 4) Deep Learning in ambito genomico |
Scarica Bando Master