Programma Didattico
Master 2023-2025 in "Genomic Data Science"
Il Master in “Genomic Data Science” si sviluppa in 10 moduli (5+5), per un totale biennale di 3000 ore, ognuno svolto in una settimana (lunedì-venerdì dalle ore 9.30-12.30 e 14.30-17.00) da Febbraio ad Ottobre, suddivise tra didattica frontale, esercitazioni pratiche, stage formativo presso Università di Pavia ed enti convenzionati, seminari presso il Dipartimento di Scienze del Sistema Nervoso e del Comportamento, attività di studio e preparazione individuale. La frequenza è obbligatoria per almeno il 75% delle lezioni.
La valutazione dell’apprendimento verrà effettuata sulla base di verifiche delle conoscenze acquisite ogni anno e di una prova finale. La prova finale consisterà nella discussione di una tesi sperimentale o trattazione di un tema di rilevante interesse relativo al progetto svolto durante il tirocinio. A conclusione del Master, agli studenti verrà rilasciato il Diploma di Master universitario di II livello in “Genomic Data Science”.
Obiettivo del Master
Lo scopo del Master, unico in Italia, è di provvedere alla formazione completa dello Statistico medico-genomico, figura professionale della quale gli istituti di ricerca, in ambito pubblico o privato, fanno sempre più pressante richiesta dato sia per il crescente fabbisogno di progettazione, analisi e valutazione di sperimentazioni cliniche, sia per il continuo aumento e la veloce diffusione degli studi genomici.
Il programma didattico è strutturato nei seguenti moduli:
I ANNO
INSEGNAMENTO/MODULO | DOCENTI | CONTENUTI |
A1) Statistica con R | Davide Gentilini | 1) L’ambiente di programmazione R 2) Data import e data mining con R 3) Visualizzazione grafica dei dati con R 4) Inferenza statistica con R |
B1) Modelli di Regressione | Andrea Nova | 1) Regressione lineare 2) Regressione logistica 3) Modelli lineari misti 4) Analisi di sopravvivenza |
C1) Metodi di Ricampionamento | Mario Grassi | 1) Permutazione e randomizzazione 2) Simulazione Monte Carlo 3) Ricampionamento e bootstrap 4) P-values empirici e FDR |
D1) Epidemiologia genetica | Luisa Bernardinelli Davide Gentilini Teresa Fazia Andrea Nova | 1) Disegno di studi sperimentale e studi osservazionali 2) Disegno ed analisi di studi di linkage parametrico e non parametrico 3) Disegno ed analisi di studi di associazione di popolazione e familiare 4) Analisi dell’ereditabilità |
E1) Statistica genetica | Luisa Bernardinelli Davide Gentilini Teresa Fazia | 1) Disegno e analisi genome-wide(GW) 2) Pre-processing, controllo di qualità, imputazione e analisi statistica GW 3) Analisi GW di dati di metilazione 4) Analisi GW di dati di espressione |
II ANNO
INSEGNAMENTO/MODULO | DOCENTI | CONTENUTI |
A2) Gestione e analisi dei BIG DATA | Anna Sandionigi | 1) Introduzione a Unix e basici concetti di ingegneria dei dati; 2) Gestire l’installazione del software: Introduzione a Conda e Docker 3) Gestire dati biologici e metadati con Python 4) Fonti dei dati e tipi di dati in biologia |
B2) Bioinformatica applicata alla genetica | Davide Gentilini | 1) Next generation sequencing (NGS) 2) DNA sequencing e variant calling 3) Metodi per analisi di associazione con varianti rare 4) RNA sequencing e differential expression analysis (limma) |
C2) Statistica Genomica | Saveria Mazzara | 1) Analisi delle componenti principali (PCA) e Clustering 2) Support Vector Machine (SVM) e Random Forest (RF) 3) Curve ROC 4) RNASeq: da fastq a analisi downstream |
D2) POST-GWAS | Cugliari Giovanni Teresa Fazia | 1) Polygenic risk score e validazione incrociata (cross-validation) 2) Metanalisi di studi Genome-Wide (GWA) 3) Randomizzazione Mendeliana 4) Metodi per l’integrazione di dati omics |
E2) Machine Learning (ML) | Mario Grassi | 1) Introduzione a ML 2) Unsupervised Learning 3) Supervised Learning 4) Deep Learning in ambito genomico |
Scarica Bando Master