Master in "Genomic Data Science"
Anno accademico 2024-2026
Il Master universitario biennale di II livello in “Genomic Data Science” unisce l’ampia fruibilità ad un avanzato livello professionalizzante. Il Master propone concetti e tecniche relativamente elementari (gli strumenti di uso quotidiano dello statistico medico), seguiti dai recenti e complessi sviluppi del metodo statistico e bioinformatico, soprattutto in ambito genomico. Ad esempio, la predizione dell’evoluzione della malattia e della risposta farmacologica nei pazienti, lo studio della suscettibilità genetiche nelle malattie complesse e l’applicazione di metodologie bioinformatiche per studi NGS.
L’ obiettivo del Master, è di provvedere alla formazione completa dello Statistico Medico-Genomico, figura professionale della quale gli istituti di ricerca, in ambito pubblico o privato, fanno sempre più pressante richiesta dato sia per il crescente fabbisogno di progettazione, analisi e valutazione di sperimentazioni cliniche, sia per il continuo aumento e la veloce diffusione degli studi genomici. Il Master propone al I° anno concetti elementari, seguiti al II° anno da sviluppi più avanzati.
Il Master in breve
Master: Genomic Data Science
Dove: Cascina Cravino, via A. Bassi, 21 Pavia
Durata: 2 anni
Monte Ore: 3.000 ore di cui 2.000 di tirocinio
CFU: 120
Iscritti: da un minimo di 8 ad un massimo di 25
Stage: presso Enti, Aziende ed Università
Requisiti: Laurea in discipline scientifiche
Contributo: 2.800 €/anno
Borse di Studio: possibilità di stage retribuito
Quest’impostazione biennale presenta molteplici vantaggi. Consente l’accesso a studenti provenienti da facoltà biomediche con scarsa formazione preliminare di statistica, fornendo loro capacità operative autonome nell’analisi di studi sperimentali e osservazionali attraverso una attività pratica guidata. Nello stesso tempo l’apprendimento di nuovi metodi specifici per gli studi genomici apre agli studenti l’orizzonte affascinante della ricerca statistica attuale.
MODULO/INSEGNAMENTO | CONTENUTI | TOTALE ORE | CFU |
A1) Statistica con R | 1) L’ambiente di programmazione R 2) Data import e data mining con R 3) Visualizzazione grafica dei dati con R 4) Inferenza statistica con R | 100 | 4 |
B1) Modelli di Regressione | 1) Regressione lineare 2) Regressione logistica 3) Modelli lineari misti 4) Analisi di sopravvivenza | 100 | 4 |
C1) Metodi di Ricampionamento | 1) Permutazione e randomizzazione 2) Simulazione Monte Carlo 3) Ricampionamento e bootstrap 4) P-values empirici e FDR | 100 | 4 |
D1) Epidemiologia Genetica | 1) Disegno di studi sperimentale e studi osservazionali 2) Disegno ed analisi di studi di linkage parametrico e non parametrico 3) Disegno ed analisi di studi di associazione familiare 4) Disegno ed analisi di studi di associazione di popolazione | 100 | 4 |
E1) Statistica Genetica | 1) Disegno ed analisi genome-wide (GW) 2) Pre-processing, controllo di qualità. imputazione e analisi statistica GW 3) Analisi GW di dati di metilazione 4) Analisi GW di dati di espressione | 100 | 4 |
A2) Gestione e analisi di Big Data | 1) Ambiente di lavoro Cloud e calcolo parallelo; 2) Tools di lavoro (Databases SQL e NoSQL); 3) Esplorazione delle librerie di Python; 4) Casi di studio. | 100 | 4 |
B2) Bioinformatica applicata alla genetica | 1) Next generation sequencing (NGS) 2) DNA sequencing and variant calling 3) Metodi per analisi di associazione con varianti rare 4) RNA sequencing e differential expression analysis (limma) | 100 | 4 |
C2) Statistica Genomica | 1) Riduzione della dimensionalità 2) Regressione "lasso" ed "elastica" 3) Path analysis (SEM) 4) Analisi dell’ereditabilità | 100 | 4 |
D2) Post-GWAS | 1) Polygenic risk score e validazione incrociata (cross-validation) 2) Metanalisi di studi GWA 3) Randomizzazione Mendeliana 4) Metodi per l’integrazione di dati omics | 100 | 4 |
E2) Machine Learning (ML) | 1) Introduzione a ML 2) Unsupervised Learning 3) Supervised Learning 4) Deep Learning in ambito genomico | 100 | 4 |