Programma Didattico

Master 2023-2025 in "Genomic Data Science"

Il Master in “Genomic Data Science” si sviluppa in 10 moduli (5+5), per un totale biennale di 3000 ore, ognuno svolto in una settimana (lunedì-venerdì dalle ore 9.30-12.30 e 14.30-17.00) da Febbraio ad Ottobre, suddivise tra didattica frontale, esercitazioni pratiche, stage formativo presso Università di Pavia ed enti convenzionati, seminari presso il Dipartimento di Scienze del Sistema Nervoso e del Comportamento, attività di studio e preparazione individuale. La frequenza è obbligatoria per almeno il 75% delle lezioni.

La valutazione dell’apprendimento verrà effettuata sulla base di verifiche delle conoscenze acquisite ogni anno e di una prova finale. La prova finale consisterà nella discussione di una tesi sperimentale o trattazione di un tema di rilevante interesse relativo al progetto svolto durante il tirocinio. A conclusione del Master, agli studenti verrà rilasciato il Diploma di Master universitario di II livello in “Genomic Data Science”.

Obiettivo del Master

Lo scopo del Master, unico in Italia, è di provvedere alla formazione completa dello Statistico medico-genomico, figura professionale della quale gli istituti di ricerca, in ambito pubblico o privato, fanno sempre più pressante richiesta dato sia per il crescente fabbisogno di progettazione, analisi e valutazione di sperimentazioni cliniche, sia per il continuo aumento e la veloce diffusione degli studi genomici.

Il programma didattico è strutturato nei seguenti moduli:

I ANNO

INSEGNAMENTO/MODULO	DOCENTI	CONTENUTI
A1) Statistica con R	Davide Gentilini	1) L’ambiente di programmazione R 2) Data import e data mining con R 3) Visualizzazione grafica dei dati con R 4) Inferenza statistica con R
B1) Modelli di Regressione	Andrea Nova	1) Regressione lineare 2) Regressione logistica 3) Modelli lineari misti 4) Analisi di sopravvivenza
C1) Metodi di Ricampionamento	Mario Grassi	1) Permutazione e randomizzazione 2) Simulazione Monte Carlo 3) Ricampionamento e bootstrap 4) P-values empirici e FDR
D1) Epidemiologia genetica	Luisa Bernardinelli Davide Gentilini Teresa Fazia Andrea Nova	1) Disegno di studi sperimentale e studi osservazionali 2) Disegno ed analisi di studi di linkage parametrico e non parametrico 3) Disegno ed analisi di studi di associazione di popolazione e familiare 4) Analisi dell’ereditabilità
E1) Statistica genetica	Luisa Bernardinelli Davide Gentilini Teresa Fazia	1) Disegno e analisi genome-wide(GW) 2) Pre-processing, controllo di qualità, imputazione e analisi statistica GW 3) Analisi GW di dati di metilazione 4) Analisi GW di dati di espressione

II ANNO

INSEGNAMENTO/MODULO	DOCENTI	CONTENUTI
A2) Gestione e analisi dei BIG DATA	Anna Sandionigi	1) Introduzione a Unix e basici concetti di ingegneria dei dati; 2) Gestire l’installazione del software: Introduzione a Conda e Docker 3) Gestire dati biologici e metadati con Python 4) Fonti dei dati e tipi di dati in biologia
B2) Bioinformatica applicata alla genetica	Davide Gentilini	1) Next generation sequencing (NGS) 2) DNA sequencing e variant calling 3) Metodi per analisi di associazione con varianti rare 4) RNA sequencing e differential expression analysis (limma)
C2) Statistica Genomica	Saveria Mazzara	1) Analisi delle componenti principali (PCA) e Clustering 2) Support Vector Machine (SVM) e Random Forest (RF) 3) Curve ROC 4) RNASeq: da fastq a analisi downstream
D2) POST-GWAS	Cugliari Giovanni Teresa Fazia	1) Polygenic risk score e validazione incrociata (cross-validation) 2) Metanalisi di studi Genome-Wide (GWA) 3) Randomizzazione Mendeliana 4) Metodi per l’integrazione di dati omics
E2) Machine Learning (ML)	Mario Grassi	1) Introduzione a ML 2) Unsupervised Learning 3) Supervised Learning 4) Deep Learning in ambito genomico

Scarica Bando Master