Programma Didattico

Master 2023-2025 in "Genomic Data Science"

Il Master in “Genomic Data Science” si sviluppa in 10 moduli (5+5), per un totale biennale di 3000 ore, ognuno svolto in una settimana (lunedì-venerdì dalle ore 9.30-12.30 e 14.30-17.00) da Febbraio ad Ottobre, suddivise tra didattica frontale, esercitazioni pratiche, stage formativo presso Università di Pavia ed enti convenzionati, seminari presso il Dipartimento di Scienze del Sistema Nervoso e del Comportamento, attività di studio e preparazione individuale. La frequenza è obbligatoria per almeno il 75% delle lezioni.

La valutazione dell’apprendimento verrà effettuata sulla base di verifiche delle conoscenze acquisite ogni anno e di una prova finale. La prova finale consisterà nella discussione di una tesi sperimentale o trattazione di un tema di rilevante interesse relativo al progetto svolto durante il tirocinio. A conclusione del Master, agli studenti verrà rilasciato il Diploma di Master universitario di II livello in “Genomic Data Science”.

Obiettivo del Master

Lo scopo del Master, unico in Italia, è di provvedere alla formazione completa dello Statistico medico-genomico, figura professionale della quale gli istituti di ricerca, in ambito pubblico o privato, fanno sempre più pressante richiesta dato sia per il crescente fabbisogno di progettazione, analisi e valutazione di sperimentazioni cliniche, sia per il continuo aumento e la veloce diffusione degli studi genomici.

Il programma didattico è strutturato nei seguenti moduli:

 I ANNO 

INSEGNAMENTO/MODULODOCENTICONTENUTI
A1) Statistica con RDavide Gentilini1) L’ambiente di programmazione R
2) Data import e data mining con R
3) Visualizzazione grafica dei dati con R
4) Inferenza statistica con R
B1) Modelli di RegressioneAndrea Nova1) Regressione lineare
2) Regressione logistica
3) Modelli lineari misti
4) Analisi di sopravvivenza
C1) Metodi di RicampionamentoMario Grassi1) Permutazione e randomizzazione
2) Simulazione Monte Carlo
3) Ricampionamento e bootstrap
4) P-values empirici e FDR
D1) Epidemiologia geneticaLuisa Bernardinelli
Davide Gentilini
Teresa Fazia
Andrea Nova
1) Disegno di studi sperimentale e studi osservazionali
2) Disegno ed analisi di studi di linkage parametrico e non parametrico
3) Disegno ed analisi di studi di associazione di popolazione e familiare
4) Analisi dell’ereditabilità
E1) Statistica geneticaLuisa Bernardinelli
Davide Gentilini
Teresa Fazia
1) Disegno e analisi genome-wide(GW)
2) Pre-processing, controllo di qualità, imputazione e analisi statistica GW
3) Analisi GW di dati di metilazione
4) Analisi GW di dati di espressione

 II ANNO 

INSEGNAMENTO/MODULODOCENTICONTENUTI
A2) Gestione e analisi dei BIG DATAAnna Sandionigi1) Introduzione a Unix e basici concetti di ingegneria dei dati;
2) Gestire l’installazione del software: Introduzione a Conda e Docker
3) Gestire dati biologici e metadati con Python
4) Fonti dei dati e tipi di dati in biologia
B2) Bioinformatica applicata alla geneticaDavide Gentilini1) Next generation sequencing (NGS)
2) DNA sequencing e variant calling
3) Metodi per analisi di associazione con varianti rare
4) RNA sequencing e differential expression analysis (limma)
C2) Statistica GenomicaSaveria Mazzara1) Analisi delle componenti principali (PCA) e Clustering
2) Support Vector Machine (SVM) e Random Forest (RF)
3) Curve ROC
4) RNASeq: da fastq a analisi downstream
D2) POST-GWASCugliari Giovanni
Teresa Fazia
1) Polygenic risk score e validazione incrociata (cross-validation)
2) Metanalisi di studi Genome-Wide (GWA)
3) Randomizzazione Mendeliana
4) Metodi per l’integrazione di dati omics
E2) Machine Learning (ML)Mario Grassi1) Introduzione a ML
2) Unsupervised Learning
3) Supervised Learning
4) Deep Learning in ambito genomico

Scarica Bando Master

Questo sito non utilizza cookie di profilazione ma solo cookie di terze parti. Per continuare a navigare nel sito dovete acconsentire al nostro uso dei cookies