Vai al contenuto principale
Oggetto:
Oggetto:

Elaborazione informatica dei dati sperimentali

Oggetto:

Anno accademico 2011/2012

Codice dell'attività didattica
MFN0409
Docenti
Dott. Massimiliano De Pierro
Prof. Maria Teresa Giraudo
Corso di studi
Scienze Biologiche D.M. 270
Anno
3° anno
Periodo didattico
I semestre
Tipologia
--- Nuovo Ordinamento ---
Crediti/Valenza
8
SSD dell'attività didattica
INF/01 - informatica
MAT/06 - probabilita' e statistica matematica
Oggetto:

Sommario insegnamento

Oggetto:

Programma


Statistica descrittiva: Distribuzione di frequenza per dati singoli e per dati raggruppati, istogramma, grafico stem and leaf, indici statistici (media campionaria, moda, mediana, varianza campionaria e deviazione standard, range, coefficiente di variazione, skewness, curtosi, percentili e quantili), box plot, outliers, indici statistici per dati raggruppati.
Elementi di calcolo delle probabilità: Eventi e probabilità. Indipendenza, regole della somma e del prodotto, probabilità condizionata. Formula delle probabilità totali e regola di Bayes. Variabili aleatorie, distribuzione, funzione di distribuzione cumulata, valore medio e varianza. Distribuzione di variabili aleatorie note: binomiale, geometrica, Poisson, normale, esponenziale. Teorema del limite centrale, legge dei grandi numeri.
Statistca Inferenziale: Intervalli di confidenza per media, varianza, proporzione, differenza tra medie, rapporto tra varianze e differenza tra proporzioni. Test di ipotesi bilaterali e unilaterali, regione critica, errori di prima e seconda specie. Test per media, varianza, proporzione, differenza tra medie, rapporto tra varianze e differenza tra proporzioni. Test per la differenza tra medie di campioni accoppiati. Test del chi-quadro per la bontà del fit, normal probability plot, test di Kolmogorov Smirnov.
Regressione lineare: Modelli lineari. Test per il coefficiente di correlazione di Pearson. Stima dei coefficienti della retta di regressione. Grafico dei residui.
Analisi della varianza a una via.

Introduzione all'uso del computer e ai Sistemi Operativi: il file system e la relativa terminologia; acquisizione e salvataggio dei dati.
Introduzione all’analisi statistica dei dati in biologia: estrarre conoscenza dai microarray di DNA, la derivazione delle matrici di punteggio (es. BLOSUM), il raggruppamento automatico dei dati (tecniche di clustering).
Il foglio elettronico per l'analisi statistica dei dati: introduzione al foglio elettronico; importazione dei dati da file esterni; celle e riferimenti a intervalli lineari e matriciali; riferimenti assoluti e relativi; calcoli e formule; funzioni built-in; formattazione dei dati; costruzione di grafici; funzioni booleane e condizionali; ordinamento di dati; filtri automatici e avanzati; formule matriciali
L'ambiente di sviluppo R per l'analisi statistica dei dati:  introduzione ed installazione del software R; uso della console e linguaggio di input e output di R; lo storage dei dati in R: vettori, array, matrici, data-frame, liste, database; istruzioni e funzioni base per la manipolazione dei dati in R; plot. Importare ed esporatre da e verso MS Excel. Alcune funzioni specializzate: principali funzioni di statistica descrittiva ed inferenziale; funzioni per il clustering dei dati.



Descriptive Statistics: Frequency distribution, hystogram plot, stem and leaf plot, sample mean, mode, median, sample variance, standard deviation, range, coefficient of variation, skewness, kurtosis, percentiles and quartiles, box plot, outliers, statistical indexes for grouped data.

Elements of Probability: Events and probability. Independence, sum and product rules, conditional probability. Bayes formula. Random variables: distribution function and cumulative distribution function, expectation and variance. Known random variables: binomial, geometric, Poisson, Gaussian, Exponential. Law of large numbers and central limit theorem.

Inferential Statistics: Confidence intervals for mean, variance, proportion, difference between means, ratio of variances, difference between proportions. Hypothesis tests, one tailed and two tailed: critical region, first kind and second kind errors. Tests for mean, variance, proportion, difference between means, ratio of variances, difference between proportions. Test for the difference between means of paired data. Chi-square test for the goodness of fit, Kolmogorov.Smirnov test, normal probability plot.

Linear regression: Linear models, Pearson correlation coefficient and test, estimation of the parameters in the linear model, residuals.

An introduction to the computer operating systems: the file-system; storing and retrieval of the data.
Statistical data analysis with a spreadsheet: an introduction to spreadsheets; how to import data from external sources; cells and cell references; vectorial and matricial ranges of cells; absolute and relative interpretation of the references; formulae; built-in functions; data formatting; charts; Boolean and conditional functions; data sorting; filters; matricial formulae.
An overview on the statistical analysis of biological data: the extraction of knowledge from  microarrays of DNA, score matrix computation (e.g. BLOSUM), automatic clustering of large data-sets (clustering techniques).
The R software for statistical data analysis: introduction to R and software installation; the console and the input and output interactive language; data storage in R: array, matrix, data-frame, list, database; the R's instructions and base functions for data manipulation; plotting. Importing from and exporting to MS Excel. Some specialized funcions: functions of descriptive and inferential statistics ; functions to cluster large data-sets.


Introdurre lo studente all’utilizzo degli strumenti informatici più comuni e allo svolgimento di analisi statistiche standard di dati sperimentali.
Permettere allo studente di riconoscere le tecniche statistiche da utilizzare per analizzare risultati sperimentali e di utilizzare tali tecniche in situazioni standard facendo uso di software opportuno.


I testi base consigliati per il corso sono:
G. Espa, R. Micciolko. “Problemi ed esperimenti di statisitca con R”. Apogeo.
M. M. Triola e M. F. Triola Statistica per le discipline biosanitarie, Pearson.
F. Crivellari, Analisi Statistica dei dati con R, Apogeo.
M.R. Middleton (2004). “Analisi statistica con Excel”. Apogeo


Esame scritto.
Analisi di un set di dati assegnato in aula informatizzata e risposta scritta ad alcune domande.



La frequenza alle lezioni non è obbligatoria; per i corsi di laboratorio e le attività di esercitazione relative ai corsi la frequenza è obbligatoria e non può essere inferiore al 70% delle ore previste.  

Testi consigliati e bibliografia



Oggetto:

Note

Curriculum Biomolecolare Cellulare, Curriculum Ecologico Ambientale, Curriculum Tecnico Analitico.

Oggetto:

Moduli didattici

Oggetto:
Ultimo aggiornamento: 28/09/2012 10:10
Non cliccare qui!