- Oggetto:
- Oggetto:
Elaborazione informatica dei dati sperimentali
- Oggetto:
Anno accademico 2011/2012
- Codice dell'attività didattica
- MFN0409
- Docenti
- Dott. Massimiliano De Pierro
Prof. Maria Teresa Giraudo - Corso di studi
- Scienze Biologiche D.M. 270
- Anno
- 3° anno
- Periodo didattico
- I semestre
- Tipologia
- --- Nuovo Ordinamento ---
- Crediti/Valenza
- 8
- SSD dell'attività didattica
- INF/01 - informatica
MAT/06 - probabilita' e statistica matematica - Oggetto:
Sommario insegnamento
- Oggetto:
Programma
Statistica descrittiva: Distribuzione di frequenza per dati singoli e per dati raggruppati, istogramma, grafico stem and leaf, indici statistici (media campionaria, moda, mediana, varianza campionaria e deviazione standard, range, coefficiente di variazione, skewness, curtosi, percentili e quantili), box plot, outliers, indici statistici per dati raggruppati.
Elementi di calcolo delle probabilità: Eventi e probabilità. Indipendenza, regole della somma e del prodotto, probabilità condizionata. Formula delle probabilità totali e regola di Bayes. Variabili aleatorie, distribuzione, funzione di distribuzione cumulata, valore medio e varianza. Distribuzione di variabili aleatorie note: binomiale, geometrica, Poisson, normale, esponenziale. Teorema del limite centrale, legge dei grandi numeri.
Statistca Inferenziale: Intervalli di confidenza per media, varianza, proporzione, differenza tra medie, rapporto tra varianze e differenza tra proporzioni. Test di ipotesi bilaterali e unilaterali, regione critica, errori di prima e seconda specie. Test per media, varianza, proporzione, differenza tra medie, rapporto tra varianze e differenza tra proporzioni. Test per la differenza tra medie di campioni accoppiati. Test del chi-quadro per la bontà del fit, normal probability plot, test di Kolmogorov Smirnov.
Regressione lineare: Modelli lineari. Test per il coefficiente di correlazione di Pearson. Stima dei coefficienti della retta di regressione. Grafico dei residui.
Analisi della varianza a una via.
Introduzione all'uso del computer e ai Sistemi Operativi: il file system e la relativa terminologia; acquisizione e salvataggio dei dati.
Introduzione all’analisi statistica dei dati in biologia: estrarre conoscenza dai microarray di DNA, la derivazione delle matrici di punteggio (es. BLOSUM), il raggruppamento automatico dei dati (tecniche di clustering).
Il foglio elettronico per l'analisi statistica dei dati: introduzione al foglio elettronico; importazione dei dati da file esterni; celle e riferimenti a intervalli lineari e matriciali; riferimenti assoluti e relativi; calcoli e formule; funzioni built-in; formattazione dei dati; costruzione di grafici; funzioni booleane e condizionali; ordinamento di dati; filtri automatici e avanzati; formule matriciali
L'ambiente di sviluppo R per l'analisi statistica dei dati: introduzione ed installazione del software R; uso della console e linguaggio di input e output di R; lo storage dei dati in R: vettori, array, matrici, data-frame, liste, database; istruzioni e funzioni base per la manipolazione dei dati in R; plot. Importare ed esporatre da e verso MS Excel. Alcune funzioni specializzate: principali funzioni di statistica descrittiva ed inferenziale; funzioni per il clustering dei dati.
Descriptive Statistics: Frequency distribution, hystogram plot, stem and leaf plot, sample mean, mode, median, sample variance, standard deviation, range, coefficient of variation, skewness, kurtosis, percentiles and quartiles, box plot, outliers, statistical indexes for grouped data.
Elements of Probability: Events and probability. Independence, sum and product rules, conditional probability. Bayes formula. Random variables: distribution function and cumulative distribution function, expectation and variance. Known random variables: binomial, geometric, Poisson, Gaussian, Exponential. Law of large numbers and central limit theorem.
Inferential Statistics: Confidence intervals for mean, variance, proportion, difference between means, ratio of variances, difference between proportions. Hypothesis tests, one tailed and two tailed: critical region, first kind and second kind errors. Tests for mean, variance, proportion, difference between means, ratio of variances, difference between proportions. Test for the difference between means of paired data. Chi-square test for the goodness of fit, Kolmogorov.Smirnov test, normal probability plot.
Linear regression: Linear models, Pearson correlation coefficient and test, estimation of the parameters in the linear model, residuals.
An introduction to the computer operating systems: the file-system; storing and retrieval of the data.
Statistical data analysis with a spreadsheet: an introduction to spreadsheets; how to import data from external sources; cells and cell references; vectorial and matricial ranges of cells; absolute and relative interpretation of the references; formulae; built-in functions; data formatting; charts; Boolean and conditional functions; data sorting; filters; matricial formulae.
An overview on the statistical analysis of biological data: the extraction of knowledge from microarrays of DNA, score matrix computation (e.g. BLOSUM), automatic clustering of large data-sets (clustering techniques).
The R software for statistical data analysis: introduction to R and software installation; the console and the input and output interactive language; data storage in R: array, matrix, data-frame, list, database; the R's instructions and base functions for data manipulation; plotting. Importing from and exporting to MS Excel. Some specialized funcions: functions of descriptive and inferential statistics ; functions to cluster large data-sets.
Introdurre lo studente all’utilizzo degli strumenti informatici più comuni e allo svolgimento di analisi statistiche standard di dati sperimentali.
Permettere allo studente di riconoscere le tecniche statistiche da utilizzare per analizzare risultati sperimentali e di utilizzare tali tecniche in situazioni standard facendo uso di software opportuno.
I testi base consigliati per il corso sono:
G. Espa, R. Micciolko. “Problemi ed esperimenti di statisitca con R”. Apogeo.
M. M. Triola e M. F. Triola Statistica per le discipline biosanitarie, Pearson.
F. Crivellari, Analisi Statistica dei dati con R, Apogeo.
M.R. Middleton (2004). “Analisi statistica con Excel”. Apogeo
Esame scritto.
Analisi di un set di dati assegnato in aula informatizzata e risposta scritta ad alcune domande.
La frequenza alle lezioni non è obbligatoria; per i corsi di laboratorio e le attività di esercitazione relative ai corsi la frequenza è obbligatoria e non può essere inferiore al 70% delle ore previste.Testi consigliati e bibliografia
- Oggetto:
Note
Curriculum Biomolecolare Cellulare, Curriculum Ecologico Ambientale, Curriculum Tecnico Analitico.
- Oggetto:
Moduli didattici
- Elementi di Informatica (MFN0409B)
- Elementi di Statistica (MFN0409A)
- Oggetto: