Statistica multivariata + laboratorio di analisi di dati reali - Laboratorio di analisi di dati reali
- A.A. 2025/2026
- CFU 6, 3(m)
- Ore 40, 20(m)
- Classe di laurea L-41 R, L-41(m)
Conoscenze di statistica di base acquisite in un corso di laurea triennale, inclusi: descrizione di dati univariati e bivariati, concetti fondamentali di probabilità, inferenza statistica (stima e test), e regressione lineare semplice.
Il corso fornisce gli strumenti fondamentali per l'applicazione attraverso software dell’analisi statistica multivariata. L’obiettivo è sviluppare la capacità di modellare e interpretare relazioni tra più variabili simultaneamente, sia per scopi descrittivi che inferenziali. Al termine del corso lo studente sarà in grado di gestire dataset, applicando varie tecniche statistiche.
Programma:
Il corso ricalca a livello pratico i concetti teorici affrontati nel corso di statistica multivariata. In particolare, si utilizzerà il software Stata per applicare ad alcuni dataset varie tecniche multivariate.
- Introduzione al software Stata
2. Analisi della varianza (ANOVA)
- ANOVA a una via e a due vie
- Ipotesi, interpretazione, test post-hoc
- Applicazioni nelle scienze sociali
3. Regressione lineare
- Modello di regressione semplice
- Estensione alla regressione multipla
- Selezione delle variabili e diagnostica del modello
4. Regressione logistica (cenni avanzati)
- Modello logit per variabili dicotomiche
- Interpretazione dei coefficienti e odds ratio
- Valutazione del modello
5. Cenni di tecniche multivariate avanzate
- Analisi delle Componenti Principali (PCA): logica di base e interpretazione
- Cluster Analysis: idea di base e applicazioni esplorative
- Scopi esplorativi e riduzione della dimensionalità
Izenman, Alan J. Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. New York: Springer, 2008. (C)
Altre informazioni / materiali aggiuntivi
per informazioni, scrivere a: vincenzo.mauro@unimc.it
-
Le lezioni saranno frontali, in presenza, con l'ausilio di materiale didattico fornito dal docente (sottoforma di dispense e materiali integrativi).
L'attività sarà supportata da esercitazioni in aula.
L'esame consiste di una parte scritta (prova finale), e, nel caso questa sia sufficiente, di un colloquio orale. Il voto finale sarà formato da una media ponderata delle due parti, con pesi rispettivamente 0.4 e 0.6.
La prova scritta, della durata indicativa di 90 minuti, consiste di domande a risposta sia aperta che chiusa. Parte della prova sarà svolta al computer, con l'ausilio di software specifico.
Tutte le prove saranno valutate tenendo conto di
a) conoscenza e capacità di comprensione degli esercizi (20% sul totale della valutazione complessiva);b) capacità di operare collegamenti fra argomenti (20% sul totale della valutazione complessiva);c) capacità di applicare le conoscenze in ambito di problemi pratici (20% sul totale della valutazione complessiva) d) precisione e rigore nell'applicazione di formule e metodologie (40% sul totale della valutazione complessiva)
Inglese
Italiano