Statistica multivariata + laboratorio di analisi di dati reali - Statistica multivariata
- A.A. 2025/2026
- CFU 6, 9(m)
- Ore 40, 60(m)
- Classe di laurea L-41 R, L-41(m)
Conoscenze di statistica di base acquisite in un corso di laurea triennale, inclusi: descrizione di dati univariati e bivariati, concetti fondamentali di probabilità, inferenza statistica (stima e test), e regressione lineare semplice.
Il corso fornisce gli strumenti fondamentali per l’analisi statistica multivariata. L’obiettivo è sviluppare la capacità di modellare e interpretare relazioni tra più variabili simultaneamente, sia per scopi descrittivi che inferenziali. Al termine del corso lo studente sarà in grado di:
- applicare e interpretare modelli di regressione lineare semplice e multipla;
- condurre analisi della varianza (ANOVA) e analisi della covarianza (ANCOVA);
- eseguire analisi in componenti principali (PCA) per la riduzione dimensionale;
- utilizzare metodi di classificazione non supervisionata (cluster analysis);
- leggere criticamente i risultati delle analisi multivariate anche mediante software statistici.
Programma:
1. La statistica multivariata
- Obiettivi e ambiti di applicazione
- Richiami di statistica descrittiva e inferenziale
- Tipi di variabili e scale di misura
2. Introduzione all'inferenza causale
- Il modello causale di Rubin (RCM)
- Concetto di effetto causale, risultati potenziali, trattamento e controllo
- Problema fondamentale dell’inferenza causale, Disegni sperimentali vs. osservazionali
- Selection bias e studi quasi-sperimentali
- Strategie standard: regressione discontinua, difference-in-differences, IV
- Assenza di confondimento e ignorabilità, Propensity score matching
3. Regressione lineare (breve richiamo)
- Modello di regressione semplice
- Estensione alla regressione multipla
- Selezione delle variabili e diagnostica del modello
4. Regressione logistica (cenni avanzati)
- Modello logit per variabili dicotomiche
- Interpretazione dei coefficienti e odds ratio
- Valutazione del modello
5. Analisi della varianza (ANOVA)
- ANOVA a una via e a due vie
- Ipotesi, interpretazione, test post-hoc
- Applicazioni nelle scienze sociali
6. Cenni di tecniche multivariate avanzate
- Analisi delle Componenti Principali (PCA): logica di base e interpretazione
- Cluster Analysis: idea di base e applicazioni esplorative
- Scopi esplorativi e riduzione della dimensionalità
7. Applicazioni con software
- Utilizzo di software statistici (Excel, Stata)
- Analisi di dataset reali in ambito socio-economico
- Interpretazione dei risultati e reporting
Izenman, Alan J. Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. New York: Springer, 2008. (C)
Altre informazioni / materiali aggiuntivi
per informazioni, scrivere a: vincenzo.mauro@unimc.it
-
Le lezioni saranno frontali, in presenza, con l'ausilio di materiale didattico fornito dal docente (sottoforma di dispense e materiali integrativi).
L'attività sarà supportata da esercitazioni in aula.
L'esame consiste di una parte scritta (prova finale), e, nel caso questa sia sufficiente, di un colloquio orale. Il voto finale sarà formato da una media ponderata delle due parti, con pesi rispettivamente 0.4 e 0.6.
La prova scritta, della durata indicativa di 90 minuti, consiste di domande a risposta sia aperta che chiusa. Parte della prova potrebbe essere svolta al computer, con l'ausilio di software specifico.
Tutte le prove saranno valutate tenendo conto di
a) conoscenza e capacità di comprensione degli esercizi (20% sul totale della valutazione complessiva);b) capacità di operare collegamenti fra argomenti (20% sul totale della valutazione complessiva);c) capacità di applicare le conoscenze in ambito di problemi pratici (20% sul totale della valutazione complessiva) d) precisione e rigore nell'applicazione di formule e metodologie (40% sul totale della valutazione complessiva)
Inglese
Italiano