Salta ai contenuti. | Salta alla navigazione

Image Portlet
Home Mauro Vincenzo Didattica 2025/2026 Statistica multivariata + laboratorio di analisi di dati reali

Statistica multivariata + laboratorio di analisi di dati reali - Statistica multivariata

  • A.A. 2025/2026
  • CFU 6, 9(m)
  • Ore 40, 60(m)
  • Classe di laurea L-41 R, L-41(m)
Vincenzo Mauro / Professore di ruolo - II fascia (STAT-01/A)
Dipartimento di Scienze Politiche, della Comunicazione e delle Relazioni Internazionali
Prerequisiti

Conoscenze di statistica di base acquisite in un corso di laurea triennale, inclusi: descrizione di dati univariati e bivariati, concetti fondamentali di probabilità, inferenza statistica (stima e test), e regressione lineare semplice.

Obiettivi del corso

Il corso fornisce gli strumenti fondamentali per l’analisi statistica multivariata. L’obiettivo è sviluppare la capacità di modellare e interpretare relazioni tra più variabili simultaneamente, sia per scopi descrittivi che inferenziali. Al termine del corso lo studente sarà in grado di:


  • applicare e interpretare modelli di regressione lineare semplice e multipla;
  • condurre analisi della varianza (ANOVA) e analisi della covarianza (ANCOVA);
  • eseguire analisi in componenti principali (PCA) per la riduzione dimensionale;
  • utilizzare metodi di classificazione non supervisionata (cluster analysis);
  • leggere criticamente i risultati delle analisi multivariate anche mediante software statistici.


Programma del corso

Programma:


1. La statistica multivariata

  • Obiettivi e ambiti di applicazione
  • Richiami di statistica descrittiva e inferenziale
  • Tipi di variabili e scale di misura

2. Introduzione all'inferenza causale

  • Il modello causale di Rubin (RCM)
  • Concetto di effetto causale, risultati potenziali, trattamento e controllo
  • Problema fondamentale dell’inferenza causale, Disegni sperimentali vs. osservazionali
  • Selection bias e studi quasi-sperimentali
  • Strategie standard: regressione discontinua, difference-in-differences, IV
  • Assenza di confondimento e ignorabilità, Propensity score matching

3. Regressione lineare (breve richiamo)

  • Modello di regressione semplice
  • Estensione alla regressione multipla
  • Selezione delle variabili e diagnostica del modello

4. Regressione logistica (cenni avanzati)

  • Modello logit per variabili dicotomiche
  • Interpretazione dei coefficienti e odds ratio
  • Valutazione del modello

5. Analisi della varianza (ANOVA)

  • ANOVA a una via e a due vie
  • Ipotesi, interpretazione, test post-hoc
  • Applicazioni nelle scienze sociali

6. Cenni di tecniche multivariate avanzate

  • Analisi delle Componenti Principali (PCA): logica di base e interpretazione
  • Cluster Analysis: idea di base e applicazioni esplorative
  • Scopi esplorativi e riduzione della dimensionalità

7. Applicazioni con software

  • Utilizzo di software statistici (Excel, Stata)
  • Analisi di dataset reali in ambito socio-economico
  • Interpretazione dei risultati e reporting

Testi (A)dottati, (C)onsigliati

Izenman, Alan J. Modern Multivariate Statistical Techniques: Regression, Classification, and Manifold Learning. New York: Springer, 2008. (C)


Altre informazioni / materiali aggiuntivi

per informazioni, scrivere a: vincenzo.mauro@unimc.it

Metodi didattici
  • Le lezioni saranno frontali, in presenza, con l'ausilio di materiale didattico fornito dal docente (sottoforma di dispense e materiali integrativi).


    L'attività sarà supportata da esercitazioni in aula.

Modalità di valutazione
  • L'esame consiste di una parte scritta (prova finale), e, nel caso questa sia sufficiente, di un colloquio orale. Il voto finale sarà formato da una media ponderata delle due parti, con pesi rispettivamente 0.4 e 0.6.

     

    La prova scritta, della durata indicativa di 90 minuti, consiste di domande a risposta sia aperta che chiusa. Parte della prova potrebbe essere svolta al computer, con l'ausilio di software specifico.

    Tutte le prove saranno valutate tenendo conto di

    a) conoscenza e capacità di comprensione degli esercizi (20% sul totale della valutazione complessiva);b) capacità di operare collegamenti fra argomenti (20% sul totale della valutazione complessiva);c) capacità di applicare le conoscenze in ambito di problemi pratici (20% sul totale della valutazione complessiva) d) precisione e rigore nell'applicazione di formule e metodologie (40% sul totale della valutazione complessiva)

Lingue, oltre all'italiano, che possono essere utilizzate per l'attività didattica

Inglese

Lingue, oltre all'italiano, che si intende utilizzare per la valutazione

Italiano

  Torna alla scheda
Calendario
  Materiali didattici
Avviso
I materiali didattici sono reperibili nella stanza Teams al link di seguito
Info
» Vai alla stanza Teams