Statistica economica, big data e micro dati - Mod. b micro dati
- A.A. 2023/2024
- CFU 3
- Ore 20
- Classe di laurea L-33
(i) Elementi di Analisi dei Dati e di Statistica Descrittiva. (ii) Statistica Applicata e Regressione Lineare (semplice e multipla). (iii) Modelli Logit
Il corso intende fornire gli strumenti principali per identificare analiticamente le strutture nascoste presenti nei dati ed essere in grado di utilizzarle per prevedere i valori futuri dei dati stessi o prendere altri tipi di decisioni. La parte centrale del corso mira a fornire le basi, mediante l'utilizzo di appropriati software (RStudio), per costruire modelli statistico-econometrici per prevedere e stimare un 'output' utilizzando un numero (potenzialmente) molto grande di 'input'.
(1) Valutazione e Selezione dei modelli: (i) Cross-validation; (ii) Criteri di Informazione.
(2) Unsupervised Machine Learning Techniques: Modelli Logistici.
(3) Metodi di selezione e di 'shrinkage': (i) tecniche di regressione 'Forward' e 'Backward'; (ii) Stepwise regression; (iii) Lasso; (iv) Ridge Regression (RR); (v) Principal Component Analysis (PCA); (vi) Partial Least Squares.
Durante il corso, gli studenti svolgeranno lezioni pratiche sugli argomenti descritti in forma cartacea ed analitica, mediante l'utilizzo del software 'open source' RStudio.
(A); Hastie, T., and Tibshirani, R., "An Introduction to Statistical Learning: with Applications in R", Springer (2017), New York (USA), ISBN 978-1461471370. Capitoli e relative pagine saranno indicati dal Docente durante le lezioni.
(C); Hastie, T., Tibshirani, R., and Friedman, J., "The Elements of Statistical Learning Data Mining, Inference, and Prediction", Springer (2009), New York (USA), ISBN 978-0387848570. Capitoli e relative pagine saranno indicati dal Docente durante le lezioni.
-
Lezioni teoriche/metodologiche. Esercizi empirici di natura microeconomico-sociale and aziendale. Casi di studio su dati micro mediante l'utilizzo del software statistico-econometrico RStudio.
La modalità di valutazione (in trentesimi) consiste in una prova scritta in cui gli studenti dovranno svolgere alcuni quesiti (suddivisi in sottopunti) contenenti: domande teoriche/pratiche; svolgimento di esercizi; interpretazione di grafici e output di stima.
I criteri di valutazione saranno suddivisi in: conoscenza e capacità di comprensione degli argomenti trattati nel corso (50%) e capacità di applicare gli strumenti adeguati e completezza delle risoluzioni presentate (50%).
Durante il corso è previsto lo svolgimento di un 'Project Work' in gruppi su dati reali (micro) mediante il software utilizzato a lezione. I gruppi devono essere composti da un minimo di 2 ad un massimo di 4 studenti. Il 'Project Work' è obbligatorio e comporta un punteggio aggiuntivo fino a 2 punti (massimo) sul voto conseguito nella prova scritta.
Se lo studente NON dovesse svolgere il Project Work, potrebbe (su disponibilità del Docente) essere autorizzato a sostenere comunque la prova scritta finale, ma con una PENALIZZAZIONE di -3 sul voto finale.
Il voto finale dell'esame è ottenuto sommando all'esito della prova scritta il voto ottenuto nel Project Work (da -1 a 2), limitatamente alla prova sostenuta - con qualsiasi esito - in uno degli appelli della prima sessione d'esame. In caso di ritiro alla prova scritta, il punteggio del 'Project Work' sarà mantenuto, ma sempre entro la prima sessione d'esame.
Italiano