Salta ai contenuti. | Salta alla navigazione

Image Portlet
Home Luisa Scaccia Didattica 2023/2024 Analisi dei big data

Analisi dei big data - Analisi dei big data - mod. a

  • A.A. 2023/2024
  • CFU 6
  • Ore 40
  • Classe di laurea LM-77
Luisa Scaccia / Professoressa di ruolo - II fascia (STAT-01/A)
Dipartimento di Economia e Diritto
Prerequisiti

Conoscenze di base di statistica descrittiva e inferenziale, e probabilità


Obiettivi del corso

Fornire gli strumenti necessari per modellizzare e comprendere insiemi di dati complessi e di grandi dimensioni. Familiarizzare gli studenti con il software statistico R per l'implementazione dei vari metodi di apprendimento statistico.

Programma del corso

Il corso introduce il concetto di apprendimento statistico, sia supervisionato che non supervisionato. Vengono poi trattati i metodi lineari classici di regressione e classificazione (regressione lineare, regressione logistica, analisi discriminante lineare). Sono forniti gli strumenti necessari per scegliere la metodologia migliore con riferimento ad una data applicazione (cross-validation, bootstrap). Infine, vengono considerati metodi lineari più avanzati, quali regressione ridge e lasso, e particolarmente indicati in problemi ad alta dimensionalità, quali la regressione delle componenti principali e i minimi quadrati parziali.

Testi (A)dottati, (C)onsigliati

(A); G. James, D. Witten, T. Hastie, R. Tibshirani; Introduzione all’apprendimento statistico con applicazioni in R; Piccin, Padova, 2020; Capitoli: 1-6; ISBN: 978-88-299-3094-4


Altre informazioni / materiali aggiuntivi

I lucidi utilizzati a lezione saranno disponibili nel canale Teams del corso, insieme a testo e soluzione delle esercitazioni e delle prove scritte dei passati appelli, e ad ogni altro supporto didattico utilizzato durante le lezioni. 


Metodi didattici
  • Lezioni frontali

    Esercitazioni

    Slide

    Project work

    Utilizzo del linguaggio di programmazione open source R

Modalità di valutazione
  • L'esame finale consiste in una prova scritta, e in un project work.

    La prova scritta è costituita da domande di teoria.

    Il project work consiste in un lavoro applicativo da svolgere autonomamente o in gruppo di max 3 persone su dataset concordati con il docente, su cui applicare i principali argomenti svolti a lezione, utilizzando il linguaggio di programmazione R.

    Il project work va consegnato il giorno della prova scritta.

    La prova orale è facoltativa.

    La prova scritta e il project work (ed eventualmente la prova orale) contribuiscono in egual misura al risultato finale.


    I criteri adottati per la graduazione dei voti della prova scritta, del project work e della prova orale sono i seguenti:

    a) conoscenza e comprensione dei concetti teorici (il 30% sul totale della valutazione complessiva)

    b) capacità di applicare le conoscenze (il 40% sul totale della valutazione complessiva)

    c) autonomia di giudizio e di pensiero critico (il 30% sul totale della valutazione complessiva)

Lingue, oltre all'italiano, che possono essere utilizzate per l'attività didattica

Italiano

  Torna alla scheda
  Materiali didattici
Avviso
I materiali didattici sono reperibili nella stanza Teams al link di seguito
Info
» Vai alla stanza Teams