Data mining

  • A.A. 2023/2024
  • CFU 6
  • Ore 40
  • Classe di laurea L-41
Luisa Scaccia / Professoressa di ruolo - II fascia (STAT-01/A)
Dipartimento di Economia e Diritto
Prerequisiti

Conoscenze di base di statistica descrittiva e inferenziale, e probabilità

Obiettivi del corso

Il corso intende fornire un’introduzione alle principali tecniche statistiche di Data Mining attraverso le più moderne tecniche e strategie per l’analisi di grandi moli di dati, illustrando le problematiche connesse.
Alla fine del corso lo studente ha la possibilità di proporre i principali algoritmi , discernendo pregi e difetti, essendo in grado di sperimentare ed applicare le conoscenze acquisite su dati reali.


Programma del corso

Il corso affronta lo studio di tecniche modellistiche algoritmiche e le principali problematiche e tecniche statistiche di Data Mining.

  • Data mining, robustezza, overfitting e problematiche di validazione dei risultati.
  • Regole associative.
  • Modelli statistici per la classificazione supervisionata (modello lineare, analisi discriminante parametrica, modello logistico binario e multinomiale).
  • Algoritmi per la classificazione supervisionata (Naive Bayes, Nearest Neighbour, neural network, regressioni lasso, Alberi decisionali e Classificativi, PLS, Bagging, Boosting and Random forest)


Testi (A)dottati, (C)onsigliati

(A); G. James, D. Witten, T. Hastie, R. Tibshirani; Introduzione all’apprendimento statistico con applicazioni in R; Piccin, Padova, 2020; Capitoli: 1-9; ISBN: 978-88-299-3094-4



Altre informazioni / materiali aggiuntivi

Metodi didattici
    • Lezioni frontali
    • Esercitazioni
    • Slide
    • Project work
    • Utilizzo del linguaggio di programmazione open source R
Modalità di valutazione
  • L'esame finale consiste in una prova scritta, e in un project work.

    La prova scritta è costituita da domande di teoria.

    Il project work consiste in un lavoro applicativo da svolgere autonomamente o in gruppo di max 3 persone su dataset concordati con il docente, su cui applicare i principali argomenti svolti a lezione, utilizzando il linguaggio di programmazione R.

    Il project work va consegnato il giorno della prova scritta.

    La prova orale è facoltativa.

    La prova scritta e il project work (ed eventualmente la prova orale) contribuiscono in egual misura al risultato finale.


    I criteri adottati per la graduazione dei voti della prova scritta, del project work e della prova orale sono i seguenti:

    a) conoscenza e comprensione dei concetti teorici (il 30% sul totale della valutazione complessiva)

    b) capacità di applicare le conoscenze (il 40% sul totale della valutazione complessiva)

    c) autonomia di giudizio e di pensiero critico (il 30% sul totale della valutazione complessiva)

Lingue, oltre all'italiano, che possono essere utilizzate per l'attività didattica

Italiano

  Torna alla scheda
  Materiali didattici
Avviso
I materiali didattici sono reperibili nella stanza Teams al link di seguito
Info
» Vai alla stanza Teams