Data mining

  • A.A. 2024/2025
  • CFU 6
  • Ore 40
  • Classe di laurea L-41
Luisa Scaccia / Professoressa di ruolo - II fascia (STAT-01/A)
Dipartimento di Economia e Diritto
Prerequisiti

Conoscenze di base di statistica descrittiva e inferenziale, e probabilità

Obiettivi del corso

Il corso intende fornire un’introduzione alle principali tecniche statistiche di Data Mining attraverso le più moderne tecniche e strategie per l’analisi di grandi moli di dati, illustrando le problematiche connesse.
Alla fine del corso lo studente ha la possibilità di proporre i principali algoritmi , discernendo pregi e difetti, essendo in grado di sperimentare ed applicare le conoscenze acquisite su dati reali.


Programma del corso

Il corso affronta lo studio di tecniche modellistiche algoritmiche e le principali problematiche e tecniche statistiche di Data Mining.

  • Data mining, robustezza, overfitting e problematiche di validazione dei risultati.
  • Regole associative.
  • Modelli statistici per la classificazione supervisionata (modello lineare, analisi discriminante parametrica, modello logistico binario e multinomiale).
  • Algoritmi per la classificazione supervisionata (Naive Bayes, Nearest Neighbour, neural network, regressioni lasso, Alberi decisionali e Classificativi, PLS, Bagging, Boosting and Random forest)


Testi (A)dottati, (C)onsigliati

(A); G. James, D. Witten, T. Hastie, R. Tibshirani; Introduzione all’apprendimento statistico con applicazioni in R; Piccin, Padova, 2020; Capitoli: 1-9; ISBN: 978-88-299-3094-4

Metodi didattici
    • Lezioni frontali
    • Esercitazioni
    • Slide
    • Project work
    • Utilizzo del linguaggio di programmazione open source R


Modalità di valutazione
  • L'esame finale consiste in una prova scritta, e in un project work.

    La prova scritta è costituita da domande di teoria. Nessun materiale didattico è consultabile durante la prova scritta.

    Il project work consiste in un lavoro applicativo da svolgere autonomamente o in gruppo di max 3 persone su dataset concordati con il docente, su cui applicare i principali argomenti svolti a lezione, utilizzando il linguaggio di programmazione R. E' naturalmente possibile utilizzare il libro di testo e tutto il materiale didattico ritenuto necessario, durante la stesura del project work.

    Il project work va consegnato il giorno della prova scritta.

    La prova orale è facoltativa.

    La prova scritta e il project work (ed eventualmente la prova orale) contribuiscono in egual misura al risultato finale.


    I criteri adottati per la graduazione dei voti della prova scritta, del project work e della prova orale sono i seguenti:

    a) conoscenza e comprensione dei concetti teorici (il 30% sul totale della valutazione complessiva)

    b) capacità di applicare le conoscenze (il 40% sul totale della valutazione complessiva)

    c) autonomia di giudizio e di pensiero critico (il 30% sul totale della valutazione complessiva)


Lingue, oltre all'italiano, che possono essere utilizzate per l'attività didattica

Inglese

Lingue, oltre all'italiano, che si intende utilizzare per la valutazione

Italiano

  Torna alla scheda
Calendario
  Materiali didattici
Avviso
I materiali didattici sono reperibili nella stanza Teams al link di seguito
Info
» Vai alla stanza Teams