Data mining
- A.A. 2023/2024
- CFU 6
- Ore 40
- Classe di laurea L-41
Conoscenze di base di statistica descrittiva e inferenziale, e probabilità
Il corso intende fornire un’introduzione alle principali tecniche statistiche di Data Mining attraverso le più moderne tecniche e strategie per l’analisi di grandi moli di dati, illustrando le problematiche connesse.
Alla fine del corso lo studente ha la possibilità di proporre i principali algoritmi , discernendo pregi e difetti, essendo in grado di sperimentare ed applicare le conoscenze acquisite su dati reali.
Il corso affronta lo studio di tecniche modellistiche algoritmiche e le principali problematiche e tecniche statistiche di Data Mining.
- Data mining, robustezza, overfitting e problematiche di validazione dei risultati.
- Regole associative.
- Modelli statistici per la classificazione supervisionata (modello lineare, analisi discriminante parametrica, modello logistico binario e multinomiale).
- Algoritmi per la classificazione supervisionata (Naive Bayes, Nearest Neighbour, neural network, regressioni lasso, Alberi decisionali e Classificativi, PLS, Bagging, Boosting and Random forest)
(A); G. James, D. Witten, T. Hastie, R. Tibshirani; Introduzione all’apprendimento statistico con applicazioni in R; Piccin, Padova, 2020; Capitoli: 1-9; ISBN: 978-88-299-3094-4
Altre informazioni / materiali aggiuntivi
-
- Lezioni frontali
- Esercitazioni
- Slide
- Project work
- Utilizzo del linguaggio di programmazione open source R
L'esame finale consiste in una prova scritta, e in un project work.
La prova scritta è costituita da domande di teoria.
Il project work consiste in un lavoro applicativo da svolgere autonomamente o in gruppo di max 3 persone su dataset concordati con il docente, su cui applicare i principali argomenti svolti a lezione, utilizzando il linguaggio di programmazione R.
Il project work va consegnato il giorno della prova scritta.
La prova orale è facoltativa.
La prova scritta e il project work (ed eventualmente la prova orale) contribuiscono in egual misura al risultato finale.
I criteri adottati per la graduazione dei voti della prova scritta, del project work e della prova orale sono i seguenti:
a) conoscenza e comprensione dei concetti teorici (il 30% sul totale della valutazione complessiva)
b) capacità di applicare le conoscenze (il 40% sul totale della valutazione complessiva)
c) autonomia di giudizio e di pensiero critico (il 30% sul totale della valutazione complessiva)
Italiano