Salta ai contenuti. | Salta alla navigazione

Image Portlet
Home Luisa Scaccia Didattica 2024/2025 Informatica e analisi dei big data

Analisi dei big data - Analisi dei big data - mod. b

  • Informatica e analisi dei big data - Informatica e analisi dei big data - mod. b Classe: LM-16
  • A.A. 2024/2025
  • CFU 3, 3(m)
  • Ore 20, 20(m)
  • Classe di laurea LM-77, LM-16(m)
Luisa Scaccia / Professoressa di ruolo - II fascia (STAT-01/A)
Dipartimento di Economia e Diritto
Prerequisiti

Conoscenze di base di statistica descrittiva e inferenziale, e probabilità


Obiettivi del corso

Il corso ha l'obiettivo di fornire agli studenti una serie di strumenti per modellizzare e comprendere insiemi di dati complessi e di grandi dimensioni. Il taglio del corso è di tipo pratico e applicato all'apprendimento statistico in ambito aziendale, del marketing e della finanza. Le esercitazioni previste hanno lo scopo di illustrare l'implementazione dei vari metodi di apprendimento statistico utilizzando il software statistico R e servono allo studente per acquisire consapevolezza del proprio grado di comprensione e conoscenza dei temi trattati.

Programma del corso

Il corso introduce i metodi lineari avanzati di apprendimento statistico supervisionato e alcune tecniche di apprendimento statistico non supervisionato. Nella prima parte del corso vengono considerate tecniche di apprendimento supervisionato, quali regressione ridge e lasso, e metodi particolarmente indicati in problemi ad alta dimensionalità, quali la regressione delle componenti principali e i minimi quadrati parziali. La parte conclusiva del corso considera metodi di apprendimento non supervisionato come l'analisi in componenti principali e le metodologie di clustering gerarchico e non gerarchico.

Testi (A)dottati, (C)onsigliati

(A); G. James, D. Witten, T. Hastie, R. Tibshirani; Introduzione all’apprendimento statistico con applicazioni in R; Piccin, Padova, 2020; Capitoli: 6 e 10; ISBN: 978-88-299-3094-4


Altre informazioni / materiali aggiuntivi

I lucidi utilizzati a lezione saranno disponibili nel canale Teams del corso, insieme a testo e soluzione delle esercitazioni e delle prove scritte dei passati appelli, e ad ogni altro supporto didattico utilizzato durante le lezioni. 


Metodi didattici
    • Lezioni frontali
    • Esercitazioni
    • Slide
    • Project work
    • Utilizzo del linguaggio di programmazione open source R


Modalità di valutazione
  • L'esame finale consiste in una prova scritta, e in un project work.

    La prova scritta è costituita da domande di teoria. Nessun materiale didattico è consultabile durante la prova scritta.

    Il project work consiste in un lavoro applicativo da svolgere autonomamente o in gruppo di max 3 persone su dataset concordati con il docente, su cui applicare i principali argomenti svolti a lezione, utilizzando il linguaggio di programmazione R. E' naturalmente possibile utilizzare il libro di testo e tutto il materiale didattico ritenuto necessario, durante la stesura del project work.

    Il project work va consegnato il giorno della prova scritta.

    La prova orale è facoltativa.

    La prova scritta e il project work (ed eventualmente la prova orale) contribuiscono in egual misura al risultato finale.


    I criteri adottati per la graduazione dei voti della prova scritta, del project work e della prova orale sono i seguenti:

    a) conoscenza e comprensione dei concetti teorici (il 30% sul totale della valutazione complessiva)

    b) capacità di applicare le conoscenze (il 40% sul totale della valutazione complessiva)

    c) autonomia di giudizio e di pensiero critico (il 30% sul totale della valutazione complessiva)

Lingue, oltre all'italiano, che possono essere utilizzate per l'attività didattica

Inglese

Lingue, oltre all'italiano, che si intende utilizzare per la valutazione

Italiano

  Torna alla scheda
Calendario
  Materiali didattici
Avviso
I materiali didattici sono reperibili nella stanza Teams al link di seguito
Info
» Vai alla stanza Teams