Search Google Appliance

Data mining

  • Edizioni di altri A.A.:
  • 2019/2020

Dati insegnamento


Lingua Insegnamento:
Italiano con libri di testo e altro materiale didattico in inglese. 
Testi di riferimento:
• Pang-Ning Tan, Michael Steinbach, Vipin Kumar. Introduction to Data Mining (2nd edition). Prentice Hall.

• Rosaria Silipo. KNIME Beginners Luck. 
Obiettivi formativi:
Un digital marketing manager ha bisogno di informazioni per poter progettare una campagna efficace. Queste informazioni, nella maggior parte dei casi, non provengono da indagini di mercato tradizionali, ma devono essere ricavate dall'analisi di dati raccolti per gli scopi più disparati: log di siti web, dati di vendita, servizi pubblicitari digitali come Google Analytics, etc... Talvolta la mole dei dati grezzi è così vasta che è necessario ricorrere a meccanismi computazionali distribuiti: si entra, cioè, nel reame dei big data.

Ovviamente, la figura professionale che è normalmente preposta a questo tipo di analisi non è il digital marketing manager ma il data scientist. Tuttavia, è importante che anche le figure manageriali abbiano una preparazione di base nell'ambito dell’estrazione della conoscenza dei dati, sia allo scopo di dialogare in maniera più efficiente con le figure preposte a questa attività, sia perché, in contesti medio-piccoli, potrebbe non essere disponibile una figura specifica di data scientist e il manager si potrebbe trovare nella posizione di dover sopperire a questa mancanza. In ogni caso, avere una preparazione di base nell’ambito del data mining è utile per conoscere potenzialità e limiti degli strumenti che si hanno a disposizione. Obiettivo del corso è dunque fornire queste conoscenze di base, come dettagliato nella sezione sui contenuti del corso.

In maniera più specifica, e riferendosi agli indicatori di Dublino, alla fine dell’insegnamento lo studente dovrà essere in grado di

CONOSCENZA E CAPACITÀ DI COMPRENSIONE:
• esporre in modo chiaro e corretto i concetti principali del data mining e dell'analisi dei dati;
• illustrare con precisione il comportamento dei principali algoritmi di analisi.

CONOSCENZA E CAPACITÀ DI COMPRENSIONE APPLICATE:
• svolgere in maniera autonoma semplici analisi di dati utilizzando il software KNIME;
• trarre informazioni a supporto delle strategie di marketing attraverso le metodologie di data mining.

AUTONOMIA DI GIUDIZIO:
• scegliere autonomamente il tipo dianalisi più idoneo in base agli obiettivi ed ai tipi di dato disponibili;
• interpretare autonomamente i risultati ottenuti dall’analisi dei dati, senza dover ricorrere ad esperti esterni.

ABILITÀ DI COMUNICAZIONE:
• comunicare con eventuali esperti di data scienze utilizzando un linguaggio corretto ed appropriato;
• comunicare ad altre figure manageriali i risultati dell’analisi dei dati in un linguaggio semplice ma corretto, facendo uso di grafici comprensibili e facilmente interpretabili.

CAPACITÀ DI APPRENDERE:
• leggere e capire testi in cui si parla, in maniera anche approfondita sebbene non al livello di attività di ricerca, di metodologie di analisi dei dati;
• leggere e capire testi in cui si parla di come utilizzare le tecniche di analisi dei dati ai fini del supporto alle strategie di marketing. 
Prerequisiti:
Pur non essendo richiesta nessuna propedeuticità, si raccomandano conoscenze di base di statistica descrittiva e sull'uso del calcolatore elettronico. 
Metodi didattici:
L'insegnamento prevede 54 ore di lezione, circa un terzo delle quali da svolgere in laboratorio di informatica. 
Modalità di verifica dell'apprendimento:
La valutazione del livello di apprendimento degli studenti sarà effettuata con il ricorso ad una prova pratica ed una successiva prova orale. La prova pratica, da svolgere in laboratorio con l'uso del software KNIME, valuterà la capacità dello studente di portare a compimento un’analisi di dati completa secondo la metodologia studiata a lezione. Pertanto, in relazione ai Descrittori di Dublino, la prova pratica è rivolta soprattutto a sondare il «saper fare» e l'«autonomia di giudizio». Rappresenta il 50% della valutazione complessiva (espressa in trentesimi).

La prova orale (altro 50% della valutazione complessiva) è rivolta a sondare nel discente le conoscenze acquisite, le abilità comunicative, la padronanza del linguaggio tecnico specifico della disciplina trattata e la chiarezza espositiva.

Le modalità d’esame sono le medesime per frequentanti e non frequentanti. 
Altre Informazioni:
Ulteriori informazioni sono disponibili sul sito web del corso nella piattaforma e-learning di ateneo. 

In questo corso studieremo il processo di estrazione della conoscenza dalle basi di dati, in particolare per ciò che riguarda le fasi di pulizia e pre-elaborazione dei dati, analisi dei dati e validazione dei risultati.

Per quanto riguarda la parte di analisi dei dati, sarà dato maggior spazio alle tecniche basate su intelligenza artificiale e machine-learning, visto che le tecniche di natura più propriamente statistica sono argomento di altri insegnamenti del medesimo corso di studi. Le lezioni teoriche saranno alternate ad esercitazioni pratiche utilizzando il software KNIME Analytics Platform (https://www.knime.com/). Durante le esercitazioni pratiche verranno presentati alcuni casi di studio che sono di particolare interesse per il Digital Marketing Manager, come la market basket analysis.


In questo corso studieremo il processo di estrazione della conoscenza dalle basi di dati, in particolare per ciò che riguarda le fasi di pulizia e pre-elaborazione dei dati, analisi dei dati e validazione dei risultati.

Per quanto riguarda la parte di analisi dei dati, sarà dato maggior spazio alle tecniche basate su intelligenza artificiale e machine-learning, visto che le tecniche di natura più propriamente statistica sono argomento di altri insegnamenti del medesimo corso di studi. Le lezioni teoriche saranno alternate ad esercitazioni pratiche utilizzando il software KNIME Analytics Platform (https://www.knime.com/). Durante le esercitazioni pratiche verranno presentati alcuni casi di studio che sono di particolare interesse per il Digital Marketing Manager, come la market basket analysis.

Più in dettaglio, il contenuto del corso sarà il seguente:

• Il processo di estrazione della conoscenza dai dati: pulizia e integrazione dati, selezione e trasformazione, data mining, validazione, presentazione.
• Dati: tipi di dati, sorgenti dei dati e big data, pre-elaborazione dei dati, misure di similarità e dissimilarità.
• Analisi di classificazione: alberi decisionali, reti neurali artificiali, overfitting, valutazione delle prestazioni di un classificatore.
• Analisi di associazione: itemset frequenti, regole associative, valutazione delle regole associative.
• Analisi di raggruppamento: metodi di partizionamento, metodi gerarchici, metodi basati su densità, valutazione della bontà di un'analisi di raggruppamento.