Big data e LION, dai dati ai modelli all’ottimizzazione
ITBTA01
Docenti
Prof. Mauro Brunato (LIONlab, Università di Trento)
Descrizione introduttiva
Il corso ha l’obiettivo di esporre metodi basati sulle tecniche di machine learning ed ottimizzazione da un punto di vista concreto e hands-on, per mettere in grado l’utente di partire da grandi moli di dati (big data, non necessariamente strutturati) e ricavare modelli "intelligenti" in grado di meglio supportare le decisioni.
Un approccio professionale all’uso del big data consiste in più passi: dai dati ai modelli, all'utilizzo dei modelli per le previsioni, alla verifica dell'adeguatezza dei modelli. Il termine Learning and Intelligent Optimization (LION) sottolinea l’orientamento pratico: partire dai dati, usare tecniche di apprendimento automatico per costruire modelli, usare i modelli per identificare situazioni migliorative.
Learning and Intelligent Optimization propone l'unificazione e l'integrazione di data mining, modellazione e visualizzazione interattiva, in un ciclo continuo di innovazione alimentato da metodi di apprendimento umano ed automatico.
Conteuti
I metodi e gli strumenti software presentati nel corso includono:
- La capacità di importare dati da file e dalla maggior parte delle banche dati esistenti, sia locali che distribuite in diversi server (e raggiungibili da Internet).
- Strumenti di analisi esplorativa dei dati per navigare rapidamente, visualizzare e derivare sommari pertinenti (compresi grafici a barre, grafici a bolle, grafici a torta, istogrammi, grafici radar, grafici a linee e semplici opzioni di filtraggio come filtri paralleli, ma anche funzionalità avanzate come scansioni nel tempo).
- Strumenti per la gestione di tabelle di dati, per unire tabelle, filtrare i dati.
- Metodi di progettazione di esperimenti (DOE), al fine di predisporre dati per esplorazioni di strategie alternative.
- Metodi per identificare automaticamente soluzioni migliorative (ottimizzazione)
Obiettivi
Il corso ha l’obiettivo di esporre metodi basati sulle tecniche di
machine learning ed ottimizzazione da un punto di vista concreto e
hands-on, per mettere in grado l’utente di partire da grandi moli di
dati (big data, non necessariamente strutturati) e ricavare modelli "intelligenti" in grado di meglio supportare le decisioni.
Un approccio professionale all’uso del big data consiste in più
passi: dai dati ai modelli, all'utilizzo dei modelli per le previsioni,
alla verifica dell'adeguatezza dei modelli. Il termine Learning and
Intelligent Optimization (LION) sottolinea l’orientamento pratico:
partire dai dati, usare tecniche di apprendimento automatico per
costruire modelli, usare i modelli per identificare situazioni
migliorative.
Learning and Intelligent Optimization propone l'unificazione e
l'integrazione di data mining, modellazione e visualizzazione
interattiva, in un ciclo continuo di innovazione alimentato da
metodi di apprendimento umano ed automatico.
Gli argomenti e gli strumenti software presentati nel corso
includono:
- La capacità di importare dati da file e dalla maggior parte delle
banche dati esistenti, sia locali che distribuite in diversi server (e
raggiungibili da Internet).
- Strumenti di analisi esplorativa dei dati per navigare
rapidamente, visualizzare e derivare sommari pertinenti
(compresi grafici a barre, grafici a bolle, grafici a torta,
istogrammi, grafici radar, grafici a linee e semplici opzioni di
filtraggio come filtri paralleli, ma anche funzionalità avanzate
come scansioni nel tempo).
- Strumenti per la gestione di tabelle di dati, per unire tabelle,
filtrare i dati.
- Metodi di progettazione di esperimenti (DOE), al fine di
predisporre dati per esplorazioni di strategie alternative.
- Metodi per identificare automaticamente soluzioni migliorative
(ottimizzazione).
Programma
Prima Giornata
9.30 Benvenuto
9.45 Introduzione delle tecniche dal punto di vista pragmatico (come
usarle per ottenere risultati)
11.15 Pausa caffè
11.30 Introduzione delle tecniche dal punto di vista pragmatico (come
usarle per ottenere risultati)
13.30 Pausa pranzo
14.00 Test guidato hands-on con il software Grapheur
16.00 Pausa caffè
16.15 Test guidato hands-on con il software Grapheur
17.30 Conclusione
Destinatari
Tecnici interessati a sfruttare la potenza di tecniche di machine learning ed ottimizzazione per estrarre valore dai dati aziendali, costruendo modelli utilizzabili pragmaticamente.
Prerequisiti
Il corso non presuppone conoscenze pregresse a parte un minimo di familiarità nel lavorare con file di dati su computer.
Materiale didattico
Il corso è basato su alcuni capitoli del testo:
Roberto Battiti and Mauro Brunato
THE LION WAY: Machine Learning plus Intelligent Optimization
LIONlab, University of Trento, Italy, Feb 2014.
Una copia delle slides utilizzate a lezione verrà distribuita ai partecipanti.