Descrizione
Il Machine Learning predittivo è senz’altro oggi al picco delle aspettative nella Data Science. Si tratta di un insieme di tecniche logiche ed algoritmi matematici per prevedere in modo automatico informazioni numeriche e non, basandosi sui dati aziendali del passato (dei quali si assume quindi la disponibilità), contribuendo così a prendere decisioni operative in modo guidato dai dati (data-driven), seppur sempre col supporto dell’esperienza delle persone.
Il corso, dopo aver illustrato gli aspetti teorici ed i concetti fondamentali del Machine Learning, si sofferma sul problema chiave della sua applicazione: scegliere le implementazioni adatte, i casi d’uso aziendali dove esso può funzionare e fare la differenza, evitando invece le implementazioni premature. Il corso ha un taglio pratico orientato alle aziende e fornisce esempi, linee-guida e casi d’uso.
Saranno illustrate competenze e figure necessarie ed alcuni tipici aspetti organizzativi legati all’introduzione in azienda del Machine Learning ed alla sua gestione, per poi passare all’integrazione in azienda e nel portafoglio applicativo dei vari modelli che si vanno a costruire (da parte del Data Scientist o dei tool).
Obiettivi
L’obiettivo principale del corso è fornire ai partecipanti le competenze per comprendere algoritmi e tecniche del Machine Learning predittivo, come integrarlo in azienda e quali sono le implementazioni adatte. Il corso ha lo scopo di mostrare strumenti e linguaggi di Machine Learning, ma non fornisce le competenze per utilizzarli.
Conoscenze in uscita
A fine corso, i partecipanti saranno in grado di:
- Comprendere algoritmi e tecniche l0gico-matematiche del Machine Learning
- Valutare in modo obiettivo le potenzialità del Machine Learning in azienda
- Scegliere le modalità corrette di integrazione e implementazione in azienda
Programma didattico
Introduzione al Machine Learning predittivo
- Che cosa è il ML e perché se ne parla tanto oggi. Realtà vs hype
- Perchè il ML può aiutare le aziende a prendere decisioni migliori
- Sviluppare una mentalità data-driven
- Quali aspetti del business di una azienda sono adatti al ML (predittivo)?
Dati e variabili
- Analisi dati esplorativa: pattern e relazioni
- Modelli e dataset
- Osservazioni e tipi variabili
I modelli
- Comprensione vs. previsione.
- Le tipologie classiche di «problema di ML»
- Un framework più ampio: modelli descrittivi, predittivi e prescrittivi
- Altre tipologie di modelli
La previsione numerica
- Algoritmi di previsione numerica
- Dataset imperfetti e mal classificati
- Generalizzazione, Overfitting, variabili omesse e underfitting
- L’importante trade-off tra bias a varianza.
La classificazione
- Algoritmi di classificazione: KNN, alberi di classificazione, regole di classificazione, ecc. Esempi.
- Classificazione binaria vs non-binaria.
- Cenni ai metodi ensemble (boosting, bagging, forest)
Oltre la regressione lineare semplice
- Linearizzazione tramite trasformazione di variabile
- Cenni a regressioni multipla e multivariata
- Regressione non-lineare
- Cenni a regressione step-wise
La valutazione e la selezione del modello
- Valutazione dell’accuratezza dei modelli predittivi
- Prediction error: tipologie a seconda del modello
- La validazione incrociata (cross-validation)
- Il bootstrapping
- Valutazione oggettiva vs soggettiva
Ambienti di sviluppo e tool
- Sviluppi custom con: Excel, R, Python, o Java?
- Lo stack Hadoop – NoSQL – Apache Spark
- I framework commerciali di Machine Learning
- ML predittivo in tempo reale con Apache KafKa e Spark Streaming
- Standard internazionali
Istruzioni per partire
- Punto chiave: come cominciare ad applicare ML in azienda e massimizzare le probabilità di riuscita
- Tempi di creazione di un modello
- Tempi e costi per partire
Integrare i (primi) modelli di Maching Learning in azienda
- Integrazione dei modelli costruiti dal Data Scientist con quelli costruiti dai tool
- Integrazione del ML nella filiera produttiva esistente (ICT)
- Integrazione del ML nel modo di lavorare
- Integrazione di modelli ML tra gruppi di lavoro e tool diversi
- Integrazione delle query, della data visualization e dei modelli predittivi
Caratteristiche del corso
| 21 ore | |
| Case study, Lezione frontale, Aula Virtuale | |
| Dispense | |
| CTO, IT Manager | |
| Attestato di frequenza e profitto. |
