I dati raccolti con l'IIoT e le tecnologie Industria 4.0 sono realmente utilizzabili?




I dispositivi IoT e L’Industria 4.0 ci hanno abituato ad avere con una certa facilità e abbondanza informazioni sul funzionamento delle macchine e dei processi produttivi nelle aziende. Come già spiegato in questo articolo, è bene pianificare quali dati scambiare con le macchine.

Le metodologie di analisi moderne sono “data driven” anziché “solution driven”. In passato era necessario partire da un'ipotesi che andava verificata, mentre adesso è possibile partire dai dati ed estrarre degli “indizi”.

Questo ha contribuito a diffondere l’errata concezione che basta prendere dei dati qualunque, darli in pasto ad un sistema di Industrial Analytics e magicamente escono delle correlazioni. Anche se in parte è così, accumulare dati senza una strategia può rivelarsi uno spreco.

I dati devono essere estratti e memorizzati rispettando alcuni criteri che li rendano fruibili, soprattutto se devono essere usati per Machine Learning, Industrial Analytics, o anche solo per semplici statistiche.

I Data Scientists sanno per esperienza come dovrebbero essere acquisiti e organizzati i dati, perché hanno passato giorni e giorni a cercare di integrarli o a renderli elaborabili. Io faccio di solito una attenta analisi prima di configurare l’acquisizione di dati, ma in generale adotto, come minimo, la regola delle 3 W, cioè mi pongo queste tre domande fondamentali:

What? Cosa?

“Cosa influisce sul risultato che voglio migliorare?” L’informazione va sempre contestualizzata al massimo: macchina, operatore, articolo, ordine, materia prima, temperatura, pressione, forza, ecc. Se c’è il minimo sospetto che un fattore possa modificare il risultato di un processo, va incluso nell’acquisizione.

Mi è capitato di vedere fiumi di dati senza il relativo contesto, che richiedevano uno sforzo indicibile per ricongiungerli a quest’ultimo, tipico dei dispositivi IIoT. Un esempio: mi hanno chiesto di elaborare dei dati di consumi energetici già acquisiti dal cliente stesso. Guardando il grafico si vedeva che variavano vistosamente nel tempo, ma i valori di consumo avevano solo la data e ora di acquisizione. Cosa si stava producendo quando il grafico si impennava? Qual era l’articolo che faceva salire i consumi? Dai dati non era deducibile.

When? Quando?

In realtà le domande sono due.

“Quando è nato il dato?” Bisogna mettere sempre il timestamp di generazione dell’informazione.  Serve anche per sincronizzare e quindi includere fattori provenienti da altre fonti.

“Quando dovrei campionare il valore?” Spiego con un esempio. Immaginiamo di acquisire il colore, il peso o l’altezza di alcuni pezzi che passano su un nastro trasportatore. Se si hanno a disposizione questi dati in tempo reale e si decide di memorizzarli a intervalli regolari, i valori acquisiti saranno probabilmente "sporchi” perché alcuni saranno stati campionati quando il pezzo non è nel punto di lettura dei sensori. In questo caso bisogna sincronizzarsi con il sistema di movimentazione e acquisire il valore nel momento in cui il pezzo passa e viene misurato, non ad intervalli regolari.

Why? Perché?

Prima di mettere via grosse quantità di dati bisogna chiedersi “Perché sto acquisendo questi dati?”. Se si vuole riuscire a prevedere un evento, magari con tecniche di Predictive Analytics, oltre ai dati che potrebbero influire su di esso (fattori), bisogna associare l’esito, cioè il risultato ottenuto. Senza quest’ultimo non sarà possibile fare Machine Learning e di conseguenza la predizione o la classificazione.

In pratica monitorare il processo memorizzando tutto ciò che succede, senza associare anche quando va bene e quando no, ha poca utilità. Questo errore l’ho visto commettere più spesso di quanto non si immagini.

Riassumendo: Chiediti cosa influisce sul risultato che vuoi analizzare/migliorare e memorizza i fattori che lo determinano, cioè la contestualizzazione dell’evento in osservazione. Chiediti se è necessaria la sincronizzazione dei dati in acquisizione e memorizza sempre il timestamp del momento in cui sono presi. Chiediti per quale risultato hai bisogno di determinate informazioni e registra il risultato ottenuto insieme al contesto.

Ecco alcuni spunti di riflessione su come acquisire i dati in modo che siano realmente utilizzabili. Ora sei pronto a fare Industrial Analytics?