Pillole di Automazione Industriale ed Information Technology . Inserisci nella casella "cerca" la parola o il termine di cui vuoi avere informazioni.

venerdì 6 agosto 2021

 IL DATO

Sentiamo sempre più spesso parlare del dato come una cosa fondamentale su cui basare il nostro business futuro. Big data, IoT Industry 4.0

L'importanza del dato è oggettivamente reale ma siamo ancora legati all'idea del dato in termini di possesso, come un qualche cosa da conservare, proteggere e difendere a costo della vita piuttosto che come un qualcosa da analizzare e da cui "imparare" insomma da sfruttare.

In realtà il dato in quanto tale è funzionale esclusivamente a ciò che viene dopo ( analisi e costruzione di modelli che possano ottimizzare ed efficentare quello che facciamo tutti i giorni.).

Raccogliere e stoccare il dato fine a se stesso nei classici DB è costoso e ha dei costi di mantenimento elevatissimi ( Server , DB stessi etc.) per non parlare dei tempi di accesso ai database e della potenza (CPU) necessaria per lanciare query e realizzare anche solo timidi report.

Esistono già oggi tecnologie che permettono di gestire enormi flussi di dati "in Aria" real-time, chiamiamolo cloud  o qualsivoglia di cui si può decidere il tempo di mantenimento e dove direzionarli ( cioè a chi darli in pasto).

Per quanto tempo mantenere un dato ad esempio è una domanda altrettanto importante. Il dato dovrebbe essere funzionale ad un obiettivo dopodichè perde di valore.

"Certo ma se voglio mantenere uno storico per andarmelo a rivedere ?"

Ma cos'è che dobbiamo rivedere ? Quante cantine o soffitte piene zeppe di cose abbiamo tenuto nelle nostre case che non giuardiamo più da 30 anni ?

Possiamo al massimo conservare qualche report, ma quel numeretto in binario che sta in una celletta di un costoso database quando ha svolto la sua funzione a che ci serve?

Eppure quando abbiamo i nostri dati nelle cellette dei nostri DB siamo tutti più tranquilli e sereni, peccato che tra 5 annni la tecnologia sarà talmente avanti che i ns. DB magari non saranno più leggibili.

Questo è un'altro  problema molto serio che stanno già studiando. La perdita di memoria storica perchè i dispositivi che la contengono sono diventati illeggibili dalla tecnologia attuale.

Immaginiamo di aver salvato informazioni importantissime su floppy disk o ancora peggio su dischi da 5"e un quarto che utilizzavano anche certi sistemi di testing industriali 30 anni fa. Le informazioni ci sono ma oggi sarebbero illeggibili quindi inutilizzabili.

Il vero valore aggiunto sarà dunque ciò che riesco ad estrapolare dal dato e le informazioni che da esso sarò in grado di ricavare..

Queste informazioni vanno poi attuate per ottenere risparmio , efficientamento, ottimizzazione.

Parliamo di Software di Analitics che analizzano in real time enormi flussi di dati ed estraggono modelli ricorsivi ed informazioni che poi devono essere utilizzate per migliorare ed ottimizzare i nostri processi.

E allora quando i dati raccolti 6 mesi prima ci hanno fatto capire cose c'e' di migliorabile nella nostra macchina, processo o azienda a cosa ci servono ancora? Sarà più utile verificare i dati dei 6 mesi successivi per verificare il mantenimento ( o miglioramento ulteriore) di questi progressi e così via.

Gli Hardware ed i software con cui  raccogliamo i dati oggi saranno in grado di alimentare gli Analitics o i modelli di AI che usciranno domani?

C'è un approccio culturale da cambiare per portare a nostro favore la tecnologia e sopratutto nessuna decisione da prendere perchè che ci piaccia o no è stata già presa.

Di fatto la scelta l'abbiamo già fatta superando abbondantemente il punto di non ritorno, pensiamo ai nostri patrimoni e alla nostra identità stessa ( posizione fiscale, sanitaria etc.), tutto già corre sottoforma di flussi di dati da un server all'altro già da parecchio tempo.

Non si può più tornare indietro che piaccia o no , se ti fermi vieni travolto , andare avanti è ancora la soluzione statisticamente meno rischiosa e ... speriamo in DIO.

sabato 2 gennaio 2021

Analitics, analisi dati , Scada - che differenza c'e'?

Oggi  la tecnologia informatica che già c'e' , può consentirci di buttare un occhio là dove prima non si riusciva a vedere e farci scoprire informazioni nuove sulla macchina che abbiamo davanti da sempre.

Da sempre raccogliamo dati attraverso software SCADA o similari , si tratta di dati grezzi raccolti , visualizzati e stoccati in qualche database. Andando ad effettuare successivamente le query sul database andiamo a visualizzare l'andamento di questi dati nel tempo.

Già in questo momento esistono servizi in grado di analizzare in realtime  grossi volumi di dati permettendo, attraverso l'individuazione di modelli ricorsivi ,di farci scoprire i punti migliorabili delle macchine che produciamo che i software di acquisizione/registrazione dati non sono in grado di mostrarci.

I processi fisici delle nostre macchine ed impianti ad oggi hanno ancora ampi margini  di ottimizzazione, dipende tutto da che strumenti utilizziamo per approfondirne la loro conoscenza.

Analytics è il processo scientifico di scoperta e comunicazione dei modelli significativi che possono essere trovati nei dati. In pratica i dati grezzi vengo trasformati in insights (intuizioni) utili per prendere decisioni migliori e si basa su un insieme di scienze, tecniche e tecnologie che vanno dalla statistica, alla matematica, alle tecnologie di business intelligence di base, al reporting, all’elaborazione analitica online (Olap) e varie forme di analisi avanzate.


La differenza dunque tra l'Analytics e l'Analisi dati come l'abbiamo sempre considerata è :

l’analysis è focalizzata sulla comprensione del passato, quello che è successo;
analytics si concentra invece sul perché è successo e su cosa succederà dopo.