Condividi l'articolo

Alfa e Omega

La Data Analysis, è scontato dirlo usa come carburante i dati, li modifica li arricchisce e li espone in nuove forme, ma da dove ha inizio e dove finisce?

L’Alfa e l’Omega, senza entrare in argomenti filosofici o esoterici, dell’analisi dati sono i processi di raccolta e di messa a disposizione.

In questa prima parte affronteremo l’importanza cruciale del recepire le informazioni.

alfaeomega

Parliamo di informazioni e non di dati, perché il dato come lo intendiamo solitamente, immagini, testi, suoni  sono già una elaborazione degli input di base che il mondo restituisce in varie forme.

Facciamo un passo indietro per meglio contestualizzare il concetto di informazione, e “sentiamo” cosa ha da dirci la Wikipedia.

L’informazione è l’insieme di dati, correlati tra loro, con cui un’idea (o un fatto) prende forma ed è comunicata.

Concentrerei l’attenzione su alcuni termini come dati, correlazione e comunicazione, che escono preponderanti dalla definizione.

I dati, sappiamo essere la base, ovvero il mattoncino elementare su cui basiamo le nostre analisi, e nelle quali cerchiamo come, moderni Indiana Jones, le correlazioni per raggiungere il sacro Graal della comprensione, ma il vero cruccio, è la modalità di comunicazione attraverso cui ci arrivano queste informazioni.

La Data Ops (https://www.dataopsmanifesto.org/) collega processi e soluzioni tecnologiche per costruire un percorso di gestione dei dati che tra i primi paradigmi vede “Individui e interazioni su processi e strumenti”, e trova naturale sbocco nell’APA.

L’Analytics Process Automation, offre automazione dei processi di analisi end to end, usando apprendimento automatico e data science con lo scopo di alzare il livello di agilità dei processi, al fine di accelerare la trasformazione digitale, attraverso il reperimento agile dei dati.

Entriamo ancora più nel dettaglio, ed usiamo come base d’esempio una delle piattaforme leader di mercato, che ha inserito come paradigma di base del suo processo l’APA; ovvero Alteryx.

Suddividiamo in macro parti il flusso di analisi, e concentriamoci sulla prima fase, gli input asset.

Alteryx come molti altre piattaforme rivoluzionarie, permette l’accesso alle fonti dati maggiori, siano essere piatte, come file o fogli tabellari, relazionali, sql o no-sql e cloud, in questo caso specifico “Oltre 80 origini dati integrate in modo nativo da Amazon a Oracle a Salesforce.”

Fin qui direi nulla di nuovo rispetto ad un’ottima piattaforma di ETL come può essere considerata quella di Alteryx, ma diamo un’occhiata al processo APA, usando come spunto, lo schema estratto dal sito principale.

data

Vediamo immediatamente alla sinistra, per i più esperti ma anche per quelli alle prime armi, una serie di voci conosciute, File, Docs, Data Platform, Applications, Cloud, Sources, ma anche qualcuna un po’ meno usuali come Logics e RPS Bots.

E qui che entra in gioco, l’informazione.

Ricordate, accennavamo proprio all’informazione come generalizzazione dei dati, o ai dati come un prodotto di elaborazione delle informazioni.

Immaginate ora se potessimo avere il reperimento delle informazioni da passarle al processo di pulizia e arricchimento, ma in modo automatico, e se aggiungessimo che sarà l’utilizzatore finale a decidere quali e come reperire tali informazioni?

Avremmo una piattaforma self-service, con l’accesso ai dati integrato, creata per semplificare e automatizzare la pipeline dei dati di un processo aziendale analitico, mantenendo governance, sicurezza e visibilità granulare dei dati.

Poco altro è necessario aggiungere, sono evidenti le potenzialità che un processo di APA sviluppato con il giusto compendio di tecnologie può sviluppare, all’interno dell’ecosistema di una azienda.

Abbiamo quindi un processo “Alfa” di estrapolazione dei dati, che non si ferma al dato strutturato ma ne recepisce tutte le forme, integrando nella pipeline le fonti di informazione, che sono rese disponibili all’utente finale, nativamente un Citizen Data Scientist, in modalità self-service.

Certo non abbiamo re-inventato la ruota, ma gli abbiamo inserito un potente e scattante motore, all’interno di un processo agile, strutturato e controllato.

data

0 commenti

Invia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *