Condividi l'articolo

Citized Data Scientist

Il cambiamento nel mondo della gestione ed elaborazione dei dati è ormai una realtà che non può essere ignorata.

Il Data Ops, la Modern Bi, l’advanced Analitycs sin dai primi vagiti hanno dimostrato la loro forza trainante, scuotendo con un ruggito possente le fondamenta della gestione dati, portando a galla un nuovo modo di estrarre, manipolare, arricchire ed infine mostrare il valore delle informazioni nascoste all’interno delle società.

Attorno a queste realtà sono cresciute figure come i Data Scientist, Data Manager, Data Ops Specialist, Data Analyst … che hanno l’arduo compito di portare avanti una cultura basata sui dati e sulle persone.

data scientist

I protagonisti

E proprio le persone, ci si è resi conto, sono il fulcro per valorizzare le esperienze salvate sotto forma di informazioni, presenti all’interno delle aziende.

L’esperti dei dati, che conoscono la natura delle informazioni, raccolte attraverso software ed immagazzinate in varie fonti, chi estrae e “pulisce” i dati, adattandone le caratteristiche per l’analisi successiva, chi ne arricchisce il contenuto con modelli matematici o lo rappresenta attraverso visualizzazioni accattivanti, sono la pietra di volta che sorregge l’universo dei dati.

Sono dunque presenti molte figure, ognuna con una propria caratteristica e specializzazione che varia nei termini e a volte nella definizione, dalla combinazione dei ruoli e delle esperienze delle persone.

Ci vorremmo concentrare in questo breve articolo sui Citized Data Scientist che Gartner descrive come “Una persona che crea o genera modelli che utilizzano analisi diagnostiche avanzate o capacità predittive e prescrittive, ma la cui funzione lavorativa primaria è al di fuori del campo della statistica e dell’analisi”, una figura che viene spesso confrontata con il data scientist.

Quali sono allora le caratteristiche distintive di un Citized Data Scientist?

Intanto sono utenti esperti di software che possono svolgere attività di analisi dei dati a livello medio, e che possiedono competenze simili ai data scientist, come conoscenze statistiche e matematiche, ed hanno la capacità di analizzare nuovi dati per migliorare i modelli esistenti.

Questo non vuol dire che possano sostituire i data scientist esperti, che possono contare nel loro bagaglio di competenze, sulla capacità e le conoscenze di linguaggi come R o Python, e creano e distribuiscono modelli di base per ottenere informazioni sempre migliori.

L’idea e che la maggior parte delle persone non sia in grado di creare gli algoritmi necessari per alimentare l’analisi predittiva, il data mining e altre tecniche di big data di cui le aziende hanno bisogno.

Ecco perché la scienza dei dati richiede elevati livelli di istruzione avanzata in settori di nicchia della matematica e dell’informatica, ed in questo ambito prosperano le capacità dei data scientist.

Il citizen nasce dall’interno dell’azienda.

L’idea predominante è che le organizzazioni possano sfruttare le competenze già presenti, riducendo al minimo l’onere della formazione, e massimizzando le conoscenze sul domino funzionale già presenti.

data scientist

L’evoluzione classica di questa figura è quella dell’esperto storico nell’ambito funzionale e di business, che ha una profonda eradicata conoscenza dei processi attraverso i quali transitano le informazioni, e già ne conosce il valore, ma che spesso per mancanza dei giusti mezzi non riesce a valorizzarlo.

I fogli di calcolo sono lo strumento “classico” di queste figure altamente specializzate, ma ad un certo punto, per quantità o complessità delle informazioni, diventano un vincolo.

Proprio per queste persone, sono nati e si evolvono continuamente strumenti di analisi di business e modelling dei dati, con interfacce semplici ma potenti, che permettono il salto di qualità necessario, riducendo al minimo la formazione e il tempo di messa in atto.

Un esempio di software, con queste caratteristiche, è Alteryx.

Attraverso una interfaccia Drag & Drop, intuitiva e veloce, permette di connettere basi dati disomogenee e variegate, come file csv o fogli excel ma anche dati strutturati provenienti da DB di livello entreprise come Oracle, Sql Server, SAP o varie fonti di big data.

alteryx

Il limite dei fogli dati, legato alla quantità dei valori rappresentabili e alle fonti utilizzabili, viene abbattuto, sarà possibile da subito inserire tutte le informazioni in un unico workflow, verificando i valori passo passo, e non solo alla fine del processo, e soprattutto senza l’onere di conoscere linguaggi come Sql o simili

Questo non significa che si perdano le buone abitudini della sicurezza, o l’accesso ai dati sia senza controllo, non vogliamo un far west del data management.

Ma se ci fermassimo alla gestione del dato, avremmo un vantaggio minimo.

Alteryx permette di arricchire i dati con analisi geospaziali, modelli matematici pronti e depositarne i risultati su nuove fonti, o lavorare direttamente sulle basi dati esistenti, aggiornando o aggiungendo valori, e il tutto senza dover conoscere R, Python o altro.

Insomma, stiamo parlando dell’anello mancante tra il business analyst esperto, che per velocizzare il proprio lavoro spesso scarica e rielabora i dati, creando duplicazioni e disperdendo di fatto le informazioni, in mancanza di un collettore unico che ne permetta il riutilizzo, ed una persona competente e senza più barriere, come il Citized Data Scientist.

Con questo non vogliamo affermare che tutto si possa risolvere con uno schiocco di dita, e la magia del software sopperisca a tutte le necessità, ma sicuramente è un formidabile acceleratore per sfruttare le competenze sedimentate all’interno delle aziende e portarne a galla il valore.

L’evoluzione dell’esperto di processi e dati verso la figura de citized data scientist, passa dunque attraverso un nuovo modo di gestire il dato e innovativi potenti strumenti.

0 commenti

Invia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *