1. News
  • 13 maggio 2024
  • News

Data Strategy: il Data Evaluation Framework

In che modo si può valutare lo stato di salute dei dati? Ecco l’approccio Cerved verso data owner e data consumer

Condividi:

Negli ultimi anni abbiamo assistito a una costante crescita dei dati raccolti dalle aziende e ci si è resi conto che avere più dati non porta necessariamente a risultati migliori. Quello che realmente fa la differenza è la qualità dei dati, che, insieme a una corretta interpretazione, permette di velocizzare i processi e prendere decisioni corrette.

In Cerved, trovandoci a gestire i dati di circa 17 milioni di persone, 13 milioni di imprese, 60 milioni di fabbricati e 54 milioni di terreni, oltre a lavorare per avere una infrastruttura tecnologica agile e moderna, non possiamo prescindere da un forte presidio dello “stato di salute” dei nostri dati ovvero un concetto che estende quello di qualità dei dati, includendo anche altre dimensioni.

In questo articolo condividiamo il nostro approccio innovativo al punteggio dello stato di salute dei dati, il Data  Evaluation Framework di Cerved.

Ecco come lo abbiamo sviluppato e utilizzato e in che modo ci potrà aiutare in futuro.

La costruzione del Data Evaluation Framework

Il nodo cruciale che ci ha portato alla consapevolezza della necessità di questo approccio è che non potevamo più fare affidamento sull’applicazione delle norme per migliorare i dati: dovevamo fare affidamento sull’incentivazione sia del produttore sia del consumatore di dati. In che modo? I data consumer devono avere fiducia nei dati che utilizzano, mentre i data owner devono avere regole di controllo che siano proporzionali al livello di criticità del dominio, senza però rinunciare alla possibilità di “scalare” da parte di chi si occupa della governance centralizzata.

Per trovare questo equilibrio tra domanda e offerta, abbiamo introdotto il concetto di punteggio sullo stato di salute dei dati, correlandolo direttamente ai domini dati e ai singoli data asset.

Per produrre il punteggio abbiamo individuato i seguenti obiettivi:

– Far evolvere la nostra comprensione della qualità dei dati oltre una semplice definizione binaria (dati maturi/non maturi).

Supportare i data owner per valutare lo stato di salute dei dati al fine di incentivarne il miglioramento.

– Consentire la piena visibilità della situazione per e stimolare la domanda di dati con un livello di maturità adeguato all’esigenza dei data consumer.

– Trasparenza verso i data consumer per un utilizzo consapevole anche nel caso di composizione di più data asset ed evoluzioni nel corso del tempo.

Per raggiungere questi obiettivi, ci siamo concentrati sui seguenti aspetti cardine:

Perimetro: il punteggio può essere applicato a qualsiasi data asset o data domain.

Automazione: la raccolta degli input che determinano il punteggio deve essere il più possibile automatizzata, fermo restando il principio di accountability per i data owner.

Utilizzabilità: il punteggio è facile da capire e visualizzabile in dashboard intuitive sia per gli owner che per i consumer.

Multidimensionalità: il punteggio può essere scomposto in diverse dimensioni indipendenti tra loro.

Evoluzione: i criteri di punteggio e le relative definizioni possono cambiare nel tempo, per esempio aggiungendo ulteriori dimensioni.

Le dimensioni del modello

Seguendo i principi generali, abbiamo individuato le dimensioni da misurare per costruire il punteggio e modellare lo spazio con le dimensioni indipendenti: qualità dei dati, cybersecurity, gestione dei metadati, interoperabilità dei dati e copertura dei dati.

Ogni dimensione fornisce un punteggio sintetico (da 0 a 1) e una classe di appartenenza (da “Elevato” a “Minimo”) e può essere formato da alcuni indicatori per facilitare la comprensione da parte dei consumer e individuare più facilmente le aree di miglioramento per i data owner: non tutti i data consumer hanno bisogno di interpretare in profondità ogni singolo componente del punteggio, ma gli è sufficiente  sapere che un dominio dati, che ottiene un punteggio più basso in termini di affidabilità e usabilità, è più difficilmente fruibile.

La versione attuale del modello prevede:

1) Un singolo punteggio compreso tra 0 e 1. Abbiamo assegnato soglie categoriche di “Elevato”, “Alto”, “Medio”, “Basso” e “Minimo”, ideali per una valutazione rapida e di alto livello della qualità complessiva di un dominio dati.

2) Punteggi dimensionali, in cui una risorsa può ottenere un punteggio perfetto in termini di qualità, ma basso in termini di interoperabilità; questo è molto utile quando una particolare area di carenza non è problematica (ad esempio, il consumer desidera che i dati siano molto accurati, ma non è preoccupato che ci possano essere complessità per l’accesso).

3) Dettagli del punteggio completo e spunti per migliorare, in cui i data consumer possono vedere esattamente dove un asset non è all’altezza e i data owner possono agire per migliorare lo stato di salute di un asset.

Come si può utilizzare

Che cosa fornisce il modello Data Evaluation Framework?

Per i data owner:

– Misure chiare e oggettive per migliorare le dimensioni dei propri data asset.

– Suggerimenti su quali aree vadano migliorate.

– Evidenze di eventuali problematiche nel flusso di sourcing dei dati.

Per i data consumer:

– Evidenzia le caratteristiche dei dati, permettendo di capire se siano adeguate al caso d’uso.

– Serve come segnale di affidabilità dei dati.

– Informa sui punti di forza in modo che possano utilizzare consapevolmente i dati.

– Consente loro di richiedere un adeguato livello di presidio e maturità dei dati.

Dal punto di vista della data strategy, questo tipo di modello, insieme con i KPI relativi al data sourcing, consente di focalizzare gli sforzi dei data owner nel miglioramento costante dello stato di salute.

Considerando l’intero modello, siamo in grado di indirizzare i team  verso i miglioramenti più urgential fine di renderli  maggiormente consapevoli dell’importanza dei dati gestiti e supportarli nel monitoraggio e aumentare l’accountability dei data owner nei propri domini.