In passato abbiamo già trattato alcuni di questi argomenti approfondendo, ad esempio, il valore della qualità dei dati per l’analytics o l’importanza di stabilire delle regole per la gestione dei dati. Oggi vogliamo concentrarci sul concetto di Data Lineage, partendo dalla sua definizione per arrivare a definirne i vantaggi e i principali casi d’uso in azienda
Il significato di Data Lineage
Quando ci viene chiesto cos’è il Data Lineage, lo definiamo come un insieme di tecniche per ricostruire l’intero ciclo di vita del dato, a partire dalla sua origine fino alle più recenti trasformazioni, attraverso la raccolta dei metadati e l’approfondimento delle varie fasi.
Questi si suddividono in:
- Metadati tecnici: descrivono la struttura, il formato e le regole di memorizzazione dei dati.
- Metadati di business: raccolgono la terminologia aziendale, le regole e il contesto a cui fanno riferimento i dati.
- Metadati descrittivi: sono costituiti da descrizioni normalizzate e permettono di identificare e recuperare i documenti.
- Metadati amministrativi e gestionali: includono informazioni di natura tecnica.
- Metadati strutturali: descrivono l’articolazione interna e le relazioni tra le parti che formano gli oggetti digitali.
Tramite l’elaborazione dei metadati è possibile ripercorrere i processi coinvolti nel flusso dati e le loro dipendenze: ma, soprattutto, è possibile rispondere alla domanda “da dove proviene questo dato e qual è la sua destinazione?”.
Riuscire a mappare e verificare come i dati vengono estratti dalle diverse fonti, trasformati e modificati nei diversi strati è fondamentale per costruire una registrazione della loro storia, e comprendere quindi il vero significato di quello che si osserva e analizza.
4 motivi per implementare un sistema di Data Lineage in azienda
Quando si devono implementare dei modelli di analisi è importante conoscere qual è l’origine del dato ma, non sempre, questo basta. A volte serve avere anche il contesto più ampio: sapere il significato dei dati, il livello di qualità, se sono accurati e affidabili.
L’obiettivo del Data Lineage è quello di costruire una visione end-to-end sul patrimonio di dati disponibile in azienda, apportando 4 vantaggi definitivi:
- Migliorare la qualità dei dati: è il punto di partenza per qualsiasi decisione e azione che si definisca data-driven. Attraverso il Data Lineage è possibile verificare la validità e l’attendibilità dei dati utilizzati per il processo decisionale.
- Comprendere il flusso dei dati: i dati sono in perenne evoluzione, soggetti a trasformazioni e cambiamenti. Tramite il tracciamento è possibile ricostruire le diverse fasi e comprendere se ci sono situazioni critiche (Performance Analysis).
- Effettuare la migrazione dei dati: in caso di cambiamenti nelle soluzioni di storage o di introduzione di nuovi sistemi software, è fondamentale sapere dove si trovano fisicamente i dati ed il loro lifecycle. Grazie al Data Lineage è possibile implementare l’Impact Analysis e pianificare gli aggiornamenti con maggiore sicurezza.
- Ottimizzare la gestione aziendale: le informazioni rese disponibili dai processi di Data Lineage permettono di avere un controllo sulla conformità dei processi, migliorare la gestione del rischio e garantire il rispetto delle policy aziendali in materia di archiviazione ed elaborazione.
L’identificazione del ciclo di vita del dato permette di approfondire i principali processi che lo coinvolgono, i suoi movimenti e le trasformazioni nel tempo, per una migliore comprensione del suo significato in termini di Business Intelligence.
Quanto più accurato è il sistema di Data Lineage tanto migliore sarà la qualità dei dati disponibili per gli utenti: perché più approfondita è la conoscenza dei sistemi nel Data Lifecycle, più efficiente è la definizione dei controlli sugli stessi.
I benefici del Data Lineage per il Business
Il Data Lineage consente di colmare il gap di comprensione tra diverse aree di competenza: tutti in azienda, a prescindere dal ruolo, possono beneficiare dei vantaggi offerti dal sistema di tracciamento. In particolar modo il Data Lineage permette di:
- Aumentare il livello di fiducia nei confronti del dato, grazie alla disponibilità di informazioni che contestualizzano la sua evoluzione. Quando gli utenti si approcciano al dato hanno così la certezza di utilizzare dati in qualità e certificati.
- Ridurre le possibilità d’errore grazie all’analisi dei Data Incident.
- Capire come utilizzare le informazioni, identificando il valore strategico per i processi decisionali e di business, e tenendo traccia delle rispettive interdipendenze. Ciò consente di implementare dei cambiamenti con rischi più contenuti.
- Ridurre il tempo necessario per analisi complesse, grazie alla piena visibilità dei cambiamenti avvenuti nei dati.
La mancanza di un sistema di Data Lineage all’interno di aziende strutturate, può determinare un incremento dei costi per l’accesso all’informazione o, nel peggiore degli scenari, impossibilitare l’identificazione di insights strategici. Senza una conoscenza puntuale su origine e flusso dei dati, infatti, diventa complesso destreggiarsi nella Data Analytics.