25012 - Dati

La qualità dei dati può favorire l’integrazione tra banche dati diverse, facilitare l'interoperabilità dei sistemi evitando duplicazioni e incoerenze, ridurre la complessità del sistema (vedi "Complessità e qualità dei dati").

foto di silos a simboleggiare la separazione delle banche dati
Silos di una ex scuola di agraria sulla costa abruzzese


Il modello di qualità dei dati è stato sviluppato in ambito ISO/IEC dal Comitato 1/SC7 per l’Ingegneria del software all’interno della serie degli standard
ISO 25000 ed è descritto nello standard ISO/IEC 25012.

Lo standard sul modello di qualità dei dati è una proposta italiana presentata dall’UNINFO alla comunità internazionale ISO/SC7, che lo ha approvato all’unanimità da 26 Paesi. L'Italia è stata tra i primi Paesi a sollevare il problema della mancanza di uno standard ISO sulla qualità delle banche dati.

L'ISO 25012 ha una visione più generale rispetto ad altri standard sulla qualità dei dati industriali, come quello della serie ISO 8000 prodotta dal Comitato 184/SC4 specifica per l’automazione industriale.

Ai primordi dell'informatica, negli anni settanta, era famoso il detto "Garbage in - Garbage out" poiché se si immettevano dati errati nel computer, i dati in uscita non potevano che essere errati. Ora le cose stanno cambiando.


Poster Gi-Go
Poster in una scuola professionale di Boston

I dati digitali soffrono di frequente delle seguenti situazioni:
- organizzati a silos
- non interscambiabili
- diversi semanticamente
- gestiti da software diversi
- classificati in modo errato o incerto
- non gestiti con dizionari o ancora non catalogati
- non "accorpati" in sportelli "unici" (problemi backend e backoffice)
- distribuiti tra i servizi in modo disomogeneo
- aggiornati in modo non regolamentato e coordinato
- acquisiti con carenza di controllo o con bassa comprensibilità
- non accessibili e disponibili

Considerazioni

Nell’epoca moderna i problemi connessi alla qualità dei dati (finanziari, bancari, economici, fiscali, demografici, ambientali, ecc.) sembrano aumentare di complessità e governabilità, richiedendo sempre più informazioni integrate, complete, tempestive, tracciate, supportate da nuovi concetti e misure, sinonimi dei concetti largamente usati, indicatori sintetici di avvertimento che dovrebbero funzionare in tempo reale.

La conoscenza del modello di qualità dei dati aiuta a rendere espliciti in modo strutturato gli elementi di indagine ed è importante per analizzare e supervisionare varie situazioni:
- l’acquisizione di dati la cui qualità non è conosciuta o garantita;
- l’elaborazione di dati difettosi;
- la constatazione di dati incoerenti tra fonti diverse;
- l’usabilità delle interfacce;
- l’integrazione e interconnessione di legacy systems e legacy architecture con differenti sistemi distribuiti e informativi di generazione internet.

L’integrazione delle principali banche dati tra i vari Enti, auspicata fin dai primordi dell’informatica, nel 1962, certamente in via di evoluzione, è di fatto non ancora pienamente realizzata. Il completamento di una simile visione può rappresentare un possibile sviluppo per l'ammodernamento dei sistemi informativi, ponendo in connessione i Comuni, l'Istat e 35 sistemi dell'epoca.

Lavagna di De Finetti
Il grafico, chiamato Lavagna di De Finetti, è riportato, per gentile concessione di Fulvia De Finetti, dal sito www.brunodefinetti.it.

Dieci anni dopo, nel 1972, il tema dell'interconnessione dei sistemi è all'attenzione del Convegno della Società Italiana di Statistica, tenutosi a Palermo, durante il quale si è approfondito l'argomento degli Indicatori sociali e l'Informatica, fornendo un diagramma più sintetico con 13 sistemi.

Grafico del 1972 sulla interconnessione di sistemi informatici
Il grafico è di G.Marbach-A.Rizzi "Indicatori sociali e informatica", Atti XXVII Riunione scientifica della Società Italiana di Statistica, Palermo, 1972, p. 531

La tendenza alla interoperabilità trova una diversa interpretazione nel 2000 che pone al centro la persona fisica, il cittadino, i suoi dati ai quali tendono tutte i sistemi istituzionali: fiscali, della scuola, del lavoro, ecc.

Batini2
Grafico di Carlo Batini del 2000 che passa dalla interoperabilità dei sistemi alla centralità del dato

L'ideazione di uno standard della qualità dei dati è basata sulla relazione possibile tra la qualità dei dati e la qualità del software, come evidenziato in apertura del convegno Very Large Data Base tenutosi a Roma nel 2001 (Vedi "Qualità dei dati e standard ISO/IEC 9126").

Nel
2015 il tema è presentato al Forum PA con la presentazione: La qualità dei dati e la loro integrazione.

Nel
2017 l'AgID pubblica la Linea Guida sul catalogo dei dati ed elenca le principale tematiche da considerare, con la particolarità di passare dalla visione basata sugli Enti gestori dei dati o mista (utenti e gestori) alla visione basata sui temi principali che riguardano i dati stessi.

Catalogo
Interpretazione grafica dal testo della Linea guida del Catalogo dati - AgID 2017

L'interpretazione grafica dei temi riportati nel Catalogo Dati mette al centro le esigenze di condivisione e la possibilità di utilizzo dei dati.

I temi sintetizzati sono:
1. Agricoltura, pesca, silvicoltura e prodotto alimentari
2. Economia e Finanze
3. Istruzione cultura e sport
4. Energia
5. Ambiente
6. Governo e settore pubblico
7. Salute
8. Tematiche internazionali
9. Giustizia, sistema giuridico e sicurezza pubblica
10. Regioni e città
11. Popolazione e società
12. Scienza e tecnologia
13. Trasporti

Per l'esame di questa progressione dei modelli, che ha latente un obiettivo di integrazione di sistemi, è bene anche tener conto che molte delle problematiche di qualità dei dati riguardano sia sistemi semplici, che sistemi complessi, cioè sistemi di sistemi. Tutti possono beneficiare della qualità dei dati.

Copia 10 di Semplicecomplesso
Grafica sulle diverse occorrenze di Owners e Data Base tra sistemi semplici e complessi

La tendenza alla interoperabilità e interconnessione, specie nei sistemi complessi, aumenta la consapevolezza di dover prestare più attenzione agli aspetti connessi all'interscambio dati, con metadati semanticamente significativi, processi armonizzati, formati standardizzati, master data condivisi, specialmente da parte delle organizzazioni tuttora verticali, a Silos, non dialoganti.

Il miglioramento della qualità dei dati può favorire l’integrazione tra banche dati diverse e consentire un miglioramento della qualità della vita, in particolare con:
- semplificazione dei processi;
- miglioramenti dei servizi;
- razionalizzazione (e eliminazione) della modulistica cartacea;
- elevata comunicazione inter-amministrativa e inter-operabile, per una più efficace operatività degli “sportelli unici”;
- disponibilità per l’utente finale di dati accurati, completi e coerenti.

E’ condivisa l’idea tra gli esperti che la qualità dei dati va perseguita come un cammino di miglioramento continuo. Questo probabilmente perché la realtà stessa cambia in continuazione e quindi anche i dati digitali che “rincorrono” i fatti del mondo reale non sono mai perfetti. Vedendo la questione in modo dinamico e non statico, si potranno raccogliere nel tempo risultati efficaci, ciclicamente, orientando attentamente la bussola della qualità, gradualmente, secondo il contesto d’uso.

La Data quality e le misure relative vanno ad inserirsi in un quadro organico alla cui base è opportuno attuare una politica più generale di Data Government (*) e di IT Governance.

(*)
Nel maggio 2013 la norma è stata oggetto della determinazione commissariale N. 68 dell’AgID - Agenzia per l’Italia digitale concernente le regole tecniche per l'identificazione delle basi di dati critiche tra quelle di interesse nazionale specificate dal D. Lgs. n. 82/2005 e per definirne le modalità di aggiornamento atte a garantire la qualità dei dati presenti. La qualità dei dati è anche approfondita nelle "Linee guida di valorizzazione del patrimonio informativo pubblico" nel quadro delle tematiche dei dati aperti delle PA. La determinazione 68/2013 sulle banche dati critiche cita espressamente l'ISO 25012.con riferimento alla qualità dei dati.
Altre considerazioni su esempi di qualità dei dati sono riportate nelle Linee guida del 2016 sulla
Valorizzazione del patrimonio informativo pubblico (Open data).


Notizie

Marketing e qualità dei dati
In media, ogni 30 minuti, si verificano 120 cambiamenti di indirizzi, 75 cambiamenti di numeri di telefono… 30 opportunità di business. (dati riferiti agli USA; D&B The Sales and Marketing Institute)

Dati non accurati hanno un diretto impatto sull'88% delle imprese, con una perdita media del 12% del fatturato.
(Experian)

Il 53% delle organizzazioni intervistate considerano come priorità una singola vista della clientela. Sviluppare una vista a 360 gradi è una grande sfida a causa delle difficoltà di tenere traccia di dati presenti tra sistemi multipli, ridondanti e contenuti in Silos non dialoganti… Solamente il 24% delle organizzazioni ritengono che le comunicazioni con i clienti e i sistemi di raccolta dati sono pienamente integrati, mentre il 13% non menziona affatto il problema del livello di integrazione. (Forbes Insights)

In generale il 49% delle organizzazioni indicano che i dati sono contenuti in Silos. (Forbes Insights)

La mancanza di strumenti analitici automatici e la presenza di dati in Silos portano le imprese ad ignorare l’88% dei dati dei loro clienti.
(Forrester)

Signora, lei è morta da tre anni
Qualcuno ha fatto confusione con i numeri e per me è iniziato un incubo… il Comune spiega che l'errore, appena scoperto, è stato corretto nei registri comunali… non sappiamo quanti enti abbiano recepito la comunicazione di intervenuta variazione. (da Il Messaggero, 27 novembre 2015, pag 16)

Decolla l'Anagrafe unica, primo passo per il cittadino digitale
… grazie a una migliore qualità dei dati, saranno eliminate le duplicazioni… (da Il Messaggero, 13 novembre 2015, pag. 8)

Informativa sulla Privacy e sui Cookies.

Utenti online


Dati