Qualità degli Open Data: il caso dei contratti pubblici delle Università

Home Open Government Open Data Qualità degli Open Data: il caso dei contratti pubblici delle Università

Misurare la qualità degli Open Data per poterli rendere il più possibile usabili dagli utenti finali è fondamentale. Ecco un caso di studio concreto sulle modalità e i vantaggi derivati

20 Maggio 2016

A

Antonio Vetrò, direttore della Ricerca del Centro Nexa su Internet & Società e Marco Torchiano, Politecnico di Torino e Faculty Fellow del Centro Nexa

Nel nostro precedente intervento, abbiamo spiegato come sia importante misurare la qualità degli Open Data per poterli rendere il più possibile usabili dagli utenti finali.

In questo articolo, continuiamo il ragionamento e mostriamo con un caso di studio concreto come è possibile farlo e quali possono essere i vantaggi derivati.

Presentiamo infatti i risultati di uno studio esplorativo sulla qualità dei dati aperti dei contratti pubblici delle Università Italiane, condotto in collaborazione con Francesca Iuliano per quanto riguarda i dati del 2014.

I dati oggetto dello studio sono quelli sui contratti pubblici messi a disposizione dalle Università Italiane in conformità al “ Decreto Trasparenza”. Le Università selezione per lo studio sono le prime 25 della classifica delle migliori università italiane pubblicato dal “Il Sole 24 Ore”.

La valutazione della qualità è stata effettuata su un modello di qualità del dato ricavato dallo Standard ISO/IEC 25024, e sulle seguenti caratteristiche di qualità: accuratezza, completezze, coerenza. Mentre le prime due caratteristiche sono intrinseche ed univoche per qualunque tipo di dato, la coerenza dipende dai dati specifici che si esaminano.

Grazie all’utilizzo delle metriche che catturano gli aspetti di qualità sopra menzionati, siamo riusciti a riscontrare alcune problematiche e a riportarle alle università.

Innanzitutto, va riportato che solamente 12 delle migliori 25 università avevano pubblicato le tabelle riassuntive per il 2014 sul proprio sito, e più precisamente nella sezione ‘Amministrazione Trasparente/Bandi di gara e contratti’ come richiesto dal decreto, utilizzando le specifiche tecniche predisposte dall’ANAC.

La valutazione dei dataset aperti ha dunque riguardato queste 12 università, e nonostante la qualità generale dei dati rivelata sia stata alta (i risultati completi sono accessibili qui), abbiamo riscontrato gravi problemi legati alla completezza, errori di accuratezza e inconsistenze nei dati. Riportiamo qui di seguito tre esempi (una presentazione dello studio è disponibile qui).

  1. Abbiamo notato l’assenza d’informazioni basilari come la selezione dell’appaltatore o l’identificatore univoco dei partecipanti ai contratti pubblici. In altri casi, campi quali il CIG (l’identificativo univoco del contratto), benché presenti nelle tabelle di riassunto, assumono valori al di fuori del dominio di validità, ad esempio in bianco o più lunghi dei 10 caratteri permessi.
  2. In un caso il metodo di scelta del contrante (es. affidamento diretto, procedura negoziata) non era indicato per nessuna procedura.
  3. Infine, in diversi casi non è stato possibile comprendere come siano stati spesi i soldi pubblici perché l’informazione sulla descrizione dei contratti era assente.

Riassumendo: oltre al fatto che molte università non hanno adempiuto agli obblighi di legge previsti dal “Decreto Trasparenza” per l’anno 2014, è stato possibile riscontrare diverse anomalie, attraverso una misurazione di pochi attributi di qualità. Le anomalie riscontrate non permettono la tracciabilità completa dei soldi pubblici spesi, che nel caso di studio in oggetto si determina, ad esempio, con l’informazione di chi riceve il denaro oppure la descrizione del perché è stato speso di più di quello contrattualizzato.

Queste anomalie sono state riscontrate grazie alle misurazioni della qualità del dato su poche caratteristiche generali di qualità: accuratezza, completezza. Non escludiamo che con altre misurazioni, anche altre tipologie di anomalie potrebbero essere scoperte: anomalie che potrebbero essere dovute a errori nel processo di generazione dei dati, oppure, nel caso più malaugurato, a illeciti. Ad esempio, applicando verifiche specifiche per i dati in questione, per alcuni contratti abbiamo rilevato che in assenza di un vincitore del bando l’ammontare dei pagamenti effettuati risulta diverso da zero, fatto che costituisce una chiara inconsistenza.

Qualunque sia la causa è sicuramente un vantaggio dotarsi di strumenti di monitoraggio e controllo di qualità che ne rivelino gli effetti.