di 

Data management

Open Data, Regione Lombardia: "Ecco le misure necessarie per un salto di qualità"

Regione Lombardia ha risposto alla rilevazione di Cantieri PA Digitale - Data Management sullo stato della diffusione degli open data in Italia. Ci sono buone iniziative, ottime esperienze, da valorizzare e portare avanti. Bisogna anche sgombrare il campo dalla chimera della crescita a costo zero

Grazie davvero al buon Nello Iacono che ci ha chiesto di partecipare a una rilevazione sulla situazione degli open data in Italia in qualità di esperti di settore.

Francamente, quando ho visto questo invito ho un po’ sorriso perché mi sono detto che, ahimè, la situazione degli open data in Italia è tristemente nota, sarebbe ora di passare dai sondaggi alle azioni concrete; comunque mi fa piacere che qualcuno si preoccupi almeno di avere una fotografia della situazione.

Utilizzando come traccia le domande che ci sono state sottoposte con il questionario, provo ad approfondire alcuni temi.

La valutazione che do sullo stato di diffusione degli open data è di sufficienza (risicata). Non è una questione di numero di dataset, in Italia ne pubblichiamo moltissimi; il fatto è che si pubblica a macchia d’i leopardo sia dal punto di vista del territorio che dal punto di vista dei soggetti che pubblicano, si pubblica sulla base della buona volontà e senza risorse, e si pubblica senza un vero coordinamento centrale.

Partiamo da come si pubblica: a volte vado su portali, anche di recente realizzazione, che dichiarano di pubblicare open data e trovo file pdf, file xls che sono tutto fuorché “machine readable” (celle unite, righe vuote, formattazioni che rendono certo meglio leggibili ad occhio umano i contenuti), metadati descritti in un file di testo illeggibile. La qualità deve migliorare, ci sono poche ma importanti regole da rispettare per pubblicare davvero “open data”.

Vediamo cosa si pubblica: dati statistici, di difficile rielaborazione e quindi poco usabili; dati in obbligo di legge (ad esempio quelli sulla trasparenza, ex dlgs 33/2013), ma di scarso interesse per cittadini e aziende. Sono poche le realtà che pubblicano dati grezzi, riusabili, che possono avere un qualche appeal per la società civile o per chi può farne un business. Vero è anche che la Pubblica Amministrazione spesso raccoglie dati (anche in forza degli obblighi di legge) che sono puramente funzionali allo svolgimento delle proprie attività interne e poco hanno di interessante per il pubblico; occorrerebbe quindi uno sforzo alla base per cominciare a raccogliere dati di qualità, e occorrerebbe anche le norme non ci impedissero di raccoglierli.

Sempre riguardo a cosa si pubblica, anche se è vero che sono stati individuati alcuni ambiti di “maggior interesse” (ambiente, salute, trasporti, turismo, …), nella nostra esperienza su www.dati.lombardia.it abbiamo avuto diverse sorprese analizzando le statistiche di accesso dei dataset:

  • per prima cosa abbiamo scoperto che in cima alle classifiche di visite e download non sempre ci sono dataset rientranti negli ambiti sopra citati, dati ben fatti diventano di interesse per aree e attività sulle quali non siamo in grado di fare previsioni (un primo dataset oggetto di riuso di cui abbiamo avuto riscontro è stato quello sugli impianti sportivi censiti da Regione Lombardia, ed è stato utilizzato da un’azienda che vende spazi pubblicitari sul territorio per integrare un proprio applicativo);
  • registriamo costantemente una certa differenza tra le classifiche dei dataset più scaricati (quindi utilizzati per elaborazioni) e quelli più visti (quindi consultati on-line);
  • registriamo l’elaborazione direttamente sul sito di viste, grafici e mappe su alcuni dataset che evidentemente sono di particolare interesse per alcune categorie di soggetti se rappresentati in un certo modo.

Veniamo a dove si pubblica. Alcune amministrazioni hanno siti dedicati in cui sono presenti dei cataloghi e strumenti per la ricerca dei dataset. Pochi di questi siti hanno però strumenti che consentono elaborazioni e viste sui dati, in molti casi si può solo fare download. Per favorire il riuso sia da parte di utenti esperti che di cittadini, sarebbe necessario avere altri strumenti a disposizione, in questa direzione stiamo cercando di andare con www.dati.lombardia.it, mettendo a disposizione motore di ricerca, possibilità di realizzare filtri, mappe, grafici, API e altri strumenti di consultazione da parte anche di macchine.

Ci sono poi siti dedicati a temi particolari che presentano alcune categorie di dati e ne offrono rappresentazioni e viste per facilitarne la consultazione diretta e poi consentire il download dei dataset, il problema è che il download è visto quasi come un “di più” poco intuitivo, che non sempre porta a dati “machine readable” e, talvolta, in mancanza di metadati. Altra cosa strana, soprattutto per alcuni servizi di livello centrale, è che richiedono alle amministrazioni locali di fornire i dati attraverso flussi particolari, quando magari le stesse amministrazioni hanno già fatto lo sforzo di pubblicare i dati aperti. Se non riusiamo noi gli open data esistenti...

Restando sul dove si pubblica, c’è poi la nota dolente di dati.gov.it che da ormai troppo tempo ha sospeso le attività di harvesting e recupero dei dataset dagli altri portali sul territorio, in vista di “future evoluzioni”. Non sarebbe stato più utile tenere attivi i servizi esistenti (tra cui anche una infografica che almeno era considerabile come “ufficiale”) fino all’avvento delle “evoluzioni”?

Altra nota dolente riguarda la diffusione delle competenze: in carenza di risorse (persone, tempo, soldi) la diffusione delle competenze su questi temi è spesso lasciata alle iniziative sporadiche e ad gli eventi divulgativi (nei quali ormai ci troviamo spesso come in un club di amici), manca coordinamento, mancano programmi che coinvolgano grandi platee e in tempi congrui. Tutto ciò vale nei confronti della Pubblica Amministrazione, che i dati li produce e potrebbe riusarli, ma anche, e soprattutto, rispetto alla società civile e alle aziende, che potrebbero trarre utile dall’utilizzo dei dati aperti.

La governance nazionale dovrebbe fare una salto di qualità:

  • Non servono Linee Guida Nazionali rinnovate ogni anno se non sono accompagnate da una verifica della loro attuazione.
  • E’ davvero necessario realizzare un profilo italiano di uno standard internazionale per la metadatazione dei dataset? Non sarebbe forse più utile realizzare strumenti per facilitare l’adesione allo standard internazionale in modo tale da far conoscere in fretta in nostri open data anche all’estero?
  • Ci vogliono strumenti più forti, anche a livello normativo, per favorire la crescita degli open data; perché realizzare liste dei dataset da pubblicare se poi non si interviene per verificare se sono stati davvero resi pubblici?
  • Gli enti chiedono cosa pubblicare ma anche con quali tracciati record; Regione Lombardia ha prodotto, per i Comuni, una proposta possibili dataset con anche proposte di tracciato, potrebbe essere un punto di partenza.
  • Ci vuole chiarezza sotto l’aspetto normativo, per superare le paure di possibili conflitti con le regole sulla privacy e le tutele varie.

Tutto sbagliato, tutto da rifare? No di certo!

Ci sono buone iniziative, ottime esperienze, devono essere valorizzate e portate avanti. Per farlo bisogna anche sgombrare il campo da quella chimera della crescita a costo zero; anche solo il nostro tempo ha un costo che va considerato per smettere di fare open data a tempo perso.