Come pubblicare Open data. Il caso della Protezione civile

Home Open Government Open Data Come pubblicare Open data. Il caso della Protezione civile

La Protezione Civile utilizza un formato machine readable per fornire dati puntuali sull’emergenza Covid-19. L’importanza di questa scelta non è ancora chiara a tutte le amministrazioni, che spesso continuano a pubblicare dati non riutilizzabili. Ripartiamo, quindi, da questa esperienza e da alcune parole chiave in tema di dati: qualità, aggiornamento, interazione, armonizzazione

23 Aprile 2020

Vincenzo Patruno

Vice Presidente Associazione onData

L’emergenza che stiamo attualmente vivendo ha sicuramente fatto comprendere appieno l’importanza fondamentale che hanno i dati per il monitoraggio e per la gestione tecnica e politica dell’emergenza stessa. Sulla base dei dati disponibili, infatti, è stato possibile gestire negli ospedali l’aumento dei posti letto in terapia intensiva, nonché, più in generale, valutare l’efficacia delle tante misure prese per contrastare il diffondersi del virus, garantendo nello stesso tempo il supporto sanitario a chi ne veniva colpito. La tradizionale conferenza stampa delle 18.00 serviva proprio a comunicare dati relativi all’andamento dell’epidemia. Nei primi giorni, i dati venivano pubblicati subito dopo la conferenza stampa, sotto forma di file PDF, sul sito web del Dipartimento della Protezione Civile.

È evidente, però, che i dati non servono esclusivamente a Governo e Protezione Civile. Sono, infatti, dati di interesse pubblico, utili ad epidemiologi, esperti di dati, società civile, governi e giornalisti non soltanto in Italia, ma in tutto il mondo. Ma pubblicare i dati attraverso documenti PDF ne rende difficoltoso il riuso. I dati, infatti, per poter essere utilizzati vanno estratti e trasformati in un formato “machine readable”, ossia un formato adatto per usare i dati all’interno di fogli elettronici, applicazioni, database per fare analisi, previsioni, visualizzazioni. Ad esempio, un file in formato csv o Json.

Questo è stato il motivo che ha spinto l’associazione onData a lanciare una prima campagna sui social per chiedere la pubblicazione di dati in formato “machine-readable”. Nello stesso tempo ha cominciato ad estrarre e a pubblicare i dati dal file PDF attraverso uno “scraper”, ossia un’applicazione scritta appositamente per fare questa operazione. Va detto che la risposta della Protezione Civile è stata tempestiva e, nel giro di qualche giorno, tutti i dati necessari sono stati pubblicati all’interno di questo repository ufficiale, sottolineando che i tecnici e i responsabili della Protezione civile avevano già cominciato a ragionare su questo aspetto, e questo ha fatto in modo che non fossero impreparati ad affrontare la situazione.

Ad ogni modo, la risposta della Protezione Civile è stata da manuale, non soltanto nei tempi ma soprattutto nel modo. È stata fatta molta attenzione alla qualità dei dati e dei metadati pubblicati, a garantire puntuali aggiornamenti quotidiani e si è puntato molto anche sulla interazione con gli utenti. La piattaforma, infatti, non soltanto consente la pubblicazione di dati e di codice, ma dà agli utenti anche la possibilità di segnalare problemi o dare suggerimenti.

È di gran lunga un grande passo in avanti per quanto riguarda gli Open Data e suggerisco di prendere questo come riferimento per tutte quelle PA che in futuro vorranno pubblicare dati. Gli enti pubblici tendono, infatti, a pubblicare report e, specie ultimamente, a generare dashboard interattive. Si pensa che gli utenti siano solo dei lettori (o degli utilizzatori di dashboard interattive). Non si pensa che c’è anche un mondo di nuovi consumatori di dati, che questi dati li usa, li visualizza, li analizza, li aumenta, li integra con altri dati creando valore.

E invece quello che accade è che ci troviamo di fronte a Regioni che, a loro volta, hanno cominciato a rilasciare report pdf e dashboard interattive sull’emergenza coronavirus. Ma non i dati sotto forma di dataset “machine readable”. Che alla fine sono quelli che servono veramente. Mi sembra un paradosso. È questo il motivo per cui è in corso un’altra campagna di sensibilizzazione di onData verso i presidenti delle Regioni ancora ferme ai report pdf e alle dashboard. E che ancora non pubblicano i dati.

A proposito dei dati, va fatta un’ulteriore considerazione. Il Dipartimento della Protezione Civile pubblica dati che provengono dall’Istituto Superiore di Sanità. A sua volta l’ISS raccoglie dati dalle singole Regioni (non dobbiamo infatti dimenticare che la sanità è gestita a livello regionale). Ma nonostante questo, le Regioni tendono a pubblicare anche altri dati ognuna per conto proprio. L’intera gestione della crisi ha sin dall’inizio avuto spinte centrifughe da parte delle singole Regioni. E anche la questione dati non è sfuggita alla tentazione di andare in ordine sparso. Abbiamo quindi i dati di qualità pubblicati dalla Protezione Civile, che hanno una copertura nazionale e un livello di dettaglio sia regionale che provinciale. Abbiamo poi una serie di dati regionali, diversi tra loro e molti dei quali neanche in formato machine readable.

Una volta che la crisi sarà terminata, sono sicuro che avremo imparato moltissime cose. Mi auguro che una di queste sia che, quando vengono pubblicati dati, bisogna necessariamente pensare anche a chi i dati li utilizza. Quindi sempre dati in formato machine readable, con aggiornamenti costanti, magari anche sulla piattaforma Github o piattaforma analoga per raccogliere i contributi e le segnalazioni degli utenti. Ma bisogna anche pensare ad armonizzare i dati secondo, diciamo così, uno schema dati condiviso. Le potenzialità dei dati aumentano, infatti, man mano che raggiungono coperture territoriali importanti restando al massimo livello di dettaglio possibile.

ICity Club

IA, competenze trasversali, aggiornamenti normativ: le Academy di FORUM PA 2026

Un punto di osservazione sui partner di FPA

FORUM PA 2026

Come pubblicare Open data. Il caso della Protezione civile