di 

Data management

La formazione elemento chiave per gli Open Data, l'esperienza ISPRA

Con i rischi attuali di "monopolio" sui dati della multinazionali, la strada maestra è quella degli open data, dove manca ancora però un serio programma nazionale Open Data, insieme all'attivazione di processi formativi per i dirigenti e i professionisti IT dando alla pubblicazione degli Open Data un specifico ruolo istituzionale.

La questione degli Open Data necessita un approccio socio culturale non affatto trascurabile. E’ opinione ormai diffusa che il processo evolutivo dell’informatica e di tutte le innumerevoli applicazioni ad essa collegate, necessita di aggiornamenti e approfondimenti continui da parte degli addetti ai lavori.

Ora vengono alla luce due problematiche.

La prima è di carattere tecnico legato, come dicevamo, agli aggiornamenti continui e specialistici.

La seconda riguarda un aspetto più generale legato al recepimento di tali tecnologie, senza avere, in molti casi, alcuna possibilità di modificarle, renderle meno vincolanti, monopolizzanti.

Improvvisamente, e non solo lavorando di fantasia, si può arrivare al ruolo che in questo contesto potrebbero avere gli Open Data.

Il dati raccolti e diffusi dalle Pubbliche Amministrazioni Centrali e Periferiche, vengono (ed è un bene) sempre maggiormente riutilizzati, in molti casi, subendo processi di interpolazione e collegamenti, non sempre certificati. Questa, ormai, è prassi diffusa e non deve sollevare particolari problemi, in quanto i fruitori di questi dati ne dovrebbero essere sufficientemente informati.

La faccenda diventa più delicata da quando alcuni colossi informatici si sono organizzati per acquisire i dati grezzi presi un po’ ovunque, che poi restituiscono ("ripuliti") al grande pubblico, con finalità quasi esclusivamente speculative e commerciali.

Solo queste multinazionali sono in grado di individuare le fonti, a livello mondiale, e leggere i vari formati dei dati in circolazione, creando Clouds di loro proprietà con una quantità di dati inimmaginabile. Il rischio di un monopolio dei dati sta diventando molto fondato.

La logica degli Open Data, in modo particolare, dei Linked Open Data, non va proprio in questa direzione.

Se vogliamo che la Storia ci possa ancora insegnare qualcosa, si può, allora, azzardare un paragone.

I Clouds contenenti i famigerati Big Data, possiamo paragonarli ai grandi latifondisti pre riforma agraria del 1950 e le applicazioni esclusivamente derivanti dagli Open Data/LOD, ai piccoli imprenditori agricoli.

La filosofia degli Open Data consiste nella diffusione di dati grezzi pronti al loro riuso da parte di tutti, piccoli o grandi “creatori o meno” di applicazioni.

La logica degli Open Data, in qualche modo, si oppone alla monopolizzazione dei metodi di archiviazione e del riuso del dato.

Fatta questa molto approssimativa introduzione, urge, a parer mio, un serio programma nazionale Open Data che possa avere un impatto nel settore della Pubblica Amministrazione come è stato fatto ad esempio, con la legge sull’anticorruzione e trasparenza.

Un articolo di legge o meglio, una legge specifica sugli Open Data, sebbene necessaria, non può però bastare.

Occorre attivare una serio processo formativo della classe dirigente e dei settori informatici della PA, dando alla pubblicazione degli Open Data un specifico ruolo istituzionale!

Il messaggio che si dovrebbe diffondere nel mondo WEB e anche nell’opinione pubblica in generale, è che gli Open Data sono una straordinaria opportunità per diffondere informazioni, consentendo la libera elaborazione e interpretazione di queste ultime. Insomma dai dati grezzi (in gran parte raccolti dalle PP.AA. e in quindi generalmente affidabili) possono essere costruite da chiunque applicazioni di varia natura e per svariate attività e finalità.

Le numerose e apprezzabili iniziative dell’AgID legate a questa particolare materia, non possono riguardare la creazione di gruppi di lavoro tra varie PP.AA. Centrali e Locali (senza dubbio utili per confrontare esperienze) e la realizzazione di linee guida (ben fatte), ma devono puntare anche a raggiungere risultati tangibili, diffusi e soprattutto veloci. Veloci come evolvono le modalità di archiviazione e di pubblicazione dei dati e le loro applicazioni.

Altro aspetto di fondamentale importanza è la pubblicazione dei dati in formato LOD, ma credo che dal punto di vista prettamente informatico, le PP.AA. come pure moltissime Aziende private, non siano ancora completamente pronte a fare questo passo puntando esclusivamente sui loro mezzi.

Al riguardo, non nascondo quanto sia necessario ricorrere a Società informatiche specializzate in questo campo sebbene non ce ne siano molte di alto spessore!

In Ispra (Istituto Superiore per la protezione e ricerca ambientale) abbiamo avviato un progetto pilota al fine di pubblicare alcuni dataset dell’Istituto in formato LOD. Ci siamo subito resi conto, sebbene il livello di informatizzazione del personale ISPRA fosse generalmente avanzato, che per lanciare il citato Progetto dovevamo far ricorso alla consulenza di una Società esterna in grado di curare l’aspetto tecnico particolarmente innovativo. Il contratto con la Società esterna prevedeva, inoltre, una particolare attenzione alla formazione del personale ISPRA che si sarebbe occupato di Linked Open Data. Abbiamo ritenuto che la formazione debba essere considerata di fondamentale importanza in quanto permette di traghettare, in questi particolari ambiti, la P.A. verso obiettivi importanti e ruoli inediti.

L’approccio adottato da ISPRA nella pubblicazione di parte dei propri dati ambientali in formato LOD, sta producendo risultati molto promettenti e in una prospettiva, neppure troppo lontana, completamente gestiti da ISPRA.

Per rendere fruibili le consultazioni e le possibilità di download dei LOD ISPRA previsti nel Progetto ( dati relativi alle altezze di marea, di onda con associati dati meteorologici, al consumo del suolo e i dati degli interventi pubblici per la difesa del suolo), è stato creato il portale dati.isprambiente.it (con SPARQL endpoint disponibile).

Particolare rilievo assumono le informazioni contenute nella voce “Ontologie e Thesauri” fondamentali per la definizione della infrastruttura dei Linked Open Data ISPRA secondo gli standard indicati dal World Wide Web Consortium (W3C).

Per la descrizione del patrimonio informativo dell’Ispra, oltre ad ontologie internazionali standard ampiamente riusate, è stata creata una ontologia di dominio che ha l’obiettivo di fornire tutti gli strumenti per comprendere al meglio i dati grezzi e le loro interconnessioni e che sarà integrata e aggiornata con i concetti espressi dai nuovi dataset pubblicati nel corso del tempo.

Infine, per lo sviluppo del portale dati.isprambiente.it sono state utilizzate tutte componenti open source (tra cui Virtuoso come triplestore, Lodview e LodLive) mentre per quanto riguarda le modalità di navigazione dati è stato utilizzato byg.portal, una personalizzazione di Lodview.

Senza dubbio e per fortuna, ISPRA non è l’unico esempio di Pubblica Amministrazione che inizi a pubblicare i propri dati in formato LOD. Però, nostro auspicio è vedere un numero sempre maggiore di P.A. che decidano di attivarsi in questa direzione!

La strada per estendere in ISPRA, come in altre realtà della P.A., questa modalità di diffusione dei dati è ancora lunga e difficile sia sotto l’aspetto prettamente tecnico che sotto l’aspetto delle politiche aziendali ancora ancorate a pratiche consolidate e sempre più antiquate di pubblicazione quali sono i “ download” presenti nei portali Web.

Riassumendo quanto finora esposto e potendo far riferimento a una dedicata e chiara normativa sugli Open Data di urgente approvazione, occorre dare particolare rilievo all’aggiornamento e alla formazione del personale informatico.

Inoltre, è assolutamente necessario rendere sempre più sensibile “l’alta dirigenza della P.A.” ad avviare progetti come quello realizzato in ISPRA, che si trasformino in concreti piani strategici in ogni singola Amministrazione Pubblica Centrale e Periferica.