Web archiving, “sfida culturale”: il servizio della Biblioteca Nazionale Centrale di Firenze

Home PA Digitale Gestione Documentale Web archiving, “sfida culturale”: il servizio della Biblioteca Nazionale Centrale di Firenze

Riceviamo e con piacere pubblichiamo la risposta di Chiara Storti, della Biblioteca Nazionale di Firenze, all’articolo di Landino e Marzotti pubblicato in precedenza su forumpa.it. Il tema è quello del web archiving: attività che sconta l’assenza di un quadro normativo stabile di riferimento

12 Giugno 2019

S

Chiara Storti

servizi informatici, Biblioteca Nazionale Centrale Firenze

Photo by Lacie Slezak on Unsplash -https://images.unsplash.com/photo-1472068996216-8c972a0af9bd?ixlib=rb-1.2.1&ixid=eyJhcHBfaWQiOjEyMDd9&auto=format&fit=crop&w=754&q=80

Il 20 marzo scorso è stato pubblicato, su queste pagine, l’articolo di Costantino Landino e Lina Marzotti “Perché dovremmo pensare al web archiving”. L’articolo che espone e problematizza egregiamente la tematica del web archiving sostiene però, sul finale, che:

Nel contesto europeo, l’Italia emerge per la sua assenza. L’unica iniziativa nota a livello nazionale è stata realizzata nel 2006 dalla Biblioteca nazionale centrale di Firenze con una sperimentazione di web archiving del dominio “.it”, elaborata sulla scia del principio del deposito legale previsto dal DPR 252/2006, considerando, dunque, i siti web nazionali alla stregua di pubblicazioni bibliografiche o periodiche.

A questa affermazione corre l’obbligo di ribattere, tentando di raccontare brevemente in cosa consiste il servizio di Web archiving che la Biblioteca Nazionale Centrale di Firenze (BNCF) ha avviato oltre un anno fa; senza, beninteso, nessun intento polemico, ma con la sola volontà di dare risonanza ad un’attività che, anche per le ragioni esposte da Landino e Marzotti, riteniamo di importanza strategica per il nostro Paese.

Il contesto normativo nazionale e l’esigenza di conservare

Uno degli istituti fondamentali, in Italia come nel resto del mondo, che concorre ad agevolare la conservazione del patrimonio bibliografico (facendo rientrare in questa definizione tutto ciò che tradizionalmente è conservato nelle biblioteche, per lo più, informazione testuale di interesse culturale registrata su qualsivoglia supporto, analogico o digitale) è quello del deposito legale, normato nel nostro Paese dalla L. 106/2004 e dal suo Regolamento attuativo D.P.R. 252/2006. Il deposito legale dei documenti diffusi tramite rete informatica non è però ancora obbligatorio perché lo stesso D.P.R. 252/2006 all’art. 37 prevedeva che il deposito di tali documenti fosse subordinato alla redazione di uno specifico regolamento tecnico che, purtroppo dopo 13 anni, non è ancora stato emanato.

La mancanza di una specifica normativa nazionale in materia di deposito legale e conservazione dei documenti digitali di interesse culturale (diversa la situazione per i documenti di carattere amministrativo, la cui conservazione è disciplinata dal Codice dell’Amministrazione Digitale) crea evidentemente numerose difficoltà nell’attuazione di una mission, quella di preservare e rendere accessibile nel lungo periodo il patrimonio culturale, che molte biblioteche hanno a prescindere, e che la Biblioteca Nazionale di Firenze trova ufficialmente tra i compiti previsti nel Decreto del 2008 con cui viene riconosciuta Istituto dotato di autonomia speciale all’interno del MIBAC.

Non potendo, per altro, nascondere l’evidenza che la conservazione del digitale è ormai, anzi lo è da qualche decennio, una necessità de facto.

L’assenza di un quadro normativo di riferimento oltre ad una serie di ostacoli gestionali che tenteremo di analizzare velocemente di seguito, porta con sé, come facilmente intuibile,  l’impossibilità di stanziare risorse economiche, umane e strumentali su questa attività in maniera proporzionata e continuativa.

Magazzini Digitali

Non solo per la mission che caratterizza la biblioteca e per la necessità de facto di conservare il digitale, ma anche per esplicito mandato del comma 2 dell’art. 37 del D.P.R. 252/2006, a partire dal 2006 la BNCF ha guidato il progetto, cui partecipano anche la Biblioteca Nazionale Centrale di Roma e la Biblioteca Nazionale Marciana di Venezia, per la realizzazione di un’infrastruttura condivisa per la gestione del servizio nazionale di conservazione e accesso ai documenti digitali denominato “Magazzini Digitali”.

In quasi 10 anni di attività, nonostante il contesto fin qui delineato, sono stati “immagazzinati” oltre 96.000 tesi di dottorato (depositate presso le due Biblioteche Nazionali Centrali di Roma e Firenze in base all’art. 73 del D.P.R. 382/1980), quasi 40.000 articoli di riviste ad accesso aperto, e circa 500 ebook di editori commerciali che volontariamente hanno scelto di effettuare i depositi. Inoltre, come riportato da Landino e Marzotti, nel 2006 è stato fatto un esperimento di Web archiving sull’intero dominio “.it”, grazie al quale sono stati raccolti 6 TB di dati.

Il servizio di Web archiving della BNCF

A marzo 2018, la BNCF ha avviato un nuovo servizio di Web archiving, cui qualsiasi ente, istituzione o associazione responsabile di uno o più siti web di interesse culturale può aderire. Inizialmente, in effetti, come ricordano Landino e Marzotti, l’attività di raccolta automatica (harvesting) avrebbe dovuto concentrarsi quasi esclusivamente su i siti che pubblicano documenti di interesse culturale, con una forma in qualche modo “editorialmente” definita e destinati al deposito legale, per sperimentare quella che, a norma di futura legge, sarà la modalità preferita di raccolta/deposito dei documenti pubblicamente accessibili sul Web.
Evidentemente però, dal D.P.R. 252/2006, il mondo è cambiato ed è ormai impossibile pensare di conservare il presente escludendo i siti web, che sono spesso anch’essi testimonianze aventi valore di civiltà, come da definizione di “beni culturali” del D.L. n. 42/2004.
I siti web vengono quindi raccolti sia in quanto “contenitori di documenti” sia qualora possano essere considerati essi stessi “documenti”.

Anagrafe dei domini

Al momento della stesura di questo contributo, l’Anagrafe dei domini .it registra 3.202.490 nomi a dominio perciò una loro raccolta indifferenziata non è possibile, e non è praticata da alcun Paese al mondo. Non è possibile perché anche per il digitale ci sono problemi di spazio, non tanto inteso come spazio di storage ma piuttosto come spazio di elaborazione e indicizzazione, cioè, in senso lato, di capacità non solo di conservare ma anche di rendere realmente ricercabile e accessibile questo patrimonio. A questo proposito, è bene ribadire che, oltre che della raccolta, la Biblioteca si fa carico  dell’organizzazione dei siti archiviati e della metadatazione “manuale”, a livello di singolo documento, laddove lo si ritenga opportuno, proprio per agevolare l’accesso da parte degli utenti.

La BNCF opera perciò una selezione dei siti, in gran parte basandosi sulle priorità elencate nel D.P.R. 252/2006, ma anche cercando di definire quella che siamo abituati a chiamare una “politica della collezioni” digitali. Una delle difficoltà del Web archiving, in assenza di una normativa di riferimento, è che, dopo la selezione, per poter procedere effettivamente alla raccolta, è necessario chiedere esplicita autorizzazione ai detentori dei siti web, con un forte aggravio di lavoro gestionale. Inoltre, potendo solo suggerire ma non certo imporre ai gestori dei siti di usare determinate accortezze nella loro pubblicazione, ottenere una raccolta di qualità (in termini di completezza e di fruibilità delle pagine web) è spesso assai complesso.

Le sfide del prossimo futuro per la PA

Possiamo quindi affermare che il Web archiving è una sfida più culturale che tecnologica. È necessaria un’assunzione di consapevolezza da parte del legislatore e degli amministratori della problematica, e poi si tratta ovviamente di prendersi la responsabilità di fare delle scelte su cosa conservare e come; problema affatto inedito nella storia delle istituzioni culturali, ma complicato dal fatto che la massa di informazioni da selezionare è esponenzialmente più grande che in qualsiasi altra epoca che ci abbia preceduto.

Infine, poiché restiamo convinti che tale attività debba rimanere appannaggio delle amministrazioni culturali pubbliche, pur potendo e dovendo collaborare anche con soggetti privati che dispongono di strumenti e know-how in questo campo, è assolutamente indispensabile poter contare, all’interno di queste amministrazioni, sulla presenza in quantità sufficiente di professionalità in grado di governare compiutamente e in maniera integrata tale  processo, non solo dal punto di vista scientifico e tecnologico ma anche da quello amministrativo e organizzativo. Pur con tutti i limiti fin qui esposti, non solo stiamo pensando al Web archiving, ma lo stiamo facendo.

Gestione Documentale

Perché dovremmo pensare al web archiving

La maggior parte degli archivi e delle biblioteche nazionali europee ha intrapreso progetti di web archiving, ovvero la conservazione dei…

di Costantino Landino e Lina Marzotti

20 Marzo 2019

Valuta la qualità di questo articolo

La tua opinione è importante per noi!