[Segue da Parte terza: i testi]
La soluzione del problema della conservazione – come insegna la sopravvivenza selettiva delle opere di Aristotele – è in primo luogo sociale. Le biblioteche del XXI secolo saranno sempre più digitalizzate: la loro funzione astratta, però, – solo contingentemente identica alla conservazione di oggetti di carta - rimarrà la diffusione della conoscenza. Non a caso i bibliotecari sono, nell’accademia dei morti, fra i pochissimi vivi. Ma non possono essere lasciati soli: la conservazione è sempre il lavoro di una comunità.
Se vogliamo che i nostri documento rimangano leggibili, dobbiamo scegliere formati aperti e non proprietari, sostenuti comunitariamente – come illustra la transizione dell’HTML dal caos dell’inizio degli anni ’90 del secolo scorso alla standardizzazione tramite il W3C, o l’intrapresa del TEI per la creazione di un formato standard per condividere i dati nelle scienze umane. TEI, oggi XML compatibile, è descrittivo piuttosto che procedurale, e insiste sulla struttura logica di un documento piuttosto che sul modo in cui appare fisicamente: è quindi indipendente dallo strumento attuale o futuro con cui un suo file verrà visualizzato. E’ stato, però, pensato con lo sguardo rivolto al passato, per la digitalizzazione di testi stampati. I testi nativi digitali dovranno andare oltre TEI, sfruttando più a fondo l’elasticità dell’XML. Chi scrive. per esempio, ha prodotto un libro tradizionale e un ipertesto da una medesima matrice in xml-docbook, valendosi di fogli stile e di programmi già esistenti, originariamente elaborati per la redazione di manuali tecnici.
I metadati conservano i testi, perché li collocano in una mappa che permette di ritrovarli, di identificarne la natura e di comprenderli in un contesto. Li disegniamo, però, senza sapere che cosa sarà importante nel futuro, e in una situazione in cui i motori di ricerca, piuttosto che affidarsi ai metadati prodotti da noi, preferiscono usare – senza trasparenza - i loro. Secondo Clay Shirky, le tassonomie tradizionali funzionano quando il corpus da catalogare è limitato e i suoi produttori e utenti sono un gruppo coeso di esperti, mentre in rete, con un corpus indefinite prodotto da gruppi sconnessi di dilettanti, sono preferibili i tag apposti dagli utenti – ma come integrazione non sostitutiva delle classifiche fatte dagli specialisti.
Le classificazioni delle biblioteche tradizionali contengono sistemi di localizzazione che permettono di identificare univocamente il luogo in cui si trova un testo. Sul web, le citazioni scientifiche devono fare i conti con la mobilità delle risorse digitali, e la conseguente instabilità degli URL Occorre dunque un sistema di identificatori che si risolvano dinamicamente nell’URL, seguendone le variazioni. Handle offre un simile servizio, assegnando alla risorsa un nome anziché un indirizzo, e rendendola tracciabile attraverso i suoi metadati, i quali comprendono un URL.aggiornabile. Il sistema è distribuito fra server locali: il server globale si limita a indirizzare le richieste degli utenti verso le autorità di denominazione locali specificate nei metadati degli oggetti richiesti. Anche Handle e le sue applicazioni sono frutto di uno sforzo comunitario delle parti interessate.
La vita di un testo sta nell’essere letto: non si conserva chiudendolo in un forziere come una pietra preziosa, ma solo garantendone l’accessibilità nel tempo. Mentre un volume antico può essere fisicamente danneggiato dal contatto col pubblico, un testo digitalizzato sopravvive – cioè continua a esistere in rete – solo se rimane ad accesso aperto. Gli archivi aperti, tuttavia, sono pensati per l’accessibilità dei contenuti piuttosto che per la conservazione dei documenti. E ancora peggiore è la situazione delle riviste elettroniche ad accesso chiuso, a cui le biblioteche si abbonano senza acquisirne neanche una copia. Non possiamo affidare la durata a lungo termine del nostro lavoro ad aziende private finalizzate al profitto ed esposte al fallimento: occorre – di nuovo – un impegno comunitario, come per esempio quello di LOCKSS (Lots of Copies Keep Stuff Safe).
LOCKSS è una rete di biblioteche, realizzata con software libero, che mettono in comune le proprie risorse in un archivio distribuito “chiaro”, cioè aperto al pubblico. Il suo omologo PORTICO, invece, propone un archivio proprietario centralizzato basato su software anch’esso proprietario. LOCKSS ha risposto con CLOCKSS, che archivia tutte le risorse di un gruppo selezionato di biblioteche in un archivio distribuito “nero“, chiuso finché l’editore titolare delle opere conservate rimane attivo: ma l’accesso futuro a CLOCKSS è aperto a tutti, mentre quello a PORTICO è riservato a chi paga. Entrambi le soluzioni sono parziali, e scontano un oneroso pedaggio a un copyright che nell’ambiente digitale può essere applicato in modo molto più intenso e capillare che in quello fisico.
La conservazione delle risorse digitali è un’impresa costosa in termini di hardware, software e personale, che si estende in un orizzonte temporale indefinito. Per questo è esposta alla tragedia dei beni comuni: se le istituzioni si aspettano che la faccia qualcun altro, o che qualcun altro approfitterà del loro lavoro senza dare nulla in cambio, non la farà nessuno. LOCKSS organizza in forma digitale il sistema della libera moltiplicazione delle copie che ci ha permesso di ricevere i testi antichi attraverso i millenni: chi vi partecipa non guadagna nulla, se non la possibilità di avere voce in capitolo su un bene comune – sulla stessa sopravvivenza della cultura nel tempo. Come aveva già capito Platone, scrivere sul papiro o sul silicio equivale a scrivere nell’acqua, se non c’è una comunità di persone che assume, attraverso i secoli, la missione del sapere e della sua disseminazione come un compito proprio.
[Continua]