Magazine Informatica

Internet Archive, viaggiare nel passato della Rete

Creato il 11 ottobre 2011 da Hnikarr
Il mondo della Rete, come si è sentito dire fino alla nausea, è un mondo in continuo mutamento, fluido, dove nuovi contenuti sono prodotti senza sosta, a vagonate, e sostituiscono contenuti vecchi, per essere a propria volta sostituiti da contenuti nuovi, in un tempo brevissimo. Fin qui, niente di nuovo. Vediamo siti che cambiano spesso, modificando la propria grafica, introducendo nuove funzioni, eliminando funzioni vecchie; pagine appaiono e pagine scompaiono, alcune eliminate con la forza dalla censura di questo o quel paese. Per tentare di mettere un ordine in tutto ciò, abbiamo naturalmente i motori di ricerca come Google, che di continuo percorrono coi propri bots la Rete, indicizzando le pagine, salvandone copie nella cache e costruendo archivi provvisori. Anche questo sistema, però, copre un arco temporale molto ristretto: troviamo soprattutto pagine di oggi, che sono sopravvissute o che sono attive adesso. Non troviamo, ad esempio, la versione di un sito così come si presentava cinque o sei anni fa, ma solo la sua faccia attuale. I motori di ricerca sono ottimi per fotografare la Rete di oggi, ma possono ben poco per la Rete di ieri o dell’altroieri. Il passato, anzi, tende a perdersi, sostituito da contenuti più nuovi. Come recuperarlo, dunque? Internet Archive è una organizzazione che nasce proprio con questo scopo: realizzare una “Libreria di Alessandria” per il mondo digitale, raccogliendo e catalogando tutto (o quasi) il materiale prodotto in Rete. Dal 1996, anno della sua fondazione, Internet Archive si dedica a un compito solo, ma molto preciso: salvare e conservare una copia di tutto ciò che è stato prodotto in Rete, così come è stato prodotto in quel particolare momento. Un compito immane, come è facile da capire. Al momento della sua nascita, cioè quindici anni fa, Internet Archive si occupava soltanto delle pagine web, anche perché costituivano la maggior parte del contenuto della Rete. Oggi, invece, il suo campo di azione si è allargato, fino a includere anche altri tipi di documenti digitali, come i file video, gli audio e gli ebooks, giusto perché non avevano già abbastanza lavoro a catalogare miliardi e miliardi di pagine (150 miliardi, al momento) e si annoiavano un poco... Scherzi a parte, Internet Archive lavora in un modo simile a un motore di ricerca come Google, per raccogliere i propri documenti. Periodicamente, percorre la Rete coi suoi bots, che saltellano da un link all’altro e salvano una copia delle pagine che attraversano, esattamente come fanno gli spider di Google: la differenza è che, mentre la cache di Google cambia ogni volta che ne è prodotta una nuova copia (la nuova versione di una pagina della cache va a sostituire la versione precedente), per quanto riguarda Internet Archive le copie si accumulano. Di uno stesso sito, dunque, troveremo versioni diverse a seconda dell’anno, del mese e del giorno in cui ne è stata salvata una copia: come un album di famiglia, in cui le varie foto sono accostate le une alle altre, permettendoci di seguire la “crescita” del sito. Ma tagliamo corto con le chiacchiere e vediamo in concreto come funziona. Per approfondimenti sul funzionamento di Internet Archive, la sua storia e quanto altro, vi rimando alla loro pagina ufficiale (in inglese).
Questo è ciò che ci appare, una volta entrati nel loro sito: Internet Archive, viaggiare nel passato della Rete Non ci capite nulla? Nessun problema, elencherò adesso le funzioni principali e i posti dove trovarle. La prima cosa che potete vedere, in alto e leggermente sulla sinistra, appena sotto il titolo, è il riquadro per la ricerca all’interno del sito. Si comporta come qualsiasi altra finestra di ricerca: scrivete ciò che vi interessa cercare e poi selezionate, dal menu a destra, il campo della ricerca. C’è un po’ di tutto: video, audio, ebook, programmi, archivi di varie biblioteche, eccetera. Se non sapete esattamente cosa state cercando (per esempio il titolo del video, o del file audio), potrebbe essere piuttosto difficile trovarlo, ma ci sono altri sistemi per la ricerca.

Wayback Machine

Appena più in basso, troviamo un riquadro dal titolo “Web”, caratterizzato da questo logo Internet Archive, viaggiare nel passato della Rete A cosa serve? Serve a fare un viaggio nel tempo, attraverso la Rete. Se vogliamo vedere come era un sito anni fa, allora è questa la sezione che ci interessa. Possiamo cercare nell’archivio di Internet Archive, ordinato per anno, e guardare tutte le vecchie copie di una pagina, anche se il sito originale non esiste più. Basta inserire l’indirizzo del sito, scegliere l’anno che ci interessa e potremo navigare attraverso il passato di quel sito. È molto interessante osservare come si sia evoluto negli anni, ma anche rileggere oggi le notizie e le “profezie” che si facevano dieci o più anni fa sul futuro della Rete... A parte questo, ha anche altri usi più importanti, come ad esempio ha permesso di conservare quei siti che, altrimenti, sarebbero svaniti con la chiusura di GeoCities, due anni fa. Se non sapete cosa sia GeoCities o non avete mai sentito questo nome, significa che siete troppo giovani: vergognatevi profondamente e leggete questa pagina.
Oltre alla “macchina del tempo” per i siti, ci sono altri riquadri utili, sempre nella home di Internet Archive, e li troviamo appena sotto: Moving Images (che sarebbero video di vari tipi), Live Music Archive, Audio e Texts. Il loro contenuto dovrebbe essere sufficientemente chiaro già dal nome. Come ho detto in precedenza, Internet Archive ha allargato il proprio raggio di azione e oggi non raccoglie più solo le pagine web, ma anche altri documenti digitali: queste sono le sezioni per accedere agli archivi di quei documenti, se non riusciamo a trovarli attraverso la normale ricerca. Cliccando su “Browse”, che troviamo accanto a ogni sezione, potremo accedere all’archivio e setacciarlo così in ordine alfabetico, alla ricerca di quello che ci interessa. Cliccando sul nome della sezione, invece, saremo portati a una breve introduzione, che ci presenterà il contenuto di quell’archivio.

Potrebbero interessarti anche :

Ritornare alla prima pagina di Logo Paperblog

Possono interessarti anche questi articoli :