Magazine Informatica

WikiTaxi: usare Wikipedia senza connessioni

Creato il 22 ottobre 2011 da Hnikarr
Wikipedia è una risorsa online che ormai la maggior parte degli utenti della Rete “sfrutta” quotidianamente o quasi, sia per la scuola sia per interessi personali. Dopo il blocco di Wikipedia, alla presentazione della proposta di legge sulle intercettazioni (e annesso comma 29, il famigerato ammazzablog), in molti si saranno preoccupati all’idea di cosa potrebbe succedere, se davvero Wikipedia fosse costretta a chiudere, almeno nella versione italiana. Una soluzione sarebbe di certo quella di utilizzare le versioni in altre lingue, come l’inglese, ma parecchi potrebbero trovarlo complicato. In alternativa, o almeno per premunirsi, è possibile scaricare un dump di Wikipedia, per consultarlo poi sul nostro computer, senza bisogno di connessione. È di questo che parlerò oggi. Prima di tutto, spieghiamo cosa sia un dump (riferito a un sito internet). Se sapete cosa sia una copia di backup, allora sapete anche cosa sia grossomodo un dump. Molti siti, periodicamente, realizzano una copia di tutto il proprio contenuto: pagine, immagini, files, eccetera. Questa copia, poi, viene compressa con vari algoritmi che non staremo a esaminare, per ridurne le dimensioni e occupare meno spazio. Otteniamo così una versione compressa e inscatolata del sito originale, che è pronta per essere immagazzinata e conservata: questa copia è un dump. A cosa serve? Beh, dipende. Se succede qualcosa al sito originale, è sempre utile possedere una copia da parte, anche se magari non è aggiornata fino all’ultimo momento, ma è vecchia di un paio di settimane: perderemo le ultime modifiche, ma tutto il resto ci sarà. Inoltre, può avere valore come testimonianza per l’archivio, in quanto ci fornisce una immagine di come fosse un sito in un determinato momento: abbiamo già parlato di archivi internet, in un altro articolo. Infine, è utile per chi vuole conservare un intero sito sul proprio computer e accedervi in qualsiasi circostanza, che sia connesso oppure no. A noi oggi interessa questo ultimo caso. Wikipedia, infatti, realizza un dump completo per ogni versione della propria enciclopedia: un dump per quella italiana, uno per quella inglese, eccetera. La cadenza di questi dump è variabile ed è legata alla frequenza con cui una versione è aggiornata, oltre che alle dimensioni della stessa. Come minimo, una copia completa di ogni versione di Wikipedia è realizzata ogni mese, ma per molte versioni la frequenza è maggiore ed è ogni due settimane. Questa è la pagina dove sono immagazzinati i vari dump, liberamente accessibili al pubblico: WikiTaxi: usare Wikipedia senza connessioni
La voce che interessa a noi, in questo caso, è la prima, ossia “Database backup dumps”: qui troveremo le copie di tutte le versioni di Wikipedia, nelle varie lingue in cui esiste, e da qui le potremo scaricare liberamente. Ci sono alcune limitazioni al download, legate più che altro al consumo di banda, per evitare che pochi utenti possano intasare la rete e impedire agli altri di scaricare, ma è un problema per cui esistono alcune soluzioni, che vedremo magari la prossima volta. Per oggi, concentriamoci sui dumps e su come usarli.
WikiTaxi: usare Wikipedia senza connessioni

WikiTaxi

WikiTaxi è un programmino gratuito, abbastanza semplice da usare, che ci permette di navigare sul nostro computer un dump di Wikipedia, proprio come se stessimo navigando il sito originale. È in versione multilingua, per adattarsi alle varie versioni di Wikipedia, ma purtroppo le istruzioni per utilizzarlo non sono multilingue, ma soltanto in inglese. Vedremo dunque in breve come funzioni. Per utilizzare WikiTaxi, e consultare così Wikipedia senza bisogno di collegarci alla Rete, abbiamo bisogno di due elementi: WikiTaxi, ovviamente, e un dump di Wikipedia, che possiamo scaricare dal sito indicato in precedenza. Prima di tutto, dovremo estrarre WikiTaxi dalla cartella compressa in cui ci arriverà, una volta scaricato. Non ha bisogno di installazione, per cui sarò sufficiente un doppio click sulla sua icona (WikiTaxi.exe) per avviarlo: possiamo dunque tenerlo sul nostro computer, oppure su un supporto esterno, come una chiavetta USB, e non ci darà problemi. Quando lo avviamo per la prima volta, una serie di schermate ci spiegherà come fare per procurarci una copia di Wikipedia, e come fare per caricarla nel database di WikiTaxi. Non è un procedimento così complicato come potrebbe sembrare, ma richiederà un certo tempo, semplicemente perché una copia di Wikipedia è piuttosto grande e non la scaricherete in due minuti. La versione inglese è di circa 3,5 GB (per adesso, ma crescerà), mentre le versioni in altre lingue sono attorno al GB di dimensione, qualcosa più qualcosa meno: la versione italiana occuperebbe all’incirca un CD-ROM e mezzo (o forse anche due), per dare una idea più precisa. Avviare lo scaricamento è semplice: entriamo nella pagina contenente la versione nella lingua che ci interessa (quella italiana è la itwiki), scegliamo la data più recente del backup e poi andiamo alla ricerca di un file dal nome pages-articles.xml.bz2. Scarichiamolo ed è fatta. Per caricare il dump all’interno di WikiTaxi, dovremo poi avviare WikiTaxi_Importer.exe, che aprirà una finestra di questo tipo: WikiTaxi: usare Wikipedia senza connessioni
Nel riquadro superiore, clicchiamo su “Browse” per selezionare il dump di Wikipedia che vogliamo caricare su WikiTaxi (quello che abbiamo appena scaricato, insomma). Il secondo riquadro ci permette di sceglier eil database che vogliamo creare, ma soprattutto dove vogliamo crearlo: di solito, nella stessa cartella in cui si trova anche WikiTaxi. Clicchiamo “Import now” e aspettiamo. Alla fine, per utilizzare la nostra copia di Wikipedia, basterà avviare WikiTaxi e scegliere il database che vogliamo usare (se ne abbiamo più di uno, ad esempio): si aprirà una pagina a caso e da lì potremo navigare come vorremo, proprio come se fossimo sul sito di Wikipedia.

Potrebbero interessarti anche :

Ritornare alla prima pagina di Logo Paperblog

Possono interessarti anche questi articoli :

Dossier Paperblog