Magazine Informatica

Come è fatto un EPUB

Creato il 08 marzo 2011 da Hnikarr
Il formato EPUB è il formato che, al momento, sta ottenendo più successo come standard per la distribuzione degli e-book, soprattutto sui supporti di piccole dimensioni come gli iPod, iPhone e altri tipi di lettori. Abbiamo già visto in breve quali siano le principali differenze tra EPUB e PDF, in quali casi sia preferibile usare l'uno e in quali casi sia preferibile usare l'altro: possiamo riassumere il discorso, dicendo che, per adesso, il PDF è più versatile e più adatto a pubblicazioni ricche di immagini, ma è poco adattabile a piccoli schermi, mentre lo EPUB ha maggiori difficoltà a supportare immagini e tabelle, ma si adatta alla perfezione a qualsiasi schermo. Abbiamo visto anche come sia possibile convertire gran parte dei files in formato EPUB, usando Calibre, e come sia possibile creare o modificare un EPUB usando Sigil. Per concludere il discorso, vedremo oggi come sia fatto in concreto un EPUB, quale sia la sua struttura.
Innanzitutto, un EPUB non è un file unico: ci appare come file unico, ma in realtà è una cartella compressa, formata da diversi files. Un po' come un file in formato DOCX, per intenderci, il formato standard utilizzato da Word 2007 in poi. Lo EPUB è una cartella compressa: se la apriamo con un lettore, allora ci apparirà lo e-boook e lo potremo leggere normalmente; se invece lo proviamo ad aprire con WinRAR o programmi simili, allora ci apparirà la sua struttura interna, composta da più cartelle e da più files. Questo perché lo EPUB è, alla fin fine, un file ZIP con una estensione .epub.
Se proviamo a "vivisezionarne" uno, otterremo questo:
Struttura epubMimetype è un file contenuto da tutti gli EPUB e deve essere il primo file dell'archivio. A differenza del resto, non deve essere compresso, perché funziona come un file guida: è il primo che sarà letto, aprendo lo EPUB con un normale lettore.
META-INF è la prima delle due cartelle che troviamo nello EPUB. Al suo interno c'è soltanto un file XML, chiamato "container": un lettore EPUB lo cercherà subito, aprendo un e-book in questo formato, perché è il file che contiene le informazioni su dove trovare tutto il materiale da cui è composto lo EPUB. In pratica, dà le indicazioni stradali al lettore.
Queste prime due parti sono le uniche che non cambieranno mai in nessun EPUB: devono sempre trovarsi nello stesso posto e con gli stessi nomi, altrimenti un lettore non sarà in grado di aprire e visualizzare lo EPUB. Il resto del contenuto, invece, è più malleabile.
OEBPS è la cartella in cui si trova effettivamente il nostro e-book, ossia l'indice dei contenuti, i files dei vari capitoli, le eventuali immagini e così via. In realtà, il nome della cartella è a libera scelta, ma convenzionalmente si utilizza il nome OEPBS, che sta per "Open eBook Publication Structure" ed è il nome che useranno programmi come Calibre o Sigil, creando un EPUB.
Questo è un esempio del contenuto di una cartella OEBPS:
Come è fatto un EPUBContent.opf è il file che specifica la collocazione esatta di tutte le componenti del libro: testo, immagini e quant'altro. Può anche avere altri nomi, ma di solito si utilizza questo. Scritto in XML, lo possiamo dividere in più parti:
- Metadati: contiene titolo del libro, nome dell'autore, eventuale codice ISBN, insomma tutte quelle cose che abbiamo già visto parlando di Calibre e Sigil e che sono obbligatorie da inserire, al momento della creazione di un EPUB.
- Manifest: contiene l'elenco di tutte le parti del libro, ossia una lista coi vari capitoli da cui è composto, le immagini che appaiono e così via. Ogni file che faccia parte dello EPUB deve comparire in questa lista: l'assenza di qualcosa è uno degli errori riportati più spesso dallo Epubcheck.
- Spina dorsale: se il Manifest indica tutti i pezzi di un EPUB, qui viene indicato l'ordine in cui vanno letti.
Toc.ncx è un altro file in formato XML, che contiene in pratica l'indice del libro o, se preferite, la tavola dei contenuti.
Queste parti le troviamo in ogni EPUB; il resto, invece, dipende da libro a libro e rispecchia il contenuto vero e proprio, ossia i capitoli, le immagini e così via. Di solito è suddiviso in più cartelle, come in questo caso, per renderlo più semplice e comprensibile, nonché più ordinato, ma non è obbligatorio.
La cartella Text conterrà ovviamente il testo del libro, ossia i files dei singoli capitoli: di solito, ogni capitolo è un file XML con estensione .html, .xhtml oppure .xml, non molto diverso da una normale pagina web.
La cartella Styles conterrà tipicamente un file .css, dove sono state salvate le informazioni sullo stile delle pagine, il carattere utilizzato, formattazione dei testi e tutto quanto riguarda, appunto, la grafica della pagina. Questa cartella è spesso assente, se le indicazioni di stile sono già incluse nei singoli files dei capitoli.
La cartella Images conterrà le immagini che compaiono nello EPUB, se ne compaiono. Specifichiamo che i formati supportati per le immagini sono solo quattro: JPEG, PNG, GIF e SVG. Una eventuale immagine di copertina si troverà in questa cartella, se è prevista l'immagine di copertina.
EPUB di piccole dimensioni e con una struttura semplice potrebbero non avere queste sottocartelle: ho presentato qui la struttura di un libro vero e proprio, tanto per mostrarvi un EPUB in forma completa.

Potrebbero interessarti anche :

Ritornare alla prima pagina di Logo Paperblog

Possono interessarti anche questi articoli :