Si può rappresentare il web come un iceberg, in cui la parte emersa è il 10% della massa totale. Tutto il resto è Deep Web. Normale chiedersi cosa ci sia in questi miliardi di pagine nascoste a Google a agli altri motori di ricerca (Mdr).
Per i normali ricercatori, nel deep web non ci sono tesori informativi nascosti, anche perché è un ambiente di assoluto anonimato, quindi del tutto inaffidabile. Però utile sapere che cos'è il deep web e come funziona, perché da queste profondità del web a volte emergono informazioni, documenti, di cui serve comprendere le modalità di formazione.
I siti che scelgono di sottrarsi ai Mdr e quindi al pubblico ordinario, adottano diverse tecniche. La più semplice è quella di non essere indicizzati dai Mdr: basta un click sulla pagina web. E' una pratica normale per i siti in costruzione o quando si ritiene che le pagine siano di interesse molto ristretto o riservato. Ma chi vuole veramente nascondersi utilizza protocolli di rete diversi da quelli Http, quali I2P, non-exit-relay, Freenet.
Cosa si trova nel deep web? Di tutto. Anche Edward Snowden e gli attivisti delle primavere arabe hanno usato il deep web per sfuggire la censura e i controlli. Poi ci sono forum, siti di organizzazioni spesso estremiste (è stato calcolato che ce ne sono almeno 50 mila) e anche siti di e-commerce illegali e/o fraudolenti.
Le presenze più note sono , e del New Yorker, un sistema creato dal giornale "per dare agli informatori completa sicurezza e anonimato". Poi c'è Kavkaz, un sito di notizie anonime del Medio Oriente disponibile in russo, inglese, arabo e turco.
Livello 1 - Web indicizzato
Questo è il Web di tutti i giorni: ci sono i siti pubblici, i blog, i forum, le pagine dei social network ecc. Il tutto, indicizzato più o meno bene dai Mdr.
Livello 2 - Web riservato
Questo livello è ancora accessibile attraverso mezzi normali e contiene pagine e documenti riservati, come server aziendali o istituzionali, oltre a siti web ad accesso condizionato, come Reddit.
Reddit è un sito dove utenti registrati possono pubblicare contenuti sotto forma di post testuali o di link votabili dai partecipanti. Il tutto ruota su questi temi.
- Istruzione: News, Science, Space, Today I Learned e World News.
- Intrattenimento: Creepy, Documentaries, Gaming, Listen To This, Movies, Music, Sports, Television e Videos.
- Discussioni: Ask Reddit, Ask Science, Books, Explain Like Im Five, IAmA, No Sleep e Two X Chromosomes.
- Humor: Data Is Beautiful, Funny, Internet Is Beautiful, Jokes, Not The Onion, Shower Thoughts, TIFU e Uplifting News.
- Condivisione immagini: Art, Aww, Earth Porn, Gifs, Midly Interesting, Old School Cool, Pics e Photoshop Battles.
- Self-improvement: DIY, Fitness, Food, Get Motivated, Life Pro Tips, Personal Finance, Philosophy e Writing Prompts.
- Tecnologia: Futurology e Gadgets.
- Meta subreddits: Announcements e Blog.
Livello 3 - Web underground
In questo livello si possono trovare alcuni siti "underground " ma ancora indicizzati, come 4chan, un sito di image board. Questo livello è l'ultimo normalmente accessibile: tutti i livelli che seguono questo devono essere accessibili con un proxy, o altro.
Oltre il livello 3 non c'è nulla di interessante per chi cerca informazioni o documenti utilizzabili. Non solo. Non essendoci Mdr per queste aree, ci si deve affidare a liste, documenti, pagine wiki (costruite collettivamente da anonimi) che offrono una serie di link ordinati in categorie da copiare e incollare sul browser di Tor per visualizzarle sul Pc.
Dato che solo gli esperti sanno proteggere realmente i propri dati, principianti e dilettanti rischiano "come un turista che passeggia di notte nei peggiori quartieri di Bogotà, con uno scintillante Rolex al polso" .
Livello 4 - Deep Web
E' accessibile solo attraverso Tor, (acronimo di The Onion Router) è un sistema di comunicazione anonima. Tor si interpone tra il tuo Pc e l'ambiente estereno, facendo da interfaccia anonima, ovvero inoltrando le richieste e le risposte dall'uno all'altro. Tor è stato creato a suo tempo per permettere la navigazione nelle nazioni in cui Internet era ed è soggetto alla censura. Tor garantisce l'anonimato attraverso il continuo rerouting su nodi. In altre parole, ogni PC connesso a TOR è un nodo, come in una rete P2P. Ecco perché è difficilissimo tracciarne le connessioni ed altrettanto facile sfuggire ai controlli. Inoltre nel deep web file come video, foto e documenti sono custoditi su computer di utenti diversi e obbediscono alla regola del peer-to-peer.
Livello 5 - Charter Web
Contiene forum più o meno temporanei (charter) di soggetti (dal disonesto al truffatore al delinquente) interessati ad attività illegali. È comunemente ritenuto "il mercato nero del web".
Livello 6 - Mariana's Web
Per accedere a questo livello, che prende il nome dalla Fossa delle Marianne, a quanto pare, c'è bisogno del "Polymeric Falcighol Derivation" che è un Quantum Computing. Ma chi possiede capacità di Quantum Computing? I governi.
A cura del "Corso Online di Ricerche e Motori di ricerche", gratuito per gli iscritti a FirstMaster.Deep web: cosa è e come usarlo (video 12.45)
.