Magazine Internet

Google glottologo

Da Pinobruno

Google ha dato una grossa mano per creare il genoma della cultura universale – il culturoma – e con la culturomica fa il glottologo del sapere universale. Occhio ai due neologismi. L’anno prossimo li ritroveremo nei dizionari, più o meno così: “culturoma: nelle scienze linguistiche attesta, con l’ausilio di software particolari, la ricorrenza delle parole e dei nomi più usati nei libri pubblicati da Gutenberg in poi, svelandone l’origine e l’introduzione nel linguaggio”. 

Google glottologo aiuta a inventare la culturomica

Google, che ha ingoiato nei suoi scanner quindici milioni di libri, ha permesso agli scienziati di analizzarne minuziosamente cinque milioni. Jean-Baptiste Michel e Erez Lieberman Aiden, della Harvard University di Boston, ci hanno lavorato su quattro anni, insieme con un folto numero di ricercatori di Google Books, Encyclopaedia Britannica, American Heritage Dictionary. I risultati della ricerca sono stati pubblicati ieri su Science.

L’abstract della pubblicazione scientifica: “Abbiamo costruito un corpus di testi digitalizzati contenenti circa il 4% di tutti i libri mai stampati. L’analisi di questo corpus ci permette di indagare le tendenze culturali quantitativamente. Abbiamo sondato il vasto terreno della culturomica (culturomics, nell’originale. NdR), puntando sui fenomeni linguistici e culturali che hanno caratterizzato la lingua inglese tra il 1800 e il 2000. Dimostriamo come questo approccio possa fornire spunti su ambiti diversi come lessicografia, l’evoluzione della grammatica, della memoria collettiva, l’introduzione della tecnologia, la ricerca della fama, la censura, e l’epidemiologia. La culturomica allarga i confini di una rigorosa indagine quantitativa alla vasta gamma di nuovi fenomeni che permeano le scienze sociali e umanistiche”.

Strumento di base della ricerca è il software Google Books Ngram Viewer, realizzato nei laboratori Google da Matthew Gray e Yuan K. Shen.

Google glottologo aiuta a inventare la culturomica

Google Books Ngram Viewer

Così, grazie a Google e ai milioni di libri elettronici presenti nella sua libreria, è stato creato il ‘genoma delle parole’, un set di dati gigantesco per studiare la cultura e la sua evoluzione, come farebbe un paleontologo con i fossili. Con il software messo a disposizione da Google, si può indagare l’origine di ogni parola, vedere quando è stata introdotta nell’uso comune e con che frequenza è stata usata negli anni. Oppure si può studiare un personaggio famoso in base al numero di volte in cui il suo nome è stato citato nei libri nel corso dei secoli.

Gli scienziati hanno creato un database enorme da interrogare: 5,2 milioni di libri (il 72% dei quali in inglese), pari a oltre 500 miliardi di parole in totale. E’ una sequenza di dati 1.000 volte più grande del genoma umano che, se scritta in una linea retta, sarebbe lunga dieci volte il viaggio andata e ritorno Terra-Luna.

Google glottologo aiuta a inventare la culturomica

Intervistato dall’ANSA, Jean-Baptiste Michel ha tracciato i grafici di alcune parole, come ‘cibo italiano’, mostrando ad esempio che dei piatti italiani si parla oggi circa cinque volte piu’ spesso nei libri in lingua inglese rispetto al 1950, segno della forza crescente della cultura gastronomica italiana.

”Si stima che a oggi siano stati prodotti 129 milioni di libri – spiega lo scienziato – Google ne ha digitalizzato 15 milioni e noi abbiamo lavorato su 5,2 milioni di questi (il 4% dei libri attualmente sulla faccia della Terra) e li abbiamo trasformati in un ‘telescopio’ della cultura umana; uno strumento che ognuno può utilizzare per tracciare e vedere il modo in cui parole e idee sono state usate nei secoli”.

”Con il ‘culturoma’ – chiamato così per assonanza con il genoma, racconta Jean-Baptiste Michel – sono già emerse molte informazioni, per esempio che ogni anno le parole introdotte nel lessico sono circa 8.500 e che il 52% di esse forma una ‘materia oscura’ che è entrata nel lessico, si trova nei libri, ma non è riportata nei dizionari”.

 


Potrebbero interessarti anche :

Ritornare alla prima pagina di Logo Paperblog

Possono interessarti anche questi articoli :

  • Facebook batte Google nelle login

    Facebook batte Google nelle login

    Janrain, una potente piattaforma di gestione che consente di verificare la performance di ben 18 tra i maggiori siti e social network , tra cui Facebook,... Leggere il seguito

    Da  Mondozio
    INTERNET, MEDIA E COMUNICAZIONE, SOCIAL NETWORK
  • La censura di Google Instant

    censura Google Instant

    Una ventina di giorni fa, con grande clamore nel mondo Web, è nato Google Instant, un sistema che consente di vedere i risultati di ricerca man mano che si... Leggere il seguito

    Da  Pamelaferrara
    INTERNET, MEDIA E COMUNICAZIONE
  • Google Me sfida Facebook

    Google sfida Facebook

    Google Me, questo il nome del nuovo Social network targato Google. Il rumor è ormai in rete da qualche giorno, ma aumenta la curiosità per il possibile... Leggere il seguito

    Da  Pocheidee
    INTERNET, MEDIA E COMUNICAZIONE
  • Finire sulla prima pagina di Google

    Finire sulla prima pagina Google

    Di questi tempi, si sa, riuscire a finire sulla prima pagina di Google per una determinata ricerca non è una cosa facile, soprattutto se la concorrenza è tanta ... Leggere il seguito

    Da  Enricoporro
    INTERNET, MEDIA E COMUNICAZIONE, MOTORI DI RICERCA
  • Google ricorda Pippi Calzelunghe

    Google ricorda Pippi Calzelunghe

    Il doodle di Google di oggi è dedicato a Pippi Calzelunghe che compie 65 anni, personaggio nato dalla penna di Astrid Lindgren e diventato una serie televisiva... Leggere il seguito

    Da  Franzrusso
    INTERNET, MEDIA E COMUNICAZIONE, MOTORI DI RICERCA
  • Notifiche desktop Gmail su Google Chrome

    Notifiche desktop Gmail Google Chrome

    L’abitudine di utilizzare un solo browser per navigare in rete ha tanti vantaggi, ma talvolta nasconde qualche limite: così, avendo ripristinato per tutto... Leggere il seguito

    Da  Kobayashi
    INTERNET, MEDIA E COMUNICAZIONE, TECNOLOGIA
  • Google oggi naviga con Jules Verne

    Google oggi naviga Jules Verne

    Non poteva essere diversamente la dedica di Google al grande scrittore francese, autore di uno dei romanzi più affascinanti della letteratura mondiale, Ventimil... Leggere il seguito

    Da  Franzrusso
    INTERNET, MEDIA E COMUNICAZIONE, MOTORI DI RICERCA