Magazine Informatica

Come funziona il Knowledge Graph di Google

Creato il 15 dicembre 2012 da Hnikarr

Agli inizi di dicembre, Google ha presentato l’estensione anche per l’Italia di un nuovo strumento di ricerca, ossia il cosiddetto Knowledge Graph. Questo strumento era disponibile in lingua inglese fin dal mese di maggio, ma adesso è stato esteso anche ad altri sette linguaggi: spagnolo, francese, tedesco, portoghese, giapponese, russo e italiano. Per ovvie ragioni geografiche, mi interesserò soltanto di questo ultimo caso, dato che è quello che modificherà almeno in parte  le nostre ricerche. Prima di tutto, vediamo cosa sia in concreto il Knowledge Graph, per capire poi meglio come funzioni. Potremmo descriverlo come un database di conoscenza, finalizzato a costruire una rete semantica di concetti e di “cose”, ma ho la sensazione che non sarebbe molto chiaro per tutti.  Un modo più chiaro, ma in parte fuorviante, di definirlo è dire che, da adesso in poi, Google non cercherà più parole e frasi che corrispondano alle stringhe di testo da noi inserite, ma cercherà i concetti alla base di ciò che noi scriviamo. Se noi scriviamo la parola “cane” nel motore di ricerca, Google non si limiterà a cercare tutte le pagine in cui compare quella parola, ma separerà prima di tutto i diversi significati che la parola “cane” può possedere (animale, costellazione, parte di un’arma da fuoco, eccetera) e ci offrirà un assaggio dei risultati disponibili per ogni concetto: starà poi a noi, in un secondo momento, selezionare il concetto che ci interessa, per accedere a una più vasta raccolta di risultati, basati soltanto su quel particolare significato che noi vogliamo. La nostra ricerca di esempio darà quindi questa prima pagina di risultati: Come funziona il Knowledge Graph di Google
Nella parte centrale vediamo una serie di risultati “tradizionali”, in cui i vari possibili significati della parola “cane” si mischiano; nella colonna di destra, invece, troviamo la lista dei significati in questione: cliccando su uno di questi, potremo lanciare una nuova ricerca, limitata soltanto a quel significato da noi scelto. Per avere un modello ancora più semplice da capire, pensiamo a un normalissimo dizionario. Per ogni parola, un dizionario ci riporterà tutti i significati disponibili, ognuno contraddistinto da un numero; grazie al Knowledge Graph, Google farà la stessa cosa, riportandoci nella colonna di destra la lista dei possibili significati della parola da noi cercata. Riconoscere e catalogare i diversi valori semantici delle parole è il primo passo di questa nuova versione di Google: un passo fondamentale, perché permette di ordinare e definire meglio la ricerca, ma altri ne seguono logicamente. Per ottenere un vero database di conoscenza, non basta distinguere e separare i vari significati delle parole, ma è necessario poi inserirli nei rispettivi campi semantici, ossia metterli in relazione con le altre parole appartenenti allo stesso contesto. Rimanendo all'esempio “cane”, una volta che abbiamo definito il significato posseduto dalla parola, dovremo poi inserirla nel suo contesto e vedere a quali altre parole si collega: l’animale, ad esempio, potrebbe ricondurci ad altri canidi, come il lupo o la volpe, ma anche ad altri animali domestici come il gatto o il criceto; la costellazione ci porterà invece all'astronomia  a svariate altre costellazioni e, magari, anche ai miti corrispondenti a ognuna di esse; la parte della pistola ci aprirà invece il mondo delle armi da fuoco. In questo modo, costruiremo dunque una rete semantica, ossia costruiremo una serie di relazioni che uniscono più parole sulla base del loro significato e del campo a cui appartengono. Da qui il discorso si potrebbe allargare a una intera branca dell’intelligenza artificiale, ma per il momento non mi avventurerò in quel campo: limitiamoci alle novità di Google. Il Knowledge Graph è dunque l’insieme di tutte queste relazioni che uniscono tra loro parole e concetti: una mappa che ricostruisce i rapporti tra parole e concetti, raggruppandole per contesto e per aree di significati affini. Almeno in teoria. In pratica, però, l’effettiva estensione di questa mappa è ancora limitata, dato l’enorme numero di parole, di concetti, e la necessità di raggrupparle per lingua e per zona geografica: una stessa parola può avere significati diversi in lingue diverse, ma può anche avere significati diversi in località diverse, dove pure si parla la stessa lingua. La portata effettiva del nuovo sistema di ricerca è destinata ad aumentare e migliorare col tempo, ma non aspettiamoci subito miracoli. Anche per questo, accanto a ogni scheda troveremo anche un link per segnalare errori o aggiungere informazioni, così da contribuire a migliorare il sistema. Più ancora di quanto avveniva in precedenza, i risultati che otterremo col nuovo sistema di ricerca saranno dipendenti dal luogo in cui ci troviamo e, dunque, dalla precisione con cui Google riuscirà a localizzarci. Il primo passaggio è ovviamente quello di guardare il dominio di Google che stiamo utilizzando: utilizzare il Google francese ci darà risultati molto più diversi rispetto al Google italiano o a quello inglese, perché la ricerca semantica sarà tarata sugli interessi e le abitudini del paese di riferimento. I passaggi successivi saranno l’analisi del nostro indirizzo IP, del linguaggio del browser, ma anche del linguaggio che utilizziamo per le nostre ricerche. In pratica, Google farà del suo meglio per trovarci e fornirci, di conseguenza, i risultati più adatti al contesto in cui noi stessi siamo inseriti. Usando strumenti per renderci anonimi e mascherare la nostra posizione, come è ovvio cambieranno anche i risultati delle ricerche. Dopo la localizzazione, si passa alle statistiche: la rete semantica di Google ci fornirà risultati osservando anche quali siano i principali argomenti di ricerca della zona in cui ci troviamo. Se in Italia la parola “cane” è associata soprattutto all'animale  allora saranno i risultati inerenti a quel campo semantico a predominare; se in un altro paese si cerca più spesso la costellazione, allora saranno predominanti quei risultati. E così via. I risultati delle ricerche, utilizzando il Knowledge Graph, promettono di essere filtrati in modo da essere quanto più possibile rilevanti per quel particolare luogo, quel particolare linguaggio e quella particolare cultura; vedremo se sarà davvero così. Come ultima nota, è possibile che al momento non vi appaiano le schede nella colonna destra di Google, se avete eseguito l’accesso al vostro account di Google al momento della ricerca. In questo caso, provato a uscire dal vostro account e ripetete la ricerca. In alcuni casi, anche l’estensione AdBlock per Google Chrome sembra causare problemi di questo tipo: potreste quindi doverla disattivare temporaneamente, se non riuscite a vedere le schede nella colonna destra. Non escludo l'esistenza di altri problemi analoghi, ma ancora non me ne sono capitati.

Potrebbero interessarti anche :

Ritornare alla prima pagina di Logo Paperblog

Possono interessarti anche questi articoli :

Dossier Paperblog