L’Insostenibile Leggerezza delle WordCloud

Creato il 09 febbraio 2015 da Pedroelrey

Le parole sono impor­tanti. A mag­gior ragione lo sono quelle pro­nun­ciate davanti al Par­la­mento da un nuovo Pre­si­dente della Repub­blica in occa­sione del pro­prio inse­dia­mento. In un momento così solenne il peso sim­bo­lico dei ter­mini espressi chia­ra­mente si moltiplica.

Per veri­fi­care quali siano le parole più ricor­renti in un testo o in un discorso le Wor­d­Cloud sono ottimi stru­menti di con­trollo. Si tratta di appli­ca­zioni che gene­rano delle “forme” gra­fi­che nelle quali i ter­mini chiave sono rap­pre­sen­tati con un corpo che aumenta in fun­zione della fre­quenza con le quali si sono ripe­tuti. Esat­ta­mente come le parole comun­que rile­vanti ma apparse meno ven­gono rap­pre­sen­tante in corpo più pic­colo. L’effetto finale è inte­res­sante: una “nuvola” com­po­sta in media di una cin­quan­tina di parole con gran­dezze diverse e che ruota intorno a alcune chiavi prin­ci­pali in corpo mag­giore. Quell’immagine in qual­che modo dovrebbe rap­pre­sen­tare l’essenza, l’anima di un testo.

In rete è facile tro­vare le appli­ca­zioni gra­tuite capaci di gene­rare un Wor­d­Cloud. Le più cono­sciute sono Wordle e Tag­xedo. A seconda del pro­gramma scelto, si pos­sono con­trol­lare le pro­por­zioni, il carat­tere da sce­gliere, impo­stare fil­tri di esclu­sione per alcuni ter­mini, si può deci­dere l’inclinazione delle sin­gole parole nella nuvola finale, il rela­tivo colore e per­sino defi­nire la forma della nuvola [rotonda, a forma di cuore, qua­drata e via dicendo]. Il risul­tato è sem­pre un “oggetto” visuale che cat­tura l’attenzione.

Nel caso di Mat­ta­rella, i media ita­liani [quo­ti­diani, tv, Ansa, siti di infor­ma­zione online] hanno mostrato un certo entu­sia­smo verso le Wor­d­Co­lud, come se fosse una novità straor­di­na­ria. Ne sono uscite “nuvole” in cui la parola più in evi­denza è stata quasi sem­pre “significa”.

Però quello è un ter­mine che iso­lato vuol dire ben poco. In realtà “signi­fica” faceva parte di una costru­zione incal­zante gio­cata dal neo Pre­si­dente per descri­vere l’idea che “Difen­dere la Costi­tu­zione” si deve tra­durre nel garan­tire il diritto allo stu­dio, nella difesa di quello al lavoro, nel soste­gno alla fami­glia e via dicendo fino al rifiuto di ogni forma di mafia e di ille­ga­lità. Per que­sto motivo “signi­fica” è stato ripe­tuto ben 18 volte nel discorso pro­nun­ciato in Par­la­mento. Nel dire “Signi­fica” Mat­ta­rella richia­mava diret­ta­mente i valori della Costituzione.

Le Wor­d­Coud sono stru­menti effi­caci per­ché veloci ma in un certo senso appros­si­ma­tivi pro­prio per­ché è com­plesso valu­tare il peso di una parola estra­po­lan­dola dal con­te­sto. Non solo, ma i pro­grammi che gene­rano i Clouds ten­dono a esclu­dere alcuni ter­mini, le con­giun­zioni giu­sta­mente, o a pena­liz­zarne altri, gli agget­tivi per esempio.

Eppure a rileg­gere il testo del Pre­si­dente si nota che la parola più fre­quente (26 volte) in realtà è stata pro­prio un agget­tivo, “nostro” [nostro, nostra, nostri, nostre]. E non si tratta di un det­ta­glio da poco. Il Pre­si­dente, nei suoi rife­ri­menti al Paese, ha volu­ta­mente evi­tato ter­mini for­mali — solo 2 volte la parola “Patria” — per dare invece enfasi a un con­cetto di appar­te­nenza, di comu­nità. E que­sto spiega l’uso di “nostro” che appare come:

- nostro paese — nostro popolo — nostro essere comu­nità — nostra Costi­tu­zione — nostra demo­cra­zia — nostra gente — nostra poli­tica — nostra con­vi­venza — nostri con­cit­ta­dini — nostri ragazzi — nostri tesori

Ora, nes­sun Wor­d­Cloud è capace di rico­no­scere e leg­gere così in pro­fon­dità la strut­tura di un discorso. E’ bene ricor­dar­selo ogni volta che si passa al setac­cio di un gene­ra­tore di nuvole un testo da esa­mi­nare. I Clouds restano comun­que validi stru­menti per una prima veri­fica a caldo, ma per un appro­fon­di­mento, anche di natura pura­mente visuale, sareb­bero neces­sari altri interventi.

Per restare all’esempio del discorso di Mat­ta­rella nes­sun gior­nale, digi­tale e/ car­ta­ceo, è riu­scito a andar oltre le “nuvole”. Pur­troppo. Eppure di mate­riale da rap­pre­sen­tare in ter­mini visuali, a par­tire pro­prio dai vari Clouds, non mancava.

Tanto per fare un esem­pio, quale è stato il peso dei rife­ri­menti alle Isti­tu­zioni o quelli ai valori etici rispetto al totale? Poi è man­cata la com­pa­ra­zione coi ter­mini più ricor­renti nei discorsi dei pre­de­ces­sori. Quante volte Napo­li­tano ha citato l’Europa pre­sen­tando il suo primo man­dato e quante volte lo ha fatto Mat­ta­rella? Sarebbe stato inte­res­sante sco­prire certi tipi di differenze.

La rin­corsa gene­rale ai Wor­d­Cloud non è stato un errore. Al con­tra­rio. Nean­che l’aver evi­den­ziato la parola “signi­fica”. Infatti nel totale del discorso di Mat­ta­rella com­po­sto da 2.274 parole, ben 351 sono state spese nel pas­sag­gio sulla difesa della Costi­tu­zione. Non poco.

Però le Wor­d­Cloud, come spie­gato in pre­ce­denza, vanno comun­que usati con cau­tela. Pro­prio Mat­ta­rella par­lando in Par­la­mento ha accen­nato, novità asso­luta, alla neces­sità di abbat­tere in Ita­lia il “digi­tal divide”. Lo ha fatto una volta sola, quindi nes­sun Cloud lo ha regi­strato. E’ un buon motivo per con­si­de­rarla una cita­zione irrilevante?

Ogni medium ha un suo ruolo e signi­fi­cato, come noto. Un conto è un tweet, o un post su Face­book, ed un altro è invece un arti­colo di gior­nale, sia esso digi­tale o car­ta­ceo poco importa. Le Wor­d­Cloud, lo riba­diamo ancora, vanno benis­simo ci pia­ce­rebbe però che non fos­sero con­si­de­rate solo uno dei tanti ele­menti visivi di con­torno, come è avve­nuto nel caso di Mat­ta­rella che abbiamo usato come esem­pio, ma che vi sia data la giu­sta atten­zione ed accu­ra­tezza che si riserva ad ogni ele­mento infor­ma­tivo, magari cor­re­dan­dolo con una cor­retta ana­lisi del discorso.

È que­sto, anche, il valore aggiunto che gior­nali e gior­na­li­sti pos­sono por­tare al let­tore che altri­menti, stante l’ampiezza di tool a dispo­si­zione, è asso­lu­ta­mente in grado di far­sela da solo la Wor­d­Cloud. L’insostenibile leg­ge­rezza delle Wor­d­Cloud cre­diamo sia un buon esem­pio del gior­na­li­smo fret­to­loso, raf­faz­zo­nato [o peg­gio], da evi­tare se si vuole ridare cen­tra­lità all’informazione — di qua­lità — ormai sem­pre più tra­bal­lante, unbran­ded e domi­nata dai social. Dove sta il ruolo del gior­na­li­sta se non nella capa­cità di gui­dare il let­tore attra­verso una nar­ra­zione che in que­sto caso sarà di tipo grafico?

Nota meto­do­lo­gica: per il con­teg­gio esatto delle parole, è stato preso il testo ori­gi­nale della tra­scri­zione. Poi gli spazi bian­chi tra parole sono stati sosti­tuiti con un a capo. A quel punto il testo, com­po­sto da una parola per riga, è stato messo in Excel. Ne è risul­tata una lista a tabella da una colonna con le parole in ordine alfa­be­tico. A quel punto il con­teg­gio delle ripe­ti­zioni è stato facile.

LA CLASSIFICA DELLE PAROLE PIÙ RICORRENTI PRONUNCIATE DAL PRESIDENTE

26 nostri 18 signi­fica 13 tutti 12 spe­ranza 12 volti 11 par­la­mento 11 nuovo 10 Paese 9 sociale 9 libertà 9 rap­pre­sen­tanza 9 libertà 9 ita­liano 8 poli­tica 7 repub­blica 7 gio­vani 6 Ita­lia 6 vita 6 nazio­nale 6 Europa 5 lotta 5 società 5 sfida 5 reli­gione 5 ter­ro­ri­smo 4 sovra­nità 4 pace 4 valori 4 risorse 4 rischio 4 mafia 4 ragazzi 4 stato 4 lavoro 4 isti­tu­zioni 4 grave 4 guerra 4 glo­bali 3 par­te­ci­pa­zione 3 ostaggi 3 sicu­rezza 3 ser­vi­zio 3 rispo­ste 3 regole 3 magi­stra­tura 3 ingiu­sti­zia 2 Patria 2 paura 2 riforme 2 tec­no­lo­gia 2 nazi­fa­sci­smo 2 mez­zo­giorno 2 povertà 2 prin­cipi 2 one­sto 2 imprese 2 governo 2 giu­sti­zia 2 indi­gna­zione 1 Nord 1 occupazione

Bonus track: Da leg­gere, “8 Great Exam­ples of Data Visualization”


Potrebbero interessarti anche :

Possono interessarti anche questi articoli :

  • Training Factor[Y]

    Come Com­mu­ni­ca­tion Factor[Y] diamo vita a Trai­ning Factor[Y] la nostra area dedi­cata alla for­ma­zione... Leggere il seguito

    Il 25 giugno 2015 da   Pedroelrey
    MEDIA E COMUNICAZIONE
  • Gestione dei social media : 10 strumenti utili

    Se, come me, siete un freelance, sarete giunti alla triste conclusione che non ci sono abbastanza ore in una giornata :-). Questo perché, per portare avanti la... Leggere il seguito

    Il 24 giugno 2015 da   Melchiorreschifano
    INTERNET, MEDIA E COMUNICAZIONE
  • Scrivere sales letter per il MLM

    Oggi abbiamo fatto una ricerca delle keywords principali che conducono al blog e ci siamo accorti che c'è una valanga di ricerche inerenti alla scrittura di... Leggere il seguito

    Il 23 giugno 2015 da   Andreatamburelli
    BLOG, INTERNET, MEDIA E COMUNICAZIONE, SOCIAL NETWORK
  • Post-it

    Le noti­zie di oggi su media e comu­ni­ca­zione che, secondo noi, non potete perdervi. News Lab - Goo­gle lan­cia News Lab per aiu­tare i... Leggere il seguito

    Il 23 giugno 2015 da   Pedroelrey
    MEDIA E COMUNICAZIONE
  • Il futuro dei giornali scritto da Google, non da personaggi in cerca d’autore /...

    Sono stato a Bar­ce­lona al #GEN­sum­mit, il sum­mit di Glo­bal Edi­tors Net­work, per­ché Data­ni­nja è stato... Leggere il seguito

    Il 22 giugno 2015 da   Pedroelrey
    MEDIA E COMUNICAZIONE
  • Post-it

    Le noti­zie di oggi su media e comu­ni­ca­zione che, secondo noi, non potete perdervi. La Sto­ria Inse­gna che la Sto­ria non Inse­gna... Leggere il seguito

    Il 22 giugno 2015 da   Pedroelrey
    MEDIA E COMUNICAZIONE