Strumento di Analisi Linguistica

Da Pedroelrey

La Stan­ford Uni­ver­sity ha creato uno stru­mento di ana­lisi lin­gui­stica ali­men­tato da appren­di­mento automatico.

Gli infor­ma­tici di Stan­ford hanno creato un sito web che dà a chiun­que, attra­verso un sem­plice copia-incolla, la capa­cità di effet­tuare clas­si­fi­ca­zioni di testo, ana­lisi lin­gui­stica, siste­ma­ti­ca­mente e gra­tui­ta­mente. Il sito web da cui è pos­si­bile fare que­sto tipo di ana­lisi è etcML , abbre­via­zione di Easy Text Clas­si­fi­ca­tion with Machine Learning.

Il sito etcML si basa su tec­ni­che di appren­di­mento auto­ma­tico che sono state svi­lup­pate per ana­liz­zare il signi­fi­cato rac­chiuso nel testo per poi valu­tare il suo “sen­ti­ment” gene­rale, posi­tivo o nega­tivo. Per acce­dere a que­sto motore di calcolo,è suf­fi­ciente tra­sci­nare e rila­sciare [“drag and drop”] i file di testo in una fine­stra di dia­logo. Per chi non fosse adden­tro la mate­ria, l’pprendimento auto­ma­tico è un campo di infor­ma­tica che svi­luppa sistemi che danno ai com­pu­ter la capa­cità di acqui­sire nuove cono­scenze in modo molto simile a quella umana, come spie­gano sul sito web della Stan­ford University.

etcML con­sente di cer­care i dati da Twit­ter feed o Twit­ter hash­tag , come mostra l’immagine sotto ripor­tata rela­tiva all’account twit­ter di Data­Me­dia­Hub, e clas­si­fi­care auto­ma­ti­ca­mente uti­liz­zando i “clas­si­fi­ca­tori state-of-the-art”. È pos­si­bile estrarre infor­ma­zioni utili da tweets, ma que­ste tec­ni­che pos­sono essere appli­cate anche ai pro­pri dati. Oltre alla visua­liz­za­zione gra­fica l’analisi for­ni­sce anche il risul­tato testuale e la sua sin­gola clas­si­fi­ca­zione: nega­tivo, posi­tivo o neu­trale. Ogni sin­gola ela­bo­ra­zione può essere sca­ri­cata sul pro­prio PC.

Un caso molto inte­res­sante d’uso dello stru­mento è quello fatto da Rebecca Weiss che l’ha uti­liz­zato per ana­liz­zare la par­zia­lità dei media in diverse tra­smis­sioni tele­vi­sive politiche.

Ini­ziate a met­tere etcML tra i pre­fe­riti. Noi qui a Data­Me­dia­Hub ovvia­mente l’abbiamo già fatto e sicu­ra­mente ne faremo ampio uso quando, final­mente, usci­remo dalla fase beta. Come si suol dire, stay tuned.

Arti­coli correlati
  • About
  • Latest Posts