Quello che segue è un esempio di un approccio che tenta di combinare l’analisi strutturale di una rete sociale (un forum di discussione on-line) e l’analisi del contenuto dei messaggi scambiati, allo scopo di rappresentare le relazioni tra gli utenti anche in considerazione dei contenuti scambiati (e vice versa). In questo caso, si tratta di un forum dedicato ai pazienti diabetici.
Un altro esempio della procedura di analisi qui adottata è illustrato nel post Autonomie a rischio: attori e temi del dibattito sul destino della Provincia di Teramo.
Questo lavoro è stato presentato al Workshop “Nuove tecnologie, mutamento sociale e costruzione del Sé“, nell’ambito del Convegno “La qualità del sapere sociologico“, AIS-Associazione Italiana di Sociologia, (Firenze 10-12 ottobre 2013).
Il forum analizzato è “Diabete e Patologie Correlate”, all’interno della piattaforma ForumSalute.it, individuato attraverso una ricerca su Google, in base a criteri di visibilità, struttura e livelli di attività.
La rilevazione ha riguardato i messaggi pubblicati fra il 15 aprile 2012 e il 15 aprile 2013, data alla quale sono state anche raccolte le statistiche del forum e quelle relative agli utenti.
Come si può vedere nella Slide 4, gli utenti sono in gran parte donne e residenti del centro-nord.
Le informazioni relative all’età degli utenti sono molto spesso mancanti (in 60 su 76 casi). L’età degli utenti per i quali l’informazione è disponibile è comunque bassa, con una media è pari a 23 anni, e il 75% dei casi che sta fra i 19 e 39 anni.
La giovane età degli utenti è un aspetto confermato anche dal diabetologo nel corso dell’intervista telefonica condotta durante la rilevazione, e dal fatto che le discussioni più seguite sono quelle relative al diabete gestazionale e quello di tipo 1 trovino più spazio del diabete di tipo 2, molto più diffuso in termini assoluti, ma principalmente nella popolazione adulta e soprattutto anziana.
Il grafo della Slide 5 rappresenta le dinamiche del forum. Si tratta di un grafo bipartito, composto cioè da due tipi di nodi: le discussioni e gli utenti. Gli utenti in effetti entrano in relazione fra di loro nel momento in cui partecipano ad una stessa discussione.
Il network è fortemente centralizzato intorno al nodo del moderatore e nello stesso tempo molto disperso. Ciò dipende dalla caratteristica dinamica a “domanda—risposta”: gli utenti intervengono per porre una domanda e il diabetologo risponde. Di conseguenza la metà dei threads iniziati ha avuto al massimo due risposte (di cui una è quasi sempre quella dell’esperto), e il 75% meno di quattro risposte. In conclusione, possiamo dire che, all’interno di questo forum, gli utenti interagiscono principalmente con lo specialista e poco fra di loro.
Nondimeno, il grafico nella Slide 6 mette in evidenza il fatto che un limitato numero di utenti ― tutte donne ― ha fatto una certa “carriera” all’interno della piattaforma, arrivando ad occupare lo status di Esporto o Fan (lo status dipende dal numero di messaggi postati sul forum). Nello stesso tempo, abbiamo rilevato che le utenti più attive frequentano un elevato numero di forum, dove le interazioni fra utenti sono più frequenti. Se quindi da una parte abbiamo visitatori e utenti interessati solo ad avere informazioni specifiche, dall’altra ci sono utenti per i quali la spinta alla socialità è altrettanto forte ― se non di più ― della semplice ricerca di informazioni.
Per analizzare i temi discussi si è proceduto ad una analisi tematica dei contenuti dei messaggi.
La wordcloud della Slide 7 rappresenta i lemmi selezionati come parole chiave dei messaggi, con una soglia minima pari a 10 occorrenze.
I temi sono stati individuati attraverso una procedura automatica, detta “modellizzazione dei temi emergenti”, disponibile nel software TLab. La procedura identifica i temi a partire dalle relazioni fra i lemmi presenti nei singoli messaggi.
Nella Slide 9 i 25 temi individuati sono essere rappresentati in maniera sintetica mediante una mappa MDS (multidimensional scaling). Tenendo conto della distanza/vicinanza dei punti (le cui dimensioni sono proporzionali alla rilevanza dei temi in termini di occorrenze), possiamo osservare che:
- l’asse delle X (destra / sinistra) distingue la ricerca di informazioni dall’espressione di dubbi e ansie
- l’asse delle Y (alto / basso) distingue invece fra temi più o meno strettamente legati al diabete
Gli interessi degli utenti spaziano dalla ricerca di informazioni legate strettamente al diabete, all’espressione di ansie solo debolmente collegate ad esso.
Al termine dell’analisi tematica, sono stati associati gli utenti ai temi, per il tramite dei messaggi, costruendo quello che è stato chiamato un content based social network (Velardi et al. 2008; Bohn et al. 2011).
In questo grafo le connessioni utente-tema rappresentano le occorrenze dei temi nei messaggi degli utenti (e non i messaggi, in quanto si possono avere più temi per ciascun messaggio). Rispetto al grafo della Slide 5, questo è meno disperso, e mostra un elevato numero di connessioni fra i nodi.
Nello stesso tempo però, esso non descrive le relazioni fra gli utenti così come si sono effettivamente realizzate: il legame fra due nodi-utente e un nodo-tema va concepita come comune riferimento a ― e dunque interesse nei confronti di — un tema.
Infine, sono stati classificati gli utenti gli utenti in base ai temi che condividono, e dunque in base ad una prossimità che si potrebbe definire, piuttosto che semantica, pragmatica, legata cioè al senso che essi attribuiscono alla loro partecipazione al forum (piuttosto che ai temi in quanto tali):
- Un nucleo centrale e caratterizzante il forum, definito dalle interazioni degli utenti con lo specialista, sui temi più diversi (“Diabetologo”);
- Un secondo gruppo (“Informazioni”) di utenti che hanno, o pensano di avere, il diabete e sono in cerca di informazioni su specifici sintomi o risultati di esami;
- Terzo per numerosità il cluster “Terapia”, formato da utenti che chiedono informazioni sulla Metformina e la terapia;
- Il cluster “Dubbi” accorpa gli utenti che tendono ad esprimere dubbi di varia natura e a cercare informazioni sul diabete qui e là, forse anche nel tentativo di gestire in autonomia questo aspetto della loro vita;
- Ruota infine attorno ad un utente particolarmente ansioso l’ultimo cluster, dove i dubbi e le ansie espresse sono i più disparati. Il cluster è stato per questo definito “Ipocondria”.
Riferimenti bibliografici
- Bohn, A., Feinerer, I., Hornik, K., & Mair, P. (2009). An Approach to Incorporate Texts into a Social Network Analysis of Communication Graphs (No. 96). Department of Statistics and Mathematics, WU Vienna University of Economics and Business, Vienna. Retrieved from http://epub.wu.ac.at/1654/
- Velardi, P., Navigli, R., Cucchiarelli, A., & D’Antonio, F. (2008). A New Content-Based Model for Social Network Analysis. In 2008 IEEE International Conference on Semantic Computing (pp. 18 – 25). doi:10.1109/ICSC.2008.30