L' Adamo ed Eva della letteratura anglosassone

Creato il 11 febbraio 2013 da Bourbaki @bourbakis
Ricordate la storia delle sette figlie di Eva? la teoria di un professore di genetica di Oxford che mappando il DNA mitocondriale (quella parte del codice genetico che si trasmette inalterato da madre a figlio) di 6000 europei ha identificato 7 ceppi da far risalire appunto a 7 donne: le sette figlie di Eva che hanno popolato il continente europeo e da cui noi discendiamo.
Si può fare un qualcosa di analogo in letteratura? Non parliamo ovviamente di DNA, ma utilizzando le parole del filologo russo Aleksandr Veselovskij il compito degli studiosi di letteratura non è di valutare i contributi specifici di singoli scrittori, ma di individuare "le formule poetiche migratorie", osservando la loro comparsa in contesti diversi, e risalire alla loro origine:
The main concern of the literary historian is not
with assessing the unique contributions of
individual writers, but with spotting the
migratory poetic formulae; accounting for their
appearance in various ethnic milieus. . . and
tracing them through all vicissitudes back to
the starting point.
Aleksandr Veselovsky (Translation by Erlich 1981)

In altre parole, si può immaginare di individuare stili e temi comuni a più scrittori e risalire a quell'autore o quel gruppo di autori da cui sono originati? Dopotutto temi e stile letterari sono parte di un sistema di influenza, gli autori creano prendendo da chi li ha preceduti - basta pensare al famoso aforisma di Oscar Wilde "il talento imita, il genio ruba"; anche la creatività è questione di evoluzione più che di volontà. Un recente studio di Matthew L. Jockers, della University of Nebraska-Lincoln, pubblicato in “Macroanalysis: Digital Methods and Literary History” ha cercato di fare questo lavoro sugli scrittori di lingua inglese dell'800. 
Dovendo pensare agli scrittori dell'800 inglese che hanno esercitato più influenza sui loro contemporanei a me verrebbero in mente Charles Dickens, Thomas Hardy, Melville, Twain, Jane Austen...  l'elenco, più o meno lungo, dipenderà dai gusti e dalle letture. Ma se dovessimo ordinarli per importanza? per capire se qualcuno ha influenzato in misura maggiore gli altri? Volendo procedere con metodo bisognerebbe leggere i loro lavori per trovare somiglianze di stile tra i libri pubblicati prima e dopo. E' un lavoro ragionevole se si devono confrontare 2, 3, 4 autori. Ma volendo farlo su tutti gli scrittori di lingua inglese dell'800?
Svelo subito che Jockers è arrivato alla conclusione che Jane Austen e Walter Scott sono gli scrittori che hanno esercitato l'influenza maggiore sia sullo stile che sulle scelte tematiche degli scrittori anglosassoni del IXX secolo. Ritornando alla metafora del DNA, con un'immagine molto significativa,  Sir Walter Scott e Jane Austen sono l'equivalente letterario dell'Homo erectus o, se si preferisce, Adamo ed Eva della letteratura anglosassone.
Come si è arrivati a questo risultato? attraverso l'analisi di 3592 opere pubblicate tra il 1780 e il 1900. Una sgobbata,  ma ci ha pensato un computer. I 3592 libri considerati nell'analisi sono stati scritti da autori inglesi, irlandesi e americani; scrittori e scrittrici sono equamente rappresentati. Da ogni libro sono state estratte le informazioni riguardanti lo stile utilizzando la tecnica classica utilizzata nelle analisi di authorship o di attribuzione dell'autore: per ciascuna parola e segno di interpunzione ne è stata calcolata la frequenza relativa (in %) nel testo; sono poi state escluse quelle parole e quei segni la cui frequenza relativa era inferiore ad una determinata soglia (10%).Per l'estrazione dei pattern tematici è stata invece utilizzata un'analisi statistica basata sulle classi latenti (Latent Dirichlet Allocation). Il dato estratto consiste nel numero di volte (in percentuale) che uno specifico tema ricorre nel testo.
Questi due tipi di dati, uno che identifica i pattern stilistici e l'altro quelli tematici, sono stati considerati insieme al fine di calcolare una distanza (numerica) di ciascun libro da tutti gli altri, come nella seguente figura in cui per esempio il Book One ha una distanza pari a 8.6 dal Book Two. I libri con distanza maggiore sono quelli meno simili tra loro

Queste distanze numeriche sono state poi raffigurate utilizzando un metodo di visualizzazione basato sulle reti che permette di rappresentare graficamente la distanza tra coppie di libri: il primo considerato come 'libro riferimento' e il secondo come 'libro target' che ha una data di pubblicazione posteriore a quella del libro riferimento.
La rete risultante, nella figura sotto, ha una forma decisamente evocativa di una matassa disordinata di fili. Ma come tutte le matasse si può tentare di sgrovigliarla. La rete è composta da tanti nodi (i libri) collegati da linee.

Ogni nodo corrisponde ad un libro, ed ha un colore più o meno scuro a seconda dell'anno di pubblicazione (i libri più recenti hanno un colore più scuro). La linea che collega due nodi è la distanza tra i due libri: più questi sono stilisticamente e tematicamente differenti, più sono lontani l'uno dall'altro.Allora osservando il cluster in fondo alla rete, si può notare che la parte sinistra è più scura. Il progressivo scurirsi passando da destra a sinistra rivela che stile e temi sono cambiati nel corso del tempo: i libri più recenti si sono allontanati da quelli meno recenti. Si può anche identificare un gruppo di libri in alto separati dal cluster principale. Questo "satellite" rappresenta un gruppo di romanzi molto simili tra loro e allo stesso tempo molto caratterizzati e diversi dagli altri.
E' interessanti analizzare la rete anche per il genere dell'autore. Se si assegna un colore diverso ai libri-nodi delle scrittrici (grigio chiaro) e a quelli degli scrittori uomini (grigio scuro) si ottiene la seguente rete

Questa rete ci dice che i romanzi di scrittrici donne sono stilisticamente e tematicamente più affini tra di loro e meno a quelli di scrittori uomini. Si può infatti notare che la parte inferiore della rete è sostanzialmente formata da scrittrici, mentre i romanzi di autori uomini stanno nella parte superiore. La separazione tra scrittrici donne e scrittori uomini è anche evidente anche nel "satellite".
Quello che non emerge da questa rappresentazione, ma risulta dall'analisi numerica delle distanze calcolate, è che molti romanzi si collocano al di fuori del trend principale; attingendo ancora alla metafora del DNA, si tratta di "mutazioni" (outlier nel linguaggio statistico) outlier). E' l'autore di questa ricerca che definisce questi romandi come "mutazioni" e questa metafora è apparentemente perfetta, perché questa ricerca si basa su un'analisi quantitative delle parole contenute nei libri e proprio come i geni sono i mattoni fondamentali della biologia, le parole sono la materia prima delle idee. Due esempi di "mutazione" sono: "La capanna dello zio Tom" di Harriet Beecher Stowe, che si situa nel cluster degli scrittori uomini, e il romanzo "Belinda" di Maria Edgeworth che ha iniziato ad esercitare una certa influenza a 40 anni dalla pubblicazione. 
E' possibile capire se qualche nodo è più importante di altri? Usando delle misura di centralità (weighted in-degree, weighted out-degree e Page-Rank, quest'ultimo è l'algoritmo di Google) è stato assegnato un peso numerico ad ogni nodo sulla base del numero di collegamenti con altri nodi allo scopo di quantificarne l'importanza relativa. Il risultato è quello già svelato: Jane Austen e Walter Scott sono gli autori meno influenzati (i più originali) dagli scrittori predecessori e allo stesso tempo i più influenti in termini di longevità del loro pattern stilistico/tematico. Si possono considerate i progenitori in un ideale albero genealogico letterario costruito sulla base di affinità di stile e temi. Riferimenti Jockers M.L. “Macroanalysis: Digital Methods and Literary History” (University of Illinois Press, 2013)

Potrebbero interessarti anche :

Possono interessarti anche questi articoli :