In queste settimane le riviste Science e Nature stanno festeggiando un anniversario importante: sono passati infatti dieci anni dalla pubblicazione dei due articoli che annunciavano il sequenziamento del genoma umano. Il 15 Febbraio 2001 Nature pubblicava Initial sequencing and analysis of the human genome a cura del consorzio pubblico Human Genome Project, mentre la stessa settimana Science usciva con i risultati dell’azienda privata Celera Genomics di Craig Venter. Cosa abbiamo imparato nei dieci anni che ci separano da quello storico traguardo scientifico? Ce lo racconta Eric Lander, che fu primo autore nel lavoro pubblicato su Nature. La sua review passa in rassegna tutti i progressi che grazie al genoma sono stati fatti nella ricerca di base, nella medicina e nella comprensione della storia evolutiva della nostra specie. E’ un resoconto completo e dettagliato che vi consiglio caldamente di leggere; per chi non avesse voglia di addentrarsi nella corposa review, tratterò qui i punti salienti.
Ricerca di base
Una volta sequenziato il genoma umano, la prima grande sorpresa fu l’esiguo numero di geni in esso contenuto. Prima del 2000 le stime relative a questo numero oscillavano ampiamente, passando da 35mila a oltre 100mila, mentre oggi sappiamo che i geni codificanti per proteine sono molti meno, circa 21mila. Se da una parte il ruolo delle proteine si è un po’ ridimensionato, dall’altra hanno acquisito sempre maggiore importanza altri elementi funzionali in precedenza sottovalutati. Ad esempio, sappiamo che la maggior parte della porzione funzionale del nostro genoma non codifica per proteine.
Da analisi di genomica comparativa è emerso che il 6% del nostro codice genetico è stato selezionato dall’evoluzione negli ultimi 100 milioni di anni per svolgere una qualche funzione, ma non si tratta solo di proteine, anzi: queste occupano solo l’1.5% del genoma, ed è quindi evidente che siano stati altri elementi quelli davvero importanti per lo sviluppo della nostra specie. Questi misteriosi artefici dell’evoluzione non sono altro che sequenze regolative: i mattoncini di base (le proteine) sono sempre gli stessi, ma è migliorato il modo di organizzarli e metterli insieme. Gli RNA non codificanti, ad esempio, derivano da tratti del genoma che non sono destinati a diventare proteine, eppure riescono a plasmare le nostre cellule agendo sui livelli di espressione proteica.
Tra di essi gli esponenti più famosi sono i microRNA, piccole sequenze che spengono gli RNA messaggeri, cioè le molecole che trasformano l’informazione contenuta nel DNA in proteine. In questi anni sono state individuate circa 100 famiglie di microRNA evolutivamente conservate, e si calcola che in media un solo microRNA possa controllare l’espressione di circa 200 proteine. Le alterazioni epigenetiche sono un altro modo per decidere quali geni accendere e quali spegnere: si tratta di modificazioni chimiche che rendono una regione genomica più o meno attiva, e stanno diventando sempre più importanti agli occhi dei ricercatori. Un ulteriore livello di complessità scoperto recentemente è dato dalle interazioni tra geni fisicamente lontani, interazioni che si verificano perché il genoma, avendo una sua struttura tridimensionale, può mettere a contatto punti diversi dei cromosomi.
Variabilità genomica
Il genoma umano ha una struttura sorprendentemente semplice: è costituito da blocchi (chiamati aplotipi) che contengono le principali varianti genetiche diffuse nelle popolazioni, e sono sufficienti meno di un milione di polimorfismi SNP per catturare il 90% della variabilità esistente in natura. Le varianti con frequenza maggiore del 5% (le cosiddette varianti comuni) sono state scoperte quasi tutte ormai, e adesso non resta che andare più in profondità per portare alla luce anche le varianti più o meno rare: è lo scopo del progetto 1000 Genomi.
Medicina
Quando fu lanciato il progetto per sequenziare il genoma umano, si conoscevano meno di 100 geni legati alle malattie; oggi abbiamo individuato più di 2850 geni relativi a malattie di tipo mendeliano, che cioè dipendono dal malfunzionamento di un singolo gene. Avere la possibilità di leggere un intero genoma diventa sempre più fondamentale anche per la pratica clinica: per identificare le cause genetiche di malattie rare particolarmente ostiche da diagnosticare, molti medici iniziano a scegliere la strada del sequenziamento genomico.
Lasciamo le malattie rare per parlare di quelle comuni, che sono tutto un altro capitolo. Non essendo caratteri di tipo mendeliano, esse dipendono dall’interazione di più geni, che insieme a diversi fattori ambientali ci portano ad ammalarci. Prima del sequenziamento del genoma umano, le basi genetiche di moltissime di queste malattie erano totalmente sconosciute. Oggi invece siamo a conoscenza di 1100 posizioni nel genoma (o loci genomici) che in qualche modo sono associate a 165 tra malattie e caratteri non patologici, e quasi tutte queste informazioni le abbiamo ottenute dal 2007 in poi, quando cioè si è iniziato a fare un uso massiccio degli studi di associazione genome-wide (GWAS). Ad esempio sono noti 41 loci legati al diabete di tipo I, 95 loci associati ai livelli di colesterolo e ben 180 loci responsabili dell’altezza di un individuo.
In generale, si è capito che la maggior parte dei tratti sono influenzati da un grande numero di loci, e che la maggior parte delle varianti comuni presenti in queste posizioni chiave hanno un effetto modesto (alzano il rischio di ammalarsi del 10-50%, proprio come molti fattori ambientali). Per riuscire a determinare tutte le basi genetiche di questi tratti complessi, è ora necessario investigare le varianti rare, le interazioni tra geni e le interazioni tra geni e ambiente. Molti hanno criticato i GWAS perché non sono riusciti a far emergere tutte le cause genetiche delle malattie comuni, e quindi non è ancora possibile fare predizioni efficaci sul rischio di ammalarsi. Tuttavia, Eric Lander ricorda che lo scopo primario dei GWAS non è questo, bensì svelare i meccanismi cellulari responsabili delle malattie: è attraverso la conoscenza anche parziale di questi meccanismi che sarà possibile mettere a punto delle cure efficaci.
Il sequenziamento del genoma è stato un passo fondamentale anche per la ricerca sul cancro. Prima del 2000, erano stati scoperti circa 80 geni coinvolti nei processi tumorali; oggi siamo arrivati a 230, a testimonianza di una conoscenza del fenomeno notevolmente migliorata. Subito dopo il sequenziamento del genoma umano sono state individuate mutazioni in geni chiave nel melanoma, nel tumore del colon-retto e nel cancro ai polmoni. Sono stati poi scoperti geni amplificati nelle cellule tumorali, così come geni sottoespressi o traslocati dalle loro posizioni originarie sul genoma. Oggi, sapere quali geni sono sovra o sottoespressi rispetto alla norma può aiutare a capire, ad esempio, quali pazienti con tumore al seno trarranno maggior beneficio dalla chemioterapia in seguito all’intervento chirurgico.
Storia dell’uomo
Le nostre conoscenze sulla storia evolutiva di Homo sapiens sono cambiate drasticamente dal 2000 a oggi. La nostra migrazione dall’Africa si inserisce in un quadro molto più ricco e complesso di quanto si credesse una volta, basti pensare che oggi crediamo che Europei e Asiatici moderni abbiano ereditato dall’1 al 4% del proprio genoma dagli uomini di Neanderthal. Il progetto HapMap , che studia la variabilità genetica nelle popolazioni umane, ci ha permesso di seguire la colonizzazione del mondo da parte della nostra specie, così come di evidenziare gli stratagemmi genetici utilizzati dalle diverse popolazioni per adattarsi a climi e ambienti differenti: si tratta soprattutto di geni coinvolti nella pigmentazione della pelle, nella risposta ad agenti infettivi e nella percezione sensoriale. Casi di selezione positiva più antica possono invece spiegare cosa ci ha permesso di evolverci dalle scimmie e diventare quello che siamo: sono le cosiddette human accelerated regions (HARs), cioè quelle regioni del genoma che sono mutate molto più velocemente da quando ci siamo separati dagli scimpanzé, rispetto ai precedenti 100 milioni di anni. HAR1 è una di queste, ed è coinvolta nella crescita delle dimensioni del nostro cervello; HAR2 potrebbe averci regalato il pollice opponibile; FOXP2, invece, potrebbe essere legato allo sviluppo del linguaggio.
Sembra assurdo che 25 anni fa i biologi si domandassero quale potesse essere l’utilità di sequenziare il genoma umano; oggi, al contrario, non riusciamo a immaginare come si potesse fare ricerca senza questa preziosissima conoscenza. Grazie ad essa abbiamo risposto a tante domande sulla nostra storia, sulle cause delle nostre malattie e più in generale su come funzioniamo. Tuttavia, la strada da percorrere è ancora lunga, perché se c’è una lezione che abbiamo imparato e su cui tutti i ricercatori sono d’accordo è proprio questa: che il nostro genoma resta ancora un grande mistero, un mistero che nasconde moltissimi segreti in attesa di essere svelati.
Lander, E. (2011). Initial impact of the sequencing of the human genome Nature, 470 (7333), 187-197 DOI: 10.1038/nature09792
Fonte: M. Colaiacovo – estropico.blogspot.com
Altri link:
- Dieci anni di sequenziamento umano – Science Backstage