Protein Data Bank: Visualizzazione di Proteine e Acidi Nucleici per Editor, Scienziati e Curiosi

Da Arturo Robertazzi - @artnite @ArtNite

“We are now in a position to study the tertiary structure of a single myoglobin molecule separated from its neighbours”, scriveva John Kendrew nel suo articolo A Three-Dimensional Model of the Myoglobin Molecule Obtained by X-ray Analysis pubblicato da Nature nel 1958. Articolo fondamentale perché contiene per la prima volta nella storia della scienza l’immagine di una struttura tridimensionale di una proteina (la mioglobina). Nel 1962 Kendrew, insieme con Perutz, vinse il premio Nobel in chimica per i risultati ottenuti sulle proteine globulari.


Dieci anni dopo, Richard E. Dickerson sviluppò un modello matematico (simile alla legge di Moore) capace di predire il numero di strutture proteiche determinate ogni anno. Secondo questo modello, il numero di proteine totale avrebbe raggiunto il valore di 12066 entro il 2001. Non male, visto che il numero totale di strutture ottenute fino al 2001 ammonta a 12123. Il modello di Dickerson oltre a essere un valido strumento predittivo, suggeriva anche che in pochi anni la quantità di strutture proteiche sarebbe diventata difficile, se non impossibile, da gestire.

Intanto, alla fine degli anni ’60, fu raggiunto un altro importantissimo risultato, come racconta in maniera egregia Edgar F. Meyer in The first years of the Protein Data Bank. Grazie allo sviluppo di computer e softwares, e, in particolare all’uso del Brookhaven Raster Display (BRAD), Meyer riuscì a produrre, insieme a un team di biologi e programmatori, la prima immagine al computer di una struttura proteica. La reazione delle persone nel vedere quello schermo con un’immagine 3D della mioglobina non deve essere stata molto diversa dagli spettatori delle prime pellicole cinematografiche.

Il metodo di Meyer assicurava che le linee di codice relative alle coordinate di una proteina venissero gestite tramite un computer. Allo scopo di automatizzare e facilitare l’analisi dei dati, fu poi sviluppato SEARCH, un software rudimentale che si basava su una libreria di aminoacidi, atomi e proprietà molecolari. Fu quello il primo passo verso la realizzazione di una banca dati che poi prese il nome di Protein Data Bank (PDB).

Da quei primi pionieristici anni, il Protein Data Bank è diventato la più completa repository di strutture di proteine e acidi nucleici. Al momento della stesura di questo articolo, il database contiene un totale di 87067 strutture, di cui 8969 aggiunte solo nel 2012. I codici rudimentali dei primi anni  si sono evoluti in un sofisticato sito web, il Research Collaboratory for Structural Bioinformatics Protein Data Bank (RCSB PDB). Il sito permette all’utente di registrare una nuova struttura, di fare una ricerca nel database in base all’ID della biomolecola (PDB code), al codice di un ligante (una molecola che si lega a una proteina o a un acido nucleico, per esempio) o al nome di un ricercatore. Una volta inserita la richiesta, l’utente è indirizzato a una pagina con una notevole quantità di informazioni riguardanti la struttura della biomolecola e la sua funzione, con la possibilità di visualizzare immagini dettagliate e/o scaricarle.

Il sito web del Protein Data Bank ha ormai un gran seguito: 140.000 visitatori unici al mese, provenienti da 140 Paesi. Gli utenti del sito sono generalmente studenti, insegnanti e professori, giornalisti scientifici, editor e scienziati come biologi, bioinformatici e chimici computazionali. La visualizzazione delle biomolecole e l’accesso alla banca dati si è rivelata estremamente utile anche per gli editor scientifici che debbano verificare i risultati descritti in un articolo o controllare che le immagini da pubblicare siano corrette.

Recentemente il sito del Protein Data Bank ha realizzato una app gratuita per iPhone/iPod/iPad – una versione per Android è in fase di sviluppo. Probabilmente la feature più interessante della app è il molecular viewer, NDKMol, che permette all’utente di navigare all’interno di una rappresentazione 3D di una biomolecula, come un DNA o una proteina. Uno strumento fantastico per lo scienziato, per l’editor o per il curioso che voglia esplorare la bellezza del mondo delle biomolecole.

[spacer size=”20″]

Questo post è la traduzione della versione integrale del mio articoloThe Research Collaboratory for Structural Bioinformatics website: proteins and nucleic acids visualisation for the curiouspubblicato in agosto su European Science Editing, la rivista della European Association of Science Editors.



app Bioinformatica DNA Media Protein Data Bank Proteine Scienza

Potrebbero interessarti anche :

Possono interessarti anche questi articoli :