Un team internazionale di ricercatori ha creato un catalogo di tutte le proteine del corpo umano. Il lavoro è il frutto di ricerche coordinate dall’Università Johns Hopkins di Baltimora e dall’Institute of Bioinformatics a Bangalore, India. Utilizzando 30 differenti tessuti umani sono stati identificati 17.294 geni, circa l’84% di quelli previsti per codificare le proteine . Lo studio è stato pubblicato sulla rivista Nature.
Il team inoltre ha identificato 193 nuove proteine provenienti da regioni del genoma che finora si credeva non prevedessero la codificazione. Il tutto suggerisce che il genoma umano è più complesso di quanto sia stato pensato finora.
Un progetto dunque che dovrebbe rivelarsi una risorsa importante per la ricerca biologica e lo sviluppo diagnostico. “Si può pensare al corpo umano come una grande biblioteca dove ogni proteina è un libro “, dice Akhilesh Pandey , professore presso il McKusick-Nathans Institute of Genetic Medicine, la Johns Hopkins University e direttore dell’Institute of Bioinformatics. “La difficoltà è che non abbiamo un catalogo completo che ci fornisce i titoli dei libri disponibili e dove trovarli. Ora però possediamo una prima bozza di tale catalogo completo.”
Mentre i geni contengono le istruzioni per il funzionamento della cellula e in particolare per la costruzione delle proteine, queste ultime sono le ‘operaie’ che eseguono il lavoro. Ecco perché il catalogo completo delle proteine umane, e soprattutto la loro posizione all’interno dell’organismo, rappresenta un riferimento ancora più importante rispetto al catalogo dei geni nel genoma umano.
Studiare le proteine è molto più impegnativo che studiare geni, osserva Pandey, perché le strutture e le funzioni delle proteine sono complesse e un elenco di quelle esistenti non sarebbe molto utile senza un’insieme di informazioni su dove si trovano nel corpo umano.
“Generando un dataset di proteine umane abbiamo reso più facile per altri ricercatori identificare le proteine nei loro esperimenti. E crediamo che i nostri dati diventeranno un must have nel settore“, spiega Pandey.
La ricerca ha permesso di identificare 193 proteine finora sconosciute, provenienti dal cosiddetto Dna spazzatura, ossia dalla parte del Dna che si riteneva non codificasse proteine. Questa, per Pandey, ”è stata la parte più emozionante di tutto il lavoro. Il fatto che provengano da una sequenza di Dna ritenuto non codificante significa che non possiamo ancora capire pienamente come venga ‘letto’ il Dna”.