Selon ses concepteurs, cette base de données libre de droit va révolutionner le travail des biologistes
Une équipe internationale de biologistes a officialisé jeudi 2 octobre le lancement de l’Human Protein Reference Database (HPRD), une nouvelle base de données en ligne répertoriant les protéines humaines. Conçue selon une architecture et des méthodes de classification totalement différentes des autres bases de données, l’HPRD indexe à ce jour environ 3 000 protéines parmi les plus étudiées chez l’homme et devrait en contenir près de 10 000 d’ici la fin de l’année.
Présentée dans la revue Genome Research, l’HPRD est le fruit d’une collaboration internationale entre plusieurs universités et centres de recherche américains (Université John Hopkins, en tête), indiens (Bangalore) et européens.
Ouverte à titre expérimental depuis cinq mois, la base de données a été conçue sous licence libre LGPL par l’Institut de bio-informatique de Bangalore en adaptant le programme open source ZOPE (pour Z Object Publishing Environment).
Biologie ’systématique’
Autre originalité du projet : des dizaines de biologistes indiens de cet institut ont effectué le recueil et le recoupement de dizaines de milliers d’articles issus de la littérature scientifique. Outre les effets biologiques et thérapeutiques de chacune des protéines, leurs interactions ont été intégrées à la base afin de relier entre eux les résultats obtenus par des recherches menées indépendamment. Ce qui permet à ses créateurs de présenter l’HPRD comme "le vrai commencement de la biologie systématique".
Si tous les biologistes reconnaissent que les progrès des biotechnologies ont permis d’acquérir une masse considérable de données ces 30 dernières années, tous constatent aussi que c’est désormais le traitement et l’interprétation de ce flot d’informations qui posent problème aux chercheurs.
"Il est toujours difficile de se constituer une idée globale en biologie, de voir si une observation recoupe ou complète une autre menée ailleurs, expliquent les créateurs de l’HPRD. Avec cette base de données, les biologistes seront désormais capables de prendre rapidement et facilement connaissance de tout ce qui est connu sur une protéine et ses interactions, accélérant ainsi la production de nouvelles hypothèses à tester dans les laboratoires. »
Alimentée quotidiennement, l’HPRD synthétise déjà presque tout ce qui est connu à propos des protéines impliquées dans les maladies humaines comme le cancer ou les maladies métaboliques. Conçue grâce à la collaboration d’experts en biologie et en informatique, la base de donnée est puissante et très simple d’utilisation.
Ainsi un biologiste qui voudra étudier BRCA1, une protéine liée au cancer du sein, n’aura qu’à se connecter au site de l’HPRD et entrer l’une des désignations de la protéine pour obtenir ses autres appellations, sa séquence, sa structure en 3D, sa fonction, sa localisation. Il pourra aussi voir graphiquement le réseau de ses interactions avec les autres enzymes ou encore récupérer la bibliographie scientifique qui lui est consacrée.
Les universitaires auront un libre accès gratuit à l’HPRD. En revanche, les entreprises privées souhaitant interroger la base devront bientôt verser une redevance à l’université John-Hopkins, qui est chargée de sa maintenance. Depuis le début de la phase de test, l’HPRD a déjà reçu plus de 2 millions de visites, grâce au simple bouche-à-oreille dans les congrès de biologistes.
Le site de l’Human Protein Reference Database:
http://www.hprd.org/
Development of Human Protein Reference Database as an Initial Platform for Approaching Systems Biology in Humans (Genome Research):
http://www.genome.org/cgi/content/a...