Des mathématiciens américains trouvent une méthode pour accélérer le séquençage des gènes
La méthode statistique mise au point par des mathématiciens de l’Institut des sciences mathématiques de New-York propose une analyse des données génétiques de meilleure qualité et plus économe en temps et en ressources, selon l’article paru dans la revue scientifique américaine PNAS.
Le séquençage des organismes a pour but de connaitre et de comprendre la fonction des gènes ainsi que leurs relations. Ces analyses sont faites grâce aux "puces à ADN", des outils électroniques qui permettent de contrôler et de compter le matériel génétique.
Indispensables aux chercheurs, ces puces à ADN demeurent très voraces en temps et en argent et ne produisent que des données limitées et parfois incohérentes.
Dirigée par Bud Mishra, une équipe de mathématiciens new-yorkais a développé une méthode statistique permettant d’optimiser les résultats des puces à ADN en limitant le "bruit de fond", des données très nombreuses mais inutiles qui sont source d’erreur dans les analyses.
L’analyse couramment utilisée jusqu’à aujourd’hui a été décrite par M.B Eisen en 1998. Selon l’équipe de Bud Mishra, cette méthode se fonde sur des hypothèses arbitraires. Les chercheurs ont donc créé un algorithme plus rigoureux. Sans éliminer la méthode Eisen, il y ajoute des corrélations mathématiques ("les estimateurs de rétrécissement" de James-Stein) qui réduisent les sources d’erreurs. D’où un gain de temps (et d’argent) substantiel.
Concluant pour la levure
Selon Hiroyuki Ogata, chercheur au CNRS à l’unité d’Information génomique et structurale (IGS), "les résultats de l’équipe new-yorkaise semblent très intéressants". "Ce type de recherche est très important car les données obtenues par les puces à ADN présentent beaucoup de biais biologiques et expérimentaux, explique le chercheur du CNRS. Pour obtenir des données dans un temps relativement court, il faut être approximatif. Pour être plus précis, les délais deviendraient beaucoup trop longs. L’amélioration des algorithmes destinés à l’analyse des données génétiques est une voie de recherche essentielle".
Les chercheurs américains ont testé leur algorithme sur une partie du génome de la levure, déjà entièrement décrypté. Leur méthode, qui s’est révélée très concluante en matière de recherche d’erreur, a présenté un taux peu élevé d’interprétations erronées.
L’équipe de Mishra espère que son algorithme pourra rapidement venir renforcer l’arsenal de la génomique. Les chercheurs envisagent particulièrement des applications dans la recherche des causes génétiques des cancers.
Institut de sciences mathématiques de New-York:
http://www.cims.nyu.edu/
"Shrinkage-based similarity metric for cluster analysis of microarray data" (PNAS)
http://www.pnas.org/cgi/content/abstract/100/17/9668?maxto...