Et si nos claviers étaient déjà bons pour la casse ? Les logiciels de reconnaissance vocale et d’écriture s’avèrent être des outils de plus en plus précis. Des systèmes biométriques, basés sur l’identification de l’empreinte digitale, de l’iris de l’œil,
ou des caractéristiques géométriques du visage peuvent remplacer les innombrables mots de passe. Et dans les labos, les recherches se précisent : stylo intelligent, commande grâce au regard, interprétation des gestes et... télépathie. Bientôt,
face à votre ordinateur, vous n’aurez plus l’impression d’avoir à faire
à une machine. Il vous écoutera, vous regardera, vous comprendra et pourra
même anticiper vos désirs. Vivement demain ?
Reconnaissance vocale
Cause toujours
En 1990, la société américaine Dragon System sortait le premier logiciel de dictée pour PC. Une horreur. On devait articuler exagérément les mots et le vocabulaire était plutôt pauvre. Aujourd’hui, on peut presque parler normalement - « imaginez que vous parlez à une personne non francophone », conseille IBM dans la notice de Via Voice - et le répertoire de base compte 300 000 mots. Malheureusement, les meilleurs logiciels du marché affichent encore un taux d’erreur moyen d’un mot sur cent et leur utilisation se cantonne à un cadre bien établi (correspondance commerciale, comptes-rendus de réunions).
Vers l’intelligence artificielle
Ces limites tiennent à la conception même des logiciels. Les mots prononcés sont numérisés, décomposés, puis comparés à des banques de données. Mais, pour l’analyse de la grammaire et du sens, ces programmes ne rivalisent pas avec l’esprit humain. Cela reviendrait à percer le mystère de l’intelligence artificielle. Selon Jean-Luc Gauvain, responsable du groupe Traitement du langage parlé au LIMSI (Laboratoire d’informatique pour la mécanique et les sciences de l’ingénieur, unité du CNRS), « l’idéal serait de brancher le système à Internet d’un côté et à la radio de l’autre, puis de le laisser se débrouiller. On reviendrait de vacances, et le logiciel parlerait la langue. » Les industriels continuent à miser sur la reconnaissance vocale mais la destinent désormais au pilotage des ordinateurs ou à la navigation Internet à la voix (pour les téléphones portables). Microsoft devrait l’intégrer à sa suite bureautique Office 10, courant 2001. Les membres du World Wide Web Consortium viennent d’adopter la norme VoiceXML destinée aux navigateurs Web vocaux. IBM et Lernout & Hauspie ont présenté des prototypes de PDA fonctionnant à la voix et capables d’obéir à quelques ordres simples.
Biométrie
Reconnu au doigt et à l’œil
Avec la biométrie, les mots de passe tombent aux oubliettes. Son fonctionnement est simple : pour identifier un utilisateur, la machine se contente de scruter son empreinte digitale, l’iris de son œil, d’analyser sa voix ou sa signature. Déjà utilisées dans des secteurs sensibles (banques, accès à certains locaux...), ces techniques s’ouvrent maintenant au grand public.
Sur Mac et bientôt sur PC
Dans son système d’exploitation Mac OS 9, Apple a déjà intégré un système de reconnaissance vocale. Il suffit de prononcer la phrase magique - « Sésame ouvre-toi », par exemple - pour que le Mac libère l’accès à vos fichiers. Microsoft envisage d’intégrer dans les futures versions de Windows des technologies de reconnaissance de la voix, de l’empreinte digitale et de l’iris (achetées à I/O Software). Pratiques pour l’utilisateur, ces nouvelles technologies permettraient aussi un développement plus sûr du commerce électronique.
Actuellement, la formule la plus fiable (et la plus utilisée) est la reconnaissance de l’empreinte digitale : son taux d’erreur varie entre un pour mille et un pour un milliard, selon les systèmes. Demeure l’obstacle du prix : environ 1 000 francs pour équiper son PC.
La
biométrie en quelques mots...
|
Signature
...léments analysés : un logiciel compare plusieurs
exemplaires écrits sur une tablette graphique et identifie les caractéristiques
communes, mais aussi la vitesse et l’accélération de
l’écriture.
Taux de reconnaissance : faible.
Inconvénients : technique sujette à falsification. Si l’utilisateur
est stressé, des rejets malencontreux peuvent également survenir. |
Empreinte
digitale
...léments analysés :
des éléments géométriques sont extraits d’une
image
ou d’une mesure en relief.
Taux de reconnaissance : excellent.
Inconvénients : des blessures ou des salissures peuvent
Ces quelques réserves n’empêchent pas l’Américain
Veridicom de proposer depuis septembre une puce de reconnaissance des empreintes
digitales aux fabricants de téléphones mobiles, pour remplacer
le bon vieux code PIN. |
Rétine
...léments analysés : à partir d’un
cliché très précis de la rétine, plusieurs caractéristiques
géométriques (distances entre différents points, formes)
sont définies.
Taux de reconnaissance : excellent.
Inconvénients : l’analyse de la rétine exige un balayage,
assez désagréable, de l’œil par une lumière
incandescente située à quelques centimètres. |
Iris
...léments analysés : à partir d’un
cliché très précis de l’iris, plusieurs caractéristiques
géométriques (distances entre différents points, formes)
sont définies.
Taux de reconnaissance : excellent.
Inconvénients : une infection de l’œil (conjonctivite)
peut perturber la mesure. En revanche, un excès d’alcool ou
de soleil n’a aucune conséquence. |
Main
...léments analysés : un modèle en 3D est
réalisé grâce à une caméra et une lumière
infrarouge adjacente. 90 mesures sont effectuées.
Taux de reconnaissance : excellent.
Inconvénients : le dispositif d’identification reste encombrant.
En revanche, d’éventuelles coupures ou salissures n’ont
aucune incidence sur les performances. |
Visage
...léments analysés : plusieurs caractéristiques
géométriques du visage (distances entre différents
points, formes...) sont extraites d’une photo.
Taux de reconnaissance : moyen.
Inconvénients : la reconnaissance peut être perturbée
par une barbe, une faible luminosité ou des expressions faciales
inhabituelles. Le système peut être trompé par un jumeau. |
Voix
...léments analysés : les caractéristiques
du timbre et de la prononciation.
Taux de reconnaissance : faible (environ 1 % d’erreur).
Inconvénients : la signature vocale peut être altérée
par une extinction de voix ou reproduite frauduleusement par un enregistrement.
L’ordinateur peut tout de même exiger la prononciation d’une
phrase aléatoire). |
|
Reconnaissance d’écriture
Le retour du stylo
Apple étudie la possibilité de remplacer la souris et le clavier par un stylet et une tablette graphique, conçus sur le même principe (mais sans papier) que le stylo d’Anoto (lire encadré ci-dessus). Le système concocté par Apple reconnaîtrait l’écriture manuscrite et permettrait également, grâce à un menu affiché en permanence à l’écran, de piloter l’ordinateur. Nom de code : Rosetta Stone. Basé sur la technologie Inkwell, développée à l’origine pour les assistants numériques Newton, ce système pourrait équiper le prochain Mac OS 10 (attendu début 2001) puis Mac OS 9. La reconnaissance de caractères manuscrits présente encore des failles. Maîtrisée dans des cas simples - par exemple par la Poste pour lire rapidement les codes postaux écrits dans des cases sur les enveloppes -, et malgré l’utilisation de technologies avancées censées imiter le cerveau, elle se heurte encore à la complexité de l’écriture cursive. « Le tout est de savoir si on gagne du temps », tranche Bertrand Fonatine, responsable technique chez Iris. Selon le type de documents, le taux d’erreur peut atteindre 90 %...
Télépathie et interprétation des mouvements
Demain, c’est sans les mains
Pouvoir piloter son PC grâce à la télépathie ne relève plus tout à fait de la science-fiction. Du moins pour le docteur Andrea Kübler, de l’université de Tübingen, en Allemagne. « Le système que nous avons développé permet de commander un ordinateur par la pensée », annonce-t-elle sobrement. Ses expériences utilisent l’EEG : un signal électrique émanant des connexions entre nos neurones. Des électrodes disposées sur le crâne recueillent le signal EEG (Electroencephalographic) et commandent le déplacement du curseur vers la gauche, la droite, le haut ou le bas selon la volonté de l’utilisateur. Pour le moment, de tels dispositifs - fort coûteux - sont surtout utilisés pour aider les tétraplégiques à communiquer avec leur entourage : un mouvement du curseur sert de réponse à une question simple par oui ou par non. Certains patients arrivent même à écrire, mais l’opération est extrêmement éprouvante (16 heures pour 70 à 80 mots, en moyenne). « L’apprentissage de ce dispositif demande des efforts considérables, reconnaît le docteur Kübler. Même après plusieurs semaines d’entraînement, le curseur n’obéit jamais à plus de 80 % de la volonté du patient. »
L’œil et la souris
complémentaires
Ailleurs, des chercheurs s’intéressent à l’œil comme moyen de sélectionner une case sur l’écran. L’opération se fait par le biais d’un casque porté par l’utilisateur ou d’une caméra infrarouge montée sur l’ordinateur. Mais le Dr Zhai, chercheur au centre Almaden d’IBM et responsable du projet MAGIC l’affirme : la souris demeure indispensable à l’opération. « Avec MAGIC, nous jouons sur la complémentarité œil / souris. Le regard est utilisé pour sélectionner une zone de travail et, lorsqu’il s’agit de placer le curseur avec finesse, la main prend le relais pour valider la commande. »
L’avantage d’un suiveur de regard est de repérer le centre d’attention de l’utilisateur. D’autres expériences associent le regard à la voix. On fixe quelque chose sur l’écran et l’on donne, en même temps, des instructions orales à la machine. Un système qui s’avère assez pratique pour ouvrir ou fermer des fichiers, effectuer des « copier-coller » ou passer d’une application à une autre.
Le diamètre de la pupille
révèle les émotions
L’ordinateur peut aussi s’adapter à la personne en se comportant comme un interlocuteur « intelligent ». « Pour cela, des dispositifs expérimentaux mesurent le diamètre de la pupille de l’utilisateur afin d’en déduire des informations sur son état émotionnel », explique Colin Ware, directeur d’un laboratoire de recherches en optique à l’université de Durham, New Hampshire.
Dans le même registre, au Rutgers Center for Advanced Information Processing (CAIP) de l’université d’...tat du New Jersey, des chercheurs ont développé MIM (Multimodal Interface Manager). Ce logiciel utilise toutes les techniques à la fois : le pilotage de la machine se fait par le biais du regard, associé à des gestes précis et à des instructions orales. Ce dispositif a, entre autres, été mis au point en vue de permettre aux médecins de sélectionner des images médicales (échantillons sanguins, par exemple) et d’interroger une base de données pour obtenir un diagnostic. Le tout sans jamais toucher à un clavier. L’interactivité totale, en somme...•