05 12 2022
Retour a la home
Rubrique Économie
Économie
Rubrique Société
Société
Rubrique Technologies
Technologies
Rubrique Culture
Culture
MOTS CLÉS
 
Tous les mots

DOSSIERS...
 Le projet |  L’équipe |  L’association |  Nos outils  | Actualités |  Sources |  Alertes  
Abonnés : connectez-vous

 
Oubli du mot de passe
TRANSFERT S'ARRETE
Transfert décryptait l'actualité des nouvelles technologies, proposait un fil info quotidien et une série d'outils de veille. Notre agence, refusant toute publicité, dépendait de ses abonnements.
  COPINAGES
Ecoutez Routine.
Protégez-vous.
Auditez votre cybersécurité.
Chiffre du jour
700 000
dépistages génétiques chaque année en Europe, selon la Commission européenne (...)
Revue de Web
 Lindows harcelé
 Cyberdissidents vietnamiens en appel
 Plus de CO2 = moins d’eau potable
Phrase du jour
"Ce service public que nous assurons a besoin de votre soutien pour perdurer"
L’association Inf’OGM, qui justifie la fin de la gratuité de son bulletin d’information (...)

Dossier
Le nucléaire mis au secret
Dossiers récents
 Racisme en ligne : l’affaire Sos-racaille
 Le fichage des passagers aériens
 La bataille des brevets logiciels
 L’impasse énergétique
 L’hydrogène, une énergie (presque) propre
Tous les dossiers
Spacer
Unes de la semaine

lundi 1er/12 Transfert.net

vendredi 28/11 Économie

jeudi 27/11 Société

mercredi 26/11 Culture

mardi 25/11 Économie

Spacer


18/07/2003 • 17h32

Un programme pour dévoiler le sexe des auteurs

Cet algorithme donne au style son genre

Comment savoir si un texte a été écrit par un homme ou une femme quand celui qui l’a écrit se dissimule derrière un pseudonyme, ou bien qu’il porte un prénom androgyne ou exotique ? En développant un programme capable de détecter correctement le sexe de l’auteur dans 80 % des cas, le professeur Moshe Koppel et ses collègues du département d’informatique de l’Université Bar-Ilan en Israël ont apporté une réponse empirique à une vieille controverse de la linguistique : le style est-il sexué ?

D’après Koppel, les hommes, qui préfèrent catégoriser les choses, utilisent plus de déterminants (le/la, cette/ce, un/une, etc.) et de quantificateurs (deux, plus, peu, etc.). Les femmes, elles, s’intéressent plus aux relations et recourent donc plutôt plus que les hommes aux pronoms personnels (je, tu, moi, son, etc).

L’algorithme de Koppel consiste donc à quantifier dans un texte la récurrence de 467 mots clés anglais (a, too, us, yourself, their, etc.) afin de "calculer" le sexe de son auteur. Ses travaux seront prochainement publiés dans les revues Literary and Linguistic Computing et Text.

Le programme a été entraîné et corrigé sur un corpus de 604 textes issus du British national corpus. Les oeuvres analysées relevaient de tous les styles d’écriture : fictions, manuels, essais, etc. Cela va de How to use homeopathy à Linford Christie : an autobiography en passant par Feminism and linguistic theory.

A l’issue de cette phase d’apprentissage, le logiciel était capable de fournir une réponse correcte quatre fois sur cinq.

Ce principe d’apprentissage artificiel est le même que celui qu’emploient les logiciels anti-spam, qui apprennent à reconnaître les tournures de style typiques de spammeurs en ingurgitant des milliers de messages de publicité indésirables, dont ils font ensuite une analyse statistique qualitative, dite "bayesienne".

Ces travaux ont d’abord été refusés par la revue scientifique PNAS qui leur reprochait de véhiculer certains archétypes sexistes (du type : "Les hommes décrivent, les femmes s’impliquent"). Koppel, qui présentera ses recherches lors de la 18ème Conférence interdisciplinaire internationale sur l’intelligence artificielle (IJCAI-03) qui se tiendra en août à Acapulco au Mexique, rejette ces accusations de sexisme rampant. Il rappelle que son approche est purement empirique.

Une approche qu’il espère désormais approfondir pour développer un programme capable de reconnaître le style personnel d’un auteur et non plus seulement son sexe. De quoi faire sortir les nègres de l’ombre...

L’article de Koppel, "Automatically categorizing written texts by author gender":
->http://www.cs.biu.ac.il/koppel/male-female-LLC-final.pdf

Le sit de la revue Literary and Linguistic Computing:
http://www3.oup.co.uk/litlin/contents/

 
Dans la même rubrique

27/11/2003 • 19h01

Un traité onusien veut obliger les belligérants à nettoyer les "résidus explosifs de guerre"

26/11/2003 • 18h47

Pour les Etats-Unis, les essais nucléaires ne sont pas encore de l’histoire ancienne

20/11/2003 • 19h00

Les technologies de surveillance automatisée tiennent salon au Milipol 2003

19/11/2003 • 16h23

Un logiciel met tous les physiciens à la (bonne) page

17/11/2003 • 18h38

Une pétition européenne met en doute la fiabilité du vote électronique
Dossier RFID
Les étiquettes "intelligentes"
Dernières infos

28/11/2003 • 19h29

Quand le déclin de la production pétrole mondiale va-t-il débuter ?

28/11/2003 • 19h19

Les réserves de pétrole sont dangereusement surévaluées, dénonce un groupe d’experts

28/11/2003 • 18h33

La Criirad porte plainte contre la Cogema pour avoir diffusé des infos sur les déchets nucléaires

27/11/2003 • 17h14

La Cnil met les"étiquettes intelligentes" sur sa liste noire

26/11/2003 • 19h06

"The Meatrix", un modèle de dessin animé militant, hilarant et viral

26/11/2003 • 18h54

Un observatoire associatif pour lutter contre les inégalités

25/11/2003 • 19h13

Les hébergeurs indépendants ne sont toujours pas responsables, pour l’instant

25/11/2003 • 19h04

Les licences Creative Commons bientôt disponibles en français

24/11/2003 • 22h09

EDF refuse d’étudier la résistance de l’EPR à une attaque de type 11-septembre

24/11/2003 • 18h36

La Grèce bannit la biométrie de ses aéroports à un an des Jeux olympiques

24/11/2003 • 18h16

10 000 manifestants réclament la fermeture de la School of Americas

21/11/2003 • 19h36

Deux affaires judiciaires relancent la polémique sur la responsabilité des hébergeurs

21/11/2003 • 19h04

Un anti-raciste poursuivi en justice pour antisémitisme

21/11/2003 • 18h48

Le festival Jonctions confronte art, technologies et éthique

20/11/2003 • 19h28

Un fonctionnaire ne peut utiliser sa messagerie professionnelle à des fins religieuses


Contacts |  Haut de page |  Archives
Tous droits réservés | © Transfert.net | Accueil
Logiciels libres |  Confidentialité |  Revue de presse

Page not found