|
Quelques
journaux en ont parlé, mais la révolution
n’a pas éclaté. Pourtant, les gros titres
auraient pu être sensationnels : « Corneille
n'a pas écrit le Misanthrope ! », ou plus incroyable
encore : « Corneille a écrit plus de la moitié
des pièces de Molière !!! ». Alors pourquoi n'en
a-t-on pas parlé au 20 heures ? Canular ? Vérité
dérangeante ? Principe de précaution ?
Deux chercheurs français sont à l'origine de cette
découverte. Dominique Labbé est un
spécialiste du traitement statistique du langage
naturel, son fils, Cyril est chercheur en informatique. Le site de
Dominique Labbé vous permettra d'en savoir plus
sur ses recherches. Ce texte fait plus particulièrement
référence à leur
étude des pièces de Corneille et de Molière.
Ils ont mis au point une mesure de distance intertextuelle qui permet
d'estimer le degré de similitude entre deux textes : «
cet indice est influencé par quatre facteurs, l'auteur, le
vocabulaire de l'époque, le thème traité, le
genre ». Ils ont étalonné leur système
sur des milliers de textes. Deux textes dont la distance est
inférieure à 0,2 (elle varie entre 0 et 1)
sont obligatoirement du même auteur. Ente 0,2 et
0,25, les seuls cas de textes écrits par des
auteurs différents sont des plagiats avérés.
Entre 0,25 et 0,4 on note une certaine similarité sans pouvoir
conclure à la paternité. Au-dessus de 0,4, il est
très improbable que les textes soient du même
auteur.
Seulement, le hic, c'est que les Labbé ont trouvé des
contre-exemples qui tous concernent Corneille et Molière. Alors
que les oeuvres de Corneille sont bien groupées, certaines
pièces de Molière se détachent de leurs
congénères et s'approchent dangereusement
des pièces de Corneille. Tellement près que
la distance passe sous la barre fatidique de 0,2 ! Au
total, les chercheurs sont formels : 16 pièces ne peuvent
pas avoir été écrites par Molière !
Auxquelles ils ajoutent 9 autres pièces très
probablement cornéliennes ! Soit 23 pièces
sur les 32 attribuées à Molière !!!
Qu'est-ce que cela signifie ? Pour commencer, précisons que
la méthode utilisée se fonde sur les statistiques, et
non sur ce qu'on appelle habituellement l'intelligence artificielle.
Cette distinction a son importance. Ca n'intéresse personne,
mais j'ai un peu étudié l'IA, qui promettait
énormément il y a quelques années.
Seulement, la complexité des solutions
dépassait tout ce qui avait été envisagé,
et, selon moi, l'IA patine... Parallèlement, les anglo-saxons
ont développé des techniques statistiques, moins
élégantes et nécessitant de plus
grandes ressources calculatoires. Mais ces techniques
statistiques ont un énorme avantage dans notre cas
: il est beaucoup plus facile de leur faire confiance, car on
ne croit que ce que l'on comprend. Ces techniques reposent sur la
répétition machinale d'opérations simples et
restent donc compréhensibles.. Je serais beaucoup plus
circonspect si les résultats avaient
été obtenus à l'aide d'un
réseau de neurones, cette boîte noire qui,
comme notre cerveau, donne les bonnes réponses sans que l'on
sache pourquoi. Tout ça pour dire que la démonstration
des Labbé semble plausible. Argument final : Pierre
Louÿs et d'autres exégètes avaient
déjà pressenti que Corneille pût
être le nègre de Molière. Lorsque la
science vient appuyer les connaissances littéraires,
il n'y a plus guère de doute possible...
Pourquoi alors cette nouvelle n'a-t-elle pas fait l'effet d'une bombe
? Premièrement parce que tout le monde n'est pas aussi convaincu
: il faut s'y connaître un petit peu pour décider
seul si l'on croit à cette théorie. En effet,
la communauté scientifique n'a pas encore donné son
aval. Les détails de cette théorie, qui permettraient de
la comprendre et de la reproduire n'ont pas encore été
communiqués. Chacun se voit dans l'obligation de choisir
soi-même. Peu de journalistes relaient donc cette
information.
Ensuite parce que, il est vrai, les conséquences bouleversent
tant nos connaissances que la vérité ne peut s'imposer
qu'après une période de vérification, de
contre-analyse, et de répétition des
résultats par d'autres chercheurs.
Enfin, parce que la résistance au changement est énorme.
Parlerons-nous
encore de "la langue de Molière" ? Imaginez-vous la
Comédie Française contrainte de modifier
son répertoire à l'annonce de la 3000ème
représentation du Tartufe de Corneille, alors que les 2999
précédentes représentations étaient
signées Molière ? Et les manuels scolaires ?
Les oeuvres au programme de nos petites têtes
blondes ? Et les kilomètres d'analyses qui ont
été écrits sur ces deux auteurs majeurs
?
Les biographies mêmes de Molière et Corneille doivent
être revues ! Les conséquences sont vraiment trop
énormes. Ca ne se fera pas durant notre
génération. Premièrement, tous les
spécialistes de Molière vont refuser cette
négation de leur travail, de leur carrière. Imaginez
que vous avez des années durant cherché des
analogies entre la vie de Molière et certaines
répliques de L'avare, par exemple ? Laisserez-vous
ruiner vos conclusions et votre carrière?
D'ailleurs, on peut s'interroger sur la facilité avec laquelle
les chercheurs trouvent des analogies qui n'existent pas. Mais c'est
une autre histoire.... |
|
LN |
|