EXERGUE
Depuis 2005
RSS

IA - Janvier 2020

Jacques Pitrat, Textes, Ordinateurs et Compréhension (1985)

Résumé

Ce livre de Jacques Pitrat (1934-2019), pionnier de l'intelligence artificielle ayant fait la première thèse en France en 1966 sur le sujet en France, montre que la question de l'IA a longtemps été conditionnée par les limites des machines, ou du nombre de chercheurs, dans les premières périodes de la recherche (ici les années 1980). Pitrat présente les outils disponibles à cette époque et quelques résultats sur des prototypes limités, mais il élargit les perspectives de la représentation du sens des textes à partir de l'analyse des ambiguïtés linguistiques et des moyens pragmatiques pour les éliminer.

Jacques Pitrat, Textes, Ordinateurs et Compréhension, éd. Eyrolles, Paris, 1985, 202 p.

Jacques Pitrat, que j'ai rencontré à une émission de France culture où nous avions été invités pour parler de l'IA, commence plaisamment son livre en le dédiant « au premier programme d'ordinateur qui sera capable de le comprendre » (p. I). C'est doublement optimiste, car il n'est pas sûr non plus que les informaticiens et linguistes à qui il destine ce texte soient capables de le comprendre non plus (p. VII). Chaque spécialité ne prépare pas (surtout à l'époque) à celle de l'autre, malgré quelques exceptions, la particularité pluridisciplinaire de Pitrat et de quelques autres étant du domaine de l'exception. La pratique de l'informatique ne s'est généralisée qu'à la fin du XXe siècle et celle de la linguistique n'est certainement pas acquise pour les informaticiens encore de nos jours. À l'époque de rédaction du livre, la question était surtout de comment faire collaborer les deux spécialités (où toute autre susceptible d'être informatisée). Quand Pitrat dit que « le problème n'est pas de savoir ce qu'il faut faire, le problème est de savoir comment le faire » (p. IX), la difficulté est que chaque spécialiste comprenne les pratiques de l'autre. Un problème constant est que certains s'imaginent précisément que l'intelligence artificielle correspond à une sorte d'omniscience d'un robot déjà conscient (tout en en niant simultanément la possibilité), alors qu'il s'agit essentiellement de techniques de programmation qu'il faut inventer parce qu'elles n'existent pas encore. Le livre de Pitrat traite des problèmes qui se présentent à l'informaticien, en particulier dans le micro-domaine des commentaires des parties d'échecs sur lequel il a travaillé.

La question fondamentale est ici celle de la représentation du sens que Pitrat note comme indépendante des langues, en pensant aussi à la traduction automatique. Dans mon livre sur l'IA, j'avais noté que nombre de problèmes pour la machine existent aussi pour les traducteurs humains. Tout au long de son texte, Pitrat se référera à la représentation utilisant les « primitives » de Schank, en nombre très réduit (PROPEL, MOVE, GRASP, INGEST, EXPEL, PTRANS, ATRANS, SPEAK, ATTEND, MTRANS, MBUILD) et des rôles conceptuels (ACTEUR, OBJET, BENEFICIAIRE, DIRECTION, ETAT, INSTRUMENT). Outre que les rôles sont les fonctions grammaticales, on remarque que Schank a aussi voulu unifier graphiquement PTRANS (déplacer un objet), ATRANS (modifier une relation abstraite, comme la possession), MTRANS (transfert d'information). Un défaut des recherches en IA est de vouloir réinventer la poudre, avec ici un biais philosophique réductionniste, pour faire plus scientifique sans doute. Si la réduction de synonymes en particulier est nécessaire pour représenter le sens, j'ai eu l'occasion d'écrire qu'il n'est pas nécessaire de rechercher des sortes de primitives ultimes, puisque les textes se situent à un niveau donné de généralité (on parle par exemple d'un chien, et pas d'un mammifère ou animal ou être vivant ou ensemble d'atomes). Il en résulte qu'on peut rester au niveau des mots du texte, ce qui nécessite un lexique complet. Par contre, ce qu'on appelle l'« héritage de propriétés » signifie que le chien a bien les caractéristiques des animaux ou des éléments matériels (faim, gravité, etc.), mais précisément cela s'obtient par le calcul qui suppose effectivement qu'on définisse les propriétés en question. Une raison de la réduction du nombre de primitives était aussi la capacité des ordinateurs de l'époque. Mais il n'est pas exact de dire que « si nous avons beaucoup de concepts primitifs, il est difficile de se rendre compte si deux représentations correspondent ou non au même sens » (pp. 36-37), puisque : 1) normalement, on le sait déjà avec les mots ; 2) c'est au programme de le calculer si on ne le sait pas. D'ailleurs, Pitrat lui-même dira un peu plus loin : « il ne sert à rien d'essayer de se raccrocher à une forme mère, puisque de toutes les façons il faudra une entrée séparée pour indiquer le sens de chaque forme » (p. 80).

Concrètement, la représentation du sens de Schank de la phrase : « Jean dit à Marie que Paul veut un livre » consiste à parler comme on suppose que le ferait un ordinateur : « le processeur conscient de Jean transmet au processeur conscient de Marie que la joie de Paul va augmenter si quelqu'un donne un livre à Paul » (pp. 4-5). Outre la présence d'une interprétation supplémentaire, cela revient au mieux à donner la définition des mots « dire » et « vouloir ». Dans mon livre sur l'IA, j'ai mentionné que l'humoriste Robert Beauvais (1911-1982), dans L'Hexagonal tel qu'on le parle, remarquait que la langue de bois technocratico-journalistique consistait à remplacer un mot par sa définition (N.B. Dans la première édition, j'avais indiqué par erreur qu'il s'agissait de Pierre Daninos (1913-2005) parlant du franglais). Cela existe donc aussi dans le langage naturel.

Pitrat adopte la position des linguistes sur la nécessité d'introduire des connaissances pragmatiques, outre les connaissances linguistiques, en particulier pour résoudre les ambiguïtés : ex. « le professeur a envoyé le cancre chez le censeur parce qu'il voulait, 1) lancer des boulettes, 2) avoir la paix, 3) le voir » (p. 9). Où « il » renvoie aux trois personnes selon la phrase et implique des connaissances sur le monde (p. 9). Mais les linguistes inventent des problèmes qui n'existent pas : dans cet exemple, il n'y a pas d'ambiguïté pour chaque possibilité. La « pragmatique » est souvent le nom de cette erreur épistémologique. Le vrai cas de ce qu'on appelle la « pragmatique linguistique » est celui de « vous avez l'heure ? » pour signifier qu'on veut l'heure et non savoir si l'autre l'a ou pas. Les linguistes confondent ici les exemples grammaticaux avec la compréhension des phrases. Dans mon livre, j'ai eu l'occasion de traiter la question en disant que l'ambiguïté est simplement une erreur (Pitrat parle des erreurs dans les textes à la fin de son livre).

De façon plus intéressante, à propos de la question : « quelles connaissances sont effectivement nécessaires » (p. 13), il répond « malheureusement, il est impossible de rencontrer des textes qui ne fassent appel qu'à un domaine de connaissance. Ceci est en grande partie dû aux métaphores » (p. 14). Il signale en particulier l'usage des métaphores aux échecs (« gourmandise, gloutonnerie, manger les pièces », p. 14). Il est bien évident qu'il faut faire un programme de l'usage des métaphores en général pour ne pas avoir à recommencer à chaque fois. L'intérêt de l'intelligence artificielle est précisément de pouvoir réutiliser un programme réalisé pour un domaine dans les autres domaines. Comme le dit Pitrat : « pour chaque domaine, il faudrait faire une fois pour toutes le travail accompli par Schank pour le monde de notre vie de tous les jours » (p. 45).

Pitrat se pose la question de la représentation du sens d'un texte comme une traduction dans une représentation indépendante de toute langue naturelle, pour décrire les états du monde et leur modification (pp. 19-20). Ce problème risque de tomber dans le biais des philosophes ou des mathématiciens qui ont tendance à expliquer ce que tout le monde comprend dans un langage, considéré par eux comme non ambigu, mais que personne d'autre qu'eux ne comprend. Les travaux de traduction automatique ont d'ailleurs considéré que cette forme de « langue pivot » servant à traduire une langue dans une autre, en particulier pour ne pas avoir à devoir faire un traducteur pour chaque couple de langue, pouvait correspondre à n'importe quelle langue naturelle. Actuellement, on passe souvent par l'anglais. Tout cela est d'ailleurs moins une question linguistique que justement une question d'informations sur le monde (le chien aboie, la pluie mouille, etc.). Ce sont ces informations qui sont indépendantes des langues. Dans le domaine des échecs utilisés par Pitrat, il faut évidemment posséder non seulement les bases, mais justement toutes les variations stylistiques pour en parler, ce qui est une ambition énorme qui se heurtait souvent aux limites des possibilités d'alors.

Outre Schank, Pitrat parle aussi de l'expérience d'IA de Winograd, avec le programme MICROPLANNER, pour formaliser le déplacement de blocs dans l'espace (p. 28), qui utilise un langage particulier et le calcul des prédicats auquel il a ajouté un prédicat temps, pour indiquer le changement (pp. 29-31). À cette occasion Pitrat parle des formalismes logiques sophistiqués (skolemisation) dont il déclare : « une fois que nous sommes familiarisés avec cette représentation, elle n'est pas difficile à comprendre » (p. 32), ce qui est un peu factice, puisque les mathématiciens y sont déjà habitués.

Un des outils disponibles pour les informaticiens travaillant dans la compréhension des textes est aussi les frames, qui utilisent des listes d'attributs (couleur, nom, taille...) ou de valeurs (Pierre, 1,55 m,...). On trouve ces frames dans le programme de Bobrow sur les voyages (voyages = client, date de départ, heure départ, aéroport de départ, aéroport d'arrivée, date d'arrivée, heure d'arrivée..., p. 38). Pour l'application aux appréciations des coups aux échecs, on a : jugement = degré, auteur, date, explication, jugements sur le jugement (p. 40). Cela permet aussi de définir les « contraintes d'intégrité » dans les descriptions du monde (ex. date de naissance < date de décès). Sur le niveau des primitives, on peut remarquer aussi que Pitrat admet qu'on n'a pas besoin de parler autrement que d'habitude : « 'après le grand roque, le pion reste sans défense !' Il est plus commode de s'exprimer ainsi plutôt que de dire 'après le coup où le Roi a pour case de départ e1 s'il est blanc et e8 s'il est noir et pour case d'arrivée c1 (ou c8) » (p. 43).

Pour les programmeurs, la modularité permet de pouvoir modifier la base de données sans désorganiser le reste (pp. 47-48). La question notée par Pitrat des définitions qui changent devrait être résolue en indiquant une date d'entrée ou de modification. En informatique, une information doit préférablement figurer une seule fois pour éviter les modifications partielles (p. 49). Mais le problème essentiel était à l'époque le nombre de règles et la taille du dictionnaire (pp. 51-52).

L'intelligence artificielle en général se distingue classiquement de l'informatique traditionnelle par l'opposition entre déclaratif (les connaissances sont entrées par leur définition) et procédural (on dit au programme ce qu'il faut faire pas à pas). Notons au passage que l'idée classique que l'IA n'est pas possible parce qu'il faut programmer l'ordinateur signifie qu'on ne parle donc pas d'IA qui est plutôt une machine à inférence à partir de données pouvant être acquises de façon autonome. Pitrat s'est aussi intéressé à la question des métaconnaissances, règles de manipulation de connaissances, qui peuvent donc être procédurales, mais qui « ne sont utilisées que dans quelques programmes expérimentaux » (pp. 54-55). Pour l'acquisition des connaissances, Pitrat note qu'« à terme, il faudra que nous donnions la possibilité aux utilisateurs de fournir les connaissances dans une langue naturelle », ou par apprentissage face à la masse des connaissances nécessaires (p. 55). Plus généralement, il faudrait pouvoir récupérer les connaissances des manuels, dictionnaires, des méthodes de langues, guides, etc. (p. 57). Pitrat mentionne ainsi Ferdinand Brunot qui, dans La Pensée et La Langue, classe les contraintes d'usage des expressions diverses (pp. 121-122). En fait, ici aussi il faudra vérifier systématiquement la validité des connaissances acquises, parce que certaines peuvent être fausses (en particulier dans les textes anciens).

Les programmeurs utilisent des graphes d'analyse (pp. 58-113), qui donnent une représentation graphique de l'analyse de la syntaxe des phrases ou du sens (analyseur de RIESBECK, ATN sémantique). Ils fonctionnent en compréhension des textes (en entrée) ou en génération (sortie). On peut aussi noter que le problème informatique de levée des ambiguïtés est souvent dû au traitement séquentiel. Une partie est levée par la syntaxe elle-même. En fait, il me semble qu'on devrait considérer le texte comme une base de données déjà structurée, d'où mon hypothèse que les ambiguïtés sont des erreurs.

Ce que Pitrat se propose d'analyser avec le jeu d'échecs, la description du « monde » des coups d'échecs et leur valeur (p. 72) concerne des expressions en langage naturel très sophistiquées. Par exemple, il a « répertorié 70 façons différentes de décrire qu'il y avait une capture » (p. 122). Du coup, ses interrogations sur la taille du dictionnaire (p. 77) reviennent à nécessiter de tout mettre. C'est normal : la difficulté de la langue est qu'on peut rencontrer des parties plus complexes. On pense aux 3000 mots pour connaître une langue étrangère. N'importe quel texte lu avec ces acquis pourra présenter des mots inconnus. C'est plus un moyen de connaissance qu'un but définitif, comme les programmes de Pitrat. L'intérêt de l'informatique est précisément qu'on n'a pas forcément à se limiter : on peut entrer tout le dictionnaire dans le programme. C'est la capacité des ordinateurs à l'époque, ou tout simplement le travail que ça représente, qui faisait qu'on se limitait à des prototypes en extrapolant au reste de la langue. Notons que les chercheurs en linguistique (ou grammaire) faisaient pareil quand ils travaillaient manuellement. Ce sont des rédacteurs de dictionnaires besogneux qui se donnaient la peine de passer leur vie sur un recueil (presque) exhaustif. On a un peu tendance à considérer aujourd'hui les dictionnaires comme des outils disponibles a priori, mais il a bien fallu que quelqu'un les compose manuellement (sans parler des coûts d'impression avec les anciennes imprimeries utilisant une composition par caractères mobiles en plomb).

Outre les analyseurs, Pitrat note que pour la génération de textes, il est « facile de créer des textes compréhensibles », mais qu'ils peuvent être d'une certaine lourdeur (pp. 124-126). On pourra lui rappeler néanmoins la réalité de certains textes administratifs. Très ambitieux, Pitrat s'intéresse ici à la stylistique. Le pionnier de l'IA Terry Winograd déclinait ainsi à la description d'un objet : s'il est unique, on arrête la description, sinon on la précise (ex. « Le cube, le cube bleu, le grand cube rouge »), plus sa position, plus des raccourcis (p. 127). Mais Pitrat note aussi : « quelles informations va-t-on regrouper dans une même phrase ? [pour une bonne lisibilité...] Ces questions ont été négligées » (p. 136). Il faut également comprendre ce que veut l'interlocuteur et partager des connaissances avec l'analyseur (pp. 139-140).

La question des inférences de l'analyseur affronte la possibilité d'une explosion combinatoire en fonction de la vraisemblance (doutes possibles sur la véracité du texte). L'exemple de Pitrat sur des crocodiles dans les égouts de Nice qui mangent les touristes isolés (p. 148) pourrait relever de l'interprétation des fake news actuelles. Plus que les ambiguïtés, la question est bien la question de l'interprétation de la vraisemblance (p. 144) qui peut effectivement se traiter initialement par des valeurs par défaut (p. 151). Mais pour le projet sophistiqué de Pitrat, cela revient aussi à maîtriser une critique littéraire systématisée et qui n'existe pas forcément encore.

À propos d'un programme de recette de cuisine à partir des travaux de Chadia Moghrabi et Marie Odile Cordier, Pitrat note que : « le but du programme est de comprendre le texte de façon assez détaillée pour commander un robot qui exécuterait la recette » (p. 162). Outre la possibilité de remarquer qu'un robot est identique à un humain sur ce point, on peut aussi se contenter d'un programme capable d'expliquer à un humain ce que des directives ambiguës signifient. C'est le problème classique, en pédagogie, du décrochage dans les explications, quand le formateur n'explique pas dans le détail, surtout si la classe est hétérogène. Il faut que les élèves n'aient pas peur de poser des questions. Notons que le principe de l'hypertexte permet d'accéder à la définition des mots qu'on ne connaît pas dans ce qu'on lit[1].

Pour la représentation du monde, Pitrat mentionne un peu tardivement les scripts de Schank comme séquences d'actions stéréotypées (celui du restaurant : retenir, s'installer, commander, être servi, manger, payer, etc.), avec même des séquences de perturbations possibles (pp. 163-168). Sur la question de la différence humain/machine, « Schank pense que les scripts ne sont pas seulement une commodité pour nos programmes, mais qu'ils correspondent à une réalité chez l'homme » (p. 170). Les scripts sont complétés par les plans, comme ensemble de buts et d'actions, ou les buts (proche, maîtrise, connaissance, domination, prépare), les contre plans pour contrer le plan de quelqu'un d'autre, les thèmes, pour comprendre les rôles des personnes ou les métaplans, comme éviter les buts impossibles (pp. 172-185).

On voit que tout cela concerne la représentation de l'activité humaine ou simplement des états du monde et que cela récupère les connaissances des sciences humaines et naturelles ou celles de la connaissance ordinaire. On peut comprendre que devant la quantité énorme de connaissances, Pitrat ne soit pas forcément optimiste et souligne constamment les limites des programmes. Il dit que le programme ELIZA de Weizenbaum, qui simulait un psychothérapeute renvoyant surtout des questions pour relancer l'expression du client, avait été conçu comme un canular. Dans mon livre, j'avais au contraire considéré qu'on se devait de constater qu'il avait atteint son but, puisque les personnes sur lesquelles il était testé se prenaient vraiment au jeu, et qu'on pouvait donc considérer que le test du Turing était donc satisfait, puisqu'on ne distinguait pas le psychothérapeute et la machine. On peut aussi considérer qu'un psychologue rogérien est une machine, mais cela revient au même.

D'ailleurs, par une coïncidence amusante, quand Pitrat parle des erreurs dans les textes, que la machine doit pouvoir repérer (p. 192), on trouve justement une coquille : « la première difficulté est parfois de se rendre cmpte qu'il y a une erreur » (p. 193). Il n'y avait pas de correcteur à l'époque. La difficulté dont il parle est celle des erreurs qui empêchent la compréhension par la machine, mais évidemment il est aussi grave qu'elle comprenne autre chose, d'où l'obsession des ambiguïtés. Sur ce point, j'ai aussi argumenté que le problème était souvent équivalent pour les êtres humains, alors qu'on les oppose aux ordinateurs en semblant dire que les humains sont doués d'une clairvoyance qui ne me paraît pas très réaliste.

La conclusion de Pitrat, quoique pessimiste quant au plafonnement des programmes en son temps, maintient l'utilité des recherches sur la compréhension. On comprend que cette représentation du sens est perçue par lui comme une sorte de langue pivot non ambiguë qui constituerait une forme de langage universel, à la fois traducteur et analyseur de la réalité humaine et matérielle (pp. 197-198).

Jacques Bolo

courrier Recommander cette page à un ami
Voir aussi :
1. On peut voir l'explication des connaissances pragmatiques nécessaires dans l'explication que donne Marie-Odile Cordier elle-même dans la journée hommage J. Pitrat qui s'est tenue le 6 mars 2020 (vidéo : « Connaissance, Béchamel au chocolat »). Retour
Soutenez
la revue Exergue
Tous les articles
Références
Critiques

IA
Méthodologie
Culture
Ecologie
Economie
Education
Ethnologie
Relativisme
Société
Europe
Turquie
Démocratie
Sciences
Histoire
Photos
Urbanisme
Sociologie
Reportages
Linguistique
Philosophie
Internet
Politique
Humour
Racismes
Femmes
Démographie
Conneries
Peurdesmots
Médias
Religion
Social
Sports
Carnet
Accueil Ball © 2005- Exergue - Paris Ball Légal Ball Ball Partenaires Ball Contacts