Jacques BOLO
PHILOSOPHIE contre INTELLIGENCE ARTIFICIELLE
Novembre 1996, ed. Lingua Franca, Paris, 376 p.
|
Chapitre 6 Langage et formalisation La formalisation du langage s’impose, à l’évidence, comme le but de l’intelligence artificielle. Il ne s’agit pas ici de considérer les systèmes cognitifs comme des langages, ce qui correspondrait plutôt aux déclarations de la psychanalyse[NOTE 103]. Il suffit de constater que le langage est un système cognitif effectivement acquis par la quasi totalité des êtres humains. L’apprentissage de la langue maternelle est un modèle universel parce que tout le monde apprend sa propre langue. Les exceptions sont des cas pathologiques (autistiques, enfants sauvages, sourds-muets de naissance avant Helen Keller, etc.). Le paradigme est ainsi parfaitement représentatif. De plus, la fonction métalinguistique de la langue, celle lui permettant de parler d’elle-même, remplit un rôle cognitif qui s’identifie à la conscience. La linguistique (ou la grammaire ancienne) est elle-même l’état des représentations du langage, la conscience de l’apprentissage de la langue. Modèle ou analogie de la didactique des langues étrangères L’analogie du langage peut être renforcée par le recours à celle de la Didactique des Langues Étrangères (DLE). L’apprentissage d’une seconde langue peut représenter l’assimilation d’un système linguistique à partir d’un autre système linguistique. D’autant que la linguistique elle-même n’est pas indépendante du comparatisme, puisque : “Les premières grammaires ne furent pas composées en France pour des Français, mais hors de France pour des étrangers.” (R. L. Wagner, La grammaire française, p.2). Cette analogie permet de comprendre, ou de résoudre, les problèmes interculturels, posés par la fameuse hypothèse Sapir-Whorf, qui soutient l’irréductibilité des systèmes conceptuels. Il suffit pour cela d’imaginer un certain nombre d’états intermédiaires (appelés interlangues en DLE), éventuellement fondés sur des primitives interculturelles — dont les concepts linguistiques sont les meilleurs exemples. Le problème linguistique est que chaque locuteur peut avoir des grammaires partiellement différentes, et qu’une bonne partie est fausse (comme justement celles des étrangers débutants). Frei, dans son livre, La grammaire des fautes, nous montre justement la régularité des fautes commises [NOTE 104]. Elles indiquent les interlangues fondées sur le système des règles déjà acquises. De plus, chaque état de la grammaire savante, chaque état de la linguistique donc, est lui-même une grammaire intermédiaire. Et toute grammaire provisoire peut diffuser une norme qui ne correspond pas à la réalité de la langue. Les agents inconscients de la diffusion de ces normes en sont naturellement les parents illettrés, les apprenants étrangers entre eux, ou les rationalisations diverses, dont celles des linguistes. Pour cerner ce décalage, même savant, on peut rappeler par exemple que les grammairiens français classiques imposaient au français les catégories de la grammaire latine, les grammairiens latins faisaient de même avec la grammaire grecque. Le fait qu’ils aient pu ainsi modifier la langue précédente n’annule pas sa réalité antérieure, mais influence la langue postérieure avec les modèles conscients des locuteurs. C’est ce qui rend irrecevable certaines déclarations intuitionnistes : “Je serais [soupçonneux] si l’on m’affirmait qu’il nous faut supplanter notre théorie implicite de la langue anglaise, celle que nous acquérons en apprenant la langue.” (Searle, p. 82). Jusqu’à preuve du contraire, l’apprentissage de la langue, dans une société scolarisée et pour un individu comme Searle, suppose le passage par la pratique de nombreuses règles de grammaire. Il ne serait pas sérieux d’affirmer que cohabite une théorie implicite totalement indépendante de l’influence de l’apprentissage formel[NOTE 105]. Cette condition expérimentale est elle-même difficile à obtenir dans l’étude de l’apprentissage d’une langue seconde, même dans le cas d’un apprenant analphabète. Cependant, le refus du formel peut décrire simplement l’observation des comportements humains. Il est en effet difficile (pour les débutants dans une langue, ou les personnes peu instruites) de passer à une explication métalinguistique (formelle). Quand un problème de communication se pose, les rectifications ou les compléments d’information portent sur le contenu, au lieu de porter sur la forme. Cela semble procéder d’une représentation intuitionniste fondée sur une négation de la nécessité du support linguistique, et la possibilité de communication directe. Alors qu’on devrait considérer que l’incompréhension repose sur l’absence d’assimilation des codes réciproques. Le problème des règles formelles de l’IA correspond ainsi à celui qui agite le milieu de la DLE à propos de l’opportunité et des avantages réciproques des techniques d’apprentissage formelles et non formelles, c’est à dire des exercices grammaticaux (dit structuraux) et de conversations libres dans l’imitation du bain linguistique (dite approche communicative). Or il est bien évident, mais également disponible dans les enquêtes empiriques, que ce recours aux structures grammaticales acquises est ce qui permet de structurer les apprentissages. Même si parfois, effectivement, une règle acquise empiriquement entre en conflit avec une règle apprise. L’utilisation de l’expérience de la DLE est également explicative de la fausse aporie de la croissance exponentielle de la complexité, qui semble ponctuer l’argumentation de Dreyfus (pp. 37-38, 92 et 369-370). En effet, il est parfaitement normal, quand on travaille sur un nouveau domaine, de résoudre rapidement des problèmes sommaires. On ne voit pas comment il pourrait en être autrement, ni comment on pourrait refuser de résoudre ce qui est facile ! Il est tout aussi normal de rencontrer ensuite des paliers de difficultés. C’est justement le cas dans l’apprentissage d’une langue étrangère. Abandonner devant ces difficultés est ce qu’on appelle alors la fossilisation, qui bloque le sujet à un niveau où la progression devient plus difficile, et la difficulté apparemment infinie. Dans ces situations, l’apprenant (analphabète surtout) finit par s’endormir à un niveau donné. Analyse ou intuition On trouve aussi en DLE, ou en didactique en général, le mythe de la lecture globale qui est bien une conséquence de la conception holiste. Cette idée est sans doute fondée sur des expériences ou des expérimentations authentiques. Mais elle a aussi provoqué des errements dans le courant pédagogique. Pour reprendre l’exemple de Searle de la langue chinoise, il n’existe pas de vision globale des idéogrammes [NOTE 106], mais une analyse en parties élémentaires qui les composent. Les caractères sont d’ailleurs classés par les chinois en comptant le nombre de traits pour les caractères simples, et par les parties qui en constituent la clé pour les caractères composés (le holisme des chinois est décidément bien analytique). Dans une langue idéographique, les signes primitifs sont simplement plus nombreux que les lettres de l’alphabet. Mais ils ne sont pas d’une nature iconique différente, d’un point de vue de la reconnaissance des formes [NOTE 107]. Avec la pratique, on reconnaît globalement ceux qu’on a l’habitude de voir, c’est à dire ceux qui sont déjà analysés. Certes, on peut apprendre un signe composé sans l’avoir d’abord analysé. Mais on peut connaître ensuite les primitives qui permettent sa construction (exactement comme les étymologies dans les langues occidentales). Il faut d’ailleurs noter que les idéogrammes (ou les étymologies), conservent les anciennes classifications, et ne servent donc pas forcément à éclairer la compréhension. Certaines formules sont effectivement globales. Mais c’est également par analyse qu’on progresse dans le langage. En situation d’apprentissage d’une langue étrangère, un mot ou un son nouveaux devront être analysés pour en faciliter la compréhension, ou la reproduction. Cette analyse est également nécessaire, car une perception globale de langues différentes, pour le sujet, ne correspond pas en fait au même découpage dans les autres langues, selon l’aspect légitime d’observation du principe Sapir-Whorf. Par exemple, les voyelles anglaises sont presque toutes des diphtongues. Pour un Français, l’équivalent élémentaire n’existe pas. Faut-il en conclure que les Français sont poussés à l’analyse, et les Anglo-saxons au holisme ? En tout cas, (ce qu’on appelle) le don des langues est un mythe (de sectes religieuses anglo-saxonnes !), car dans la pratique, on apprend patiemment en analysant les règles articulatoires pour les sons, la composition morphologique ou phonologique pour les mots, les règles grammaticales pour les phrases, l’emploi en situation pour la pragmatique linguistique, etc. La fossilisation dont il était question plus haut est justement une conséquence de l’incapacité à décomposer, qui caractérise spécialement les apprenants peu scolarisés. On reconnaît là les lacunes produites par l’absence de manipulations abstraites (selon les enseignements de Piaget). Ce qui est déterminant est le poids des formes globales acquises de la langue maternelle, considérées comme les seules grilles possibles, comme le seul langage possible. Position qu’on retrouve sous une autre forme dans certains aspects du purisme d’ailleurs, pour les plus scolarisés. En définitive, on est bien obligé de constater un apprentissage des langues étrangères, même si cette compétence reste imparfaite. D’ailleurs, cette imperfection réside essentiellement, outre le manque de souplesse mentale, dans le fait qu’on ne partage pas les mêmes expériences éphémères de l’actualité, ou des ustensiles quotidiens. Cette différence s’estompe précisément quand on s’installe dans le pays. Car une fois la base acquise, il suffit de demander une explication en cas de besoin. Au-delà, on entre dans les domaines spécialisés et techniques, ignorés eux-mêmes des non-spécialistes. Or ils sont précisément déjà universels ou codifiés. Il serait alors absurde de vouloir plus que ce qui est le lot des natifs.
Perception et conceptualisation L’intelligence artificielle a au moins le mérite de rappeler que la formalisation du langage reste le but de la logique (ou de L’art de penser, comme on disait à Port-Royal). Mais ce projet doit se fonder en fait sur une conception faible de la science qui évite les écueils du logicisme, et ceux du sens commun. Le premier est incomplet en matière de langage ordinaire, et le second ne peut évidemment pas être idéalisé sans tomber dans la démagogie. Le projet de formalisation du langage naturel permet de résoudre la fausse opposition signalée par la psychologie génétique : “Un russellien anglais disait un jour pour prouver l’inutilité des recherches sur la pensée de l’enfant, que “le logicien s’intéresse aux idées vraies, tandis que le psychologue trouve son plaisir à décrire les idées fausses”.” (Piaget, La psychologie de l’intelligence, p. 28). Les adversaires de l’IA refusent ainsi la formalisation, que Dreyfus considère même comme un postulat métaphysique. Par ce terme, il ironise sur les partisans de l’IA, dont on peut expliquer éventuellement les maladresses par leur situation de non-spécialistes de philosophie, ou plus généralement par l’absence de pluridisciplinarité : “Ces derniers métaphysiciens misent en effet exclusivement sur l’aptitude de l’être humain à dégager des principes abstraits de son comportement — à court-circuiter corps et cerveau pour atteindre, d’autant plus sûrement, l’essence même de la raison.” (Dreyfus, p. 17). On peut lui concéder l’excès de formalisme de la science moderne, qui retrouve souvent des accents platoniciens en s’éloignant du monde sensible. Mais usuellement, le postulat métaphysique est plutôt celui qui prétend que l’humain ou l’intelligence est au delà de la physique. Nous avons vu que ce dualisme est parfois repris par la phénoménologie qui sépare le monde humain du monde matériel. A la suite de Dreyfus, le duo Winograd et Flores précisent cette pensée anti-théoricienne en développant, comme nous l’avons vu, l’idée de l’engagement et de l’interaction sociale, contre la tradition rationaliste de la connaissance. Ils font aussi de l’absence d’engagement la condition de l’impuissance des ordinateurs à comprendre le langage naturel (Winograd & Flores, p. 37). Ils réinterprètent les ordinateurs eux-mêmes, dans leur schéma jargonnant de reformulation, comme n’ayant pas d’existence propre : “…au sens où les choses possèdent des caractéristiques objectives ainsi que des fonctions, en dehors du langage. Ils ont été créés par des conversations entre les humains qui s’engagent et qui anticipent des échecs. […] Les ordinateurs ne sont pas seulement dans le langage mais sont eux-mêmes un équipement pour le langage.” (Winograd & Flores, pp. 131-132). Avec beaucoup d’indulgence, et une reprise de ce langage privé, on pourrait au contraire généraliser cette caractérisation au langage lui-même. Le langage est bien un outil d’interaction pour exprimer les relations des êtres (humains) avec le monde. Mais ce n’est pas suffisant, car pour ces auteurs, “ nous créons notre monde à travers le langage “ (Winograd & Flores, p. 35). On peut croire ici à une sorte de magie verbaliste. L’influence de Searle se fait sentir qui confond manifestement les actes de langage avec les pétitions de principe. Pourquoi refuser ainsi la formalisation quand on prétend soi-même que “ ‘langage en tant qu’action’ et ‘langage en tant qu’interprétation’ peuvent être réconciliés” (Winograd & Flores, p. 96) ? Car il suffit d’admettre aussi le langage en tant que représentation. Finalement, l’aptitude de l’être humain à dégager des principes abstraits n’est pas un postulat de métaphysicien, mais un fait (d’observation). Même, et surtout, si la raison est fondée sur le corps, elle procède par abstraction de principes, à partir du comportement observable de l’être humain. Et un robot dégagerait aussi des principes abstraits de son propre comportement par la considération de son interaction avec l’environnement. Un programme procéderait par simulation de cette interaction. Toute conceptualisation est une schématisation, c’est-à-dire l’élimination de détails non pertinents. La démonstration par l’absurde est disponible dans la nouvelle de Borges, “De la rigueur de la science”, in Histoire universelle de l’infamie/Histoire de l’éternité, où un monarque exige de ses géographes une carte toujours plus parfaite, jusqu’à ce qu’elle se confonde avec le territoire réel. On ne peut donc que s’étonner du cliché romantique de la part d’un scientifique citant Horkheimer, déplorant que “ les concepts [soient] réduits à des caractéristiques communes à plusieurs spécimens.” (Weizenbaum, p. 163). D’autant que la reconnaissance de ce processus élémentaire de toute abstraction est enregistrée par le philosophe. Son ironie le situe cependant dans un cadre dualiste qui n’imagine pas que le monde humain relève des mêmes procédures que le monde naturel : “De même que Galilée a découvert qu’on pouvait décrire par une simple formule les mouvements des planètes en éliminant certains détails secondaires et certaines considérations théologiques, de même pourrait-on imaginer une sorte de Galilée du comportement humain, parvenant à réduire toutes les considérations sémantiques (appel au sens des mots) à de simples techniques de manipulation syntaxique.” (Dreyfus, p. 5, c’est moi qui souligne). Conformément à la prétention philosophique traditionnelle, on peut admettre que, parfois, Dreyfus pose bien le problème en abandonnant conjoncturellement la richesse du contexte matériel et culturel. Mais nous savons déjà que ce genre de procédé rhétorique confond une question avec une négation de la position adverse. En général, la réponse n’est d’ailleurs même pas écoutée. Inversement, l’immanence du sens, sans doute intuitionniste, va jusqu’à une sorte de quiétisme sémantique, dans la tradition de la simplicité. Cette ontologie cognitive est ici généralisée au monde non humain, contradiction phénoménologique qui vaut bien certains excès mécanistes : “Le fait que ce gros morceau de matière […] qui constitue le cerveau, ait une conscience ne devrait pas nous étonner davantage [que la vie].” (Searle, pp. 30-31). Personne d’autre que le philosophe n’utilise cette stratégie rhétorique de l’absence d’étonnement, pour employer immédiatement la stratégie contraire : “Notre second problème est de savoir comment les atomes dans le vide peuvent posséder une intentionnalité.” (Searle, p. 31). Ainsi, ce syndrome parapsychologique plus ou moins animiste croit devenir scientifique en s’associant à des corpus académiques consacrés. C’est la tradition des para-sciences qui briguent la scientificité. Réductionnisme et constructivisme On commence maintenant à connaître le procédé. Le préjugé contre la formalisation conteste le passage de la perception à la représentation par réductionnisme neuronal. Le refus de la formalisation par l’approche phénoménologique/gestaltiste généralise même la perception à la cognition. Cela passe d’abord par le refus de la décomposition ou du calcul pour préférer “certains facteur comme le temps et des interactions de champ.” (Dreyfus, p. 199), bizarrement perçus comme incalculables. La caution de la théorie de la forme prétend distinguer la méthode de reconnaissance de l’humain et celle de l’ordinateur (Dreyfus, p. 81). Que le traitement des informations soit différent entre un humain et un programme est acceptable, mais cela n’exclut pas une classification. On passe rapidement du fait qu’elle puisse être inconsciente (Dreyfus, p. 79) à une différence ontologique, sans doute sur des critères subjectivistes searliens. Mais comment peut-on exclure tout recueil d’informations dans la prise en compte d’un chien qui traverse devant une voiture (Winograd & Flores, p. 223). Dire que : “Notre action n’est pas la conséquence d’une décision mais d’une manière d’être.” (W. & F., idem) n’explique pas cette manière d’être. La recherche d’une décision rationnelle a justement pour objet la possibilité de correction d’une manière d’être inadéquate ou non optimale. De plus, toute la question est de savoir si un calcul ne peut pas modéliser une perception, ou si les conceptions gestaltistes de la perception globale ne concerne pas seulement les formes déjà connues. Car il a fallu longtemps, dans la petite enfance, pour apprendre les formes courantes. De même, malgré la résistance à la perception comme calcul, la psychologie cognitive actuelle permet d’assimiler cette perception à une construction à partir de l’interprétation et de la composition de signaux et des schèmes élémentaires. Ce qui contredit explicitement les affirmations dogmatiques contre le processus de construction (Dreyfus, pp. 347-348). Ce processus de perception ne concerne que de façon élémentaire l’acquisition des formes culturelles. Car l’existence de catégories plus abstraites est, sans conteste, révélée par les confrontations ou les déplacements interculturels, ou les différences de connaissances. D’ailleurs, les acquis culturels n’excluent pas les possibilités d’analyse, contrairement à la déshumanisation supposée. Simplement, un spécialiste est capable de verbaliser une impression qu’un profane ressentira. Et cette verbalisation sera une analyse. Plus généralement, on peut simplement rappeler que le langage est un artefact, ce qui signifie qu’il faut plutôt le décomposer pour le comprendre, et non absorber la voix de Dieu. On comprend cependant la résistance au constructivisme excessif, qui règne parfois dans les sciences humaines. La notion kantienne de cadres cognitifs, intermédiaires entre nous et un réel inaccessible comme tel, aboutit souvent à un relativisme identitaire extrémiste pour justifier les conflits interculturels de représentations ou de valeurs. Si on pousse un peu, dire que l’individu construit ses perceptions peut revenir, ou conduire à dire, qu’il n’y a pas de perception du tout. Ou selon le principe antique, que le regard est actif (qu’il fonctionne comme un projecteur et non comme une caméra). On en conclut alors que le monde n’existe pas, que tout est illusion (sur le mode immatérialiste inspiré de Berkeley ou des philosophies orientales), ou on obtient à un avatar du volontarisme (toujours par reconversion de nombreux chercheurs anciennement marxistes) [NOTE 108]. Comme la phénoménologie balance alternativement entre les deux possibilités de négation ou d’apologie du constructivisme, on ne peut guère décider quoi que ce soit sur ce point. On se demande si le constructivisme ne correspond pas simplement à l’abstraction et aux classifications, dans la tradition positiviste, que les adversaires de l’IA contestent. Car la philosophie redécouvre sans cesse ce qu’elle commence par nier. Ce qui est bien la définition de la démonstration par l’absurde ! Plus sérieusement, on peut admettre classiquement une version faible du constructivisme, en considérant que l’activité cognitive du sujet signifie que l’ordre est ce qu’on met, pas ce qu’on voit. D’ailleurs, les anciens qui voyaient la même chose, ne percevaient que le chaos, là où nous reconnaissons la régularité des lois physiques. Les grilles conceptuelles en question constituent alors les acquis cognitifs, le but et le moyen cumulatif de la connaissance. On peut aussi admettre que l’analyse des postulats, qui correspond à ce constructivisme, permet la recherche inductive des principes générant les discours ou les actions. L’inconvénient réside alors souvent dans la tendance à la construction d’un système réducteur, fermé et déductif. Cette approche constitue de ce point de vue le résumé de la philosophie (ou de la théologie) traditionnelle qui considérait que le réel se déduit d’un nombre limité de principes, ou de primitives sémantiques dans le cas de l’IA. Cette influence traditionnelle, comme le dit Dreyfus, induit effectivement une conception internaliste ou analytique, qui associe le holisme (les phénomènes ne sont que des propriétés du tout) et le logicisme (qui ne fait que définir le moyen de cette déduction) dont le structuralisme est l’aboutissement. Popper, en continuant à refuser l’induction se situe lui aussi dans un cadre internaliste. Mais il ajoutera judicieusement le contrôle des conjectures par l’expérimentation, et la recherche systématique de réfutations [NOTE 109]. Inversement, les positions phénoménologiques ou empiristes sont bien cohérentes avec l’idée d’une ouverture sur le monde. Cette ouverture est le seul sens de l’incomplétude de nos théories. On peut comprendre ainsi l’idée d’une pratique précédant la théorie. Cependant, une ouverture au monde est relative, car il existe une clôture épistémologique en terme d’états de connaissance. Par exemple, une classification des animaux connus pourra être perturbée par une nouvelle découverte. Mais par définition, le cumul des connaissances rendra ce bouleversement moins probable, contrairement au mythe épistémologique (gauchiste) de la révolution permanente. Les révolutions scientifiques ne sont d’ailleurs pas toujours aussi radicales qu’on le dit, comme le rappelle Piaget : “Une science exacte, malgré toutes les “crises” et les refontes dont elle tient à se flatter pour prouver sa vitalité, n’en constitue pas moins un corps de notions dont le détail des rapports se conserve, et se resserre même, lors de chaque nouvelle adjonction de faits ou de principes. […] On retrouve le même phénomène […] dans la pensée de tout homme équilibré.” (Piaget, La psychologie de l’intelligence, p. 47). Notons que la clôture épistémologique (et non réaliste) est tout aussi nécessaire à l’action. Une connaissance toujours limitée est d’ailleurs ce qui contredit le holisme en permettant l’action sans connaissance absolue. L’analyse économique considère précisément cette rationalité limitée avec Herbert Simon. Son modèle, tout idéal qu’il soit, ne prétend pas (par définition) à la connaissance totale. Ce qui rend incompréhensibles les restrictions de Winograd & Flores, ou les interrogations pseudo-méthodologiques qui exigeraient que “pour tout observateur cet espace d’alternatives existe” (Winograd & Flores, p. 224). Car le fait que certaines alternatives ne soient pas conscientes (le cas de la conscience de l’observateur formalise simplement une représentation de l’action d’autrui) relève précisément de la rationalité limitée. Cette interrogation repose sur le préjugé holiste. Dans le monde réel, une connaissance partielle est toujours suffisante, car elle permet l’action, et donne un avantage concurrentiel. Certes, pour d’autres économistes, l’action est le produit de la croyance ou de l’idéologie, et non du calcul rationnel. Mais il s’agit évidemment là d’un jugement extérieur — rationnel — sur les croyances. D’une façon générale, parler de croyance est déjà fondé sur la connaissance plus exacte ou plus formalisée, que possèdent ces économistes. De plus, la rationalisation idéologique elle-même correspond à un calcul, à partir de prémisses fausses ou limitées, souvent généralisées abusivement. L’intérêt micro-économique d’un acteur est évidemment distinct des équilibres macro-économiques [NOTE 110]. Conscience des formalismes Le refus du formalisme et des règles est d’ailleurs finalement contradictoire avec la nécessité de la conscience dans l’action. Le discours de la phénoménologie insiste sur ce critère intentionnel, qui implique la conscience de l’acteur. Cette position s’explique sans doute à l’origine par le souci de restituer une autonomie au sujet après une domination déterministe dans les sciences humaines. Cependant, le critère intentionnaliste revient à récuser les phénomènes inconscients parce qu’il ne sont pas conscients (Dreyfus, pp. 107-108). Ce genre de pétition de principe est le mode d’argumentation pseudo-analytique préféré des phénoménologues. Il existe évidemment des processus inconscients, et certains sont plus ou moins explicitables, comme les cadres culturels. Le meilleur exemple pour notre propos en est la grammaire et ses règles. Cette notion de règle peut indifféremment exprimer des facteurs conscients ou inconscients pour expliquer les comportements. Elle n’est pas contradictoire avec le fait que les partisans de l’IA admettent cette absence de conscience, dans la tradition de la philosophie classique de Platon à Kant : “Feigenbaum […] note scrupuleusement que les experts eux-mêmes ne sont pas conscients de faire appel à (des) règles.” (Dreyfus, p. 147). Car pour réaliser des systèmes experts, tout le travail du cogniticien, sur le modèle de Socrate à qui il emprunte la maïeutique, consiste justement à découvrir les règles que les experts appliquent. Le fait que les systèmes experts fonctionnent effectivement est une preuve suffisante. Il est à remarquer aussi que toute la deuxième partie du livre de Dreyfus, utilise la méthode qui se réfère à la mise en lumière (kantienne) ou la critique (marxiste) de postulats implicites, correspondant à l’idée de règles, générant de raisonnements à partir de ces postulats. On peut d’ailleurs s’étonner du refus simultané de l’utilisation de règles pourtant conscientes dans les deux exemples concrets que nous fournissent Dreyfus et Searle : “L’exemple de la bicyclette est tiré du livre de Michel Polanyi […] : “Ayant interrogé tout à tour des physiciens, des ingénieurs et des fabricants de bicyclettes, j’en suis arrivé à la conclusion que le principe en vertu duquel le cycliste conserve son équilibre n’est pas universellement connu. La règle qu’observe le cycliste est la suivante : lorsqu’il s’incline dangereusement vers la droite, il tourne son guidon vers la droite, de sorte que le vélo dévie, selon une certaine courbe vers la droite. Il en résulte une force centrifuge qui pousse le cycliste vers la gauche […]. Mais cela nous apprend-il, au fond, à rouler à bicyclette ? Non, il est bien évident qu’il n’est pas question pour nous de régler les courbes décrites par la roue avant de notre bicyclette sur le quotient de notre angle d’inclinaison par le carré de notre vitesse”.” (Dreyfus, p. 236, note 2). “Lorsque mes enfants fréquentaient l’auto-école d’Oakland, on leur a appris à garer leur voiture d’une certaine manière. La règle disait : manœuvrez votre voiture en direction du trottoir, en braquant le volant à l’extrême droite, jusqu’à ce que vos roues avant se trouvent au même niveau que les roues arrières de la voiture qui se trouve devant. Puis braquez le volant au maximum vers la gauche. […] Cette règle m’a intéressé parce que ce n’est pas celle que je suivais. Lorsque je gare ma voiture, je ne suis aucune règle. Je me contente de regarder le trottoir et de m’en approcher autant que possible sans heurter les voitures qui se trouvent devant et derrière. Mais attention, il se peut très bien que mon comportement, vu de l’extérieur, corresponde parfaitement à […] la règle précédemment énoncée. Et pourtant, il ne serait pas exact de dire que je suis cette règle.” (Searle, pp. 64-65). La question qui se pose, au contraire, est justement celle de la traduction du “quotient de notre angle d’inclinaison par le carré de notre vitesse” en termes perceptifs, dans la conscience seconde des adversaires de l’IA (qui ressemble beaucoup à l’homoncule, et qui mériterait au moins les guillemets dont ils abusent généralement). Dans le premier exemple, les explications initiales des physiciens semblaient pourtant suffisantes et ne présentaient pas une difficulté insurmontable pour le sens commun. L’utilisation (pédante et ironique) de termes mathématiques s’explique seulement si on veut quantifier l’état d’équilibre. De plus, on semble oublier ici que le refus de la science revient évidemment à la nier comme forme de conscience. Si, dans le premier exemple, il ne semble être accordé d’intérêt qu’aux explications de sens commun, dans le second exemple, la question semble bien se limiter à des façons de parler : “Ce n’est pas (la règle) que je suivais… je ne suis aucune règle… je me contente de regarder le trottoir et de m’en approcher” qui explicite précisément la règle suivie (vraisemblablement de façon insuffisante) ! Le problème de l’hypothèse mentaliste semble résider dans la différence entre règle, ou apprentissage formel d’une part, et apprentissage non formel, conscient ou inconscient de l’autre. Le sujet peut très bien avoir, comme c’est le cas ici, une règle interne provisoire plus ou moins exacte, et plus ou moins incomplète. Il pourrait d’ailleurs exister plusieurs méthodes. Mais cela n’exclut pas qu’une règle soit plus précise ou englobante qu’une autre. Comme c’est sans doute le cas ici, elle peut être une formalisation du comportement sans référence aux rationalisations (mentalistes, ou intentionnalistes) du sujet. C’est ce que laisse supposer : “il se peut que mon comportement, vu de l’extérieur… “. Car contrairement à ce qu’affirme Searle, ce critère d’observation est une condition suffisante (et un comportement vu de l’extérieur est aussi un phénomène). En effet, des variations (succès/échecs) observables de ce comportement de créneau peuvent caractériser les fois où la rationalisation incomplète, pourtant respectée, échoue, car elle n’est pas optimale. Nul doute que d’autres rationalisations accompagneraient alors les schémas mentalistes : culpabilité : “Je dois faire plus attention” ; accusation : “C’est de ta faute, tu m’as distrait.” (Searle à sa femme, ou ses enfants) malchance : “Zut, encore raté”, etc. Les comportements d’échecs comportent souvent une intense activité mentaliste psychologisante. L’exemple de Polanyi, comme celui de Searle, possèdent aussi l’inconvénient de concerner une compétence familière, que simulerait, dans le cas linguistique, l’apprentissage de sa propre langue. Le résultat apparemment trivial ressemble à la leçon du maître de grammaire, dans la pièce de Molière, Le bourgeois gentilhomme, dont l’humour est fondé sur la flagornerie envers les aristocrates. Selon le principe de trivialisation, ce que l’on sait déjà paraît ridiculement facile, voire inné. Mais cette impression aurait été différente s’il s’était agit de l’apprentissage d’une langue étrangère, ou d’une compétence nouvelle. La pédagogie du maître de grammaire aurait alors été parfaitement judicieuse, qui faisait articuler les sons à la manière de toute leçon de phonétique. Dans les exemples de la bicyclette ou de l’auto-école, la mise au jour de règles permet au contraire la pédagogie, destinée évidemment à ceux qui n’arrivent pas à réaliser une performance, et remplace la seule sélection de ceux qui y réussissent plus ou moins du premier coup. Et réciproquement, on comprend qu’il n’est pas nécessaire d’ennuyer ceux qui réussissent. Dans des compétences de ce genre, on peut imaginer que le modèle cognitiviste supprime le jugement de valeur qui découlerait de l’échec, sans doute jugé comme un échec moral de cette fameuse conscience seconde. Un échec peut être ainsi un échec à expliquer du pédagogue non formaliste. Car même l’identification de handicaps correspond justement à la possibilité d’existence de ces processus cognitifs. D’une façon plus générale, on peut plutôt constater l’incompréhension du principe de la formalisation en règles. Car il est possible d’affirmer que la formalisation est équivalente à la compréhension, comme le formule exactement (mais a contrario) Dreyfus (p. 256). Et cette incompétence se manifeste au niveau même du langage, ou de pseudo-distinctions philosophiques : “Polanyi attire notre attention sur la distinction qu’il convient de faire entre les règles strictes et les préceptes : “les préceptes sont des règles dont l’application correcte est un art, un art qui se confond avec l’art même qu’ils régissent. […] Les préceptes ne peuvent être réellement compris, et à plus forte raison appliqués que par ceux qui possèdent déjà une connaissance profonde, acquise par la pratique, de la discipline considérée”.” (Dreyfus, pp. 151-152). En somme, il s’agit de règles qui ne sont pas des règles, mais des préceptes qui ne s’appliquent pas comme une technique, mais comme un art qui ne s’apprennent pas, mais qui se comprennent, etc. Voilà bien une illustration de la pensée de castes. Et bien entendu, le discours passéiste de la philosophie nous ressert aussi la ficelle rousseauiste de l’idéalisation des cultures non-occidentales : “Les japonais préfèrent traditionnellement régler leurs conflits, même ceux pour lesquels l’aide de la loi existe statutairement, par ce que les occidentaux appellent les moyens informels. […] La Cour Suprême des États-Unis […] a refusé d’infirmer le jugement de la juridiction du tribunal indigène.” (Weizenbaum, pp. 148-149). Cette double auto-contradiction est exemplaire : d’une part, l’arrêt américain est bien juridique, de même que l’arrêt local d’autre part, pour un non-américain, tout cela révèle plutôt le caractère traditionaliste et communautariste (informel ou jurisprudentiel) de la justice américaine ! Si on tient absolument à distinguer les degrés de formalismes, on pourrait dire que le droit est moins formel que les mathématiques, le droit européen plus formel que le droit américain, le droit américain plus formel que le droit local, ou l’écrit plus formel que l’oral [NOTE 111]. Mais ce schéma est évidemment faux, car à l’intérieur de chaque système, les règles sont appliquées mécaniquement, et des contre-arguments tout aussi mécaniques sont mis en œuvre (par les plus ou moins bons avocats). Si le droit écrit ou oral peut justement se résumer à la mécanisation des relations sociales, cette mécanisation n’exclut justement pas, pour notre propos, la créativité. Elle s’exerce simplement par le recours à des principes caractérisant ou catégorisant nouvellement ces situations. Il n’existe évidemment pas de formalisation informelle. D’une façon flagrante, la négation de l’abstraction doit autant affronter l’évidence que les acquis de l’épistémologie. On constate ainsi, dans la citation suivante, que les deux premiers points de l’analyse bachelardienne recouvrent bien les biais holistes, vitalistes et simplistes de la philosophie : “Dans sa formation individuelle, un esprit scientifique passerait donc nécessairement par les trois états suivants, beaucoup plus précis et particuliers que les formes comtiennes. L’état concret où l’esprit s’amuse des premières images du phénomène et s’appuie sur une littérature philosophique glorifiant la Nature, chantant curieusement à la fois l’unité de la nature et sa riche diversité. L’état concret/abstrait où l’esprit adjoint à l’expérience physique des schémas géométriques et s’appuie sur une philosophie de la simplicité. L’esprit est encore dans une situation paradoxale : il est d’autant plus sûr de son abstraction que cette abstraction est plus clairement représentée par une intuition sensible. L’état abstrait où l’esprit entreprend des informations volontairement soustraites à l’intuition de l’espace réel, volontairement détachées de l’expérience immédiate et même en polémique ouverte avec la réalité première, toujours impure, toujours informe.” (Gaston Bachelard, La formation de l’esprit scientifique, p. 8). Mais le troisième thème bachelardien de la coupure épistémologique a traditionnellement choisi l’anti-empirisme (dans la tradition kantienne). Il faudrait plutôt valider (comme Piaget) l’activité formelle déjà présente à chaque stade. Car on peut constater que le formalisme épistémologique, en parlant des erreurs du passé, tend vers une sorte de cuistrerie dogmatique a posteriori. Ces préférences pourraient aussi n’être qu’une question de style : “L’empiriste a tendance à projeter sur les lois et les théories la facticité qui est à leur origine. Les seules propositions vraiment solides sont celles qui énoncent le plus directement des faits d’expérience. […] Le rationaliste, au contraire, projette sur les lois et les faits l’intelligibilité et la nécessité que leur confère leur insertion dans un système théorique.” (Robert Blanché, L’induction scientifiques et les lois naturelles, p. 161). Une telle observation permet de nuancer les tendances normatives de l’épistémologie française. Car l’épistémologie plus ou moins littéraire des sciences humaines subit la dictature de la norme constructiviste, dont on connaît la meilleure formulation : “Pour un esprit scientifique, toute connaissance est une réponse à une question. S’il n’y a pas eu de question, il ne peut pas y avoir de connaissance scientifique. Rien ne va se soi. Rien n’est donné, tout est construit.” (Gaston Bachelard, La formation de l’esprit scientifique, p. 14). Ce leitmotiv épistémologique pose le problème de savoir s’il n’y avait pas de connaissance scientifique avant qu’il ait cours. Dans le cas contraire, même si cela signifie bien que toute connaissance scientifique peut s’exprimer sous la forme d’une réponse à une question, ce ne serait donc qu’une question de présentation. Il suffirait d’adopter un ton problématique plutôt qu’assertorique. Cette norme stylistique explique sans doute la mode du questionnement, avec la généralisation d’expressions, voire de tics verbaux comme : “ça m’interroge”, “Les livres PUF questionnent le monde” (slogan publicitaire), etc. [NOTE 112]. La mode du questionnement ou le goût envahissant de l’interrogation peut produire un surcodage savant du genre : “un problème est ce qui fait question”. Il est d’ailleurs amusant de constater que la diffusion de cette norme est sans doute aussi à l’origine de l’existence d’un jeu télévisé — bizarrement appelé Jeopardy (mise en danger) —, qui consiste à deviner la question à une réponse qu’on connaît ! Et la valeur de cette norme questionnante n’a certainement pas plus d’intérêt, quant à la description de la pratique scientifique [NOTE 113]. La confusion entre question et problème peut provenir de l’usage scolaire des mathématiques, où les problèmes sont des exercices. Bien entendu, sociolinguistique oblige, il n’est pas question de refuser des acceptions nouvelles, surtout en se fondant sur une sorte d’étymologie. Mais il est permis de préférer, par référence à l’usage courant, le terme question pour ce qui possède une réponse (ou ce qui possède un agent humain), et conserver le terme problème pour ce dont on ne connaît pas la solution. La confusion pourrait provenir d’un biais professoral, car dans le cadre scolaire, l’élève découvrira la solution qu’il ne connaissait pas, alors que pour le maître, ce n’était qu’une question de cours. Que la réponse soit connue d’avance est le minimum de préparation des cours par le professeur : seule méthode pour garantir une évaluation objective et non relative au niveau de la classe. Ce dernier relativisme ne sert qu’à vérifier que la question correspond bien au niveau du public. Même quand il s’agit d’une recherche commune (professeur/élèves, groupes d’élèves), la tentative de proposer (imposer) une réponse tout en prétendant ne pas la connaître, tout en la connaissant, est une imposture qui réduit l’inconnu au connu, au préjugé. C’est un biais didactique fréquent face à une réponse non prévue, quand il s’agit d’une fausse recherche. On pourrait affirmer, que la philosophie, en n’opérant pas la distinction que je propose, consiste à transformer une question dont la réponse est connue en problème, en aporie. Et elle transforme un vrai problème en question de cours, en lieu commun surcodé, voire en délire sur l’inconnu. Dans ce cas, le connu est prétendument déterminé par l’inconnu, dont, évidemment, un locuteur privilégié (poète, philosophe…) sera le porte-parole, d’où la reconversion des avant-gardes quand elles se piquent de transcendance. Ce phénomène apparaît au sociologue malgré une coupable indulgence : “Mais il serait naïf de réduire la dissertation à la simple production d’une réponse apprise. Lorsque le corps professoral soutient l’idéologie de la “réflexion personnelle”, il peut aisément mettre en avant la place que l’exercice reconnaît à l’initiative individuelle. En effet, les sujets de dissertation sont expressément conçus de façon à éviter l’usage mécanique de la question de cours. La formulation de l’énoncé vise à brouiller les correspondances entre le traitement singulier et le répertoire philosophique des questions, conceptions et doctrines […] Le sujet de dissertation est cette question énigmatique dont on sait seulement qu’elle doit, en toute certitude, posséder au moins une signification répertoriée. La caractéristique “personnelle” de la “réflexion” philosophique impose une question inédite et singulière qui ne saurait être codifiée à la façon des sujets d’histoire (“Le Japon à l’ère de Meiji”) ou des sciences naturelles (“La structure de la cellule”). L’ambiguïté est la marque d’une discipline d’autant plus légitime intellectuellement qu’elle détient une sorte de monopole institutionnel des questions insondables.” (Louis Pinto, “L’école des philosophes… “, Actes de la recherche en science sociale, n° 47/48, p. 25). Or le fait de la pré-correction toujours présente, avec la consommation des Sujets du bac et autres, réduit effectivement le dévoilement à la question de cours. La philosophie sert à produire des dissertations au point que certains informaticiens peuvent s’amuser à programmer un générateur de textes philosophiques (“Philosophia”, Soft et Micro, n° 5, février 1985). Formalisation humaine et explicitation Argumentant contre le formalisme, le réductionnisme qu’opère la phénoménologie est pour le coup une négation de l’authentique réalité (et simplicité) humaines de ces formalismes classificatoires (Dreyfus, p. 346). Nous l’avons vu, les encyclopédies, les catégories, les étiquettes, etc., existent bel et bien pour organiser l’existence et l’action humaines. C’est d’ailleurs à de telles catégorisations que se livre Dreyfus lui-même, quand il distingue quatre types de problèmes comme limites de l’informatisation traditionnelle (Dreyfus, p. 379). Il est certain qu’une distinction de ce genre peut permettre d’éclaircir certains problèmes. Et elle constitue précisément une connaissance à intégrer comme telle à une stratégie de résolution de problèmes. L’action humaine elle-même s’organise effectivement selon les découpages ou les conceptualisations, implicites ou explicites. Tout comportement distinct constitue également une formalisation (en tant que découpage du monde par l’action). Cette décomposition, même apparemment non formelle, est équivalente à un algorithme, ou à des heuristiques, quand il existe trop de variantes. Car l’intérêt de cette décomposition est justement de permettre une activité discursive. C’est du reste le principe explicatif — de réduction à des principes élémentaires — qui caractérise tout discours scientifique. Le refus de l’analyse est simplement un effet de l’incompétence. Même dans le symbolisme, un mythe doit posséder une valeur explicative. Et un système mythologique devrait en principe être cohérent. Les grandes religions peuvent également être considérées comme des efforts de coordination d’explications parcellaires. En définitive, un symboliste ne doit pas pouvoir, en droit, dire n’importe quoi, même s’il dit, en fait, tout et le contraire de tout. Une telle décomposition est inversement une caractéristique de l’empirisme/nominalisme, qui considère tout concept comme un ensemble structuré de propriétés élémentaires. Et de nombreux travaux de philosophes néo-idéalistes consistent simplement à essayer de masquer cette banalité de base dans leur conception de la sémantique (ce que rappelle U. Eco). Cette décomposition remonte à la Grèce antique, et résume bien toute la pensée occidentale, en ce qu’elle a de spécifique comme expérience culturelle — qui en vaut bien une autre en droit, mais vaut effectivement mieux en fait [NOTE 114]. Calcul syntaxique La question classique de la philosophie, “la pensée est-elle réductible à un calcul ?”, prend avec l’informatique et l’IA une forme pragmatique immédiate. Weizenbaum (p. 10) est choqué par cette possibilité. Mais la compétence philosophique de gestion des références historiques d’autres adversaires de l’IA, leur permet de rappeler les étapes de cette problématique de calculabilité. Tout au moins les étapes explicites, car évidemment, la philosophie dans son ensemble procède de cette réalité : ““Lorsqu’un individu raisonne, il ne fait rien d’autre que concevoir la résultante d’opérations parcellaires” écrit [Hobbes], “car le RAISONNEMENT n’est rien d’autre qu’un calcul[NOTE 115]”.” (Dreyfus, p. 5, c’est lui qui souligne). “De même qu’Hobbes, Boole partait du principe que le raisonnement est un calcul, et il s’employa a “explorer les lois fondamentales de ces opérations de l’esprit par lesquelles progresse le raisonnement, afin de les exprimer par le langage symbolique d’un calcul[NOTE 116]”.” (Dreyfus, p. 7). Nier que la pensée soit un calcul pourrait à la rigueur être compréhensible, quoique discutable sur le principe d’une acceptation simultanée du sens commun. Mais le raisonnement (s’il est distinct de la pensée) est bien un calcul, qui se caractérise justement par les définitions données par Hobbes et Boole, et par la formulation magistrale de Leibniz, rappelée par la même érudition : ““Si quelqu’un venait à douter de mes résultats”, écrivait Leibniz, “je lui dirais : “Monsieur, calculons cela ensemble” ; et de la sorte, à l’aide d’une plume et d’un encrier, nous réglerions la question[NOTE 117]”.” (Dreyfus, p. 6). Que le raisonnement soit un calcul relève en fait de la capacité d’explication, à autrui, ou à soi-même. Il existe une identité formelle entre les problèmes de la connaissance formelle ou calculante (ou cybernétique, mécanique, l’IA, etc.) et ceux de la connaissance humaine ou commune (ou phénoménologique, littéraire, etc.). Et cette identité peut réduire la seconde à la première, qui en constitue précisément une représentation formelle. De ce point de vue, le langage naturel (LN) n’est pas moins formel qu’un langage mathématique ou logique [NOTE 118], qui en constitue simplement un équivalent non ambigu, mais incomplet. L’argument de l’inhumanisation n’est que rhétorique. Car la tradition philosophique pose la déduction parfaite comme l’idéal à réaliser (la pratique juridique aussi). C’est, dans l’exemple littéraire canonique, ce qui oppose le docteur Watson à Sherlock Holmes. De même dans la science, le but de tout raisonnement n’est-il pas une exécution parfaitement reproductible ? Mais évidemment, il est possible de considérer que ces moments d’automaticité ne caractérisent pas “les êtres humains [qui], si on les considère comme des machines, sont de machines d’un usage très universel.” (Weizenbaum, p. 122). La contradiction est alors double : concernant l’informatique, car l’universalité est justement ce en quoi consiste la nouveauté de l’informatique. Les machines universelles (de Turing) sont simplement opposable aux machines dédiées à une tache particulière (comme le programme d’un ascenseur). L’ordinateur, en tant que machine universelle, est précisément le modèle de l’universalité de l’esprit, de sa polyvalence. Le fait de charger des programmes divers et de pouvoir les modifier correspond au fait qu’un être humain peut jouer au tennis, conduire une voiture, effectuer des calculs, etc. Dans les deux cas, cela suppose qu’on puisse distinguer les compétences, et les acquérir indépendamment, sans en conditionner la qualité d’humain. La seule restriction à l’universalité concerne plutôt l’humain : chaque individu est souvent spécialisé, pour les domaines où il peut se targuer de dépasser l’ordinateur (et les autres individus d’ailleurs, comme les grands maîtres aux échecs !). Alors que chaque ordinateur individuel est potentiellement universel immédiatement (sous réserve de charger le bon programme, ou d’en combiner simultanément plusieurs). Cette possibilité de mécanisation des performances intellectuelles peut encore se manifester dans la situation évoquée précédemment (voir le paragraphe Délire holiste). Il ne s’agit donc pas d’ironiser sur la prédiction de Dreyfus [NOTE 119], mais de s’interroger sur sa capacité de compréhension de la classe d’un problème. La façon pour l’ordinateur de résoudre ce problème d’analogie, qui consiste à trouver la figure suivante d’un test de QI, est justement la manière dont les humains résolvent ces problèmes. Ce qui est d’ailleurs normal puisque ces tests ont été conçus pour ce type de résolution. Pour nier la calculabilité, le mentalisme postule alors une conception holographique de la sémantique. Il faudrait que le signifié (sens) se cache dans les plus petites parcelles possibles des signifiants (signes). On reconnaît ici l’ambition symboliste, ou freudienne. Cette exigence porte même sur les éléments quantitatifs : “Si j’ajoute 6 à 3, la machine (calculette) ne sait pas que le numéral 6 signifie le nombre 6, […] et que le signe plus signifie l’opération d’addition. Cela pour la bonne raison qu’en fait, elle ne sait rien.” (Searle, p. 67). Pourtant, le fait est que la machine sait — possède la compétence de — faire des opérations. Quand l’humain ajoute deux nombres, il applique lui aussi des règles syntaxiques. C’est même un bon exemple de la situation ou l’on peut appliquer des règles sans les comprendre. Dans ces opérations, seules les fautes montrent qu’on n’a pas tout compris (ou qu’on est distrait). Leibniz encore, pour nous dire que nous appliquons des opérations syntaxiques, établit que dans le cas des opérations sur les grands nombres, nous appliquons les règles justement sans en concevoir une représentation réaliste. Il démontre ainsi l’idée d’une “pensée aveugle” (cf. Eco, La recherche de la langue parfaite, pp. 319-320), guidée précisément par les formalismes, qui justifie son projet de langue philosophique. En fait, c’est la pensée perçue comme une boîte noire, qui, comme pour les tables d’opérations, est simplement constituée par l’acquisition d’automatismes. Ce sont ces automatismes qu’on peut analyser pour les transposer dans les ordinateurs (par un moyen ou un autre, puisque le calcul binaire est différent du calcul décimal). Finalement, si on quitte le cadre du présupposé philosophique du tout ou rien, une conception minimale de la pensée comme calcul, en vertu du principe d’une science faible, peut consister déjà à calculer ce qui est calculable. Cette approche plus réaliste signifie bien une possibilité de décomposition en étapes qui manifestent la possibilité de cumul. On peut reconnaître ce pragmatisme chez les partisans de l’IA, contre la norme de fausse modestie académique. Weizenbaum manifeste d’ailleurs une indulgence étrange vis-à-vis des capacités génératives d’une grammaire universelle qui préfigure pourtant le projet général de l’IA, contre son mépris pour les ambitions déclarées de Simon et Newell à propos de l’extension progressive des compétences de l’IA “jusqu’à ce que […] l’étendue des problèmes [qu’elle pourra] traiter soit coextensive à celle accessible à l’esprit humain”.(Weizenbaum, p. 92). Contrairement à son ironie, cette correspondance est effectivement déjà le cas pour les opérations algorithmiques, qui sont bien des aptitudes de l’esprit humain. Et si l’aptitude des machines doit se développer, c’est qu’elle n’est pas perçue comme absolue — bien qu’il n’y ait pas de raison de supposer qu’elle soit bornée par celle de l’esprit humain. En effet, les connaissances de sens commun comprennent aussi, aujourd’hui, les connaissances arithmétiques simples, au minimum. Ce ne sont pas non plus des connaissances innées, spécialement du fait de l’adoption tardive du système décimal ou de la numération arabe, qui seuls permettent l’usage des tables que nous connaissons. Cela nous renvoie également à l’histoire de la machine à calculer. Elle permet de nous rappeler que le calcul dans le système binaire, ou les possibilités de calcul de la machine ne sont pas moins artificiels, ni mécaniques, qu’un calcul décimal soudainement humanisé ! Face à la machine à calculer de Pascal, ou celle de Leibniz, il faut relire les impressions de l’époque pour apprécier le travail effectué : “Que l’on puisse donner une telle compétence à une machine, au sens où nous l’entendons, semblait alors un peu surnaturel. C’est ainsi que la sœur de Pascal […] écrivait que “l’esprit avait été en quelque sorte capturé par la machine” car “il était possible d’exécuter sans erreur toutes sortes de calculs, chose extraordinaire sans crayons, mais, bien plus, sans même connaître l’arithmétique”. Cette réflexion de la sœur de Pascal est vraisemblablement l’une des premières faites sur le problème connu aujourd’hui sous le nom d’intelligence artificielle. […].” (René Moreau, Ainsi naquit l’informatique, p. 13). Cela constitue une assez bonne réponse à l’interrogation sur l’intelligence d’une calculette, d’une pendule, d’un programme de comptabilité ou d’un traitement de texte (Winograd & Flores, pp. 36, 150, 265). On voit justement que la capacité arithmétique de la machine se fonde sur la mécanisation des règles de calcul, alors qu’on croyait jadis cette compétence propre au seul esprit humain. C’est ainsi qu’on peut relativiser l’idée d’intelligence à chaque étape au lieu de ne la réserver qu’aux Pic de la Mirandole ou aux polytechniciens, tout en méprisant d’ailleurs la pluridisciplinarité. Faut-il voir dans les illusions phénoménologiques une réminiscence des diabolisations anti-nouveauté ? Car on a oublié celles concernant la même machine à calculer : “Et c’est ainsi également que l’inquisition poursuivit la mère de Leibniz qu’elle accusait d’avoir copulé avec le diable car, sinon, comment aurait-elle eu un fils s’intéressant à de telles réalisations.” (René Moreau, Ainsi naquit l’informatique, p. 13). Relativisme calculateur Les critiques anti-IA peuvent concerner validement l’observation que peu de gens raisonnent correctement, ou même que peu de gens se servent du raisonnement pour agir. Le but de l’intelligence concrète est plutôt d’acquérir des automatismes. La décomposition calculante la plus simple est souvent remise en cause dans la vie courante, où les calculs n’exploitent pas les acquis scolaires. Il faut dire qu’ils sont parfois oubliés, comme pour la lecture quand on ne la pratique pas quotidiennement. Un parfait exemple de non-application de règles, pourtant connues ou mobilisables, est notoirement celui des connaissances mathématiques. Cet oubli de l’être mathématique permet d’ailleurs d’accueillir facilement la dévalorisation du calcul, à la source de la démagogie anti-IA. Sur ce principe de perte de compétences acquises, j’ai eu personnellement l’écho d’une contestation de somme d’heures de travail, fondée sur la difficulté relative, la non-évidence, du calcul en base soixante. Il s’agissait d’un total de 3 h 45 + 3 h 30 + 3 h 45 qui n’est pas équivalent à 10 h 20 : (3,45 + 3,30 + 3,45), mais à 11 h, (9 h + 120 minutes). L’intérêt est ici que la méthode de calcul est disponible, en principe, mais entre en conflit avec l’habitude intuitive, prégnante, du calcul en base décimale. Dans le cadre du débat sur le relativisme, il est d’ailleurs intéressant de constater que, durant l’argumentation, il a été fait la remarque que le calcul correct (sexagésimal) était une drôle de façon de calculer. Ce qui sous-entendait en l’occurrence qu’il pouvait s’agir d’une habitude étrangère — du fait de l’appartenance de l’employée à une culture fortement exotique. Sur le plan purement cognitif, cet épisode illustre aussi la difficulté à expliquer, précisément quand on ne décompose pas les opérations. L’employée avait d’abord fait l’erreur elle-même, mais avait corrigé rapidement. Ce qui avait suscité une certaine méfiance, et une préférence explicite pour le calcul précédent, plus intuitif. Mais un problème est aussi ici l’incapacité à adopter une stratégie neutre pour résoudre un problème, spécialement quand un intérêt (même limité à 40 minutes) est en jeu. Dans une perspective socio-politique, il est amusant de noter que l’épouse de l’employeur, et une amie présente, commettent l’erreur contre l’employée (étudiante en l’occurrence). L’autorité extérieure du mari, consulté par téléphone, s’étant d’ailleurs révélée, elle-aussi, impuissante à trancher. Plutôt qu’une interprétation marxiste en terme de défense réciproque d’intérêt de classe, je préfère raisonner ici en terme de hiérarchie de compétences, en l’espèce sous la forme d’une inversion des statuts [NOTE 120]. Dans l’état social actuel, la hiérarchie des compétences est bouleversée, contre les conventions littéraires de référence (Le bourgeois gentilhomme, Bouvard et Pécuchet,…). Ce qui peut se lire comme une déficience de la structure de rétributions sociales, et une résurgence d’une société de castes. Un autre exemple relativiste : bizarrement, la question de la pensée comme calcul est, en fait, déjà résolue par certaines acceptions locales. Dans le sud de la France, en langage populaire, l’emploi de calculer était traditionnellement fréquent pour ce qui en français standard se dit penser ou réfléchir. On peut (ou on pouvait, il y a peu) rencontrer couramment des formulations comme : “Attendez, je calcule”, etc. Il est donc possible de considérer que le problème se pose aussi comme une simple question de différences culturelles. On pourra toujours penser que les méridionaux sont des sous-développés, ou que l’expression populaire est métaphorique, et mépriser cette objection. En tout cas, il faudra abandonner la simultanéité de la référence au relativisme culturel, de type Sapir-Whorf, si on ne veut pas essayer de résoudre ce problème. Il restera à expliquer le fait culturel que certains peuples semblent trouver naturel de calculer, alors que d’autres semblent voir dans la pensée un phénomène mystérieux, voire magique. Ce qui semble inverser le sous-développement, ou signifier que le rejet chrétien ou socialiste de la monnaie est trop bien assimilé en philosophie. Il faudrait peut-être réinterroger cette tradition ! Les peuples non-occidentaux (ou quelques poches de résistance) savent qu’ils calculent. Contrairement à ce que croient les sociologues dits anti-utilitaristes, les acteurs sociaux comptent tout ce qu’ils peuvent compter. De plus, en termes philosophiques, si les mots calculer et pensée sont ostensifs (descriptifs), la proposition “la pensée est un calcul” est recevable comme explication. Alors que toute recherche sur le terme penser, spécialement en terme d’étymologie, est inutile, ou risible. Rappelons que les jeux de mots heideggerro-lacaniens fondés sur la morphologie prétendent justement à une valeur sémantique. Le fait que cette valeur étymologique ou symboliste ne soit justement pas disponible pour les locuteurs enlève beaucoup de pertinence à cette sémantique morphologique (et évidemment, qui plus est, à l’intentionnalité). Il s’agit simplement de résidus archaïques que le langage charrie, et dont la possible valeur sémantique peut effectivement présenter un intérêt, mais d’une productivité très variée. D’ailleurs, le travail des philosophes lacaniens eux-mêmes, qui s’apparente à une analyse symbolique, peut être considéré comme un calcul. Et la pathologie correspondante est justement un abus de calcul symboliste de la part du malade — ou du thérapeute à force de reproduction. On peut ainsi simuler la formation de jeux de mots lacaniens ou heideggeriens, ou simplement humoristiques. L’étymologisme permettrait de renvoyer aux littéraires, ou aux psychanalystes subjectivistes, l’insulte de mécanisme. Cette simulation du comportement littéraire ou pathologique nous permet de considérer la normalité cognitive comme l’acquisition de mécanismes de contrôle (et non comme la combinatoire étymologique spontanée). L’obstacle de l’ambiguïté Le poncif linguistique des ambiguïtés du langage humain est devenu évidemment un des thèmes favoris des adversaires de l’IA. Le terme ambiguïté désigne le plus souvent, pour la linguistique automatique (qui travaille quasi exclusivement sur le mot, ou sur la phrase), une simple polysémie. Pourtant, cette situation suppose simplement, pour la machine, le choix d’un sens parmi ceux disponibles. On rencontre le même problème pour l’analyse de mots nouveaux. Mais, les difficultés sont perçues en terme d’impossibilité ontologique : “La machine, quand elle rencontre une expression nouvelle, n’a que deux possibilités : ou bien elle traite l’expression en question comme un cas sans problème auquel s’applique les règles en vigueur, ou bien elle y va à l’aveuglette. Alors qu’un auditeur, dans sa langue maternelle, dispose d’une troisième voie : il peut reconnaître l’expression comme bizarre, échappant aux règles et cependant en démêler le sens il va lui assigner un sens selon le contexte vivant dans lequel elle se situe, et cela, apparemment, sans se référer à des règles, mais sans davantage s’en remettre au hasard.” (Dreyfus, p. 252). On voit ici la caractéristique magique du contexte [NOTE 121] (vivant qui plus est !). Or, comme dans l’exemple précédent, l’humain va faire la même chose que la machine et pour la même raison. Ce que Dreyfus appelle ici le contexte sera simplement traité comme des indices. On ne peut comprendre un énoncé que quand les indices sont suffisants. Une absence d’indices signifierait que la syntaxe et les mots ne signifient rien. Il est vrai que c’est ici une conception de poètes [NOTE 122]. D’où ici un indice sérieux pour corroborer le soupçon de parapsychologie. D’ailleurs, même si quelque chose comme l’intuition, ou même la transmission de pensée, existent, le moyen de les établir serait fondé sur des indices. Cette tendance à se fonder sur l’ambiguïté, ou à produire une infinité de sens, relève sans doute de la sur-interprétation. Umberto Eco, brûlant ce qu’il a naguère encouragé chez certains (qu’il traite aujourd’hui de fous), la récuse aujourd’hui — tout espoir en l’être humain n’est donc pas perdu. Une autre évocation de l’infini semble être l’affirmation de liens, constituant un immense réseau sémantique, entre tous les concepts possibles. Cela revient-il à nier toute analyse ? Il est bien évident que tout peut être relié avec tout, au moins en terme de classifications générales, comme les classifications typiques d’êtres vivants par exemple (ou par des liens, classiques en IA ou dans les bases de données, comme : partie de, ou sous ensemble de, etc.). Mais il est tout aussi évident que les types de liens sont différents, et ne possèdent pas les mêmes propriétés. Les liens ci-dessus sont orientés et non symétriques (tous les félins sont de mammifères, mais tous les mammifères ne sont pas des félins), alors que d’autres le seront. Analyse automatique du langage Comment l’analyse automatique fonctionne-t-elle concrètement ? Contrairement aux contraintes philosophiques, acceptées par certains linguistes, la levée des ambiguïtés est possible par n’importe quel moyen. On ne voit pas au nom de quelle théorie sémantique, sinon celle d’une secte linguistique quelconque, on pourrait décréter que : “la théorie centrale de la signification (sémantique) ne s’intéresse qu’au sens littéral des mots et des propositions, en tant qu’ils sont indépendants du contexte.” (Winograd & Flores, p. 47). Le problème des ambiguïtés, comme bien d’autres évoqués ici, est assumé par la recherche en IA. Chaque solution partielle à la levée d’une ambiguïté peut être considérée comme un pas vers une bonne modélisation du problème. Il est vrai que la tâche semble difficile si on en croit les exemples canoniques. Certains, comme “La petite brise la glace”, comportent ainsi une ambiguïté (polysémie) sur chaque mot : la : déterminant (article)/pronom. Chaque ambiguïté lexicale est levée, en principe, par un moyen formel parfaitement connu. On peut utiliser la syntaxe, la sémantique, la valence (nombre de compléments de certains verbes),… ou tout simplement demander à l’émetteur de l’énoncé, comme nous l’avons vu. Habituellement, en linguistique, la syntaxe est la plus utilisée. Il lui suffit d’analyser les types de phrases possibles, comme par exemple, avec les schémas chomskyens classiques : phrase = groupe nominal + groupe verbal Le résultat est effectivement ici une belle ambiguïté, parfaitement analysable automatiquement, mais impossible à lever en l’état : La petite [fille] brise la glace (Det+Nom+V+Det+Nom) Dans de tels exemples, comme le disent les adversaires de l’analyse automatique, le choix dépend du contexte. Mais cela n’exclut pas, comme on l’a vu, la possibilité d’analyse formelle, contrairement aux affirmations sur l’intuition, devenues familières (Dreyfus, p. 62). Car précisément, comme dans l’exemple précédent, cette situation d’ambiguïté est parfaitement équivalente pour l’être humain et la machine ! Il est même possible de limiter les ambitions de décodage aux besoins, sans viser la compréhension totale. C’est déjà réalisé dans l’interrogation en langage naturel de bases de données comme le rappellent Winograd & Flores (p. 201). Sans les préjugés intentionnalistes, on pourrait y reconnaître une utilisation du langage naturel orientée par une visée. Ce qui tranche de la pertinence d’une telle pratique est évidemment l’efficacité du système. Car en fin de compte, même si le système automatique bute sur des ambiguïtés — ce qui ne le différencie pas de l’être humain —, ses performances se définissent par le taux de réussite. On peut aussi améliorer les performances de la machine (ou de l’humain) par un pré-traitement. Il en est ainsi des nombreuses virgules, dans le texte de Dreyfus, qui facilitent le décodage, et rendent plus agréables la lecture, des phrases longues en particulier (indépendamment du contenu) ! Selon le principe industriel, nous pouvons évaluer l’analyse d’une phrase comme “la petite brise la glace” (pour un seul des sens considérés en référence à l’intention originale). Il suffit de se livrer à une substitution pour voir que le problème des ambiguïtés est relatif. Un analyseur automatique (ou humain) comprendrait donc bien “la petite [fille] brise la… (vitre, porcelaine, pile d’assiettes, etc.)” ; ou “la petite… (mange, porte, fait fondre, etc.) la glace” ; ou “la… (plaisanterie, déflagration, maladresse, etc.) brise la glace”. On s’aperçoit alors qu’il ne pourrait pas décider dans le seul cas initial (ou même plusieurs). Transformer une simple circonstance statistique en preuve ontologique s’appelle, en philosophie classique, le sophisme de l’accident. En tout état de cause, la raison élémentaire de cette réussite imprévisible est que le contexte signifie tout simplement ce qui précède ou de ce qui suit. Les limites traditionnelles de la phrase ne constituent pas un obstacle logique ou formel. Les mêmes auteurs reconnaissent d’ailleurs cette possibilité et son efficacité dans des cas concrets : “ En gardant un enregistrement de la conversation, SHRDLU pouvait la plupart du temps déterminer la référence d’une expression.” (Winograd & Flores, p. 174). Mais ils préfèrent sans doute conserver, comme Dreyfus, l’idée magique ou télépathique d’un insaisissable contexte global. La remarque initiale de Dreyfus sur l’absence de l’obstacle des ambiguïtés était donc plus correcte : “La grande majorité des ambiguïtés que l’on peut concevoir dans l’abstrait ne se présentent tout simplement pas.” (Dreyfus, p. 61). Il s’agit ici d’un argument décisif contre les jeux formels des linguistes. Mais cette lucidité dreyfusienne consiste simplement à déplacer le problème de l’humain à l’ordinateur. Or il est bien évident que cet ostracisme ne correspond à rien dans la réalité, puisque les linguistes utilisent déjà la question des ambiguïtés à propos de la communication humaine ! Au contraire, l’intérêt de la formalisation est de permettre de constater les règles nécessaires à l’humain pour expliquer sa compréhension. Et de ce point de vue, la formalisation ou de la mécanisation est bien équivalente aux catégories cognitives nécessaires. (D’une façon générale, ce qui est présenté comme une impossibilité peut être considéré plutôt comme l’état des connaissances sur la question pour l’humain ou pour la machine.) Ambiguïtés et communication Simultanément à cette apologie de l’ambiguïté, la simplicité mentaliste croit expliquer la communication (qu’elle nie simultanément d’ailleurs), en constatant la compréhension. Et cette ingénuité oublie, ou semblent même aller jusqu’à nier, les incompréhensions et les conflits d’interprétation entre les êtres humains (Dreyfus, p. 252). La possibilité de leur rectification en temps réel (de tolérance de pannes) passe un peu vite sur la possibilité de malentendus tout aussi réels (évoqués d’ailleurs par Weizenbaum, pp. 164-165). Les cas où cette tolérance existe se fondent au contraire plutôt sur l’identification de la faute, et renvoient précisément à la maîtrise de la règle. C’est même la catégorie de l’erreur qui permet, en situation, de définir la règle : une erreur inaperçue est une variante. Dreyfus néglige évidemment le fait que pour un natif ces corrections explicites ont déjà eu lieu dans l’enfance. C’est à rapprocher de ses rétractations à propos des champions d’échecs qui subissent bien un long entraînement. On peut même avancer que les fautes commises en situation, et non corrigées, doivent être considérées plutôt comme hors contexte d’apprentissage. Ce phénomène peut caractériser la connaissance des marqueurs culturels (accents régionaux ou étrangers), ou des indicateurs de statuts sociaux. Dans la conversation avec un étranger, on constate ainsi les différentes attitudes : a) Soit on laisse parler sans corriger. Ce qui, si la faute est importante, est une preuve de non coopération ! Il existe une blague sur ce thème, où un Français enseigne volontairement des erreurs à un Allemand pendant l’occupation. Et plus généralement, les erreurs de ce genre sont connues pour prêter à sourire. b) Soit on corrige sans cesse en gênant l’exposition du discours, et en niant même le contenu pour la seule obsession de la forme [NOTE 124]. Ce qui est évidemment ridicule quand les fautes sont mineures, le contenu important, ou sa négation uniquement polémique. La critique de la forme pour s’opposer au contenu est également un procédé rhétorique traditionnel. c) Soit on dose ses interventions en fonction du contexte ou des interlocuteurs. L’idéal étant une correction des seules erreurs qui peuvent constituer un contresens. On résout ainsi pragmatiquement le problème du relativisme, par le fait qu’on ne se place pas ainsi en position de dominance, mais comme possesseur d’une partie de l’information. Car, en l’absence de toute intervention, non seulement pour des étrangers mais aussi pour les natifs entre eux après tout, on aboutirait rapidement à une sorte de babélisation. On peut imaginer que ce phénomène de confrontation relativiste est fréquent aux USA, au moins par la présence de vagues d’immigrants et de l’apartheid communautaire. L’indicateur linguistique y est le signe de la date d’arrivée (outre celui du don personnel pour les langues étrangères), ou de l’appartenance communautaire. Dans des cas de ce genre, le relativisme est assumé par les locuteurs, et exalté éventuellement par les théories identitaires. Mais on peut dire que l’abandon du melting-pot pour le salad-bowl confond la description de l’état particulariste actuel, forcément transitoire, avec les anticipations de l’état universaliste ultime, effectivement irréel, mais pas forcément inaccessible. Cette stratégie pseudo-réaliste peut paraître méthodologiquement orthodoxe, mais peut se révéler à courte vue [NOTE 125]. La leçon à tirer, de ces expériences humaines ou automatiques de communication et de traduction, est qu’il suffit d’interpréter tout signal d’ambiguïté : soit en fonction du contexte linguistique, opération mécanisable par un arbre de décision (ou bien/ou bien) soit par les impossibilités sémantiques fondés sur la connaissance des propriétés des objets, comme le suggère Dreyfus lui-même (paragraphe ci-dessous). Et cette reconnaissance de la possibilité de la définition des propriétés du réel récuse au passage sa conception mythique du contexte. On ne peut s’empêcher de penser ici que les fameux présupposés ou contextes sont simplement équivalents à la lente accumulation de connaissances, et de leur parfaite définition. Il n’y a donc pas de différence avec les lois physiques. Ce sont ces étages successifs qui permettent, entre autres, le décollage des fusées (cf. Dreyfus, p. 255). De plus, contrairement à l’idéalisation de l’ineffable, une solution en terme de communication peut aussi consister à proposer qu’un texte qui contiendrait des ambiguïtés ne devrait pas être considéré comme légal : une ambiguïté est assimilable à une erreur. Cette hypothèse remet à sa juste place les nombreux et laborieux exemples qui semblent troubler beaucoup les linguistes. Une ambiguïté est alors une faute stylistique, comme certaines répétitions, ou comme certains effets indésirables de juxtaposition qui doivent être contrôlés, et volontaires (si on veut faire un jeu de mot). Au cours de l’analyse, il suffirait, selon l’usage en vigueur dans la linguistique pour le cas des phrases agrammaticales, d’ajouter une étoile (*) avant les phrases concernées par divers types d’ambiguïtés : * Les poules du couvent couvent. Dans ces exemples canoniques, le principe de compréhension lui-même est assimilable au décryptage, à la réduction de la dissonance cognitive. D’ailleurs, le fait que Dreyfus et consorts se fondent essentiellement sur ces ambiguïtés rabaisse contradictoirement leur thèse à une théorie du signal. Le problème de l’ambiguïté est simplement équivalent au bruit de la théorie de l’information. Avec décidément beaucoup d’indulgence, on pourrait limiter leur modèle, dans le meilleurs des cas, à la seule littérature (pour l’écrit), ou aux arts en général. Car ces domaines se fondent souvent essentiellement sur un jeu avec les limites de la perception de l’information (comme la perspective ou le trompe l’œil). Ce qui justifie effectivement la référence gestaltiste, qui définit aussi cette perception par des schémas globaux et stéréotypés. Mais l’erreur de cette position réside précisément dans le fait que la littérature ou les arts procèdent, normalement, par contrôle de ces ambiguïtés pour renforcer le sens. Ils procèdent par des assonances, des ornements stylistiques ou symboliques, par surcodage (hermétisme), par des juxtapositions perturbantes (spécialement depuis la rencontre d’objets hétéroclites sur une table de dissection chez les surréalistes), ou par confusion (contrepèteries, ellipses, non-sens) — à condition cependant que certaines options demeurent marginales, sous peine de perte totale de communication (cryptisme, solipsisme, folie littéraire), ou justement de clichés nouveaux (cf. Les kenningars de Borges). Traduction et trahison automatiques Le poncif linguistique de la glose sur l’ambiguïté règne aussi à plus forte raison dans le petit monde de la traduction littéraire. On connaît bien sûr le cliché “traduttore traditore”, qui cumule le lacanisme, le soupçon contre la cinquième colonne cosmopolite, et l’hypothèse Sapir-Whorf d’incommensurabilité culturelle. On connaît également, bien sûr, certaines des limites de la traduction automatique (TA), d’origine plus ou moins poétiques, comme “The spirit is strong, but the flesh is weak” (l’esprit est fort, mais la chair est faible), traduit par : “L’alcool est fort, mais la viande est pourrie”, à l’époque de ses débuts. Dreyfus rappelle un autre épisode canonique de cette opposition à la traduction automatique chez Bar-Hillel : “Soit une phrase de ce genre : The box was in the pen. […] Ce que j’affirme, c’est qu’aucun programme, existant ou imaginable, ne peut permettre à un ordinateur de déterminer d’emblée que le mot pen, dans la phrase donnée, dans le contexte donné, ne peut avoir que le second sens [parc à bébé], alors que n’importe quel lecteur sachant suffisamment d’anglais le fera “automatiquement[NOTE 126]”.” (Dreyfus, p. 273). On remarque, encore une fois, que l’ineffable traditionnel saute ainsi d’une impossibilité de la traduction humaine elle-même, à une possibilité de traduction comme caractéristique exclusivement humaine, sans aucune transition (sans pour autant récuser ou abandonner les paradigmes caducs) ! En fait, le problème se posait pour le cas d’un traitement des ambiguïtés qui se fondait uniquement sur le mot à mot, ou sur l’approche syntaxique, à la mode à l’époque. Et l’erreur dérisoire de Bar-Hillel (linguiste confirmé, auteur du rapport ayant entraîné la chute des investissements en traduction automatique), c’est qu’il n’existe justement pas d’ambiguïté, puisqu’un des deux sens est impossible ! Le problème est simplement la capacité du programme à éliminer la polysémie. Pour cela, il n’est pas nécessaire à Dreyfus, d’imaginer des hypothèses abracadabrantes, contrairement à son habitude. Il rend compte de la proposition de Minsky qui signale l’erreur du linguiste, sans être pourtant spécialiste (ou précisément parce qu’il n’est pas prisonnier des schémas disciplinaires en question) : “Sans doute serait-il une bonne idée que d’incorporer, dans le modèle sémantique, suffisamment de données géométriques simples pour rendre improbable l’hypothèse de la boîte dans le stylo. “ [NOTE 127] (Dreyfus, p. 274). Il était aussi facile de dénigrer le simplisme de la première étape de la traduction automatique. Elle n’aurait jamais commencé si elle ne se fondait pas pragmatiquement sur un certain taux de réussite. Nous avons vu qu’un tel taux caractérise les approches industrielles, fonctionnant en terme d’approximations ou de rendement, contre les approches philosophiques, exigeant l’absolu. Mais cette incompréhension philosophique se fonde aussi sur une conception mystique de la pragmatique, où nous ne levons pas les ambiguïtés par le recours à des faits, mais parce que nous “habitons le langage”, dans la tradition heideggerienne, via Polanyi (Dreyfus, p. 325). Ce qui entre en contradiction avec la possibilité de définition des propriétés des objets (voir le pen / parc à bébé, ci-dessus). Il est aussi facile de comprendre, sans doute trop pour les linguistes, qu’on apprend une langue en augmentant le nombre de mots nouveaux, ou comme ici d’acceptions nouvelles. La plupart des lecteurs qui parlent l’anglais seconde langue ignoraient sans doute celle de pen/parc à bébé, contrairement à ce que croit Dreyfus, fidèle à sa surestimation de l’humain. Et bien qu’ils aient certainement habité dans un de ces parcs, il auraient dû chercher le mot dans un dictionnaire. Sémantique, syntaxe, conscience et théologie La position des adversaires de l’IA culmine, à travers les oppositions diverses à la formalisation et à l’analyse, dans la distinction ontologique de la sémantique et de la syntaxe. Cette conception est d’ailleurs peu orthodoxe quand elle déclare que les “les symboles [digitaux] n’ont pas de signification, pas de contenu sémantique” (Searle, p. 40). Car il est pourtant connu que la linguistique soutient la généralité de l’arbitraire du signe. Tout se résume plutôt à une pétition de principe, insistante, qui se croit définitive : “En un mot, l’esprit, en plus de la syntaxe, a une sémantique. La raison pour laquelle un programme d’ordinateur ne sera jamais pareil à un esprit est tout simplement que le programme est purement syntaxique, tandis que l’esprit a quelque chose en plus. L’esprit est sémantique, au sens où, en plus de sa structure formelle, il a un contenu.” (Searle, p. 42). En fait, cette question de l’opposition entre sémantique et syntaxe, identifiée à l’opposition entre humain et machine, constitue un archaïsme théologique. Elle récupère avec retard le cartésianisme — ce qui est d’ailleurs bien imprudent hors du contexte de son temps. Cette opposition du fond et de la forme est bien équivalente au dualisme traditionnel (âme/corps) où le sémantique est un plus irréductible à la forme. Cet archaïsme antique (Aristote, St-Thomas, Descartes), ou la problématique chrétienne de l’informaticien Arsac (in Dreyfus, p. 415), pose la question de l’émergence du sens, qui se manifeste toujours selon Searle en termes ontologiques : “La syntaxe seule ne suffit pas à produire une sémantique, et les ordinateurs n’ont, par définition, qu’une syntaxe.” (Searle, p. 45). Remarquons au passage que l’ontologie n’exclut pas la surenchère contradictoire ou inconséquente, quelques pages plus loin : “L’ordinateur, là où l’homme suit des règles syntaxiques, ne suit aucune règle, il ne fait que suivre des procédures formelles.” (Searle, p. 66). Où l’on voit, dans ces deux citations, que les termes “règles syntaxiques” sont alternativement employés péjorativement ou non, et qu’ils peuvent être encore plus dévalorisants sous la forme de l’expression définitive “procédures formelles”. Contrairement au glissement de sens du terme communication vers plus d’implicite, bizarrement considéré comme plus sémantique, il est possible d’affirmer que le sens est la connaissance qu’on arrête, pas celle qui manque. En vertu de ce principe, si une machine — ou un humain — ne comprend pas, c’est qu’elle (ou il) ne sait pas formaliser, c’est à dire expliquer. La science des êtres humains est explicitation et non implicitation. Et cette explicitation a lieu par le dialogue. La conséquence, pour ceux qui s’inquiètent de la différence entre syntaxe et sémantique (comme l’informaticien Jacques Arsac, in Dreyfus entre autres) est évidemment la possibilité de la tartufferie. Mais qu’on se rassure, même si la machine ne fait que ce qu’on lui dit, il suffit de la programmer pour mentir. Et si elle peut posséder une autonomie, elle apprendra bien toute seule. Cependant, nous pouvons comprendre cette angoisse métaphysique, de Searle à Arsac [NOTE 128]. En effet, en plus du pur calcul, les ordinateurs peuvent déjà se livrer à la manipulation de symboles, ce qui leur donne une dimension autre que digitale (ou ce qu’est supposé signifier cette limitation). Mais il en est de même pour l’humain, qui ne peut, pour communiquer du sens, que disposer de la manipulation de signes (verbaux ou non verbaux). Car pour justifier l’intuition, la négation de toute méthode d’analyse se contente finalement d’ironiser dans la surenchère pseudo-formaliste : “Soit l’expression anglaise, par exemple, “L’idée est dans la plume”; elle est fort claire pour nous, dès qu’il est question d’auteurs, mais une machine, à ce stade, risque fort de buter. […] Faut-il en conclure, alors, que pour employer, (comme pour comprendre) une expression “hors normes”, les interlocuteurs suivent une autre règle — une règle régissant, en l’occurrence, un emploi différent de la préposition “dans” ?.” (Dreyfus, p. 251). Il est évident que cette objection s’appuie sur la tentative de décodage à partir de la seule syntaxe (par référence à Chomsky). L’erreur d’interprétation réside dans le fait qu’il s’agit ici d’une simple figure de rhétorique. En principe, comme pour toute expression imagée, il serait aussi concevable d’automatiser son décodage. Mais il faudrait que la linguistique n’ait pas fait l’impasse sur cette rhétorique, pour s’obnubiler sur la syntaxe, depuis le début du vingtième siècle. Cette erreur constitue encore un indicateur des limites de la discipline linguistique, et du conformisme qui y règne. Mais plus simplement, quand il s’agit comme ici d’expressions toutes faites, l’analyse automatique (pour la compréhension ou la traduction) doit les identifier en bloc d’abord, comme les mots composés (pomme de terre, etc.), et les apprendre. Il est d’ailleurs possible pour un être humain, donc pour une machine, d’utiliser ces figures telles quelles, sans en connaître le sens original, étymologique ou anecdotique. C’est bien ce qui a lieu la plupart du temps. Ces expressions constituent donc une simple synonymie. Notons ainsi que les dictionnaires étymologiques, ou ceux qui explicitent l’origine des expressions courantes ou imagées, démontrent l’existence, chez les natifs, de cet emploi pré-analytique, simplement fondé sur la désignation. Spécialement dans la phase d’apprentissage où réside, par définition, la fréquente rencontre d’expressions inconnues, la machine a justement l’avantage de la mémorisation définitive. Inversement, les tentatives de déductions à partir de la littéralité correspondent plutôt à l’inanité des délires philosophico-lacaniens. Car il n’y a pas forcément de transparence du sens originel, contrairement au goût pour les étymologies significatives, les compositions morphologiques — sans doute pour amortir leur propre formation gréco-latine, ou germanique [NOTE 129]. Quant au sens imagé, il concerne d’autres fonctions du langage (poésie, jeux de mots, sous entendus…). Il n’est transparent qu’après un long apprentissage, comme peuvent le constater les étrangers, à la suite des natifs au cours de leur enfance. Et bien sûr, il existe pour l’humain (comme pour la machine), la possibilité de demander une précision extérieure [NOTE 130]. Ne pas le faire revient à faire semblant de comprendre dans le cas humain. De fait, Searle ne voit pas que le problème de la conscience des ordinateurs se réduit lui aussi à celui qu’il définit lui-même comme la possibilité de la conscience pour la matière. Et l’IA, justement, généralise cette conscience au traitement de l’information ! Car le sens repose aussi sur un codage, à moins de retomber dans le dualisme âme/corps, ou les apories de l’homoncule, petit bonhomme qui tire les ficelles à l’intérieur de nos crânes, selon l’épistémologie classique. Contre le réductionnisme, nous pouvons laisser Searle se répondre d’abord à lui-même, et à ses comparses : “Même si nous pouvons dire du cerveau qu’il est conscient, ou qu’il éprouve de la soif ou de la douleur, nous ne pouvons, parlant d’un neurone spécifique du même cerveau, dire qu’il souffre ou qu’il a soif. “ [NOTE 131] (Searle, p. 29). On peut donc abandonner les gloses archaïsantes. Et les propositions pseudo-analytiques de Searle contre l’IA : “1. Le cerveau cause l’esprit, 2. La syntaxe ne suffit pas à la sémantique, 3. Les programmes d’ordinateur ne sont définis que par leur structure formelle et syntaxique, 4. L’esprit a un contenu mental plus spécialement, il a un contenu sémantique.” (Searle, pp. 51-52) sont donc simplement des pétitions de principe. L’IA pourrait répondre par : 1) Les représentations formelles causent l’esprit, 2) La syntaxe peut suffire à la sémantique dans la plupart des langues. 3) La pensée est aussi définie par une structure formelle. 4) Si tout contenu sémantique est mental, alors l’ordinateur a un contenu mental, sinon il se peut que l’humain n’en ait pas vraiment, c’est-à-dire qu’il n’ait que des processus formels. Ce qui ne constitue évidemment pas une tare. Bien sûr, la proposition sur l’absence de valeur sémantique de la syntaxe ou de la morphologie est absolument fausse. Dans les langues, le sens d’une phrase dépend notoirement de la syntaxe, ou de la morphologie. Selon les exemples canoniques : “Jean tue Pierre”, n’est pas équivalent à “Pierre tue Jean”. (Ce qui a donc aussi des incidences juridiques évidentes, et non seulement grammaticales, contre le postulat saussurien d’explication de la langue par la langue). Mais l’opposition au formalisme qui se fonde sur la seule syntaxe peut très bien être illustrée par la fameuse création littéraire du surréalisme : “Les idées vertes incolores dorment furieusement” — pour laquelle nous noterons qu’il s’agit (paradoxalement) d’une volonté d’écriture automatique. Il suffit donc de considérer que les énoncés légaux comportent également des contraintes empiriques qui excluent certaines combinaisons (idée-verte, verte-incolore, idée-dormir, dormir-furieusement). Ce qui revient à dire que la grammaire comporte une composante sémantique. Et les contraintes en question n’en sont pas pour autant mystérieuses. Les surréalistes, créateurs naïfs des impossibilités précédentes, peuvent être considérés comme des linguistes qui fournissent des contre-exemples. On obtient, par là même, des limitations considérables des énoncés possibles, qui ne peuvent que faciliter la génération automatique de textes cohérents. De la sémantique chinoise On peut aussi observer que cette contestation à la syntaxe de la possibilité de représenter la sémantique se fonde sur des extrapolations ne sont plus aussi prudentes dès que les phénoménologues rencontrent un article (de T. G. Bever) qui : “invalide toute théorie de la saisie de la parole qui s’efforcerait d’incorporer telles quelles les règles de grammaire, en tant qu’éléments isolables, dans les processus d’identification des propos.” (Dreyfus, p. 249). Est-ce à dire que la grammaire n’a rien à voir avec la compréhension du langage ? C’est ce qu’il semble qu’on soit fondé à conclure si on accepte les curieuses — et légendaires — théories de Searle sur le chinois : “Imaginons qu’un groupe de programmeurs ait écrit un programme qui permet à un ordinateur de simuler la compréhension du chinois. […] Supposons en outre que ces réponses soient aussi bonnes que celles d’un véritable chinois. Alors, pourra-t-on dire que l’ordinateur comprend le chinois au sens littéral, comme un chinois comprend sa langue ? Maintenant, imaginons que nous nous trouvons enfermés dans une pièce ou se trouvent plusieurs paniers pleins de symboles chinois. Imaginons qu’aucun de nous ne comprenne un seul mot de chinois, mais que nous ayons chacun un livre en français qui nous dise comment manipuler les symboles chinois. […]. Dans une telle situation, je vous défie d’apprendre un mot de chinois par la manipulation de symboles.” (Searle, pp. 43-44). Remarquons tout d’abord que Searle n’a rien inventé, puisque le principe de ce test est ce qu’on appelle le test de Turing. Le modèle de Turing n’est d’ailleurs en lui-même qu’une complication inutile des traditionnels jeux ou paradoxes logiques, où il s’agit de déterminer qui ment. Dans sa version originale, il consiste à identifier le sexe de deux interlocuteurs masculin et féminin (en communiquant avec eux par téléscripteurs). Il concerne l’IA par la possibilité de remplacer une des deux personnes par une machine [NOTE 132]. Searle n’a donc réalisé lui-même qu’une transposition formelle, tout humain qu’il soit ! Il faut cependant observer que son étude de cas est formellement plus pertinente que celle de Turing. Mais bizarrement, Searle semble proposer ici ce test pour en refuser les résultats (puisqu’ils contredisent ses préjugés), même quand on lui précise l’explication : “Certains, après avoir écouté ma parabole chinoise, me répondent qu’en fait, le système dans son ensemble comprend le chinois, que moi, qui ne le comprends pas et qui manipule des symboles, je ne suis que l’unité centrale de fonctionnement d’un système informatique. […] Même dans cette hypothèse, mon objection tient : le système est incapable de passer de la syntaxe à la sémantique. Moi, l’unité centrale, je n’ai aucun moyen de deviner la signification des symboles, et le système non plus.” (Searle, p. 45). Que signifie l’entêtement à ne pas comprendre que la sémantique est précisément dans le comportement adéquat (Searle, p. 46) ? Le philosophe accorde-t-il à cette sémantique une valeur mythique, parapsychologique, ou réservée ontologiquement à l’humain par décret ? On peut même ajouter qu’on apprend bien une langue par le moyen qu’il propose. Remarquons aussi que la conception de Searle semble se fonder sur un contresens (ou une confusion) sur le terme simuler (p. 49). Car, si l’ordinateur simule la compréhension du chinois, au sens de la simulation dans les sciences contemporaines, on peut dire que l’ordinateur comprend le chinois par hypothèse. L’auteur semble jouer sur l’autre sens de simulation qui correspond à la volonté de tromper. Tout le débat suivant serait vain s’il ne consistait pas à expliquer comment procède cette simulation, pour en dénigrer le principe. Sa construction revient à dire que si l’ordinateur ne comprend pas le chinois, il ne comprend pas le chinois. Searle, oubliant de définir ce que comprendre veut dire pour lui, en reste à sa pétition de principe que l’ordinateur ne comprend pas le chinois parce que seul l’humain comprend. Finalement, le test de Searle, correspondant à un ordinateur qui nous indiquerait ce qu’il faut faire, ou ce qu’il faut répondre, quand un chinois nous parle, serait un guide informatisé de conversation pour les touristes, comme il en existe déjà sous forme écrite. Il est bien évident qu’un tel ordinateur est un traducteur de chinois, voire un traducteur simultané s’il était interactif. Si le programme répondait effectivement de mieux en mieux, et pouvait éviter les erreurs que je relève ici chez des êtres humains opposés à l’IA, il ne serait peut-être pas intelligent, mais ce serait une performance suffisante. Le chinois, comme toute langue, peut être considéré comme un simple codage du réel. Les premiers travaux de traduction automatique avaient justement envisagé de considérer toute langue comme un surcodage d’une autre. Sur le plan lexical, un Italien utiliserait caballo où un Allemand utilise pferd, et un Français cheval (pour prendre l’exemple linguistique canonique). Sur le plan syntaxique, l’allemand mettrait le verbe à la fin, etc. Donc l’allemand est de l’italien mal parlé, et réciproquement. Ou, ce qui revient au même, de l’indo-européen parlé avec des accents différents, et des choix d’économie linguistique différents. Ce qui est bien admis par les linguistes, sous une forme plus académique, il est vrai. De même, une définition pragmatique de la compréhension dirait que si on se comporte comme un chinois se comporterait en communiquant dans sa langue, alors on comprend le chinois. On trouve une telle conception pragmatique chez Bobrow qui “attribue au verbe “comprendre” un sens un peu particulier : “[…] un ordinateur comprend un sous ensemble de l’anglais dès lors qu’il accepte l’introduction de phrases […] et qu’il répond à des questions sur la base d’informations introduites de la sorte[NOTE 133]”.” (Dreyfus, p. 97). N’est-ce pas cela qui s’appelle comprendre une langue [NOTE 134] ? Car c’est sur ce critère qu’on juge un étranger ou un enfant, ou un étudiant. On peut en déduire que la sémantique est bien un effet pragmatique de la syntaxe (voir le cas “Jean tue Pierre”). Même dans la perspective de Searle, une conception de la forme distincte du contenu permet justement la possibilité de traduction (éventuellement automatique) : des formes diverses pour un référent unique est la condition d’une bonne traduction. Ce qui contredit les postulats de ces philosophes qui s’inspirent de la phénoménologie, ou de l’hypothèse Sapir-Whorf. Même les limitations de l’ordinateur (non ambiguïté, domaine limité, etc.) sont directement assimilables aux différents niveaux de compétence de la compréhension d’une langue étrangère ou maternelle. Malheureusement, les êtres humains doivent mémoriser, ce qui explique les modalités de l’apprentissage humain. Mais s’ils pouvaient répondre à toutes les questions posées en chinois, même sans comprendre, celui qui les poserait conclurait qu’ils auraient appris le chinois. Supposer le contraire s’appliquerait au cas du prof soupçonneux qui douterait toujours de la réalité de l’apprentissage de l’élève. Peut-être est-ce le symptôme d’un biais professoral (fondé sur les apprentissages incomplets, ou résultant des mauvaises évaluations reposant justement sur des critères intuitifs). Valeur pragmatique des formalismes Le pragmatisme lui-même suscite aussi quelques malentendus. Il désignait à l’origine, chez Peirce, le moyen d’obtenir un résultat sur le plan conceptuel (sur le modèle de la désignation des corps chimiques par des sigles désignant leurs composants). Cette position pragmatique résout la dichotomie entre pensée et action par la découverte que tout comportement distinct correspond à une formalisation (en tant que découpage du monde par l’action). Cette décomposition, même apparemment non formelle, est équivalente à un algorithme, ou à des heuristiques, quand il existe trop de variantes. L’influence de la phénoménologie sur la linguistique a fait définir le pragmatisme comme la situation concernant l’implicite. Plus spécialement, (avec quelques variantes selon les auteurs) la pragmatique linguistique concerne les cas où les expressions ne sont pas comprises au sens propre, ou littéral. On peut reconnaître la pragmatique à l’œuvre dans les expressions comme : “Avez-vous l’heure ?”, utilisable à la place de l’explicite “Quelle heure est-il ?”, ou l’emploi en français de “sans doute” pour son opposé “peut-être”, etc. Mais ainsi, par une régression classique, la linguistique retrouve simplement la grammaire traditionnelle avec ses grammaires d’usages. La seule différence de la linguistique est la volonté méthodologiquement correcte de l’observation des pratiques langagières contre l’attitude ancienne de la prescription d’un bon usage (“La façon de parler de la plus saine partie de la cour, conformément à la façon d’écrire de la plus saine partie des auteurs du temps”, Vaugelas, 1647). La référence normative a simplement changé de modèle idéal : l’écrit a été simplement remplacé par l’oral (éventuellement par parti pris plébéien ou rousseauiste, anti-bourgeois ou anti-académique [NOTE 135]). Cette régression normative semble être la maladie professionnelle des grammairiens ou linguistes, et ne mérite guère d’interrogations épistémologiques. L’analyse linguistique, qu’on peut appeler verbaliste et non pragmatique comme elle le prétend, conduit d’ailleurs à certaines aberrations : “Selon Martinet, la conduite de celui à qui l’on parle ne sera pas la même si on lui dit : “apportez la chaise” ou “apportez la lampe”. Même pour celui qui ignore tout de la psychologie, il est évident que cette remarque n’est guère valable on peut imaginer nombre de réponses identiques à ces deux impératifs différents : par ex : “oui, mais attend une seconde” ou encore “non, je ne peux pas elle est trop lourde”.” (Hermine Sinclair de Zwaart, “L’explication en linguistique”, in Piaget, L’explication dans les sciences, p. 134). AU FOU ! Si c’est ça l’explication en linguistique[NOTE 136] ! Faudra-t-il pousser l’explication jusqu’à dire que : donc “chaise” = “table” ? Un minimum de bon sens serait nécessaire en sciences humaines. En fait, cette conception de la pragmatique est ici une bonne illustration de l’interdit de traiter le référent, qui a spécialement régné dans les années soixante/soixante-dix [NOTE 137]. L’aspect linguistique de la pragmatique est une étape de l’apprentissage qui n’exclut pas la possibilité formelle. Il est évidemment absurde de ne considérer comme pragmatique que les énoncés où le sens n’est pas explicite. Plus précisément, une conception uniquement pragmatique correspond bien à une sélection, par le sujet, des énoncés efficaces [NOTE 138] . Cette possibilité correspond, conformément au modèle piagétien, à la capacité de variation formelle des performances. L’acquisition du formalisme implique la vérification des conséquences extra-linguistiques. Dans des énoncés comme : “Passe-moi le sel, le poivre”, etc., la prise en compte des conséquences permet de renforcer les acquis formels. C’est cette qualité ostensive qui fait qu’un chat est un chat, ou comme dirait le logicien : qui rend vraie la proposition “c’est un chat”, quand c’est bien d’un chat dont il est question. Cette possibilité formelle n’est donc pas seulement mathématique. Si Piaget ne considère guère la pratique du langage au point de tolérer ces délires intra-disciplinaires dans le livre qu’il dirige ci-dessus, il précise fécondement la distinction entre les compétences formelles et corporelles : “L’emploi de signes comme des symboles suppose cette aptitude, toute nouvelle par opposition aux conduites sensori-motrices, qui consiste à représenter quelque chose par autre chose.” (Piaget, La psychologie de l’intelligence, p. 136). La résistance aux formalismes logiciens est sans doute la cause de la réaction phénoménologique, mais elle provoque pourtant la solution du réductionnisme — par fétichisme scientifique. Comme nous le savons, ce réductionnisme atteint souvent les limites du ridicule : “La signification n’est pas produite à partir d’éléments, qu’il s’agisse de signes ou de sons. Le flot de sons est un problème qui intéresse les physiciens et les neurophysiologistes, alors qu’au niveau du discours signifiant, les indispensables transformations d’énergie viennent déjà d’avoir lieu, et il en résulte un monde signifiant, pour lequel il n’est pas nécessaire d’introduire quelque nouvelle théorie […].” (Dreyfus, pp. 348-349). Ce genre de délire oublie un petit détail, c’est que le langage fonctionne effectivement par décomposition ! Ce monde est celui de l’écriture alphabétique — ou du langage en général par opposition à un monde pré-conceptuel. Il n’est pas nécessaire d’imaginer des “cochons ailés” comme Winograd et Flores (p. 167), qui appartiennent peut-être ontologiquement à un tel monde symbolique. De même, il n’y a pas de raison que les connaissances extra-linguistiques ne puissent pas être formalisées, contre cette habitation heideggerienne du langage reprise maladroitement par Weizenbaum (p. 47). Son exemple (même page), concerne le fait que George Eliot soit une femme, ce qui est parfaitement formalisable. Il s’agit d’une connaissance encyclopédique quelconque, dont on imagine facilement qu’un étranger au monde anglo-saxon est ignorant, même quand il a déjà entendu le nom de cet auteur. Cet exemple n’a d’implicite que l’allusion (inconsciente ?) au test de Turing. Deviner qu’il s’agit d’une femme suppose simplement que l’auteur laisse apparaître certains indices dans son écriture. Ce qui serait bien maladroit si le but est la dissimulation, ou pourrait au contraire constituer une double subtilité : et si George Eliot était un homme ? Compétence/performance La notion de règle peut indifféremment exprimer des facteurs conscients ou inconscients pour expliquer les comportements, conformément à la philosophie classique : “Kant analysait explicitement toute expérience y compris la perception, à la lumière d’un ensemble de règles […]. Platon était d’avis que, même si les sujets n’étaient pas conscients d’agir selon les règles, leur action n’en avait pas moins une structure rationnelle, qui pouvait être explicité par le philosophe.” (Dreyfus, pp. 218-219). Le problème posé ici peut être celui qui s’exprime, chez les linguistes, par l’opposition de la compétence et de la performance. La première correspond bien à la programmation, aux règles qui permettent de produire la seconde, des énoncés sur le mode classique en linguistique. Mais la conception classique, en linguistique selon Chomsky, fait surtout référence au fait que la constatation d’une seule performance ne suffit évidemment pas, du fait de la possibilité du hasard ou des cas d’erreurs-correctes dans la production de phrases durant l’apprentissage (langue maternelle ou seconde). Car la pédagogie suppose des situations de contrôle, et l’action réelle tolère un certain pourcentage de productions ratées. Préférer l’induction inverse simplement le processus. Mais dans les deux cas, pourquoi nier la possibilité effective de génération, spécialement dans le cas des ordinateurs (Dreyfus, p. 239). On ne voit pas très bien quel serait ce formalisme qui ne permet pas de reproduire l’action, alors même qu’on admet qu’il peut exprimer la compétence ! La grammaire permet de générer des phrases correctes, et c’est ce qui permet de les produire par ordinateur. On a déjà vu que la méthode qui se réfère à la mise en lumière ou la critique (kantienne ou marxiste) de postulats implicites, comme toute la deuxième partie du livre de Dreyfus, utilise aussi l’idée de règles, générant de raisonnements à partir de ces postulats. Alors que la solution de Searle, fondé encore une fois l’abracadabra de la simplicité, pourrait se justifier dans le cadre de l’hypothèse physiologique dreyfusienne — à moins qu’il ne s’agisse que d’un aveu d’impuissance personnelle à déterminer ces règles, généralisé en impossibilité ontologique (p. 73), quand il propose, contre la théorie chomkyenne d’une grammaire universelle, qu’il : “existe une hypothèse beaucoup plus simple pour expliquer ces phénomènes : celle qui dit que la structure physiologique du cerveau engendre des grammaires possibles sans qu’intervienne un niveau intermédiaire de règles ou de théories.” (Searle, p. 70). Cette conception de la causalité mentale revient sans doute à dire que Newton a inventé la gravitation, ou que Pasteur a inventé les microbes. Mais peut-on pour autant dire que les pommes ne tombaient pas avant 1665, ou que la génération spontanée était la cause des maladies avant Pasteur. Celui qui ne connaît, ni ne crée, la physique ou la biologie, se trouve-t-il au même niveau que Newton ou Pasteur, du seul fait qu’il subit les conséquences du réel que la théorie formalise ? Le constructivisme subjectiviste consisterait à punir dans le scientisme le porteur de mauvaise nouvelle, et justifier, par cet archaïsme cognitif, la critique des méfaits de la science et du progrès. Le cas de Pasteur (et le paradigme de la médecine en général, plutôt que le modèle épistémologique traditionnel de la physique), permet de comprendre la situation antérieure aux découvertes. Depuis toujours, des phénomènes connus comme la maladie et la mort ont donné lieu à des interprétations philosophiques ou théologiques, comme les autres phénomènes naturels. Mais la projection animiste résiste, dans le champ humain, alors qu’elle n’est guère défendue que par des marginaux, dans le champ physique. Ce qu’a découvert Pasteur, ce n’est pas la maladie, ou les symptômes divers, mais les microbes. Et la construction, si on tient à ce terme à la mode, concerne la théorie du lien entre deux phénomènes, les microbes et les symptômes. L’explication pastorienne n’est ni plus ni moins théorique que les explications théologiques ou magiques antérieures, qui reliaient bien des causes supposées et des effets constatés. La différence fondamentale est bien dans l’observation, et sa programmation dans la méthode expérimentale en médecine, formalisée plus tard par Claude Bernard. A la question “Pasteur a-t-il inventé les microbes ?”, il serait possible de répondre, en utilisant les catégories des linguistes : a) Pasteur a-t-il inventé le signifiant (le mot) ? Ce n’est pas très important. Car une analyse étymologique ne constitue pas une preuve mais, au mieux, un procédé mnémotechnique. b) Pasteur a-t-il inventé le référent (la chose) ? Non. Ce qui permet de justifier une position réaliste/matérialisme (comme le remarque Ian Hacking, dans Concevoir et expérimenter) et de justifier l’observation, avec des moyens directs ou indirects. c) Pasteur a-t-il inventé le signifié (le concept ou le sens) ? Oui. Il a associé un mot à une observation, en s’opposant aux concepts antérieurement connus qui la décrivent. L’ironie animisto-réductionniste de Dreyfus, à propos de planètes qui “devraient résoudre des équations différentielles pour ne pas s’écarter de leur orbite.” (p. 207), ou celle de Searle à propos des limites de la vision au nom “d’une règle universelle qui dirait : “ne voyez ni l’infrarouge, ni l’ultraviolet” (p. 71) est relayée par cette autre présentation dans le domaine spécifiquement linguistique, sous la forme de paradoxe : “Given that grammar is the system of rules that defines the class of sentences which comprises the language, and given that in their verbal behavior people comply with theses rules, one concludes that people know the rules of language and that grammar is mentally represented in the mind […]. But, then, it is also the case that Newton’s laws […] define the motion of physical bodies, and stones comply in their behavior with these rules. Why doesn’t one say that stones have a representation of the laws of physics. “ [NOTE 140] (Benny Shanon, Journal for the Theory of Social Behavior, vol. 17, p. 83). On peut exiger la distinction entre phénomènes cognitifs et phénomènes matériels. Mais ce n’est pas suffisant. Car l’absence de clarté de la question de la compétence/performance rend préférable d’utiliser cette distinction dans le seul cas où, pour la compétence, la règle peut être explicitée par le locuteur, alors que pour la performance, la règle est constatée par un observateur extérieur, ce qui permet de répondre à la précaution béhavioriste de Shanon (idem, p. 86). La performance que constitue le fait de parler une langue ne signifie pas strictement qu’on est ipso facto grammairien. La limitation de la compétence à la possibilité conceptuelle ou formelle est la seule solution qui évite le relativisme, qui remplace l’idée de langue (de code) par celle de parole (ou de langage privé). Habitus/conceptus L’assimilation de la culture par l’individu s’effectue évidemment par un processus qui prend en compte la subjectivité, mais qui est également déterminé par l’environnement social, comme dans le cas de l’apprentissage d’une langue. La phénoménologie, dans la tradition romantique, insiste sur ces processus sans vraiment les clarifier. On peut s’aider de la notion d’habitus du sociologue Pierre Bourdieu, qui semble remonter à Aristote, via Thomas d’Aquin et Panovski, comme le note Rist, pour expliquer la stratification des goûts par quelque chose qui ressemble beaucoup à du conditionnement. On sait que le sociologue Pierre Bourdieu est lui aussi un adepte du surcodage : “Les structures qui sont constitutives d’un type particulier d’environnement […], et qui peuvent être saisies empiriquement sous la forme de régularités associées à un environnement socialement structuré, produisent des habitus…” (Bourdieu, Esquisse d’une théorie de la pratique, p. 175)”, (in Gilbert Rist, “La notion médiévale d’‘habitus’ dans la sociologie de Pierre Bourdieu”, Revue européenne des sciences sociales, XXII, 1984, n° 67, p. 210) comme le montre la comparaison du discours de Bourdieu avec celui de St-Thomas à propos de cette notion : “Quand les actes se répètent, l’habitus se développe.” (St-Thomas Summa theol. qu. 52, art. 3)”. (Gilbert Rist, idem). Cette conception, si elle ne considère pas l’humain comme une machine programmée — Rist note que “d’Aristote à Bourdieu, l’habitus ne cesse d’être “une disposition difficile à modifier”” (p. 221) — semble admettre au mieux une capacité générative, paraphrasant Chomsky (avec une restriction qui marque ses résistances) : “L’habitus comme tout art d’inventer est ce qui permet de produire des pratiques en nombre infini, et relativement imprévisibles ( comme les situations correspondantes), mais limitées cependant dans leur diversité.” (Le sens pratique, p. 93, cité in Rist, idem, p. 206). Pour réellement prendre en compte la liberté du sujet, on peut considérer avec profit les remarques de François Bourricaud sur cette notion, qui la rapproche de celle de learning (partie active de l’apprentissage chez l’élève) : “Si donc pour leur faire remplir la fonction de mécanisme d’autorégulation, l’on fait dériver les habitus vers les normes morales, on renforce à coup sûr leur valeur contraignante, leur caractère d’obligation, mais on limite aussi leur champ d’application [dans…] des processus de décision […]. Si on tire les habitus du côté cognitif, on leur rend de la souplesse, on en fait des schémas, des représentations qui limitent pour l’acteur le champ du possible, mais en même temps l’invitent à traiter l’expérience comme un ensemble de possibles à explorer.” (François Bourricaud, Revue française de sociologie, vol. XVI, p. 591). Même en considérant ce dernier aspect, il semble également nécessaire de distinguer les comportements des conceptualisations. La conception de l’abstraction chez Piaget permet de sortir de ce cadre restreint. Mais cela suppose bien une maîtrise des opérateurs de la linguistiques (Piaget n’étudie que très sommairement le langage proprement dit). Car la solution phénoménologique du corps comme siège de la performance ne permet pas cette économie de la compétence considérée comme capacité d’explicitation. L’habitude n’est pas équivalente à la conscience ou à l’intelligence : “L’habitude, comme la perception, est irréversible parce que toujours dirigée à sens unique vers le même résultat, tandis que l’intelligence est réversible : inverser une habitude […] consiste à acquérir une nouvelle habitude.” (Piaget, La psychologie de l’intelligence, p. 98). “Par le fait même, un acte d’intelligence sensori-motrice ne tend qu’à la satisfaction pratique […] et non pas à la connaissance comme telle. Il ne cherche ni l’explication, ni la classification, ni la constatation pour elle-mêmes […]. L’intelligence sensori-motrice est de l’intelligence vécue et nullement réflexive.” (Piaget, La psychologie de l’intelligence, p. 131). On remarque que cette conception permet de résoudre le problème (moraliste) de la gratuité de la science par le paramètre plus réaliste de l’autonomie des représentations. De même, on peut résoudre les apories classiques du débat compréhension/explication, qui se fondent sur le fait que les sciences humaines sont par nature auto-réflexives (“La connaissance de la connaissance” chère à Edgar Morin). C’est cette capacité d’explicitation qui constitue la compétence, et les formalismes qui l’expriment. La connaissance de la connaissance elle-même n’est qu’un cas particulier (outre la tendance au jeu de mot d’origine hégélienne). Aussi, je propose de considérer que le learning se décompose en habitus et conceptus, pour rendre compte de la constitution, chez l’individu, de son système personnel de représentations. Il ne s’agit pas en effet de considérer que les représentations collectives sont seulement une sorte de moyenne de l’individuel, ni de façon holiste (romantique, marxiste, ou culturaliste), qu’ils sont le reflet de l’environnement. Ils sont bel et bien le produit de l’immersion de l’individuel dans le collectif et l’histoire, en fonction de capacités différentes d’assimilation ou de formalisation. D’un point de vue logique, ce processus est équivalent à l’induction, qui consiste à extraire des règles de l’expérience, ou de l’étude de cas. La phénoménologie croit simplement innover en ne considérant que les comportements induits (habitus), et en excluant les concepts induits (conceptus). Mais c’est se priver dogmatiquement d’un phénomène tout aussi observable dans le comportement humain. De plus, cette capacité théorique possède, comme on sait, ses propres avantages. Elle a précisément la faculté de créer de nouvelles expériences répondant au critère comportemental. Le refus de la technoscience (comme chez les Amish) ne peut pas justifier sa négation ontologique (bien que ce soit précisément la tendance de l’habitus romantico-philosophique). Le flop de l’anti-formalisme Finalement, on voit bien que la négation de la possibilité d’une pensée calculante est logiquement à l’origine de la négation des sciences humaines. Comment admettre l’ironie contre ce projet, où “les questions morales seraient simplifiées et notre savoir plus sûr.” (Dreyfus, p. 219), qui semble ne pas admettre la réalité et l’efficacité déjà actuelle du raisonnement. Elle ne s’explique que si on reste dans un cadre dualiste, où les affaires humaines sont hors de toute conceptualisation. Mais même cette immanence du sens (personnelle et culturelle) peut se résumer à la formalisation, car il est admis qu’on ne peut sortir du cadre de la représentation, même pour la contester (Dreyfus, p. 391). Et si cette preuve ontologique n’était pas suffisante, elle pourrait s’augmenter de l’aveu de Dreyfus, présent dans la deuxième édition d’Intelligence Artificielle, Mythes et Limites, où il admet que “se prêter à l’abstraction, c’est aussi se prêter à la formalisation.” (p. 155). Dont acte ! Mais cette acquisition, pour aussi tardive que méritoire qu’elle soit, ne signifie-t-elle pas que les critiques antérieures caractérisaient simplement la résistance d’une (in)compétence confrontée aux autres compétences supérieures (ou à de nouvelles connaissances et disciplines à intégrer). Toute la question est d’accepter l’existence de connaissances que l’on n’a pas. Ne pas admettre le débat en termes d’échanges inégaux signifie que les connaissances doivent se plier aux archaïsmes. Notes [NOTE 103] Cette considération est-elle (via Heidegger et Gadamer) celle de ceux qui déclarent que “Le problème de la cognition est inséparable du problème de la nature du langage” (Winograd & Flores, p. 34) ? [NOTE 104] Ce problème de grammaire des fautes, a sans doute été inversé en faute de la grammaire par un certain nombre de partisans d’une conception libertaire mal comprise, dans la suite du rousseauisme anti-normatif post-soixante-huitard, ou justement sous l’influence de la phénoménologie. Il peut s’agir d’une réaction contre un environnement excessivement normatif à l’époque de la formation des convictions des partisans de cette méthode. [NOTE 105] Depuis la première édition, j'ai pris connaissance du fait que les pays anglo-saxons ont tendance à refuser l'utilisation de la grammaire (encore qu'il est probable que ce n'était pas le cas par le passé, pour Searle lui-même donc). Cette position pro-implicite est-elle la conséquence ou la cause de cette stratégie qui se répand effectivement en France ? [NOTE 106] Cet exemple précis est d’ailleurs canoniquement à la source de cette idée de la vision globale, depuis la diffusion de la connaissance du chinois en occident, au XVIIe siècle. [NOTE 107] La forme d’un “a” n’est pas moins iconique que celle d’un caractère chinois, spécialement pour un asiatique. Il arrive d’ailleurs que de pseudo-lettres romaines soient utilisées (ou de vrais caractères composés aléatoirement, ou empruntés à un texte quelconque) dans les illustrations (surtout anciennes) des pays possédant un système idéographique. De la même façon, les occidentaux utilisent parfois de pseudo-caractères chinois. [NOTE 108] Et on rencontre même très souvent la négation des structurations conceptuelles par des assertions irrationalistes de ce genre : “ O |