Archives par étiquette : paradoxe de Goodman

Éléments d’un contextualisme dialectique

Éléments d’un contextualisme dialectique

Paul Franceschi

Université de Corse

Paul Franceschi

Fontaine du Salario

Lieu-dit Morone

20000 Ajaccio

France

RÉSUMÉ Dans ce qui suit, je m’attache à présenter les éléments d’une doctrine philosophique, qui peut être définie comme un contextualisme dialectique. Je m’efforce tout d’abord d’en définir les éléments constitutifs, à travers les dualités et pôles duaux, le principe d’indifférence dialectique et le biais d’uni-polarisation. Je m’attache ensuite à souligner l’intérêt spécifique de cette doctrine au sein d’un domaine particulier de la méta-philosophie : la méthodologie utilisée pour la résolution des paradoxes philosophiques. Je décris enfin des applications de cette dernière à l’analyse des paradoxes suivants : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse.

ABSTRACT In what follows, I strive to present the elements of a philosophical doctrine, which can be defined as dialectical contextualism. I proceed first to define its basic elements, namely, dualities and polar contraries, the principle of dialectical indifference and the one-sidedness bias. I emphasize then the special importance of this doctrine in a specific field of meta-philosophy : the methodology for solving philosophical paradoxes. Finally, I describe several applications of this methodology on the analysis of the following paradoxes : Hempel’s paradox, the surprise examination paradox and the Doomsday Argument.


Éléments d’un contextualisme dialectique

Paul FRANCESCHI

Dans ce qui suit, je m’attacherai à présenter les éléments d’une doctrine philosophique spécifique, qui peut être définie comme un contextualisme dialectique. Je m’efforcerai tout d’abord de préciser les éléments essentiels qui fondent cette doctrine, en particulier les dualités et pôles duaux, le principe d’indifférence dialectique et le biais d’uni-polarisation. Je m’attacherai ensuite à en décrire l’intérêt au niveau méta-philosophique, en particulier en tant que méthodologie pour aider à la résolution des paradoxes philosophiques. Je décrirai enfin des applications de cette méthodologie à l’analyse des paradoxes philosophiques suivants : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse.

Le contextualisme dialectique décrit ici est fondé sur un certain nombre d’éléments constitutifs qui présentent une nature spécifique. Au nombre de ces derniers figurent : les dualités et pôles duaux, le principe d’indifférence dialectique et le sophisme d’uni-polarisation. Il convient de les analyser tour à tour.

1. Dualités et pôles duaux

Je m’attacherai tout d’abord à définir la notion de pôles duaux (polar opposites)1. Bien qu’intuitive, une telle notion nécessite d’être décrite de manière plus précise. Des exemples de pôles duaux sont ainsi statique/dynamique, interne/externe, qualitatif/quantitatif, etc. Nous pouvons définir les pôles duaux comme des concepts (que nous pouvons dénommer A et Ā) qui se présentent par paires, et qui sont tels que chacun d’eux est défini comme le contraire de l’autre. Par exemple, interne peut être défini comme le contraire d’externe, et de manière symétrique, externe est défini comme le contraire d’interne. En un certain sens, il n’y a pas de notion primitive ici et aucun des deux pôles duaux A et Ā ne peut être considéré comme une telle notion primitive. Considérons tout d’abord une dualité donnée, que nous pouvons dénoter par A/Ā, où A et Ā constituent des concepts duaux. Une telle dualité est représentée sur la figure ci-dessous :

Figure 1. Les pôles duaux A et Ā

À ce stade, nous pouvons donner également une énumération2 (qui présente nécessairement un caractère partiel) des dualités :

Interne/Externe, Quantitatif/Qualitatif, Visible/Invisible, Absolu/Relatif, Abstrait/Concret, Statique/Dynamique, Diachronique/Synchronique, Unique/Multiple, Extension/Restriction, Esthétique/Pratique, Précis/Vague, Fini/Infini, Simple/Composé, Individuel/Collectif, Analytique/Synthétique, Implicite/Explicite, Volontaire/Involontaire

Afin de caractériser les pôles duaux avec davantage de précision, il convient de s’attacher à les distinguer par rapport à d’autres concepts. Nous présenterons ainsi plusieurs propriétés des pôles duaux, qui permettent de les différencier d’autres concepts voisins. Les pôles duaux sont ainsi des concepts neutres, de même que des qualités simples ; en outre, ils se distinguent des notions vagues. En premier lieu, deux pôles duaux A et Ā constituent des concepts neutres. Ils peuvent ainsi être dénotés par A0 et Ā0. Nous pouvons ainsi les représenter de la manière suivante :

Figure 2. Les pôles duaux neutres A0 et Ā0

Les pôles duaux constituent des concepts neutres, c’est-à-dire des concepts qui ne présentent aucune nuance méliorative ou péjorative. En ce sens, externe, interne, concret, abstrait, etc., constituent des pôles duaux, à la différence de concepts tels que beau, laid, courageux, qui présentent une nuance soit méliorative soit péjorative, et qui sont donc non-neutres. Le fait que les pôles duaux soient neutres possède son importance, car cela permet de les distinguer de concepts qui possèdent une connotation positive ou négative. Ainsi, la paire de concepts beau/laid ne constitue pas une dualité et beau et laid ne sont donc pas des pôles duaux au sens de la présente construction. En effet, beau possède une connotation positive et laid présente une nuance péjorative. Dans ce contexte, nous pouvons les dénoter par beau+ et laid.

Il convient de souligner, en second lieu, que les deux pôles duaux d’une même dualité correspondent à des qualités simples, par opposition aux qualités composées. La distinction entre qualités simples et composées peut être effectuée de la manière suivante. Soient A1 et A2 des qualités simples. Dans ce cas, A1 ˄ A2, de même que A1 ˅ A2 sont des qualités composées. Pour prendre un exemple, statique, qualitatif, externe sont des qualités simples, alors que statique et qualitatif, statique et externe, qualitatif ou externe, sont des qualités composées. Une définition plus générale est ainsi la suivante : soient B1 et B2 des qualités simples ou composées, dans ce cas B1 ˄ B2, de même que B1 ˅ B2 sont des qualités composées. De manière incidente, ceci met également en évidence pourquoi les paires de concepts rouge/non-rouge, bleu/non-bleu ne peuvent pas être considérés comme des pôles duaux. En effet, non-rouge peut ainsi être défini en tant que qualité composée de la manière suivante : violet ˅ indigo ˅ bleu ˅ vert ˅ jaune ˅orange ˅ blanc ˅ noir. Dans ce contexte, on peut assimiler non-bleu à la négation-complément de bleu, une telle négation-complément étant définie à l’aide de qualités composées.

Compte tenu de la définition précédente, nous sommes également en mesure de distinguer les pôles duaux des objets vagues. Nous pouvons observer tout d’abord que les pôles duaux et les objets vagues possèdent en commun certaines propriétés. En effet, les objets vagues se présentent par paires, de la même manière que les pôles duaux. De plus, les concepts vagues sont considérés classiquement comme possédant une extension et une anti-extension, qui sont mutuellement exclusives. Une telle caractéristique est également partagée par les pôles duaux. À titre d’exemple, qualitatif et quantitatif s’assimilent à une extension et à une anti-extension, qui présentent la propriété d’être mutuellement exclusives ; il en va de même pour statique et dynamique, etc.

Cependant, il convient de souligner les différences existant entre les deux catégories de concepts. Une première différence (a) réside ainsi dans le fait que l’union de l’extension et l’anti-extension des concepts vagues n’est pas exhaustive, en ce sens qu’elles admettent des cas-limites (et aussi des cas-limites de cas-limites, etc. donnant ainsi naissance à une hiérarchie du vague d’ordre n), qui constitue une zone de pénombre. À l’inverse, les pôles duaux ne possèdent pas nécessairement une telle caractéristique. En effet, l’union des pôles duaux peut être soit exhaustive, soit non-exhaustive. Par exemple, la dualité abstrait/concret est, de manière intuitive, exhaustive, car il ne semble pas exister d’objets qui ne sont ni abstraits ni concrets. Il en va de même pour la dualité vague/précis : intuitivement, il n’existe pas en effet d’objets qui ne sont ni vagues ni précis, et qui appartiendraient à une catégorie intermédiaire. Ainsi, à la différence des objets vagues, il existe des pôles duaux dont l’extension et l’anti-extension se révèle exhaustive.

Il convient de mentionner, en second lieu, une autre différence (b) entre les pôles duaux et les objets vagues. En effet, les pôles duaux constituent des qualités simples, alors que les objets vagues peuvent consister en des qualités simples ou composées. Il existe en effet des concepts dénommés objets vagues multi-dimensionnels, tels que la notion de véhicule, de machine, etc. Enfin, une dernière différence entre les deux catégories d’objets (c) réside dans le fait que certains pôles duaux présentent une nature intrinsèquement précise. Tel est notamment le cas de la dualité individuel/collectif, qui est susceptible de donner lieu à une définition tout à fait précise.

2. Le principe d’indifférence dialectique

À partir des notions de dualité et de pôles duaux qui viennent d’être définis, nous sommes en mesure de définir également une notion de point de vue, relatif à une dualité ou un pôle dual donné. Ainsi, nous avons tout d’abord la notion de point de vue correspondant à une dualité donnée A/Ā : ceci correspond par exemple au point de vue de la dualité extension/restriction, celui de la dualité qualitatif/quantitatif, ou de la dualité diachronique/synchronique, etc. Il en résulte également la notion de point de vue relatif à un pôle donné d’une dualité A/Ā. Ainsi, on a par exemple le point de vue par extension (au niveau de la dualité extension/restriction), de même que le point de vue par restriction. De même, il en résulte le point de vue ou angle de vue qualitatif, ainsi que le point de vue ou angle de vue quantitatif, etc. (au niveau de la dualité qualitatif/quantitatif). Ainsi, lorsqu’on considère un objet donné o (que ce soit un objet concret ou bien un objet abstrait telle que par exemple une proposition ou un raisonnement), on est susceptible d’envisager ce dernier par rapport à différentes dualités, et au niveau de ces dernières, par rapport à chacun de ses deux pôles duaux.

L’idée sous-jacente inhérente aux points de vue relatifs à une dualité donnée, ou à un pôle donné d’une dualité, est que chacun des deux pôles d’une même dualité, toutes choses étant par ailleurs égales, possède une égale légitimité. En ce sens, si on considère un objet o du point de vue d’une dualité A/Ā, il convient de ne pas privilégier l’un des pôles par rapport à l’autre. Afin d’obtenir un point de vue objectif par rapport à une dualité A/Ā, il convient de se placer tout à tour du point de vue du pôle A, puis de celui du pôle Ā. Car une approche qui n’aborderait que le point de vue de l’un des deux pôles se révélerait partielle et tronquée. Le fait de considérer tour à tour le point de vue des deux pôles, lors de l’étude d’un objet o et de la classe de référence qui lui est associée, permet d’éviter une démarche subjective et de satisfaire, autant que possible, les besoins de l’objectivité.

On le voit, l’idée qui sous-tend la notion de point de vue peut être formalisée en un principe d’indifférence dialectique, de la manière suivante :

(PRINCIPE D’INDIFFERENCE DIALECTIQUE)Lorsqu’on considère un objet donné o et la classe de référence E qui lui est associée, sous l’angle de la dualité A/Ā, toutes choses étant par ailleurs égales, il convient d’accorder une égale importance au point de vue du pôle A et au point de vue du pôle Ā.

Ce principe est formulé en termes de principe d’indifférence : si l’on considère un objet o sous l’angle d’une dualité A/Ā, il n’y a pas lieu de privilégier le point de vue A par rapport au point de vue Ā, et sauf élément contraire résultant du contexte, on doit placer à égalité les points de vue A et Ā. Une conséquence directe de ce principe est que si l’on considère le point de vue du pôle A, il est nécessaire de prendre également en considération le point de vue du pôle opposé Ā (et réciproquement). La nécessité de prendre en considération les deux points de vue, celui résultant du pôle A et celui associé au pôle Ā, répond au souci d’analyser l’objet o et la classe de référence qui lui est associée d’un point de vue objectif. Cette objectivité est atteinte, autant que faire se peut, par la prise en considération des points de vue complémentaires qui sont ceux des pôles A et Ā. Chacun de ces points de vue possède en effet, eu égard à la dualité A/Ā, un droit égal à la pertinence. Dans de telles circonstances, lorsque seul le pôle A ou (exclusivement) le pôle Ā est pris en considération, il s’agit alors d’un point de vue que l’on peut appeler uni-polarisé. À l’inverse, le point de vue qui réalise la synthèse des points de vue correspondants aux pôles A et Ā, est par nature bi-polarisé. Fondamentalement, une telle démarche se révèle d’essence dialectique. En effet, l’étape d’analyse successive des points de vue complémentaires par rapport à une classe de référence donnée, est destinée à permettre, dans une étape ultérieure, une synthèse finale, qui résulte de la prise en compte conjointe des points de vue correspondant à la fois aux pôles A et Ā. Dans la présente construction, le processus de confrontation des différents points de vue pertinents par rapport à une dualité A/Ā est destiné à construire, cumulativement, un point de vue plus objectif et exhaustif que celui, uni-polarisé et nécessairement partiel, qui résulte de la prise en compte des données qui résultent d’un seul des deux pôles.

La définition du principe d’indifférence dialectique qui est proposée ici se réfère à une classe de référence E, qui se trouve associée à l’objet o. La classe de référence3 est constituée par un ensemble de phénomènes ou d’objets. Plusieurs exemples peuvent en être donnés : la classe des êtres humains ayant un jour existé, la classe des événements futurs de la vie d’une personne, la classe des parties du corps d’une personne, la classe des corbeaux, etc. Nous examinerons, dans ce qui suit, un certain nombre d’exemples. La mention d’une telle classe de référence possède son importance, car sa définition-même se trouve associée à la dualité A/Ā précitée. En effet, la classe de référence peut être définie du point de vue de A ou bien du point de vue de Ā. Une telle particularité nécessite d’être soulignée et nous sera utile lors de la définition du biais qui se trouve associé à la définition-même du principe d’indifférence dialectique : le biais d’uni-polarisation.

3. Caractérisation du biais d’uni-polarisation

La formulation précédente du principe d’indifférence dialectique suggère, de manière directe, une erreur de raisonnement d’un certain type. De manière informelle, une telle erreur de raisonnement consiste à privilégier un point de vue lorsqu’on s’intéresse à un objet donné, et à négliger le point de vue opposé. De manière plus formelle, dans le contexte qui vient d’être décrit, une telle erreur de raisonnement consiste, lorsqu’on considère un objet o et la classe de référence qui lui est associée, à ne prendre en considération que le point de vue du pôle A (respectivement Ā), en occultant complètement le point de vue du pôle dual Ā (respectivement A) pour définir cette classe de référence. Nous dénommerons biais d’uni-polarisation un tel type d’erreur de raisonnement. Les conditions de ce type de biais, en violation du principe d’indifférence dialectique, méritent toutefois d’être précisées. En effet, dans le présent contexte, on peut considérer qu’il existe certains cas, où la bi-polarisation par rapport à une dualité donnée A/Ā n’est pas requise. Tel est le cas lorsque les éléments du contexte ne présupposent pas des conditions d’objectivité et d’exhaustivité des points de vue. Ainsi, un avocat qui ne ferait valoir que les éléments à la décharge de son client, en ignorant complètement les éléments à charge, ne commettrait pas le type d’erreur de raisonnement précité. Dans une telle circonstance en effet, l’avocat ne commettrait pas un biais d’uni-polarisation dommageable, puisqu’il s’agit de la fonction qui lui est propre. Il en irait de même dans un procès pour le procureur qui, à l’inverse, mettrait uniquement l’accent sur les éléments à charge de la même personne, en ignorant complètement les éléments à décharge. Dans une telle situation également, le biais d’uni-polarisation en résultant ne serait pas inapproprié, car il résulte bien des éléments du contexte qu’il s’agit bien du rôle exact mais limité qui est assigné au procureur. En revanche, un juge qui ne prendrait en compte que les éléments à charge de l’accusé, ou bien qui commettrait l’erreur inverse, de ne considérer que les éléments à décharge de ce dernier, commettrait bien un biais d’uni-polarisation inapproprié, car le rôle-même du juge implique qu’il prenne en considération les deux catégories d’éléments et que son jugement provienne de la synthèse qui en résulte.

En outre, ainsi que nous l’avons évoqué plus haut, la mention d’une classe de référence associée à l’objet o se révèle importante. En effet, ainsi que nous aurons l’occasion de le constater avec l’analyse des exemples qui suivent, sa définition-même se trouve associée à une dualité A/Ā. Et la classe de référence peut être définie soit du point de vue de A, soit du point de vue de Ā. Une telle particularité a pour conséquence que tous les objets ne sont pas susceptibles de donner lieu à un biais d’uni-polarisation. En particulier, les objets auxquels ne sont pas associés une classe de référence qui est elle-même susceptible d’être envisagée sous l’angle d’une dualité A/Ā, ne donnent pas lieu à un tel biais d’uni-polarisation.

Avant d’illustrer la présente construction à l’aide de plusieurs exemples concrets, il apparaît utile à ce stade, de considérer le biais d’uni-polarisation qui vient d’être défini, et qui résulte de la définition-même du principe d’indifférence dialectique, à la lumière de plusieurs notions similaires. De manière préliminaire, nous pouvons observer qu’une description générale de ce type d’erreur de raisonnement avait déjà été formulée, en des termes voisins, par John Stuart Mill (On Liberty, II) :

He who knows only his own side of the case, knows little of that. His reasons may be good, and no one may have been able to refute them. But if he is equally unable to refute the reasons on the opposite side ; if he does not so much know what they are, he has no ground for preferring either opinion.

Dans la littérature récente, une notion très voisine a également été décrite. Il s’agit en particulier du biais dialectique défini notamment par Douglas Walton (1997, 1999). Walton (1999, pp. 76-77) se place ainsi dans le cadre la théorie dialectique des biais, qui oppose les arguments uni-polarisés aux arguments bi-polarisés :

The dialectical theory of bias is based on the idea […] that an argument has two sides. […] A one-sided argument continually engages in pro-argumentation for the position supported and continually rejects the arguments of the opposed side in a dialogue. A two-sided (balanced) argument considers all arguments on both sides of a dialogue. A balanced argument weights each argument against the arguments that have been opposed to it.

Walton décrit ainsi le biais dialectique (dialectical bias) comme un point de vue uni-polarisé qui survient au cours de l’argumentation. Le biais dans le raisonnement consiste ainsi à ne prendre en compte qu’un point de vue concernant l’argument en question, alors même que l’autre point de vue pourrait se révéler décisif quant à la conclusion à en tirer. Le raisonnement correspondant se trouve biaisé, en ce sens qu’il ne présente qu’un aspect des éléments qui justifient un jugement ou un point de vue donné, en occultant complètement l’autre aspect des éléments pertinents relatifs à ce même argument.

Walton souligne aussi que le biais dialectique, qui est très répandu dans l’argumentation humaine, ne constitue pas nécessairement une erreur de raisonnement. Suivant en cela la distinction entre «bon» et «mauvais» biais due à Antony Blair (1988), Walton considère que le biais dialectique est incorrect seulement dans certaines conditions, et en particulier s’il survient dans un contexte qui est supposé être équilibré, c’est-à-dire où les deux facettes du raisonnement correspondant sont censées être mentionnées (p. 81) :

Bad bias can be defined as “pure (one-sided) advocacy” in a situation where such unbalanced advocacy is normatively inappropriate in argumentation.

En outre, ainsi que nous aurons de le constater au moyen d’un exemple, le biais d’uni-polarisation pêche par le fait qu’un certain nombre de prémisses sont omises dans le raisonnement correspondant. Ce point est essentiel, car lorsque ces prémisses manquantes sont replacées au sein de l’argument, la conclusion qui en résulte n’est plus valide, et une conclusion radicalement différente prévaut alors.

4. Instance du biais d’uni-polarisation

Afin d’illustrer les notions précédentes, il s’avère intéressant, à ce stade, de donner un exemple du biais d’uni-polarisation. À cette fin, considérons l’instance suivante, qui consiste en une forme de raisonnement, mentionnée par Philippe Boulanger (2000, p. 3)4, qui l’attribue au mathématicien Stanislas Ulam. Le biais d’uni-polarisation s’y manifeste sous une forme déductive. Ulam estime ainsi que si une entreprise devait atteindre un niveau de main d’oeuvre suffisamment important, son niveau de performance serait paralysé par le grand nombre de conflits internes qui en résulteraient. Ulam estime ainsi que le nombre de conflits entre personnes augmenterait selon le carré du nombre n d’employés, alors que l’impact sur le travail qui en résulterait ne progresserait qu’en fonction de n. Ainsi, selon cet argument, il n’est pas souhaitable que le nombre d’employés au sein d’une entreprise devienne important. Cependant, il s’avère que le raisonnement d’Ulam est fallacieux, comme le souligne Boulanger, car il met exclusivement l’accent sur les relations conflictuelles entre employés. Or les n2 relations parmi les employés de l’entreprise peuvent être de nature conflictuelle, mais peuvent consister aussi bien en relations de collaboration tout à fait bénéfiques pour l’entreprise. Il n’y a donc pas de raison de privilégier les relations conflictuelles par rapport aux relations de collaboration. Et lorsque parmi les n2 relations qui s’établissent entre les employés de l’entreprise, certaines sont d’authentiques relations de collaboration, cela a pour effet, au contraire, d’améliorer la performance de l’entreprise. Par conséquent, on ne peut pas conclure légitimement qu’il n’est pas souhaitable que l’effectif d’une entreprise atteigne une taille importante.

Dans un souci de clarté, il s’avère utile de formaliser quelque peu le raisonnement précédent. Il apparaît ainsi que le raisonnement d’Ulam peut être présenté de la manière suivante :

(D1Ā) si <une entreprise présente un nombre important d’employés>

(D2Ā) alors <il en résultera n2 relations conflictuelles>

(D3Ā) alors des effets négatifs en résulteront

(D4Ā)  le fait qu’ <une entreprise ait un nombre important d’employés> est mauvais

Ce type de raisonnement présente la structure d’un biais d’uni-polarisation, car il met uniquement l’accent sur les relations conflictuelles (qui concernent le pôle de dissociation de la dualité association/dissociation), en passant sous silence un argument parallèle présentant la même structure qui pourrait être légitimement soulevé, mettant l’accent sur les relations de collaboration (associées au pôle d’association), qui constituent l’autre aspect pertinent sur ce sujet particulier. Cet argument parallèle est le suivant :

(D1A) si <une entreprise présente un nombre important d’employés>

(D2A) alors <il en résultera n2 relations de collaboration>

(D3A) alors des effets positifs en résulteront

(D4A)  le fait qu’ <une entreprise ait un nombre important d’employés> est bon

Ceci met finalement en lumière comment les deux formulations de l’argument conduisent à des conclusions contradictoires, c’est-à-dire (D4Ā) et (D4A). À ce stade, il est utile de souligner la structure-même de la conclusion du raisonnement ci-dessus, qui est la suivante :

(D5Ā) la situation s est mauvaise du point de vue Ā (dissociation)

alors que la conclusion du raisonnement parallèle est la suivante :

(D5A) la situation s est bonne du point de vue A (association)

Mais si le raisonnement avait été complet, en prenant en compte les deux points de vue, une autre conclusion en aurait résulté :

(D5Ā) la situation s est mauvaise du point de vue Ā (dissociation)

(D5A) la situation s est bonne du point de vue A (association)

(D6A/Ā) la situation s est mauvaise du point de vue Ā (dissociation) et bonne du point de vue A (association)

(D7A/Ā)  la situation s est neutre du point de vue de la dualité A/Ā (association/dissociation)

Et une telle conclusion s’avère tout à fait différente de celle qui résulte de (D5Ā) et de (D5A).

Finalement, nous sommes en mesure de caractériser le biais d’uni-polarisation qui vient d’être décrit dans le cadre du présent modèle : l’objet o est le raisonnement précité, la classe de référence est celle des relations existant entre les employés d’une entreprise, et la dualité correspondante — permettant de définir la classe de référence — est la dualité dissociation/association.

5. Analyse dichotomique et méta-philosophie

Le principe d’indifférence dialectique précité et son corollaire — le biais d’uni-polarisation — est susceptible de trouver des applications dans plusieurs domaines5. Nous nous intéresserons, dans ce qui suit, à ses applications à un niveau méta-philosophique, à travers l’analyse de plusieurs paradoxes philosophiques contemporains. La méta-philosophie constitue cette branche de la philosophie dont l’objet est l’étude de la nature de la philosophie, de sa finalité et de ses méthodes propres. Dans ce contexte, un domaine spécifique au sein de la méta-philosophie est celui de la méthode à employer pour s’attacher à résoudre, ou à progresser vers la résolution des paradoxes ou des problèmes philosophiques. C’est dans ce domaine spécifique que s’inscrit la présente construction, en ce sens qu’elle propose l’analyse dichotomique comme un outil qui peut se révéler utile pour aider à la résolution de paradoxes ou de problèmes philosophiques.

L’analyse dichotomique, en tant que méthodologie pouvant être utilisée pour la recherche de solutions à certains paradoxes ou problèmes philosophiques, résulte directement de l’énoncé-même du principe d’indifférence dialectique. L’idée générale qui sous-tend la démarche dichotomique d’analyse des paradoxes, est que deux versions, correspondant à l’un et l’autre pôle d’une dualité donnée, peuvent se trouver mêlées dans un paradoxe philosophique. La démarche consiste alors à trouver une classe de référence associée au paradoxe en question et la dualité A/Ā correspondante, ainsi que les deux variations du paradoxe qui en résultent et qui s’appliquent à chacun des pôles de cette dualité. Cependant, toute dualité ne convient pas pour cela, car pour nombre de dualités, la version correspondante du paradoxe demeure par essence inchangée, quel que soit le pôle que l’on envisage. Dans la méthode dichotomique, il s’agit de s’attacher à trouver une classe de référence et une dualité associée pertinente, telle que le point de vue de chacun de ses pôles conduise effectivement à deux versions structurellement différentes du paradoxe, ou bien à la disparition du paradoxe selon le point de vue de l’un des pôles. Ainsi, lorsque l’on envisage le paradoxe sous l’angle des deux pôles A et Ā, et que cela n’a aucune incidence concernant le paradoxe lui-même, la dualité A/Ā correspondante ne se révèle donc pas, de ce point de vue, pertinente.

L’analyse dichotomique ne constitue pas un outil qui prétend résoudre tous les problèmes philosophiques, loin s’en faut, mais seulement une méthodologie qui est susceptible d’apporter un éclairage pour certains d’entre eux. Dans ce qui suit, nous nous attacherons à illustrer, à travers plusieurs travaux de l’auteur, comment l’analyse dichotomique peut s’appliquer pour progresser vers la résolution de trois paradoxes philosophiques contemporains : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse.

De manière préliminaire, on peut observer ici que dans la littérature, on trouve également un exemple d’analyse dichotomique de paradoxe chez David Chalmers (2002). Chalmers s’attache ainsi à montrer comment le paradoxe des deux enveloppes comporte deux versions fondamentalement distinctes, dont l’une correspond à une version finie du paradoxe et l’autre à une version infinie. Une telle analyse, bien que conçue indépendamment de la présente construction, peut ainsi être caractérisée comme une analyse dichotomique fondée sur la dualité fini/infini.

Figure 3. Pôles duaux dans l’analyse de David Chalmers du paradoxe des deux enveloppes

6. Application à l’analyse des paradoxes philosophiques

À ce stade, il convient d’appliquer ce qui précède à l’analyse de problèmes concrets. Nous nous efforcerons ainsi d’illustrer cela à travers l’analyse de plusieurs paradoxes philosophiques contemporains : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse. Nous nous attacherons à montrer comment un problème de biais d’uni-polarisation associé à un problème de définition d’une classe de référence se rencontre dans l’analyse des paradoxes philosophiques précités. En outre, nous montrerons comment la définition-même de la classe de référence associée à chaque paradoxe est susceptible d’être qualifiée à l’aide des pôles duaux A et Ā d’une dualité A/Ā tels qu’ils viennent d’être définis.

6.1. Application à l’analyse du paradoxe de Hempel

Le paradoxe de Hempel est basé sur le fait que les deux assertions suivantes :

(H) Tous les corbeaux sont noirs

(H*) Tout ce qui est non-noir est un non-corbeau

sont logiquement équivalentes. Par sa structure, (H*) se présente en effet comme la forme contraposée de (H). Il en résulte que la découverte d’un corbeau noir confirme (H) et également (H*), mais aussi que la découverte d’une chose non-noire qui n’est pas un corbeau telle qu’un flamand rose ou même un parapluie gris, confirme (H*) et donc (H). Cependant, cette dernière conclusion apparaît comme paradoxale.

Nous nous attacherons maintenant à détailler l’analyse dichotomique sur laquelle se trouve basée la solution proposée dans Franceschi (1999). La démarche se trouve fondée sur la recherche d’une classe de référence associée à l’énoncé du paradoxe, qui est susceptible d’être définie à l’aide d’une dualité A/Ā. Si l’on examine ainsi avec soin les concepts et les catégories qui sous-tendent les propositions (H) et (H*), on remarque tout d’abord que ceux-ci sont au nombre de quatre : les corbeaux, les objets noirs, les objets non-noirs et les non-corbeaux. Un corbeau tout d’abord se trouve défini de manière précise dans la taxinomie au sein de laquelle il s’insère. Une catégorie comme celle des corbeaux peut être considérée comme bien définie, car elle est basée sur un ensemble de critères précis définissant l’espèce corvus corax et permettant l’identification de ses instances. De même, la classe des objets noirs peut être décrite avec précision, à partir d’une taxinomie des couleurs établie par rapport aux longueurs d’onde de la lumière. Enfin, on peut constater que la classe des objets non-noirs peut également faire l’objet d’une définition qui ne souffre pas d’ambiguïté, à partir notamment de la taxinomie précise des couleurs qui vient d’être mentionnée.

En revanche, qu’en est-il de la classe des non-corbeaux ? Qu’est-ce qui constitue une instance d’un non-corbeau ? Intuitivement, un merle bleu, un flamand rose, un parapluie gris, voire même un entier naturel, constituent des non-corbeaux. Mais doit-on envisager une classe de référence qui aille jusqu’à inclure les objets abstraits ? Faut-il ainsi considérer une notion de non-corbeau qui englobe des entités abstraites tels que les entiers naturels et les nombres complexes ? Ou bien convient-il se limiter à une classe de référence qui n’embrasse que les animaux ? Doit-on considérer une classe de référence qui englobe tous les êtres vivants, ou bien encore toutes les choses concrètes, incluant cette fois également les artefacts ? Finalement, il en résulte que la proposition (H*) initiale est susceptible de donner lieu à plusieurs variations, qui sont les suivantes :

(H1*) Tout ce qui est non-noir parmi les corvidés est un non-corbeau

(H2*) Tout ce qui est non-noir parmi les oiseaux est un non-corbeau

(H3*) Tout ce qui est non-noir parmi les animaux est un non-corbeau

(H4*) Tout ce qui est non-noir parmi les êtres vivants est un non-corbeau

(H5*) Tout ce qui est non-noir parmi les choses concrètes est un non-corbeau

(H6*) Tout ce qui est non-noir parmi les objets concrets et abstraits est un non-corbeau

Ainsi, il apparaît que l’énoncé du paradoxe de Hempel et en particulier la proposition (H*) se trouve associée à une classe de référence, qui permet de définir les non-corbeaux. Une telle classe de référence peut s’assimiler aux corvidés, aux oiseaux, aux animaux, aux êtres vivants, aux choses concrètes, ou encore aux choses concrètes et abstraites, etc. Cependant, dans l’énoncé du paradoxe de Hempel, on ne dispose pas de critère objectif permettant d’effectuer un tel choix. À ce stade, il apparaît que l’on peut choisir une telle classe de référence de manière restrictive, par exemple en l’assimilant aux corvidés. Mais de manière aussi légitime, on peut choisir une classe de référence de manière plus extensive, par exemple en l’identifiant à l’ensemble des choses concrètes, incluant alors notamment les parapluies. Alors pourquoi choisir telle classe de référence définie de manière restrictive plutôt que telle autre définie de façon extensive ? On ne possède pas en réalité de critère pour légitimer le choix, selon que l’on procède par restriction ou par extension, de la classe de référence. Dès lors, il apparaît que celle-ci ne peut être définie que de manière arbitraire. Or le choix d’une telle classe de référence se révèle déterminant, car selon que l’on choisira telle ou telle classe de référence, un objet donné tel qu’un parapluie gris confirmera ou non (H*) et donc (H). Ainsi, si nous choisissons la classe de référence par extension, incluant ainsi l’ensemble des objets concrets, un parapluie gris confirmera (H). Cependant, si nous choisissons une telle classe de référence par restriction, en l’assimilant seulement aux corvidés, un parapluie gris ne confirmera pas (H). Une telle différence se révèle essentielle. En effet, si l’on choisit une définition extensive de la classe de référence, on a bien l’effet paradoxal inhérent au paradoxe de Hempel. Mais dans le cas contraire, si l’on opte pour une classe de référence définie de manière restrictive, on perd alors l’effet paradoxal.

Figure 4. Pôles duaux au sein de la classe de référence des non-corbeaux dans le paradoxe de Hempel

Ce qui précède permet de décrire avec précision les éléments de l’analyse qui précède du paradoxe de Hempel, en termes de biais d’uni-polarisation ainsi qu’il a été défini plus haut : au paradoxe et en particulier à la proposition (H*) se trouve associée la classe de référence des non-corbeaux, qui est elle-même susceptible d’être définie par rapport à ladualité extension/restriction. Or, pour un objet donné tel qu’un parapluie gris, la définition de la classe de référence par extension donne lieu à un effet paradoxal, alors-même que le choix de cette dernière par restriction ne conduit pas à un tel effet.

6.2. Application à l’analyse du paradoxe de l’examen-surprise

La version classique du paradoxe de l’examen-surprise (Quine, 1953 ; Sorensen, 1988) est la suivante : un professeur annonce à ses étudiants qu’un examen aura lieu la semaine prochaine, mais qu’ils ne pourront pas connaître à l’avance le jour précis où l’examen se déroulera. L’examen aura donc lieu par surprise. Les étudiants raisonnent ainsi. L’examen ne peut avoir lieu le samedi, pensent-ils, car sinon ils sauraient à l’avance que l’examen aurait lieu le samedi et donc il ne pourrait survenir par surprise. Aussi le samedi se trouve-t-il éliminé. De plus, l’examen ne peut avoir lieu le vendredi, car sinon les étudiants sauraient à l’avance que l’examen aurait lieu le vendredi et donc il ne pourrait survenir par surprise. Aussi le vendredi se trouve-t-il également éliminé. Par un raisonnement analogue, les étudiants éliminent successivement le jeudi, le mercredi, le mardi et le lundi. Finalement, ce sont tous les jours de la semaine qui sont ainsi éliminés. Toutefois, cela n’empêche pas l’examen de survenir finalement par surprise, le mercredi. Ainsi, le raisonnement des étudiants s’est avéré fallacieux. Pourtant, un tel raisonnement paraît intuitivement valide. Le paradoxe réside ici dans le fait que le raisonnement des étudiants est semble-t-il valide, alors qu’il se révèle finalement en contradiction avec les faits, à savoir que l’examen peut véritablement survenir par surprise, conformément à l’annonce faite par le professeur.

Afin de présenter l’analyse dichotomique (Franceschi, 2005) qui peut être effectuée par rapport au paradoxe de l’examen-surprise, il convient de considérer tout d’abord deux variations qui apparaissent structurellement différentes du paradoxe. Une première variation est associée à la solution au paradoxe proposée par Quine (1953). Quine considère ainsi la conclusion finale de l’étudiant selon laquelle l’examen ne peut avoir lieu par surprise aucun jour de la semaine. Selon Quine, l’erreur de l’étudiant réside dans le fait de n’avoir pas envisagé dès le début l’hypothèse selon laquelle l’examen pourrait avoir lieu le dernier jour. Car le fait de considérer précisément que l’examen n’aura pas lieu le dernier jour permet finalement à l’examen de survenir par surprise, le dernier jour. Si l’étudiant avait également pris en compte cette possibilité dès le début, il ne serait pas parvenu à la conclusion fallacieuse que l’examen ne peut pas survenir par surprise.

La seconde variation du paradoxe qui se révèle intéressante dans le présent contexte, est celle qui est associée à la remarque, effectuée par plusieurs auteurs (Hall, 1999, p. 661; Williamson, 2000), selon laquelle le paradoxe émerge nettement, lorsque le nombre n d’unités est grand. Un tel nombre est habituellement associé à un nombre n de jours, mais on peut aussi bien utiliser des heures, des minutes, des secondes, etc. Une caractéristique intéressante du paradoxe est en effet que celui-ci émerge intuitivement de manière plus nette lorsque de grandes valeurs de n sont prises en compte. Une illustration frappante de ce phénomène nous est ainsi fournie par la variation du paradoxe qui correspond à la situation suivante, décrite par Timothy Williamson (2000, p. 139) :

Advance knowledge that there will be a test, fire drill, or the like of which one will not know the time in advance is an everyday fact of social life, but one denied by a surprising proportion of early work on the Surprise Examination. Who has not waited for the telephone to ring, knowing that it will do so within a week and that one will not know a second before it rings that it will ring a second later ?

La variation décrite par Williamson correspond à l’annonce faite à quelqu’un qu’il recevra un coup de téléphone dans la semaine, sans pouvoir toutefois déterminer à l’avance à quelle seconde précise un tel événement surviendra. Cette variation souligne comment la surprise peut se manifester, de manière tout à fait plausible, lorsque la valeur de n est élevée. L’unité de temps considérée par Williamson est ici la seconde, rapportée à une période qui correspond à une semaine. La valeur correspondante de n est ici très élevée et égale à 604 800 (60 × 60 × 24 × 7) secondes. Cependant, il n’est pas indispensable de prendre en compte une valeur aussi grande de n, et une valeur de n égale par exemple à 365 convient également très bien.

Le fait que deux versions qui semblent a priori assez différentes du paradoxe coexistent, suggère que deux versions structurellement différentes du paradoxe pourraient se trouver inextricablement mêlées dans le paradoxe de l’examen-surprise. De fait, si l’on analyse la version du paradoxe qui donne lieu à la solution de Quine, on s’aperçoit qu’elle présente une particularité : elle est susceptible de se manifester pour une valeur de n égale à 1. La version correspondante de l’annonce du professeur est alors la suivante : «Un examen aura lieu demain, mais vous ne pourrez savoir à l’avance que cet examen aura lieu et par conséquent, il surviendra par surprise.» L’analyse de Quine s’applique directement à cette version du paradoxe pour laquelle n = 1. Dans ce cas, l’erreur de l’étudiant réside, selon Quine, dans le fait de n’avoir considéré que la seule hypothèse suivante : (a) «l’examen aura lieu demain et je prévoirai qu’il aura lieu». En fait, l’étudiant aurait dû considérer également trois autres cas : (b) «l’examen n’aura pas lieu demain et je prévoirai qu’il aura lieu» ; (c) «l’examen n’aura pas lieu demain et je ne prévoirai pas qu’il aura lieu» ; (d) «l’examen aura lieu demain et je ne prévoirai pas qu’il aura lieu». Et le fait de considérer l’hypothèse (a) mais également l’hypothèse (d) qui est compatible avec l’annonce du professeur aurait empêché l’étudiant de conclure que l’examen n’aurait finalement pas lieu. Par conséquent, souligne Quine, c’est le fait de n’avoir pris en considération que l’hypothèse (a) qui peut être identifié comme la cause du raisonnement fallacieux.

On le voit, la structure-même de la version du paradoxe sur laquelle est fondée la solution de Quine présente les particularités suivantes : d’une part, la non-surprise peut effectivement survenir le dernier jour, et d’autre part, l’examen peut également survenir par surprise le dernier jour. Il en va de même pour la version du paradoxe où n = 1 : la non-surprise ainsi que la surprise peuvent survenir le jour n. Ceci permet de représenter une telle structure du paradoxe sous forme de la matrice S[k, s] suivante (où k dénote le jour où l’examen a lieu et S[k, s] dénote si le cas correspondant de non-surprise (s = 0) ou de surprise (s = 1) est rendu possible (dans ce cas, S[k, s] = 1) ou non (dans ce cas, S[k, s] = 0)) :

journon-surprisesurprise
111
211
311
411
511
611
711

Structure matricielle de la version du paradoxe correspondant à la solution de Quine pour n = 7 (une semaine)

journon-surprisesurprise
111

Structure matricielle de la version du paradoxe correspondant à la solution de Quine pour n = 1 (un jour)

Compte tenu de la structure correspondante de la matrice qui admet des valeurs égales à 1 à la fois au niveau des cas de non-surprise et de surprise, pour un jour donné, nous dénommerons conjointe une telle structure de matrice.

Si l’on étudie la variation du paradoxe énoncée par Williamson et mentionnée plus haut, elle présente la particularité, à l’inverse de la variation précédente, d’émerger de manière nette lorsque n est grand. Dans ce contexte, l’annonce du professeur correspondante par exemple à une valeur de n égale à 365, est la suivante : «Un examen aura lieu dans l’année à venir mais la date de l’examen constituera une surprise». Si l’on analyse une telle variation en termes de matrice des cas de non-surprise et de surprise, il apparaît qu’une telle version du paradoxe présente les propriétés suivantes : la non-surprise ne peut survenir le 1er jour alors que la surprise est possible ce même 1er jour ; en revanche, le dernier jour, la non-surprise est possible alors que la surprise n’est pas possible.

journon-surprisesurprise
101
36510

Structure matricielle de la version du paradoxe correspondant à la variation de Williamson pour n = 365 (un an)

Ce qui précède permet maintenant d’identifier avec précision ce qui pêche dans le raisonnement de l’étudiant, lorsqu’il s’applique à cette version particulière du paradoxe. Dans ces circonstances, l’étudiant aurait alors dû raisonner de la manière suivante. La surprise ne peut se manifester le dernier jour mais peut survenir le 1er jour ; la non-surprise peut se manifester le dernier jour, mais ne peut survenir le 1er jour. Il s’agit ici d’instances propres de non-surprise et de surprise, qui se révèlent disjointes. Cependant, la notion de surprise n’est pas capturée de manière exhaustive par l’extension et l’anti-extension de la surprise. Or une telle définition est conforme à la définition d’un prédicat vague, qui se caractérise par une extension et une anti-extension mutuellement exclusives et non-exhaustives. Ainsi, la conception de la surprise associée une structure disjointe est-elle celle d’une notion vague. Aussi l’erreur à l’origine du raisonnement fallacieux de l’étudiant réside-t-elle dans l’absence de prise en compte du fait que la surprise correspond dans le cas d’une structure disjointe, à une notion vague, et comporte donc la présence d’une zone de pénombre correspondant à des cas-limites (borderline) entre la non-surprise et la surprise. Car la seule prise en compte du fait que la notion de surprise est ici une notion vague aurait interdit à l’étudiant de conclure que S[k, 1] = 0, pour toutes les valeurs de k, c’est-à-dire que l’examen ne peut survenir par surprise aucun jour de la période considérée.

Finalement, il apparaît ainsi que l’analyse conduit à distinguer au niveau du paradoxe de l’examen-surprise deux variations indépendantes. La définition matricielle des cas de non-surprise et de surprise conduit à distinguer deux variations du paradoxe, en fonction de la dualité conjoint/disjoint. Dans un premier cas, le paradoxe est basé sur une définition conjointe des cas de non-surprise et de surprise. Dans un second cas, le paradoxe se trouve fondé sur une définition disjointe. Chacune de ces deux variations conduit à une variation structurellement différente du paradoxe et à une solution indépendante. Lorsque la variation du paradoxe est basée sur une définition conjointe, la solution développée par Quine s’applique alors. En revanche, lorsque la variation, du paradoxe est fondée sur une définition disjointe, la solution retenue est fondée sur la reconnaissance préalable de la nature vague de la notion de surprise associée à cette variation du paradoxe.

Figure 5. Pôles duaux dans la classe des matrices associées au paradoxe de l’examen-surprise

On le voit finalement, l’analyse dichotomique du paradoxe de l’examen-surprise conduit à envisager la classe des matrices associées à la définition-même du paradoxe et à distinguer selon que leur structure est conjointe ou bien disjointe. Dès lors, il en résulte une solution indépendante pour chacune des deux versions structurellement différentes du paradoxe qui en résultent.

6.3. Application à l’analyse de l’Argument de l’Apocalypse

L’argument de l’Apocalypse, attribué à Brandon Carter, a été décrit par John Leslie (1993, 1996). Il convient d’en rappeler préalablement l’énoncé. Considérons la proposition (A) suivante :

(A) L’espèce humaine disparaîtra avant la fin du XXIème siècle

On peut estimer, pour fixer les idées, à une chance sur 100 la probabilité que cette disparition survienne : P(A) = 0,01. Soit également la proposition suivante :

(Ā) L’espèce humaine ne disparaîtra pas à la fin du XXIème siècle

Soit encore E l’événement : je vis durant les années 2010. On peut par ailleurs estimer aujourd’hui à 60 milliards le nombre d’humains ayant existé depuis la naissance de l’humanité. De même, la population actuelle peut être évaluée à 6 milliards. On calcule ainsi qu’un humain sur dix, si l’événement A survient, aura connu les années 2010. On évalue alors la probabilité que l’humanité soit éteinte avant la fin du XXIème siècle, si j’ai connu les années 2010 : P(E, A) = 6×109/6×1010 = 0,1. Par contre, si l’humanité passe le cap du XXIème siècle, on peut penser qu’elle sera appelée à une expansion beaucoup plus importante, et que le nombre des humains pourra s’élever par exemple à 6×1012. Dans ce cas, la probabilité que l’humanité ne soit pas éteinte à la fin du XXIème siècle, si j’ai connu les années 2010 s’évalue ainsi : P(E, Ā) = 6×109/6×1012 = 0,001. À ce stade, nous pouvons assimiler à deux urnes distinctes — l’une contenant 60 milliards de boules et l’autre en comportant 6000 milliards — les populations humaines totales qui en résultent. Ceci conduit à calculer la probabilité a posteriori de l’extinction de l’espèce humaine avant la fin du XXIème siècle, à l’aide de la formule de Bayes : P'(A) = [P(A) x P(E, A)] / [P(A) x P(E, A) + P(Ā) x P(E, Ā)] = (0,01 x 0,1) / (0,01 x 0,1 + 0,99 x 0,001) = 0,5025. Ainsi, la prise en compte du fait que je vis actuellement fait passer la probabilité de l’extinction de l’espèce humaine avant 2150 de 1 % à 50,25 %. Une telle conclusion apparaît comme contraire à l’intuition et en ce sens, paradoxale.

Il convient maintenant de s’attacher comment une analyse dichotomique (Franceschi, 1999, 2009) peut s’appliquer à l’argument de l’Apocalypse. En premier lieu, nous nous attacherons à montrer comment l’argument de l’Apocalypse comporte un problème de définition de classe de référence6 liée à une dualité A/Ā. Considérons en effet l’assertion suivante :

(A) L’espèce humaine disparaîtra avant la fin du XXIème siècle

Une telle proposition présente une connotation dramatique, apocalyptique et tragique, liée à la disparition très prochaine de l’espèce humaine. Il s’agit là d’une prédiction de nature tout à fait catastrophique et alarmante. Cependant, si on analyse une telle proposition avec soin, on est conduit à remarquer qu’elle comporte une imprécision. Si la référence temporelle elle-même — la fin du XXIème siècle — se révèle tout à fait précise, le terme d’ «espèce humaine» proprement dit apparaît comme ambigu. En effet, il s’avère qu’il existe plusieurs façons de définir cette dernière. La notion la plus précise permettant de définir l’ «espèce humaine» est notre présente taxinomie scientifique, basée sur les notions de genre, d’espèce, de sous-espèce, etc. En adaptant cette dernière taxinomie à l’assertion (A), il s’ensuit que la notion ambiguë d’ «espèce humaine» est susceptible d’être définie par rapport au genre, à l’espèce, à la sous-espèce, etc. et en particulier par rapport au genre homo, à l’espèce homo sapiens, à la sous-espèce homo sapiens sapiens, etc. Finalement, il s’ensuit que l’assertion (A) est susceptible de revêtir les formes suivantes :

(Ah) Le genre homo disparaîtra avant la fin du XXIème siècle

(Ahs) L’espèce homo sapiens disparaîtra avant la fin du XXIème siècle

(Ahss) La sous-espèce homo sapiens sapiens disparaîtra avant la fin du XXIème siècle

À ce stade, la lecture de ces différentes propositions conduit à un impact différent, eu égard à la proposition initiale (A). Car si (Ah) présente bien à l’instar de (A) une connotation tout à fait dramatique et tragique, il n’en va pas de même pour (Ahss). En effet, une telle proposition qui prévoit l’extinction de notre sous-espèce actuelle homo sapiens sapiens avant la fin du XXIème siècle, pourrait s’accompagner du remplacement de notre actuelle race humaine par une nouvelle sous-espèce plus évoluée, que l’on pourrait dénommer homo sapiens supersapiens. Dans ce cas, la proposition (Ahss) ne comporterait pas de connotation tragique, mais serait associée à une connotation positive, car le remplacement d’une race ancienne par une espèce plus évoluée constitue un processus naturel de l’évolution. Plus encore, en choisissant une classe de référence encore plus restreinte telle que celle des humains n’ayant pas connu l’ordinateur (homo sapiens sapiens antecomputeris), on obtient la proposition suivante :

(Ahsss) L’infra-sous-espèce homo sapiens sapiens antecomputeris disparaîtra avant la fin du XXIème siècle

qui ne présente plus du tout la connotation dramatique inhérente à (A) et qui se révèle même tout à fait normale et rassurante, et qui ne présente plus de caractère paradoxal ni contraire à l’intuition. Dans ce cas en effet, la disparition de l’infra-sous-espèce homo sapiens sapiens antecomputeris s’accompagne de la surviede l’infra-sous-espèce plus évoluée homo sapiens sapiens postcomputeris. Il s’avère ainsi qu’un classe de référence restreinte coïncidant avec une infra-sous-espèce est définitivement éteinte, mais qu’une classe plus étendue correspondant à une sous-espèce (homo sapiens sapiens) survit. Dans ce cas, on observe bien le décalage bayesien décrit par Leslie, mais l’effet de ce décalage se révèle cette fois tout à fait inoffensif.

Ainsi, le choix de la classe de référence pour la proposition (A) se révèle-t-il déterminant pour la nature paradoxale de la conclusion associée à l’argument de l’Apocalypse. Si l’on choisit ainsi une classe de référence étendue pour la définition-même des humains, en l’associant par exemple au genre homo, on conserve le caractère dramatique et inquiétant associé à la proposition (A). Mais si on choisit une telle classe de référence de manière restrictive, en l’associant par exemple à l’infra-sous-espèce homo sapiens sapiens antecomputeris, un contenu rassurant et normal se trouve désormais associé à la proposition (A) qui sous-tend l’argument de l’Apocalypse.

Finalement, nous sommes en mesure de replacer l’analyse qui précède dans le présent contexte. La définition-même de la classe de référence des «humains» associée à la proposition (A) inhérente à l’argument de l’Apocalypse est susceptible d’être définie selon les pôles de la dualité extension/restriction. Une analyse fondée sur un point de vue bi-polarisé conduit à constater que le choix par extension entraîne un effet paradoxal, alors-même que le choix par restriction de la classe de référence fait disparaître ce même effet paradoxal.

Figure 6. Pôles duaux au sein de la classe de référence des «humains» dans l’Argument de l’Apocalypse

L’analyse dichotomique, toutefois, en ce qui concerne l’argument de l’Apocalypse, ne se limite pas à cela. En effet, si on étudie l’argument avec soin, il apparaît qu’il recèle une autre classe de référence associée à une autre dualité. Ceci peut être mis en évidence en analysant l’argument opposé par William Eckhardt (1993, 1997) à l’argument de l’Apocalypse. Selon Eckhardt, la situation humaine correspondant à DA n’est pas analogue au modèle des deux urnes décrit par Leslie, mais plutôt à un modèle alternatif, qui peut être appelé le distributeur d’objets consécutifs (consecutive token dispenser). Le distributeur d’objets consécutifs est un dispositif qui éjecte à intervalles réguliers des boules numérotées consécutivement :

(…) suppose on each trial the consecutive token dispenser expels either 50 (early doom) or 100 (late doom) consecutively numbered tokens at the rate of one per minute.

S’appuyant sur ce modèle, Eckhardt (1997, p. 256) souligne le fait qu’il est impossible d’effectuer une sélection aléatoire, dès lorsqu’il existe de nombreux individus qui ne sont pas encore nés au sein de la classe de référence correspondante : «How is it possible in the selection of a random rank to give the appropriate weight to unborn members of the population ?». L’idée forte d’Eckhardt qui sous-tend cette objection diachronique est qu’il est impossible d’effectuer une sélection aléatoire lorsqu’il existe de nombreux membres au sein de la classe de référence qui ne sont pas encore nés. Dans une telle situation, il serait tout à fait erroné de conclure à un décalage bayesien en faveur de l’hypothèse (A). En revanche, ce que l’on peut inférer de manière rationnelle dans un tel cas, c’est que la probabilité initiale demeure inchangée.

À ce stade, il apparaît que deux modèles alternatifs pour modéliser l’analogie avec la situation humaine correspondant à l’argument de l’Apocalypse se trouvent en concurrence : d’une part le modèle à caractère synchronique (où toutes les boules sont présentes dans l’urne au moment où s’effectue le tirage) préconisé par Leslie et d’autre part, le modèle diachronique d’Eckhardt, où des boules peuvent être ajoutées dans l’urne après le tirage. La question qui se pose est la suivante : la situation humaine correspondant à l’argument de l’Apocalypse est-elle en analogie avec (a) le modèle de l’urne synchronique, ou bien avec (b) le modèle de l’urne diachronique ? Afin d’y répondre, la question suivante s’ensuit : existe-t-il un critère objectif qui permette de choisir, de manière préférentielle, entre les deux modèles concurrents ? Il apparaît que non. En effet, ni Leslie ni Eckhardt ne présentent une motivation objective qui permette de justifier le choix du modèle qu’ils préconisent, et d’écarter le modèle alternatif. Dans ces circonstances, le choix de l’un ou l’autre des deux modèles — synchronique ou diachronique — apparaît comme arbitraire. Par conséquent, il s’avère que le choix au sein de la classe des modèles associée à l’argument de l’Apocalypse est susceptible d’être défini selon les pôles de la dualité synchronique/diachronique. Et une analyse fondée sur un point de vue bi-polarisé conduit à constater que le choix du modèle synchronique conduit à un effet paradoxal, alors-même que le choix du modèle diachronique fait disparaître ce dernier effet paradoxal.

Figure 7. Pôles duaux au sein de la classe des modèles de l’Argument de l’Apocalypse

Finalement, compte tenu du fait que le problème précité concernant la classe de référence des humains et le choix dans la dualité extension/restriction qui lui est associé, ne concerne que le modèle synchronique, la structure de l’analyse dichotomique à un double niveau concernant l’argument de l’Apocalypse, peut être représentée de la manière suivante :

Figure 8. Structure de pôles duaux imbriqués Diachronie/Synchronie et Extension/Restriction pour l’Argument de l’Apocalypse

On le voit, les développements qui précèdent mettent en oeuvre la forme de contextualisme dialectique qui a été décrite plus haut, en l’appliquant à l’analyse de trois paradoxes philosophiques contemporains. Dans le paradoxe de Hempel, à la proposition (H*) se trouve associée la classe de référence des non-corbeaux, qui est elle-même susceptible d’être définie par rapport à ladualité extension/restriction. Or, pour un objet x donné tel qu’un parapluie gris, la définition de la classe de référence par extension donne lieu à un effet paradoxal, alors-même que le choix de cette dernière par restriction élimine un tel effet. En second lieu, les structures matricielles associées au paradoxe de l’examen-surprise sont analysées sous l’angle de la dualité conjoint/disjoint, mettant ainsi en évidence deux versions structurellement distinctes du paradoxe, qui admettent elles-mêmes deux résolutions indépendantes. Enfin, au niveau de l’argument de l’Apocalypse, une analyse dichotomique double met en évidence que la classe des humains est liée à la dualité extension/restriction, et que l’effet paradoxal qui est manifeste lorsque la classe de référence est définie par extension, se dissout dès lors que cette dernière est définie par restriction. En second lieu, il s’avère que la classe des modèles peut faire l’objet d’une définition selon la dualité synchronique/diachronique ; au point de vue synchronique se trouve associé un effet paradoxal, alors que ce même effet disparaît si l’on se place du point de vue diachronique.

Remerciements

Je suis très reconnaissant envers Pascal Engel à qui je dois l’inspiration de la rédaction de ce texte. Il a en effet été élaboré à partir d’éléments entièrement remaniés de mon mémoire d’habilitation à diriger les recherches, présenté en 2006, comportant notamment la correction d’une erreur conceptuelle, suivant en cela les commentaires et les recommandations que Pascal Engel m’avait faits à l’époque. Une version antérieure de ce texte a été incluse dans le Liber Amicorum dédié à Pascal Engel.


Références

Beck, Aaron, 1963, «Thinking and depression : Idiosyncratic content and cognitive distortions», Archives of General Psychiatry, vol. 9, p. 324-333.

Beck, Aaron, 1964, «Thinking and depression : Theory and therapy», Archives of General Psychiatry, vol. 10, p. 561-571.

Blair, J. Anthony, 1988, «What Is Bias ?» dans Trudy Govier dir., Selected Issues in Logic and Communication, Belmont CA, Wadsworth, p. 101-102).

Boulanger, Philippe, 2000, «Culture et nature», Pour la Science, vol. 273, p. 3.

Chalmers, David, 2002, «The St. Petersburg two-envelope paradox», Analysis, vol. 62, p. 155-157.

Eckhardt, William, 1993, «Probability Theory and the Doomsday Argument», Mind, vol. 102, p. 483-488.

Eckhardt, William, 1997, «A Shooting-Room view of Doomsday», Journal of Philosophy, vol. 94, p. 244-259.

Ellis, Albert, 1962, Reason and Emotion in Psychotherapy, New York, Lyle Stuart.

Franceschi, Paul, 1999, «Comment l’urne de Carter et Leslie se déverse dans celle de Carter», Canadian Journal of Philosophy, vol. 29, p. 139-156.

Franceschi, Paul, 2002, «Une classe de concepts», Semiotica, vol. 139 (1-4), p. 211-226.

Franceschi, Paul, 2005, «Une analyse dichotomique du paradoxe de l’examen surprise», Philosophiques, vol. 32-2, p. 399-421.

Franceschi, Paul, 2007, «Compléments pour une théorie des distorsions cognitives», Journal de Thérapie Comportementale et Cognitive,vol. 17-2, p. 84-88.

Franceschi, Paul, 2009, «A Third Route to the Doomsday Argument», Journal of Philosophical Research, vol. 34, p. 263-278.

Hall, Ned, 1999, «How to Set a Surprise Exam», Mind, vol. 108, p. 647-703.

Leslie, John, 1993, «Doom and Probabilities», Mind, vol. 102, p. 489-491.

Leslie, John, 1996, The End of the World : the science and ethics of human extinction, Londres, Routledge

Quine, Willard Van Orman, 1953, «On a So-called Paradox», Mind, vol. 62, p. 65-66.

Sorensen, Roy, 1988, Blindspots, Oxford, Clarendon Press.

Stuart Mill, John, 1985, On Liberty, Londres, Penguin Classics, original publication in 1859.

Walton, Douglas, 1997, «What is Propaganda, and What Exactly is Wrong with it», Public Affairs Quarterly, vol. 11, p. 383-413.

Walton, Douglas, 1999, One-Sided Arguments : A Dialectical Analysis of Bias, Albany, State University of New York Press.

Williamson, Timothy, 2000, Knowledge and its Limits, Londres & New York, Routledge.


1Une telle notion se trouve au coeur du concept de matrice de concepts introduit dans Franceschi (2002), dont on peut considérer qu’elle constitue le noyau, ou une forme simplifiée. Pour le présent exposé portant spécifiquement sur les éléments du contextualisme dialectique et leur application pour la résolution de paradoxes philosophiques, la présentation des pôles duaux se révèle suffisante.

2Plusieurs problèmes ouverts en résultent dans cette construction : (a) est-il possible de concevoir une liste qui soit exhaustive de telles dualités ? (b) existe-t-il une méthodologie pour produire une liste la plus exhaustive possible de ces dualités ?

3La présente construction s’applique également à des objets qui sont associés à plusieurs classes de référence. Nous nous limitons ici, dans un souci de simplification, à une seule classe de référence.

4Philippe Boulanger indique (correspondance personnelle) qu’il a entendu Stanislas Ulam développer ce point particulier lors d’une conférence à l’Université du Colorado.

5Une application de la présente construction aux distorsions cognitives, introduites par Aaron Beck (1963, 1964) dans les éléments constitutifs de la thérapie cognitive, est donnée dans Franceschi (2007). Les distorsions cognitives sont classiquement définies comme des raisonnements fallacieux jouant un rôle déterminant dans l’émergence d’un certain nombre de troubles mentaux. La thérapie cognitive en particulier se fonde sur l’identification de ces distorsions cognitives dans le raisonnement usuel du patient, et leur remplacement par des raisonnements alternatifs. Classiquement, les distorsions cognitives sont décrites comme l’un des douze modes de raisonnement irrationnel suivants : 1. Raisonnement émotionnel 2. Hyper-généralisation 3. Inférence arbitraire 4. Raisonnement dichotomique 5. Obligations injustifiées (Should statements, (Ellis 1962)) 6. Divination ou lecture mentale 7. Abstraction sélective 8. Disqualification du positif 9. Maximisation et minimisation 10. Catastrophisme 11. Personnalisation 12. Étiquetage.

6L’analyse de l’argument de l’Apocalypse du point de vue du problème de la classe de référence est effectuée de manière détaillée par Leslie (1996). Mais l’analyse de Leslie vise à montrer que le choix de la classe de référence, par extension ou par restriction, n’a pas d’incidence sur la conclusion de l’argument lui-même.

Une solution pour le paradoxe de Goodman

Une Solution pour le Paradoxe de Goodman

Paul FRANCESCHI

Université de Corse

publié dans Dialogue, winter 2001, vol. 40, pp. 99-123

ABSTRACT: In the classical version of Goodman’s paradox, the universe where the problem takes place is ambiguous. The conditions of induction being accurately described, I define then a framework of n-universes, allowing the distinction, among the criteria of a given n-universe, between constants and variables. Within this framework, I distinguish between two versions of the problem, respectively taking place: (i) in an n-universe the variables of which are colour and time; (ii) in an n-universe the variables of which are colour, time and space. Finally, I show that each of these versions admits a specific resolution.

1. Le problème

Le paradoxe de Goodman (Goodman’s Paradox, soit GP dans ce qui suit) a été énoncé par Nelson Goodman (1946)[1]. Goodman expose son paradoxe de la manière suivante[2]. Soit une urne contenant 100 boules. Une boule est tirée chaque jour dans l’urne, durant 99 jours, jusqu’à aujourd’hui. A chaque fois, la boule extraite de l’urne est rouge. Intuitivement, on s’attend à ce que la 100ème boule tirée soit également rouge. Cette prédiction est basée sur la généralisation selon laquelle toutes les boules dans l’urne sont rouges. Cependant, si on considère la propriété S “tiré avant aujourd’hui et rouge ou tiré après aujourd’hui et non rouge”, on constate que cette propriété est également vérifiée par les 99 instances déjà observées. Mais la prédiction qui en résulte cette fois, basée sur la généralisation selon laquelle toutes les boules sont S, est que la 100ème boule sera non rouge. Et ceci est contraire à la conclusion précédente, qui est elle-même pourtant conforme à notre intuition[3]. Goodman exprime ainsi GP à l’aide d’une induction énumérative. Et on peut modéliser GP en termes de SR (straight rule). Si l’on prend (D) pour la définition du prédicat “rouge”, (I) pour l’énumération des instances, (H) pour la généralisation en résultant, et (P) pour la prédiction correspondante, on a alors :

(D) R = rouge (I) Rb1·Rb2·Rb3·…·Rb99 (H) Rb1·Rb2·Rb3·…·Rb99·Rb100

\ (P) Rb100 Et de même, avec le prédicat S :

(D*) S = rouge et tiré avant T ou non rouge et tiré après T (I*) Sb1·Sb2·Sb3·…·Sb99 (H*) Sb1·Sb2·Sb3·…·Sb99·Sb100 qui équivaut à : (H’*) Rb1·Rb2·Rb3·…·Rb99·~Rb100 \ (P*) Sb100 c’est-à-dire finalement :

\ (P’*) ~Rb100 Le paradoxe réside ici dans le fait que les deux généralisations (H) et (H*) conduisent respectivement à des prédictions (P) et (P’*) qui sont contradictoires. Intuitivement, l’application de SR à (H*) paraît erronée. Goodman donne aussi dans Fact, Fiction and Forecast[4] une version légèrement différente de son paradoxe, appliquée cette fois aux émeraudes[5]. Cette forme est très bien connue et est basée sur le prédicat “grue” = vert et observé avant T ou non vert et observé après T. Le prédicat S utilisé dans Goodman (1946) présente avec “grue”, une structure commune. Soient P et Q deux prédicats, cette structure correspond à la définition : (P et Q) ou (~P et ~Q). Dans ce qui suit, on désignera par grue un prédicat présentant cette structure particulière, sans distinguer selon que la forme spécifique utilisée est celle de Goodman (1946) ou (1954).

2. La dualité unification/différenciation

J’ai devant moi des instances. Dois-je les décrire en mettant l’accent sur leurs différences ? Ou bien dois-je les décrire en insistant sur leurs propriétés communes ? Je peux procéder d’une manière ou de l’autre. Mettre l’accent sur les différences entre les instances, c’est opérer par différenciation. A l’inverse, mettre en évidence leurs propriétés communes, c’est procéder par unification. Il convient de s’intéresser tout à tour à chacun de ces deux modes d’opérer. Soient les 100 boules composant l’urne de Goodman (1946). Considérons tout d’abord le cas où mon intention est de mettre l’accent sur les différences entre les instances. Là, une option est d’appréhender le moment particulier et unique, où chacune d’elles est extraite de l’urne. On considère alors les prédicats : rouge et tiré le jour 1rouge et tiré le jour 2, …, rouge et tiré le jour 99. On a ainsi 99 prédicats différents. Mais ceci interdit d’appliquer SR, qui nécessite un seul et même prédicat. Qu’est-ce donc que distinguer selon le moment où chaque boule est tirée ? C’est mettre l’accent sur une différence essentielle entre chacune des boules, fondée sur le critère du temps. On individualise ainsi chaque boule, et il en résulte autant de prédicats différents : tiré en T1, tiré en T2, …, tiré en T99. Ceci empêche ensuite tout mouvement inductif par application de SR. En effet, on ne dispose pas alors d’une propriété commune pour permettre l’induction et appliquer SR. Ici, la cause du problème réside dans le fait d’avoir réalisé une différenciation extrême. De manière alternative, je peux également procéder par différenciation en opérant une mesure extrêmement précise[6] de la longueur d’onde de la lumière définissant la couleur de chacune des boules. J’obtiendrai alors une mesure de longueur d’onde unique pour chacune des boules de l’urne. Ainsi, j’ai 100 boules devant moi, et je connais avec précision la longueur d’onde de la lumière de 99 d’entre elles. Les boules ont respectivement une longueur d’onde de 722,3551 nm, 722,3643 nm, 722,3342 nm, 722,3781 nm, etc. Je dispose dès lors de 99 prédicats distincts P3551, P3643, P3342, P3781, etc. Mais je suis alors dans l’impossibilité d’appliquer SR, qui exige un seul prédicat. Ici aussi, les propriétés communes font défaut pour pouvoir mettre en oeuvre le processus inductif. De la même manière que précédemment, il s’avère ici que j’ai réalisé une différenciation extrême. Que se passe-t-il maintenant si je procède exclusivement par unification ? Considérons le prédicat R correspondant à “rouge ou non rouge”. On tire 99 boules rouges avant le temps T. Elles sont toutes R. On prédit que la 100ème boule sera R après T, c’est-à-dire rouge ou non rouge. Mais cette forme d’induction n’apporte ici aucune information. La conclusion produite est vide d’information. On appellera induction vide ce type de situation. Dans ce cas, on observe que le processus d’unificationdes instances par la couleur a été réalisé de manière radicale, en annihilant à cet égard, toute démarche de différenciation. La cause du problème réside ainsi dans la mise en oeuvre d’un processus d’unification extrême. Si l’on se place du point de vue de la couleur, il apparaît que chacun des cas envisagés précédemment fait appel à une taxinomie différente des couleurs. Ainsi, il est fait usage successivement : – de notre taxinomie usuelle des couleurs basée sur 9 prédicats : violet, indigo, bleu, vert, jaune, orangé, rouge, blanc, noir – d’une taxinomie fondée sur une mise en relation des longueurs d’onde des couleurs avec l’ensemble des nombres réels (taxinomie réelle) – d’une taxinomie fondée sur un prédicat unique (taxinomie à taxon unique) : rouge ou non rouge Or il s’avère que chacun de ces trois cas peut être replacé dans une perspective plus générale. En effet, de multiples taxinomies des couleurs sont susceptibles d’être utilisées. Et celles-ci peuvent être ordonnées de la plus grossière (taxinomie à taxon unique) à la plus fine (taxinomie réelle), de la plus unifiée à la plus différenciée. On a notamment la hiérarchie suivante des taxinomies :

– TAX1 = {rouge ou non rouge} (taxinomie à taxon unique) – TAX2 = {rouge, non rouge} (taxinomie binaire) – … – TAX9 = {violet, indigo, bleu, vert, jaune, orangé, rouge, blanc, noir} (taxinomie basée sur les couleurs spectrales, ainsi que blanc et noir) – … – TAX16777216 = {(0, 0, 0), …, (255, 255, 255)} (taxinomie utilisée en informatique et distinguant 256 nuances de rouge, vert et bleu) – …

– TAXR = {370, …, 750} (taxinomie réelle basée sur la longueur d’onde de la lumière) Au sein de cette hiérarchie, il apparaît que l’usage de taxinomies extrêmes telles que celle basée sur un taxon unique, ou bien la taxinomie réelle, conduisent à des problèmes (respectivement unification extrême et différenciation extrême). Ainsi, les problèmes mentionnés plus haut lors de l’application d’un raisonnement inductif basé sur SR surviennent lorsque le choix dans la dualité unification/différenciation s’effectue de manière trop radicale. De tels problèmes concernent l’induction en général. Ceci incite à penser que l’on doit plutôt raisonner ainsi : je ne dois privilégier ni l’unification, ni la différenciation. Un prédicat tel que “rouge”, associé à notre taxinomie usuelle des couleurs[7] (TAX9), correspond précisément à un tel critère. Il correspond à un choix équilibré dans la dualité unification/différenciation. Ceci permet d’éviter les problèmes précédents. Cela n’empêche pas toutefois l’émergence de nouveaux problèmes, dès lors que l’on cherche à mettre en oeuvre un raisonnement inductif, dans certaines situations. Et un de ces problèmes est naturellement GP. Ainsi, il apparaît que l’enjeu du choix dans la dualité unification/différenciation est capital du point de vue de l’induction, car selon que je choisirai une manière ou bien l’autre, je pourrai ou non utiliser SR et produire des inférences inductives valables. Confronté à plusieurs instances, on peut mettre en oeuvre soit un processus de différenciation, soit un processus d’unification. Mais le choix effectué conditionne largement le succès ultérieur du raisonnement inductif réalisé sur ce fondement. Je dois décrire à la fois les propriétés communes et les différences. A partir de là, un raisonnement inductif correct peut prendre place. Mais d’ores et déjà, il apparaît que le rôle de la dualité unification/différenciation s’avère crucial pour l’induction. Plus précisément, il apparaît à ce stade qu’un choix correct dans la dualité unification/différenciation constitue une des conditions de l’induction.

3. Plusieurs problèmes concernant l’induction

Les problèmes qui viennent d’être évoqués constituent l’illustration de plusieurs difficultés inhérentes à la mise en oeuvre du processus inductif. Cependant, à la différence de GP, ils n’engendrent pas véritablement une contradiction. De ce point de vue, ils se distinguent de GP. Considérons maintenant la situation suivante. Je tire 99 boules respectivement aux temps T1, T2, …, T99. La 100ème boule sera tirée en T100. On constate que les 99 boules tirées sont rouges. Elles sont donc à la fois rouges et tirées avant T100. Soit R le prédicat “rouge” et T le prédicat “tiré avant T100“. On a alors :

(I) RTb1, RTb2, …, RTb99 (H) RTb1, RTb2, …, RTb99, RTb100

\ (P) RTb100 Par application directe de SR, il s’ensuit la prédiction : “la 100ème boule est rouge et tirée avant T100“. Mais ceci est en contradiction avec les données de l’expérience en vertu desquelles la 100ème boule est tirée en T100. Là aussi, le raisonnement inductif est basé sur une formalisation qui est celle de SR. Et de même que pour GP, SR conduit ici à une contradiction. Appelons Δ2 ce problème, où deux prédicats sont utilisés. Il apparaît que l’on peut construire aisément une forme de Δ2 basée sur un seul prédicat. Une manière de faire cela est de considérer le prédicat unique S défini comme “rouge et tiré avant T100” en lieu et place des prédicats R et T utilisés précédemment. Il s’ensuit alors la même contradiction. Plus encore, il apparaît que l’on peut mettre en évidence une autre version (Δ1) comportant un seul prédicat de ce problème, sans utiliser la propriété “rouge” qui se révèle ici inutile. Soit en effet T le prédicat tiré avant T100. On a alors :

(I) Tb1, Tb2, …, Tb99 (H) Tb1, Tb2, …, Tb99, Tb100

\ (P) Tb100 Ici aussi, la conclusion selon laquelle la 100ème boule est tirée avant T100 contredit les données de l’expérience selon lesquelles la 100ème boule est tirée en T100. Et on a alors un effet contradictoire, à l’instar de GP, sans que la structure de “grue” ait été mise en oeuvre. Compte tenu du fait que seul le critère du temps est utilisé pour construire ce problème, il sera désigné dans ce qui suit par Δ1-temps. Il apparaît ici que les problèmes tels que Δ1-temps et Δ2 conduisent de mκme que GP ΰ une contradiction. Tel n’est pas le cas pour les autres problèmes relatifs à l’induction évoqués précédemment[8], qui entraînent soit l’impossibilité de réaliser l’induction, soit une conclusion vide d’information. Cependant, il s’avère que la contradiction rencontrée dans Δ1-temps n’est pas de même nature que celle observée dans GP. En effet, dans GP, on a une contradiction entre les deux prédictions concurrentes (P) et (P*). En revanche, dans Δ1-temps, la contradiction apparaît entre d’une part les conditions de l’expérience (T ≥ 100) et d’autre part la prédiction résultant de la généralisation (T < 100). En tout état de cause, les problèmes qui viennent d’être rencontrés suggèrent que le formalisme de SR ne capture pas l’ensemble de nos intuitions relatives à l’induction. Il convient donc de s’attacher à définir avec précision les conditions de l’induction, et d’adapter en conséquence le formalisme utilisé. Mais avant toutefois de procéder à une telle analyse, il est nécessaire de préciser davantage les différents éléments du contexte de GP.

4. L’univers de référence

Considérons la loi (L1) selon laquelle “le diamant raye les autres solides”. A priori, (L1) s’impose à nous comme une vérité incontestable. Pourtant, il s’avère qu’à une température supérieure à 3550°C, le diamant fond. Aussi en dernière analyse, la loi (L1) se vérifie-t-elle à une température normale et en tout état de cause, lorsque la température est inférieure à 3550°C. Mais une telle loi ne s’applique pas au-delà de 3550°C. Ceci illustre combien l’énoncé des conditions dans lesquelles la loi (L1) est vérifiée est important, notamment en ce qui concerne les conditions de température. Ainsi, lorsqu’on énonce (L1), s’avère-t-il nécessaire de préciser les conditions de température dans lesquelles elle trouve à s’appliquer. Ceci revient à décrire le type d’univers dans lequel la loi est vérifiée. Soit également la proposition (P1) suivante : “le volume de l’univers visible est supérieur à 1000 fois celui du système solaire”. Une telle proposition s’impose à nous comme évidente. Mais là aussi, il apparaît que (P1) est vérifiée à l’époque moderne, mais qu’elle se révèle fausse dans les premiers instants de l’univers. En effet, lorsque l’âge de notre univers était de 10-6 seconde après le big bang, son volume était à peu près égal à celui de notre système solaire. Ici également, il apparaît donc nécessaire de spécifier, en même temps que la proposition (P1) les conditions de l’univers dans lequel elle s’applique. Une formulation non ambiguë de (P1) comporte donc une clause temporelle plus restrictive, telle que : “à notre époque, le volume de l’univers visible est supérieur à 1000 fois celui du système solaire”. Ainsi, d’une manière générale, on peut penser que lorsqu’on énonce une généralisation, il est nécessaire de préciser les conditions de l’univers dans lequel celle-ci s’applique. La description précise de l’univers de référence est fondamentale, car selon les conditions de l’univers dans lequel on se place, la loi énoncée peut se révéler vraie ou fausse. On observe dans notre univers la présence à la fois de constantes et de variables. On a ainsi des constantes, qui constituent les constantes fondamentales de l’univers : la vitesse de la lumière : c = 2,998 x108 m/s; la constante de Planck : h = 6,626 x 10-34 J.s; la charge de l’électron : e = 1,602 x 10-19 C; etc. On a d’autre part des variables. Parmi celles-ci, on peut citer notamment : la température, la pression, l’altitude, la localisation, le temps, la présence d’un rayonnement laser, la présence d’atomes de titanium, etc. On a souvent tendance, lorsqu’on énonce une généralisation, à ne pas prendre en compte les constantes et les variables qui sont celles de notre univers envisagé dans sa totalité. Tel est le cas par exemple lorsqu’on considère la situation de notre univers le 1er janvier de l’an 2000, à 0h. On se place alors explicitement dans ce qui constitue une tranche, une coupe de notre univers. En effet, le temps n’est pas considéré alors comme une variable, mais bien comme une constante. Soit également la généralisation : “les dinosaures avaient le sang chaud[9]“. Ici, on se place explicitement dans un sous-univers du notre où les paramètres du temps et de l’espace ont une portée restreinte. La variable temporelle se réduit à l’époque particulière de l’histoire de la Terre qui a connu l’apparition des dinosaures : le Trias et le Crétacé. Et de même, le paramètre spatial se limite à notre planète : la Terre. De manière identique, les conditions de température sont changeantes au sein de notre univers, selon que l’on se situe à un emplacement ou à un autre de ce dernier : à l’Equateur terrestre, à la surface de Pluton, au coeur d’Alpha du Centaure, etc. Mais si l’on s’intéresse exclusivement au ballon servant à l’expérimentation au sein du laboratoire de physique, où la température est maintenue invariablement à 12°C, on peut considérer alors la température comme une constante. Car lorsqu’on exprime de telles généralisations, on se place non pas dans notre univers envisagé dans sa totalité, mais seulement dans ce qui constitue véritablement une partie spécifique, une restriction de ce dernier. On peut alors assimiler l’univers de référence dans lequel on se place à un sous-univers du notre. Il est ainsi fréquent d’exprimer des généralisations qui ne valent que pour l’époque présente, ou pour nos conditions terrestres habituelles. Explicitement ou non, l’énoncé d’une loi comporte un univers de référence. Mais dans la plupart des cas, les variables et les constantes du sous-univers considéré sont distinctes de celles permettant de décrire notre univers envisagé dans sa totalité. Car les conditions sont extrêmement variées au sein de notre univers : les conditions sont très différentes selon que l’on se place à la 1ère seconde après le big bang, sur Terre à l’époque précambrienne, sur notre planète en l’an 2000, à l’intérieur de l’accélérateur de particules du CERN, au coeur de notre Soleil, à proximité d’une naine blanche, ou bien à l’intérieur d’un trou noir, etc. On peut penser également qu’il est intéressant de pouvoir modéliser des univers dont même les constantes sont différentes des constantes fondamentales de notre univers. On peut ainsi souhaiter étudier par exemple un univers où la masse de l’électron est égale à 9,325 x10-31 kg, ou bien un univers où la charge de l’électron est égale à 1,598 x 10-19 C. Et de fait, les univers-jouets, qui prennent en compte des constantes fondamentales différentes de celles de notre univers familier, sont étudiés par les astrophysiciens. Enfin, lorsqu’on décrit les conditions d’une expérience de pensée, on se place, de manière explicite ou non, dans les conditions qui s’apparentent à celles d’un sous-univers. Lorsqu’on considère par exemple 100 boules extraites d’une urne durant 100 jours consécutifs, on se place alors dans une restriction de notre univers où la variable temporelle est limitée à une période de 100 jours et, où la localisation spatiale est extrêmement réduite, correspondant par exemple à un volume à peu près égal à 5 dm3. Par contre, le nombre d’atomes de zirconium ou de titane éventuellement présents dans l’urne, l’existence éventuelle d’un rayonnement laser, la présence ou l’absence d’une source sonore de 10 db, etc. peuvent être omis et ignorés. Dans ce contexte, il n’est pas nécessaire de prendre en compte l’existence de telles variables. Dans cette situation, il suffit de mentionner les variables et les constantes effectivement utilisées dans l’expérience de pensée. Car on peut penser en effet que le nombre de variables dans notre univers est si grand qu’il est impossible de les énumérer toutes. Et dès lors, il ne paraît pas possible de caractériser notre univers en fonction de toutes ses variables, car on peut en fournir une énumération infinie. Il apparaît suffisant de décrire le sous-univers considéré, en mentionnant uniquement les constantes et les variables qui jouent un rôle effectif dans l’expérience. Ainsi, dans de telles situations, on décrira le sous-univers considéré en ne mentionnant que les critères effectifs nécessaires à la description de l’expérience. Ce qui précède incite à penser que d’une manière générale, afin de modéliser le contexte dans lequel prennent place des problèmes tels que GP, il est opportun de décrire un univers donné en termes de variables et de constantes. On est amené ainsi à définir un n-univers (n ≥ 0) comme un univers dont les critères comportent mconstantes, et n variables, où les m constantes et les n variables constituent les critères de l’univers considéré. Dans ce cadre particulier, on définit un 1-univers temporel (Ω1T) comme un univers comportant un seul critère-variable : le temps. De même, on définit un 1-univers coloré (Ω1C) comme un univers comportant un seul critère-variable : la couleur. On définira aussi un 2-univers coloré et temporel 2CT) comme un univers comportant deux critères-variables : le temps et la couleur. Etc. De même, un univers où tous les objets sont rouges, mais se caractérisent par une localisation différente sera modélisé par un 1-univers localisé (Ω1L) dont la couleur est un critère-constante (rouge). On notera incidemment que le modèle à n-univers permet notamment de modéliser plusieurs situations intéressantes. Ainsi, un univers temporel peut être considéré comme un n-univers dont l’une des variables est un critère temporel. De plus, un univers où on considère un moment unique T0, dépourvu du phénomène de succession du temps, peut être considéré comme un n-univers dont le temps ne constitue pas une des variables, mais où il existe une constante-temps. De même, un univers atemporel correspond à un n-univers dont aucune variable ne correspond à un critère temporel, et où il n’existe aucune constante-temps. Dans le contexte qui vient d’être défini, qu’est-ce maintenant qu’être rouge ? Ici, être “rouge” correspond à deux types de situations, selon le type de n-univers dans lequel on se place. Il peut s’agir en premier lieu, d’un n-univers dont la couleur est l’une des constantes. Dans ce type d’univers, la couleur des objets n’est pas susceptible de varier, et tous les objets y sont invariablement rouges. Le fait d’être “rouge” peut correspondre, en second lieu, à un n-univers dont la couleur constitue un des critères-variables. Là, un objet peut être rouge ou non rouge. Soit le cas d’un Ω1C. Dans un tel univers, un objet est rouge ou non rouge dans l’absolu. Aucun changement de couleur n’y est possible, car aucun autre critère-variable n’existe, duquel puisse dépendre une telle variation. Et dans un Ω2CT, être rouge, c’est être rouge au temps T. Au sein d’un tel univers, être rouge, c’est être rouge relativement au temps T. De même, dans un 3-univers coloré, temporel et localisé (Ω3CTL), être rouge, c’est être rouge au temps T et au lieu L. Etc. Dans de tels univers, être rouge, c’est être rouge relativement aux autres critères-variables. Et il en va de même pour les n-univers qui modélisent un univers tel que le notre. Ici se pose le problème du statut des instances d’un type d’objet donné. Qu’est-ce donc qu’être une instance, dans le présent cadre ? Ce problème a son importance, car les versions originales de GP sont basées sur des instancesde boules (1946) et d’émeraudes (1954). Si l’on prend en compte le cas de Goodman (1946), les instances considérées sont 100 boules différentes. Pourtant, si on considère une boule unique, tirée aux temps T1, T2, …, T100, on constate que la problématique de GP est toujours présente. Il suffit en effet de considérer une boule dont la couleur est susceptible de varier au cours du temps. On a tiré 99 fois la boule aux temps T1, T2, …, T99, et on constaté chaque fois que la boule était rouge. Il en résulte la prédiction selon laquelle la boule sera rouge en T100. Pourtant, cette prédiction s’avère contradictoire avec une prédiction concurrente basée sur les mêmes observations, et la projection du prédicat S “rouge et tiré avant T100 ou non rouge et tiré en T100[10]. Le présent cadre doit être à même d’appréhender la diversité de ces situations. Peut-on parler ainsi d’un 1-univers instancié et temporel, ou bien d’un 1-univers instancié et coloré ? Ici, on doit observer que le fait d’être instancié, pour un univers donné, correspond à un critère-variable supplémentaire. Car sinon, qu’est-ce qui permet de différencier les instances entre elles ? Si aucun critère ne les distingue, il s’agit alors d’une seule et même chose. Et si elles sont distinctes, c’est qu’un critère permet de les différencier. Ainsi, un 1-univers instancié et temporel est en fait un 2-univers, dont le 2ème critère, qui permet de distinguer les instances entre elles, n’est en fait pas mentionné ni explicité. En rendant explicite ce second critère-variable, il est donc clair que l’on se situe dans un 2-univers. De même, un 1-univers instancié et coloré est en réalité un 2-univers dont l’un des critères est la couleur et le second critère existe mais n’est pas précisé. Un autre aspect qui mérite d’être souligné ici, est la question de la réduction d’un n-univers donné à un autre. N’est il pas possible en effet, de réduire logiquement un n-univers à un système de critères différent ? Intéressons-nous par exemple à un Ω3CTL. Pour caractériser l’univers correspondant, on a 3 critères-variables : couleur, temps, localisation. Il apparaît que l’on peut réduire ce 3-univers à un 2-univers. Cela peut s’effectuer en réduisant deux des critères du 3-univers à un seul. En particulier, on réduira les critères de couleur et de temps à un critère unique de tcouleur* (shmolor[11]). Et on ne conservera que deux taxons de tcouleur* : G et ~G. Soient donc un critère de couleur comportant deux taxons (rouge, non rouge) et un critère de temps comportant deux taxons (avant T, après T). Si l’on associe les taxons de couleur et de temps, on obtient quatre nouveaux prédicats : rouge avant T, rouge après T, non rouge avant T, non rouge après T, que l’on dénotera respectivement RT, R~T, ~RT et ~R~T. Plusieurs de ces prédicats sont compatibles entre eux (RT et R~T, RT et ~R~T, ~RT et R~T, ~RT et ~R~T) alors que d’autres sont incompatibles (RT et ~RT, R~T et ~R~T). A ce stade, on a plusieurs manières (16)[12] de grouper les prédicats compatibles, permettant d’obtenir deux nouveaux prédicats G et ~G de tcouleur* :

0123456789101112131415
RT Ù R~TXXXXXXXX
RT Ù ~R~TXXXXXXXX
~RT Ù R~TXXXXXXXX
~RT Ù~R~TXXXXXXXX

Dans chacun de ces cas, il en résulte bien un nouveau critère unique de tcouleur* (Z), se substituant aux deux critères précédents de couleur et de temps. On dénotera Zi (0 ≤ i ≤ 15) les taxons de tcouleur* ainsi obtenus. S’il est clair que Z15 conduit à l’induction vide, on observera que plusieurs cas correspondant à la situation où les instances sont RT conduisent à la problématique GP. On notera ainsi que Z2, c’est-à-dire grue2 (en assimilant les Zi à gruei et les Z15-i à bleeni) est basé sur la définition : grue2 = rouge avant T et non rouge après T. Il s’agit là d’une interprétation conjonctive de la définition de “grue”. De même, grue7 correspond à une définition de “grue” basée sur un ou exclusif. Enfin, grue12 est basé sur la définition classique : grue12 = rouge avant T ou non rouge après T, où la disjonction s’interprète comme un ou inclusif. De la même manière, il s’avère également qu’un Ω2CT peut se réduire à un 1-univers tcoloré* (Ω1Z). Et de façon plus générale, un n-univers est ainsi réductible à un (n-1)-univers (pour n > 1). Ainsi, si l’on considère un univers donné, plusieurs caractérisations en termes de n-univers peuvent être valablement utilisées. On peut notamment appréhender un même univers comme un Ω3CTL, ou bien comme un Ω2ZL. De la même manière, on peut se représenter un Ω2CT comme un Ω1Z. A ce stade, aucune de ces vues n’apparaît fondamentalement meilleure que l’autre. Mais chacune de ces deux caractérisations constituent des façons alternatives de décrire une même réalité. Ceci montre finalement qu’un n-univers constitue en fait une caractérisation abstraite d’un univers réel ou imaginaire. Un n-univers constitue ainsi un système de critères, comportant des constantes et des variables. Et pour caractériser un même univers réel ou imaginaire donné, on peut recourir valablement à plusieurs n-univers. Chacun d’entre eux apparaît finalement comme une caractérisation distincte de l’univers considéré, faisant simplement appel à un jeu de primitives différent.

5. Conditions de l’induction

Le fait que le formalisme de SR entraîne l’effet de GP suggère que l’intuition qui préside à notre notion d’induction n’est pas entièrement capturée par SR. Il est ainsi permis de penser que si l’approche formelle est nécessaire et utile pour servir de support à l’induction, elle ne constitue pas toutefois une démarche suffisante. Car il paraît également essentiel de capturer l’intuition qui préside à notre raisonnement inductif. Aussi s’avère-t-il nécessaire de compléter l’approche formelle de l’induction par une approche sémantique. Goodman lui-même fait mention d’une définition de l’induction[13]. Il définit l’induction comme la projection de caractéristiques du passé dans le futur, ou d’une manière plus générale, comme la projection de caractéristiques correspondant à un aspect donné d’un objet à travers un autre aspect. Cette définition correspond à notre intuition de l’induction. On peut penser toutefois qu’il convient de la compléter en prenant en compte les observations précédentes[14]relatives à la dualité différenciation/unification. En ce sens, on a pu observer que l’induction consiste en une inférence à partir d’instances présentant à la fois des propriétés communes, et des différences. Soient les instances-source (instances-S) les instances sur lesquelles portent (I) ou (I*) et l’instance-destination (instance-D) celle qui fait l’objet de (P) ou (P*). Les propriétés communes concernent les instances-S et les propriétés différenciées s’établissent entre les instances-S et l’instance-D. Il en résulte la définition suivante : l’induction consiste précisément dans le fait que l’instance-D[15] possède également la propriété commune aux instances-S, alors que l’on fait varier le(s) critère(s) sur le(s)quel(s) est (sont) basé(es) les différences entres les instances-S et l’instance-D. Le raisonnement inductif est ainsi fondé sur le caractère constant d’une propriété, alors que telle autre propriété est variable. De cette définition de l’induction découlent directement plusieurs conditions de l’induction. Il convient de les examiner tour à tour. Les deux premières conditions sont ainsi les suivantes :

(C1) les instances-S doivent présenter des propriétés communes

(C2) les instances-S et l’instance-D doivent présenter des propriétés distinctives Ceci a pour conséquence qu’on ne peut appliquer l’induction dans deux circonstances particulières : d’une part (i) lorsque les instances ne laissent apparaître aucune propriété commune. On appellera un tel cas une différenciation totale des instances. Les problèmes correspondant à cette circonstance particulière ont été évoqués plus haut[16]. Et d’autre part (ii) lorsque les instances ne présentent aucune propriété distinctive. On appellera une telle situation unification totale. Les problèmes rencontrés dans ce type de situation ont également été mentionnés précédemment[17]. On doit noter ici qu’il ne s’agit pas là de propriétés intrinsèques des instances, mais bien de l’analyse qui est effectuée par celui qui s’apprête à raisonner par induction. Compte tenu de la définition de l’induction qui a été donnée, une troisième condition peut être ainsi énoncée :

(C3) un critère-variable est nécessaire pour les propriétés communes des instances-S et un autre critère-variable pour les propriétés distinctives Ceci se rapporte à la structure de l’univers de référence considéré. En conséquence, deux critères-variables sont au minimum nécessaires, dans la structure de l’univers de référence correspondant. On appellera cela la condition minimale de l’induction. Par conséquent, un 2-univers est au minimum nécessaire pour que les conditions de l’induction soient satisfaites. Ainsi, un Ω2CT conviendra. De même, un 2-univers temporel et localisé (Ω2TL) satisfera également les conditions qui viennent d’être définies, etc[18]. On peut noter qu’une autre façon d’énoncer cette condition est la suivante : le critère-variable pour les propriétés communes et le critère-variable pour les propriétés différenciées doivent être distincts. On ne doit pas avoir confusion entre les deux. On peut appeler cela la condition de séparation des propriétés communes et des propriétés distinctives. Un tel principe apparaît comme une conséquence de la condition minimale pour l’induction : on doit avoir deux critères pour réaliser l’induction, et ces critères doivent être différents. Si l’on choisit un même critère pour les propriétés communes et les propriétés différenciées, on se ramène de fait à un seul critère et au contexte d’un 1-univers, lui-même insuffisant pour réaliser l’induction. Enfin, une quatrième condition de l’induction résulte de la définition précédente :

(C4) on doit projeter les propriétés communes des instances-S (et non les propriétés distinctives) Les conditions de l’induction qui viennent d’être énoncées permettent désormais de traiter les problèmes liés à l’utilisation de SR évoqués plus haut[19]. Il s’ensuit en effet que les projections[20] suivantes sont correctes : C°T dans un Ω2CT, C°L dans un Ω2CL, Z°L dans un Ω2ZL, etc. A l’inverse, les projections suivantes sont incorrectes : T°T dans un Ω1T, Z°Z dans un Ω1Z. En particulier, on notera ici que la projection T°T dans le Ω1T est celle de Δ1-temps. Δ1-temps prend en effet place dans un Ω1T, alors que l’induction exige à la fois des propriétés communes et des propriétés distinctives. Ainsi, un 2-univers est au minimum nécessaire. D’habitude, le critère du temps est utilisé pour la différenciation. Mais ici, il est utilisé pour l’unification (“tiré avant T”). Cela peut se faire, mais à condition qu’on utilise un critère distinct pour les propriétés différenciées. Cependant, alors qu’il en résulte ici des propriétés communes, on perd les propriétés différenciées. Il manque donc un second critère – correspondant aux propriétés différenciées – à l’univers considéré, pour réaliser valablement l’induction. Ainsi Δ1-temps trouve-t-il son origine dans une violation de la condition minimale de l’induction. On peut formuler cette solution de manière équivalente, par rapport à la condition de séparation. En effet, dans Δ1-temps, un mκme critθre temporel (tiré avant T/tiré après T) est utilisé pour les propriétés communes et pour les propriétés différenciées, alors que deux critères distincts sont nécessaires. Il s’agit ainsi d’une violation manifeste de la condition de séparation. Enfin, les conditions de l’induction définies plus haut conduisent à adapter le formalisme utilisé pour décrire GP. Il s’avère en effet nécessaire de distinguer entre la propriété commune et la(les) propriété(s) distinctive(s). On utilisera donc le formalisme suivant en lieu et place de celui utilisé plus haut :

(I) RT1·RT2·RT3·…·RT99

(H) RT1·RT2·RT3·…·RT99·RT100 où R désigne la propriété commune et les Ti une propriété distinctive. Il est à noter qu’ici, il peut s’agir au choix d’un objet unique, ou bien d’instances que distingue un critère donné (qui n’entre pas en jeu dans le processus inductif) selon le n-univers dans lequel on se place. Ainsi, on utilisera dans le cas d’une instance unique α, dont la couleur est susceptible de varier selon le temps :

(I) RT1α·RT2α·RT3α·…·RT99α ou dans le cas oω plusieurs instances α1, α2, …, α99, α100 existent[21] :

(I) RT1α1·RT2α2·RT3α3·…·RT99α99

6. L’origine du paradoxe

Compte tenu des conditions de l’induction et du cadre des n-univers qui viennent d’être définis, on est désormais en mesure de s’attacher à déterminer l’origine de GP. Il convient pour cela tout d’abord de décrire avec précision les conditions de l’univers de référence dans lequel GP prend place. En effet, dans la version originale de GP, le choix de l’univers de référence n’est pas défini avec précision. Or on peut penser qu’il est essentiel, afin d’éviter toute ambiguïté, que ce dernier soit décrit précisément. L’univers de référence dans lequel se place Goodman (1946) n’est pas défini explicitement, mais plusieurs éléments de l’énoncé permettent d’en préciser la nature. Goodman fait ainsi mention des couleurs “rouge” et “non rouge”. Aussi la couleur constitue-t-elle un des critères-variables de l’univers de référence. De plus, Goodman distingue les boules qui sont tirées aux temps T1, T2, T3, …, T100. Ainsi, le temps est également un critère-variable de l’univers considéré. Par conséquent, on peut décrire l’univers minimal dans lequel se place Goodman (1946) comme un Ω2CT. De même, dans Goodman (1954), les critères-variables de couleur (vert/non vert) et de temps (tiré avant T/tiré après T) sont expressément mentionnés. Dans les deux cas, on se place donc, implicitement dans le cadre minimal d’un Ω2CT. Goodman fait par ailleurs mention d’instances de boules ou d’émeraudes. Faut-il à ce stade recourir à un critère-variable supplémentaire permettant de distinguer les instances entre elles ? Il apparaît que non. D’une part en effet, comme on l’a vu précédemment[22], il s’avère que l’on a bien une version de GP en considérant simplement un Ω2CT et un objet unique dont la couleur est susceptible de varier au cours du temps. D’autre part, il apparaît que si le critère qui sert à distinguer les instances n’est pas utilisé dans le processus inductif, il ne sert alors ni en tant que critère commun, ni en tant que critère différencié. Il s’ensuit alors que l’on peut se dispenser de recourir à ce 3ème critère supplémentaire. Ainsi, il s’avère que le fait de prendre en compte une instance unique ou bien plusieurs instances, n’est pas essentiel dans la formulation de GP. Dans ce qui suit, on pourra donc considérer que l’énoncé s’applique, indifféremment, à un objet unique ou à plusieurs instances que distingue un critère qui n’est pas utilisé dans le processus inductif. Désormais, nous sommes en mesure de replacer GP dans le cadre des n-univers. Compte tenu du fait que le contexte de GP est celui d’un Ω2CT minimal, on envisagera successivement deux situations : celle d’un Ω2CT, puis celle d’un Ω3CTα (oω α dιsigne un 3θme critère). 6.1 “Grue” dans le 2-univers coloré et temporel Envisageons tout d’abord l’hypothèse d’un Ω2CT. Dans un tel univers, être “rouge”, c’est être rouge au temps T. On dispose alors d’un critère de couleur pour les propriétés communes, et d’un critère de temps pour les propriétés différenciées. Dès lors, il apparaît tout à fait légitime de projeter la propriété commune de couleur (“rouge”), à travers le temps différencié. Une telle projection s’avère conforme aux conditions de l’induction énoncées plus haut. Qu’en est-il maintenant de la projection de “grue” ? On a observé précédemment[23] que le Ω2CT était réductible à un Ω1Z. Ici, le fait d’utiliser “grue” (et “bleen”) en tant que primitives, est caractéristique du fait que le système de critères utilisé est celui d’un Ω1Z. Qu’en est-il alors lorsqu’on projette “grue”, dans le Ω1Z ? Dans un tel univers de référence, l’unique critère-variable est la tcouleur*. Un objet y est “grue” ou “bleen” dans l’absolu. Dès lors, si l’on dispose bien d’un critère commun (la tcouleur*), il apparaît que le critère différencié fait défaut, pour mettre en oeuvre valablement l’induction. Et la situation dans laquelle on se trouve est celle d’une indifférenciation extrême. Ainsi, une telle projection s’effectue en violation de la condition minimale de l’induction. Par conséquent, il s’avère que GP ne peut prendre place dans le Ω2CT, et se trouve bloqué au stade de la projection de “grue”. Mais ces remarques préliminaires sont-elles suffisantes pour fournir, dans le contexte d’un Ω2CT, une solution satisfaisante à GP ? On peut penser que non, car le paradoxe s’y présente également sous une autre forme, qui est celle de la projection de la tcouleur* à travers le temps. On peut formaliser ainsi cette projection Z°T :

(I*) GT1·GT2·GT3·…·GT99 (H*) GT1·GT2·GT3·…·GT99·GT100 qui équivaut à : (H’*) RT1·RT2·RT3·…·RT99·~RT100 (P*) GT100 qui équivaut à :

(P’*) ~RT100 où il est manifeste que les éléments de la problématique GP sont encore présents. Fondamentalement dans cette version, il apparaît que les propriétés communes sont empruntées au système de critères du Ω1Z, alors que les propriétés différenciées proviennent du Ω2CT. Une première analyse révèle donc que la projection de “grue” dans ces conditions comporte un défaut qui consiste dans le choix d’un système de critères donné pour les propriétés communes (la tcouleur*) et d’un système de critères différent pour les propriétés différenciées (le temps). Car la sélection de la tcouleur* est caractéristique du choix d’un Ω1Z, alors que l’utilisation du temps est révélatrice du fait que l’on se place dans un Ω2CT. Mais on se doit de choisir l’un ou l’autre des systèmes de critères réductibles pour réaliser l’induction. Dans les hypothèses envisagées précédemment, le choix des critères pour les propriétés communes et différenciées s’effectuait dans un même système de critères. Mais ici, le choix des critères pour les propriétés communes et les propriétés différenciées s’effectue dans deux systèmes de critères (réductibles) différents. Ainsi, les critères commun et différencié choisis pour l’induction ne sont pas véritablement distincts. Et ceci apparaît comme une violation de la condition de séparation. Par conséquent, une des conditions de l’induction n’est pas respectée. Cependant, la projection Z°T possède un certain support intuitif, car elle est basée sur le fait que les notions de “grue avant T” et “grue après T” se révèlent, intuitivement, porteuses de sens. Faisons donc abstraction de la violation des conditions de l’induction qui vient d’être mentionnée, et considérons donc cette situation. Dans ce contexte, GP est toujours présent, puisqu’on observe une contradiction entre (P) et (P’*). C’est à cette contradiction qu’il convient désormais de s’intéresser. Soit l’étape d’équivalence entre (H*) et (H’*). On conçoit que “grue avant T” s’assimile ici à RT, car le fait que les instances-S sont rouges avant T résulte clairement des conditions de l’expérience. En revanche, il convient de s’intéresser à l’étape selon laquelle (P*) entraîne (P’*). Selon la définition classique[24] : “grue” = {RT Ù R~T, RT Ù ~R~T, ~RT Ù ~R~T}. Qu’est-ce donc qu’être “grue après T” ? Là, il apparaît qu’un objet “grue” peut être R~T (ceci correspond au cas RT Ù R~T) ou bien ~R~T (ceci correspond aux cas RT Ù ~R~T et ~RT Ù ~R~T). En conclusion, l’objet peut être soit R~T soit ~R~T. Ainsi, le fait de savoir qu’un objet est “grue après T” ne permet pas de conclure que cet objet est ~R~T, car ce dernier peut également être R~T. En conséquence, l’étape selon laquelle (P*) entraîne (P’*) se révèle finalement fausse. D’où il s’ensuit que la contradiction entre (P) et (P’*) n’a plus de raison d’être. On peut se persuader que cette analyse ne dépend pas du choix de la définition classique de “grue” (grue12) qui est effectué, en considérant d’autres définitions. Soit par exemple la définition basée sur grue9 : “grue” = {RT Ù~R~T, ~RT Ù ~R~T } et “bleen” = {RT Ù R~T, ~RT Ù R~T}. Mais dans cette version, on constate que l’on n’a pas l’émergence de GP, car les instances-S, qui sont RT, peuvent être à la fois “grue” et “bleen”. Et il en va de même si on considère une définition conjonctive (grue2) telle que “grue” = {RT Ù ~R~T}. Dans un tel cas en effet, les instances-S ne sont “grue” que si elles sont RT mais également ~R~T. Or ceci ne correspond pas aux conditions initiales de GP dans le Ω2CT où on ignore si les instances-S sont ~R~T. On pourrait penser également que le problème est lié à l’utilisation d’une taxinomie de tcouleur* basée sur deux taxons (G et ~G). Considérons donc une taxinomie de la tcouleur* basée sur 4 taxons : Z0 = RT Ù R~T, Z1 = RT Ù ~R~T, Z2 = ~RT Ù R~T, Z3 = ~RT Ù ~R~T. Mais dans cette hypothèse, il apparaît clairement que dès lors que les instances-S sont par exemple Z1, on se trouve replacé dans la situation précédente. Le fait de considérer “grue après T”, “grue avant T”, “bleen avant T”, “bleen après T” s’assimile à une tentative d’exprimer “grue” et “bleen” par rapport à nos propres critères, et en particulier celui du temps. Il s’agit là d’une forme d’anthropocentrisme, sous-tendue par l’idée d’exprimer le Ω1Z à l’aide des taxons du Ω2CT. Dès lors que l’on connaît le code définissant les relations entre deux n-univers réductibles – le Ω1Z et le Ω2CT – et que l’on possède des données partielles, on peut être tenté d’élucider complètement les prédicats du n-univers étranger. Sachant que les instances sont GT, G~T, ~GT, ~G~T, je peux déduire qu’elles sont respectivement {RT, ~RT}, {R~T, ~R~T}, {~RT}, {R~T}. Mais comme on l’a vu, du fait que les instances sont GT et RT, je ne peux pas déduire qu’elles seront ~R~T. Le raisonnement dans cette version de GP est basé sur l’idée apparemment inductive que ce qui est “grue avant T” est également “grue après T”. Mais dans le contexte qui est celui du Ω1Z, lorsqu’un objet est “grue”, il est “grue” dans l’absolu. Car aucun critère supplémentaire n’existe qui puisse faire varier sa tcouleur*. Ainsi, lorsqu’un objet est GT, il est nécessairement G~T. Et de l’information selon laquelle un objet est GT, on peut donc conclure, par déduction, qu’il est également G~T. De ce qui précède, il s’ensuit que la version de GP liée à Z°T présente les caractères apparents de l’induction, mais il ne s’agit pas d’une forme authentique de ce type de raisonnement. Z°T constitue ainsi une forme déguisée de l’induction pour deux raisons principales: d’une part, il s’agit d’une projection à travers le critère différencié du temps, qui constitue le mode standard de notre pratique inductive. Et d’autre part, elle est basée sur le principe intuitif selon lequel tout ce qui est GT est également G~T. Mais comme on l’a vu, il s’agit en réalité là d’une forme déductive de raisonnement, dont la véritable nature se trouve masquée par un apparent mouvement inductif. Et ceci conduit à conclure que la forme de GP apparentée à Z°T s’analyse en fait véritablement comme une pseudo-induction. 6.2 “Grue” dans le 3-univers coloré, temporel et localisé Envisageons maintenant le cas d’un Ω3CTα. Ce type d’univers de rιfιrence correspond également à la définition d’un Ω2CT minimal, mais il comporte également un 3ème critère-variable[25]. Choisissons pour ce dernier un critère tel que la localisation[26]. Soit donc un Ω3CTL. Considérons tout d’abord (H) dans un tel 3-univers. Etre “rouge” dans le Ω3CTL, c’est être rouge au temps T et au lieu L. D’après les conditions de GP, la couleur correspond aux propriétés communes, et le temps aux propriétés différenciées. On a alors la projection C°TL suivante :

(I) RT1L1·RT2L2·RT3L3·…·RT99L99 (H) RT1L1·RT2L2·RT3L3·…·RT99L99·RT100L100

\ (P) RT100L100 où compte tenu des conditions de l’induction, il s’avère légitime de projeter la propriété commune (“rouge”) des instances-S, à travers le temps et le lieu différenciés, et de prédire que la 100ème boule sera rouge. Une telle projection apparaît tout à fait correcte, et s’avère en tous points conforme aux conditions de l’induction mentionnées plus haut. Qu’en est-il maintenant de (H*) dans le Ω3CTL ? On a pu observer que le Ω3CTL pouvait se réduire à un Ω2ZL. Dans ce dernier n-univers, les critères-variables sont la tcouleur* et la localisation. Le fait d’être “grue” y est relatif au lieu : être “grue”, c’est être “grue” au lieu L. Ce qui est alors projeté est la tcouleur*, c’est-à-dire le fait d’être “grue” ou “bleen”. On a donc un critère commun de tcouleur* et un critère différencié de localisation. Dès lors, si on considère que les instances-S sont “grue”, on peut fort bien projeter la propriété commune “grue” à travers un critère différencié de localisation. Soit donc la projection Z°L dans le Ω2ZL :

(I*) GL1·GL2·GL3·…·GL99 (H*) GL1·GL2·GL3·…·GL99·GL100

\ (P*) GL100 Une telle projection est conforme aux conditions mentionnées plus haut, et constitue par conséquent une forme valable de l’induction. Dans ce contexte, on peut projeter valablement un prédicat ayant une structure identique à celle de “grue”, dans le cas des émeraudes. Considérons la définition “grue” = vert avant T ou non vert après T, où T = 10 milliards d’années. On sait qu’à cette époque, notre Soleil sera éteint, et deviendra progressivement un naine blanche. Les conditions de notre atmosphère seront radicalement différentes de ce qu’elles sont actuellement. Et la température s’élèvera notamment dans des proportions considérables, pour atteindre 8000°. Dans ces conditions, la structure de nombreux minéraux se transformera radicalement. Il devrait normalement en être ainsi pour nos émeraudes actuelles, qui devraient voir leur couleur modifiée, à la suite de l’énorme élévation de température qui s’ensuivra. Ainsi, j’observe actuellement une émeraude: elle est “grue” (pour T = 10 milliards d’années). Si je projette cette propriété à travers un critère de lieu, j’en conclus légitimement que l’émeraude trouvée au coeur de la forêt amazonienne sera également “grue”, de même également que l’émeraude qui vient d’être extraite d’une mine d’Afrique du Sud. A ce stade, on pourrait s’interroger pour savoir si la projectibilité de “grue” n’est pas liée intrinsèquement au choix d’une définition de “grue” basée sur le ou inclusif (grue12) ? Cependant, on vérifie aisément en utilisant une définition alternative de “grue” que sa projection demeure valide[27]. On remarque qu’on a ici l’expression du fait que la taxinomie basée sur la tcouleur* est plus grossière que celle basée sur le temps et la couleur. En effet, la première ne comprend que 2 taxons (grue/bleen), alors que la seconde en comprend 4. En réduisant les critères de couleur et de temps à un critère unique de tcouleur*, on a remplacé 4 taxons (RT Ù R~T, RT Ù ~R~T, ~RT Ù R~T, ~RT Ù ~R~T) par 2. Ainsi, “grue” constitue de ce point de vue un prédicat plus grossier que “rouge”. L’univers qui est décrit n’a pas changé, mais les n-univers qui sont des systèmes de critères décrivant ces univers sont différents. Avec la tcouleur* ainsi définie, on dispose de moins de prédicats pour décrire une même réalité. Les prédicats “grue” et “bleen” sont pour nous peu informatifs, et le sont moins, en tout état de cause que nos prédicats “rouge”, “non rouge”, “avant T”, etc. Mais cela n’empêche pas toutefois “grue” et “bleen” d’être projectibles. Alors que la projection de “grue” se révèle valide dans le Ω2ZL, on remarquera cependant que l’on n’observe pas dans ce cas la contradiction entre (P) et (P’*). Car ici (I*) équivaut bien à :

(I’*) RT1L1·RT2L2·RT3L3·…·RT99 L99 puisque, sachant d’après les données initiales de GP que les instances-S sont RT, on remplace valablement les GLi par les RTiLi (i < 100). Mais il apparaît que dans cette hypothèse, (P*) n’entraîne pas :

(P’*) ~RT100L100 car on ne possède pas d’indication relative à la temporalité de la 100ème instance, du fait que seule la localisation constitue ici le critère différencié. En conséquence, on a bien dans le cas du Ω3CTL une version construite à partir des éléments de GP où la projection de “grue” s’effectue valablement, mais qui ne se révèle pas paradoxale.

7. Conclusion

Dans la solution à GP proposée par Goodman, un prédicat est projectible ou non projectible dans l’absolu. Et on a d’autre part une correspondance entre les prédicats implantés[28]/ non implantés et les prédicats projectibles / non projectibles. Goodman par ailleurs ne fournit pas de justification à cette assimilation. Dans la présente approche, on n’a pas une telle dichotomie, car un prédicat donné P se révèle projectible dans un n-univers donné, et non projectible dans un autre n-univers. Ainsi, P est projectible relativement à tel univers de référence. On a donc la distinction projectible non projectible relativement à tel n-univers. Et cette distinction est justifiée par les conditions de l’induction, et par le mécanisme fondamental de celle-ci par rapport à la dualité unification/différenciation. On a ainsi des n-univers où “vert” est projectible et d’autres ou il ne l’est pas. De même, “grue” se révèle ici projectible relativement à certains n-univers. Ni vert ni grue ne sont projectibles dans l’absolu, mais seulement relativement à tel univers donné. De même que d’autres prédicats, “grue” est projectible dans certains univers de référence, mais non projectible dans d’autres[29]. Ainsi, il s’avère qu’une des causes de GP réside dans le fait que dans GP, on s’attache classiquement à opérer une dichotomie entre les prédicats projectibles et les prédicats non projectibles. Les solutions classiquement proposées pour résoudre GP sont respectivement basées sur la distinction temporel / non temporel, local / non local, qualitatif / non qualitatif, implanté / non implanté, etc. et une mise en correspondance avec la distinction projectible / non projectible. On s’interroge ainsi sur le caractère projectible ou non, dans l’absolu, de tel prédicat P* présentant la structure de “grue”. Ceci résulte du fait que dans GP, on a une contradiction entre les deux prédictions concurrentes (P) et (P*). On en déduit classiquement qu’une des deux prédictions doit être rejetée, en même temps qu’une des deux généralisations (H) ou (H*) sur lesquelles ces prédictions sont respectivement basées. A l’inverse, dans la présente analyse, que l’on se place dans le cas de la projection authentique Z°L ou de la pseudo-projection Z°T, on n’a pas la contradiction entre (P) et (P’*). Dès lors, on ne se trouve plus contraint de rejeter soit (H) soit (H*). Et la distinction entre prédicats projectibles / non projectibles ne se révèle plus indispensable[30]. Comment s’effectue dans ce contexte le choix de nos n-univers usuels ? Des n-univers tels que le Ω2CT, le Ω3CTL, le Ω2ZL etc. conviennent pour réaliser l’induction. Mais nous tendons naturellement à privilégier ceux qui sont basés sur des critères structurés assez finement pour permettre un maximum de combinaisons de projections. Si l’on opère à partir des critères Z et L dans le Ω2ZL, on s’autorise un nombre de combinaisons restreint : Z°L et L°Z. A l’inverse, si l’on retient les critères C, T et L, on se place dans le Ω3CTL et on a la possibilité des projections C°TL, T°CL, L°CT, CT°L[31], CL°T, TL°C. On a ainsi un maximum de combinaisons. Ceci semble inciter à préférer le Ω3CTL au Ω2ZL. Bien sûr, le pragmatisme semble devoir jouer un rôle dans le choix optimal de nos critères. Mais il semble que ce ne soit qu’un des multiples facteurs qui interagissent pour permettre l’optimisation de nos critères pour effectuer les opérations primitives de regroupement et de différenciation, afin de pouvoir ensuite généraliser, classer, ordonner, faire des hypothèses ou prévoir[32]. Parmi ces facteurs, on peut notamment citer : le pragmatisme, la simplicité, la souplesse de mise en oeuvre, la polyvalence[33], l’économie de moyens, la puissance[34], mais aussi la nature de notre univers réel, la structure de nos organes de perception, l’état de nos connaissances scientifiques, etc[35]. Nos n-univers habituels sont optimisés par rapport à ces différents facteurs. Mais ceci laisse valablement la place au choix d’autres systèmes de critères, en fonction des variations de l’un ou l’autre de ces paramètres[36].

[1] Nelson Goodman, “A Query On Confirmation”, Journal of Philosophy, vol. 43 (1946), p. 383-385; repris dans Problems and Projects, Indianapolis, Bobbs-Merrill, 1972, p. 363-366. [2] Avec quelques adaptations mineures. [3] Cf. Goodman “A Query On Confirmation”, p. 383 : “Suppose we had drawn a marble from a certain bowl on each of the ninety-nine days up to and including VE day and each marble drawn was red. We would expect that the marble drawn on the following day would also be red. So far all is well. Our evidence may be expressed by the conjunction “Ra1·Ra2·…·Ra99” which well confirms the prediction Ra100.” But increase of credibility, projection, “confirmation” in any intuitive sense, does not occur in the case of every predicate under similar circumstances. Let “S” be the predicate “is drawn by VE day and is red, or is drawn later and is non-red.” The evidence of the same drawings above assumed may be expressed by the conjunction “Sa1·Sa2·…·Sa99“. By the theories of confirmation in question this well confirms the prediction “Sa100“; but actually we do not expect that the hundredth marble will be non-red. “Sa100” gains no whit of credibility from the evidence offered.” [4] Nelson Goodman, Fact, Fiction and Forecast, Cambridge, MA, Harvard University Press, 1954. [5] Ibid., p. 73-4 : “Suppose that all emeralds examined before a certain time t are green. At time t, then, our observations support the hypothesis that all emeralds are green; and this is in accord with our definition of confirmation. […] Now let me introduce another predicate less familiar than “green”. It is the predicate “grue” and it applies to all things examined before t just in case they are green but to other things just in case they are blue. Then at time t we have, for each evidence statement asserting that a given emerald is green, a parallel evidence statement asserting that that emerald is grue.” [6] Par exemple avec une précision de 10-4 nm. [7] Ou toute taxinomie qui en est proche. [8] Cf. §2. [9] Cette affirmation est controversée. [10] Une telle remarque s’applique également à l’énoncé de Goodman, Fact, Fiction and Forecast. [11] Ainsi que le mentionne J.S. Ullian, “More on ‘Grue’ and Grue”, Philosophical Review, vol. 70 (1961), p. 386-389, en p. 387. [12] Soit C(0, 4)+C(1, 4)+C(2, 4)+C(3, 4)+C(4, 4) = 24, où C(pq) désigne le nombre de combinaisons de qéléments pris p à la fois. [13] Cf. Goodman, “A Query On Confirmation”, p. 383 : “Induction might roughly be described as the projection of characteristics of the past into the future, or more generally of characteristics of one realm of objects into another.” [14] Cf. §2 ci-dessus. [15] On peut bien sûr prendre en considération, de manière alternative, plusieurs instances-D. [16] Cf. §2 ci-dessus. [17] Ibid.

[18] Pour l’application de cette condition, on doit tenir compte des remarques mentionnées plus haut concernant le problème du statut des instances. Ainsi, on doit en réalité assimiler un 1-univers instancié et temporel à un 2-univers dont l’un des critères est temporel, et le second critère n’est pas explicité. De même, un 1-univers instancié et coloré s’assimile en fait à un 2-univers dont l’un des critères est temporel, et le second critère n’est pas spécifié.

[19] Cf. §3 ci-dessus. [20] Avec les notations C (couleur), T (temps), L (localisation) et Z (tcouleur*). [21] Toutefois, dès lors que le fait qu’il existe une ou plusieurs instances n’est pas essentiel dans la formulation du problème considéré, on pourra évidemment s’abstenir d’en faire mention. [22] Cf. §4. [23] Ibid. [24] Il s’agit de celle basée sur le ou inclusif (grue12). [25] Une même solution s’applique, bien sûr, si l’on considère un nombre de critères-variables supérieur à 3. [26] Tout autre critère distinct de la couleur ou du temps, conviendrait également. [27] En particulier, il apparaît que la projection d’une définition conjonctive (grue2) nous est en fait familière. En effet, nous ne faisons pas autre chose lorsque nous projetons le prédicat “être vert avant maturité et rouge après maturité” applicable aux tomates, à travers un critère différencié de lieu : ceci est vrai des 99 instances-S observées en Corse et en Provence, et se projette valablement à une 100ème instance située en Sardaigne. On peut observer qu’un tel type de projection est notamment considéré comme non problématique par Jackson (Franck Jackson, “‘Grue'”, Journal of Philosophy, vol. 72 (1975), p. 113-131) : “There seems no case for regarding ‘grue’ as nonprojectible if it is defined this way. An emerald is grue1 just if it is green up to T and blue thereafter, and if we discovered that all emeralds so far examined had this property, then, other things being equal, we would probably accept that all emeralds, both examined and unexamined, have this property (…). Si on devait replacer un tel prédicat dans la présente analyse, on devrait alors considérer que la projection s’effectue par exemple à travers un critère différencié de localisation (p. 115). [28] C’est-à-dire “entrenched” (Goodman, Fact, Fiction and Forecast). [29] La conception développée dans J. Holland, K. Holyoak, R. Nisbett et P. Thagard (Induction, Cambridge, MA; Londres, MIT Press, 1986) me paraît constituer une variation de la solution de Goodman, orientée vers le traitement informatique des données et basée sur la distinction intégré / non intégré dans la hiérarchie par défaut. Mais la solution de Holland présente les mêmes inconvénients que celle de Goodman : quelle justification sinon anthropocentrique, possède-t-on pour cette distinction ? Cf. p. 235 : “Concepts such as “grue”, which are of no significance to the goals of the learner, will never be generated and hence will not form part of the default hierarchy. (…) Generalization, like other sorts of inference in a processing system, must proceed from the knowledge that the system already has”. La présente analyse se distingue aussi de celle présentée par Susan Haack (Evidence and Inquiry, Oxford; Cambridge, MA, Blackwell, 1993), car l’existence d’espèces naturelles (natural kinds) ne constitue pas ici une condition pour l’induction. Cf. p. 134 : “There is a connection between induction and natural kinds. […] the reality of kinds and laws is a necessary condition of successful inductions”. Dans le présent contexte, le fait que les conditions de l’induction (un critère commun, un critère différencié distinct, etc.) soient satisfaites convient pour réaliser l’induction.

[30] Une remarque similaire est formulée par Franck Jackson en conclusion de son article (“‘Grue'”, p. 131) : “[…] the SR can be specified without invoking a partition of predicates, properties or hypotheses into the projectible and the nonprojectible”. Pour Jackson, tous les prédicats non contradictoires sont projectibles : “[…] all(consistent) predicates are projectible.” (p. 114). Une telle conclusion apparaît toutefois plus forte que celle qui résulte de la présente analyse. Car pour Jackson, tous les prédicats sont donc projectibles dans l’absolu. Mais dans le présent contexte, on n’a pas de prédicats projectibles ou non projectibles dans l’absolu. Ce n’est que relativement à un n-univers donné, qu’un prédicat P se révèle projectible ou non projectible.

De manière plus générale, la présente analyse se distingue essentiellement de celle de Jackson en ce sens que la solution proposée à GP ne repose pas sur la condition contrefactuelle (conterfactual condition). Cette dernière en effet apparaît trop liée à l’utilisation de certains prédicats (examinedsampled, etc.). En revanche, dans le présent contexte, on considère le problème d’un point de vue général, indépendamment de la nature particulière des prédicats composant la définition de grue. [31] Une telle projection correspond par exemple à la généralisation selon laquelle “Les statues-menhirs anthropomorphes sont de la couleur du granit et de l’Age du Bronze”. [32] Comme le souligne Ian Hacking, Le plus pur nominalisme, Combas, L’éclat, 1993, p. 9: “Utiliser un nom pour une espèce, c’est (entre autres choses) vouloir réaliser des généralisations et former des anticipations concernant des individus de cette espèce. La classification ne se limite pas au tri : elle sert à prédire. C’est une des leçons de la curieuse “énigme” que Nelson Goodman publia il y a quarante ans.” [33] Le fait qu’un même critère puisse servir à la fois de critère commun et de critère différencié (en recourant éventuellement à des taxons différents). [34] C’est-à-dire le nombre de combinaisons rendues possibles. [35] Cette énumération ne prétend pas être exhaustive. Une étude plus approfondie de cette question serait bien entendu nécessaire. [36] Je remercie le rédacteur de Dialogue ainsi que deux experts anonymes pour l’ensemble de leurs commentaires concernant une version précédente de cet article.

Introduction à la philosophie analytique: Paradoxes, arguments et problèmes contemporains

Dans cet ouvrage (2ème édition), Paul Franceschi nous livre une introduction à la philosophie analytique. De manière concrète, il choisit de décrire quarante paradoxes, arguments ou problèmes philosophiques, qui constituent autant de défis pour la philosophie contemporaine et l’intelligence humaine. Car certains paradoxes d’origine millénaire – tels que le Menteur ou le paradoxe sorite – ne sont toujours pas résolus à l’époque actuelle. D’autres énigmes philosophiques en revanche – telles que l’argument de l’Apocalypse – ne sont apparues que très récemment dans la littérature. L’auteur s’attache à nous présenter clairement chacun de ces problèmes ainsi que les principales tentatives qui ont été formulées pour les résoudre.

“Un réjouissant concentré de casse-têtes: j’adore ce livre ! (…) Je suis vraiment impressionné par ce livre trés soigné et stimulant. Je le recommande chaudement, tant aux étudiants pour la pédagogie et la culture générale (dilemme du prisonnier, Terre-jumelle, etc.), qu’aux pros pour l’outil de référence, et même plus généralement à ceux qui aiment réfléchir.” Julien Dutant, Blog philosophique.

Les enfants d’Eubulide

Dans ce dialogue à trois personnages, Paul Franceschi transpose l’enseignement d’Eubulide – qui fut dirigeant de l’Ecole de Mégare – à l’époque contemporaine, 2500 ans plus tard. Pharamménion expose son enseignement à Ephilodie et à Vallidor. La discussion porte sur plusieurs des paradoxes célèbres introduits par Eubulide – le Menteur, le paradoxe sorite – mais aussi d’autre paradoxes modernes comme celui de la Belle au bois dormant, le paradoxe de Goodman, etc… Mais très vite, Ephilodie et Vallidor découvrent que l’intérêt de l’étude des paradoxes ne réside pas seulement dans les paradoxes proprement dits, et commencent à entrevoir peu-à-peu toute la portée de l’enseignement initié par Eubulide. Des connexions inattendues se font jour…