Archives par étiquette : dualités

Réaliser un plan dialectique pour un sujet d’ordre général

Mon cours (durée : 4h08) intitulé “Réaliser un plan dialectique pour un sujet d’ordre général” (à partir de ce lien, vous bénéficiez d’une réduction importante) est en ligne sur Udemy.

Le cours est une version à visée pédagogique et pratique, qui expose les notions contenues dans mes articles Une classe de concepts et Le plan dialectique : pour une alternative au paradigme, publiés dans la revue Semiotica. Il s’agit d’une méthode pas-à-pas, accompagnée d’exercices, afin d’apprendre à réaliser un plan dialectique, à l’aide des matrices de concepts.

Comparaison de deux outils conceptuels : le carré sémiotique et les matrices de concepts

Comparaison de deux outils conceptuels : le carré sémiotique et les matrices de concepts

Paul Franceschi

Fontaine du Salario

lieu-dit Morone

20000 Ajaccio

France

paul@paulfranceschi.com

Dans ‘Une Classe de Concepts’ (Semiotica, 2002), j’ai présenté une théorie des matrices de concepts, qui visait à fournir une alternative au carré sémiotique de Greimas. Dans le présent document, j’effectue une comparaison entre le carré de l’opposition et les matrices de concepts. Tout d’abord, je teste la construction résultant des deux outils conceptuels alternatifs par rapport à trois concepts paradigmatiques : l’amour, la haine et l’indifférence. J’applique d’abord le carré sémiotique à la triade amour-haine-indifférence. Je regroupe ensuite les concepts issus du carré sémiotique dans un cadre qui convient mieux pour réaliser des comparaisons. J’utilise aussi les matrices de concepts avec la même association triadique de concepts. D’autre part, j’étends l’analyse précédente à une autre paire de concepts paradigmatiques opposés : masculin/féminin. Je mets finalement en correspondance les deux séries de concepts qui en résultent, mettant ainsi en lumière les points communs et les différences entre les deux outils conceptuels.

Dans ce qui suit, je m’attacherai à effectuer une comparaison entre d’une part le carré sémiotique et d’autre part, les matrices de concepts introduites dans Franceschi (2002). La comparaison entre les deux outils conceptuels sera effectuée par rapport à un triplet de concepts (amour-haine-indifférence), puis à une paire de concepts (masculin-féminin).

1. Les matrices de concepts

De manière préliminaire, il est utile de décrire les éléments essentiels du cadre formel qui a été décrit de manière détaillée dans Une classe de concepts (2002). Soit tout d’abord une dualité donnée. Celle-ci peut être dénotée par A/Ā, où A et Ā constituent des concepts duaux. On peut considérer également que A et Ā sont des concepts qui possèdent une composante contraire c, de sorte que c[A] = 1 et c[Ā] = -1. De même, la polarité p de A et Ā étant neutre, ces derniers concepts peuvent être dénotés par A0 et Ā0.

À ce stade, on peut définir la classe des pôles canoniques. Il suffit de considérer l’extension de la classe précédente {A0, Ā0}, telle que A0 et Ā0 admettent respectivement un concept corrélatif dont la polarité est soit positive soit négative. Les concepts qui en résultent peuvent être dénotés respectivement par {A+, A} et {Ā+, Ā}. Ainsi, pour une dualité donnée A/Ā, on obtient les six concepts suivants : {A+, A0, A, Ā+, Ā0, Ā}, que nous pouvons dénommer les pôles canoniques. Ceci conduit à distinguer entre les pôles canoniques positifs (A+, Ā+), neutres (A0, Ā0) et négatifs (A, Ā). Enfin, la classe constituée par les six pôles canoniques peut être dénommée la matrice canonique : {A+, A0, A, Ā+, Ā0, Ā}.

Intéressons-nous maintenant aux relations existant entre les pôles canoniques d’une même matrice. Parmi les relations existant entre les six pôles canoniques (A+, A0, A, Ā+, Ā0, Ā), on peut mentionner : la dualité, l’antinomie et la complémentarité. Ainsi, deux pôles canoniques donnés d’une même matrice sont :

(i) duaux si leurs composantes contraires sont opposées et leurs polarités sont neutres

(ii) contraires (ou antinomiques) si leurs composantes contraires sont opposées et leurs polarités sont non neutres et opposées

(iii) complémentaires si leurs composantes contraires sont opposées et leurs polarités sont non neutres et égales

Résumons : {A0, Ā0} sont duaux, {A+, Ā} et {A, Ā+} sont contraires, {A+, Ā+} et {A, Ā} sont complémentaires.

À partir du cadre théorique ainsi défini, on est à même d’obtenir une classification des concepts comportementaux, qui est calquée sur la structure même des matrices de concepts. Parmi les concepts que cette dernière classification permet d’appréhender, on peut citer : courage, paresse, persévérance, entêtement, prodigalité, dogmatisme, modestie, etc. À titre d’exemple, la matrice à laquelle correspond le concept de courage est la suivante (une énumération plus générale de la classe des concepts comportementaux est exposée dans Franceschi (2002, note 22) :

2. Le carré sémiotique

Le carré sémiotique est un outil conceptuel destiné à l’analyse paradigmatique, qui a été développé par Algirdas Greimas (1970, 1977), et inspiré du carré logique aristotélicien. Le carré sémiotique permet d’enrichir et d’étendre l’ontologie qui se rapporte à une paire de concepts opposés. Le processus qui consiste à enrichir progressivement l’ontologie inhérente à une paire de concepts opposés, peut être décrit de la manière suivante. Soient tout d’abord les deux concepts initiaux : S1 et S2, tels qu’il existe entre ces deux concepts une relation d’opposition. Le carré sémiotique permet, dans une première étape, de construire deux autres concepts qui répondent respectivement à la définition : non-S1 et non-S2. On obtient ainsi les quatre ‘termes’ qui justifient la dénomination de ‘carré’ sémiotique : S1, S2, non-S1, non-S2. Il s’ensuit également les relations suivantes entre les quatre termes :

▪ S1 et S2 : opposition

▪ non-S1 et non-S2 : relation de sub-contraire

▪ S1 et non-S1 : contradiction

▪ S2 et non-S2 : contradiction

▪ S1 et non-S2 : complémentarité

▪ S2 et non-S1 : complémentarité

Le schéma résultant du carré sémiotique laisse également apparaître, à ce stade, six ‘axes’ différents, qui sont déterminés par les six relations précédentes :

▪ S1/S2 : l’axe des contraires

▪ non-S1/non-S2 : l’axe des sub-contraires

▪ S1/non-S1 : non dénommé

▪ S2/non-S2 : non dénommé

▪ S1/non-S2 : deixis positive

▪ S2/non-S1 : deixis négative

Dans une seconde étape, le carré sémiotique permet la construction d’une nouvelle série de concepts, associés à chacun des axes qui viennent d’être mentionnés. Cette nouvelle construction s’effectue à l’aide de l’opérateur de conjonction ‘et’, appliqué aux deux concepts correspondant à chacun des axes précités. Il en résulte six nouveaux concepts, qui correspondent aux définitions suivantes :

▪ S1 et S2 : le ‘terme complexe’

▪ non-S1 et non-S2 : le ‘terme neutre’, c’est-à- dire ni S1 ni S2

▪ S1 et non-S1 : non dénommé

▪ S2 et non-S2 : non dénommé

▪ S1 et non-S2 : la deixis positive

▪ S2 et non-S1 : la deixis négative

Parmi ces concepts, on retient essentiellement le ‘terme complexe’ et le ‘terme neutre’, qui sont le plus souvent lexicalisés. Au total, ce sont donc dix concepts (si l’on inclut les deux concepts ‘non dénommés’) que permet de construire le carré sémiotique, qui sont représentés sur la figure ci-dessous :

3. Application au triplet de concepts amour-haine-indifférence

À ce stade, il convient de s’attacher à comparer les constructions qui résultent à la fois du carré sémiotique et des matrices de concepts, à partir d’une paire de concepts opposés. Nous nous intéresserons tout d’abord à la paire amour/haine (qui sera toutefois envisagée sous la perspective plus large du triplet amour/haine/indifférence), puis à la paire masculin/féminin.

L’application des matrices de concepts au triplet amour/haine/indifférence a été décrite en détail dans Franceschi (2005). Nous résumerons ici les éléments qui résultent d’une telle application, puis nous nous intéresserons à l’application du carré sémiotique à ce même triplet. Tout d’abord, l’application des matrices de concepts au triplet amour/haine/indifférence est basée sur la notion d’englobant. Il s’agit là d’une extension des matrices de concepts, introduite dans Franceschi (2005), qui permet de construire les relations existant entre certains concepts appartenant à des matrices distinctes. On pose ainsi qu’un concept  est un englobant pour deux autres concepts  et  si et seulement si  =   . Une telle définition, basée sur le ou inclusif, capture l’intuition selon laquelle  est le concept minimal dont le contenu sémantique inclut celui de  et de . À titre d’exemple, dans la logique trivaluée, on distingue trois valeurs de vérité : vrai, faux et indéterminé, où déterminé est un englobant pour {vrai, faux}. Soient maintenant A et E deux matrices dont les pôles canoniques sont respectivement {A+, A0, A, Ā+, Ā0, Ā} et {E+, E0, E, Ē+, Ē0, Ē}. Ces matrices sont telles que E+, E0, E sont les englobants respectifs pour {A+, Ā+}, {A0, Ā0}, {A, Ā}, c’est-à-dire telles que E+ = A+  Ā+, E0 = A0  Ā0 et E = A  Ā.

Nous pouvons dénoter cette relation entre les deux matrices par A < E. On prolonge alors les relations existant entre les pôles canoniques d’une même matrice, aux relations de même nature existant entre deux matrices présentant les propriétés de A et de E, c’est-à-dire telles que A < E. Il en résulte alors de manière directe les relations de 2-dualité, 2-antinomie, 2-complémentarité,qui prolongent les relations de dualité, antinomie, complémentarité, qui sont inhérentes à une matrice donnée. Ainsi deux pôles canoniques 1 et 2 de deux matrices différentes sont:

(i’) 2-duaux (ou duaux trichotomiques) si leurs polarités sont neutres et si le dual de 2 est un englobant pour 1

(ii’) 2-antinomiques (ou contraires trichotomiques) si leurs polarités sont non-neutres et opposées et si le contraire de 2 est un englobant pour 1

(iii’) 2-complémentaires (ou complémentaires trichotomiques) si leurs polarités sont non-neutres et égales et si le complémentaire de 2 est un englobant pour 1

Pour résumer : {A0, Ē0} et {Ā0, Ē0} sont 2-duaux, {A+, Ē}, {A, Ē+}, {Ā+, Ē} et {Ā, Ē+} sont 2-contraires, {A+, Ē+}, {A, Ē}, {Ā+, Ē+} et {Ā, Ē} sont 2-complémentaires.

À ce stade, nous sommes en mesure de compléter la matrice qui est associée aux concepts d’Amour+ et de Haine, de la manière suivante :

Et de même, nous pouvons compléter ainsi la matrice qui inclut la notion d’Indifférence :

Enfin, les relations existant entre les concepts des deux matrices peuvent être décrites en termes d’englobants :

Finalement, nous sommes en mesure de préciser les relations existant entre les différents concepts du triplet amour/haine/indifférence : d’une part, Amour+ et Indifférence sont des contraires trichotomiques et d’autre part, Haine et Indifférence sont des complémentaires trichotomiques. En outre, l’amour est le contraire de la haine ; l’amour est le 2-contraire de l’indifférence ; la haine est le 2-complémentaire de l’indifférence.

Il convient de s’intéresser, en second lieu, à la construction qui résulte du carré sémiotique, à partir du triplet de concepts amour-haine indifférence. Une telle construction, appliquée aux quatre termes du carré sémiotique, est notamment décrite par Titscher et al. 2000 (p. 129) :

Dans une seconde étape, on est à même de compléter plusieurs méta-termes, en introduisant en particulier le concept d’ ‘indifférence’, qui correspond au ‘terme neutre’, qui répond à la définition ‘ni amour ni haine’ :

4. Application à la paire de concepts masculin-féminin

À ce stade, il s’avère également intéressant de comparer les constructions qui résultent à la fois du carré sémiotique et des matrices de concepts, à partir d’une autre paire de concepts opposés : la paire masculin/féminin. L’application du carré sémiotique à la paire de concepts opposés masculin/féminin, tout d’abord, constitue une application classique du carré sémiotique (Floch 1985, Hébert 2007), où les quatre termes sont ainsi définis :

▪ S1 : masculin

▪ S2 : féminin

▪ non-S1 : efféminé

▪ non-S2 : hommasse

ainsi que les méta-termes :

▪ S1 et S2 : masculin et féminin, c’est-à-dire hermaphrodite (‘terme complexe’)

▪ non-S1 et non-S2 : non-masculin et non-féminin, c’est-à-dire asexué (‘terme neutre’)

▪ S1 et non-S2 : masculin et non-féminin c’est-à-dire viril (‘deixis positive’)

▪ S2 et non-S1 : féminin et non-masculin, c’est-à-dire féminité (‘deixis négative’)

▪ S1 et non-S1 : non dénommé

▪ S2 et non-S2 : non dénommé

Il en résulte la construction suivante :

En second lieu, l’application des matrices de concepts conduit à la construction ci-dessous, à partir de la paire de concepts opposés masculin/féminin :

À ce stade, il apparait que les termes ‘hermaphrodite’ et ‘asexué’ ne sont pas construits au niveau de la matrice de concepts. Cependant, il s’avère qu’‘asexué’ peut être construit à l’aide d’une seconde matrice et de la relation d’ ‘englobant’, d’une manière tout à fait similaire à celle qui a conduit à la construction des concepts associés au triplet amour-haine-indifférence. La seconde matrice est alors la suivante :

Cette seconde matrice est basée sur la paire de concepts opposés Sexué0/Asexué0. Dans ce cas, Sexué0 (qui fait défaut dans la construction résultant du carré sémiotique) est un englobant qui correspond à la définition : ‘Masculin0 ou Féminin0’. Il en résulte les relations suivantes entre les deux matrices de concepts, reliées par la notion d’englobant :

À ce stade, il apparaît ici que Sexué0 en tant qu’englobant peut être défini de deux manières, selon que l’on considère que la relation d’englobant est fondée sur :

– le ou exclusif : Masculin0 ou Féminin0, mais pas les deux à la fois

– le ou inclusif  : Masculin0 ou Féminin0, ou bien les deux à la fois (‘hermaphrodite’) c’est-à-dire finalement : masculin, féminin ou hermaphrodite

Une telle construction conduit ainsi à un éclairage supplémentaire par rapport à l’opposition Sexué0/Asexué0. En effet, la question suivante résulte de ce qui précède : qu’est-ce qui constitue le contraire d’ ‘Asexué0’ ? Est-ce (a) Sexué0 au sens de : Masculin0 ou (exclusivement) Féminin0 ? Ou bien est-ce (b) Sexué0 au sens de : Masculin0, Féminin0 ou hermaphrodite ? Une telle question possède une pertinence sémantique, et l’analyse qui précède permet d’apporter des éléments de réponse, qui mettent notamment en lumière l’ambiguïté qui préside à la notion de ‘sexué’, qui est donc susceptible de recevoir deux acceptions différentes : (a) masculin ou (exclusivement) féminin ; ou bien (b) masculin, féminin ou hermaphrodite.

La construction précédente montre également que le concept d’‘hermaphrodite’ proprement dit ne figure pas au nombre des concepts résultant des deux matrices précédentes, reliées à l’aide de la relation d’englobant. Cependant, ce que suggère la construction résultant du carré sémiotique, c’est que les deux matrices pourraient être reliées à l’aide d’une relation d’englobant qui s’identifierait au ‘et logique’. Dans ce cas, le concept d’‘hermaphrodite’ serait également engendré par une telle construction. Ainsi, la comparaison qui précède suggère finalement que les deux matrices de concepts pourraient être reliées à l’aide d’une notion d’englobant qui pourrait s’identifier à l’un des trois opérateurs logiques suivants : ou inclusif, ou exclusif, et logique. Le et logique serait ainsi hérité du carré sémiotique, et dans ce contexte, les concepts suivants en résulteraient : (a) Sexué0 au sens de ‘Masculin0, Féminin0 ou hermaphrodite’ (ou inclusif) ; (b) Sexué0 au sens de ‘Masculin0 ou (exclusivement) Féminin0’ ; et enfin (c) Hermaphrodite0 (et logique).

5. Correspondances entre le carré sémiotique et les matrices de concepts

Les développements qui précèdent permettent désormais d’établir une correspondance entre les concepts qui résultent du carré sémiotique et ceux qui sont obtenus à l’aide des matrices de concepts. Le fait de rendre explicites ces correspondances conduit à mieux appréhender les différences existant entre les deux outils conceptuels. Considérons, en premier lieu, les constructions qui résultent du carré sémiotique et des matrices de concepts, par rapport à la paire de concepts masculin/féminin. Les équivalences, portant sur les quatre termes du carré sémiotique et les matrices de concepts, s’établissent comme suit (le symbole ≡ dénotant la correspondance) :

▪ S1 (masculin) ≡ A0

▪ S2 (féminin) ≡ Ā0

▪ non-S1 (efféminé) ≡ Ā

▪ non-S2 (hommasse) ≡ A

Au-delà, au niveau des méta-termes, ces correspondances se manifestent de la manière suivante :

▪ S1 et non-S2 (viril : masculin et non-féminin : ‘deixis positive’ ) ≡ A+

▪ S2 et non-S1 (féminité : féminin et non-masculin : ‘deixis négative’) ≡ Ā+

▪ non-S1 et non-S2 (asexué : non-masculin et non-féminin : ‘terme neutre’) ≡ Ē0

En second lieu, les correspondances entre carré sémiotique et matrices de concepts par rapport au triplet amour/haine/indifférence, appliquées aux quatre termes du carré sémiotique, sont les suivantes :

▪ S1 (amour) ≡ A+

▪ S2 (haine) ≡ Ā

▪ non-S1 (non-amour) ≡ Ā0

▪ non-S2 (non-haine) ≡ A0

Et elles s’établissent de la manière suivante au niveau des méta-termes :

L’examen de ces correspondances montre finalement que ces dernières s’appliquent différemment pour la paire masculin/féminin et pour le triplet amour/haine/indifférence. Tout d’abord, la paire masculin/féminin et la paire amour/haine sont toutes deux associées aux termes S1 et S2 du carré sémiotique. En revanche, il s’avère que la paire masculin/féminin correspond aux concepts A0 et Ā0 de la matrice, alors que la paire amour/haine correspond aux concepts A+ et Ā de la matrice. Il apparaît que cette différence résulte de la méthodologie inhérente au carré sémiotique, où l’on commence par assigner les concepts aux termes S1 et S2, indépendamment de leur polarité intrinsèque, et où, dans une seconde étape, l’analyse est étendue aux concepts non-S1 et non-S2, et ensuite aux méta-termes. En revanche, dans le processus de construction des matrices de concepts, on commence par attribuer une polarité aux concepts selon leur connotation – positive, négative ou neutre – et on leur assigne ensuite une place au sein de la matrice.

6. Conclusion

Les développements qui précédent ont permis de mettre en lumière les différences existant dans les processus de construction de concepts résultant du carré sémiotique et des matrices de concepts, à partir de la paire de concepts masculin/féminin et du triplet amour/haine/indifférence. La carré sémiotique conduit ainsi à la construction de dix concepts (incluant les deux concepts non dénommés) alors que l’utilisation des matrices de concepts se traduit par la construction de douze concepts appartenant à deux matrices différentes, mises en relation à travers la notion d’englobant. De plus, des correspondances entre les concepts résultant des deux types de constructions ont pu être mises en évidence. Ceci permet de mettre en lumière les étapes successives de la construction des concepts au sein des deux outils conceptuels : le carré sémiotique procède par affectation prioritaire des termes S1 et S2, et ensuite des termes non-S1 et non-S2 et enfin des méta-termes. En revanche, les matrices de concepts procèdent par détermination préalable de la polarité – positive, négative ou neutre – des concepts, puis par affectation des concepts dans la matrice. De plus, l’accent étant mis sur la relation ‘et’ à partir des quatre termes fondamentaux dans le carré sémiotique, alors qu’il est mis sur les connotations neutre, positive et négative au niveau des matrices de concepts.

Remerciements

Je remercie Marcin J. Schroeder pour des discussions très utiles.

Références

Floch, J-M. (1985). Quelques concepts fondamentaux en sémiotique générale, Petites mythologies de l’oeil et de l’esprit ; pour une sémantique plastique, Hadès-Benjamins, Paris-Amsterdam, 189-207. Franceschi, Paul (2002). Une classe de concepts. Semiotica, 139 (1/4), 211-226. Franceschi, Paul (2005). Le problème des relations amour-haine-indifférence. Semiotica, 152 (1-4), 251–260. Greimas, Algirdas J. (1970). Du Sens, Paris, Seuil. Greimas, A. J. (1977). Elements of a Narrative Grammar. Diacritics, 7, 23-40 Hébert, Louis (2007). Dispositifs pour l’analyse des textes et des images, Limoges, Presses de l’Université de Limoges
Titscher, S., Meyer, M., Wodak, R., Vetter, E. (2000). Methods of text and discourse analysis, London, Sage.

Analyse paradigmatique d’un corpus de proverbes à l’aide des matrices de concepts

Analyse paradigmatique d’un corpus de proverbes à l’aide des matrices de concepts

Paul Franceschi

Université de Corse

un article paru dans Semiotica (2007), volume 167, pages 271-282.

Abstract. In Franceschi (2002), I described a theory based on matrices of concepts that aims at constituting an alternative to the classification proposed by Greimas, in the field of paradigmatic analysis. I set out here to apply the matrices of concepts to the study of a corpus of Corsican proverbs. I recall briefly, first, the framework of matrices of concepts. I further describe the structure of proverbial theses, and I expose then the results of the corresponding analysis.

Résumé. Dans Franceschi (2002), j’ai présenté une théorie basée sur les matrices de concepts qui se propose de constituer une alternative à la classification proposée par Greimas, dans le domaine de l’analyse paradigmatique. Je m’attache ici à appliquer les matrices de concepts à l’analyse d’un corpus constitué de proverbes corses. Je rappelle tout d’abord brièvement le modèle des matrices de concepts. Je décris également la structure des thèses proverbiales, avant de présenter les résultats de l’analyse correspondante.


Dans ce qui suit, je m’attacherai à effectuer une analyse paradigmatique d’un corpus de proverbes corses à l’aide des matrices de concepts décrites dans Franceschi (2002).

Les matrices de concepts

De manière préliminaire, il est utile de décrire l’essentiel du cadre formel qui a été décrit de manière détaillée dans Une classe de concepts (2002). Soit tout d’abord une dualité donnée. Celle-ci peut être dénotée par A/Ā. À ce stade, A et Ā constituent des concepts duaux. On peut considérer également que A et Ā sont des concepts qui possèdent une composante contraire c, de sorte que c[A] = 1 et c[Ā] = -1. De même, la polarité p de A et Ā étant neutre (p = 0), ces derniers concepts peuvent être dénotés par A0 et Ā0.

À ce stade, on peut définir la classe des pôles canoniques. Il suffit de considérer l’extension de la classe précédente {A0, Ā0}, telle que A0 et Ā0 admettent respectivement un concept corrélatif dont la polarité est soit positive (p = 1) soit négative (p = -1). Les concepts qui en résultent peuvent être dénotés respectivement par {A+, A} et {Ā+, Ā}. Ainsi, pour une dualité donnée A/Ā, on obtient les six concepts suivants : {A+, A0, A, Ā+, Ā0, Ā}. Appelons-les les pôles canoniques. Ceci conduit à distinguer entre les pôles canoniques positifs (A+, Ā+), neutres (A0, Ā0) et négatifs (A, Ā). Enfin, la classe constituée par les six pôles canoniques peut être dénommée la matrice canonique : {A+, A0, A, Ā+, Ā0, Ā}.

Figure 1

Intéressons-nous maintenant aux relations existant entre les pôles canoniques d’une même matrice. Parmi les relations existant entre les six pôles canoniques (A+, A0, A, Ā+, Ā0, Ā), on peut mentionner : dualité, antinomie, complémentarité, corollarité, connexité, anti-connexité. Ainsi, deux pôles canoniques donnés d’une même matrice sont :

(i) duaux si leurs composantes contraires sont opposées et leurs polarités sont neutres

(ii) contraires (ou antinomiques) si leurs composantes contraires sont opposées et leurs polarités sont non neutres et opposées

(iii) complémentaires si leurs composantes contraires sont opposées et leurs polarités sont non neutres et égales

(iv) corollaires si leurs composantes contraires sont égales et leurs polarités sont non neutres et opposées

(v) connexes si leurs composantes contraires sont égales et la valeur absolue de la différence de leurs polarités est égale à 1

(vi) anti-connexes si leurs composantes contraires sont opposées et la valeur absolue de la différence de leurs polarités est égale à 1

Résumons : {A0, Ā0} sont duaux, {A+, Ā} et {A, Ā+} sont contraires, {A+, Ā+} et {A, Ā} sont complémentaires, {A+, A} et {Ā+, Ā} sont corollaires, {A0, A+}, {A0, A}, {Ā0, Ā+} et {Ā0, Ā} sont connexes, {A0, Ā+}, {A0, Ā}, {Ā0, A+} et {Ā0, A} sont anti-connexes.

À partir du cadre théorique ainsi défini, on est à même d’obtenir une classification des concepts comportementaux, qui est calquée sur la structure des matrices de concepts. Parmi les concepts que cette dernière classification permet d’appréhender, on peut citer ainsi : courage, paresse, persévérance, entêtement, prodigalité, dogmatisme, modestie, etc. À titre d’exemple, la matrice à laquelle correspond le concept de courage est la suivante (une énumération plus générale de la classe des concepts comportementaux est présentée dans Franceschi (2002, note 22) :

Figure 2

Cette classification des concepts comportementaux servira de base à la présente étude. Mais avant de présenter les résultats auxquels conduit cette dernière, il est nécessaire de décrire plus en détail la structure particulière des propositions proverbiales qui font l’objet de la présente analyse.

Structure des thèses proverbiales

Dans ce qui suit, chacun des proverbes étudiés sera considéré comme une thèse simple (Franceschi 2004) relative à un concept d’une matrice donnée. D’une manière générale, une thèse simple constitue une appréciation – négative, neutre ou positive – formulée pare rapport à un concept donné. Si l’on dénote par  un tel concept, la structure de la thèse simple correspond alors à p(), avec   {A+, A0, A, Ā+, Ā0, Ā}, p dénotant une polarité positive (p = 1), neutre (p = 0) ou négative (p = -1). Une appréciation négative s’assimile alors à un blâme et une appréciation positive à un éloge (l’appréciation neutre, qui se rencontre rarement, peut être ignorée ici). Ainsi, le blâme d’un concept  est dénoté par () et son éloge par +(). Les différents cas de figure théoriques, par rapport aux six concepts d’une même matrice, sont ainsi les suivants : (A+), (A0), (A), +), 0), ), +(A+), +(A0), +(A), ++), +0), +).

Il convient maintenant de s’intéresser aux thèses proverbiales simples, qui présentent la structure d’un blâme ou d’un éloge. Considérons tout d’abord le blâme. Un certain nombre de thèses proverbiales comportent ainsi une appréciation dévalorisante, dépréciative, par rapport à un certain type de comportement, une manière d’agir ou d’appréhender les choses. On peut dénoter ce type de thèse simple par (s) où s désigne un type de comportement ou une manière de considérer les choses. Pour fixer les idées, considérons quelques exemples. Soit la thèse proverbiale suivante :

(1) À chì dormi un piglia pesci.(Celui qui dort ne prend pas de poissons)

Le point de vue exprimé ici est que l’inactivité ou la paresse ne permettent pas à une personne de subvenir à ses propres besoins, de se nourrir. Ceci s’analyse en un jugement négatif, dépréciatif vis-à-vis de la paresse. Ce dernier concept peut être considéré comme une notion péjorative, que l’on peut dénoter par paresse. Ainsi, la thèse proverbiale simple exprimée ici présente-t-elle la structure d’un blâme de la paresse, qui peut être dénotée par (paresse).

Soit également cette autre thèse proverbiale :

(2) Un si pò fà u passu più longu chè l’infurcatura. (On ne peut pas faire le pas plus long que l’enfourchure)

Le contenu de cette dernière thèse proverbiale s’analyse comme une appréciation péjorative formulée à l’encontre de la tendance à vouloir faire des choses au-delà de ses propres capacités, à voir trop grand. Une telle thèse présente ainsi une structure qui constitue le blâme du concept péjoratif de vanité, de prétention, que l’on peut ainsi dénoter par (prétention).

Considérons, en second lieu, les thèses proverbiales qui présentent la structure d’un éloge. De telles thèses comportent une appréciation flatteuse par rapport à un comportement, une propension à agir, une situation ou une manière d’appréhender les choses. On dénote les propositions correspondantes par +(s) où s désigne une façon de considérer les choses ou un comportement donnés. Considérons ainsi quelques exemples. Soit tout d’abord la thèse proverbiale suivante :

(3) U megliu oru hè quiddu chì piega.(Le meilleur or est celui qui plie)

La structure sémantique de cette thèse proverbiale simple est basée sur une analogie. L’or le plus souple, le plus ductile, est qualifié de « meilleur ». Par analogie, cette dernière qualité est étendue aux humains, valorisant ainsi celui qui est capable de faire preuve de souplesse, d’adaptabilité. Il s’agit ainsi d’un éloge, d’une louange formulée vis-à-vis de la souplesse. Cette dernière notion étant méliorative, le point de vue ainsi exprimé présente la structure d’un éloge de la souplesse+, soit formellement +(souplesse+).

On rencontre également un type de structure identique, au niveau de la thèse suivante :

(4) Chì va pianu va sanu è chì va sanu va luntanu. (Celui qui va lentement va sûrement et celui qui va sûrement va loin)

qui s’analyse comme la valorisation d’une façon d’agir tranquille et non précipitée, c’est-à-dire un éloge du calme+, soit de manière formelle +(calme+).

À ce stade, on est à même de déterminer la valeur de vérité de chacune des thèses simples. La valeur de vérité de chaque type d’éloge ou de blâme1 indique si l’appréciation et le comportement sur lequel elle porte se révèlent cohérents ou non au niveau de la thèse proverbiale considérée, sachant que l’éloge d’un concept positif est vrai, de même que le blâme d’un concept négatif. À l’inverse, l’éloge d’un concept négatif ou neutre et le blâme d’un concept positif ou neutre sont faux. Ainsi, parmi les différents cas qui viennent d’être énumérés, ceux dont la valeur de vérité est vrai sont : (A), ), +(A+), ++). Et ceux dont la valeur de vérité est faux sont : (A+), (A0), +), 0), +(A0), +(A), +0), +).

On peut mentionner enfin, que l’on peut rencontrer, plus rarement, une structure qui est celle d’une thèse 2-composée (Franceschi 2004), qui comporte des appréciations relatives à deux concepts d’une même matrice et qui peut être définie comme la conjonction de deux thèses simples. La thèse proverbiale suivante constitue l’illustration d’une thèse 2-composée :

(5) A pratica vinci a grammatica. (La pratique domine la théorie)  (prétention)  (prétention)

En effet, cette dernière thèse comporte la mention des concepts duaux d’une même matrice (la pratique et la théorie), et s’analyse ainsi en une thèse qui comporte d’une part l’éloge explicite de la pratique (« La pratique domine la théorie ») et d’autre part le blâme implicite de la théorie (« La théorie est dominée par la pratique »). Soit formellement : +(pratique0) et (théorie0).

Analyse du corpus de proverbes

Dans ce qui suit, je m’attacherai à appliquer la méthodologie qui vient d’être décrite à un corpus constitué de proverbes corses (Wikiquote 2006). La démarche consistera ainsi à sélectionner les proverbes qui présentent la structure d’une thèse simple (plus rarement, il s’agira d’une thèse 2-composée) telle qu’elle vient d’être définie, à en déterminer le contenu sémantique, et à synthétiser les résultats ainsi obtenus dans un tableau final.

De manière préalable, il est utile de distinguer ici les thèses proverbiales simples portant sur un concept comportemental, des proverbes dont la portée se révèle plus limitée. Un certain nombre de proverbes présentent en effet une connotation locale ou temporelle. Plusieurs proverbes comportent ainsi un prédicat local, qui se réfère par exemple à une localité, un village ou une ville donnés. On peut citer ainsi : Sè Bastelica t’avia u portu, Aiacciu saria l’ortu (Si Bastelica avait un port, Ajaccio n’en serait que le jardin).Une autre catégorie de proverbes se caractérise par la présence d’un prédicat temporel, qui se réfère à un mois ou un jour ou l’autre de l’année. Les proverbes qui appartiennent à cette catégorie présentent un champ d’application qui est limité dans le temps. Parmi ces derniers, on peut citer par exemple : Aqua d’aostu, oliu è mostu (De l’eau en août donne de l’huile et du moût).

À ce stade, il est utile de noter que de nombreux proverbes corses présentent la structure conditionnelle suivante : si <comportement> alors <situation>, où <situation> consiste dans la description d’une situation, d’un état de fait, faisant suite à un type de comportement donné. La forme paradigmatique du proverbe corse présentant cette structure particulière est ainsi : À chì (Celui qui) … <comportement> … <situation>.

Une telle structure se révèle particulièrement adaptée à la formulation des thèses simples, compte tenu du fait que <comportement> et <situation> peuvent présenter une forme négative, neutre ou positive. En particulier, la polarité – positive ou négative – attribuée à <situation> permet l’expression de l’éloge ou du blâme relatif à un type de <comportement> donné. Les proverbes ci-dessous constituent l’illustration d’une telle structure :

(1) À chì dormi un piglia pesci.(Celui qui dort ne prend pas de poissons)

(6) À chì posa mal’ pensa (Celui qui reste sans rien faire, pense à mal)

On peut mentionner également qu’une telle structure constitue une instance de la forme causale plus générale : si <cause> alors <effet>.

À ce stade, on est en mesure de présenter les résultats de l’analyse effectuée à l’aide de la méthodologie basée sur les matrices de concepts qui vient d’être décrite. Tout d’abord, la partie du corpus qui a fait l’objet de l’analyse est constitué par les thèses proverbiales suivantes2 :

(7) A lingua ossu ùn ha è ossu tronca. (La langue ne possède pas d’os, mais peut faire rompre les os)  (dénigrement)

(8) A misura ancu ind’è l’aqua. (Il faut de la mesure en tout, même lorsqu’on boit)  +(modération+)

(5) A pratica vinci a grammatica. (La pratique domine la théorie)  +(goût pour la pratique0)  (goût pour la théorie0)

(9) A regula ci stà bè ancu in casa di u rè. (Même dans la maison du roi, on fait des économies)  +(sens de l’économie)

(10) À a fica zemba ognunu s’arremba. (Tout le monde profite du faible. Litt. : tout le monde s’appuie sur le fichier qui penche)  (faiblesse)

(11) À chì campa spirendu mori caghendu. (Celui qui vit d’espérance, meurt dans le dénuement)  (attrait pour les chimères)

(12) À chì di piombu tomba di piombu mori. (Celui qui tue par le plomb périt par le plomb)  (violence)

(1) À chì dormi un piglia pesci.(Celui qui dort ne prend pas de poissons)  (paresse)

(13) À chì l’attempa a perdi. (Celui qui diffère une chose, finit par la perdre)  (lenteur)

(14) À chì muta muga. (Celui qui fait des changements, blesse)  (inclination au changement0)

(6) À chì posa mal’ pensa (Celui qui reste sans rien faire, pense à mal)  (paresse)

(15) À chì s’aiuta hè galant’ omu. (Il est louable de se prendre en main)  +(s’occuper de soi)

(16) À chì servi u cumunu ùn servi à nissunu. (Celui qui se sert le bien commun ne sert personne)  (altruisme+)

(17) À chì tropppu abbraccia nudda strigni. (Qui trop embrasse mal étreint)  (dispersion)

(18) À chì tropppu si cala, u culu vi mostra. (Celui qui se baisse trop, montre son cul)  (sous-estimation de soi)

(19) À chì ùn arrisica ùn arruzica. (Qui ne risque rien n’a rien. Litt. : celui qui ne risque rien n’a rien à ronger)  (éviter les risques0)

(20) À chì ùn si misura ùn dura. (Celui qui ne fait pas preuve de mesure ne dure pas)  (immodération)

(4) Chì va pianu va sanu è chì va sanu va luntanu. (Celui qui va lentement va sûrement et celui qui va sûrement va loin)  +(calme+)

(21) Ci voli à lagà u fusu à chì n’ha l’usu. (Chacun son métier. Litt. : Il faut laisser le fuseau à celui dont c’est le métier)  (expertise+)

(22) Di fà ciò chì hè fattu ùn hè piccatu. (Rendre ce que l’on nous a fait n’est pas pêcher)  +(violence)

(23) I funi longhi diventani sarpi. (Les cordes trop longues deviennent des serpents)  (lenteur)

(24) I solda ùn venini micca cantendu. (L’argent ne vient pas en chantant)  (paresse)

(25) Tuttu lagatu hè persu. (Toutes les occasions qu’on laisse passer sont perdues)  (réactions différées0)

(26) U bè di l’avaru u si magna u furfanti. (Le bien de l’avare, c’est le forban qui en profite)  (avarice)

(27) U cavaddu chi ùn vò bia hè un gattivu zifulà. (Il ne sert à rien de forcer un cheval qui ne veut pas boire)  (autoritarisme)

(3) U megliu oru hè quiddu chì piega.(Celui qui est souple réussit mieux. Litt. : le meilleur or est celui qui plie)  +(souplesse+)

(28) U troppu bè s’arrivolta. (Si on fait trop de bien aux gens, on finit par en retirer des ennuis. Litt. : faire trop de bien finit par nuire)  (rendre dépendant)

(2) Ùn si pò fà u passu più longu chè l’infurcatura. (On ne peut pas faire le pas plus long que l’enfourchure)  (prétention)

(29) Ùn si pò tena i dui pedi in u scarpu. (On ne peut courir deux lièvres à la fois. Litt. : on ne peut mettre les deux pieds dans une seule chaussure)  (dispersion)

(30) Una mani lava l’altra è tremindù lavani u visu. (Une main lave l’autre, et les deux lavent le visage)  +(altruisme+)

Et le tableau final qui en résulte est le suivant :

disponibilité+activité+
Goût du loisir0goût du travail0
(1) (6) (24)paressesuractivité
Amour-propre+modestie+
estime de soi0mise en retrait de l’ego0
(2)prétentionsous-estimation de soi(18)
(9)Sens de l’économie+générosité+
Inclination à l’épargne0inclination à la dépense0
(26)avariceprodigalité
audace+prudence+
Prise de risques0évitement des risques0(19)
téméritélâcheté
(15)s’occuper de soi+altruisme+(30) (16)
être tourné vers soi-même0être tourné vers les autres0
égoïsmerendre dépendant(28)
(3)souplesse+constance+
Tendance à changer0tendance à ne pas changer0
inconstancerigidité
idéalisme+réalisme+
Appréhender les objectifs0appréhender les moyens0
(11)Attrait pour les chimèresprosaïsme
Vicacité, spontanéité+calme+(4)
Réactions immédiates0réactions différées0(25)
précipitationlenteur(23) (13)
Capacité d’abstraction+pragmatisme+
(5)goût pour la théorie0goût pour la pratique0(5)
dogmatismeprosaïsme
sens de l’autorité+sens de la discipline+
goût du commandement0obéir0
(27)autoritarismeservilité
défense+pacifisme+
refus0acceptation0
(12) (22)violencefaiblesse
causticité+valorisation+
esprit critique0souligner les qualités0
(7)dénigrementangélisme
éclectisme+expertise+(21)
pluridisciplinarité0mono-disciplinarité0
(29) (17)dispersioncloisonnement
stabilité+adaptabilité+
inclination au statu quo0inclination au changement0(14)
invariabilitéinstabilité
motivation+modération+(8)
passion0raison0
(20)immodérationtiédeur
fermeté+diplomatie+
ne pas céder0faire des concessions0
intransigeancefaiblesse(10)

On le voit, la présente analyse conduit à mettre en évidence plusieurs points intéressants. Elle permet tout d’abord de souligner un certain nombre de congruences sémantiques. Par exemple, les deux thèses proverbiales (1) À chì dormi un piglia pesci et (24) I solda ùn venini micca cantendu présentent une structure commune qui est celle du blâme de la paresse. De même, l’analyse a permis d’expliciter les relations entre plusieurs thèses proverbiales (par exemple, (2) Ùn si pò fà u passu più longu chè l’infurcatura et (18) À chì tropppu si cala, u culu vi mostra) qui sont co-matricielles. En outre, l’analyse permet de souligner d’éventuelles contradictions telles que l’éloge et le blâme d’un même concept. Tel est notamment le cas pour et (22) Di fà ciò chì hè fattu ùn hè piccatu (éloge de la violence) et (12) À chì di piombu tomba di piombu mori (blâme de la violence). Enfin, les thèses proverbiales co-matricielles (29) Ùn si pò tena i dui pedi in u scarpu et (21) Ci voli à lagà u fusu à chì n’ha l’usu présentent un cas particulier de convergence sémantique : la première thèse proverbiale constitue le blâme du concept négatif de dispersion, alors que la seconde thèse réside dans l’éloge du concept positif opposé d’expertise+.

Conclusion

On le voit, le type d’analyse paradigmatique qui vient d’être décrit, appliqué à un corpus de proverbes corses, permet d’en préciser, selon une approche méthodique, le contenu sémantique. Ce type d’analyse basé sur les matrices de concepts peut aisément être étendu à d’autres corpus parémiologiques, ou bien utilisé pour effectuer des comparaisons entre plusieurs corpus parémiologiques. Plus généralement, on peut observer que ce type d’analyse peut également être appliqué d’autres types de textes au sein duquel la structure des thèses simples se révèle prédominante.3

Références

Franceschi, Paul (2002). Une classe de concepts. Semiotica, 139 (1-4), 211-226.
Franceschi, Paul (2003). Le plan dialectique : pour une alternative au paradigme. Semiotica, 146 (1-4), 353-367.
Wikiquote (2006). Corsican proverbs, http ://en.wikiquote.org/wiki/Corsican_proverbs

1 Comme on l’a vu, l’appréciation neutre se rencontre rarement.

2 On peut noter ici qu’un certain nombre de matrices de concepts comportementaux – qui peuvent être énumérées sous forme matricielle simplifiée – n’ont pas été utilisées ici :

{objectivité+, être neutre0, impersonnalité, engagement+, être partisan0, parti-pris}

{fermeté+, propension à réprimer0, sévérité, clémence+, propension à pardonner0, laxisme}

{expansion+, recherche de la quantité0, excès, perfectionnisme+, recherche de la qualité0, hyper-sélectivité}

{délicatesse+, sensibilité0, sensiblerie, sang-froid+, impassibilité0, froideur}

{droiture+, agir de façon directe0, brusquerie, tact+, agir de façon indirecte0, propension à biaiser}

{combativité+, goût de l’attaque0, agressivité, protection+, goût de la défense0, repli}

{mobilité+, penchant au déplacement0, instabilité, stabilité+, attrait du même endroit0, sédentarité}

{sens de l’humour+, goût du jeu0, légèreté, sérieux+, goût de l’activité sérieuse0, se prendre au sérieux}

{discrétion+, garder pour soi0, inhibition, ouverture+, rendre public0, indiscrétion}

{réceptivité+, propension à croire0, crédulité, scepticisme constructif+, propension à douter0, scepticisme excessif}

{optimisme+, appréhender les avantages0, optimisme béat, méfiance+, voir les inconvénients0, pessimisme}

{sens du collectif+, faire comme les autres0, conformisme, originalité+, se distinguer0, excentricité}

{résolution+, garder une opinion0, entêtement, souplesse d’esprit+, changer d’avis0, versatilité}

{goût de la liberté+, être affranchi0, indiscipline, obéissance+, se soumettre à une règle0, servilité}

{réflexion+, intériorisation0, inhibition, sociabilité+, extériorisation0, sans-gêne}

{renouveau+, intérêt au changement0, rupture, préservation des acquis+, intérêt au maintien0, conservatisme}

{ampleur de vues+, goût de la synthèse0, survol, précision+, goût de l’analyse0, se perdre dans les détails}

{amour+, attraction0, affection mièvre, savoir prendre ses distances+, répulsion0, haine}

{conquête+, avidité0, boulimie, sobriété+, avoir le minimum0, dénuement}

3 Je remercie Françoise Albertini et Dominique Salini pour leurs commentaires concernant le mémoire de DEA Langue et culture corses qui est à l’origine du présent article.

Une classe de concepts

Paul Franceschi

Université de Corse

post-publication d’un article initialement paru dans Semiotica (2002), volume 139 (1-4), pages 211-226


Cet article est cité dans les travaux suivants :


Classiquement, dans la discussion relative aux contraires polarisés1, on s’intéresse essentiellement aux concepts usuels, lexicalisés, c’est-à-dire pour lesquels il existe un mot correspondant dans le langage propre à une langue donnée. Cette manière de procéder tend à engendrer plusieurs inconvénients. L’un d’entre eux (i), réside dans le fait que de tels concepts sont susceptibles de varier d’une langue à l’autre, d’une culture à l’autre. Un autre (ii) des problèmes qui en résultent est le fait que certains concepts lexicalisés présentent une nuance soit méliorative, soit péjorative, avec des degrés dans ce type de nuances qui s’avèrent difficiles à apprécier. Enfin (iii), un autre problème réside dans le fait que certains concepts, selon l’analyse sémiotique2 sont considérés comme ‘marqués’ (marked) par rapport à d’autres qui sont ‘non marqués’ (unmarked), le statut de concept non marqué conférant une sorte de préséance, de prééminence aux concepts en question.

A mon sens, l’ensemble des inconvénients précités provient du fait que l’on travaille essentiellement, de manière classique, à partir des concepts lexicalisés. La démarche mise en oeuvre dans la présente étude se situe à l’inverse de cette manière de procéder. On commencera ici en effet par construire des concepts de manière abstraite, sans considération du fait que ces concepts sont ou non lexicalisés. Une fois cette construction réalisée, on pourra alors vérifier que certains des concepts ainsi construits correspondent effectivement à des concepts lexicalisés, alors que d’autres ne peuvent être mis en correspondance avec aucun mot du langage courant. Cette manière de procéder permet, me semble-t-il, d’éviter les inconvénients précités.

On le verra enfin, la construction qui est proposée ci-dessous permettra de proposer une taxinomie de concepts qui constitue une alternative à celle basée sur le carré sémiotique (semiotic square) défini par Greimas.

1. Dualités

On considère ici la classe des dualités, qui est composée de concepts correspondant à l’intuition que ces derniers:

(i) sont différents les uns des autres

(ii) sont minimaux ou irréductibles, c’est-à-dire ne peuvent plus se réduire à d’autres éléments sémantiques plus simples

(iii) se présentent sous forme de paires de concepts duaux ou contraires

(iv) constituent des prédicats

Chacun des concepts composant la dualité sera appelé pôle. On présentera ici une liste, qui ne prétend pas à être exhaustive, et pourra être si nécessaire, complétée. Soit donc l’énumération suivante des dualités3:

Analytique/Synthétique, Animé/Inanimé, Exceptionnel/Normal, Antécédent/Conséquent, Existant/Inexistant, Absolu/Relatif, Abstrait/Concret, Accessoire/Principal, Actif/Passif, Aléatoire/Certain, Discret/Continu, Déterministe/Indéterministe, Positif/Négatif, Vrai/Faux, Total/Partiel, Neutre/Polarisé, Statique/Dynamique, Unique/Multiple, Contenant/Contenu, Acquis/Inné, Beau/Laid, Bien/Mal, Temporel/Intemporel, Etendu/Restreint, Précis/Vague, Fini/Infini, Simple/Composé, Attiré/Repoussé, Egal/Différent, Identique/Contraire, Supérieur/Inférieur, Interne/Externe, Individuel/Collectif, Quantitatif/Qualitatif, Implicite/Explicite4, …

A ce stade, on observe que certains pôles présentent une nuance soit méliorative (beau, bien, vrai), soit péjorative (laid, mal, faux), soit neutre (temporel, implicite).

On dénotera par A/Ā une dualité donnée. Si on utilise des mots du langage courant pour dénoter la dualité, on utilisera des majuscules pour distinguer les concepts utilisés des concepts usuels. Exemple: les dualités Abstrait/Concret, Vrai/Faux.

On notera enfin que plusieurs questions5 se posent, de manière immédiate, en matière de dualités. Les dualités existent-elles (i) en nombre fini ou infini? De même, existe-t-il (ii) une construction logique qui permette d’énumérer les dualités?

2. Pôles canoniques

A partir de la classe des dualités, on est en mesure de construire celle des pôles canoniques. A l’origine, les concepts lexicalisés correspondant à chaque pôle d’une dualité présentent respectivement une nuance6 soit méliorative, soit neutre, soit péjorative. La classe des pôles canoniques correspond à l’intuition selon laquelle, pour chaque pôle d’une dualité A/Ā, on peut construire 3 concepts: un concept positif, un concept neutre et un concept négatif. Au total, pour une dualité A/Ā donnée, on construit donc 6 concepts, constituant la classe des pôles canoniques. Intuitivement, les pôles canoniques positifs répondent à la définition: forme positive, méliorative de ; les pôles canoniques neutres correspondent à la forme neutre, ni méliorative ni péjorative de ; et les pôles canoniques négatifs correspondent à la forme négative, péjorative de . On notera que ces 6 concepts sont construits à l’aide exclusivement de notions logiques. La seule notion qui échappe à ce stade à une définition logique est celle de dualité ou base.

Pour une dualité A/Ā donnée, on a ainsi les pôles canoniques suivants: {A+, A0, A, Ā+, Ā0, Ā}, que l’on pourra également dénoter respectivement par (A/Ā, 1, 1), (A/Ā, 1, 0) , (A/Ā, 1, -1) , (A/Ā, -1, 1) , (A/Ā, -1, 0) , (A/Ā, -1, -1).

Une majuscule pour la première lettre d’un pôle canonique sera utilisée, pour le distinguer du concept lexicalisé correspondant. Lorsqu’on voudra se référer de manière précise à un pôle canonique alors que le langage courant ne possède pas un tel concept ou bien se révèle ambigu, on pourra choisir un concept lexicalisé, auquel on ajoutera l’exposant correspondant à l’état neutre ou polarisé choisi. Pour mettre en évidence le fait que l’on se réfère explicitement à un pôle canonique – positif, neutre ou négatif – on utilisera les notations A+, A0 et A. On a ainsi par exemple les concepts Uni+, Uni0, Uni etc. Où Uni+ = Solide, Soudé, Cohérent et Uni = Monolithique. De même, Rationnel0 désigne le concept neutre correspondant au terme rationnel du langage courant, qui présente une nuance légèrement méliorative. De même, Irrationnel0 désigne l’état neutre correspondant, alors que le terme irrationnel courant présente une nuance péjorative. On procédera de même, lorsque le terme lexicalisé correspondant est ambigu. Dans la présente construction en effet, on commence par construire logiquement les concepts, puis on les met en adéquation avec les concepts du langage courant, dans la mesure où ces derniers existent.

Les composantes d’un pôle canonique sont:

– une dualité (ou base) A/Ā

– une composante contraire c {-1, 1}

– une polarité canonique p {-1, 0, 1}

Un pôle canonique présente la forme: (A/Ā, c, p).

On distinguera en outre pour chaque dualité A/Ā les classes dérivées suivantes:

– les pôles canoniques positifs: A+, Ā+

– les pôles canoniques neutres: A0, Ā0

– les pôles canoniques négatifs: A, Ā

– la matrice canonique constituée par les 6 pôles canoniques: {A+, A0, A, Ā+, Ā0, Ā}. On pourra également noter les 6 concepts constituant la matrice canonique sous forme de matrice 3 x 2.

Soit également un pôle canonique, on notera ~ son complément, correspondant sémantiquement à non. On a ainsi les compléments ~A+, ~A0, ~A, ~Ā+, ~Ā0, ~Ā. La notion de complément impose la définition d’un univers de référence U. On s’intéressera ainsi au complément d’un pôle canonique défini par rapport à la matrice correspondante7. On a alors ainsi: ~A+ = {A0, A, Ā+, Ā0, Ā}, et une définition de même nature pour les compléments des autres concepts de la matrice.

On peut noter enfin que les questions suivantes se posent en matière de pôles canoniques. On a en effet la construction de la matrice des pôles canoniques de la dualité Positif/Négatif: {Positif+, Positif0, Positif, Négatif+, Négatif0, Négatif}. Mais des concepts tels que Positif0, Négatif0 et surtout Positif, Négatif+ existent-ils (i) sans contradiction?

De même, au niveau de la dualité Neutre/Polarisé, on a la construction de la matrice {Neutre+, Neutre 0, Neutre, Polarisé+, Polarisé 0, Polarisé}. Mais Neutre+, Neutre existent-ils (ii) sans contradiction? De même, Polarisé0 existe-t-il sans contradiction?

Ceci conduit à poser la question de manière générale: tout pôle canonique neutre admet-il (iii) sans contradiction un concept correspondant positif et négatif? A-t-on une règle générale pour toutes les dualités ou bien a-t-on autant de cas spécifiques pour chaque dualité?

3. Relations entre les pôles canoniques

Parmi les combinaisons de relations existant entre les 6 pôles canoniques (A+, A0, A, Ā+, Ā0, Ā) d’une même dualité A/Ā, on retiendra les relations suivantes (outre la relation d’identité, notée I).

Deux pôles canoniques 1(A/Ā, c1, p1) et 2(A/Ā, c2, p2) d’une même dualité sont duaux ou antinomiques ou contraires si leurs composantes contraires sont opposées et leurs polarités sont opposées8.

Deux pôles canoniques 1(A/Ā, c1, p1) et 2(A/Ā, c2, p2) d’une même dualité sont complémentaires si leurs composantes contraires sont opposées et leurs polarités sont égales9.

Deux pôles canoniques 1(A/Ā, c1, p1) et 2(A/Ā, c2, p2) d’une même dualité sont corollaires si leurs composantes contraires sont égales et leurs polarités sont opposées10.

Deux pôles canoniques 1(A/Ā, c1, p1) et 2(A/Ā, c2, p2) d’une même dualité sont connexes si leurs composantes contraires sont égales et la valeur absolue de la différence de leurs polarités est égale à 111.

Deux pôles canoniques 1(A/Ā, c1, p1) et 2(A/Ā, c2, p2) d’une même dualité sont anti-connexes si leurs composantes contraires sont opposées et la valeur absolue de la différence de leurs polarités est égale à 112, 13.

On a les questions suivantes, en matière de relations entre les pôles canoniques. Existe-t-il (i) un (ou plusieurs) pôle canonique qui soit son propre contraire? A priori, ce n’est pas possible sans contradiction pour un pôle positif ou un pôle négatif. Mais la question se pose pour un pôle neutre.

De même, existe-t-il (ii) un (ou plusieurs) pôle canonique qui soit son propre complémentaire? Il en résulte deux questions: existe-t-il un pôle canonique positif qui soit son propre complémentaire? Et de même: existe-t-il un pôle canonique négatif qui soit son propre complémentaire?

On peut formuler les questions (i) et (ii) de manière plus générale. Soit R une relation telle que R {I, c, , j, g, }. Existe-t-il (iii) un (ou plusieurs) pôle canonique a qui vérifie a = Ra?

4. Degrés de dualité

On construit la classe des degrés de dualité, à partir de l’intuition selon laquelle de A+ à Ā, de A0 à Ā0 et de A à Ā+, il existe une succession continue de concepts. La composante continue d’un degré de dualité correspond à un degré dans la paire duale concernée. L’approche par degré est sous-tendue par l’intuition qu’il existe une succession continue et régulière de degrés, à partir d’un pôle canonique Ap jusqu’à son contraire Ā-p14. On est amené ainsi à distinguer 3 classes de degrés de dualité: (i) de A+ à Ā (ii) de A0 à Ā0 (iii) de A à Ā+.

Un degré de dualité présente les composantes suivantes:

– une paire duale Ap-p (correspondant à l’un des 3 cas: A+, A00 ou A+)

– un degré d Î [-1; 1] dans cette dualité

Un degré de dualité présente donc la forme: (A+, d), (A00, d) ou (A+, d).

On appelle d’autre part point neutre un concept appartenant à la classe des degrés de dualité dont le degré est égal à 0. On note 0 un tel concept, qui est donc de la forme (Ap-p, 0) avec d[0] = 0. Sémantiquement un point neutre 0 correspond à un concept répondant à la définition suivante: ni Ap ni Ā-p. Par exemple, (Vrai/Faux, 0) correspond à la définition: ni Vrai ni Faux. De même (Vague/Précis, 0) répond à la définition: ni Vague ni Précis. Enfin, si on considère les dualités Neutre/Polarisé et Positif/Négatif, on a: Neutre0 = (Négatif0/Positif0, 0) = (Neutre0/Polarisé0, 1).

Il convient d’observer que cette construction ne signifie pas que le point neutre ainsi construit soit l’unique concept qui corresponde à la définition ni Ap ni Ā-p. On verra au contraire que plusieurs concepts et même des hiérarchies de concepts peuvent correspondre à cette dernière définition.

On a la propriété suivante des points neutres, pour une dualité A/Ā donnée: (A+, 0) = (A00, 0) = (A+, 0).

On peut s’intéresser également aux classes dérivées suivantes:

– une classe discrète et tronquée, construite à partir des degrés de dualité, comprenant seulement les concepts pour lesquels le degré de dualité est tel que d {-1, -0,5, 0, 0,5, 1}.

– la classe des degrés de complémentarité, des degrés de corollarité, etc. La classe des degrés de dualité correspond à la relation d’antinomie. Mais on peut s’intéresser, de manière générale, à autant de classes qu’il existe de relations entre les pôles canoniques d’une même dualité. On a autant de classes de même nature pour les autres relations, correspondant respectivement à des degrés de complémentarité, corollarité, connexite et anti-connexité.

On note enfin les questions suivantes, en matière de degrés de dualité et de points neutres. Existe-t-il (i) un (ou plusieurs) pôle canonique qui soit son propre point neutre? A priori, cela n’est possible que pour un pôle neutre.

Toute dualité A/Ā admet-elle (ii) un point neutre ou zéro trichotomique? On peut appeler cette question le problème de la trichotomie générale. S’agit-il d’une règle générale15 ou bien existe-t-il des exceptions? Il semble a priori que la dualité Abstrait/Concret n’admette pas de point neutre. Il paraît en être de même pour la dualité Fini/Infini ou encore la dualité Précis/Vague. Intuitivement, on n’a pas là d’état intermédiaire.

Le concept correspondant au point neutre (Neutre0/Polarisé0, 0) et répondant à la définition: ni neutre ni polarisé existe-t-il (iii) sans contradiction dans la présente construction?

5. Relations entre les pôles canoniques d’une dualité différente: englobants

On s’intéresse à la relation d’englobant pour les pôles canoniques Soient les paires de pôles canoniques duaux A+ et Ā+, A0 et Ā0, A et Ā. On a alors les définitions suivantes: un englobant positif + est un concept tel qu’il est lui-même un pôle canonique positif et correspond à la définition + = A+ Ā+. Un englobant neutre 0 est un pôle canonique neutre tel que 0 = A0 Ā0. Et un englobant négatif est un pôle canonique négatif tel que = A Ā. Compte tenu de cette définition, il est clair que l’on assimile ici l’englobant à l’englobant minimum. Exemples: Déterminé0 est un englobant pour Vrai0/Faux0. Et Déterminé0 est aussi un pôle pour la dualité Déterminé0/Indéterminé0. De même, Polarisé0 est un englobant pour Positif0/Négatif0.

De manière plus générale, on a la relation de n-englobant (n > 1) en considérant la hiérarchie des (n + 1) matrices. On a également, de manière évidente, la relation réciproque d’englobé et de n-englobé.

On considère également les classes dérivées suivantes:

englobants matriciels: il s’agit de concepts englobant l’ensemble des pôles canoniques d’une même dualité. Ils répondent à la définition: 0 = A+ A0 A Ā+ Ā0 Ā.

– englobants mixtes: il s’agit de concepts répondant à la définition 1 = A+ Ā ou bien 2 = A Ā+.

On s’intéresse également aux types de relations existant entre les pôles canoniques d’une dualité différente. Soient deux matrices A et E dont les pôles canoniques sont respectivement {A+, A0, A, Ā+, Ā0, Ā} et {E+, E0, E, Ē+, Ē0, Ē} et telles que E soit un englobant pour A/Ā c’est-à-dire telles que E+ = A+ Ā+, E0 = A0 Ā0 et E = A Ā. On étend alors les relations précédemment définies entre les pôles canoniques d’une même matrice, aux relations de même nature entre deux matrices présentant les propriétés de A et E. On a alors les relations de 2-antinomie, 2-complémentarité, 2-corollarité, 2-connexité, 2-anti-connexité16. Ainsi, par exemple, A0 est 2-contraire (ou contraire trichotomique) avec Ē0, 2-connexe (ou connexe trichotomique) avec E+ et E et 2-anti-connexe (ou anti-connexe trichotomique) avec Ē+ et Ē. De même, A+ et Ā+ sont 2-contraires avec Ē, 2-complémentaires avec Ē+, 2-corollaires avec E, 2-connexes avec E0 et 2-anti-connexes avec Ē0, etc.

On considère également la propriété suivante des points neutres et englobants. Soient deux matrices A et E, telles que l’un des pôles neutres de E soit un englobant pour la paire duale neutre de A: E0 = A0 Ā0. On a alors la propriété suivante: le pôle canonique Ē0 pour la matrice E est un point neutre pour la dualité A00. Ainsi, le point neutre pour la dualité A00 est le dual de l’englobant E0 de A0 et Ā0. Exemple: Déterminé0 = Vrai0 Faux0. Ici, le point neutre pour la dualité Vrai/Faux correspond à la définition: ni Vrai ni Faux. Et on a : (Vrai0/Faux0, 0) = (Déterminé0/Indéterminé0, -1).

On peut généraliser cette propriété à une hiérarchie de matrices A1, A2, A3, …, An, telles que l’un des pôles 2 de A2 de polarité p soit un englobant pour une paire duale de A1, que l’un des pôles 3 de A3 soit un englobant pour une paire duale de A2, …, que l’un des pôles n de An soit un englobant pour une paire duale de An-1. Il en résulte une construction infinie de concepts.

On note également l’émergence d’une hiérarchie, au-delà du seul point neutre d’une dualité donnée. Il s’agit de la hiérarchie des points neutres d’ordre n, construite de la manière suivante à partir des pôles canoniques duaux A0 et Ā0:

– A0, Ā0

– A1 = ni A0 ni Ā0

– A21 = ni A0 ni A1

– A22 = ni Ā0 ni A1

– A31 = ni A0 ni A21

– A32 = ni A0 ni A22

– A33 = ni A0 ni A21

– A34 = ni Ā0 ni A22

– …

On peut aussi envisager l’émergence de cette hiérarchie sous la forme suivante17:

– A0, Ā0

– A1 = ni A0 ni Ā0

– A2 = ni A0 ni Ā0 ni A1

– A3 = ni A0 ni Ā0 ni A1 ni A2

– A4 = ni A0 ni Ā0 ni A1 ni A2 ni A3

– A5 = ni A0 ni Ā0 ni A1 ni A2 ni A3 ni A4

– …

Classiquement, on construit cette hiérarchie infinie pour Vrai/Faux en considérant I1 (Indéterminé), I2, etc. On peut remarquer que dans cette dernière construction, il n’est pas fait mention de l’englobant (Déterminé) de Vrai/Faux. On ne fait pas plus mention de la hiérarchie des englobants.

La notion de complément d’un pôle canonique correspond sémantiquement à non. On a la notion de 2-complément d’un pôle canonique , défini par rapport à un univers de référence U consistant dans la 2-matrice de . On alors par exemple: ~A+ = {A0, A, Ā+, Ā0, Ā, Ē+, Ē0, Ē}, etc. Et de même, ~A+ = {Ā+, E0, E, Ē+, Ē0, Ē}, etc. Plus généralement, on ainsi la notion de n-complément (n > 0) d’un pôle canonique par rapport à la n-matrice correspondante.

On a enfin les questions suivantes, concernant les englobants. Pour certains concepts, existe-t-il (i) un englobant maximum ou bien a-t-on une construction infinie pour chaque dualité? Pour la dualité Vrai/Faux en particulier, l’analyse des paradoxes sémantiques a conduit à l’utilisation des logiques basées sur un nombre infini de valeurs de vérité18.

Toute dualité admet-elle (ii) un englobant neutre? Certaines dualités en effet semblent ne pas admettre d’englobant: tel est notamment le cas pour la dualité Abstrait/Concret ou Fini/Infini. Il semble qu’Abstrait constitue un élément maximal. Certes, on peut bien construire, de manière formelle un concept correspondant à la définition ni Abstrait ni Concret, mais un tel concept apparaît très difficile à justifier sémantiquement.

Existe-t-il (iii) un pôle canonique qui soit son propre englobant minimum?

Existe-t-il (iv) un pôle canonique qui soit son propre englobant non minimum? On peut formuler ce problème de manière équivalente ainsi. A un niveau donné, ne rencontre-t-on pas un pôle canonique qui est déjà apparu quelque part dans la structure? On aurait ainsi affaire à une structure comportant une boucle. Et notamment, ne rencontre-t-on pas l’un des pôles de la première dualité?

6. Principes canoniques

Soit un pôle canonique. Intuitivement, la classe des principes canoniques correspond aux concepts qui répondent à la définition: principe correspondant à ce qui est . Exemples: Précis Précision; Relatif Relativité; Temporel Temporalité. Les principes canoniques peuvent être vus comme des prédicats 0-aires, alors que les pôles canoniques sont des prédicats n-aires (n > 0). Les concepts lexicalisés correspondant à des principes canoniques sont souvent des termes où le suffixe –ité (ou –itude) à été ajouté au radical correspondant à un pôle canonique. Par exemple: Relativité0, Beauté+, Activité0, Passivité0, Vérité0, Neutralité0, Simplicité0, Temporalité0, etc. Une liste (nécessairement non exhaustive) des principes canoniques est la suivante:

Analyse0/Synthèse0, [Animé0]/[Inanimé0], [Exceptionnel0]/Normalité0, [Antécédent0]/[Conséquent0], Existence0/Inexistence0, Absolu0/Relativité0, Abstraction0/[Concret], [Accessoire0]/[Principal0], Activité0/Passivité0, [Aléatoire0]/Certitude0, [Discret0]/[Continu0], Déterminisme0/Non-déterminisme0, [Positif0]/[Négatif0], Vérité0/Fausseté0, Attraction0/Répulsion0, Neutralité0/Polarisation0, [Statique0]/Dynamisme0, Unicité0/Multiplicité0, Contenance0/[Contenu0], Acquis0/Inné0, Beauté+/Laideur, Bien+/Mal, Identité0/Contraire0, Supériorité0/Infériorité0, Extension0/Restriction0, Précision0/Vague0, Finitude0/Infinitude0, Simplicité0/Complexité0, [Interne0]/[Externe0], Egalité0/Différence0, Tout0/Partie0, Temporalité0/Intemporalité0, Individualité0/Collectivité0, Quantité0/Qualité0, [Implicite0]/[Explicite0], …

On remarque qu’un certain nombre de principes canoniques ne sont pas lexicalisés. On utilisera les notations A+, A0, A pour dénoter sans ambiguïté un principe canonique respectivement positif, neutre ou négatif. On pourra également utiliser la notation suivante: soit un pôle canonique, alors ité (ou itude) est un principe canonique. On pourra noter ainsi: Abstrait0ité, Absolu0ité, Acessoire0ité, etc. ou encore, comme ci-dessus [Abstrait0], [Absolu0], etc.

Les composantes des principes canoniques sont les mêmes que pour la classe des pôles canoniques.

On distingue enfin les classes dérivées suivantes:

principes canoniques positifs

principes canoniques neutres

principes canoniques négatifs

principes canoniques polarisés

avec des définitions évidentes19.

7. Méta-principes

Soit a0 un principe canonique neutre20. La classe des méta-principes correspond à une disposition d’esprit orientée vers ce qui est a0, à l’intérêt pour ce qui est a0. Intuitivement, un méta-principe correspond à un point de vue, une perspective, une orientation de l’esprit humain. Ainsi, l’attrait pour l’Abstraction0, l’intérêt pour l’Acquis0, la propension à se placer du point de vue de l’Unité0, etc. constituent des méta-principes. On notera que cette construction permet notamment de construire des concepts qui ne sont pas lexicalisés. Ceci présente l’avantage d’une meilleure exhaustivité et conduit à une meilleure et plus riche sémantique.

Soit a0 un principe canonique neutre. On notera p un méta-principe (p {-1, 0, 1}). On dénote ainsi + un méta-principe positif, 0 un méta-principe neutre et un méta-principe négatif. On a ainsi l’énumération des méta-principes, pour une dualité donnée: {A+, A0, A, Ā+, Ā0, Ā}. De plus, on pourra désigner par aisme un méta-principe. Exemple: Uni Unité-isme. On a ainsi Internalisme, Externalisme, Relativisme, Absolutisme, etc. qui correspondent notamment à des tendances de l’esprit. On utilisera ici une majuscule pour distinguer les méta-principes des concepts lexicalisés, et notamment pour les différencier des doctrines philosophiques correspondantes, qui possèdent souvent des sens différents. On pourra toutefois s’inspirer des termes classiques lorsqu’ils existent pour désigner le méta-principe correspondant. Ainsi Tout-isme correspond au Holisme.

On peut dénommer Ultraaisme ou Hypera-isme le concept correspondant à . Cette forme correspond à un usage exclusif, excessif, exagéré du point de vue correspondant à un principe donné. On a ainsi par exemple: Externalisme = Ultra-externalisme.

Les composantes des méta-principes sont:

– une polarité p Î {-1, 0, 1}

– un principe canonique neutre composé de:

– une dualité (ou base) A/Ā

– une composante contraire c {-1, 1}

– une polarité neutre q = 0

Les méta-principes canoniques positifs, neutres, négatifs sont respectivement de la forme ((A/Ā, c, 0), 1), ((A/Ā, c, 0), 0), ((A/Ā, c, 0), -1).

Entre les méta-principes canoniques d’une même dualité, on a les mêmes relations que pour les pôles canoniques.

On a enfin les classes dérivées constituées par:

– les méta-principes positifs (p > 0)

– les méta-principes neutres (p = 0)

– les méta-principes négatifs (p < 0)

– les méta-principes polarisés qui comprennent les méta-principes positifs et négatifs

– la matrice des méta-principes canoniques, constituée par les 6 méta-principes applicables à une dualité donnée: {A+, A0, A, Ā+, Ā0, Ā}.

– les degrés de méta-principes canoniques. Intuitivement, de tels concepts sont plus ou moins positifs ou négatifs. La polarité est ici considérée comme un degré de polarité. Ces concepts sont tels que p Î [-1; 1].

– la classe des principes comportementaux. Intuitivement, la classe des principes comportementaux constitue une extension de celle des méta-principes. Là où le méta-principe constitue une disposition de l’esprit humain, les concepts visés ici sont ceux qui visent à décrire, de manière plus générale, les tendances du comportement humain21. Parmi les concepts lexicalisés correspondant aux principes comportementaux, on peut mentionner: courage, prudence, pessimisme, rationalité, avarice, fidélité, goût de l’analyse, instabilité, objectivité, pragmatisme, etc. Une première analyse révèle (i) qu’un certain nombre d’entre eux présentent une nuance méliorative: courage, objectivité, pragmatisme; que (ii) d’autres, à l’inverse, présentent une connotation péjorative, défavorable: lâcheté, avarice, instabilité; et enfin (iii) que certains concepts se présentent sous une forme qui n’est ni méliorative, ni péjorative: goût de l’analyse22. On a ici les mêmes classes que pour les méta-principes, et notamment les degrés de principes comportementaux. Exemple: lâche est plus négatif que craintif; de même, bravoure est plus positif que courage.

Conclusion

Les concepts construits à l’aide de la présente théorie se distinguent de plusieurs points de vue de ceux qui résultent de l’application du ‘carré sémiotique’ conçu par Greimas (1977, p. 25). Cette dernière théorie prévoit en effet quatre concepts: S1, S2, ~S1, ~S2. En premier lieu, il apparaît que le carré sémiotique est basé sur deux concepts lexicalisés S1 et S2 constituant une paire duale. Il ne distingue pas, lorsqu’il envisage les concepts duaux, selon que ces derniers sont positifs, neutres ou négatifs. La présente théorie considère à l’inverse six concepts, lexicalisés ou non.

En second lieu, la présente analyse se distingue du carré sémiotique par une définition différente de la négation-complément. En effet, le carré sémiotique comporte deux concepts correspondant à la négation-complément: non-S1 et non-S2. Dans le présent contexte en revanche, la négation est définie par rapport à un univers de référence U, qui peut être défini par rapport à la matrice considérée, ou bien à la 2-matrice, …, à la n-matrice. Pour chaque pôle canonique, on a ainsi une hiérarchie de concepts correspondant à non-S1 et non-S2.

On le voit, la présente taxinomie de concepts se différencie de celle conçue par Greimas. Elaborée à partir des dualités et de notions logiques, la présente théorie présente l’avantage de s’appliquer aux concepts lexicalisés ou non, et de s’affranchir également des définitions de concepts propres à une culture donnée. Ainsi, la classification qui vient d’être décrite constitue une alternative à celle basée sur le carré sémiotique proposée par Greimas.


Références

FINE, Kit (1975). Vagueness, Truth and Logic. Synthese 30: 265-300

GREIMAS, A. J. (1977). Elements of a Narrative Grammar, Diacritics 7: 23-40

JAKOBSON, Roman (1983). Dialogues, Cambridge MA: MIT Press

PEACOCKE, C. A. B. (1981). Are Vague Predicates Incoherent?. Synthese 46: 121-141

RESCHER, Nicholas (1969). Many-Valued Logic, New York: McGraw Hill

1 Polar contraries, polar opposites.

2 Cf. Jakobson (1983).

3 De même, il aurait été possible de définir une classe plus restreinte, comprenant seulement la moitié des pôles sémantiques, en ne retenant qu’un des deux prédicats duaux, et en construisant les autres avec la relation contraire. Cependant, le choix de l’un ou l’autre des pôles duaux eut été arbitraire, et j’ai préféré ici l’éviter. On aurait eu alors la construction suivante. Soit le pôle sémantique Contraire et a un pôle sémantique quelconque, non nécessairement distinct de Contraire; le concept résultant de la composition de Contraire et de a est un pôle sémantique. Il est à noter que ce type de construction aurait conduit à:

Contraire ° Contraire = Identique.

Contraire ° Identique = Contraire.

Contrairen = Identique (pour n pair)

Contrairen = Contraire (pour n impair)

Dans ce contexte, on observe que Contraire constitue un cas particulier, puisque si on cherche à construire une classe des pôles canoniques qui soit minimale, on constate que l’on peut s’affranchir de Identique, alors que l’on ne peut se dispenser de Contraire. On a là une asymétrie. En effet, on peut construire Identique à l’aide de Contraire, à l’aide de la propriété d’involution: Contraire ° Contraire = Identique. Pour les autres dualités, on peut choisir indifféremment l’un ou l’autre des pôles sémantiques concernés.

4 Il est à noter qu’on aurait pu distinguer ici selon les pôles unaires et les pôles binaires, en considérant qu’il s’agit là de prédicats. Mais a priori, une telle distinction ne s’avère pas très utile pour la suite de la construction.

5 Dans ce qui suit, les questions relatives aux différentes classes sont seulement mentionnées. Il va de soi qu’elles nécessitent un traitement en profondeur qui va bien au-delà de la présente étude.

6 Avec des degrés variables dans la nuance.

7 S’il est défini par rapport à une paire duale, le complément du pôle d’une dualité s’identifie avec le pôle dual correspondant.

8 Formellement c1 = –c2, p1 = – p2 ® 1(A/Ā, c1, p1) = 2(A/Ā, c2, p2).

9 Formellement c1 = – c2, p1 = p2 ® 1(A/Ā, c1, p1) = f2(A/Ā, c2, p2).

10 Formellement c1 = c2, p1 = – p2 ® 1(A/Ā, c1, p1) = c2(A/Ā, c2, p2).

11 Formellement c1 = c2, |p1p2| = 1 ® 1(A/Ā, c1, p1) = g2(A/Ā, c2, p2).

12 Formellement c1 = – c2, |p1p2| = 1 ® 1(A/Ā, c1, p1) = b2(A/Ā, c2, p2).

13 On a les propriétés suivantes, en ce qui concerne les relations précitées. La relation d’identité constitue une relation d’équivalence. L’antinomie, la complémentarité et la corollarité sont symétriques, anti-réflexives, non associatives, involutives.

L’opération de composition sur les relations {identité, corollarité, antinomie, complémentarité} définit un groupe abélien d’ordre 4. Soit G = {I, c, , j}:

°IcjIIcjccIjjIcjjcI

où pour tout A Î G, A-1 = A, et A ° I = A, I étant l’élément neutre. On notera que les propriétés de groupe permettent notamment de donner, de manière évidente, une valuation à des propositions de la forme: le concept contraire du complémentaire de a1 est identique au corollaire du complémentaire de a2.

14 Cette construction de concepts peut être considérée comme l’application de la degree theory. Cf. notamment Fine (1975), Peacocke (1981). La présente théorie toutefois ne se caractérise pas par le choix préférentiel de la degree theory, mais considère simplement cette dernière comme l’une des méthodes de construction de concepts.

15 Plusieurs trichotomies usuelles sont: {passé, présent, futur}, {droit, centre, gauche}, {haut, centre, bas}, {positif, neutre, négatif}.

16 De manière évidente, on a la généralisation à n matrices (n > 1) de la présente construction avec les relations de n-antinomie, n-complémentarité, n-corollarité, n-connexité, n-anti-connexité.

17 On peut assimiler les deux hiérarchies qui viennent d’être décrites, à une seule et même hiérarchie. Il suffit de procéder à l’assimilation suivante:

– A2 = A21 ou A22

– A3 = A31 ou A32 ou A33 ou A34

– A4 = A41 ou A42 ou A43 ou A44 ou A45 ou A46 ou A47 ou A48

– …

18 Infinite-valued logics. Cf. Rescher (1969).

19 On notera en outre que d’autres concepts peuvent être ainsi construits. Soit ainsi un pôle canonique. On a alors les classes de concepts répondant à la définition: rendre (Exemple: Uni Unifier; Différent Différencier); action de rendre (Uni Unification; Différent Différenciation); qu’il est possible de rendre (Uni Unifiable; Différent Différenciable), etc. Ces concepts ne présentent pas toutefois d’intérêt dans le cadre de la présente étude.

20 A noter que l’on aurait pu, de manière alternative, prendre comme base de la définition des méta-principes un principe canonique, sans distinguer selon que ce dernier est positif, neutre ou négatif. Mais il semble qu’une telle définition aurait engendré davantage de complexité, sans apporter en retour un réel intérêt sémantique.

21 Cette classe particulière nécessiterait toutefois une analyse beaucoup plus fine que celle qui est présentée sommairement ici. Il s’agit seulement ici de montrer que nombre de concepts appartenant à cette catégorie peuvent faire l’objet d’une classification présentant la structure de celle des méta-principes.

22 On peut considérer l’énumération suivante – nécessairement partielle – correspondant aux principes comportementaux, dans l’ordre (A+), (A0), (A), (Ā+), (Ā0), (Ā):

fermeté, propension à réprimer, sévérité, clémence, propension à pardonner, laxisme

défense, refus, violence, pacifisme, acceptation, faiblesse

amour-propre, estime de soi, surestimation de soi, modestie, mise en retrait de l’ego, sous-estimation de soi

expansion, recherche de la quantité, excès, perfectionnisme, recherche de la qualité, hyper-sélectivité

délicatesse, sensibilité, sensiblerie, sang-froid, impassibilité, froideur

objectivité, être neutre, impersonnalité, engagement, être partisan, parti-pris

droiture, agir de façon directe, brusquerie, tact, agir de façon indirecte, fuir les difficultés

combativité, goût de l’attaque, agressivité, protection, goût de la défense, repli

réceptivité, croyance, crédulité, incrédulité, doute, incroyance

expansion, être tourné vers soi-même, égoïsme, altruisme, être tourné vers les autres, rendre dépendant

sens de l’économie, être tourné vers l’épargne, avarice, générosité, être tourné vers la dépense, prodigalité

mobilité, penchant au déplacement, instabilité, stabilité, attrait du même endroit, sédentarité

logique, rationalité, hyper-matérialisme, imagination, irrationalité, illogisme

sens de l’humour, goût du jeu, légèreté, sérieux, goût de l’activité sérieuse, se prendre au sérieux

capacité d’abstraction, attrait de l’abstrait, dogmatisme, pragmatisme, attrait du concret, prosaïsme

audace, prise de risques, témérité, prudence, éviter les risques, lâcheté

discrétion, garder pour soi, inhibition, ouverture, rendre public, indiscrétion

optimisme, appréhender les avantages, optimisme béat, méfiance, voir les inconvénients, pessimisme

sens du collectif, faire comme les autres, conformisme, originalité, se distinguer, excentricité

résolution, garder une opinion, entêtement, souplesse d’esprit, changer d’avis, versatilité

idéalisme, appréhender les objectifs, attrait des chimères, réalisme, appréhender les moyens, prosaïsme

goût de la liberté, être affranchi, indiscipline, obéissance, se soumettre à une règle, servilité

réflexion, intériorisation, inhibition, sociabilité, extériorisation, sans-gêne

spontanéité, réactions immédiates, précipitation, calme, réactions différées, lenteur

éclectisme, pluridisciplinarité, dispersion, expertise, mono-disciplinarité, cloisonnement

renouveau, intérêt au changement, rupture, préservation des acquis, intérêt au maintien, conservatisme

motivation, passion, fanatisme, modération, raison, tiédeur

ampleur de vues, goût de la synthèse, survol, précision, goût de l’analyse, se perdre dans les détails

disponibilité, goût du loisir, oisiveté, activité, goût du travail, suractivité

fermeté, ne pas céder, intransigeance, diplomatie, faire des concessions, faiblesse

causticité, esprit critique, dénigrement, valorisation, souligner les qualités, angélisme

sens de l’autorité, goût du commandement, autoritarisme, docilité, obéir, servilité

amour, attraction, affection mièvre, savoir prendre ses distances, répulsion, haine

conquête, avidité, boulimie, sobriété, avoir le minimum, dénuement

Éléments d’un contextualisme dialectique

Éléments d’un contextualisme dialectique

Paul Franceschi

Université de Corse

Paul Franceschi

Fontaine du Salario

Lieu-dit Morone

20000 Ajaccio

France

RÉSUMÉ Dans ce qui suit, je m’attache à présenter les éléments d’une doctrine philosophique, qui peut être définie comme un contextualisme dialectique. Je m’efforce tout d’abord d’en définir les éléments constitutifs, à travers les dualités et pôles duaux, le principe d’indifférence dialectique et le biais d’uni-polarisation. Je m’attache ensuite à souligner l’intérêt spécifique de cette doctrine au sein d’un domaine particulier de la méta-philosophie : la méthodologie utilisée pour la résolution des paradoxes philosophiques. Je décris enfin des applications de cette dernière à l’analyse des paradoxes suivants : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse.

ABSTRACT In what follows, I strive to present the elements of a philosophical doctrine, which can be defined as dialectical contextualism. I proceed first to define its basic elements, namely, dualities and polar contraries, the principle of dialectical indifference and the one-sidedness bias. I emphasize then the special importance of this doctrine in a specific field of meta-philosophy : the methodology for solving philosophical paradoxes. Finally, I describe several applications of this methodology on the analysis of the following paradoxes : Hempel’s paradox, the surprise examination paradox and the Doomsday Argument.


Éléments d’un contextualisme dialectique

Paul FRANCESCHI

Dans ce qui suit, je m’attacherai à présenter les éléments d’une doctrine philosophique spécifique, qui peut être définie comme un contextualisme dialectique. Je m’efforcerai tout d’abord de préciser les éléments essentiels qui fondent cette doctrine, en particulier les dualités et pôles duaux, le principe d’indifférence dialectique et le biais d’uni-polarisation. Je m’attacherai ensuite à en décrire l’intérêt au niveau méta-philosophique, en particulier en tant que méthodologie pour aider à la résolution des paradoxes philosophiques. Je décrirai enfin des applications de cette méthodologie à l’analyse des paradoxes philosophiques suivants : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse.

Le contextualisme dialectique décrit ici est fondé sur un certain nombre d’éléments constitutifs qui présentent une nature spécifique. Au nombre de ces derniers figurent : les dualités et pôles duaux, le principe d’indifférence dialectique et le sophisme d’uni-polarisation. Il convient de les analyser tour à tour.

1. Dualités et pôles duaux

Je m’attacherai tout d’abord à définir la notion de pôles duaux (polar opposites)1. Bien qu’intuitive, une telle notion nécessite d’être décrite de manière plus précise. Des exemples de pôles duaux sont ainsi statique/dynamique, interne/externe, qualitatif/quantitatif, etc. Nous pouvons définir les pôles duaux comme des concepts (que nous pouvons dénommer A et Ā) qui se présentent par paires, et qui sont tels que chacun d’eux est défini comme le contraire de l’autre. Par exemple, interne peut être défini comme le contraire d’externe, et de manière symétrique, externe est défini comme le contraire d’interne. En un certain sens, il n’y a pas de notion primitive ici et aucun des deux pôles duaux A et Ā ne peut être considéré comme une telle notion primitive. Considérons tout d’abord une dualité donnée, que nous pouvons dénoter par A/Ā, où A et Ā constituent des concepts duaux. Une telle dualité est représentée sur la figure ci-dessous :

Figure 1. Les pôles duaux A et Ā

À ce stade, nous pouvons donner également une énumération2 (qui présente nécessairement un caractère partiel) des dualités :

Interne/Externe, Quantitatif/Qualitatif, Visible/Invisible, Absolu/Relatif, Abstrait/Concret, Statique/Dynamique, Diachronique/Synchronique, Unique/Multiple, Extension/Restriction, Esthétique/Pratique, Précis/Vague, Fini/Infini, Simple/Composé, Individuel/Collectif, Analytique/Synthétique, Implicite/Explicite, Volontaire/Involontaire

Afin de caractériser les pôles duaux avec davantage de précision, il convient de s’attacher à les distinguer par rapport à d’autres concepts. Nous présenterons ainsi plusieurs propriétés des pôles duaux, qui permettent de les différencier d’autres concepts voisins. Les pôles duaux sont ainsi des concepts neutres, de même que des qualités simples ; en outre, ils se distinguent des notions vagues. En premier lieu, deux pôles duaux A et Ā constituent des concepts neutres. Ils peuvent ainsi être dénotés par A0 et Ā0. Nous pouvons ainsi les représenter de la manière suivante :

Figure 2. Les pôles duaux neutres A0 et Ā0

Les pôles duaux constituent des concepts neutres, c’est-à-dire des concepts qui ne présentent aucune nuance méliorative ou péjorative. En ce sens, externe, interne, concret, abstrait, etc., constituent des pôles duaux, à la différence de concepts tels que beau, laid, courageux, qui présentent une nuance soit méliorative soit péjorative, et qui sont donc non-neutres. Le fait que les pôles duaux soient neutres possède son importance, car cela permet de les distinguer de concepts qui possèdent une connotation positive ou négative. Ainsi, la paire de concepts beau/laid ne constitue pas une dualité et beau et laid ne sont donc pas des pôles duaux au sens de la présente construction. En effet, beau possède une connotation positive et laid présente une nuance péjorative. Dans ce contexte, nous pouvons les dénoter par beau+ et laid.

Il convient de souligner, en second lieu, que les deux pôles duaux d’une même dualité correspondent à des qualités simples, par opposition aux qualités composées. La distinction entre qualités simples et composées peut être effectuée de la manière suivante. Soient A1 et A2 des qualités simples. Dans ce cas, A1 ˄ A2, de même que A1 ˅ A2 sont des qualités composées. Pour prendre un exemple, statique, qualitatif, externe sont des qualités simples, alors que statique et qualitatif, statique et externe, qualitatif ou externe, sont des qualités composées. Une définition plus générale est ainsi la suivante : soient B1 et B2 des qualités simples ou composées, dans ce cas B1 ˄ B2, de même que B1 ˅ B2 sont des qualités composées. De manière incidente, ceci met également en évidence pourquoi les paires de concepts rouge/non-rouge, bleu/non-bleu ne peuvent pas être considérés comme des pôles duaux. En effet, non-rouge peut ainsi être défini en tant que qualité composée de la manière suivante : violet ˅ indigo ˅ bleu ˅ vert ˅ jaune ˅orange ˅ blanc ˅ noir. Dans ce contexte, on peut assimiler non-bleu à la négation-complément de bleu, une telle négation-complément étant définie à l’aide de qualités composées.

Compte tenu de la définition précédente, nous sommes également en mesure de distinguer les pôles duaux des objets vagues. Nous pouvons observer tout d’abord que les pôles duaux et les objets vagues possèdent en commun certaines propriétés. En effet, les objets vagues se présentent par paires, de la même manière que les pôles duaux. De plus, les concepts vagues sont considérés classiquement comme possédant une extension et une anti-extension, qui sont mutuellement exclusives. Une telle caractéristique est également partagée par les pôles duaux. À titre d’exemple, qualitatif et quantitatif s’assimilent à une extension et à une anti-extension, qui présentent la propriété d’être mutuellement exclusives ; il en va de même pour statique et dynamique, etc.

Cependant, il convient de souligner les différences existant entre les deux catégories de concepts. Une première différence (a) réside ainsi dans le fait que l’union de l’extension et l’anti-extension des concepts vagues n’est pas exhaustive, en ce sens qu’elles admettent des cas-limites (et aussi des cas-limites de cas-limites, etc. donnant ainsi naissance à une hiérarchie du vague d’ordre n), qui constitue une zone de pénombre. À l’inverse, les pôles duaux ne possèdent pas nécessairement une telle caractéristique. En effet, l’union des pôles duaux peut être soit exhaustive, soit non-exhaustive. Par exemple, la dualité abstrait/concret est, de manière intuitive, exhaustive, car il ne semble pas exister d’objets qui ne sont ni abstraits ni concrets. Il en va de même pour la dualité vague/précis : intuitivement, il n’existe pas en effet d’objets qui ne sont ni vagues ni précis, et qui appartiendraient à une catégorie intermédiaire. Ainsi, à la différence des objets vagues, il existe des pôles duaux dont l’extension et l’anti-extension se révèle exhaustive.

Il convient de mentionner, en second lieu, une autre différence (b) entre les pôles duaux et les objets vagues. En effet, les pôles duaux constituent des qualités simples, alors que les objets vagues peuvent consister en des qualités simples ou composées. Il existe en effet des concepts dénommés objets vagues multi-dimensionnels, tels que la notion de véhicule, de machine, etc. Enfin, une dernière différence entre les deux catégories d’objets (c) réside dans le fait que certains pôles duaux présentent une nature intrinsèquement précise. Tel est notamment le cas de la dualité individuel/collectif, qui est susceptible de donner lieu à une définition tout à fait précise.

2. Le principe d’indifférence dialectique

À partir des notions de dualité et de pôles duaux qui viennent d’être définis, nous sommes en mesure de définir également une notion de point de vue, relatif à une dualité ou un pôle dual donné. Ainsi, nous avons tout d’abord la notion de point de vue correspondant à une dualité donnée A/Ā : ceci correspond par exemple au point de vue de la dualité extension/restriction, celui de la dualité qualitatif/quantitatif, ou de la dualité diachronique/synchronique, etc. Il en résulte également la notion de point de vue relatif à un pôle donné d’une dualité A/Ā. Ainsi, on a par exemple le point de vue par extension (au niveau de la dualité extension/restriction), de même que le point de vue par restriction. De même, il en résulte le point de vue ou angle de vue qualitatif, ainsi que le point de vue ou angle de vue quantitatif, etc. (au niveau de la dualité qualitatif/quantitatif). Ainsi, lorsqu’on considère un objet donné o (que ce soit un objet concret ou bien un objet abstrait telle que par exemple une proposition ou un raisonnement), on est susceptible d’envisager ce dernier par rapport à différentes dualités, et au niveau de ces dernières, par rapport à chacun de ses deux pôles duaux.

L’idée sous-jacente inhérente aux points de vue relatifs à une dualité donnée, ou à un pôle donné d’une dualité, est que chacun des deux pôles d’une même dualité, toutes choses étant par ailleurs égales, possède une égale légitimité. En ce sens, si on considère un objet o du point de vue d’une dualité A/Ā, il convient de ne pas privilégier l’un des pôles par rapport à l’autre. Afin d’obtenir un point de vue objectif par rapport à une dualité A/Ā, il convient de se placer tout à tour du point de vue du pôle A, puis de celui du pôle Ā. Car une approche qui n’aborderait que le point de vue de l’un des deux pôles se révélerait partielle et tronquée. Le fait de considérer tour à tour le point de vue des deux pôles, lors de l’étude d’un objet o et de la classe de référence qui lui est associée, permet d’éviter une démarche subjective et de satisfaire, autant que possible, les besoins de l’objectivité.

On le voit, l’idée qui sous-tend la notion de point de vue peut être formalisée en un principe d’indifférence dialectique, de la manière suivante :

(PRINCIPE D’INDIFFERENCE DIALECTIQUE)Lorsqu’on considère un objet donné o et la classe de référence E qui lui est associée, sous l’angle de la dualité A/Ā, toutes choses étant par ailleurs égales, il convient d’accorder une égale importance au point de vue du pôle A et au point de vue du pôle Ā.

Ce principe est formulé en termes de principe d’indifférence : si l’on considère un objet o sous l’angle d’une dualité A/Ā, il n’y a pas lieu de privilégier le point de vue A par rapport au point de vue Ā, et sauf élément contraire résultant du contexte, on doit placer à égalité les points de vue A et Ā. Une conséquence directe de ce principe est que si l’on considère le point de vue du pôle A, il est nécessaire de prendre également en considération le point de vue du pôle opposé Ā (et réciproquement). La nécessité de prendre en considération les deux points de vue, celui résultant du pôle A et celui associé au pôle Ā, répond au souci d’analyser l’objet o et la classe de référence qui lui est associée d’un point de vue objectif. Cette objectivité est atteinte, autant que faire se peut, par la prise en considération des points de vue complémentaires qui sont ceux des pôles A et Ā. Chacun de ces points de vue possède en effet, eu égard à la dualité A/Ā, un droit égal à la pertinence. Dans de telles circonstances, lorsque seul le pôle A ou (exclusivement) le pôle Ā est pris en considération, il s’agit alors d’un point de vue que l’on peut appeler uni-polarisé. À l’inverse, le point de vue qui réalise la synthèse des points de vue correspondants aux pôles A et Ā, est par nature bi-polarisé. Fondamentalement, une telle démarche se révèle d’essence dialectique. En effet, l’étape d’analyse successive des points de vue complémentaires par rapport à une classe de référence donnée, est destinée à permettre, dans une étape ultérieure, une synthèse finale, qui résulte de la prise en compte conjointe des points de vue correspondant à la fois aux pôles A et Ā. Dans la présente construction, le processus de confrontation des différents points de vue pertinents par rapport à une dualité A/Ā est destiné à construire, cumulativement, un point de vue plus objectif et exhaustif que celui, uni-polarisé et nécessairement partiel, qui résulte de la prise en compte des données qui résultent d’un seul des deux pôles.

La définition du principe d’indifférence dialectique qui est proposée ici se réfère à une classe de référence E, qui se trouve associée à l’objet o. La classe de référence3 est constituée par un ensemble de phénomènes ou d’objets. Plusieurs exemples peuvent en être donnés : la classe des êtres humains ayant un jour existé, la classe des événements futurs de la vie d’une personne, la classe des parties du corps d’une personne, la classe des corbeaux, etc. Nous examinerons, dans ce qui suit, un certain nombre d’exemples. La mention d’une telle classe de référence possède son importance, car sa définition-même se trouve associée à la dualité A/Ā précitée. En effet, la classe de référence peut être définie du point de vue de A ou bien du point de vue de Ā. Une telle particularité nécessite d’être soulignée et nous sera utile lors de la définition du biais qui se trouve associé à la définition-même du principe d’indifférence dialectique : le biais d’uni-polarisation.

3. Caractérisation du biais d’uni-polarisation

La formulation précédente du principe d’indifférence dialectique suggère, de manière directe, une erreur de raisonnement d’un certain type. De manière informelle, une telle erreur de raisonnement consiste à privilégier un point de vue lorsqu’on s’intéresse à un objet donné, et à négliger le point de vue opposé. De manière plus formelle, dans le contexte qui vient d’être décrit, une telle erreur de raisonnement consiste, lorsqu’on considère un objet o et la classe de référence qui lui est associée, à ne prendre en considération que le point de vue du pôle A (respectivement Ā), en occultant complètement le point de vue du pôle dual Ā (respectivement A) pour définir cette classe de référence. Nous dénommerons biais d’uni-polarisation un tel type d’erreur de raisonnement. Les conditions de ce type de biais, en violation du principe d’indifférence dialectique, méritent toutefois d’être précisées. En effet, dans le présent contexte, on peut considérer qu’il existe certains cas, où la bi-polarisation par rapport à une dualité donnée A/Ā n’est pas requise. Tel est le cas lorsque les éléments du contexte ne présupposent pas des conditions d’objectivité et d’exhaustivité des points de vue. Ainsi, un avocat qui ne ferait valoir que les éléments à la décharge de son client, en ignorant complètement les éléments à charge, ne commettrait pas le type d’erreur de raisonnement précité. Dans une telle circonstance en effet, l’avocat ne commettrait pas un biais d’uni-polarisation dommageable, puisqu’il s’agit de la fonction qui lui est propre. Il en irait de même dans un procès pour le procureur qui, à l’inverse, mettrait uniquement l’accent sur les éléments à charge de la même personne, en ignorant complètement les éléments à décharge. Dans une telle situation également, le biais d’uni-polarisation en résultant ne serait pas inapproprié, car il résulte bien des éléments du contexte qu’il s’agit bien du rôle exact mais limité qui est assigné au procureur. En revanche, un juge qui ne prendrait en compte que les éléments à charge de l’accusé, ou bien qui commettrait l’erreur inverse, de ne considérer que les éléments à décharge de ce dernier, commettrait bien un biais d’uni-polarisation inapproprié, car le rôle-même du juge implique qu’il prenne en considération les deux catégories d’éléments et que son jugement provienne de la synthèse qui en résulte.

En outre, ainsi que nous l’avons évoqué plus haut, la mention d’une classe de référence associée à l’objet o se révèle importante. En effet, ainsi que nous aurons l’occasion de le constater avec l’analyse des exemples qui suivent, sa définition-même se trouve associée à une dualité A/Ā. Et la classe de référence peut être définie soit du point de vue de A, soit du point de vue de Ā. Une telle particularité a pour conséquence que tous les objets ne sont pas susceptibles de donner lieu à un biais d’uni-polarisation. En particulier, les objets auxquels ne sont pas associés une classe de référence qui est elle-même susceptible d’être envisagée sous l’angle d’une dualité A/Ā, ne donnent pas lieu à un tel biais d’uni-polarisation.

Avant d’illustrer la présente construction à l’aide de plusieurs exemples concrets, il apparaît utile à ce stade, de considérer le biais d’uni-polarisation qui vient d’être défini, et qui résulte de la définition-même du principe d’indifférence dialectique, à la lumière de plusieurs notions similaires. De manière préliminaire, nous pouvons observer qu’une description générale de ce type d’erreur de raisonnement avait déjà été formulée, en des termes voisins, par John Stuart Mill (On Liberty, II) :

He who knows only his own side of the case, knows little of that. His reasons may be good, and no one may have been able to refute them. But if he is equally unable to refute the reasons on the opposite side ; if he does not so much know what they are, he has no ground for preferring either opinion.

Dans la littérature récente, une notion très voisine a également été décrite. Il s’agit en particulier du biais dialectique défini notamment par Douglas Walton (1997, 1999). Walton (1999, pp. 76-77) se place ainsi dans le cadre la théorie dialectique des biais, qui oppose les arguments uni-polarisés aux arguments bi-polarisés :

The dialectical theory of bias is based on the idea […] that an argument has two sides. […] A one-sided argument continually engages in pro-argumentation for the position supported and continually rejects the arguments of the opposed side in a dialogue. A two-sided (balanced) argument considers all arguments on both sides of a dialogue. A balanced argument weights each argument against the arguments that have been opposed to it.

Walton décrit ainsi le biais dialectique (dialectical bias) comme un point de vue uni-polarisé qui survient au cours de l’argumentation. Le biais dans le raisonnement consiste ainsi à ne prendre en compte qu’un point de vue concernant l’argument en question, alors même que l’autre point de vue pourrait se révéler décisif quant à la conclusion à en tirer. Le raisonnement correspondant se trouve biaisé, en ce sens qu’il ne présente qu’un aspect des éléments qui justifient un jugement ou un point de vue donné, en occultant complètement l’autre aspect des éléments pertinents relatifs à ce même argument.

Walton souligne aussi que le biais dialectique, qui est très répandu dans l’argumentation humaine, ne constitue pas nécessairement une erreur de raisonnement. Suivant en cela la distinction entre «bon» et «mauvais» biais due à Antony Blair (1988), Walton considère que le biais dialectique est incorrect seulement dans certaines conditions, et en particulier s’il survient dans un contexte qui est supposé être équilibré, c’est-à-dire où les deux facettes du raisonnement correspondant sont censées être mentionnées (p. 81) :

Bad bias can be defined as “pure (one-sided) advocacy” in a situation where such unbalanced advocacy is normatively inappropriate in argumentation.

En outre, ainsi que nous aurons de le constater au moyen d’un exemple, le biais d’uni-polarisation pêche par le fait qu’un certain nombre de prémisses sont omises dans le raisonnement correspondant. Ce point est essentiel, car lorsque ces prémisses manquantes sont replacées au sein de l’argument, la conclusion qui en résulte n’est plus valide, et une conclusion radicalement différente prévaut alors.

4. Instance du biais d’uni-polarisation

Afin d’illustrer les notions précédentes, il s’avère intéressant, à ce stade, de donner un exemple du biais d’uni-polarisation. À cette fin, considérons l’instance suivante, qui consiste en une forme de raisonnement, mentionnée par Philippe Boulanger (2000, p. 3)4, qui l’attribue au mathématicien Stanislas Ulam. Le biais d’uni-polarisation s’y manifeste sous une forme déductive. Ulam estime ainsi que si une entreprise devait atteindre un niveau de main d’oeuvre suffisamment important, son niveau de performance serait paralysé par le grand nombre de conflits internes qui en résulteraient. Ulam estime ainsi que le nombre de conflits entre personnes augmenterait selon le carré du nombre n d’employés, alors que l’impact sur le travail qui en résulterait ne progresserait qu’en fonction de n. Ainsi, selon cet argument, il n’est pas souhaitable que le nombre d’employés au sein d’une entreprise devienne important. Cependant, il s’avère que le raisonnement d’Ulam est fallacieux, comme le souligne Boulanger, car il met exclusivement l’accent sur les relations conflictuelles entre employés. Or les n2 relations parmi les employés de l’entreprise peuvent être de nature conflictuelle, mais peuvent consister aussi bien en relations de collaboration tout à fait bénéfiques pour l’entreprise. Il n’y a donc pas de raison de privilégier les relations conflictuelles par rapport aux relations de collaboration. Et lorsque parmi les n2 relations qui s’établissent entre les employés de l’entreprise, certaines sont d’authentiques relations de collaboration, cela a pour effet, au contraire, d’améliorer la performance de l’entreprise. Par conséquent, on ne peut pas conclure légitimement qu’il n’est pas souhaitable que l’effectif d’une entreprise atteigne une taille importante.

Dans un souci de clarté, il s’avère utile de formaliser quelque peu le raisonnement précédent. Il apparaît ainsi que le raisonnement d’Ulam peut être présenté de la manière suivante :

(D1Ā) si <une entreprise présente un nombre important d’employés>

(D2Ā) alors <il en résultera n2 relations conflictuelles>

(D3Ā) alors des effets négatifs en résulteront

(D4Ā)  le fait qu’ <une entreprise ait un nombre important d’employés> est mauvais

Ce type de raisonnement présente la structure d’un biais d’uni-polarisation, car il met uniquement l’accent sur les relations conflictuelles (qui concernent le pôle de dissociation de la dualité association/dissociation), en passant sous silence un argument parallèle présentant la même structure qui pourrait être légitimement soulevé, mettant l’accent sur les relations de collaboration (associées au pôle d’association), qui constituent l’autre aspect pertinent sur ce sujet particulier. Cet argument parallèle est le suivant :

(D1A) si <une entreprise présente un nombre important d’employés>

(D2A) alors <il en résultera n2 relations de collaboration>

(D3A) alors des effets positifs en résulteront

(D4A)  le fait qu’ <une entreprise ait un nombre important d’employés> est bon

Ceci met finalement en lumière comment les deux formulations de l’argument conduisent à des conclusions contradictoires, c’est-à-dire (D4Ā) et (D4A). À ce stade, il est utile de souligner la structure-même de la conclusion du raisonnement ci-dessus, qui est la suivante :

(D5Ā) la situation s est mauvaise du point de vue Ā (dissociation)

alors que la conclusion du raisonnement parallèle est la suivante :

(D5A) la situation s est bonne du point de vue A (association)

Mais si le raisonnement avait été complet, en prenant en compte les deux points de vue, une autre conclusion en aurait résulté :

(D5Ā) la situation s est mauvaise du point de vue Ā (dissociation)

(D5A) la situation s est bonne du point de vue A (association)

(D6A/Ā) la situation s est mauvaise du point de vue Ā (dissociation) et bonne du point de vue A (association)

(D7A/Ā)  la situation s est neutre du point de vue de la dualité A/Ā (association/dissociation)

Et une telle conclusion s’avère tout à fait différente de celle qui résulte de (D5Ā) et de (D5A).

Finalement, nous sommes en mesure de caractériser le biais d’uni-polarisation qui vient d’être décrit dans le cadre du présent modèle : l’objet o est le raisonnement précité, la classe de référence est celle des relations existant entre les employés d’une entreprise, et la dualité correspondante — permettant de définir la classe de référence — est la dualité dissociation/association.

5. Analyse dichotomique et méta-philosophie

Le principe d’indifférence dialectique précité et son corollaire — le biais d’uni-polarisation — est susceptible de trouver des applications dans plusieurs domaines5. Nous nous intéresserons, dans ce qui suit, à ses applications à un niveau méta-philosophique, à travers l’analyse de plusieurs paradoxes philosophiques contemporains. La méta-philosophie constitue cette branche de la philosophie dont l’objet est l’étude de la nature de la philosophie, de sa finalité et de ses méthodes propres. Dans ce contexte, un domaine spécifique au sein de la méta-philosophie est celui de la méthode à employer pour s’attacher à résoudre, ou à progresser vers la résolution des paradoxes ou des problèmes philosophiques. C’est dans ce domaine spécifique que s’inscrit la présente construction, en ce sens qu’elle propose l’analyse dichotomique comme un outil qui peut se révéler utile pour aider à la résolution de paradoxes ou de problèmes philosophiques.

L’analyse dichotomique, en tant que méthodologie pouvant être utilisée pour la recherche de solutions à certains paradoxes ou problèmes philosophiques, résulte directement de l’énoncé-même du principe d’indifférence dialectique. L’idée générale qui sous-tend la démarche dichotomique d’analyse des paradoxes, est que deux versions, correspondant à l’un et l’autre pôle d’une dualité donnée, peuvent se trouver mêlées dans un paradoxe philosophique. La démarche consiste alors à trouver une classe de référence associée au paradoxe en question et la dualité A/Ā correspondante, ainsi que les deux variations du paradoxe qui en résultent et qui s’appliquent à chacun des pôles de cette dualité. Cependant, toute dualité ne convient pas pour cela, car pour nombre de dualités, la version correspondante du paradoxe demeure par essence inchangée, quel que soit le pôle que l’on envisage. Dans la méthode dichotomique, il s’agit de s’attacher à trouver une classe de référence et une dualité associée pertinente, telle que le point de vue de chacun de ses pôles conduise effectivement à deux versions structurellement différentes du paradoxe, ou bien à la disparition du paradoxe selon le point de vue de l’un des pôles. Ainsi, lorsque l’on envisage le paradoxe sous l’angle des deux pôles A et Ā, et que cela n’a aucune incidence concernant le paradoxe lui-même, la dualité A/Ā correspondante ne se révèle donc pas, de ce point de vue, pertinente.

L’analyse dichotomique ne constitue pas un outil qui prétend résoudre tous les problèmes philosophiques, loin s’en faut, mais seulement une méthodologie qui est susceptible d’apporter un éclairage pour certains d’entre eux. Dans ce qui suit, nous nous attacherons à illustrer, à travers plusieurs travaux de l’auteur, comment l’analyse dichotomique peut s’appliquer pour progresser vers la résolution de trois paradoxes philosophiques contemporains : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse.

De manière préliminaire, on peut observer ici que dans la littérature, on trouve également un exemple d’analyse dichotomique de paradoxe chez David Chalmers (2002). Chalmers s’attache ainsi à montrer comment le paradoxe des deux enveloppes comporte deux versions fondamentalement distinctes, dont l’une correspond à une version finie du paradoxe et l’autre à une version infinie. Une telle analyse, bien que conçue indépendamment de la présente construction, peut ainsi être caractérisée comme une analyse dichotomique fondée sur la dualité fini/infini.

Figure 3. Pôles duaux dans l’analyse de David Chalmers du paradoxe des deux enveloppes

6. Application à l’analyse des paradoxes philosophiques

À ce stade, il convient d’appliquer ce qui précède à l’analyse de problèmes concrets. Nous nous efforcerons ainsi d’illustrer cela à travers l’analyse de plusieurs paradoxes philosophiques contemporains : le paradoxe de Hempel, le paradoxe de l’examen-surprise et l’argument de l’Apocalypse. Nous nous attacherons à montrer comment un problème de biais d’uni-polarisation associé à un problème de définition d’une classe de référence se rencontre dans l’analyse des paradoxes philosophiques précités. En outre, nous montrerons comment la définition-même de la classe de référence associée à chaque paradoxe est susceptible d’être qualifiée à l’aide des pôles duaux A et Ā d’une dualité A/Ā tels qu’ils viennent d’être définis.

6.1. Application à l’analyse du paradoxe de Hempel

Le paradoxe de Hempel est basé sur le fait que les deux assertions suivantes :

(H) Tous les corbeaux sont noirs

(H*) Tout ce qui est non-noir est un non-corbeau

sont logiquement équivalentes. Par sa structure, (H*) se présente en effet comme la forme contraposée de (H). Il en résulte que la découverte d’un corbeau noir confirme (H) et également (H*), mais aussi que la découverte d’une chose non-noire qui n’est pas un corbeau telle qu’un flamand rose ou même un parapluie gris, confirme (H*) et donc (H). Cependant, cette dernière conclusion apparaît comme paradoxale.

Nous nous attacherons maintenant à détailler l’analyse dichotomique sur laquelle se trouve basée la solution proposée dans Franceschi (1999). La démarche se trouve fondée sur la recherche d’une classe de référence associée à l’énoncé du paradoxe, qui est susceptible d’être définie à l’aide d’une dualité A/Ā. Si l’on examine ainsi avec soin les concepts et les catégories qui sous-tendent les propositions (H) et (H*), on remarque tout d’abord que ceux-ci sont au nombre de quatre : les corbeaux, les objets noirs, les objets non-noirs et les non-corbeaux. Un corbeau tout d’abord se trouve défini de manière précise dans la taxinomie au sein de laquelle il s’insère. Une catégorie comme celle des corbeaux peut être considérée comme bien définie, car elle est basée sur un ensemble de critères précis définissant l’espèce corvus corax et permettant l’identification de ses instances. De même, la classe des objets noirs peut être décrite avec précision, à partir d’une taxinomie des couleurs établie par rapport aux longueurs d’onde de la lumière. Enfin, on peut constater que la classe des objets non-noirs peut également faire l’objet d’une définition qui ne souffre pas d’ambiguïté, à partir notamment de la taxinomie précise des couleurs qui vient d’être mentionnée.

En revanche, qu’en est-il de la classe des non-corbeaux ? Qu’est-ce qui constitue une instance d’un non-corbeau ? Intuitivement, un merle bleu, un flamand rose, un parapluie gris, voire même un entier naturel, constituent des non-corbeaux. Mais doit-on envisager une classe de référence qui aille jusqu’à inclure les objets abstraits ? Faut-il ainsi considérer une notion de non-corbeau qui englobe des entités abstraites tels que les entiers naturels et les nombres complexes ? Ou bien convient-il se limiter à une classe de référence qui n’embrasse que les animaux ? Doit-on considérer une classe de référence qui englobe tous les êtres vivants, ou bien encore toutes les choses concrètes, incluant cette fois également les artefacts ? Finalement, il en résulte que la proposition (H*) initiale est susceptible de donner lieu à plusieurs variations, qui sont les suivantes :

(H1*) Tout ce qui est non-noir parmi les corvidés est un non-corbeau

(H2*) Tout ce qui est non-noir parmi les oiseaux est un non-corbeau

(H3*) Tout ce qui est non-noir parmi les animaux est un non-corbeau

(H4*) Tout ce qui est non-noir parmi les êtres vivants est un non-corbeau

(H5*) Tout ce qui est non-noir parmi les choses concrètes est un non-corbeau

(H6*) Tout ce qui est non-noir parmi les objets concrets et abstraits est un non-corbeau

Ainsi, il apparaît que l’énoncé du paradoxe de Hempel et en particulier la proposition (H*) se trouve associée à une classe de référence, qui permet de définir les non-corbeaux. Une telle classe de référence peut s’assimiler aux corvidés, aux oiseaux, aux animaux, aux êtres vivants, aux choses concrètes, ou encore aux choses concrètes et abstraites, etc. Cependant, dans l’énoncé du paradoxe de Hempel, on ne dispose pas de critère objectif permettant d’effectuer un tel choix. À ce stade, il apparaît que l’on peut choisir une telle classe de référence de manière restrictive, par exemple en l’assimilant aux corvidés. Mais de manière aussi légitime, on peut choisir une classe de référence de manière plus extensive, par exemple en l’identifiant à l’ensemble des choses concrètes, incluant alors notamment les parapluies. Alors pourquoi choisir telle classe de référence définie de manière restrictive plutôt que telle autre définie de façon extensive ? On ne possède pas en réalité de critère pour légitimer le choix, selon que l’on procède par restriction ou par extension, de la classe de référence. Dès lors, il apparaît que celle-ci ne peut être définie que de manière arbitraire. Or le choix d’une telle classe de référence se révèle déterminant, car selon que l’on choisira telle ou telle classe de référence, un objet donné tel qu’un parapluie gris confirmera ou non (H*) et donc (H). Ainsi, si nous choisissons la classe de référence par extension, incluant ainsi l’ensemble des objets concrets, un parapluie gris confirmera (H). Cependant, si nous choisissons une telle classe de référence par restriction, en l’assimilant seulement aux corvidés, un parapluie gris ne confirmera pas (H). Une telle différence se révèle essentielle. En effet, si l’on choisit une définition extensive de la classe de référence, on a bien l’effet paradoxal inhérent au paradoxe de Hempel. Mais dans le cas contraire, si l’on opte pour une classe de référence définie de manière restrictive, on perd alors l’effet paradoxal.

Figure 4. Pôles duaux au sein de la classe de référence des non-corbeaux dans le paradoxe de Hempel

Ce qui précède permet de décrire avec précision les éléments de l’analyse qui précède du paradoxe de Hempel, en termes de biais d’uni-polarisation ainsi qu’il a été défini plus haut : au paradoxe et en particulier à la proposition (H*) se trouve associée la classe de référence des non-corbeaux, qui est elle-même susceptible d’être définie par rapport à ladualité extension/restriction. Or, pour un objet donné tel qu’un parapluie gris, la définition de la classe de référence par extension donne lieu à un effet paradoxal, alors-même que le choix de cette dernière par restriction ne conduit pas à un tel effet.

6.2. Application à l’analyse du paradoxe de l’examen-surprise

La version classique du paradoxe de l’examen-surprise (Quine, 1953 ; Sorensen, 1988) est la suivante : un professeur annonce à ses étudiants qu’un examen aura lieu la semaine prochaine, mais qu’ils ne pourront pas connaître à l’avance le jour précis où l’examen se déroulera. L’examen aura donc lieu par surprise. Les étudiants raisonnent ainsi. L’examen ne peut avoir lieu le samedi, pensent-ils, car sinon ils sauraient à l’avance que l’examen aurait lieu le samedi et donc il ne pourrait survenir par surprise. Aussi le samedi se trouve-t-il éliminé. De plus, l’examen ne peut avoir lieu le vendredi, car sinon les étudiants sauraient à l’avance que l’examen aurait lieu le vendredi et donc il ne pourrait survenir par surprise. Aussi le vendredi se trouve-t-il également éliminé. Par un raisonnement analogue, les étudiants éliminent successivement le jeudi, le mercredi, le mardi et le lundi. Finalement, ce sont tous les jours de la semaine qui sont ainsi éliminés. Toutefois, cela n’empêche pas l’examen de survenir finalement par surprise, le mercredi. Ainsi, le raisonnement des étudiants s’est avéré fallacieux. Pourtant, un tel raisonnement paraît intuitivement valide. Le paradoxe réside ici dans le fait que le raisonnement des étudiants est semble-t-il valide, alors qu’il se révèle finalement en contradiction avec les faits, à savoir que l’examen peut véritablement survenir par surprise, conformément à l’annonce faite par le professeur.

Afin de présenter l’analyse dichotomique (Franceschi, 2005) qui peut être effectuée par rapport au paradoxe de l’examen-surprise, il convient de considérer tout d’abord deux variations qui apparaissent structurellement différentes du paradoxe. Une première variation est associée à la solution au paradoxe proposée par Quine (1953). Quine considère ainsi la conclusion finale de l’étudiant selon laquelle l’examen ne peut avoir lieu par surprise aucun jour de la semaine. Selon Quine, l’erreur de l’étudiant réside dans le fait de n’avoir pas envisagé dès le début l’hypothèse selon laquelle l’examen pourrait avoir lieu le dernier jour. Car le fait de considérer précisément que l’examen n’aura pas lieu le dernier jour permet finalement à l’examen de survenir par surprise, le dernier jour. Si l’étudiant avait également pris en compte cette possibilité dès le début, il ne serait pas parvenu à la conclusion fallacieuse que l’examen ne peut pas survenir par surprise.

La seconde variation du paradoxe qui se révèle intéressante dans le présent contexte, est celle qui est associée à la remarque, effectuée par plusieurs auteurs (Hall, 1999, p. 661; Williamson, 2000), selon laquelle le paradoxe émerge nettement, lorsque le nombre n d’unités est grand. Un tel nombre est habituellement associé à un nombre n de jours, mais on peut aussi bien utiliser des heures, des minutes, des secondes, etc. Une caractéristique intéressante du paradoxe est en effet que celui-ci émerge intuitivement de manière plus nette lorsque de grandes valeurs de n sont prises en compte. Une illustration frappante de ce phénomène nous est ainsi fournie par la variation du paradoxe qui correspond à la situation suivante, décrite par Timothy Williamson (2000, p. 139) :

Advance knowledge that there will be a test, fire drill, or the like of which one will not know the time in advance is an everyday fact of social life, but one denied by a surprising proportion of early work on the Surprise Examination. Who has not waited for the telephone to ring, knowing that it will do so within a week and that one will not know a second before it rings that it will ring a second later ?

La variation décrite par Williamson correspond à l’annonce faite à quelqu’un qu’il recevra un coup de téléphone dans la semaine, sans pouvoir toutefois déterminer à l’avance à quelle seconde précise un tel événement surviendra. Cette variation souligne comment la surprise peut se manifester, de manière tout à fait plausible, lorsque la valeur de n est élevée. L’unité de temps considérée par Williamson est ici la seconde, rapportée à une période qui correspond à une semaine. La valeur correspondante de n est ici très élevée et égale à 604 800 (60 × 60 × 24 × 7) secondes. Cependant, il n’est pas indispensable de prendre en compte une valeur aussi grande de n, et une valeur de n égale par exemple à 365 convient également très bien.

Le fait que deux versions qui semblent a priori assez différentes du paradoxe coexistent, suggère que deux versions structurellement différentes du paradoxe pourraient se trouver inextricablement mêlées dans le paradoxe de l’examen-surprise. De fait, si l’on analyse la version du paradoxe qui donne lieu à la solution de Quine, on s’aperçoit qu’elle présente une particularité : elle est susceptible de se manifester pour une valeur de n égale à 1. La version correspondante de l’annonce du professeur est alors la suivante : «Un examen aura lieu demain, mais vous ne pourrez savoir à l’avance que cet examen aura lieu et par conséquent, il surviendra par surprise.» L’analyse de Quine s’applique directement à cette version du paradoxe pour laquelle n = 1. Dans ce cas, l’erreur de l’étudiant réside, selon Quine, dans le fait de n’avoir considéré que la seule hypothèse suivante : (a) «l’examen aura lieu demain et je prévoirai qu’il aura lieu». En fait, l’étudiant aurait dû considérer également trois autres cas : (b) «l’examen n’aura pas lieu demain et je prévoirai qu’il aura lieu» ; (c) «l’examen n’aura pas lieu demain et je ne prévoirai pas qu’il aura lieu» ; (d) «l’examen aura lieu demain et je ne prévoirai pas qu’il aura lieu». Et le fait de considérer l’hypothèse (a) mais également l’hypothèse (d) qui est compatible avec l’annonce du professeur aurait empêché l’étudiant de conclure que l’examen n’aurait finalement pas lieu. Par conséquent, souligne Quine, c’est le fait de n’avoir pris en considération que l’hypothèse (a) qui peut être identifié comme la cause du raisonnement fallacieux.

On le voit, la structure-même de la version du paradoxe sur laquelle est fondée la solution de Quine présente les particularités suivantes : d’une part, la non-surprise peut effectivement survenir le dernier jour, et d’autre part, l’examen peut également survenir par surprise le dernier jour. Il en va de même pour la version du paradoxe où n = 1 : la non-surprise ainsi que la surprise peuvent survenir le jour n. Ceci permet de représenter une telle structure du paradoxe sous forme de la matrice S[k, s] suivante (où k dénote le jour où l’examen a lieu et S[k, s] dénote si le cas correspondant de non-surprise (s = 0) ou de surprise (s = 1) est rendu possible (dans ce cas, S[k, s] = 1) ou non (dans ce cas, S[k, s] = 0)) :

journon-surprisesurprise
111
211
311
411
511
611
711

Structure matricielle de la version du paradoxe correspondant à la solution de Quine pour n = 7 (une semaine)

journon-surprisesurprise
111

Structure matricielle de la version du paradoxe correspondant à la solution de Quine pour n = 1 (un jour)

Compte tenu de la structure correspondante de la matrice qui admet des valeurs égales à 1 à la fois au niveau des cas de non-surprise et de surprise, pour un jour donné, nous dénommerons conjointe une telle structure de matrice.

Si l’on étudie la variation du paradoxe énoncée par Williamson et mentionnée plus haut, elle présente la particularité, à l’inverse de la variation précédente, d’émerger de manière nette lorsque n est grand. Dans ce contexte, l’annonce du professeur correspondante par exemple à une valeur de n égale à 365, est la suivante : «Un examen aura lieu dans l’année à venir mais la date de l’examen constituera une surprise». Si l’on analyse une telle variation en termes de matrice des cas de non-surprise et de surprise, il apparaît qu’une telle version du paradoxe présente les propriétés suivantes : la non-surprise ne peut survenir le 1er jour alors que la surprise est possible ce même 1er jour ; en revanche, le dernier jour, la non-surprise est possible alors que la surprise n’est pas possible.

journon-surprisesurprise
101
36510

Structure matricielle de la version du paradoxe correspondant à la variation de Williamson pour n = 365 (un an)

Ce qui précède permet maintenant d’identifier avec précision ce qui pêche dans le raisonnement de l’étudiant, lorsqu’il s’applique à cette version particulière du paradoxe. Dans ces circonstances, l’étudiant aurait alors dû raisonner de la manière suivante. La surprise ne peut se manifester le dernier jour mais peut survenir le 1er jour ; la non-surprise peut se manifester le dernier jour, mais ne peut survenir le 1er jour. Il s’agit ici d’instances propres de non-surprise et de surprise, qui se révèlent disjointes. Cependant, la notion de surprise n’est pas capturée de manière exhaustive par l’extension et l’anti-extension de la surprise. Or une telle définition est conforme à la définition d’un prédicat vague, qui se caractérise par une extension et une anti-extension mutuellement exclusives et non-exhaustives. Ainsi, la conception de la surprise associée une structure disjointe est-elle celle d’une notion vague. Aussi l’erreur à l’origine du raisonnement fallacieux de l’étudiant réside-t-elle dans l’absence de prise en compte du fait que la surprise correspond dans le cas d’une structure disjointe, à une notion vague, et comporte donc la présence d’une zone de pénombre correspondant à des cas-limites (borderline) entre la non-surprise et la surprise. Car la seule prise en compte du fait que la notion de surprise est ici une notion vague aurait interdit à l’étudiant de conclure que S[k, 1] = 0, pour toutes les valeurs de k, c’est-à-dire que l’examen ne peut survenir par surprise aucun jour de la période considérée.

Finalement, il apparaît ainsi que l’analyse conduit à distinguer au niveau du paradoxe de l’examen-surprise deux variations indépendantes. La définition matricielle des cas de non-surprise et de surprise conduit à distinguer deux variations du paradoxe, en fonction de la dualité conjoint/disjoint. Dans un premier cas, le paradoxe est basé sur une définition conjointe des cas de non-surprise et de surprise. Dans un second cas, le paradoxe se trouve fondé sur une définition disjointe. Chacune de ces deux variations conduit à une variation structurellement différente du paradoxe et à une solution indépendante. Lorsque la variation du paradoxe est basée sur une définition conjointe, la solution développée par Quine s’applique alors. En revanche, lorsque la variation, du paradoxe est fondée sur une définition disjointe, la solution retenue est fondée sur la reconnaissance préalable de la nature vague de la notion de surprise associée à cette variation du paradoxe.

Figure 5. Pôles duaux dans la classe des matrices associées au paradoxe de l’examen-surprise

On le voit finalement, l’analyse dichotomique du paradoxe de l’examen-surprise conduit à envisager la classe des matrices associées à la définition-même du paradoxe et à distinguer selon que leur structure est conjointe ou bien disjointe. Dès lors, il en résulte une solution indépendante pour chacune des deux versions structurellement différentes du paradoxe qui en résultent.

6.3. Application à l’analyse de l’Argument de l’Apocalypse

L’argument de l’Apocalypse, attribué à Brandon Carter, a été décrit par John Leslie (1993, 1996). Il convient d’en rappeler préalablement l’énoncé. Considérons la proposition (A) suivante :

(A) L’espèce humaine disparaîtra avant la fin du XXIème siècle

On peut estimer, pour fixer les idées, à une chance sur 100 la probabilité que cette disparition survienne : P(A) = 0,01. Soit également la proposition suivante :

(Ā) L’espèce humaine ne disparaîtra pas à la fin du XXIème siècle

Soit encore E l’événement : je vis durant les années 2010. On peut par ailleurs estimer aujourd’hui à 60 milliards le nombre d’humains ayant existé depuis la naissance de l’humanité. De même, la population actuelle peut être évaluée à 6 milliards. On calcule ainsi qu’un humain sur dix, si l’événement A survient, aura connu les années 2010. On évalue alors la probabilité que l’humanité soit éteinte avant la fin du XXIème siècle, si j’ai connu les années 2010 : P(E, A) = 6×109/6×1010 = 0,1. Par contre, si l’humanité passe le cap du XXIème siècle, on peut penser qu’elle sera appelée à une expansion beaucoup plus importante, et que le nombre des humains pourra s’élever par exemple à 6×1012. Dans ce cas, la probabilité que l’humanité ne soit pas éteinte à la fin du XXIème siècle, si j’ai connu les années 2010 s’évalue ainsi : P(E, Ā) = 6×109/6×1012 = 0,001. À ce stade, nous pouvons assimiler à deux urnes distinctes — l’une contenant 60 milliards de boules et l’autre en comportant 6000 milliards — les populations humaines totales qui en résultent. Ceci conduit à calculer la probabilité a posteriori de l’extinction de l’espèce humaine avant la fin du XXIème siècle, à l’aide de la formule de Bayes : P'(A) = [P(A) x P(E, A)] / [P(A) x P(E, A) + P(Ā) x P(E, Ā)] = (0,01 x 0,1) / (0,01 x 0,1 + 0,99 x 0,001) = 0,5025. Ainsi, la prise en compte du fait que je vis actuellement fait passer la probabilité de l’extinction de l’espèce humaine avant 2150 de 1 % à 50,25 %. Une telle conclusion apparaît comme contraire à l’intuition et en ce sens, paradoxale.

Il convient maintenant de s’attacher comment une analyse dichotomique (Franceschi, 1999, 2009) peut s’appliquer à l’argument de l’Apocalypse. En premier lieu, nous nous attacherons à montrer comment l’argument de l’Apocalypse comporte un problème de définition de classe de référence6 liée à une dualité A/Ā. Considérons en effet l’assertion suivante :

(A) L’espèce humaine disparaîtra avant la fin du XXIème siècle

Une telle proposition présente une connotation dramatique, apocalyptique et tragique, liée à la disparition très prochaine de l’espèce humaine. Il s’agit là d’une prédiction de nature tout à fait catastrophique et alarmante. Cependant, si on analyse une telle proposition avec soin, on est conduit à remarquer qu’elle comporte une imprécision. Si la référence temporelle elle-même — la fin du XXIème siècle — se révèle tout à fait précise, le terme d’ «espèce humaine» proprement dit apparaît comme ambigu. En effet, il s’avère qu’il existe plusieurs façons de définir cette dernière. La notion la plus précise permettant de définir l’ «espèce humaine» est notre présente taxinomie scientifique, basée sur les notions de genre, d’espèce, de sous-espèce, etc. En adaptant cette dernière taxinomie à l’assertion (A), il s’ensuit que la notion ambiguë d’ «espèce humaine» est susceptible d’être définie par rapport au genre, à l’espèce, à la sous-espèce, etc. et en particulier par rapport au genre homo, à l’espèce homo sapiens, à la sous-espèce homo sapiens sapiens, etc. Finalement, il s’ensuit que l’assertion (A) est susceptible de revêtir les formes suivantes :

(Ah) Le genre homo disparaîtra avant la fin du XXIème siècle

(Ahs) L’espèce homo sapiens disparaîtra avant la fin du XXIème siècle

(Ahss) La sous-espèce homo sapiens sapiens disparaîtra avant la fin du XXIème siècle

À ce stade, la lecture de ces différentes propositions conduit à un impact différent, eu égard à la proposition initiale (A). Car si (Ah) présente bien à l’instar de (A) une connotation tout à fait dramatique et tragique, il n’en va pas de même pour (Ahss). En effet, une telle proposition qui prévoit l’extinction de notre sous-espèce actuelle homo sapiens sapiens avant la fin du XXIème siècle, pourrait s’accompagner du remplacement de notre actuelle race humaine par une nouvelle sous-espèce plus évoluée, que l’on pourrait dénommer homo sapiens supersapiens. Dans ce cas, la proposition (Ahss) ne comporterait pas de connotation tragique, mais serait associée à une connotation positive, car le remplacement d’une race ancienne par une espèce plus évoluée constitue un processus naturel de l’évolution. Plus encore, en choisissant une classe de référence encore plus restreinte telle que celle des humains n’ayant pas connu l’ordinateur (homo sapiens sapiens antecomputeris), on obtient la proposition suivante :

(Ahsss) L’infra-sous-espèce homo sapiens sapiens antecomputeris disparaîtra avant la fin du XXIème siècle

qui ne présente plus du tout la connotation dramatique inhérente à (A) et qui se révèle même tout à fait normale et rassurante, et qui ne présente plus de caractère paradoxal ni contraire à l’intuition. Dans ce cas en effet, la disparition de l’infra-sous-espèce homo sapiens sapiens antecomputeris s’accompagne de la surviede l’infra-sous-espèce plus évoluée homo sapiens sapiens postcomputeris. Il s’avère ainsi qu’un classe de référence restreinte coïncidant avec une infra-sous-espèce est définitivement éteinte, mais qu’une classe plus étendue correspondant à une sous-espèce (homo sapiens sapiens) survit. Dans ce cas, on observe bien le décalage bayesien décrit par Leslie, mais l’effet de ce décalage se révèle cette fois tout à fait inoffensif.

Ainsi, le choix de la classe de référence pour la proposition (A) se révèle-t-il déterminant pour la nature paradoxale de la conclusion associée à l’argument de l’Apocalypse. Si l’on choisit ainsi une classe de référence étendue pour la définition-même des humains, en l’associant par exemple au genre homo, on conserve le caractère dramatique et inquiétant associé à la proposition (A). Mais si on choisit une telle classe de référence de manière restrictive, en l’associant par exemple à l’infra-sous-espèce homo sapiens sapiens antecomputeris, un contenu rassurant et normal se trouve désormais associé à la proposition (A) qui sous-tend l’argument de l’Apocalypse.

Finalement, nous sommes en mesure de replacer l’analyse qui précède dans le présent contexte. La définition-même de la classe de référence des «humains» associée à la proposition (A) inhérente à l’argument de l’Apocalypse est susceptible d’être définie selon les pôles de la dualité extension/restriction. Une analyse fondée sur un point de vue bi-polarisé conduit à constater que le choix par extension entraîne un effet paradoxal, alors-même que le choix par restriction de la classe de référence fait disparaître ce même effet paradoxal.

Figure 6. Pôles duaux au sein de la classe de référence des «humains» dans l’Argument de l’Apocalypse

L’analyse dichotomique, toutefois, en ce qui concerne l’argument de l’Apocalypse, ne se limite pas à cela. En effet, si on étudie l’argument avec soin, il apparaît qu’il recèle une autre classe de référence associée à une autre dualité. Ceci peut être mis en évidence en analysant l’argument opposé par William Eckhardt (1993, 1997) à l’argument de l’Apocalypse. Selon Eckhardt, la situation humaine correspondant à DA n’est pas analogue au modèle des deux urnes décrit par Leslie, mais plutôt à un modèle alternatif, qui peut être appelé le distributeur d’objets consécutifs (consecutive token dispenser). Le distributeur d’objets consécutifs est un dispositif qui éjecte à intervalles réguliers des boules numérotées consécutivement :

(…) suppose on each trial the consecutive token dispenser expels either 50 (early doom) or 100 (late doom) consecutively numbered tokens at the rate of one per minute.

S’appuyant sur ce modèle, Eckhardt (1997, p. 256) souligne le fait qu’il est impossible d’effectuer une sélection aléatoire, dès lorsqu’il existe de nombreux individus qui ne sont pas encore nés au sein de la classe de référence correspondante : «How is it possible in the selection of a random rank to give the appropriate weight to unborn members of the population ?». L’idée forte d’Eckhardt qui sous-tend cette objection diachronique est qu’il est impossible d’effectuer une sélection aléatoire lorsqu’il existe de nombreux membres au sein de la classe de référence qui ne sont pas encore nés. Dans une telle situation, il serait tout à fait erroné de conclure à un décalage bayesien en faveur de l’hypothèse (A). En revanche, ce que l’on peut inférer de manière rationnelle dans un tel cas, c’est que la probabilité initiale demeure inchangée.

À ce stade, il apparaît que deux modèles alternatifs pour modéliser l’analogie avec la situation humaine correspondant à l’argument de l’Apocalypse se trouvent en concurrence : d’une part le modèle à caractère synchronique (où toutes les boules sont présentes dans l’urne au moment où s’effectue le tirage) préconisé par Leslie et d’autre part, le modèle diachronique d’Eckhardt, où des boules peuvent être ajoutées dans l’urne après le tirage. La question qui se pose est la suivante : la situation humaine correspondant à l’argument de l’Apocalypse est-elle en analogie avec (a) le modèle de l’urne synchronique, ou bien avec (b) le modèle de l’urne diachronique ? Afin d’y répondre, la question suivante s’ensuit : existe-t-il un critère objectif qui permette de choisir, de manière préférentielle, entre les deux modèles concurrents ? Il apparaît que non. En effet, ni Leslie ni Eckhardt ne présentent une motivation objective qui permette de justifier le choix du modèle qu’ils préconisent, et d’écarter le modèle alternatif. Dans ces circonstances, le choix de l’un ou l’autre des deux modèles — synchronique ou diachronique — apparaît comme arbitraire. Par conséquent, il s’avère que le choix au sein de la classe des modèles associée à l’argument de l’Apocalypse est susceptible d’être défini selon les pôles de la dualité synchronique/diachronique. Et une analyse fondée sur un point de vue bi-polarisé conduit à constater que le choix du modèle synchronique conduit à un effet paradoxal, alors-même que le choix du modèle diachronique fait disparaître ce dernier effet paradoxal.

Figure 7. Pôles duaux au sein de la classe des modèles de l’Argument de l’Apocalypse

Finalement, compte tenu du fait que le problème précité concernant la classe de référence des humains et le choix dans la dualité extension/restriction qui lui est associé, ne concerne que le modèle synchronique, la structure de l’analyse dichotomique à un double niveau concernant l’argument de l’Apocalypse, peut être représentée de la manière suivante :

Figure 8. Structure de pôles duaux imbriqués Diachronie/Synchronie et Extension/Restriction pour l’Argument de l’Apocalypse

On le voit, les développements qui précèdent mettent en oeuvre la forme de contextualisme dialectique qui a été décrite plus haut, en l’appliquant à l’analyse de trois paradoxes philosophiques contemporains. Dans le paradoxe de Hempel, à la proposition (H*) se trouve associée la classe de référence des non-corbeaux, qui est elle-même susceptible d’être définie par rapport à ladualité extension/restriction. Or, pour un objet x donné tel qu’un parapluie gris, la définition de la classe de référence par extension donne lieu à un effet paradoxal, alors-même que le choix de cette dernière par restriction élimine un tel effet. En second lieu, les structures matricielles associées au paradoxe de l’examen-surprise sont analysées sous l’angle de la dualité conjoint/disjoint, mettant ainsi en évidence deux versions structurellement distinctes du paradoxe, qui admettent elles-mêmes deux résolutions indépendantes. Enfin, au niveau de l’argument de l’Apocalypse, une analyse dichotomique double met en évidence que la classe des humains est liée à la dualité extension/restriction, et que l’effet paradoxal qui est manifeste lorsque la classe de référence est définie par extension, se dissout dès lors que cette dernière est définie par restriction. En second lieu, il s’avère que la classe des modèles peut faire l’objet d’une définition selon la dualité synchronique/diachronique ; au point de vue synchronique se trouve associé un effet paradoxal, alors que ce même effet disparaît si l’on se place du point de vue diachronique.

Remerciements

Je suis très reconnaissant envers Pascal Engel à qui je dois l’inspiration de la rédaction de ce texte. Il a en effet été élaboré à partir d’éléments entièrement remaniés de mon mémoire d’habilitation à diriger les recherches, présenté en 2006, comportant notamment la correction d’une erreur conceptuelle, suivant en cela les commentaires et les recommandations que Pascal Engel m’avait faits à l’époque. Une version antérieure de ce texte a été incluse dans le Liber Amicorum dédié à Pascal Engel.


Références

Beck, Aaron, 1963, «Thinking and depression : Idiosyncratic content and cognitive distortions», Archives of General Psychiatry, vol. 9, p. 324-333.

Beck, Aaron, 1964, «Thinking and depression : Theory and therapy», Archives of General Psychiatry, vol. 10, p. 561-571.

Blair, J. Anthony, 1988, «What Is Bias ?» dans Trudy Govier dir., Selected Issues in Logic and Communication, Belmont CA, Wadsworth, p. 101-102).

Boulanger, Philippe, 2000, «Culture et nature», Pour la Science, vol. 273, p. 3.

Chalmers, David, 2002, «The St. Petersburg two-envelope paradox», Analysis, vol. 62, p. 155-157.

Eckhardt, William, 1993, «Probability Theory and the Doomsday Argument», Mind, vol. 102, p. 483-488.

Eckhardt, William, 1997, «A Shooting-Room view of Doomsday», Journal of Philosophy, vol. 94, p. 244-259.

Ellis, Albert, 1962, Reason and Emotion in Psychotherapy, New York, Lyle Stuart.

Franceschi, Paul, 1999, «Comment l’urne de Carter et Leslie se déverse dans celle de Carter», Canadian Journal of Philosophy, vol. 29, p. 139-156.

Franceschi, Paul, 2002, «Une classe de concepts», Semiotica, vol. 139 (1-4), p. 211-226.

Franceschi, Paul, 2005, «Une analyse dichotomique du paradoxe de l’examen surprise», Philosophiques, vol. 32-2, p. 399-421.

Franceschi, Paul, 2007, «Compléments pour une théorie des distorsions cognitives», Journal de Thérapie Comportementale et Cognitive,vol. 17-2, p. 84-88.

Franceschi, Paul, 2009, «A Third Route to the Doomsday Argument», Journal of Philosophical Research, vol. 34, p. 263-278.

Hall, Ned, 1999, «How to Set a Surprise Exam», Mind, vol. 108, p. 647-703.

Leslie, John, 1993, «Doom and Probabilities», Mind, vol. 102, p. 489-491.

Leslie, John, 1996, The End of the World : the science and ethics of human extinction, Londres, Routledge

Quine, Willard Van Orman, 1953, «On a So-called Paradox», Mind, vol. 62, p. 65-66.

Sorensen, Roy, 1988, Blindspots, Oxford, Clarendon Press.

Stuart Mill, John, 1985, On Liberty, Londres, Penguin Classics, original publication in 1859.

Walton, Douglas, 1997, «What is Propaganda, and What Exactly is Wrong with it», Public Affairs Quarterly, vol. 11, p. 383-413.

Walton, Douglas, 1999, One-Sided Arguments : A Dialectical Analysis of Bias, Albany, State University of New York Press.

Williamson, Timothy, 2000, Knowledge and its Limits, Londres & New York, Routledge.


1Une telle notion se trouve au coeur du concept de matrice de concepts introduit dans Franceschi (2002), dont on peut considérer qu’elle constitue le noyau, ou une forme simplifiée. Pour le présent exposé portant spécifiquement sur les éléments du contextualisme dialectique et leur application pour la résolution de paradoxes philosophiques, la présentation des pôles duaux se révèle suffisante.

2Plusieurs problèmes ouverts en résultent dans cette construction : (a) est-il possible de concevoir une liste qui soit exhaustive de telles dualités ? (b) existe-t-il une méthodologie pour produire une liste la plus exhaustive possible de ces dualités ?

3La présente construction s’applique également à des objets qui sont associés à plusieurs classes de référence. Nous nous limitons ici, dans un souci de simplification, à une seule classe de référence.

4Philippe Boulanger indique (correspondance personnelle) qu’il a entendu Stanislas Ulam développer ce point particulier lors d’une conférence à l’Université du Colorado.

5Une application de la présente construction aux distorsions cognitives, introduites par Aaron Beck (1963, 1964) dans les éléments constitutifs de la thérapie cognitive, est donnée dans Franceschi (2007). Les distorsions cognitives sont classiquement définies comme des raisonnements fallacieux jouant un rôle déterminant dans l’émergence d’un certain nombre de troubles mentaux. La thérapie cognitive en particulier se fonde sur l’identification de ces distorsions cognitives dans le raisonnement usuel du patient, et leur remplacement par des raisonnements alternatifs. Classiquement, les distorsions cognitives sont décrites comme l’un des douze modes de raisonnement irrationnel suivants : 1. Raisonnement émotionnel 2. Hyper-généralisation 3. Inférence arbitraire 4. Raisonnement dichotomique 5. Obligations injustifiées (Should statements, (Ellis 1962)) 6. Divination ou lecture mentale 7. Abstraction sélective 8. Disqualification du positif 9. Maximisation et minimisation 10. Catastrophisme 11. Personnalisation 12. Étiquetage.

6L’analyse de l’argument de l’Apocalypse du point de vue du problème de la classe de référence est effectuée de manière détaillée par Leslie (1996). Mais l’analyse de Leslie vise à montrer que le choix de la classe de référence, par extension ou par restriction, n’a pas d’incidence sur la conclusion de l’argument lui-même.

Compléments pour une théorie des distorsions cognitives

Un article paru dans le Journal de Thérapie Comportementale et Cognitive, 2007, 17-2, pages 1-6.


Compléments pour une théorie des distorsions cognitives

Paul Franceschi

résidence la Pietrina

avenue de la grande armée

20000 Ajaccio

France

Université de Corse

RÉSUMÉ La présente étude se propose de présenter un cadre conceptuel pour les distorsions cognitives, permettant notamment de préciser les relations entre ces dernières. Ce cadre conceptuel est destiné à s’insérer au sein de la thérapie cognitive. La présente analyse est basée sur les concepts fondamentaux suivants : la classe de référence, la dualité et le système de taxons. À l’aide de ces trois notions, chaque distorsion cognitive est ensuite définie. Une distinction est également opérée entre d’une part, les distorsions cognitives générales et d’autre part, les distorsions cognitives spécifiques. Le présent modèle permet de définir au sein d’un même cadre conceptuel les distorsions cognitives générales telles que le raisonnement dichotomique, la disqualification de l’un des pôles, la minimisation et la maximisation. Il permet également de décrire en tant que distorsions cognitives spécifiques : la disqualification du positif, l’abstraction sélective et le catastrophisme. En outre, le présent modèle permet de prédire l’existence de deux autres distorsions cognitives générales : l’omission du neutre et la requalification dans l’autre pôle.


Les distorsions cognitives, introduites par Aaron Beck (1963, 1964) sont classiquement définies comme des raisonnements fallacieux jouant un rôle déterminant dans l’émergence d’un certain nombre de troubles mentaux. La thérapie cognitive en particulier se fonde sur l’identification de ces distorsions cognitives dans le raisonnement usuel du patient, et leur remplacement par des raisonnements alternatifs. Classiquement, les distorsions cognitives sont décrites comme l’un des douze modes de raisonnement irrationnel suivants : 1. Raisonnement émotionnel 2. Hyper-généralisation 3. Inférence arbitraire 4. Raisonnement dichotomique 5. Obligations injustifiées (Should statements, (Ellis 1962)) 6. Divination ou lecture mentale 7. Abstraction sélective 8. Disqualification du positif 9. Maximisation et minimisation 10. Catastrophisme 11. Personnalisation 12. Etiquetage.

Sous leur forme classique qui est celle d’une énumération, les distorsions cognitives jouent un rôle essentiel au niveau de la thérapie cognitive. Pour cette raison, il apparaît qu’un cadre conceptuel, permettant notamment de définir les relations entre les différentes distorsions cognitives, pourrait également se révéler utile. Dans ce qui suit, nous nous attacherons à présenter une théorie générale des distorsions cognitives, qui procure un certain nombre de compléments par rapport à la théorie classique.

1. Notions principales

Le présent cadre permet de décrire un certain nombre de distorsions cognitives classiques : le raisonnement dichotomique, la disqualification de l’un des pôles, l’abstraction sélective, la minimisation et la maximisation. À celles-ci peuvent être ajoutées deux autres distorsions cognitives dont le présent modèle permet de prédire l’existence et qui sont étroitement apparentées aux distorsions cognitives classiques, bien qu’elles ne figurent pas, à la connaissance de l’auteur, au nombre de ces dernières. Il s’agit de l’omission du neutre et de la requalification dans l’autre pôle.

Les distorsions cognitives peuvent être construites, dans le présent modèle, à partir de trois notions principales : la classe de référence, la dualité et le système de taxons. Il convient, de manière préliminaire, de s’attacher à décrire ces trois notions. La classe de référence, en premier lieu, est constituée par un ensemble de phénomènes ou d’objets. Plusieurs exemples peuvent en être donnés : la classe composée des événements et des faits de la vie du patient ; la classe des événements futurs de la vie du patient ; la classe de référence constituée par l’ensemble des parties du corps du patient ; la classe qui est composée des traits de caractère du patient.

La notion de dualité, en second lieu, correspond à une paire de concepts telle que Positif/Négatif, Interne/Externe, Collectif/Individuel, Beau/Laid, etc. Une dualité correspond ainsi à un critère sous l’angle duquel les éléments de la classe de référence peuvent être appréhendés ou évalués. On peut dénoter par A/Ā une dualité donnée, où A et Ā constituent des concepts duaux. Une énumération (nécessairement partielle) des dualités est la suivante: Positif/Négatif, Interne/Externe, Quantitatif/Qualitatif, Visible/Invisible, Analytique/Synthétique, Absolu/Relatif, Abstrait/Concret, Statique/Dynamique, Unique/Multiple, Esthétique/Pratique, Précis/Vague, Fini/Infini, Simple/Composé, Individuel/Collectif, Implicite/Explicite, Volontaire/Involontaire.

Enfin, le système de taxons du patient consiste en une taxonomie qui permet au patient d’évaluer et de classifier les éléments de la classe de référence, selon le critère correspondant à une dualité donnée A/Ā. Les taxons peuvent être considérés comme “ce que peut voir” le patient. Il s’agit d’un système de valeurs qui lui est propre ou bien d’un filtre à travers lequel le patient “voit” les éléments de la classe de référence, c’est-à-dire les phénomènes ou les objets de la réalité. La figure ci-dessous représente un système de taxons optimal.

Fig.1. Le système de taxons optimal

Ce dernier est composé de 11 sphères qui représentent chacune un taxon donné. Le système de taxons est optimal, car tous les taxons sont présents. En revanche, si le patient ne possède pas certains taxons, il ne peut voir ni compter les éléments correspondants. Ainsi, s’il ne possède pas les taxons de la dualité A/Ā correspondants au pôle A, il ne peut voir les éléments correspondants. Ou de même, si le patient ne possède pas le taxon neutre, il ne peut voir les éléments neutres de la classe de référence. De manière formelle, on considère ainsi une série de n éléments E1, E2, …, En tels que chacun d’eux possède, de manière objective, un degré d[Ei] dans la dualité A/Ā compris entre -1 et 1 (d  [-1, +1]). On peut considérer ainsi une série comportant 11 éléments, E1, E2, …, E13, qui présentent un degré objectif croissant (le choix de 11 éléments est ici arbitraire, et tout autre nombre conviendrait également). On peut poser ainsi: d[E1] = -1, d[E2] = -4/5, d[E3] = -3/5, d[E4] = -2/5, d[E5] = -1/5, d[E6] = 0, d[E7] = 1/5, d[E8] = 2/5, d[E9] = 3/5, d[E10] = 4/5, d[E11] = 1. De même, on peut définir un degré subjectif [Ei] tel qu’il est attribué par le patient à chacun des Ei. Ainsi, E1-E5 correspond au pôle A de la dualité A/Ā, E6 au taxon neutre et E7-E11 au pôle Ā. En outre, ce système de taxons optimal peut être assimilé à un échelle de Likert à 11 degrés.

À ce stade, nous sommes en mesure de définir les principales distorsions cognitives, et il convient de les analyser tour à tour. Les distorsions cognitives peuvent être définies comme un type de raisonnement qui conduit à privilégier, sans fondement objectif, un sous-ensemble des taxons applicables à une dualité donnée, pour qualifier une classe de référence donnée. Il s’avère également utile de distinguer, de manière préliminaire, les distorsions cognitives générales et les distorsions cognitives spécifiques. Les distorsions cognitives générales concernent toutes les classes de référence et toutes les dualités. À l’inverse, les distorsions cognitives spécifiques sont des instances de distorsions cognitives générales qui sont inhérentes à une classe de référence et à une dualité données.

2. Les distorsions cognitives

2.1 Le raisonnement dichotomique

Dans le présent contexte, le raisonnement dichotomique (ou raisonnement tout ou rien) peut être défini comme une distorsion cognitive générale qui conduit le patient à n’appréhender une classe de référence qu’en fonction des taxons extrêmes correspondant à chaque pôle d’une dualité donnée. Avec ce type de raisonnement, le patient ignore totalement la présence de degrés ou d’étapes intermédiaires. Dans son système de taxons, le patient ne possède ainsi que les deux taxons extrêmes correspondant aux pôles A et Ā. Le défaut de cette manière d’appréhender les choses est que les faits ou les objets correspondant aux taxons intermédiaires ne sont pas pris en compte. Il en résulte ainsi un raisonnement sans nuances ni gradation, qui s’avère inadapté pour appréhender la diversité des situations humaines. De manière formelle, le raisonnement dichotomique consiste à ne prendre en compte que les éléments de la classe de référence tels que |d[Ei]| = 1, soit d[E1] = 1 ou d[E11] = -1, en ignorant tous les autres.

Fig.2. Le raisonnement dichotomique

2.2 La disqualification de l’un des pôles

Dans le présent modèle, la disqualification de l’un des pôles est la distorsion cognitive générale qui conduit à accorder une préférence arbitraire à l’un des pôles d’une dualité donnée, pour qualifier les éléments d’une classe de référence. Il s’agit ainsi du fait d’attribuer plus d’importance à l’un des pôles plutôt qu’à l’autre, en l’absence de motivation objective. Les taxons correspondant à l’un des pôles d’une dualité sont absents du système de taxons du patient. Ainsi, le patient ne voit les choses qu’à travers le prisme du pôle A (respectivement Ā), en méconnaissant totalement le point de vue du pôle opposé Ā (respectivement A). De manière formelle, la disqualification de l’un des pôles conduit à ne considérer que les Ei tels que d[Ei] ≤ 0 (respectivement d[Ei] ≥ 0), en ignorant les événements tels que d[Ei] > 0 (respectivement d[Ei] < 0).

Fig.3. La disqualification de l’un des pôles

Une instance de la disqualification d’un des pôles consiste dans la disqualification du positif. Cette dernière s’analyse, dans la présent contexte, en une instance spécifique de la disqualification d’un des pôles, qui s’applique à la dualité Positif/Négatif et à la classe de référence incluant les faits et les événements de la vie du patient. Le patient tend ainsi à ignorer les événements positifs, en considérant qu’ils ne comptent pas, pour telle ou telle raison. Une telle instance trouve à s’appliquer dans la thérapie cognitive de la dépression.

Une autre instance de la disqualification d’un des pôles s’applique également à la dualité Positif/Négatif et à la classe de référence qui inclut les traits de caractère du patient. Celui-ci ignore complètement les traits de caractère positifs (qualités) qui sont les siens et ne porte son attention que sur ses traits de caractère négatifs (défauts). Ceci l’incite ensuite à conclure qu’il ne “vaut rien”, qu’il “est nul”. Une telle instance s’applique également dans la thérapie cognitive de la dépression.

2.3 La focalisation arbitraire sur une modalité donnée

Un autre type de distorsion cognitive générale consiste dans la focalisation arbitraire sur une modalité appartenant à une dualité donnée. Dans le présent contexte, ce type de distorsion cognitive générale conduit à privilégier l’un des taxons dans le système de taxons du patient, en ignorant tous les autres. Dans la focalisation arbitraire, le taxon en question est présent dans le système de taxons du patient, et se trouve affecté à un élément unique de la classe de référence. Il y a occultation (en général temporaire) des autres taxons et des autres éléments de la classe de référence, de sorte que le patient est obsédé par cet élément.

Fig.4. La focalisation arbitraire

Une instance particulière de ce type de distorsion cognitive générale, se rapporte à la classe de référence des faits de la vie du patient, et à la dualité Positif/Négatif. Il s’agit d’une distorsion cognitive spécifique, qui consiste dans la focalisation sur un événement négatif de la vie du patient. Il s’agit là d’une des distorsions cognitives classiques, définie comme l’abstraction sélective (Mental filter), qui consiste dans le fait de sélectionner un détail à connotation négative et de focaliser sur ce dernier. De la sorte, le patient ne voit plus que ce détail, et sa vision de la réalité se trouve assombrie car elle est entièrement teintée de cet événement particulier. Une telle instance s’applique dans la thérapie cognitive de la dépression.

On peut mentionner également une autre instance de la focalisation arbitraire, qui s’applique de même à la dualité Positif/Négatif, mais se rapporte à la classe de référence composée des hypothétiques événements futurs de la vie du patient. Dans ce cas, le patient focalise sur la possible survenue d’un événement très négatif. Une telle instance trouve à s’appliquer dans la thérapie cognitive du trouble anxieux généralisé.

Une autre instance spécifique de la focalisation arbitraire s’applique à la dualité Beau/Laid et à une classe de référence qui s’identifie à l’ensemble des parties du corps du patient. Le patient focalise alors sur un détail de son anatomie qu’il considère comme laid. Le patient possède, dans son système de taxons, le taxon Laid en question. De plus, il attribue ce taxon à une partie unique de son corps, alors que tous les autres taxons sont temporairement occultés. Une telle distorsion cognitive spécifique trouve son application dans la thérapie cognitive du trouble dysmorphique corporel (Neziroglu et Yaryura-Tobias 1993, Veale et Riley 2001, Veale 2004).

2.4 L’omission du neutre

Le présent modèle conduit également à prédire l’existence d’un autre type de distorsion cognitive générale, qui consiste dans l’omission du neutre. Cette distorsion cognitive provient de l’absence, dans le système de taxons du patient, du taxon neutre. Il s’ensuit que les éléments de la classe de référence qui peuvent être objectivement définis comme neutres selon la dualité A/Ā, ne sont pas pris en compte par le patient. Formellement, le patient omet de considérer les Ei tels que d[Ei] = 0. L’omission du neutre revêt parfois un rôle important, notamment lorsqu’il existe une distribution gaussienne des éléments de la classe de référence, où les éléments qui se voient affecter le taxon neutre sont précisément ceux qui sont les plus nombreux.

Fig.5. L’omission du neutre

2.5 La requalification dans l’autre pôle

Le présent modèle conduit également à prédire l’existence d’un autre type de distorsion cognitive générale. Il s’agit du raisonnement qui consiste à requalifier un événement appartenant à une dualité donnée A, dans l’autre dualité Ā. Formellement, le degré subjectif attribué par le patient à l’événement E est l’inverse de son degré objectif, de sorte que: [E] = (-1) x d[E].

Fig.6. La requalification dans l’autre pôle

Une instance caractéristique de la requalification dans l’autre pôle consiste dans la distorsion cognitive spécifique qui s’applique à la classe des événements de la vie du patient et à la dualité Positif/Négatif. Ceci consiste typiquement à requalifier comme négatif un événement qui devrait être objectivement considéré comme positif. En requalifiant de manière négative des événements positifs, le patient peut parvenir à la conclusion que tous les événements de sa vie sont d’une nature négative. Par exemple, en considérant les événements de sa vie passée, le patient constate qu’il n’a commis aucun acte de violence. Il considère cela comme “suspect”. Ce type instance trouve également son champ d’application dans la thérapie cognitive de la dépression.

Une autre instance de la requalification dans l’autre pôle consiste dans la distorsion cognitive spécifique qui s’applique à la classe des parties du corps du patient et à la dualité Beau/Laid. Typiquement, le patient requalifie comme “laide” une partie de son corps qui est objectivement “belle”. Une telle distorsion cognitive spécifique est pertinente dans la thérapie cognitive du trouble dysmorphique corporel.

2.6 La minimisation ou la maximisation

Cette distorsion cognitive générale consiste à attribuer à un élément de la classe de référence, un taxon selon le critère de la dualité A/Ā qui s’avère inférieur (minimisation) ou supérieur (maximisation) à sa valeur objective. Il s’agit là d’une distorsion cognitive classique. Le degré subjectif [E] qui est attribué par le patient à un événement E diffère de manière significative de son degré objectif d[E]. Dans la minimisation, ce degré subjectif est nettement inférieur, de sorte que |[E]| < |d[E]|. Dans la maximisation, à l’inverse, le degré subjectif est nettement supérieur, tel que |[E]| > |d[E]|.

Fig.7. La maximisation et la minimisation

Une instance spécifique de la minimisation se rapporte à la classe des faits de la vie du patient et à la dualité Positif/Négatif. Le patient tend à considérer certains faits de son existence comme moins positifs qu’ils ne le sont en réalité. Dans la maximisation, il considère certains faits de sa vie comme plus négatifs qu’ils ne le sont véritablement. Dans le présent contexte, la distorsion cognitive classique de catastrophisme (ou dramatisation) peut être considérée comme une distorsion cognitive spécifique, qui consiste en une maximisation appliquée au pôle négatif de la dualité Positif/Négatif. Le patient attribue alors un degré subjectif [E] dans la dualité Positif/Négatif à un événement, alors que la valeur absolue de son degré objectif d[E] est très nettement inférieure. Une telle instance trouve à s’appliquer dans la thérapie cognitive de la dépression.

3. Conclusion

On le voit, la présente théorie fournit, par rapport à la théorie classique, un certain nombre d’éléments, qui permettent de définir et de classifier, au sein d’un même cadre conceptuel, les distorsions cognitives classiques. Ces dernières sont considérées ici, soit comme des distorsions cognitives générales, soit comme des distorsions cognitives spécifiques, c’est-à-dire des instances des distorsions cognitives générales s’appliquant à une classe de référence et à une dualité données. Ainsi, le raisonnement dichotomique, la maximisation et la minimisation constituent des distorsions cognitives générales. Et de même, la disqualification du positif, l’abstraction sélective, la focalisation négative et le catastrophisme constituent autant de distorsions cognitives spécifiques. En outre, la présente analyse a permis de décrire deux distorsions cognitives générales supplémentaires : l’omission du neutre et la requalification dans l’autre pôle.


Références

Beck AT. Thinking and depression: Idiosyncratic content and cognitive distortions. Archives of General Psychiatry, 1963, 9, 324-333.

Beck AT. Thinking and depression: Theory and therapy, Archives of General Psychiatry, 1964, 10, 561-571.

Ellis A. Reason and Emotion in Psychotherapy, Lyle Stuart, New York , 1962.

Neziroglu FA et Yaryura-Tobias JA. Exposure, response prevention, and cognitive therapy in the treatment of body dysmorphic disorder. Behavior Therapy, 1993, 24, 431-438.

Veale D., et Riley S. Mirror, mirror on the wall, who is the ugliest of them all? The psychopathology of mirror gazing in previous termbody dysmorphic disorder.next term. Behaviour Research and Therapy, 2001, 39, 1381-1393.

Veale D. Advances in a cognitive behavioural model of body dysmorphic disorder. Body Image, 2004, 1, 113-125.

L’argument de la Simulation et le problème de la classe de référence

L’argument de la Simulation et le problème de la classe de référence : le point de vue du contextualisme dialectique

Paul Franceschi

Université de Corse

Paul Franceschi

Fontaine du salario

Lieu-dit Morone

20000 Ajaccio

France

post-publication d’un article paru dans la revue Philosophiques, Volume 43, Numéro 2, Automne, 2016, p. 371–389

ABSTRACT. I present in this paper an analysis of the Simulation argument from a dialectical contextualist standpoint. This analysis is grounded on the reference class problem. I begin with describing Bostrom’s Simulation Argument step-by-step. I identify then the reference class within the Simulation argument. I also point out a reference class problem, by applying the argument successively to several references classes: aware-simulations, rough simulations and cyborg-type simulations. Finally, I point out that there are three levels of conclusion within the Simulation Argument, depending on the chosen reference class, that yield each final conclusions of a fundamentally different nature.

RESUMÉ. Je présente dans cet article une analyse de l’argument de la Simulation selon le point de vue du contextualisme dialectique, fondée sur le problème de la classe de référence. Je décris tout d’abord étape par étape l’argument de la Simulation. J’identifie ensuite la classe de référence et j’applique successivement l’argument à plusieurs classes de référence distinctes : les simulations conscientes de leur propre nature de simulation, les simulations grossières et les simulations de type cyborg. Finalement, je montre qu’il existe trois niveaux de conclusion dans l’argument de la Simulation, selon la classe de référence choisie, qui engendrent des conclusions finales d’une nature très différente.

1. L’argument de la Simulation

Je proposerai dans ce qui suit une solution pour résoudre le problème posé par l’argument de la Simulation, récemment décrit par Nick Bostrom (2003). Je m’attacherai tout d’abord à décrire en détail l’argument de la Simulation, en exposant notamment le problème qui lui est inhérent. Je montrerai ensuite comment une solution peut être apportée à un tel problème, fondée sur l’analyse de la classe de référence qui sous-tend SA, et sans qu’il soit nécessaire de renoncer à ses intuitions préthéoriques.

L’idée générale qui sous-tend l’argument de la Simulation (SA) peut être ainsi énoncée. Il est très probable que des civilisations post-humaines posséderont une puissance de calcul informatique tout à fait hors de proportion avec celle qui est la nôtre actuellement. Une telle puissance de calcul extraordinaire devrait leur conférer la capacité de réaliser des simulations humaines tout à fait réalistes, telles notamment que les habitants de ces simulations auraient une conscience de leur propre existence, en tous points similaire à la nôtre. Dans un tel contexte, on peut penser qu’il est probable que des civilisations post-humaines consacreront effectivement une partie de leurs ressources informatiques à réaliser des simulations des civilisations humaines qui les ont précédés. Dans ce cas, le nombre des humains simulés devrait très largement excéder celui des humains authentiques. Dans de telles conditions, le fait de prendre en compte le simple fait que nous existions conduit à la conclusion qu’il est plus probable que nous fassions partie des humains simulés, plutôt que des humains authentiques.

Bostrom s’attache également à décrire l’argument de la Simulation avec précision. Il souligne que l’argument de la Simulation est basé sur les trois hypothèses suivantes :

(1)l’humanité connaîtra une extinction prochaine
(2)les civilisations post-humaines ne réaliseront pas de simulations d’humains
(3)nous vivons actuellement dans une simulation réalisée par une civilisation post-humaine

La première étape du raisonnement consiste à considérer, par dichotomie, que soit (a) l’humanité connaîtra une extinction prochaine, soit (b) elle poursuivra son existence dans un lointain avenir. La première de ces deux hypothèses constitue la disjonction (1) de l’argument. On considère ensuite l’hypothèse selon laquelle l’humanité ne connaîtra pas une extinction prochaine et poursuivra ainsi son existence durant de nombreux millénaires. Dans un tel cas, on peut également considérer qu’il est probable que les civilisations post-humaines posséderont à la fois la technologie et les aptitudes nécessaires pour réaliser des simulations d’humains. Une nouvelle dichotomie se présente alors : soit (a) ces civilisations post-humaines ne réaliseront pas de telles simulations—il s’agit de la disjonction (2) de l’argument ; soit (b) ces civilisations post-humaines réaliseront effectivement de telles simulations. Dans ce dernier cas, il s’ensuivra que le nombre d’humains simulés excédera largement celui des humains. La probabilité de vivre dans une simulation sera donc beaucoup plus grande que celle de vivre dans la peau d’un humain ordinaire. Il s’ensuit alors la conclusion que nous autres, habitants de la Terre, vivons probablement dans une simulation réalisée par une civilisation post-humaine. Cette dernière conclusion constitue la disjonction (3) de l’argument. Une étape supplémentaire conduit alors à considérer qu’en l’absence d’élément probant en faveur de l’une ou l’autre d’entre elles, on peut considérer les hypothèses (1), (2) et (3) comme équiprobables.

L’argument de la Simulation peut être décrit étape par étape de la manière suivante :

(4)soit l’humanité connaîtra une extinction prochaine, soit l’humanité ne connaîtra pas une extinction prochainedichotomie 1
(1)l’humanité connaîtra une extinction prochainehypothèse 1.1
(5)l’humanité ne connaîtra pas une extinction prochainehypothèse 1.2
(6)les civilisations post-humaines seront capables de réaliser des simulations d’humainsde (5)
(7)soit les civilisations post-humaines ne réaliseront pas de simulations d’humains, soit elles en réaliserontdichotomie 2
(2)les civilisations post-humaines ne réaliseront pas de simulations d’humainshypothèse 2.1
(8)les civilisations post-humaines réaliseront des simulations d’humainshypothèse 2.2
(9)la proportion des humains simulés excédera très largement celle des humainsde (8)
(3)nous vivons actuellement dans une simulation réalisée par une civilisation post-humainede (9)
(10)en l’absence d’élément probant en faveur de l’une d’entre elles, les hypothèses (1), (2) et (3) sont équiprobablesde (1), (2), (3)

Il convient également de mentionner un élément qui résulte de l’interprétation-même de l’argument. Car ainsi que le précise Bostrom (2005), l’argument de la Simulation ne doit pas être mal interprété. Il ne s’agit pas en effet d’un argument qui conduit à la conclusion que (3) est vraie, à savoir que nous vivons actuellement dans une simulation réalisée par une civilisation post-humaine. Le noyau de l’argument de la Simulation réside ainsi dans le fait que les propositions (1), (2) ou (3) sont équiprobables.

Cette nuance d’interprétation étant mentionnée, l’argument de la Simulation ne manque pas cependant de poser un problème. Car l’argument conduit à la conclusion que l’une des propositions (1), (2) ou (3) au moins est vraie, et que dans la situation d’ignorance où nous nous trouvons, on peut les considérer comme équiprobables. Ainsi que Bostrom le note : “In the dark forest of our current ignorance, it seems sensible to apportion one’s credence roughly evenly between (1), (2) and (3).” (Bostrom 2003). Cependant, selon notre intuition pré-théorique, la probabilité de (3) est nulle ou au mieux extrêmement proche de 0. Ainsi, la conclusion de l’argument a pour conséquence de faire passer la probabilité que (3) soit vraie, de zéro à une probabilité d’environ 1/3. Ainsi, le problème posé par l’argument de la Simulation est précisément qu’il fait passer—via sa conclusion disjonctive—une probabilité nulle ou quasi-nulle concernant (3) à une probabilité beaucoup plus considérable d’environ 1/3. Car une probabilité de 1/3 pour les propositions (1) et (2) ne possède rien de choquant a priori, mais se révèle en revanche tout à fait contraire à l’intuition pour ce qui concerne la proposition (3). C’est en ce sens que l’on peut parler du problème posé par l’argument de la Simulation et de la nécessité de rechercher une solution à ce dernier.

De manière préliminaire, il convient de s’interroger sur ce qui constitue l’aspect paradoxal de SA. Qu’est-ce en effet qui confère une nature paradoxale à SA ? Car SA se distingue de la classe des paradoxes qui conduisent à une contradiction. Dans les paradoxes comme le Menteur ou bien le paradoxe sorite, le raisonnement correspondant conduit à une contradiction : le Menteur est à la fois vrai et faux. Dans le paradoxe sorite, un objet comportant un certain nombre de grains de sable est à la fois un tas et un non-tas. Rien de tel ne se manifeste au niveau de SA qui appartient, de ce point de vue, à une classe différente de paradoxes dont fait également partie l’argument de l’Apocalypse. Il s’agit en effet d’une classe de paradoxes dont la conclusion présente une nature contraire à l’intuition, et qui se place en conflit avec l’ensemble de nos croyances. Dans l’argument de l’Apocalypse, la conclusion selon laquelle la prise en considération de notre rang au sein de la classe des humains ayant jamais existé a pour effet qu’une apocalypse est beaucoup plus probable qu’on aurait pu l’envisager initialement, vient heurter l’ensemble de nos croyances. De manière similaire, ce qui apparaît finalement ici comme paradoxal, en première analyse, c’est que SA conduit à une probabilité de l’hypothèse selon laquelle nous vivons actuellement dans une simulation crée par des post-humains, qui est supérieure à celle qui résulte de notre intuition pré-théorique.

2. La classe de référence dans l’argument de la Simulation

La conclusion du raisonnement qui sous-tend SA, fondée sur le calcul du ratio futur entre les humains réels et les humains simulés, si elle se révèle contraire à l’intuition, résulte néanmoins d’un raisonnement qui apparaît a priori valide. Cependant, un tel raisonnement suscite une interrogation, qui se trouve liée à la classe de référence qui est inhérente à l’argument lui-même1. En effet, il s’avère que SA comporte, de manière indirecte, une classe de référence particulière, qui est celle des simulations d’humains. Mais qu’est-ce donc qui constitue une simulation ? L’argument original se réfère, de manière implicite, à une classe de référence qui est celle des simulations virtuelles d’humains, d’une très haute qualité et par nature indiscernables des humains authentiques. Toutefois, une certaine ambiguïté s’attache à la notion-même de simulation et la question se pose de l’applicabilité de SA à d’autres types de simulations d’humains2. On peut en effet concevoir des types de simulations quelque peu différents qui, de manière intuitive, entrent également dans le champ de l’argument.

Il est possible d’imaginer tout d’abord un type de simulations en tous points identiques à celles décrites dans l’argument original, c’est-à-dire quasiment indiscernables des humains authentiques, mais à la seule différence qu’elles seraient conscientes de leur propre nature de simulation. L’unique différence avec le type de simulation mis en scène dans l’argument original serait donc que ces dernières simulations auraient clairement conscience de ne pas être des humains authentiques. A priori, rien n’exclut que des post-humains choisissent de mettre en oeuvre de telles simulations et de manière intuitive, SA est susceptible de s’appliquer également à ce type particulier de simulations.

De même, de manière implicite, SA se réfère à des simulations sophistiquées, de très haute qualité, qui sont par nature indiscernables des humains authentiques. Cependant, on peut concevoir différents degrés dans la qualité des simulations humaines. Aussi la question se pose-t-elle notamment de savoir si l’on peut inclure dans la classe de référence de SA des simulations virtuelles qui seraient d’une qualité très légèrement inférieure ? Avec de telles simulations, la nature de simulation qui constitue leur identité profonde serait susceptible d’être un jour découverte par le sujet lui-même. Si l’argument doit s’appliquer à cette classe de simulations, la question est alors posée de son applicabilité à d’autres types de simulations de cette nature, car on peut concevoir de nombreux degrés intermédiaires entre d’une part, les simulations indiscernables et d’autre part, les simulations que nous sommes actuellement capables de réaliser, au moyen notamment des images de synthèse. Aussi, la question se pose-t-elle de savoir si la classe de référence de SA peut aller jusqu’à inclure les simulations de moindre qualité que celles évoquées dans l’argument original ?

Enfin, il apparaît que SA ‘fonctionne’ également si on l’applique à des humains, dont le cerveau est interfacé avec des uploads, des simulations de l’esprit humain incluant les événements mémorisés, les connaissances, les traits de personnalité, les modes de raisonnement, etc. propres à un individu. On peut imaginer en effet que dans un futur pas très lointain, l’émulation du cerveau humain pourrait être achevée (Moravec 1998, Sandberg & Bostrom 2008, De Garis et al. 2010), de sorte que la réalisation d’uploads pourrait devenir courante et être utilisée de manière intensive. Un très grand nombre d’uploads pourraient ainsi être réalisés et utilisés à des fins diverses : scientifiques, culturelles, sociales, utilitaires, etc. Si on assimile ainsi les uploads aux simulations de SA, l’argument fonctionne également. En un sens, les humains dotés d’uploads peuvent être considérés comme des simulations de nature partielle, qui ne concernent que le cerveau ou une partie du cerveau, alors même que le reste du corps humain demeure authentique et non simulé. Dans un tel cas, les humains dont le cerveau seul est simulé à l’aide d’un upload, peuvent être assimilés à un type particulier de cyborgs. On peut ainsi se poser la question générale de savoir dans quelle mesure la classe des simulations de SA peut être étendue aux simulations partielles et aux types de cyborgs qui viennent d’être décrits. On peut concevoir en effet des cyborgs de différents types, selon les parties du corps et les organes de remplacement ou de substitution qui sont les leurs. Aussi la question se pose-t-elle de savoir jusqu’à quel point SA s’applique également à ce type de cyborgs ?

On le voit, la question-même de la définition de la classe de référence pour SA conduit à s’interroger sur l’inclusion ou non dans le champ de SA de plusieurs types de simulations. Sans prétendre à l’exhaustivité, on peut mentionner à ce stade, parmi ces dernières : les simulations conscientes, les simulations plus ou moins grossières et les simulations partielles de type cyborg. La question de la définition de la classe de référence pour SA apparaît ainsi étroitement liée à la nature de la future taxinomie des êtres et des créatures qui peupleront la Terre dans un futur proche ou éloigné.

À ce stade, il s’avère en première approche que les types de simulations d’humains présentent une nature assez variée, et que l’on peut définir la classe de référence des simulations de différentes manières. On pourrait ainsi choisir la classe de référence de manière plus ou moins restrictive ou plus ou moins extensive. Dans ce contexte, il s’avère nécessaire d’analyser de manière plus approfondie les conséquences de l’un ou l’autre choix.

3. Le problème de la classe de référence : le cas des simulations conscientes

À ce stade, on ne peut encore véritablement parler de problème de la classe de référence au sein de SA. Pour cela en effet, il convient de montrer que le choix de l’une ou l’autre classe de référence a des conséquences tout à fait différentes au niveau de l’argument, et en particulier que la nature de sa conclusion s’en trouve modifiée de manière fondamentale. Dans ce qui suit, nous nous attacherons désormais à montrer que selon que l’on choisit l’une ou l’autre classe de référence, des conclusions radicalement différentes s’ensuivent au niveau de l’argument lui-même et que par conséquent, il existe bien un problème de classe de référence au sein de SA. Nous considérerons pour cela successivement plusieurs classes de référence, en nous attachons à montrer comment des conclusions de nature fondamentalement différente en résultent au niveau de l’argument lui-même.

La version originale de SA met en scène, de manière implicite, des simulations d’humains d’un certain type. Il s’agit de simulations de type virtuel, quasiment indiscernables pour nous-mêmes et qui présentent ainsi un degré de sophistication très élevé. Plus encore, il s’agit d’un type de simulations qui n’ont pas conscience qu’elles sont elles-mêmes simulées et qui sont donc persuadées d’être des humains authentiques. Ceci résulte implicitement des termes de l’argument lui-même et en particulier, de l’inférence de (9) à (3) qui conduit à conclure que ‘nous’ vivons actuellement dans une simulation indiscernable réalisée par des post-humains. De fait, il s’agit de simulations qui sont en quelque sorte abusées et trompées par les post-humains en ce qui concerne leur identité véritable. Pour les besoins de la présente discussion, nous dénommerons quasi-humains les humains simulés qui n’ont pas conscience qu’ils le sont.

À ce stade, il s’avère que l’on peut également concevoir des simulations indiscernables qui présentent un degré tout à fait identique de sophistication mais qui, à l’inverse, auraient conscience qu’elles sont simulées. Nous appellerons ainsi quasi-humains+ des humains simulés ayant conscience qu’ils sont eux-mêmes des simulations. De telles simulations sont en tous points identiques aux quasi-humains auxquels SA se réfère de manière implicite, à la seule différence qu’elles sont cette fois clairement conscientes de leur nature intrinsèque de simulation. De manière intuitive, SA s’applique également à ce type de simulation. A priori, on ne possède pas de justification pour écarter un tel type de simulation. Plus encore, plusieurs raisons conduisent à penser que les quasi-humains+ pourraient être plus nombreux que les quasi-humains. Pour des raisons éthiques (a) tout d’abord, on peut penser que les post-humains pourraient être enclins à préférer les quasi-humains+ aux quasi-humains. Car le fait de conférer une existence aux quasi-humains constitue une tromperie sur leur identité véritable, alors qu’un tel inconvénient est absent lorsqu’il s’agit des quasi-humains+. Une telle tromperie pourrait raisonnablement être considérée comme non-éthique et conduire à une forme ou une autre d’interdiction des quasi-humains. Une autre raison (b) milite pour le fait de ne pas écarter, a priori, les simulations d’humains ayant conscience de leur propre nature de simulation. En effet, on peut penser que le niveau d’intelligence acquis par certains quasi-humains dans un futur proche pourrait être extrêmement élevé et faire que dans ce cas, les simulations deviendraient très rapidement conscientes qu’elles sont elles-mêmes des simulations. On peut penser qu’à partir d’un certain degré d’intelligence, et en particulier celui susceptible d’être obtenu par l’humanité dans un futur pas très éloigné (Kurtzweil 2000, 2005, Bostrom 2006), les quasi-humains devraient être à même—au moins beaucoup plus facilement qu’actuellement—de recueillir les preuves qu’ils sont l’objet d’une simulation. Plus encore, le concept-même de ‘simulation non-consciente qu’elle est une simulation’ pourrait être entaché de contradiction, car il faudrait alors limiter son intelligence et dès lors, il ne s’agirait plus une simulation indiscernable et suffisamment réaliste. Ces deux raisons inclinent à penser que les quasi-humains+ pourraient bien exister en plus grand nombre que les quasi-humains.

À ce stade, il s’avère nécessaire d’envisager les conséquences de la prise en compte des quasi-humains+ au sein de la classe de référence des simulations inhérente à SA. Pour cela, considérons tout d’abord la variation de SA (dénommons-la SA*) qui s’applique, de manière exclusive, à la classe des quasi-humains+. Un tel choix, tout d’abord, n’a pas de conséquence sur la disjonction (1) de SA, qui se réfère à une possible disparition prochaine de notre humanité. Cela n’a pas d’effet non plus sur la disjonction (2), selon laquelle les post-humains ne réaliseront pas de quasi-humains+, c’est-à-dire de simulations conscientes d’êtres humains. En revanche, le choix d’une telle classe de référence a une conséquence directe sur la disjonction (3) de SA. Certes, il s’ensuit, de la même manière que pour l’argument original, la conclusion de premier niveau selon laquelle le nombre des quasi-humains+ excédera largement le nombre des humains authentiques (la disproportion). Cependant, il ne s’ensuit plus désormais la conclusion de second niveau selon laquelle ‘nous’ sommes actuellement des quasi-humains+. En effet, une telle conclusion (appelons-la l’auto-applicabilité) ne s’applique plus à nous désormais, puisque que nous n’avons pas conscience d’être simulés et sommes tout à fait convaincus d’être des humains authentiques. En effet, ce qui constitue la conclusion inquiétante de SA ne résulte plus désormais de l’étape (9), puisque nous ne pouvons nous identifier aux quasi-humains+, ces derniers ayant clairement conscience qu’ils évoluent dans une simulation. Ainsi, à la différence de la version originale de SA basée sur la classe de référence qui associe les humains aux quasi-humains, cette nouvelle version associant les humains et les quasi-humains+, n’est pas associée à une telle conclusion inquiétante. La conclusion qui s’ensuit désormais, on le voit, s’avère tout à fait rassurante, et en tout état de cause très différente de celle, profondément inquiétante, qui résulte de l’argument original.

À ce stade, il apparaît qu’une question se pose : doit-on identifier, dans le contexte de SA, la classe de référence aux quasi-humains ou bien aux quasi-humains+ ? Il s’avère qu’aucun élément objectif, dans l’énoncé de SA, ne vient conforter le choix a priori des quasi-humains ou des quasi-humains+. Ainsi, toute version de l’argument qui comporte le choix préférentiel des quasi-humains ou bien des quasi-humains+ apparaît comme comportant un biais. Tel est ainsi le cas pour la version originale de SA, qui comporte ainsi un biais en faveur des quasi-humains, qui résulte du choix par Bostrom d’une classe des simulations qui s’assimile exclusivement à des quasi-humains, c’est-à-dire à des simulations non-conscientes de leur nature de simulation et qui sont par conséquent abusées et trompées par les post-humains sur la nature-même de leur identité. Et tel est également le cas pour SA* la version alternative de SA qui vient d’être décrite, qui comporte un biais particulier en faveur des quasi-humains+, des simulations conscientes de leur propre nature de simulation. Cependant, le choix de la classe de référence se révèle ici fondamental, car il comporte une conséquence essentielle : si l’on choisit une classe de référence qui associe les humains aux quasi-humains, il en résulte la conclusion inquiétante que nous vivons actuellement très probablement dans une simulation. En revanche, si l’on choisit une classe de référence qui associe les humains aux quasi-humains+, il s’ensuit un scénario qui de manière rassurante, ne comporte pas une telle conclusion. À ce stade, il apparaît bien que le choix des quasi-humains, c’est-à-dire à des simulations non-conscientes, dans la version originale de SA, au détriment des simulations conscientes, constitue un choix arbitraire. En effet, qu’est-ce qui permet de préférer le choix des quasi-humains, par rapport aux quasi-humains? Une telle justification fait défaut dans le contexte de l’argument. À ce stade, il s’avère que l’argument original de SA comporte un biais qui conduit au choix préférentiel des quasi-humains, et à la conclusion alarmante qui lui est associée. Cette remarque étant faite, il convient désormais d’envisager le problème sous une perspective plus large encore, en prenant en considération d’autres types possibles de simulations.

4. Le problème de la classe de référence : le cas des simulations grossières

Le problème de la classe de référence dans SA porte, ainsi que cela a été mentionné plus haut, sur la nature-même et le type des simulations mises en oeuvre dans l’argument. Ce problème se limite-t-il au choix préférentiel, au niveau de l’argument original, des simulations non-conscientes, au détriment du choix alternatif des simulations conscientes, qui correspondent à des simulations très sophistiquées d’humains, capables de créer l’illusion, mais dotées de la conscience qu’elles sont elles-mêmes des simulations ? Il apparaît que non. En effet, comme cela a été évoqué plus haut, on peut également concevoir d’autres types de simulations pour lesquelles l’argument fonctionne également, mais qui se révèlent d’une nature quelque peu différente. En particulier, on peut concevoir que les post-humains conçoivent et implémentent des simulations identiques à celles de l’argument original, mais qui ne présentent toutefois pas un caractère aussi parfait. Une telle situation présente un caractère tout à fait vraisemblable et ne présente pas les inconvénients d’ordre éthique qui pourraient accompagner les simulations indiscernables mises en scène dans l’argument original. Le choix de réaliser ce type de simulations pourrait résulter du niveau technologique nécessaire, ou bien de choix délibérés et pragmatiques, destinés à faire économiser du temps et des ressources. On peut ainsi concevoir différents degrés dans la réalisation d’un tel type de simulations. Il pourrait s’agir par exemple de simulations de très bonne qualité dont nos scientifiques actuels ne pourraient déterminer la nature artificielle qu’après, par exemple, dix années de recherche. Mais de manière alternative, de telles simulations pourraient être de qualité moyenne, voire plutôt grossières, par rapport aux simulations quasiment indiscernables évoquées plus haut. Pour les besoins de la présente discussion, nous appellerons toutefois simulations grossières l’ensemble de cette catégorie de simulations.

Quelles sont donc les conséquences sur SA de la prise en compte d’une classe de référence qui s’assimile à des simulations grossières ? Dans de telles circonstances, un grand nombre de telles simulations seraient détectables par nous humains. Dans ce cas, la conséquence de premier niveau fondée sur la disproportion humains/simulations s’applique toujours, de la même manière que pour l’argument original. En revanche, la conclusion de second niveau fondée sur l’auto-applicabilité ne s’applique plus désormais. Nous ne pouvons plus conclure désormais que ‘nous’ sommes des simulations, puisqu’en présence de telles simulations, nous nous apercevrions rapidement qu’il s’agit d’humains simulés et non d’humains réels. Aussi, dans un tel cas, il s’avère que la conclusion alarmante inhérente à la version originale de SA et fondée sur l’auto-applicabilité ne s’applique plus désormais. Une conclusion rassurante s’y substitue en effet, fondée sur le fait que nous humains n’appartenons pas à ce type de simulations.

À ce stade, il apparaît que SA, dans sa version originale, opte pour le choix préférentiel de simulations très sophistiquées, indétectables par nous autres humains et non-conscientes de leur nature de simulation. Mais ainsi que cela vient d’être évoqué, on peut concevoir d’autres types de simulations, de nature plus grossière, pour lesquelles l’argument s’applique également. Jusqu’à quel niveau de simulation détectable peut-on aller ? Doit-on aller jusqu’à inclure dans la classe de référence, à un niveau d’extension plus élevé, des simulations assez grossières, telles que par exemple des versions améliorées des simulations que nous sommes d’ores et déjà capables de réaliser à l’aide d’images de synthèse ? Dans ce cas, cela conduit à une formulation quelque peu différente de l’argument orignal, car nous pouvons alors assimiler la classe des post-humains aux humains qui vivront sur Terre dans dix ans, voire dans un an, ou même—à un niveau d’extension plus grand encore—dans un mois. Dans cas, la disjonction (1) selon laquelle les humains ne parviendront pas jusqu’à cette époque ne vaut plus, puisqu’un tel niveau technologique a d’ores et déjà été atteint. De même, la disjonction (2) n’a plus non plus de raison d’être, puisque nous réalisons déjà de telles simulations grossières. Ainsi, il ne subsiste dans ce cas que la disjonction (3), qui constitue alors la proposition unique qui sous-tend l’argument et constitue la conclusion de premier niveau de SA, selon laquelle le nombre des humains simulés excédera largement celui des humains authentiques. Dans ce cas, il s’ensuit bien, de manière identique à l’argument original, la conclusion de premier niveau selon laquelle le nombre des quasi-humains+ excédera largement le nombre des humains authentiques (la disproportion). Mais là aussi, il ne s’ensuit plus désormais la conclusion de second niveau selon laquelle ‘nous’ sommes actuellement des quasi-humains+ (l’auto-applicabilité). Cette dernière ne s’applique plus à nous désormais et une conclusion de nature rassurante s’y substitue, puisque que nous avons clairement conscience de ne pas être de telles simulations grossières.

5. Le problème de la classe de référence : le cas des cyborgs

Ainsi que cela a été évoqué plus haut, une autre question qui se pose est celle de savoir si la classe de référence peut être étendue aux cyborgs et en particulier à cette catégorie de cyborgs qui sont indiscernables des humains. On peut en effet concevoir différents types de cyborgs, allant de ceux pour lesquels quelques parties du corps ont été remplacées par des organes de synthèse de substitution ou plus performants, à ceux pour lesquels la quasi-totalité des organes—y compris le cerveau—a été remplacée. A priori, une telle classe entre également dans le champ de l’argument. Ici, l’argument s’applique naturellement aux cyborgs élaborés, indiscernables des humains, pour lesquels une grande partie des organes d’origine ont été remplacés ou transformés. En particulier, les cyborgs pour lesquels une partie du cerveau a été remplacée par un uploadpartiel ou non—entre naturellement dans le champ de l’argument. Les uploads partiels sont ceux pour lesquels une partie seulement des données du cerveau a été remplacée par un upload. De même, on peut imaginer de nombreux types d’uploads de ce genre : ainsi des uploads qui reconstituent la mémoire en restaurant les événements oubliés peuvent être envisagés. Ils peuvent se révéler utiles non seulement pour les personnes en bonne santé, mais également pour celles qui souffrent de maladies dans lesquelles les fonctions de la mémoire sont altérées. On peut concevoir que de tels types d’uploads partiels pourront être mis en œuvre dans un futur plus ou moins proche (Moravec 1998, Kurzweil 2005, De Garis et al. 2010). Et de la même manière que pour l’argument original, on peut concevoir que des quantités très grandes de ces uploads puissent être réalisées par les moyens informatiques. De manière générale, il s’avère que la discussion sur l’inclusion des cyborgs au sein de la classe de référence de SA possède son importance, car si l’on considère la classe des cyborgs dans un sens étendu, nous sommes déjà pratiquement tous des cyborgs. Si l’on considère en effet que des organes ou des parties du corps humains ont été remplacés ou améliorés afin qu’ils fonctionnent correctement font de nous des cyborgs, tel est aujourd’hui déjà le cas, compte tenu de la généralisation des dents synthétiques, pacemakers, prothèses, etc. Ainsi la question se trouve-t-elle posée de savoir jusqu’à quel degré on peut inclure certains types de cyborgs dans le champ de l’argument.

Quel serait donc l’effet sur SA de la prise en compte de la classe des cyborgs partiels, si l’on se place à un tel degré d’extension ? De même que pour les simulations grossières, il s’avère que la disjonction (1) selon laquelle les humains ne parviendront pas jusqu’à cette époque ne vaut plus alors, puisqu’un tel palier technologique est d’ores et déjà atteint. De manière identique, la disjonction (2) ne se justifie plus non plus, puisque dans un tel contexte, nous sommes déjà quasiment tous de tels cyborgs partiels. Ainsi, il ne subsiste dans ce cas que la disjonction (3) en tant que proposition unique, mais qui se présente toutefois sous une forme différente de celle de l’argument original. En effet, la conséquence de premier niveau fondée sur la disproportion humains/simulations s’applique ici également, de la même manière que pour l’argument original. En outre, et c’est là une différence importante, la conclusion de second niveau fondée sur l’auto-applicabilité s’applique également, puisque nous pouvons en conclure que ‘nous’ sommes également, dans ce sens étendu, des simulations. En revanche, il ne s’ensuit plus la conclusion alarmante, qui est celle de l’argument original et qui se manifeste à un troisième niveau, que nous sommes des simulations non-conscientes, puisque le fait que nous soyons en ce sens des simulations n’implique pas ici que nous soyons trompés sur notre identité première. Ainsi s’ensuit-il finalement, à la différence de l’argument orignal, une conclusion rassurante : nous sommes des simulations, qui sont elles-mêmes tout à fait conscientes de leur propre nature de cyborgs partiels.

Ce qui précède montre également qu’en examinant SA avec attention, on constate que l’argument recèle une seconde classe de référence. Cette seconde classe de référence est celle des posthumains. Qu’est-ce donc qu’un post-humain ? Doit-on assimiler cette classe aux civilisations très largement supérieures à la nôtre, à celles qui évolueront au XXVème siècle ou bien au XLIIIème siècle ? Les descendants de notre actuelle race humaine qui vivront au XXIIème siècle doivent-ils être comptés parmi les post-humains ? Le fait que des évolutions importantes liées à l’accroissement de l’intelligence humaine (Moravec 1998, Kurzweil 2005) puissent survenir dans un futur plus ou moins proche, constitue notamment un argument qui milite dans ce sens. Mais doit-on aller jusqu’à inclure les descendants des humains actuels qui vivront sur Terre dans 5 ans ? De telles questions sont posées et nécessitent une réponse. La question de savoir comment on doit définir les post-humains, constitue ainsi également un élément du problème de la classe de référence de SA. En tout état de cause, la définition de la classe des post-humains apparaît étroitement liée à celle des simulations. Car si l’on s’intéresse, dans un sens étendu, à des cyborgs à peine plus évolués que nous le sommes dans un certain sens, alors les post-humains peuvent être assimilés à la prochaine génération d’humains. Il en va de même si l’on considère des simulations grossières améliorées par rapport à celles que nous sommes actuellement capables de produire. En revanche, si l’on considère, dans un sens plus restrictif, des simulations d’humains complètement indiscernables pour notre humanité actuelle, il convient alors de s’intéresser à des post-humains d’une époque nettement plus lointaine. En tout état de cause, il apparaît ici que la classe de référence des post-humains, ainsi que la classe des simulations à laquelle elle est associée, peut être choisie à différentes niveaux de restriction ou d’extension.

6. Les différents niveaux de conclusion selon la classe de référence choisie

Finalement, la discussion qui précède met l’accent sur le fait que si on considère SA à la lumière du problème de la classe de référence qui lui est inhérente, il existe en réalité plusieurs niveaux dans la conclusion de SA : (C1) la disproportion ; (C2) l’auto-applicabilité ; (C3) la non-conscience (le fait inquiétant que nous soyons trompés, dupés sur notre identité première). En fait, la discussion précédente montre que (C1) est vrai quelle que soit la classe de référence choisie (par restriction ou par extension) : les quasi-humains, les quasi-humains+, les simulations grossières et les simulations de type cyborg. En outre, (C2) est également vrai pour la classe de référence originale des quasi-humains et pour celle des simulations de type cyborg, mais se révèle toutefois faux pour la classe des quasi-humains+ et aussi pour celle des simulations grossières. Enfin, (C3) est vrai pour la classe de référence originale des quasi-humains, mais se révèle faux pour les quasi-humains+, les simulations grossières et les simulations de type cyborg. Ces trois niveaux de conclusion sont représentés sur le tableau ci-dessous :

niveauconclusioncasquasi-humainsquasi-humains+simulations grossièressimulations de type cyborg
C1la proportion des humains simulés excédera largement celle des humains (disproportion)C1Avraivraivraivrai
la proportion des humains simulés n’excédera pas largement celle des humainsC1Āfauxfauxfauxfaux
C2nous sommes très probablement des simulations (auto-applicabilité)C2Avraifauxfauxvrai
nous ne sommes très probablement pas des simulationsC2Āfauxvraivraifaux
C3nous sommes des simulations inconscientes de leur nature de simulation (non-conscience)C3Avraifauxfauxfaux
nous ne sommes pas des simulations inconscientes de leur nature de simulationC3Āfauxvraivraivrai

Figure 1. Les différents niveaux de conclusion dans SA

ainsi que sur l’arborescence suivante :

Figure 2. Arbre des différents niveaux de conclusion de SA

Alors-même que la conclusion originale de SA laisse penser qu’il n’existe qu’un seul niveau de conclusion, il s’avère cependant, ainsi que cela vient d’être mis en lumière, qu’il existe en réalité plusieurs niveaux de conclusion dans SA, dès lors qu’on examine l’argument selon une perspective plus large, à la lumière du problème de la classe de référence. La conclusion de l’argument original est elle-même inquiétante et alarmante, en ce sens qu’elle conclut à une probabilité beaucoup plus forte que nous ne l’avions imaginé a priori, que nous soyons des humains simulés à leur insu. Une telle conclusion résulte du chemin C1-C1A-C2-C2A-C3-C3A de l’arbre ci-dessus. Cependant, l’analyse qui précède montre que selon la classe de référence choisie, des conclusions de nature très différente peuvent être inférées par l’argument de la simulation. Ainsi, une conclusion de nature tout à fait différente est associée au choix de la classe de référence des quasi-humains+, mais aussi à celle des simulations grossières. La conclusion qui en résulte est que nous ne sommes pas de telles simulations (C2Ā). Cette dernière conclusion est associée au chemin C1-C1A-C2-C2Ā dans l’arbre ci-dessus. Enfin, une autre conclusion possible, elle-même associée au choix de la classe des simulations de type cyborg, est que nous faisons partie d’une telle classe de simulation, mais que nous en avons conscience et que cela ne présente donc rien d’inquiétant (C3Ā). Cette dernière conclusion est représentée par le chemin C1-C1A-C2-C2A-C3-C3Ā.

L’analyse qui précède met finalement en lumière ce qui pêche dans la version originale de SA. L’argument original focalise en effet sur la classe des simulations non-conscientes de leur propre nature de simulation. Il s’ensuit la succession de conclusions selon lesquelles il existera une plus grande proportion d’humains simulés que d’humains authentiques (C1A), que nous faisons partie des humains simulés (C2A) et finalement que nous sommes, plus probablement que nous ne l’aurions imaginé a priori, des humains simulés non-conscients de l’être (C3A). Cependant, ainsi que cela a été évoqué plus haut, la notion-même de simulation d’humains—elle-même associée à la classe des post-humains—se révèle ambiguë, et une telle classe peut en réalité être définie de différentes manières, compte tenu qu’il n’existe pas, dans SA, un critère objectif permettant de choisir une telle classe d’une manière qui ne soit pas arbitraire. En effet, on peut choisir la classe de référence par restriction, en identifiant les simulations à des quasi-humains, ou à des quasi-humains; dans ce cas, les post-humains sont ceux auxquels se réfère l’argument orignal, d’une époque beaucoup plus avancée que la nôtre. En revanche, si on se place à un certain niveau d’extension, les simulations s’assimilent à des simulations moins parfaites que celles de l’argument original, ainsi que celles de type cyborg comportant des uploads évolués ; dans un tel cas, les post-humains associés sont ceux d’une époque moins éloignée. Enfin, si on effectue le choix de la classe de référence à un niveau plus grand d’extension, les simulations sont des simulations grossières, à peine meilleures que nous sommes actuellement capables de réaliser, ou bien des simulations de type cyborgs avec un degré d’intégration de parties simulées légèrement supérieur à celui que nous connaissons actuellement ; dans un tel cas, la classe des post-humains associée est celle des humains qui nous succéderont d’ici quelques années. On le voit, on peut effectuer le choix de la classe de référence qui sous-tend SA à différents niveaux de restriction ou d’extension. Mais selon que la classe sera choisie à tel ou tel niveau de restriction ou d’extension, une conclusion tout à fait différente s’ensuivra. Ainsi, le choix par restriction de simulations parfaites et non-conscientes de leur nature de simulation, comme le fait l’argument original, conduit à une conclusion inquiétante. En revanche, le choix à un niveau d’extension un peu plus grand, de simulations parfaites mais conscientes de leur nature de simulation, conduit à une conclusion rassurante. Et de même, le choix, à un niveau d’extension plus grand encore, des simulations grossières ou des simulations de type cyborg, entraîne également une conclusion rassurante. Ainsi, l’analyse qui précède montre que dans la version originale de SA, le choix se porte de manière préférentielle, par restriction, sur la classe de référence des quasi-humains, à laquelle est associée une conclusion inquiétante, alors-même qu’un choix par extension, prenant en compte les quasi-humains+, les simulations grossières, les simulations de type cyborg, etc., conduit à une conclusion rassurante. Finalement, le choix préférentiel dans l’argument original de la classe des quasi-humains, apparaît ainsi comme un choix arbitraire que rien ne vient justifier, alors-même que d’autres choix possèdent une égale légitimité. Car l’énoncé de SA ne comporte aucun élément objectif permettant d’effectuer le choix de la classe de référence d’une manière non-arbitraire. Dans ce contexte, la conclusion inquiétante associée à l’argument original apparaît également comme une conclusion arbitraire, alors-même qu’il existe plusieurs autres classes de référence qui possèdent un degré égal de pertinence vis-à-vis de l’argument lui-même, et desquelles découlent une conclusion tout à fait rassurante3.


Références

Bostrom, N. (2003) Are You a Living in a Computer Simulation?, Philosophical Quarterly, 53, 243-55

Bostrom, N. (2005) Reply to Weatherson, Philosophical Quarterly, 55, 90-97

Bostrom, N. (2006) ‘How long before superintelligence?’, Linguistic and Philosophical Investigations, 5-1, 11—30

De Garis, H.D., Shuo, C., Goertzel, B., Ruiting, L. (2010) A world survey of artificial brain projects, part i: Large-scale brain simulations, Neurocomputing, 74(1-3), 3-29

Eckhardt, W. (1993) ‘Probability Theory and the Doomsday Argument’, Mind, 102, 483-88

Eckhardt, W. (1997) ‘A Shooting-Room View of Doomsday’, Journal of Philosophy, 94, 244-259

Eckhardt, W. (2013) Paradoxes in probability Theory, Dordrecht, New York : Springer

Franceschi, P. (2009) A Third Route to the Doomsday Argument, Journal of Philosophical Research, 34, 263-278, traduction en français

Franceschi, P. (2014) Eléments d’un contextualisme dialectique, dans Liber Amicorum Pascal Engel, édité par J. Dutant, D. Fassio & A. Meylan, 581-608, English translation under the title Elements of Dialectical Contextualism, cogprints.org/9225

Kurzweil, R. (2000) The Age of Spiritual Machines: When Computers Exceed Human Intelligence, New York & London: Penguin Books

Kurzweil, R. (2005) The Singularity is Near, New York : Viking Press

Moravec, H. (1998) When will computer hardware match the human brain?, Journal of Evolution and Technology, vol. 1

Sandberg, A & Bostrom, N. (2008) Whole Brain Emulation: a Roadmap, Technical Report #2008-3, Future of Humanity Institute, Oxford University

1 William Eckhardt (2013, p. 15) considère que—de manière identique à l’argument de l’Apocalypse (Eckhardt 1993, 1997, Franceschi 2009)— le problème inhérent à SA provient de l’usage de la rétro-causalité et du problème lié à la définition de la classe de référence : ‘if simulated, are you random among human sims? hominid sims? conscious sims?‚’.

2 Nous laisserons de côté ici la question de savoir si l’on doit prendre en compte un nombre infini d’humains simulés. Tel pourrait être le cas si le niveau ultime de réalité était abstrait. Dans ce cas, la classe de référence pourrait inclure des humains simulés qui s’identifient, par exemple, à des matrices de très grands nombres entiers. Mais Bostrom répond à une telle objection dans sa FAQ (www.simulation-argument.com/faq.html) et indique que dans ce cas, les calculs ne valent plus (le dénominateur est infini) et le ratio n’est pas défini. Nous laisserons donc de côté cette hypothèse, en concentrant notre argumentation sur ce qui constitue le cœur de SA, c’est-à-dire le cas où le nombre de simulations d’humains est fini.

3 La présente analyse constitue une application directe à l’argument de la Simulation de la forme de contextualisme dialectique décrit dans Franceschi (2014).

Une troisième voie pour l’argument de l’Apocalypse

Une troisième voie pour l’argument de l’Apocalypse

Paul Franceschi

Université de Corse

à paraître dans le Journal of Philosophical Research

Dans ce qui suit, je m’attacherai à présenter une solution au problème posé par l’argument de l’Apocalypse (DA, dans ce qui suit). La solution ainsi décrite constitue une troisième voie, par rapport à d’une part, l’approche qui est celle des promoteurs de DA (Leslie 1993, 1996) et d’autre part, la solution préconisée par ses détracteurs (Eckhardt 1993, 1997 ; Sowers 2002).1

1. L’argument de l’Apocalypse et le modèle de Carter-Leslie

Pour les besoins de la présente discussion, il convient tout d’abord de présenter brièvement DA. Cet argument peut être décrit comme un raisonnement qui conduit à un décalage bayesien, à partir d’une analogie entre ce qui a été dénommé l’expérience des deux urnes (two-urn case2) et la situation humaine correspondante.

Considérons tout d’abord, l’expérience des deux urnes (adapté de Bostrom 1997) :

L’expérience des deux urnes Une urne3 opaque se trouve devant vous. Vous savez qu’elle contient soit 10, soit 1000 boules numérotées. Une pièce équilibrée a en effet été lancée au temps T0 et si la pièce est tombée sur pile, alors 10 boules ont été placées dans l’urne ; en revanche, si la pièce est tombée sur face, ce sont 1000 boules qui ont été placées dans l’urne. Les boules sont numérotées 1, 2, 3, …. Vous formulez alors les hypothèses Hpeu (l’urne ne contient que 10 boules) et Hbeaucoup (l’urne contient 1000 boules) avec les probabilités initiales P(Hpeu) = P(Hbeaucoup) = 1/2.

Informé de tout ce qui précède, vous tirez au temps T1 une boule au hasard dans l’urne. Vous obtenez ainsi la boule n° 5. Vous vous attachez à estimer le nombre de boules qui étaient contenues en T0 dans l’urne. Vous concluez alors à un décalage bayesien vers le haut en faveur de l’hypothèse Hpeu.

L’expérience des deux urnes constitue une application non controversée du théorème de Bayes. Elle est basée sur les deux hypothèses concurrentes suivantes :

(H1peu)l’urne contient 10 boules
(H2beaucoup)l’urne contient 1000 boules

et les probabilités initiales correspondantes : P(H1) = P(H2) = 1/2. En prenant en compte le fait que E dénote l’élément matériel avéré selon lequel la boule tirée au hasard porte le numéro 5 et que P(E|H1) = 1/10 et P(E|H2) = 1/1000, un décalage bayesien vers le haut s’ensuit, par application directe du théorème de Bayes. Par conséquent, les probabilités a posteriori sont telles que P'(H1) = 0.99 et P'(H2) = 0.01.

Considérons, en second lieu, la situation humaine correspondant à DA. En s’intéressant au nombre total d’humains que comptera finalement l’espèce humaine, on considère les deux hypothèses concurrentes suivantes :

(H3peu)le nombre total des humains ayant jamais existé s’élèvera à 1011 (Apocalypse proche)
(H4beaucoup)le nombre total des humains ayant jamais existé s’élèvera à 1014 (Apocalypse lointaine)

Il apparaît maintenant que chaque humain possède son propre rang de naissance, et que le votre, par exemple, est environ 60×109. Supposons également, par souci de simplicité, que les probabilités a priori soient telles que P(H3) = P(H4) = 1/2. Maintenant, selon Carter et Leslie, la situation humaine correspondant à DA est analogue au modèle des deux urnes.4 Si l’on dénote par E le fait que notre rang de naissance est 60×109, une application du théorème de Bayes, en prenant en compte le fait que P(E|H3) = 1/1011 et que P(E|H4) = 1/1014, conduit à un important décalage bayesien en faveur de l’hypothèse d’une Apocalypse prochaine, soit P'(H3) = 0.999. L’importance du décalage bayesien qui résulte de ce raisonnement, associé à une situation très inquiétante quant au devenir de l’humanité, à partir de la seule prise en compte de notre rang de naissance, apparaît contraire à l’intuition. En soi, ceci constitue un problème, qui nécessite qu’on s’attache à lui trouver une solution.

Dans un tel contexte, il apparaît qu’une solution à DA se doit de présenter les caractéristiques suivantes. En premier lieu, elle doit indiquer dans quelle mesure la situation humaine correspondant à DA est analogue au modèle des deux urnes ou éventuellement, à un modèle alternatif, dont les caractéristiques sont à préciser. En second lieu, une telle solution à DA doit indiquer dans quelle mesure le ou les modèles en analogie avec la situation humaine correspondant à DA se trouvent associés à une situation effrayante pour l’avenir de l’humanité.

Dans ce qui suit, je m’attacherai à présenter une solution pour DA. Afin d’élaborer cette dernière, il sera nécessaire tout d’abord de construire l’espace des solutions de DA. Une telle construction constitue une tâche non triviale, car elle nécessite la prise en considération non seulement de plusieurs objections qui ont été soulevées contre DA, mais aussi du problème de la classe de référence. Au sein de cet espace des solutions, les solutions préconisées par les défenseurs ainsi que par les détracteurs de DA, prennent naturellement place. Je montrerai finalement qu’au sein de l’espace des solutions ainsi constitué, il y a place pour une troisième voie, qui constitue une solution par essence différente de celle offerte par les défenseurs et les détracteurs de DA.

2. Échec d’un modèle alternatif fondé sur l’objection incrémentale d’Eckhardt et al.

DA est basé sur la mise en correspondance d’un modèle probabiliste – le modèle des deux urnes – avec la situation humaine correspondant à DA. Afin de construire l’espace des solutions pour DA, il convient de s’attacher à définir les modèles qui constituent des alternatives au modèle des deux urnes, et qui peuvent également être mis en correspondance avec la situation humaine correspondant à DA. Plusieurs modèles alternatifs ont notamment été décrits par les opposants à DA. Cependant, pour des raisons qui deviendront claires un peu plus loin, tous ces modèles ne peuvent être retenus valablement en tant que modèle alternatif au modèle des deux urnes, et prendre ainsi place au sein de l’espace des solutions pour DA. Il convient ainsi de distinguer parmi ces modèles proposés par les détracteurs de DA, ceux qui ne constituent pas d’authentiques modèles alternatifs, et ceux qui peuvent légitimement être intégrés au sein de l’espace des solutions de DA.

Un certain nombre d’objections à DA ont tout d’abord été formulées par William Eckhardt (1993, 1997). Pour les besoins de la présente discussion, il convient de distinguer deux objections, parmi celles qui ont été soulevées par Eckhardt, et que j’appellerai respectivement : l’objection incrémentale et l’objection diachronique. À chacune de ces deux objections est associé une expérience qui se propose de constituer un modèle alternatif au modèle des deux urnes.

Commençons tout d’abord par l’objection incrémentale, mentionnée dans Eckhardt (1993, 1997) et le modèle alternatif qui lui est associé. Récemment, George Sowers (2002) et Elliott Sober (2003) s’en sont fait l’écho. Selon cette objection, l’analogie avec l’urne qui se trouve à l’origine de DA, est mal fondée. En effet, dans l’expérience des deux urnes, le numéro de la boule est choisi au hasard. En revanche, soulignent ces auteurs, dans le cas de la situation humaine correspondant à DA, notre rang de naissance n’est pas choisi au hasard, mais se trouve en fait indexé sur la position temporelle correspondante. Par conséquent, souligne Eckhardt, l’analogie dans le modèle des deux urnes n’est pas fondée et l’ensemble du raisonnement s’en trouve invalidé. Sober (2003) développe une argumentation similaire,5 en soulignant qu’aucun mécanisme ayant pour objet d’assigner de manière aléatoire une position temporelle aux êtres humains, ne peut être mis en évidence. Enfin, une telle objection a récemment été ravivée par Sowers. Ce dernier a mis l’accent sur le fait que le rang de naissance de chaque humain n’est pas aléatoire, car il se trouve indexé sur la position temporelle correspondante.

Selon le point de vue développé par Eckhardt et al., la situation humaine correspondant à DA n’est pas analogue à l’expérience des deux urnes, mais plutôt à un modèle alternatif, qui peut être appelé le distributeur d’objets consécutifs (consecutive token dispenser). Le distributeur d’objets consécutifs est un dispositif, décrit à l’origine par Eckhardt,6 qui éjecte à intervalles réguliers des boules numérotées consécutivement : “(…) suppose on each trial the consecutive token dispenser expels either 50 (early doom) or 100 (late doom) consecutively numbered tokens at the rate of one per minute”. Un dispositif similaire – appelons-le le distributeur de boules numérotées – est également mentionné par Sowers, où les boules sont éjectées de l’urne et numérotées selon l’ordre de leur éjection, à l’intervalle régulier d’une par minute :7

There are two urns populated with balls as before, but now the balls are not numbered. Suppose you obtain your sample with the following procedure. You are equipped with a stopwatch and a marker. You first choose one of the urns as your subject. It doesn’t matter which urn is chosen. You start the stopwatch. Each minute you reach into the urn and withdraw a ball. The first ball withdrawn you mark with the number one and set aside. The second ball you mark with the number two. In general, the nth ball withdrawn you mark with the number n. After an arbitrary amount of time has elapsed, you stop the watch and the experiment. In parallel with the original scenario, suppose the last ball withdrawn is marked with a seven. Will there be a probability shift? An examination of the relative likelihoods reveals no.

Ainsi, en vertu du point de vue défendu par Eckhardt et al., la situation humaine correspondant à DA n’est pas en analogie avec l’expérience des deux urnes, mais bien avec le distributeur de boules numérotées. Et ce dernier modèle conduit à laisser inchangées les probabilités initiales.

L’objection incrémentale d’Eckhardt et al. se trouve basée sur une disanalogie. En effet, la situation humaine correspondant à DA présente une nature temporelle, car les rangs de naissance sont successivement attribués aux humains en fonction de la position temporelle correspondant à leur apparition sur Terre. Ainsi, la situation correspondante prend place, par exemple, de T1 à Tn, où 1 et n sont respectivement les rang de naissance du premier et du dernier humain. En revanche, l’expérience des deux urnes se révèle atemporelle, car au moment où la boule est tirée au hasard, toutes les boules sont déjà présentes dans l’urne. L’expérience des deux urnes prend ainsi place à un moment donné T0. Il apparaît ainsi que l’expérience des deux urnes consiste en un modèle atemporel, alors que la situation correspondant à DA correspond à un modèle temporel. Et ceci interdit, soulignent Eckhardt et al., de considérer la situation correspondant à DA et l’expérience des deuxurnes comme isomorphes.8

À ce stade, il s’avère que la disanalogie atemporelle-temporelle constitue bien une réalité et qu’elle ne peut être niée. Toutefois, ceci ne constitue pas un obstacle insurmontable pour DA. On le verra en effet, il est possible de mettre en analogie la situation humaine correspondant à DA, avec une variation temporelle du modèle des deux urnes. Il suffit pour cela de considérer l’expérience suivante, que l’on peut dénommer l’expérience des deux urnes incrémentale (formellement, l’expérience des deux urnes++) :

L’expérience des deux urnes++ Une urne opaque se trouve devant vous. Vous savez qu’elle contient soit 10, soit 1000 boules numérotées. Une pièce équilibrée a en effet été lancée au temps T0 et si la pièce est tombée sur pile, alors l’urne ne contient que 10 boules ; en revanche, si la pièce est tombée sur face, l’urne contient ces mêmes 10 boules plus 990 boules supplémentaires, soient 1000 boules au total. Les boules sont numérotées 1, 2, 3, …. Vous formulez alors les hypothèses Hpeu (l’urne ne contient que 10 boules) et Hbeaucoup (l’urne contient 1000 boules) avec les probabilités initiales P(Hpeu) = P(Hbeaucoup) = 1/2. Au temps T1, un dispositif tirera dans l’urne une boule au hasard, puis expulsera à chaque seconde une boule numérotée dans l’ordre croissant, de la boule n° 1 jusqu’au numéro de la boule tirée au hasard. À ce moment précis, le dispositif s’arrêtera.

Vous êtes informé de tout ce qui précède, et le dispositif expulse alors la boule n° 1 en T1, la boule n° 2 en T2, la boule n° 3 en T3, la boule n° 4 en T4, puis la boule n° 5 en T5. Le dispositif s’arrête alors. Vous vous attachez à estimer le nombre de boules qui étaient contenues en T0 dans l’urne. Vous concluez alors à un décalage bayesien vers le haut en faveur de l’hypothèse Hpeu.

On le voit, une telle variation constitue une adaptation simple du modèle des deux urnes original, avec l’ajout d’un mécanisme incrémental pour l’expulsion des boules. La nouveauté avec cette variation9 réside dans le fait que l’expérience présente maintenant un aspect temporel, puisque la sélection aléatoire est effectuée en T1 et que la boule tirée au hasard est finalement éjectée, par exemple, en T5.

À ce stade, il convient également d’analyser les conséquences de l’expérience des deux urnes++ sur l’analyse développée par Eckhardt et al. En effet, dans l’expérience des deux urnes++, le numéro de chacune des boules éjectées du dispositif est indexé sur le rang de leur expulsion. Par exemple, je tire la boule n°60000000000. Mais je sais également que la boule précédente était la boule n°59999999999 et que l’avant-dernière boule était la boule n°59999999998, etc. Cependant, cela ne m’empêche pas de raisonner de la même manière que dans l’expérience des deux urnes originale et de conclure à un décalage bayesien en faveur de l’hypothèse Hpeu. Dans ce contexte, l’expérience des deux urnes++ conduit à la conséquence suivante : le fait d’être indexé par rapport au temps n’implique pas que le numéro de la boule ne soit pas choisi de manière aléatoire. Ceci peut maintenant être confronté avec la thèse principale de l’objection incrémentale développée par Eckhardt et al., selon laquelle le rang de naissance de chaque humain n’est pas choisi de manière aléatoire, mais se révèle indexé sur la position temporelle correspondante. Sowers en particulier considère que la cause de DA réside dans le fait que le numéro correspondant au rang de naissance se trouve indexé par rapport au temps.10 Mais ce que l’expérience des deux urnes++ et l’analogie correspondante démontrent, c’est que notre rang de naissance peut être indexé par rapport au temps et se trouver néanmoins déterminé de manière aléatoire dans le contexte qui est celui de DA. Pour cette raison, le modèle du distributeur de boules numérotées proposé par Eckhardt et Sowers ne peut pas être pris en considération en tant que modèle alternatif au modèle des deux urnes, au sein de l’espace des solutions de DA.

3. Succès d’un modèle alternatif fondé sur l’objection diachronique de William Eckhardt

William Eckhardt (1993, 1997) expose également une autre objection à DA, que nous appellerons, pour les besoins de la présente discussion, l’objection diachronique. Cette dernière objection, on le verra, est basée sur un modèle alternatif à l’expérience des deux urnes, qui est différent de celui qui correspond à l’objection incrémentale. Eckhardt (1997, p. 256) souligne ainsi le fait qu’il est impossible d’effectuer une sélection aléatoire, dès lorsqu’il existe de nombreux individus qui ne sont pas encore nés au sein de la classe de référence correspondante : “How is it possible in the selection of a random rank to give the appropriate weight to unborn members of the population?”.

Cette seconde objection est potentiellement plus forte que l’objection incrémentale. Afin d’en évaluer la portée précise, il convient maintenant de la traduire en termes de modèle. Il apparaît que le modèle associé à l’objection diachronique d’Eckhardt peut être construit, à partir de la structure du modèle des urnes. La version correspondante, qui peut être dénommée l’expérience des deux urnes diachronique, est la suivante :

L’expérience des deux urnes diachronique Une urne opaque se trouve devant vous. Vous savez qu’elle contient soit 10, soit 1000 boules numérotées. Une pièce équilibrée a en effet été lancée au temps T0. Si la pièce est tombée sur pile, 10 boules ont alors été placées dans l’urne ; en revanche, si la pièce est tombée sur face, 10 boules ont également été placées dans l’urne au temps T0, mais 990 boules supplémentaires seront ensuite ajoutées dans l’urne au temps T2, portant ainsi le nombre total de boules finalement contenues dans l’urne à 1000. Les boules sont numérotées 1, 2, 3, …. Vous formulez alors les hypothèses Hpeu (l’urne ne contient finalement que 10 boules) et Hbeaucoup (l’urne contient finalement 1000 boules) avec les probabilités initiales P(Hpeu) = P(Hbeaucoup) = 1/2.

Informé de tout ce qui précède, vous tirez au temps T1 une boule au hasard dans l’urne. Vous obtenez ainsi la boule n° 5. Vous vous attachez à estimer le nombre de boules qui seront finalement contenues dans l’urne en T2. Vous concluez alors que les probabilités initiales demeurent inchangées.

À ce stade, il apparaît que le protocole qui vient d’être décrit rend justice à l’idée forte d’Eckhardt selon laquelle il est impossible d’effectuer une sélection aléatoire lorsqu’il existe de nombreux membres au sein de la classe de référence qui ne sont pas encore nés. Dans le modèle des deux urnes diachronique, les 990 boules qui sont éventuellement (si la pièce tombe sur face) ajoutées en T2 représentent en effet ces membres non encore nés. Dans une telle situation, il serait tout à fait erroné de conclure à un décalage bayesien en faveur de l’hypothèse Hpeu. En revanche, ce que l’on peut inférer de manière rationnelle dans un tel cas, c’est que les probabilités initiales demeurent inchangées.

On peut constater en outre que la structure du protocole de l’expérience des deux urnes diachronique se révèle tout à fait similaire à celui de l’expérience des deux urnes originale (que nous appellerons désormais l’expérience des deux urnes synchronique). Ceci permet désormais d’effectuer aisément des comparaisons. On constate ainsi que si la pièce tombe sur pile : la situation est identique dans les deux expériences, synchronique et diachronique. En revanche, la situation est différente si la pièce tombe sur face : dans le modèle des deux urnes synchronique, les 990 boules supplémentaires sont déjà présentes dans l’urne en T0 ; à l’inverse, dans le modèle des deux urnes diachronique, les 990 boules supplémentaires sont ajoutées dans l’urne ultérieurement, c’est-à-dire en T2. On le voit ainsi, le modèle des deux urnes diachronique fondé sur l’objection diachronique d’Eckhardt mérite tout à fait de prendre sa place au sein de l’espace des solutions de DA.

4. Construction de l’espace des solutions préliminaire

Compte tenu de ce qui précède, nous sommes maintenant en position d’apprécier à quel point l’analogie qui sous-tend DA se révèle adéquate. Il apparaît en effet que deux modèles alternatifs pour modéliser l’analogie avec la situation humaine correspondant à DA se trouvent en concurrence : d’une part le modèle des deux urnes synchronique préconisé par les promoteurs de DA et d’autre part, le modèle des deux urnes diachronique, fondé sur l’objection diachronique d’Eckhardt. Il s’avère que ces deux modèles présentent une structure commune, ce qui permet ainsi d’effectuer des comparaisons11.

À ce stade, la question qui se pose est la suivante : la situation humaine correspondant à DA est-elle en analogie avec (a) le modèle des deux urnes synchronique, ou bien à (b) le modèle des deux urnes diachronique ? Afin d’y répondre, la question suivante s’ensuit : existe-t-il un critère objectif qui permette de choisir, de manière préférentielle, entre les deux modèles concurrents ? Il apparaît que non. En effet, ni Leslie ni Eckhardt ne présentent une motivation objective qui permette de justifier le choix du modèle qu’ils préconisent, et d’écarter le modèle alternatif. Leslie tout d’abord, défend l’analogie de la situation humaine correspondant à DA avec l’expérience de la loterie (ici, l’expérience des deux urnes synchronique). Mais parallèlement, Leslie reconnaît que DA est considérablement affaibli si notre univers est d’une nature indéterministe, c’est-à-dire si le nombre total d’humains qui existeront n’est pas encore fixé.12 Or il s’avère qu’une telle situation indéterministe correspond tout à fait au modèle des deux urnes diachronique. Car le protocole de cette expérience prend en compte le fait que le nombre total de boules qui seront finalement contenues dans l’urne, n’est pas connu au moment où le tirage aléatoire est effectué. On le voit finalement, Leslie accepte libéralement que l’analogie avec le modèle des deux urnes synchronique puisse ne pas prévaloir dans certaines circonstances indéterministes, où comme on l’a vu, ce serait alors le modèle des deux urnes diachronique qui s’appliquerait.

Parallèlement, une faiblesse dans le point de vue défendu par Eckhardt réside dans le fait qu’il rejette l’analogie avec l’expérience de la loterie (ici, l’expérience des deux urnes synchronique) dans tous les cas. Mais comment peut-on avoir la certitude qu’une analogie avec le modèle des deux urnes synchronique ne prévaut pas, au moins pour une situation particulière donnée ? Il apparaît ici que les éléments probants qui permettent d’écarter une telle hypothèse avec une certitude absolue, font défaut.

Résumons maintenant. Au sein de l’espace des solutions pour DA qui résulte de ce qui précède, il s’ensuit désormais que deux modèles concurrents peuvent convenir également pour modéliser la situation humaine correspondant à DA : le modèle des deux urnes synchronique de Leslie ou le modèle des deux urnes diachronique d’Eckhardt. À ce stade toutefois, il apparaît qu’aucun critère objectif ne permet à ce stade d’accorder la préférence à l’un ou l’autre de ces deux modèles. Dans ces circonstances, en l’absence d’éléments objectifs permettant d’effectuer un choix entre les deux modèles concurrents, nous sommes conduits à appliquer un principe d’indifférence, qui conduit à retenir les deux modèles comme globalement équiprobables. Nous attribuons ainsi (Figure 1), en vertu d’un principe d’indifférence, une probabilité P de 1/2 à l’analogie avec le modèle des deux urnes synchronique (associé à un scénario terrifiant), et une probabilité identique de 1/2 à l’analogie avec le modèle des deux urnes diachronique (associé à un scénario rassurant).

CasModèleT0T2PNature du scénario
1modèle des deux urnes synchronique1/2terrifiant
2modèle des deux urnes diachronique1/2rassurant

Figure 1.

Une telle approche revêt toutefois un caractère préliminaire, car afin d’attribuer une probabilité précise à chacune des situations inhérentes à DA, il est nécessaire de prendre en considération l’ensemble des éléments qui sous-tendent DA. Or il apparaît qu’un élément essentiel de DA n’a pas encore été pris en compte. Il s’agit du délicat problème de la classe de référence.

5. Le problème de la classe de référence

Commençons tout d’abord par rappeler le problème de la classe de référence (reference class problem).13 Sommairement, il s’agit du problème de la définition correcte des “humains”. De manière plus précise, le problème peut être ainsi énoncé : comment la classe de référence peut-elle être objectivement définie dans le contexte de DA ? Car une définition plus ou moins extensive ou restrictive de la classe de référence peut être utilisée. Une classe de référence définie de manière extensive inclurait par exemple des variétés quelque peu exotiques correspondant à des évolutions futures de notre humanité, possédant par exemple un quotient intellectuel moyen égal à 200, un double cerveau ou bien des capacités pour la causalité rétrograde. À l’inverse, une classe de référence définie de manière restrictive n’inclurait que les humains dont les caractéristiques sont très exactement celles de – par exemple – notre sous-espèce homo sapiens sapiens. Une telle définition exclurait ainsi l’espèce éteinte homo sapiens neandertalensis, de même qu’une éventuelle future sous-espèce telle qu’homo sapiens supersapiens. Pour mettre cela en adéquation avec notre actuelle taxonomie, la classe de référence peut être définie à différents niveaux qui correspondent respectivement au super-genre superhomo, au genre homo, à l’espèce homo sapiens, à la sous-espèce homo sapiens sapiens, etc. À ce stade, il apparaît qu’un critère objectif permettant de choisir le niveau correspondant d’une manière qui ne soit pas arbitraire, fait défaut.

La solution proposée par Leslie’s au problème de la classe de référence, exposée dans la réponse faite à Eckhardt (1993) et dans The End of the World (1996), est la suivante : on peut choisir la classe de référence plus ou moins comme on le souhaite, c’est-à-dire à n’importe quel niveau d’extension ou de restriction. Une fois ce choix effectué, il suffit d’ajuster en conséquence les probabilités initiales, et DA fonctionne à nouveau. La seule réserve énoncée par Leslie est que la classe de référence ne doit pas être choisie à un niveau extrême d’extension ou de restriction.14 Pour Leslie, le fait que chaque humain puisse appartenir à différentes classes, selon qu’elles sont définies de manière restrictive ou extensive, ne constitue pas un problème, puisque l’argument fonctionne pour chacune de ces classes. Dans ce cas, indique Leslie, un décalage bayesien s’ensuit quelque soit la classe de référence, choisie à un niveau raisonnable d’extension ou de restriction. Et Leslie illustre ce point de vue par une analogie avec une urne multicolore, à la différence de l’urne unicolore de l’expérience des deux urnes originale. Il considère ainsi une urne qui contient des boules de différentes couleurs, par exemple rouges et vertes. Une boule rouge est tirée au hasard dans l’urne. D’un point de vue restrictif, la boule constitue une boule rouge et il n’y a alors pas de différence avec le modèle des deux urnes. Mais d’un point de vue plus extensif, la boule constitue aussi une boule rouge ou verte.15 Selon Leslie, bien que les probabilités initiales soient différentes dans chaque cas, un décalage bayesien s’ensuit dans les deux cas.16 On le voit, le modèle des deux urnes synchronique peut aisément être adapté pour restituer l’essence du modèle multicolore de Leslie. Il suffit en effet de remplacer les boules rouges de l’expérience des deux urnes synchronique originale, par des boules rouges ou vertes. Le modèle bicolore qui en résulte est alors en tous points identique à l’expérience des deux urnes synchronique originale, et conduit à un décalage bayesien de même nature.

À ce stade, afin d’intégrer adéquatement le problème de la classe de référence au sein de l’espace des solutions pour DA, il reste encore à traduire le modèle des deux urnes diachronique en une version bicolore.

5.1 Le modèle des deux urnes diachronique bicolore

Dans l’expérience unicolore originale qui correspond au modèle des deux urnes diachronique, la classe de référence est celle des boules rouges. Il apparaît ici que l’on peut construire une variation bicolore, adaptée au traitement du problème de la classe de référence, où la classe pertinente est celle des boules rouges ou vertes. La variation bicolore correspondante est alors en tous points identique à l’expérience des deux urnes diachronique originale, à la seule différence que les 10 premières boules (1 à 10) sont rouges et que les 990 autres boules (11 à 1000) sont vertes. La variation correspondante est ainsi la suivante :

L’expérience des deux urnes diachronique bicolore Une urne opaque se trouve devant vous. Vous savez qu’elle contient soit 10, soit 1000 boules numérotées (consistant en 10 boules rouges et 990 boules vertes). Les boules rouges sont numérotées 1, 2, …, 9, 10 et les boules vertes 11, 12, .., 999, 1000. Une pièce équilibrée a en effet été lancée au temps T0. Si la pièce est tombée sur pile, 10 boules ont alors été placées dans l’urne ; en revanche, si la pièce est tombée sur face, 10 boules rouges ont également placées dans l’urne au temps T0, mais 990 boules vertes supplémentaires seront ensuite ajoutées dans l’urne au temps T2, portant ainsi le nombre total de boules contenues dans l’urne à 1000. Vous formulez alors les hypothèses Hpeu (l’urne ne contient finalement que 10 boules rouges ou vertes) et Hbeaucoup (l’urne contient finalement 1000 boules rouges ou vertes) avec les probabilités initiales P(Hpeu) = P(Hbeaucoup) = 1/2.

Informé de tout ce qui précède, vous tirez au temps T1 une boule au hasard dans l’urne. Vous obtenez ainsi la boule rouge n° 5. Vous vous attachez à estimer le nombre de boules rouges ou vertes qui seront finalement contenues dans l’urne en T2. Vous concluez alors que les probabilités initiales demeurent inchangées.

On le voit, la structure de cette variation bicolore est en tous points analogue à celle de la version unicolore de l’expérience des deux urnes diachronique. On considère en effet ici la classe des boules rouges ou vertes, en lieu et place de la classe des boules rouges originale. Et dans ce type de situation, il est rationnel de conclure de la même manière que dans la version unicolore originale de l’expérience des deux urnes diachronique que les probabilités initiales demeurent inchangées.

5.2 Non-exclusivité du modèle synchronique unicolore et du modèle diachronique bicolore

À l’aide des outils permettant d’appréhender le problème de la classe de référence, nous sommes désormais en mesure d’achever la construction de l’espace des solutions pour DA, en intégrant les éléments qui viennent d’être décrits. De manière préliminaire, nous avons attribué une probabilité de 1/2 à chacun des modèles des deux urnes unicolores -synchroniqueetdiachronique – en leur associant respectivement un scénario terrifiant et rassurant. Qu’en est-il désormais, compte tenu de la présence de modèles bicolores, permettant désormais d’appréhender le problème lié à la classe de référence ?

Avant d’évaluer l’impact du modèle bicolore sur l’espace des solutions de DA, il convient tout d’abord de définir comment s’effectue la mise en correspondance des modèles bicolores avec notre situation humaine actuelle. Pour cela, il suffit d’assimiler la classe des boules rouges à notre sous-espèce actuelle homo sapiens sapiens et la classe des boules rouges ou vertes à notre actuelle espèce homo sapiens. De même, on assimilera la classe des boules vertes à la sous-espèce homo sapiens supersapiens, une sous-espèce plus avancée que la notre, qui correspond à une évolution d’homo sapiens sapiens. Une situation de ce type se révèle très courante dans le processus évolutionnel qui régit les espèces. Compte tenu de ces éléments, nous sommes désormais en mesure d’établir la mise en relation des modèles probabilistes avec notre situation actuelle.

À ce stade, il convient de noter une importante propriété du modèle diachronique bicolore. En effet, il s’avère que ce dernier modèle est susceptible de se combiner avec un modèle des deux urnes synchronique unicolore. Supposons en effet qu’un modèle des deux urnes synchronique unicolore prévale : 10 boules ou 1000 boules rouges sont placées dans l’urne en T0. Mais cela n’exclut pas que des boules vertes soient également ajoutées dans l’urne en T2. Il apparaît ainsi que le modèle synchronique unicolore et le modèle diachronique bicolore ne sont pas exclusifs l’un de l’autre. Car dans une telle situation, un modèle des deux urnes synchronique unicolore prévaut pour la classe restreinte des boules rouges, tandis qu’un modèle diachronique bicolore s’applique à la classe étendue des boules rouges ou vertes. À ce stade, il apparaît que nous nous trouvons sur une troisième voie, d’essence pluraliste. Car le fait de mettre en correspondance la situation humaine correspondant à DA avec le modèle synchronique ou bien (de manière exclusive) le modèle diachronique, constituent bien des attitudes monistes. À l’inverse, le fait de reconnaître le rôle conjoint joué par chacun des modèles synchronique et diachronique, constitue l’expression d’un point de vue pluraliste. Dans ces circonstances, il s’avère nécessaire d’analyser l’impact sur l’espace des solutions de DA de la propriété de non-exclusivité qui vient d’être soulignée.

Compte tenu de ce qui précède, il apparaît que quatre types de situations doivent désormais être distingués, au sein de l’espace des solutions de DA. En effet, chacun des deux modèles unicolores initiaux – synchronique et diachronique – peut être associé à un modèle des deux urnes diachronique bicolore. Commençons ainsi par le cas (1) où le modèle synchronique unicolore s’applique. Dans ce cas, on est amené à distinguer deux types de situations : soit (1a) rien ne se passe en T2 et aucune boule verte n’est ajoutée dans l’urne en T2 ; soit (1b) 990 boules vertes sont ajoutées dans l’urne en T2. Dans le premier cas (1a) où aucune boule verte n’est ajoutée dans l’urne en T2, on a bien une disparition rapide de la classe des boules rouges. De même, on a une disparition corrélative de la classe des boules rouges ou vertes, puisqu’elle s’identifie ici avec la classe des boules rouges. Dans un tel cas, l’extinction rapide d’homo sapiens sapiens (les boules rouges) n’est pas suivie par l’apparition d’homo sapiens supersapiens (les boules vertes). Dans un tel cas, on observe l’extinction rapide de la sous-espèce homo sapiens sapiens et l’extinction corrélative de l’espèce homo sapiens (les boules rouges ou vertes). Un tel scénario, on doit le reconnaître, correspond à une forme d’Apocalypse qui présente un caractère tout à fait effrayant.

Considérons maintenant le second cas (1b) où nous sommes toujours en présence d’un modèle synchronique unicolore, mais où cette fois, des boules vertes sont également ajoutées dans l’urne en T2. Dans ce cas, 990 boules vertes s’ajoutent en T2 aux boules rouges initialement placées dans l’urne en T0. On a alors une disparition rapide de la classe des boules rouges, mais qui s’accompagne de la survivance de la classe des boules rouges ou vertes, compte tenu de la présence des boules vertes en T2. Dans ce cas (1b), on constate qu’un modèle synchronique unicolore se trouve combiné avec un modèle diachronique bicolore. Les deux modèles se révèlent ainsi compatibles, et non-exclusifs l’un de l’autre. Si l’on traduit cela en termes de troisième voie, on constate, en conformité avec l’essence pluraliste de cette dernière, que le modèle synchronique unicolore s’applique à la classe, restrictivement définie, des boules rouges, alors qu’un modèle diachronique bicolore s’applique également à la classe, définie de manière extensive, des boules rouges ou vertes. Dans ce cas (1b), l’extinction rapide d’homo sapiens sapiens (les boules rouges) est suivie par l’apparition de la sous-espèce humaine plus évoluée homo sapiens supersapiens (les boules vertes). Dans une telle situation, la classe restreinte homo sapiens sapiens se trouve éteinte, alors que la classe plus étendue homo sapiens (les boules rouges ou vertes) survit. Alors que le modèle synchronique unicolore s’applique à la classe restreinte homo sapiens sapiens, le modèle diachronique bicolore prévaut pour la classe plus étendue homo sapiens. Mais une telle caractéristique ambivalente a pour effet de priver l’argument original de la terreur qui est initialement associée avec le modèle synchronique unicolore. Et finalement, cela a pour effet de rendre DA inoffensif, en le privant de sa terreur originelle. En même temps, ceci laisse le champ à l’argument pour s’appliquer à une classe de référence donnée, mais sans ses conséquences effrayantes et contraires à l’intuition.

Dans le cas (1) on le voit, le traitement correspondant du problème de la classe de référence se révèle différent de celui préconisé par Leslie. Car Leslie considère que le modèle synchronique s’applique quelle que soit la classe de référence choisie. Mais la présente analyse conduit à un traitement différencié du problème de la classe de référence. Dans le cas (1a), le modèle synchronique prévaut et un décalage bayesien s’applique, de même que dans le traitement de Leslie, à la fois à la classe des boules rouges et à celle des boules rouges ou vertes. En revanche, dans le cas (1b), la situation est différente. Car si un modèle synchronique unicolore s’applique bien à la classe de référence restreinte des boules rouges et conduit à un décalage bayesien, il apparaît qu’un modèle diachronique bicolore s’applique alors à la classe de référence étendue des boules rouges ou vertes, qui conduit à laisser les probabilités initiales inchangées. Dans ce cas (1b), on le voit, la troisième voie conduit à un traitement pluraliste du problème de la classe de référence.

Envisageons maintenant la seconde hypothèse (2) où c’est le modèle diachronique unicolore qui prévaut. Dans ce cas, 10 boules rouges sont placées dans l’urne en T0, puis 990 autres boules rouges sont ajoutées dans l’urne en T2. De même que précédemment, on est conduit à distinguer deux hypothèses. Soit (2a) aucune boule verte n’est ajoutée dans l’urne en T2 ; soit (2b) 990 boules vertes sont également ajoutées à l’urne en T2. Dans le premier cas (2a), le modèle diachronique unicolore s’applique. Dans une telle situation (2a), aucune apparition d’une sous-espèce humaine plus évoluée telle qu’homo sapiens supersapiens ne se produit. Mais le scénario correspondant à un tel cas se révèle également tout à fait rassurant, puisque notre sous-espèce homo sapiens sapiens survit. Dans le second cas (2b), où 990 boules vertes sont ajoutées dans l’urne en T2, un modèle diachronique bicolore s’ajoute au modèle diachronique unicolore initial. Dans une telle hypothèse (2b), il s’ensuit l’apparition de la sous-espèce plus évoluée homo sapiens supersapiens. Dans ce cas, le scénario correspondant se révèle doublement rassurant, puisqu’il conduit à la fois à la survivance d’homo sapiens sapiens et à celle d’homo sapiens supersapiens. On le voit, dans le cas (2), c’est le modèle diachronique qui demeure le modèle fondamental, conduisant à laisser les probabilités initiales inchangées.

À ce stade, nous sommes en mesure d’achever la construction de l’espace des solutions pour DA. En effet, une nouvelle application du principe d’indifférence conduit ici à attribuer une probabilité de 1/4 à chacun des 4 sous-cas : (1a), (1b), (2a), (2b). Ces derniers se trouvent représentés sur la figure ci-dessous :

CasT0T2P
11a1/4
1b1/4
22a1/4
2b● ○1/4

Figure 2.

Il suffit désormais de déterminer la nature du scénario qui est associé à chacun des quatre sous-cas qui viennent d’être décrits. Ainsi que cela a été discuté plus haut, un scénario inquiétant est associé à l’hypothèse (1a), alors qu’un scénario rassurant est associé aux hypothèses (1b), (2a) et (2b) :

CasT0T2PNature du scénarioP
11a1/4terrifiant1/4
1b1/4rassurant
22a1/4rassurant3/4
2b● ○1/4rassurant

Figure 3.

On le voit finalement, les considérations qui précèdent conduisent à une nouvelle formulation de DA. Car il résulte des développements précédents que la portée initiale de DA doit être réduite, dans deux directions différentes. En premier lieu, il convient de reconnaître que soit le modèle synchronique unicolore, soit le modèle diachronique unicolore s’applique à notre sous-espèce homo sapiens sapiens. Un principe d’indifférence conduit alors à attribuer une probabilité de 1/2 à chacune de ces deux hypothèses. Il en résulte un premier affaiblissement de DA, puisque le décalage bayesien associé à une hypothèse terrifiante ne concerne plus qu’un scénario sur deux. Un deuxième affaiblissement de DA résulte ensuite du traitement pluraliste du problème de la classe de référence. Car dans l’hypothèse où le modèle synchronique unicolore (1) s’applique à notre sous-espèce homo sapiens sapiens, deux situations différentes doivent être distinguées. L’une d’entre elles seulement (1a) conduit à la fois à la disparition d’homo sapiens sapiens et d’homo sapiens et correspond ainsi à une Apocalypse effrayante. En revanche, l’autre situation (1b) conduit à la disparition d’homo sapiens sapiens mais à la survivance de la sous-espèce humaine plus évoluée homo sapiens supersapiens, et constitue alors un scénario tout à fait rassurant. À ce stade, une seconde application du principe d’indifférence entraîne l’attribution d’une probabilité de 1/2 à chacun de ces deux sous-cas (cf. Figure 3). Au total, un scénario effrayant n’est plus associé désormais qu’avec une probabilité de 1/4, alors qu’un scénario rassurant se trouve associé avec une probabilité de 3/4.

On le voit, étant donné ces deux mouvements de recul, il en résulte une nouvelle formulation de DA, qui pourrait se révéler plus consensuelle que dans sa forme originale. En effet, la présente formulation de DA peut maintenant être réconciliée avec nos intuitions pré-théoriques. Car le fait de prendre en compte DA donne désormais une probabilité de 3/4 pour l’ensemble des scénarios rassurants et une probabilité qui n’est plus que de 1/4 pour un scénario associé à une Apocalypse effrayante. Bien sûr, nous n’avons pas fait complètement disparaître le risque d’une Apocalypse effrayante. Et nous devons, à ce stade, accepter un certain risque, dont la portée se révèle toutefois limitée. Mais surtout, il n’est plus nécessaire désormais de renoncer à nos intuitions pré-théoriques.

Finalement, ce qui précède met en lumière une facette essentielle de DA. Car dans un sens étroit, il s’agit d’un argument qui concerne le destin de l’humanité. Et dans un sens plus large (celui qui nous a concerné jusqu’ici) il met en avant la difficulté d’appliquer des modèles probabilistes aux situations de la vie courante,17 une difficulté qui est le plus souvent largement sous-estimée. Ceci ouvre la voie à un champ entier qui présente un réel intérêt pratique, consistant en une taxonomie de modèles probabilistes, dont l’importance philosophique serait demeurée cachée, sans la défense forte et courageuse de l’argument de l’Apocalypse effectuée par John Leslie.18


Références

Bostrom, N. (1997) ‘Investigations into the Doomsday argument, pré-publication à http://www.anthropic-principle.com/preprints/inv/investigations.html

Bostrom, N. (2002) Anthropic Bias: Observation Selection Effects in Science and Philosophy, New York: Routledge

Chambers, T. (2001) ‘Do Doomsday’s Proponents Think We Were Born Yesterday?’, Philosophy, 76, 443-50

Delahaye, J-P. (1996) ‘Recherche de modèles pour l’argument de l’apocalypse de Carter-Leslie’, manuscrit

Eckhardt, W. (1993) ‘Probability Theory and the Doomsday Argument’, Mind, 102, 483-88

Eckhardt, W. (1997) ‘A Shooting-Room view of Doomsday’, Journal of Philosophy, 94, 244-259

Franceschi, P. (1998) ‘Une solution pour l’Argument de l’Apocalypse’, Canadian Journal of Philosophy, 28, 227-46

Franceschi, P. (1999) ‘Comment l’urne de Carter et Leslie se déverse dans celle de Hempel’, Canadian Journal of Philosophy, 29, 139-56, traduction anglaise sous le titre ‘The Doomsday Argument and Hempel’s Problem’, http://cogprints.org/2172/

Franceschi, P. (2002) Une application des n-univers à l’Argument de l’Apocalypse et au paradoxe de Goodman, Corté: Université de Corse, dissertation doctorale, http://www.univ-corse.fr/~franceschi/Une%20application%20des%20n-univers.pdf

Hájek, A. (2002) ‘Interpretations of Probability’, The Stanford Encyclopedia of Philosophy, E. N. Zalta (ed.), http://plato.stanford.edu/archives/win2002/entries/probability-interpret

Korb, K. & Oliver, J. (1998) ‘A Refutation of the Doomsday Argument’, Mind, 107, 403-10

Leslie, J. (1993) ‘Doom and Probabilities’, Mind, 102, 489-91

Leslie, J. (1996) The End of the World: the science and ethics of human extinction, London: Routledge

Sober, E. (2003)‘An Empirical Critique of Two Versions of the Doomsday Argument – Gott’s Line and Leslie’s Wedge’, Synthese, 135-3, 415-30

Sowers, G. F. (2002) ‘The Demise of the Doomsday Argument’, Mind, 111, 37-45

1 La présente analyse de DA constitue le prolongement de Franceschi (2002).

2 Cf. Korb & Oliver (1998).

3 La description originale par Bostrom de l’expérience des deux urnes se réfère à deux urnes distinctes. Dans un souci de simplicité, je me réfère ici, de manière équivalente, à une seule urne (qui contient soit 10, soit 1000 boules).

4 De manière plus précise, Leslie considère une analogie avec l’expérience de la loterie.

5 Cf. (2003, p. 9): “But who or what has the propensity to randomly assign me a temporal location in the duration of the human race? There is no such mechanism”. Mais Sober s’intéresse surtout à fournir des preuves par rapport aux hypothèses utilisées dans la version originale de DA et à élargir le champ de l’argument en déterminant les conditions de son application à des situations concrètes.

6 Cf. (1997, p. 251).

7 Cf. (2002, p. 39).

8 J’emprunte cette terminologie à Chambers (2001).

9 D’autres variations de l’expérience des deux urnes++ peuvent même être envisagées. En particulier, des variations de l’expérience où le processus aléatoire s’opère de manière diachronique et non synchronique (c’est-à-dire au temps T0) peuvent être imaginées.

10 Cf. Sowers (2002, p. 40).

11Les expériences des deux urnes synchronique et diachronique peuvent toutes deux donner lieu à une variation incrémentale. La variation incrémentale de l’expérience des deux urnes (synchronique) a été mentionnée plus haut : il s’agit de l’expérience des deux urnes++. Il est de même possible de construire une variation incrémentale analogue pour l’expérience des deux urnes diachronique, où l’éjection des boules s’effectue à des intervalles temporels réguliers. À ce stade, il apparaît que les deux modèles concurrents peuvent donner lieu à une telle variation incrémentale. Ainsi, le fait de considérer les variations incrémentales des deux modèles concurrents – l’expérience des deux urnes++ synchronique et l’expérience des deux urnes++ diachronique, n’apporte pas ici d’élément nouveau par rapport aux deux expériences originales. De même, on pourrait considérer en effet des variations où le tirage aléatoire s’effectue non pas en T0, mais de manière progressive, ou des variations où une pièce quantique est utilisée, etc. Mais dans tous les cas, de telles variations sont susceptibles d’être adaptées à chacun des deux modèles.

12 Leslie (1993, p. 490) évoque ainsi: “(…) the potentially much stronger objection that the number of names in the doomsday argument’s imaginary urn, the number of all humans who will ever have lived, has not yet been firmly settled because the world is indeterministic”.

13 Le problème de la classe de référence dans la théorie des probabilités est notamment exposé dans Hájek (2002, s. 3.3). Pour un traitement du problème de la classe de référence dans le contexte qui est celui de DA, voir notamment Eckhardt (1993, 1997), Bostrom (1997, 2002, ch. 4 pp. 69-72 et ch. 5), Franceschi (1998, 1999). Le point souligné dans Franceschi (1999) peut être interprété comme un traitement du problème de la classe de référence au sein de la théorie de la confirmation.

14 Cf. 1996, p. 260-261.

15 Cf. Leslie (1996, p. 259).

16 Cf. Leslie (1996, pp. 258-9): “The thing to note is that the red ball can be treated either just as a red ball or else as a red-or-green ball. Bayes’s Rule applies in both cases. […] All this evidently continues to apply to when being-red-or-green is replaced by being-red-or-pink, or being-red-or-reddish”.

17 Cet aspect important de l’argument est également souligné dans Delahaye (1996). Il s’agit aussi du thème principal de Sober (2003).

18 Je suis reconnaissant envers Nick Bostrom pou des discussions utiles sur le problème de la classe de référence, ainsi qu’envers Daniel Andler, Jean-Paul Delahaye, John Leslie, Claude Panaccio, Elliott Sober, ainsi qu’un expert anonyme pour le Journal of Philosophical Research, pour des commentaires utiles sur de précédentes versions de cet article.

Le plan dialectique: pour une alternative au paradigme

Le plan dialectique: pour une alternative au paradigme

Paul Franceschi

Université de Corse

Dans Franceschi (2002), j’ai présenté une théorie qui se propose de constituer une alternative à la classification proposée par Greimas dans le domaine de l’analyse paradigmatique. Dans le présent article, je m’attache à tirer les conséquences de cette théorie en l’appliquant à la technique de conception de plan. En matière de plan dialectique, le paradigme actuel est en effet le plan du type thèse-antithèse-synthèse. Cette forme de plan est largement répandue et son usage se révèle consensuel. Dans ce qui suit, je présenterai un nouveau type de plan dialectique, qui se propose de constituer une alternative au plan dialectique classique. Il s’agit d’un  type de plan que l’on peut qualifier de matriciel, et qui présente plusieurs avantages par rapport au plan classique.

Le plan dialectique classique

Le paradigme actuel en matière de plan dialectique est un plan du type thèse-antithèse-synthèse[1]. Ce plan trouve son origine dans l’approche dialectique[2] développée par Hegel. La triple association de concepts sous la forme de thèse-antithèse-synthèse, désormais associée au mouvement dialectique de la pensée, a été élaborée par Hegel et Marx[3]. La dialectique constitue ainsi un processus de raisonnement qui procède par l’énoncé de deux thèses contradictoires et par leur réconciliation au stade de la synthèse. Pour Hegel[4], toute thèse présente en soi une nature incomplète, partielle, qui donne ainsi naissance à son contraire, l’antithèse. Selon Hegel, les contraires présentent, au-delà de la contradiction qui les sous-tend, une nature indissociable. Cette dernière propriété permet ainsi de réaliser leur union finale, à un niveau de la pensée qui se situe au-delà de celui où se manifeste la contradiction. Les contraires présentent ainsi par essence une véritable unité, dont il convient de capturer le principe fécond, permettant ainsi de parvenir, à un niveau supérieur, à une authentique connaissance. Cette dernière phase constitue la synthèse, qui peut ainsi être considérée comme l’étape du raisonnement qui réconcilie véritablement, à un niveau supérieur, la contradiction née entre la thèse et l’antithèse. La synthèse permet ainsi de surmonter le conflit apparu entre la thèse et l’antithèse, en unifiant ultérieurement la part de vérité contenue à la fois dans chacune d’entre elles. Mais le processus toutefois ne se limite pas à cela. Car la synthèse ainsi obtenue constitue à son tour une nouvelle thèse, qui elle-même donne lieu à une nouvelle antithèse puis à une nouvelle synthèse, et ainsi de suite… Dans le langage courant, l’approche dialectique désigne désormais la méthodologie générale qui permet de surmonter et de résoudre les contradictions. C’est dans cette approche dialectique que le plan classique du type thèse-antithèse-synthèse trouve son origine.

A ce stade, il convient de s’intéresser tour à tour à chacun des composants du plan thèse-antithèse-synthèse. Considérons en premier lieu la thèse. Cette dernière constitue un point de vue exprimé par un auteur. Il s’agit du point de vue sur lequel porte la discussion, et vers lequel la structure du plan se trouve orientée. Par simplification, on peut assimiler ici la thèse à une proposition donnée. En second lieu, l’antithèse est un point de vue qui se révèle contraire à celui de la thèse. De même que la thèse, il est utile de réduire l’antithèse, dans un but de simplification, à une proposition. A ce stade, les points de vue exprimés par la thèse et l’antithèse présentent une nature antinomique. Enfin, la synthèse constitue la partie du discours où les points de vue antagonistes développés dans la thèse et l’antithèse font l’objet d’un dépassement. La synthèse vise ainsi classiquement à s’élever au-delà de l’antinomie existant entre la thèse et l’antithèse et à la surpasser.

D’une manière générale, l’intérêt du plan dialectique de type thèse-antithèse-synthèse est de permettre d’appréhender le double aspect d’un problème ou d’une réalité donnée. En se plaçant alternativement d’un côté puis de l’autre, en envisageant successivement la thèse puis l’antithèse, ce type de plan évite une vision partielle ou tronquée du problème particulier posé par la thèse. La finalité du plan dialectique classique est ainsi d’appréhender la double nature d’une même réalité et de dépasser la contradiction qui résulte d’une étude préliminaire.

Matrices de concepts

Dans Franceschi (2002), j’ai décrit une structure qui est celle d’une matrice de concepts, dont le champ d’application s’étend à un nombre important de concepts. Pour les besoins de la présente discussion, il n’est pas utile de reprendre en détail la description de la structure de concepts présentée dans cet article. Toutefois, le type de plan dialectique qui sera proposé plus loin dérive directement de la notion de matrice de concepts. Il s’avère donc nécessaire de présenter les lignes essentielles de la structure de base qui est celle d’une matrice de concepts.

Considérons tout d’abord une dualité donnée. Dénotons-la par A/Ā. A ce stade, A et Ā constituent des concepts duaux. On peut considérer ainsi que A et Ā sont des concepts qui se caractérisent par une composante contraire c Î {-1, 1} au niveau d’une dualité A/Ā, telle que c[A] = -1 et c[Ā] = 1. On peut considérer également que A et Ā sont des concepts neutres qui peuvent ainsi être dénotés par A0 et Ā0.

A ce stade, on est à même de définir la classe des pôles canoniques. Il suffit de considérer une extension de la classe précédente {A0, Ā0}, telle que A0 et Ā0 admettent respectivement à la fois un concept positif et négatif qui leurs sont corrélatifs. De tels concepts possèdent un certain support intuitif. Dénotons-les respectivement par {A+, A} et {Ā+, Ā}. A ce stade, pour une dualité A/Ā donnée, on obtient les concepts suivants: {A+, A0, A, Ā+, Ā0, Ā}, qui constituent les pôles canoniques. Il convient de mentionner ici que l’on peut utiliser de manière alternative la notation a(A/Ā, cp) pour un pole canonique[5]. Dans tous les cas, les composants d’un pôle canonique sont: une dualité A/Ā, une composante contraire c Î {-1, 1} et une polarité canonique p Î {-1, 0, 1}. Cette définition des pôles canoniques conduit à distinguer entre les pôles canoniques positifs (A+, Ā+), neutres (A0, Ā0) et négatifs (A, Ā). Enfin, la classe constituée par les six pôles canoniques d’une même matrice peut être dénommée matrice canonique: {A+, A0, A, Ā+, Ā0, Ā}.

Intéressons-nous maintenant à la nature des relations existant entre les pôles canoniques d’une matrice donnée. Parmi les combinaisons de relations existant entre les six pôles canoniques (A+, A0, A, Ā+, Ā0, Ā) d’une même dualité A/Ā, on retiendra les relations suivantes: dualité, antinomiecomplémentaritécorollaritéconnexitéanti-connexité. Ainsi, deux pôles canoniques a1(A/Ā, c1p1) et a2(A/Ā, c2p2) d’une même matrice sont:

(a) duaux si leurs composantes contraires sont opposées et leurs polarités sont neutres[6]

(b) contraires (ou antinomiques) si leurs composantes contraires sont opposées et leurs polarités sont non-neutres et opposées[7]

(c) complémentaires si leurs composantes contraires sont opposées et leurs polarités sont non-neutres et égales[8]

(d) corollaires si leurs composantes contraires sont égales et leurs polarités sont non-neutres et opposées[9]

(e) connexes si leurs composantes contraires sont égales et la valeur absolue de la différence de leurs polarités est égale à 1[10]

(f) anti-connexes si leurs composantes contraires sont opposées et la valeur absolue de la différence de leurs polarités est égale à 1[11]

Résumons: {A0, Ā0} sont duaux; {A+, Ā} et {A, Ā+} sont contraires; {A+, Ā+} et {A, Ā} sont complémentaires; {A+, A} et {Ā+, Ā} sont corollaires; {A0, A+}, {A0, A}, {Ā0, Ā+} et {Ā0, Ā} sont connexes; {A0, Ā+}, {A0, Ā}, {Ā0, A+} et {Ā0, A} sont anti-connexes.

Pour fixer les idées, prenons l’exemple de la matrice[12] {éclectisme+pluridisciplinarité0dispersionexpertise+mono-disciplinarité0cloisonnement}. On a alors les relations suivantes:

(a’)  {pluridisciplinarité0mono-disciplinarité0} sont duaux

(b’)  {éclectisme+cloisonnement}, {dispersionexpertise+} sont antinomiques

(c’)  {éclectisme+expertise+}, {dispersioncloisonnement} sont complémentaires

(d’)  {éclectisme+dispersion}, {expertise+cloisonnement} sont corollaires

(e’)  {pluridisciplinarité0éclectisme+}, {pluridisciplinarité0dispersion}, {mono-disciplinarité0expertise+}, {mono-disciplinarité0cloisonnement} sont connexes

(f’)   {pluridisciplinarité0expertise+}, {pluridisciplinarité0cloisonnement}, {mono-disciplinarité0éclectisme+}, {mono-disciplinarité0dispersion} sont anti-connexes

Structure d’une thèse

A ce stade, il est nécessaire de s’attacher à analyser de manière plus approfondie la structure interne de la thèse à laquelle s’applique le plan dialectique. On distinguera ici entre les thèses simples et les thèses composées.

Thèses simples

En règle générale, une thèse simple présente une structure qui est celle d’une appréciation – négative, neutre ou positive – relative à un concept donné. Soit a un tel concept; on dénote alors par zp(a) une telle structure de thèse, où p dénote une polarité négative, neutre ou positive telle que respectivement p Î {-1, 0, 1}. L’appréciation négative peut être assimilée à un blâme et l’appréciation positive à un éloge. Le blâme d’un concept a donné est ainsi dénoté par z(a), l’appréciation neutre par z0(a) et l’éloge par z+(a). D’une manière générale, les propositions correspondant aux thèses simples présentent la structure suivante: zp(a), avec p Î {-1, 0, 1} et  a Î {A+, A0, A, Ā+, Ā0, Ā}. En se référant à la notion de matrice, on constate que les différents cas de figure théoriques sont les suivants, par rapport aux six concepts d’une même matrice: {z(A+), z(A0), z(A), z+), z0), z), z0(A+), z0(A0), z0(A), z0+), z00), z0), z+(A+), z+(A0), z+(A), z++), z+0), z+)}. A ce stade, il apparaît que l’appréciation neutre se rencontre assez rarement. Ainsi, par souci de simplification, on s’attachera ici à décrire essentiellement de manière plus précise les thèses qui présentent la structure d’un blâme ou d’un éloge.

Commençons tout d’abord par le blâme. Un certain nombre de thèses comportent ainsi une appréciation dévalorisante, dépréciative, par rapport à un comportement, une manière d’agir ou d’appréhender les choses, une situation donnée. De tels énoncés correspondent à des propositions présentant la structure d’un blâme. On dénote de telles propositions par z(s) où s désigne une manière de considérer les choses ou d’agir.

Considérons, pour fixer les idées, quelques exemples. Soit la thèse suivante:

(1)   C’est dans le mépris de l’ambition que doit se trouver l’un des principes essentiels du bonheur sur la terre.(Edgar Poe, Le domaine d’Arneihm)

Ici, l’auteur considère le ‘mépris de l’ambition’ comme un principe essentiel permettant de parvenir au bonheur. Un tel point de vue s’analyse comme un jugement négatif, dépréciatif vis-à-vis de l’ambition. Ce dernier concept peut être considéré comme une notion neutre[13]. Ainsi, une telle thèse simple présente-t-elle une structure qui est celle du blâme de l’ambition0 et peut être ainsi dénotée par z(ambition0).

Soit également cette autre thèse:

(2)   Amour, fléau du monde, exécrable folie. (Alfred de Musset, Premières poésies)

Le contenu de cette dernière thèse s’analyse comme une appréciation très péjorative formulée à l’égard de l’amour+. Là aussi, une telle thèse présente une structure qui constitue un blâme de l’amour+, que l’on peut ainsi dénoter par z(amour+).

A l’inverse, on rencontre également fréquemment des thèses qui comportent une appréciation flatteuse par rapport à un comportement, une propension à agir, une situation ou une manière d’appréhender les choses. La structure de la proposition correspondante est alors celle d’un éloge. On dénote de telles propositions par z+(s) où s désigne une façon de considérer les choses ou un comportement donnés.

Considérons quelques exemples. Le point de vue suivant illustre tout d’abord ce type de structure:

(3)   Rien de grand ne s’est accompli dans le monde sans passion. (Hegel, Introduction à la philosophie de l’Histoire)

L’auteur formule ici une louange vis-à-vis de la passion, considérant ainsi que ‘rien de grand’ n’a pu être accompli sans cette dernière. On peut considérer ici la passion comme une notion neutre[14]. Un tel point de vue présente ainsi la structure d’un éloge de lapassion0, soit formellement z+(passion0).

On rencontre également un type de structure identique, au niveau de l’affirmation suivante:

(4)   La passion est une maladie qui exècre toute médication. (Kant)

qui s’analyse en un blâme de la passion0, c’est-à-dire de manière formelle z( passion0).

Enfin, la thèse simple suivante:

(5) Ce qu’il y a de pire chez le fanatique, c’est la sincérité. (Oscar Wilde)

constitue un exemple d’éloge du concept négatif de fanatisme, c’est-à-dire formellement z+(fanatisme).

A ce stade, on constate que l’on est à même de déterminer la valeur de vérité de chacune des thèses simples. La valeur de vérité de chaque type d’éloge, d’appréciation neutre ou de blâme indique si l’affirmation envisagée est vraisemblable et cohérente ou non, sachant que l’éloge d’un concept positif est vrai, de même que l’appréciation neutre d’un concept neutre et le blâme d’un concept négatif. A l’inverse, l’éloge d’un concept non positif[15]l’appréciation neutre d’un concept non neutre ou bien le blâme d’un concept non négatif[16] sont faux. De manière formelle, la valeur de vérité [v] des propositions du type P = zp(aq), avec pq Î {-1, 0, 1} et  a Î {A+, A0, A, Ā+, Ā0, Ā} se calcule de la manière suivante: [v] = 1 (vrai) si p = q et [v] = -1 (faux) si p ¹ q[17]. Ainsi, parmi les différents cas qui viennent d’être énumérés, ceux dont la valeur de vérité est vrai sont: {z(A), z), z0(A0), z00), z+(A+), z++)}. Et ceux dont la valeur de vérité est faux sont: {z(A+), z(A0), z+), z0), z0(A+), z0(A), z0+), z0), z+(A0), z+(A), z+0), z+)}.

Thèses composées

Alors que les thèses simples contiennent un jugement formulé vis-à-vis d’un seul concept appartenant à une matrice donnée, les thèses composées comportent des appréciations relatives à plusieurs concepts d’une même matrice. Une thèse composée peut ainsi être définie de manière générale comme la conjonction de plusieurs thèses simples. Une thèse composée peut ainsi comporter des appréciations relatives à deux, trois, …, n concepts différents. On utilisera alors le terme de thèse n-composée. Dans ces hypothèses, les combinaisons s’avèrent nombreuses, sans qu’il soit toutefois nécessaire de les énumérer de manière exhaustive. Une proposition P constituant une thèse composée présente ainsi la structure suivante: P = Q1 Ù Q2 Ù … Ù Qn, pour n > 1, et Qi = zpi(aqi), avec piqi Î{-1, 0, 1} et  a Î {A+, A0, A, Ā+, Ā0, Ā}. On a ainsi les thèses 2-composées, 3-composées, …, n-composées.

A ce stade, il apparaît nécessaire de s’intéresser en premier lieu aux thèses 2-composées, qui constituent, parmi les thèses composées, le cas le plus fréquent. Les thèses 2-composées comportent des appréciations relatives à deux concepts d’une même matrice. Elles présentent la structure: zp(a1(A/Ā, c1q)) Ù zr(a2(A/Ā, c2s)). L’appréciation suivante constitue ainsi un exemple de thèse2-composée:

(6)   Toute théorie est grise, mais vert et florissant est l’arbre de la vie. (Goëthe)

Cette thèse 2-composée comporte en effet à la fois le blâme de la théorie (‘toute théorie est grise’) et l’éloge du pragmatisme (‘vert et florissant est l’arbre de la vie’). Il s’avère ici que les concepts d’intérêt pour la théorie et de pragmatisme appartiennent à la matrice suivante: {capacité d’abstraction+intérêt pour la théorie0dogmatismepragmatisme+intérêt pour la pratique0prosaïsme}. La structure de la thèse est ainsi z(intérêt pour la théorie0) Ù z+(pragmatisme+) soit z(A0) Ù z++).

De même, l’appréciation suivante constitue un cas de thèse 2-composée:

(7)   L’art d’être tantôt très audacieux et tantôt très prudent est l’art de réussir. (Napoléon Bonaparte)

Cette thèse 2-composée comporte à la fois l’éloge de l’audace (‘l’art d’être (…) très audacieux (…) est l’art de réussir’) et l’éloge de la prudence (‘l’art d’être (…) très prudent est l’art de réussir’). Il apparaît que ces derniers concepts appartiennent à la matrice suivante: {audace+propension à prendre des risques0téméritéprudence+propension à éviter les risques0lâcheté}. La thèse comporte donc ici l’éloge des deux concepts positifs complémentaires d’une même matrice. La structure particulière de ce type de thèse composée comporte donc l’éloge de A+ et l’éloge de Ā+, soit formellement z+(audace+) Ù z+(prudence+).

Soit enfin la thèse suivante, qui constitue également un cas de thèse 2-composée:

(8) Deux excès: exclure la raison, n’admettre que la raison.(Pascal, Les Pensées)

Cette dernière thèse comporte en effet à la fois le blâme de l’irrationalité (‘exclure la raison’) et le blâme de l’hyper-rationalisme (‘n’admettre que la raison’). La matrice correspondante reconstituée est la suivante: {imagination+inspiration0irrationalitérationalité+raison0hyper-rationalisme}. On le voit, il s’agit là d’une thèse 2-composée dont la structure est z(irrationalité) Ù z(hyper-rationalisme) soit z(A) Ù z).

Enfin, la thèse 2-composée suivante:

(9) Comment souffrir que la passion soit mise au même rang que la raison? (Sénèque, De la colère)

s’analyse en un blâme de la passion0 et un éloge de la raison0, c’est-à-dire formellement z(passion0) Ù  z+(raison0), soit z(A0) Ù z+0) au niveau de la matrice {motivation+passion0fanatismepondération+raison0tiédeur}.

On peut observer ici que ce dernier type de thèse 2-composée correspond à un cas fréquent, pour des raisons de cohérence interne. Il est en effet logique lorsqu’on critique ou déprécie telle valeur ou tel concept, de flatter son contraire. Blâmer telle chose revient naturellement à faire l’éloge de son opposé, et inversement. Pour cette raison, les thèses 2-composées dont la structure particulière est z(A) Ù z++) ou bien z+(A+) Ù z) constituent également, parmi toutes les combinaisons possibles de thèses 2-composées, un cas courant.

En ce qui concerne la valeur de vérité des thèses 2-composées, elle se détermine de la même manière que pour les thèses simples. Soit ainsi P Ù Q une thèse 2-composée, telle que P = zp(aq) et Q = zr(bs), avec pqrs Î {-1, 0, 1} et  a, b Î {A+, A0, A, Ā+, Ā0, Ā}. De manière formelle, la valeur de vérité [v] d’une thèse 2-composée P Ù Q est vrai si v[P] = v[Q] = vrai, et faux dans les autres cas[18]. Il est à noter que les types les plus courants de thèses 2-composées sont ceux dont la valeur de vérité est vrai. Tel est le cas lorsque la valeur de vérité de chacune des deux propositions contenues dans la thèse composée est vrai. Dans cette hypothèse, les deux propositions se renforcent. Il s’agit ainsi des cas correspondant à: {z+(A+) Ù z(A), z+(A+) Ù z++), z+(A+) Ù z), z(A) Ùz++), z(A) Ù z), z++) Ù z)}.

Thèses duales

A ce stade, il convient de s’intéresser à la notion de thèse duale d’une thèse donnée. Cette dernière notion s’applique à la fois aux thèses simples et aux thèses composées. La thèse duale constitue ici un élément de la discussion dialectique, qui se révèle importante car elle sert de fondement à la discussion relative à la thèse considérée.

Intéressons-nous, en premier lieu, aux thèses duales des thèses simples. Commençons tout d’abord par en donner une définition générale. De manière formelle, une thèse simple zp(a1(A/Ā, cq)) possède une thèse duale qui répond à la définition suivante: zp(a2(A/Ā, –cq)). Ainsi, une thèse duale d’une thèse simple présente les caractéristiques suivantes: (i) les polarités de l’appréciation de la thèse duale et de la thèse simple sont identiques; (ii) les composantes contraires des concepts sur lesquels portent les appréciations de la thèse duale et de la thèse simple sont opposées; (iii) les polarités des concepts sur lesquels portent les appréciations de la thèse duale et de la thèse simple sont identiques.

On considérera tout d’abord les thèses duales des thèses simples vraies. Les types de thèses simples vraies peuvent être ainsi énumérés: {z+(A+), z0(A0), z(A), z++), z00), z)}. De manière formelle, une thèse simple vraie zp(a1(A/Ā, cp)) présente un thèse duale qui répond à la définition suivante: zp(a2(A/Ā, –cp)). Ainsi, les thèses duales des thèses simples vraies sont respectivement: {z++), z00), z), z+(A+), z0(A0), z(A)}.

Considérons, à titre d’exemple, la thèse simple vraie suivante:

(10) Quoi que tu rêves d’entreprendre, commence-le. L’audace a du génie, du pouvoir, de la magie. (Goethe)

qui présente la structure z+(audace+) soit z+(A+) au niveau de la matrice {audace+propension à prendre des risques0téméritéprudence+propension à éviter les risques0lâcheté}. La thèse ci-dessous dont la structure est z+(prudence+) soit z++) constitue ainsi sa thèse duale:

(11) La prudence surpasse les autres vertus comme la vue surpasse les autres sens. (Bion de Phlossa)

Considérons également les thèses duales des thèses simples fausses. Les types de thèses simples fausses sont: {z(A+), z(A0), z+), z0), z0(A+), z0(A), z0+), z0), z+(A0), z+(A), z+0), z+)}. Et les thèses duales des thèses simples fausses sont respectivement: {z+), z0), z(A+), z(A0), z0+), z0), z0(A+), z0(A), z+0), z+), z+(A0), z+(A)}.

A titre d’exemple, la thèse simple fausse suivante:

(4)   La passion est une maladie qui exècre toute médication. (Kant)

présente la structure z(passion0) soit z(A0) au niveau de la matrice {motivation+passion0fanatismepondération+raison0tiédeur}. La thèse suivante dont la structure est z(raison0) soit z0) constitue ainsi sa thèse duale:

(12) Si la raison dominait sur la terre, il ne s’y passerait rien. (Bernard Fontenelle)

Il convient désormais de s’intéresser, en second lieu, aux thèses duales des thèses composées. Ces dernières sont telles que les composantes contraires des concepts sur lesquels portent les appréciations des deux thèses simples composant la thèse duale et de la thèse considérée sont opposées[19]. Considérons ainsi les thèses 2-composées vraies. Ainsi, la thèse duale de z+(A+) Ù z) est z++) Ù z(A). Et de même, la thèse duale de z0(A0) Ù z+(A+) est z00) Ù z++). On notera ici en particulier que la thèse duale de z0(A0) Ù z00) est z00) Ù z0(A0), que la thèse duale de z+(A+) Ù z++) est z+ +) Ù z+(A+) et que la thèse duale z(A) Ù z) est z(A) Ù z).

Donnons également quelques exemples. Ainsi, la thèse 2-composée vraie correspondant à la proposition suivante:

(6)   Toute théorie est grise, mais vert et florissant est l’arbre de la vie. (Goëthe)

présente la structure z(A0) Ù z++) c’est-à-dire z(intérêt pour la théorie0) Ù z+(pragmatisme+) au niveau de la matrice {capacité d’abstraction+intérêt pour la théorie0dogmatismepragmatisme+intérêt pour la pratique0prosaïsme}. La thèse suivante dont la structure est z0) Ù z+(A+) soit z(intérêt pour la pratique0) Ù z+(capacité d’abstraction+)  constitue donc sa thèse duale:

(13) Toute pratique est vile, mais féconde et élevée est la quête de l’abstraction véritable.

De manière similaire, la proposition suivante:

(8) Deux excès: exclure la raison, n’admettre que la raison.(Pascal, Les Pensées)

constitue une thèse 2-composée vraie dont la structure est z(irrationalité) Ù z(hyper-rationalisme) soit z(A) Ù z) au niveau de la matrice: {imagination+inspiration0irrationalitérationalité+raison0hyper-rationalisme}. La thèse ci-dessous dont la structure est z+(imagination+) Ù z+(rationalité+) soit z+(A+) Ù z++) constitue ainsi sa thèse duale:

(14) L’art d’être tantôt très imaginatif et tantôt très rationnel est l’art de réussir.

Il convient de noter enfin que l’on a également des définitions analogues pour les thèses 3-composées, 4-composées, etc. Ainsi, à titre d’exemple, la thèse duale de la thèse 3-composée z+(A+) Ù z0(A0) Ù z00) est z++) Ù z00) Ù z0(A0). De même, la thèse duale de la thèse 3-composée z+(A+) Ù z0(A0) Ù z(A) est z++) Ù z00) Ù z).

Plan dialectique matriciel

Les développements qui précèdent permettent maintenant de décrire les étapes du raisonnement dialectique applicable à l’analyse d’une thèse particulière donnée, à partir des principes qui viennent d’être définis. La première étape consiste ainsi dans la détermination précise de la structure de la thèse considérée. La seconde étape, qui en résulte directement, est l’attribution d’une valeur de vérité à cette dernière. L’étape suivante consiste alors dans la reconstitution de la matrice complète applicable au(x) concept(s) qui font l’objet de la thèse. On est alors à même de déterminer la thèse duale de la thèse considérée ainsi que les thèses simples vraies autres que la thèse étudiée et sa thèse duale. Enfin, l’étape finale est la synthèse qui consiste dans la conjonction des thèses simples vraies relatives à chacun des 6 concepts de la matrice considérée: z+(A+) Ù z0(A0) Ù z(A) Ù z++) Ù z00) Ù z). Une telle synthèse permet de dépasser une triple antinomie: celle existant entre A+ et Ā, A0 et Ā0, et A et Ā+. On peut observer ici que l’on peut éventuellement ne retenir de la synthèse qu’une forme simplifiée consistant dans la conjonction des thèses simples vraies constituant un éloge ou un blâme: z+(A+) Ù z(A) Ù z++) Ù z). De même, on pourra parfois se contenter d’une forme tronquée de synthèse consistant en z+(A+) Ù z++), qui met l’accent sur la complémentarité entre A+ et Ā+ [20].

A ce stade, nous sommes désormais en mesure de présenter le plan dialectique matriciel. Un tel plan résulte directement de la structure de matrice de concepts qui vient d’être décrite. Le plan dialectique matriciel correspondant présente ainsi la structure suivante[21]:

(15) 1. Du point de vue de A0

1.1 Eloge de A+

1.2 Blâme de A

  1. Du point de vue de Ā0

2.1 Eloge de Ā+

2.2 Blâme de Ā

  1. Complémentarité entre A+et Ā+[22]

Considérons à titre d’exemple la thèse simple vraie suivante:

(16) Le succès fut toujours un enfant de l’audace. (Prosper Crébillon, Catilina)

dont la structure est z+(audace+) soit z+(A+) au niveau de la matrice {audace+propension à prendre des risques0téméritéprudence+propension à éviter les risques0lâcheté}. Il en résulte alors le plan matriciel suivant:

(17) 1. Du point de vue de la prise de risques0

1.1 La nécessité de l’audace+

1.2 Les dangers de la témérité

  1. Du point de vue de l’évitement des risques0

2.1 Les avantages de la prudence+

2.2 Le risque de la lâcheté

  1. La nécessaire complémentarité entreaudace+et prudence+

Soit également la thèse simple fausse suivante:

(12) Si la raison dominait sur la terre, il ne s’y passerait rien. (Bernard Fontenelle)

dont la structure est z(raison0). La matrice correspondante est: {pondération+raison0tiédeurmotivation+passion0fanatisme}. Et il en résulte le plan matriciel suivant:

(18) Introduction: (i) structure de la thèse; (ii)  valeur de vérité; (iii) matrice

  1. Du point de vue de laraison0

1.1 L’écueil de la tiédeur

1.2 La nécessité de la pondération+

  1. Du point de vue de lapassion0

2.1 Les dangers du fanatisme

2.2 La nécessité de la motivation+

  1. La nécessaire complémentarité entrepondération+et motivation+

Enfin, un  tel type de plan se révèle également adapté à une thèse 2-composée vraie telle que la suivante:

(19) Avant toute chose, il y a d’abord le métier, disait, car bien faire une seule chose procure un plus haut développement que d’en faire à demi une centaine. (Goëthe)

Cette dernière thèse s’analyse en une thèse 2-composée dont la structure est z+(expertise+) Ù z(superficialité) soit z+(A+) Ù z) au niveau de la matrice: {expertise+mono-disciplinarité0cloisonnementéclectisme+pluridisciplinarité0superficialité}. Et il en résulte le plan matriciel suivant[23]:

(20) 1. Du point de vue de la mono-disciplinarité0

1.1 Les avantages de l’expertise+

1.2 Le risque du cloisonnement

  1.  Du point de vue de la pluridisciplinarité0

2.1 La nécessité de l’éclectisme+

2.2 Les dangers de la superficialité

  1. La nécessaire complémentarité entreexpertise+et éclectisme+

Conclusion

Les développements qui précèdent permettent de constater que le plan dialectique matriciel présente un certain nombre d’avantages par rapport au plan dialectique classique. En premier lieu, l’approche dialectique qui vient d’être décrite effectue tout d’abord une analyse de la structure de la thèse considérée, qui conduit ensuite à lui attribuer une valeur de vérité, selon un fondement objectif.

En second lieu, il apparaît que le plan dialectique matriciel replace la thèse ou la proposition principale dans un contexte qui comprend un plus grand nombre de concepts que le plan dialectique classique. En effet, le plan dialectique classique situe habituellement la thèse dans un environnement comprenant en général deux, voire trois concepts. En revanche, le plan dialectique matriciel replace la thèse dans un contexte comprenant six concepts qui sont liés à cette dernière.

En troisième lieu, un des intérêts du plan dialectique matriciel est qu’il permet également de prendre en compte des concepts qui ne sont pas lexicalisés. En effet, la matrice de concepts décrit six concepts canoniques. Mais il est rare que la totalité de ces derniers soient lexicalisés. En effet, la situation la plus courante est que seuls certains concepts – en général deux ou trois – parmi les six que décrit la matrice correspondante sont lexicalisés. Ici aussi, l’intérêt du plan dialectique matriciel est de permettre la prise en compte exhaustive des six concepts d’une même matrice et de les intégrer dans la discussion correspondante.

On peut noter en outre que le stade de l’antithèse au niveau du plan dialectique classique se trouve remplacé ici par la détermination de la thèse duale, qui présente une structure identique à celle de la thèse initiale. La thèse duale, qui sert ici de base au raisonnement dialectique, présente pas sa structure simple ou bien n-composée une nature plus élaborée que la traditionnelle antithèse.

Enfin, il s’avère que le plan dialectique classique permet de dépasser une antinomie existant entre deux concepts, qui servent respectivement de support à la thèse et à l’antithèse. Il s’agit le plus souvent de A+ et Ā, de A0 et Ā0, ou bien de A et Ā+. La plupart du temps, il s’agit d’une paire duale ou antinomique de concepts qui présentent la propriété d’être lexicalisés. A l’inverse, le plan matriciel constitue l’expression d’un mouvement dialectique de la pensée qui permet de dépasser une triple antinomie: celle existant à la fois entre A+ et Ā, A0 et Ā0, et finalement A et Ā+, que ces concepts soient lexicalisés ou non.


Références

Franceschi, Paul (2002). Une classe de concepts. Semiotica 139 (1-4), 211-226.

Hegel, Georg Wilhelm Friedrich (1812-1816). Wissenschaft der Logik. Science de la logique, trad. Bourgeois, Paris, Aubier Montaigne, 1972.

————- (1817). Die Encyclopädie der philosophischen Wissenschaften im Grundrisse. Précis de l’encyclopédie des sciences philosophiques, trad. J. Gibelin. Vrin, Paris, 1978


Notes

[1] On trouve également la variante antithèse-thèse-synthèse.

[2] Platon envisageait la dialectique sous la forme d’un dialogue entre deux interlocuteurs, basé sur l’alternance de questions et de réponses. On trouve également une approche dialectique chez Kant, mais également Fichte et Schelling.

[3] Dans le contexte du matérialisme dialectique, la dialectique trouve son expression sur le terrain social, à travers le conflit ou la lutte, qui constituent la manifestation sur le plan matériel de la contradiction. Du dépassement de ce conflit naît le progrès historique, l’avancée sociale. Pour Marx également, la dialectique objective se situe véritablement au niveau de la réalité, trouvant ainsi son expression dans les faits et les phénomènes. A l’inverse, le mouvement dialectique observé au niveau de la pensée humaine ne constitue que le reflet subjectif de la dialectique fondamentale, une simple transposition de cette dernière au niveau du cerveau humain.

[4] Cf. (1812-1816) et (1817).

[5] Avec cette dernière notation, la matrice des pôles canoniques est restituée de la manière suivante: {a(A/Ā, -1, 1), a(A/Ā, -1, 0), a(A/Ā, -1, -1), a(A/Ā, 1, 1), a(A/Ā, 1, 0), a(A/Ā, 1, -1)}.

[6] Formellement a1 et a2 sont duaux si et seulement si c[a1] = – c[a2] and p[a1] = p[a2] = 0.

[7] Formellement a1 et a2 sont antinomiques si et seulement si c[a1] = – c[a2] et p[a1] = – p[a2] avec p[a1], p[a2] ¹ 0.

[8] Formellement a1 et a2 sont complémentaires si et seulement si c[a1] = – c[a2] et p[a1] = p[a2] avec p[a1], p[a2] ¹ 0.

[9] Formellement a1 et a2 sont corollaires si et seulement si c[a1] = c[a2] et p[a1] = – p[a2] avec p[a1], p[a2] ¹ 0.

[10] Formellement a1 et a2 sont connexes si et seulement si c[a1] = c[a2] et │p[a1] – p[a2]│ = 1.

[11] Formellement a1 et a2 sont anti-connexes si et seulement si c[a1] = – c[a2] et │p[a1] – p[a2]│ = 1.

[12] Pour une liste plus complète de matrices de concepts, cf. Franceschi (2002).

[13] L’ambition pouvant être réalisatrice (ambition+) ou bien excessive, voire démesurée (ambition).

[14] Une passion pouvant être réalisatrice (passion+) ou bien excessive, destructrice (passion).

[15] Négatif ou neutre.

[16] Positif ou neutre.

[17] On pourrait bien sûr distinguer ici des degrés de valeur de vérité, en utilisant des degrés d’appréciation, avec p Î [-1, 1]. Il en résulterait ainsi une approche par degré de la valeur de vérité, en calculant ainsi cette dernière par rapport à la valeur absolue de la différence entre p et q: [v] = 1- |(p – q)/2|.

[18] Une telle définition se généralise pour la détermination des valeurs de vérité des thèses 3-composées, …, n-composées.

[19] De manière formelle, soit ainsi P Ù Q une thèse 2-composée, telle que P = zp1(a1(A/Ā, c1, q1)) et Q = zP2(a2(A/Ā, c2, q2), avec p1, p2, q1, q2 Î {-1, 0, 1}, c1, c2 Î {-1, 1} et  a, b Î {A+, A0, A, Ā+, Ā0, Ā}; alors la thèse duale de P Ù Q est de la forme: zp1(a1 (A/Ā, –c1, q1)) Ù zP2(a2(A/Ā, –c2, q2). Une telle définition se généralise aisément aux thèses duales des thèses n-composées.

[20] La description des différentes étapes du processus dialectique ainsi défini suggère également d’autres types de plans que celui sur lequel l’accent est mis ici. Des plans alternatifs peuvent notamment mettre en évidence une partie relative à l’étape de détermination de la valeur de vérité de la thèse considérée, ou bien à la thèse duale de cette dernière.

[21] De manière alternative, on pourrait également considérer la variation suivante:

  1. D’un point de vue analytique

1.1 Du point de vue de A0

1.1.1 Eloge de A+

1.1.2 Blâme de A

1.2 Du point de vue de Ā0

1.2.1 Eloge de Ā+

1.2.2 Blâme de Ā

  1. D’un point de vue synthétique: la complémentarité entre A+et Ā+et entre A et Ā

[22] Une variation de ce type de plan consiste bien sûr à assimiler la partie 3 à la conclusion.

[23] Pour ce dernier type de thèse dont la structure est z+(A+) Ù z), on pourra également recourir à un autre type de plan qui met davantage l’accent sur la thèse duale z++) Ù z(A). Un tel type de plan se révèle proche du plan dialectique classique et accorde une place importante à la thèse duale de la thèse étudiée, à savoir z+(éclectisme+) Ù z(cloisonnement). Un tel type de plan présente alors la structure suivante:

  1.  Thèse

1.1 Les avantages de l’expertise+

1.2 Les dangers de la superficialité

  1. Thèse duale

2.1 La nécessité de l’éclectisme+

2.2 Le risque du cloisonnement

  1. La nécessaire synthèse entreéclectisme+et expertise+, et superficialité et cloisonnement

Mon cours (durée : 4h08) intitulé “Réaliser un plan dialectique pour un sujet d’ordre général” (Réaliser un plan dialectique matriciel pour un sujet d’ordre général, une dissertation, un essai) est en ligne sur Udemy.

Le cours est une version à visée pédagogique et pratique, qui expose les notions contenues dans mon article intitulé Le plan dialectique : pour une alternative au paradigme, publié dans la revue Semiotica.

L’ABC du plan dialectique matriciel

L’ouvrage « ABC du plan dialectique matriciel » a pour but de présenter de manière simple, progressive et illustrée une méthode créée par l’auteur qui permet de réaliser aisémentun plan dialectique matriciel. Il s’agit d’un outil à vocation pratique qui constitue l’application directe de concepts d’essence philosophique. Lorsqu’on en a assimilé les principes, quelques secondes suffisent pour réaliser un plan dialectique matriciel. Ce dernier présente un certain nombre d’avantages par rapport au plan dialectique classique du type thèse-antithèse-synthèse.

L’élaboration d’un plan dialectique matriciel se révèle utile dans le domaine scolaire, pour la rédaction d’une dissertation ou d’un devoir de philosophie ; dans le domaine parascolaire, pour la rédaction de l’épreuve de sujet d’ordre général des concours ; et plus généralement, pour la rédaction de mémoires, de thèses, de rapports, de compte-rendus, etc.

Le plan dialectique matriciel s’applique à des questions ou des sujets du type :

  • Discutez l’opinion suivante : « Toute théorie est grise, mais vert et florissant est l’arbre de la vie. » (Goethe)
  • Commentez l’assertion suivante : « Comment souffrir que la passion soit mise au même rang que la raison ? » (Sénèque)