Citation
L'auteur
Sonia Bressler
(soniabressler@gmail.com) - Bressler Conseil
Copyright
Déclaration d'intérêts
Financements
Aperçu
Contenu
En juin 2017, lors d’une présentation à la commission des droits de l’homme à la conférence des ONG du Conseil de l’Europe, j’ai exposé la nécessité de comprendre l’avènement du monde de la data à l’aide de l’interrogation philosophique et d’une éthique radicale que j’ai désignée sous l’expression “data philosophie”[1].
Il s’agit ici d’expliquer en quoi la philosophie de part son histoire et ses recherches sur la notion fondamentale de “critère de réalité” peut aider à la compréhension des enjeux de la data.
Dans cet article, nous allons aborder deux points essentiels à la réflexion sur la philosophie à l’ère du big data. En premier lieu, nous devons nous interroger sur la conciliation entre deux champs qui paraissent opposés. D’un côté nous aurions la “data” qui serait de l’ordre de la technologie mais qui peut être aussi considérée comme une technique (au sens de la techné τέχνη, « fabriquer », « produire »), et de l’autre la “philosophie” au sens du questionnement sur les savoirs et la conduite des êtres humains. Ces deux recherches sont-elles compatibles sans pour autant basculer dans une philosophie pratique ?
Dans un deuxième temps, nous verrons que cette conciliation est non seulement possible mais qu’elle se doit de recouvrir quatre champs d’investigations : une ontologie de la data, une épistémologie, une data-praxis, une éthique des données.
La “data” et la “philosophie” sont-elles conciliables ?
La Data
“Data” est un mot ancien qui réapparaît grâce à la langue anglaise. Ce dernier recouvre les données qui peuvent circuler par un réseau téléphonique ou informatique. Comme l’indique le dictionnaire Le Littré, le mot “data” provient du latin qui signifie “choses données”. Nous pourrions ici nous interroger sur le sens de cette expression “choses données”. À partir de quel moment les choses sont-elles données ? Et quel type de “chose” consentons-nous à donner et pour quelles raisons ?
Afin qu’une chose nous soit donnée, il faut qu’il y ait un acte, un geste en ce sens. Il y a un émetteur et un receveur de ce don. Or dans le cadre numérique, les données sont captées, prises, chez un émetteur qui n’en n’a pas toujours conscience.
Dans son essai, The data Revolution, Rob Kitchin réalise une investigation de la notion de “data”. Il propose de remplacer la terminologie anglaise de “ data” par le terme de “capta”. Il écrit : “ainsi, au niveau technique, ce que nous entendons par “data” sont en réalité des “capta” (dérivé du latin capere qui signifie prendre) ; ces unités de données qui ont été sélectionnées et récoltées dans la somme de toutes les données potentielles”.
En d’autres termes, les « capta » ne deviennent « data » que parce qu’un algorithme, une équation va éliminer d’autres captas pour ne saisir que celles qui sont pertinentes à la réalisation de son « raisonnement ». Ainsi nous devons comprendre que la « data » est déjà un regard sur notre réel, elle est un regard humain qui considère que ceci est une “donnée” et en tant que telle, elle mérite d’être exploitée. La “data” est un réel tangible, une appréciation qui pourra ensuite conduire d’autres analyses en association à d’autres datas. Mais la data est-elle l’élément “simple” qui nous permet de reconstruire tout ou partie de notre réel ? Est-il possible que la philosophie puisse apporter un éclairage sur le sens de la data mais aussi sa constitution ?
La Philosophie
Nous n’allons pas ici nous embarquer sur le fil des siècles des débats philosophiques qui animent la définition même de la philosophie. Nous allons aller directement à sa définition donnée par le Centre National de Ressources Textuelles et Lexicales, elle souligne que de l’antiquité jusqu’au XIXème siècle la philosophie se définit comme « toute connaissance rationnelle quel que soit son objet ». Il s’agit donc d’un système « général » des connaissances humaines.
La philosophie est une démarche de réflexion critique. En partant du sens commun, elle examine la diversité des opinions et des conflits qui peuvent surgir. Elle les étudie afin d’arriver à “quelque chose” qui pourrait être considéré comme le critère originel du savoir. En ce sens, elle n’est pas la somme de toutes les connaissances acquises. Elle est un exercice pour bien exercer sa raison. Même si la philosophie, depuis le début du XIXème siècle ne recouvre plus la totalité des savoirs, c’est à elle que revient l’exercice de penser le réel dans sa globalité et dans son unité. La définition du réel constitue le point de départ et l’aboutissement de toute connaissance.
Comme le souligne Wittgenstein « 1. le monde est tout ce qui a lieu. 1.1 le monde est la totalité des faits, non des choses » (Tractatus logico-philosophicus, p.33). Et par faits, nous devons entendre « 2. ce qui a lieu, le fait, est la subsistance d’états de chose » (ibid). Par là, Wittgenstein nous montre qu’il nous faut manipuler le réel dans un espace logique. Ce qui est déjà une abstraction par rapport à notre expérience.
Il revient donc à la philosophie de distinguer le réel de l’illusoire. La connaissance du réel n’est pas immédiate. Elle résulte d’une progression des apparences à la réalité. Faut-il comme Charles Sanders Peirce voir que la réalité dépend de la décision ultime d’une communauté ? Comme le note Jean-Marie Chevalier (2015) en reprenant les théories de Peirce, nous sommes dans la société, notre comportement en dépend. Il écrit pour Peirce « régler son comportement sur des inférences probables ne peut être justifié que par une raison collective et non individuelle ».
Faire référence à Wittgenstein ou à Peirce nous sert, ici, à prendre conscience que toute la difficulté philosophique se porte sur les présupposés à la compréhension du réel. Peirce note que nos moyens sont toujours limités (financiers, temporels, etc.) ce qui nous pousse à nous orienter vers les « abductions » (ou hypothèses) les plus fructueuses. Selon Peirce, rechercher une vérité, c’est faire une approximation asymptotique du réel. En ce qu’elle pose ces questions, la philosophie est essentielle à la data. Elle en permet une approche critique. Dans ce cadre, elle nous conduit à remettre en cause l’image intuitive d’une « donnée brute » objective et neutre qui serait le reflet fidèle de la réalité extérieure.
La Data-Philosophie
L’association « data-philosophie » a son importance. Il ne s’agit pas de poser une “philosophie de la data” qui serait simplement une sorte d’application pratique ou un code déontologique de la data. Nous devons regarder la data comme ce qu’elle est : un critère du réel. Et nous devons reprendre la pensée de Peirce sur la question de la “raison collective” qui nous fait considérer la “data” comme élément du réel. Élément qui devient le socle d’une nouvelle constitution de connaissances et de pratiques. Dès lors nous pourrions ici tenter une analogie entre la « data » et la « monade » de Leibniz (Monadologie).
Dans cet article, il ne s’agit pas de résoudre cette analogie qui par ailleurs, comme toute analogie, a son degré de fausseté. Cependant, nous devrions remarquer, qu’à la base de toutes les recherches ou manipulations de data, il devrait y avoir une question.
L’objectif de la data-philosophie serait donc situé là : dans l’art de poser les questions et donc de soulever des problèmes. Sans ce cheminement il ne peut y avoir d’analyse structurée.
La question de l’usage et, donc du sens des datas, doit intervenir en premier. Mais ce présupposé suffit-il à rendre possible la « data-philosophie » ?
Comme le note Jonathan Furner, dans son article « Philosophy of data : Why ? » : “Certaines personnes ont commencé à parler de « philosophie des données ». Existe-t-il vraiment une telle chose ? Comment pourrait-elle être différente de la philosophie de l’information ? Et pourquoi toute personne travaillant dans le domaine des bibliothèques et des études d’information devrait-elle s’en soucier ?”.
Ce sont de bonnes questions qu’il faudrait traiter dans un autre article pour insister sur cette distinction nécessaire. Ici, nous dirons juste que la philosophie de l’information (selon Floridi) a pour objectif d’étudier les questions conceptuelles qui se posent à l’intersection de la science du calcul (base de la technologie de l’information) et de la philosophie. Tandis que la “data-philosophie” opère sur la question du “réel” présupposé par la philosophie de l’information.
Les champs de la Data-philosophie
La data-philosophie opère autour de quatre champs : ontologie, épistémologie, praxis et éthique de la data.
L’ontologie ou la métaphysique des data
L’ontologie est un domaine philosophique qui étudie les propriétés qui appartiennent à tous les êtres (quels qu’ils soient). Il revient donc à l’ontologie de la data de se poser les questions suivantes :
- que sont précisément les données ?
- les datas ont-elles un genre ?
- dans quelles conditions une chose peut-elle être considérée comme une donnée ?
- quelles propriétés doit avoir une chose pour être ou pour jouer le rôle d’une donnée ?
Ces questions ontologiques sont à la base de toutes nos connaissances. Et en matière d’usage des datas elles peuvent être la source de nouvelles pratiques. Connaître les « data », c’est, en quelque sorte, établir un nouveau rapport à ce « phénomène ».
L’épistémologie des datas
Le monde numérique, programmatique (et/ou technologique) est en constante évolution. Nous devons donc apporter un regard sur cette évolution et en mesurer les conséquences. De façon générale l’épistémologie de la data devra s’articuler autour des questions suivantes :
- quels sont les objets et les méthodes des data-sciences ?
- quels types de connaissance pouvons-nous avoir sur les données ?
- de quelle façon pouvons-nous acquérir ou produire ces connaissances ?
- les sciences des données sont-elles un mouvement graduel ou discontinu ?
- les sciences des données obéissent-elles à leur propre logique ou bien subissent-elles l’influence de ce qui se déroule en dehors d’elles ?
- les datas sciences répondent-elles à une demande sociale ?
L’épistémologie a ici toute son importance, car elle nous permet une compréhension des pratiques par lesquelles nous tentons de saisir certains phénomènes (ici ce sont les bases de données, par exemple, ou encore les langages informatiques, leurs différences structurelles, etc.). L’épistémologie nous permet d’évaluer ces pratiques et d’en développer, si besoin de meilleures.
La Data-praxis
Dans cette pratique de la data, nous devons nous tourner vers la recherche de méthodologie efficace pour répondre aux questions concrètes des analystes des données. En d’autres termes, la data-praxis doit s’intéresser au passage précis de la « data » à l’information.
Elle doit répondre à plusieurs questions du type :
- quand une data peut-elle devenir information ?
- quand la data devient-elle une information exploitable ?
La data-praxis doit donc intervenir sur les champs suivants : l’analyse descriptive et exploratoire des données, l’analyse des données inférentielles, l’analyse prédictive des données, et l’analyse des données causales. Nous pouvons ici nous référer à l’article de Jeffery T. Leek, Roger D. Peng (2015) “ Statistics: P values are just the tip of the iceberg”, ils soulignent que « l’éducation ne suffit pas. L’analyse des données est enseignée selon un modèle d’apprentissage, et les différentes disciplines développent leurs propres sous-cultures d’analyse. Les décisions sont basées sur les conventions culturelles de communautés spécifiques plutôt que sur des preuves empiriques ».
L’éthique des données
Le grand champ de la « data-philosophie » est l’éthique (à ne pas confondre avec la morale). Elle est une réflexion fondamentale sur laquelle la morale établira ses normes, ses limites et ses devoirs. Sa formulation se caractérise par des énoncés normatifs, prescriptifs ou encore évaluatifs (d’où résultent les impératifs kantiens). L’éthique comprend également des sous-catégories à savoir : l’éthique normative, l’éthique pratique et la méta-éthique.
Si nous devions segmenter une éthique appliquée à la data, alors nous pourrions proposer les champs suivants : l’éthique by design, l’éthique des usages, l’éthique sociétale. Ces trois éthiques sont interconnectées (et inter-connectables), mais il est nécessaire d’opérer cette catégorisation afin de mieux définir les enjeux, qui se trouvent sur des échelles parfois très différentes.
Les questions auxquelles doit répondre l’éthique de la data sont les suivantes :
- à quel type de valeur pouvons-nous ou devons-nous nous soumettre ?
- dans quelle pratique utilisons-nous les données ?
- quelles sont l’ensemble des possibilités de ces pratiques ?
En termes d’application, l’éthique des données désigne un ensemble de gestes et de comportements à adopter ayant pour objectif principal de protéger les données, en particulier les données personnelles. En son coeur, nous devons retrouver les huit piliers suivants : la finalité, la confiance, les proportionnalités, la pertinence, la confidentialité, la sécurité, la transparence, le respect du droit des personnes (avec une extension au droit des machines intelligentes, et très probablement des humains augmentés dans les prochaines années…).
Conclusion
Ceci est une conclusion temporaire. Une ouverture aux différentes formes de questionnement de ce à quoi mène l’investigation « data-philosophique ».
À l’aide de ces quatre champs, la data-philosophie se doit d’aller au plus près de de critère appelé « data ». Elle se doit de le questionner sous tous ses angles. Elle doit pousser l’investigation au-delà de l’usage technique, en montrer les rouages et les intrications avec d’autres sciences, d’autres formes de savoirs.
Ainsi, la Data-philosophie doit évaluer le « phénomène » des datas afin de déterminer la manière dont elles soutiennent les objectifs des entreprises, des états, ou des citoyens. Elle doit poser, par exemple, clairement la question des impacts sociaux de la collecte, de la manipulation et la distribution des données de masse. Faut-il lancer les bases d’un nouveau contrat social ? Faut-il imaginer un nouveau Léviathan ? Enfin la « data-philosophie » doit poser des limites à la data et mettre au jour le tournant épistémologique où la question n’est plus celle qui touche ce à quoi nous consentons quand nous donnons volontairement (ou pas) nos données, mais celle qui se demande que se passe-t-il quand nous ne consentons plus ? Les datas sont-elles intrinsèquement des moyens neutres ou bien reflètent-elles nécessairement des relations de pouvoir ou des intérêts de classe ? Enfin que se passe-t-il si nous décidons d’imposer l’opérateur « égalité radicale » en premier dans le champ des datas ?
[1] Cela a été consigné dans la note intitulée « SESSION D’HIVER COMMISSION DES DROITS DE L’HOMME CONF/HR(2017)SYN2 »
Bibliographie
Ballsun-Stanton B, Bunker D. Philosophy of data (PoD) and its importance to the discipline of information systems. In: AMCIS 2009: Proceedings of the 15th Americas Conference on Information Systems. Paper no. 435. Available from: aisel.aisnet.org/amcis2009/435.
Bouzeghoub M., et Mosseri R., sous la direction de, (2017) : Les Big Data à découvert, CNRS – éditions.
Dacos M., Mounier P. (2014) Humanités numériques. Etat des lieux et positionnement de la recherche française dans le contexte international. Institut français, Ministère des Affaires étrangères pour l’action culturelle extérieure de la France, Paris.
Floridi L. (2014) The Fourth Revolution: How the Infosphere is Reshaping Human Reality. Oxford: Oxford University Press
Furner Jonathan, « Philosophy of data : Why ? », DOI 10.3233/EFI-1700986
Jensen P. (2018), Pourquoi la société ne se laisse pas mettre en équations, Seuil, coll. « Science ouverte ».
Ktichin R. (2014) The Data Revolution, Big Data, Open Data, Data Infrastructures and Their Consequences, éd. SAGE Publishing.
Leek, J. T., & Peng, R. (2015). What is the question? Mistaking the type of question being considered is the most common error in data analysis. Science, 347(6228), 1314-1315.
Leek, J. T., & Peng, R. D. (2015). Statistics: P values are just the tip of the iceberg. Nature, 520(7549), 612-612.