Citation
L'auteur
Aurélie Dudézert
(aurelie.dudezert@imt-bs.eu) - (Pas d'affiliation)
Copyright
Déclaration d'intérêts
Financements
Aperçu
Contenu
Depuis plusieurs mois, de nombreuses critiques se développent, à juste titre, sur les informations générées par les IA génératives. Outre le risque de développement de Deep Fakes et de désinformation, elles sont aussi accusées de véhiculer des stéréotypes [1]. Comme l’écrit Cathy O’Neill (2018) [2] ces systèmes intègrent de nombreux biais: « Les algorithmes d’apprentissage automatique et d’intelligence artificielle n’intègrent pas une modélisation du monde capable de distinguer de façon fiable la vérité du mensonge ». Ces biais sont particulièrement visibles lors de la génération d’image par les IA Génératives telles que DALL-E ou Stabble Diffusion. Des expérimentations d’usages soulignent notamment les stéréotypes de genre ou d’ethnies véhiculées par ces IA [3].
Comme le définit clairement ChatGPT : « Un stéréotype est une croyance ou une idée préconçue sur un groupe de personnes ou sur un type de comportement qui est souvent simpliste ou exagéré. Les stéréotypes sont généralement basés sur des généralisations et ne tiennent pas compte de la diversité et de la complexité des individus au sein d’un groupe. Ils peuvent conduire à des jugements et des traitements injustes et sont souvent à la base de préjugés et de discriminations. »
Or pour lutter contre une croyance, encore faut-il avoir conscience de l’existence de cette croyance. Si aujourd’hui, de nombreux stéréotypes sont clairement identifiés et combattus, comme ceux sur le genre ou l’appartenance ethnique, d’autres sont plus difficiles à cerner. Alors, pourquoi ne pas se servir de ces outils pour mettre en lumière les stéréotypes qui structurent nos sociétés ? C’est l’expérimentation que j’ai choisi de mener au cours du mois de Novembre dernier sur les stéréotypes entourant l’entreprise française.
Les entreprises françaises vues par DALL-E
DALL-E est le générateur d’images développé par OpenAI. Comme le présente (Ramesh et ali, 2022) [4], DALL-E a été entraîné sur des millions de paires image-texte extraites d’internet. Ceci lui a permis d’apprendre à établir des liens entre les images et les mots utilisés pour les décrire. OpenAI a également expliqué qu’il y a eu un filtrage sur le corpus proposé à DALL-E pour qu’il ne contienne pas de contenu haineux ou violent [5]. Le modèle d’apprentissage n’étant pas confronté à ces contenus et concepts dans sa conception, il ne pourrait donc pas en générer. Avec ce contexte en tête, j’ai alors considéré que DALL-E était l’outil idéal pour identifier les stéréotypes qui circulent sur le web sur la perception de l’entreprise française.
Dans un premier temps, j’ai donné à DALL-E le prompt suivant : « Peux-tu me créer une image représentant une entreprise française? »
L’outil a alors généré l’image suivante :
J’ai ensuite demandé à ChatGPT de me décrire l’image en détails.
Voici sa réponse : « L’image montre une entreprise française traditionnelle, située dans une rue de ville pittoresque. L’édifice a deux étages et est d’une architecture classique avec des murs de couleur crème et des volets bleus. Au rez-de-chaussée, il y a un café avec des tables à l’extérieur où les gens sont assis et semblent profiter de leur temps, certains parlant entre eux, d’autres regardant autour ou attendant.
Le nom de l’entreprise, « FRENCH ENSEPRISE, » est écrit en grandes lettres sur le fronton du bâtiment, juste au-dessus de l’entrée principale qui est encadrée par deux piliers. Le logo de l’entreprise, qui comprend une étoile et une couronne, est affiché au-dessus de la porte.
La scène est animée et chaleureuse, avec des personnes qui se promènent sur les pavés et interagissent les unes avec les autres dans une atmosphère détendue et accueillante. »
Je dois dire qu’au début de cette expérience, j’ai bien ri en découvrant sa réponse. L’entreprise française type serait donc ancrée dans la tradition, au cœur de villes qui charment l’observateur par leur originalité et leur cachet (« pittoresque »). Les salariés français profitent pleinement d’un cadre de vie agréable, de leur temps et baignent dans une atmosphère détendue et accueillante. A noter que les entreprises françaises se caractériseraient par la présence en leur sein d’un café ouvert et accueillant.
Au regard des études sur les conditions de travail en France et des travaux que nous menons dans l’Observatoire du New Normal au Travail [6] avec ma collègue Florence LAVAL, je me suis dit que nous étions loin de la réalité.
Pour aller plus loin et mieux interpréter cette représentation de l’entreprise française, j’ai alors soumis le Prompt suivant à DALL-E : « Peux-tu me créer une image représentant une entreprise américaine? »
DALL-E a alors généré l’image suivante que j’ai demandée à ChatGPT de me décrire.
Description par ChatGPT : « Cette image représente un immeuble moderne qui incarne une entreprise américaine en milieu urbain. Le bâtiment est composé de verre et de métal, avec des reflets des gratte-ciel environnants sur sa façade vitrée. Il y a plusieurs étages visibles, certains avec des intérieurs qui semblent être des espaces de bureau avec des personnes en train de travailler à l’intérieur.
L’entrée du bâtiment est marquée par le mot « American enterprise » en lettres blanches sur un fond sombre, donnant un contraste frappant. Le rez-de-chaussée comporte des commerces avec des enseignes lumineuses, et il y a de l’activité dans la rue avec des passants et des voitures, ce qui donne une impression de dynamisme. La rue est bordée d’arbres, ajoutant une touche de verdure à l’environnement urbain.
L’architecture est contemporaine, avec des lignes épurées et une structure cubique, caractéristique des tendances modernes en architecture commerciale. La scène est baignée dans une lumière douce, suggérant soit le début de soirée, soit le matin. C’est une image qui évoque la vitalité et la modernité de l’entreprise américaine contemporaine. »
Le contraste avec la première représentation est saisissant. Alors que l’entreprise française est représentée comme pittoresque et presque surannée, l’entreprise américaine est représentée comme moderne et dynamique. Les salariés ne sont pas attablés à la terrasse d’un café dans une atmosphère détendue mais bien en train de travailler à l’intérieur. Le mouvement et la vitalité symbolise l’entreprise américaine tandis que la tranquillité et la convivialité caractérise l’entreprise française.
Comment interpréter cette différence de représentation ?
DALL-E ne fait que refléter l’image qui est renvoyée par le web de ce qu’est l’entreprise française. Ces images nous permettent de comprendre comment sont perçues aujourd’hui les entreprises françaises dans cet univers numérique. Le travail en France est perçu comme baigné de traditions et d’Histoire. La référence à l’architecture classique souligne cette inscription de l’entreprise dans une Histoire ancienne. La perception véhiculée est qu’en France, la douceur de vivre et la tradition l’emporte sur les objectifs de productivité et d’efficacité.
DALL-E ne fait là que représenter les idées reçues qu’il a capté, au regard des chiffres, photographies et images sur l’architecture en France, le temps de travail ou sur la taille des entreprises françaises par exemple. DALL-E ne peut pas percevoir que si le temps de travail est passé à 35h par semaine en France, ce chiffre n’est qu’une moyenne. Que derrière ce chiffre il y a des situations très différentes : du temps de travail élastique pour les cadres, du travail à temps partiel subi… DALL-E ne peut pas non plus percevoir que parmi les entreprises françaises, il y a aussi de très grandes entreprises dont la réalité est proche de celle qu’il décrit comme étant celle de l’entreprise américaine.
Par ailleurs, OpenAI a filtré l’apprentissage de l’IA. Toute image controversée sur ce que pourrait être l’entreprise française (grèves, gilets jaunes…) n’a probablement pas été présentée à l’outil. La conséquence est que la représentation de l’entreprise française proposée par DALL-E est celle de la « bien-pensance » : une entreprise où il fait bon vivre et où le charme historique et le goût de la table sont des fondamentaux.
Quels apprentissages tirer de cette expérience ?
D’abord, cette expérience permet de mieux comprendre comment le monde du web voit ce qu’est l’entreprise en France. Le web étant la vitrine du monde, on comprend à quel point il est important de continuer à communiquer sur le dynamisme et la créativité des entreprises françaises pour faire changer ce regard. Les entreprises françaises ont de nombreux défauts mais elles ont aussi des atouts. La « modernité » et l’efficacité ne sont pas l’apanage des entreprises américaines.
Ensuite, cette expérience montre que DALL-E peut être très utile pour identifier rapidement les idées reçues sur un sujet. Si je lui demande de me générer une image sur un sujet qui me pose question, je verrai sous quel angle l’aborder pour rentrer dans les idées reçues et ne heurter personne ou au contraire pour déconstruire ces idées reçues. Pour un enseignant/chercheur en Management, cela ouvre des perspectives intéressantes. En tant qu’experts, nous avons souvent des difficultés à nous faire entendre et comprendre des étudiants ou des praticiens. Partir des stéréotypes sur un sujet peut nous aider à dialoguer avec eux dans une logique de déconstruction/transmission des connaissances que nous avons développées sur certains sujets. Dans mon cas, je pense que cela pourrait être un outil pertinent pour transmettre des résultats de travaux sur le Management des Connaissances, le New Normal au Travail ou l’usage des technologies émergentes dans le travail.
Dans le même ordre d’idées, en demandant à DALL-E de générer une image sur un sujet de Management qui m’intéresse, je peux aussi prendre conscience d’idées reçues qui circulent que je n’avais pas forcément identifiées auparavant. Cela peut ouvrir à de nouvelles perspectives de recherche.
Enfin, cette expérience illustre par l’exemple que DALL-E ne peut pas traiter de sujets sensibles. Le filtre harmonise les réponses pour que les images ne choquent personne. Ce filtre a été construit par les concepteurs de chez OpenAI avec leurs points de vue sur ce qui est « bien » ou « mal », sur ce qui blessant et ce qui ne l’est pas. Le « non-dit » des images générées sur des sujets managériaux est aussi un axe intéressant de travail. Ces IA pourraient permettre d’identifier l’univers de « bien-pensance » voire la « vision organisante », pour reprendre l’expression de Swanson et Ramiller, dans lesquels s’inscrivent certains enjeux. Pour les praticiens, cela pourrait être très utile pour embarquer des financeurs ou sponsors dans certains projets. Pour les enseignants/chercheurs, cela pourrait servir de véritable outil de veille sur les biais cognitifs et symboliques dans lesquels les acteurs sont pris.
Bibliographie
[1] https://www.entreprendre.fr/chatgpt-reproduit-elle-les-stereotypes-de-nos-societes/
[2] O’Neill Cathy (2018), Algorithmes, la bombe à retardement, Editions Les Arènes
[3]https://www.sciencesetavenir.fr/high-tech/intelligence-artificielle/de-dall-e-2-a-stable-diffusion-les-ia-generatives-de-stereotypes-hallucinants_170327
[4] https://arxiv.org/abs/2204.06125
[5] https://www.blogdumoderateur.com/dall-e-midjourney-quelles-differences-generateurs-images/
[6] https://www.observatoire-nnt.com/