Traitement automatique du langage naturel et informatique affective

À quoi s’attendre prochainement dans les domaines du machine learning, du deep learning, ainsi que pour le traitement automatique des langues (TAL) et l’informatique affective.

Pour beaucoup de gens, ce qui distingue les machines des humains, c’est l’émotion. C’est vrai que certains existentialistes peuvent en débattre, mais la réalité existentielle primaire, c’est l’émotion. Un ordinateur n’est pas une entité vivante, ne comprend pas l’empathie, et ne peut pas mesurer ce que nous ressentons. Il ne s’en soucie pas, et ne peut pas se soucier, de savoir si l’utilisateur est heureux, triste, frustré, ou regrette tout simplement d’avoir trop mangé au déjeuner.

Mais le sujet de l’étude des émotions est très intéressant, puisqu’elles déterminent la plupart de nos décisions. Des avancées récentes en neurosciences cognitives sociales et sciences comportementales montrent que la rationalité n’est un des principes gouverneurs dans la prise de décision. Nous sommes également influencés par nos humeurs, et nous consultons notre intuition quand il s’agit de faire des investissements. Si l’on n’était guidé que par la rationalité pure, pourquoi investir dans la charité ou la philanthropie ?

Les émotions et le langage, qui sont parmi les moyens que l’on utilise pour décrire notre perception, jouent un rôle important dans la manière dont les décisions d’investissement sont exécutées. Ces dernières années, nous avons assisté à un progrès considérable dans le domaine du TAL et de l’informatique affective.

Traitement automatique des langues

Dans nos articles précédents, nous nous étions focalisés sur les méthodes d’analyses quantitatives. Néanmoins, le TAL est de nature plus qualitative. Tandis que les données quantitatives sont plus faciles à traiter, qu’il s’agisse de prix d’action, donc analyse de séries temporelles, il est plus compliqué de définir des quantités et de faire des modélisations statistiques sur les données qualitatives.

Par exemple, Facebook a été introduit en bourse en 2012 : comment cela se fait-il qu’une firme qui générait 1 milliard d’euros de chiffre d’affaires avait une valeur boursière de 90 milliards d’euros ? La raison était que cette valeur se basait sur plusieurs facteurs qualitatifs : concept de départ, équipe, et potentiel d’augmentation du chiffre d’affaires, etc. C’est un exemple où les données qualititatives peuvent jouer un rôle important dans la prise de décisions financières. En réalité, les données structurées, sous la forme de tableaux et bases de données (parmi d’autres formats), représentent seulement 20 % de toutes les données disponibles. Les autres 80 % sont des textes de billets sur les réseaux sociaux (surtout Twitter), images, courriels, messages textuels, fichiers audio, documents Word, PDF, et d’autres formats de données non-structurées.

Pour tirer des conclusions à partir de ces sources de données non-structurées, le TAL utilise du machine learning pour comprendre des textes non-structurées et déterminer le contexte dans lequel le langage est utilisé. Cela permet de traiter de l’information (la résumer, catégoriser des données qualitatives) reçue par le biais d’annonces officielles, rumeurs, pronostics d’experts, en temps réel et d’améliorer la prise de décision dans le déluge des informations en ligne.

En termes d’interprétations de l’information qualitative, le TAL peut être décliné en plusieurs points :

  • Traitement du signal : la conversion de la parole en texte ;
  • Analyse syntactique : quelles sont la structure et la grammaire des phrases ;
  • Analyse sémantique : quel est le sens des mots. Quelle est la logique des phrases ;
  • Pragmatique : quel est le contexte des phrases. Comment sont-elles liées aux autres phrases.

La plupart du temps, le TAL passe par les trois derniers points. Des avancées récentes dans chacun de ces points ont permis d’utiliser le TAL pour une compréhension plus poussé de la perception des produits, services, marques et firmes. Les sentiments jouent un rôle important dans la prise de décision, et la capacité de la machine à convertir le langage humain en code lisible par la machine et d’en tirer des conclusions utiles est une capacité que nous offre le TAL.

Informatique affective

Le sujet de l’analyse des sentiments nous amène à l’informatique affective. Tandis que le NLP (natural language processing) est capable de lire et convertir les mots en un flux logique qui peut être envoyé à un outil de calcul, nous ne pouvons pas ignorer le fait que les humains utilisent des nuances plus subtiles lors de leur communication. Les sentiments peuvent être décryptés sur la base de la structure des mots, le sens des phrases, et même la vitesse à laquelle ils sont saisit (est-ce que vous tapez plus rapidement ou plus lentement quand vous êtes fâché ?)

Mais le langage n’est qu’un moyen d’exhiber les émotions. Nous utilisons aussi nos corps. Un hochement de tête peut dire que nous sommes en accord, en désaccord, ou que nous avons simplement le cou raide. Tandis qu’il est relativement simple pour nous de décrypter le sens de ces gestes (qui dépendent du contexte culturel dans lequel nous sommes immergés), l’automatisation de cette tâche est un vrai défi pour les scientifiques qui travaillent sur l’interface homme-machine. Ceci a pavé le chemin pour le développement de l’informatique affective.

L’informatique affective est l’étude et le développement des systèmes et dispositifs qui peuvent reconnaître, interpréter, traiter et simuler des émotions humaines. C’est un champ interdisciplinaire, qui couvre l’informatique, la psychologie, et les sciences cognitives, et dont le but est de mesurer l’état émotionnel à l’aide de senseurs et du deep learning.

De manière très similaire à celle sont les algorithmes de deep learning reçoivent des milliers et des milliers de messages capables d’identifier les différentes écritures manuscrites des chiffres, l’informatique affective utilise des méthodes similaires pour apprendre la manière dont un sourire se dessine sur un visage. À la place des chiffres, donnez à l’ordinateur des tons de données pour lui apprendre ce qu’un sourire veut dire, des sourires d’hommes, femmes, enfants, de toutes les couleurs et origines.

L’informatique affective est la prochaine étape pour l’analyse des sentiments et des émotions. Lors d’une récente conférence au MIT, des experts ont pronostiqué que l’informatique affective va avoir une influence sur tous les secteurs de l’industrie, de la publicité et l’étude des marchés à la fabrication des produits. Puisque des expressions faciales et des mots parlés peuvent maintenant être observés et analysés en temps réel, nous entrons dans une nouvelle ère dans laquelle les réponses physiques aux stimuli peuvent être identifiées et les émotions peuvent être transformées en mesures quantitatives, qui nous fournissent un vrai plan d’action.

Implications économiques

Les chatbots utilisent déjà l’informatique affective. Ce sont des programmes qui miment des conversations humaines, à l’aide d’outils d’intelligence artificielle. Avec les avancées récentes en intelligence artificielle, les chatbots deviennent de vrais causeurs, surtout quand ils se centrent sur un domaine précis. Les chatbots sont de plus en plus un mode opératoire sur les sites web. Plutôt que d’avoir un service de support dédié, on peut avoir un chatbot qui donne un moyen plus simple et moins cher pour communiquer.

Les start-ups créatrices de robots conversationnels.

Les usages de l’informatique affective dans le monde des affaires ne sont pas complètement explorés, et exploités. Une utilisation possible : si vous êtes prédisposé au stress ou si vous travaillez dans un environnement à haut niveau de stress, des capteurs pourraient mesurer votre état émotionnel et ce que vous ressentez. L’information peut être utilisée pour modifier votre plan d’assurance, puisque votre assureur saura quel est votre niveau de stress au travail et donc quels sont les risques pour la santé pour ses assurés.


The ConversationMark Esposito et Terence Tsé sont co-auteurs de « Understanding How the Future Unfolds: Using DRIVE to Harness the Power of Today’s Megatrends ». Kary Bheemaiah est auteur de « The Blockchain Alternative: Rethinking Macroeconomic Policy and Economic Theory ».

Auteurs:

Mark Esposito, Professor of Business & Economics at Harvard University and Grenoble École de Management, Grenoble École de Management (GEM); Kariappa Bheemaiah, Associate research scientist Cambridge Judge Business School and lecturer GEM, Grenoble École de Management (GEM) et Terence Tse, Associate Professor of Finance / Head of Competitiveness Studies at i7 Institute for Innovation and Competitiveness, ESCP Europe

La version originale de cet article a été publiée sur The Conversation.