Aller au contenu principal

L’intelligence artificielle et la communication humain-machine

Représentation d’un robot conversationnel

Représentation d’un robot conversationnel (LuckyStep48, iStockphoto)

Représentation d’un robot conversationnel

Représentation d’un robot conversationnel (LuckyStep48, iStockphoto)

Let's Talk Science
5.87

Quels sont les liens avec mon programme d'études?

Partager sur:

Découvre comment l’intelligence artificielle et l’apprentissage automatique nous aident à communiquer avec les ordinateurs.

L’intelligence artificielle (IA) te fait-elle penser à un film dans lequel des robots prennent le contrôle? Si c’est le cas, tu penses peut-être que l’IA est une technologie du futur. Mais l’IA est au contraire déjà utilisée dans de nombreux domaines de ta vie. Dans ce document d’information, nous explorerons quelques outils développés grâce à l’IA. Mais avant d’aller plus loin, il est important que tu saches ce qu’est l’apprentissage machine. Si tu n’as pas lu le document d’information Introduction à l’apprentissage machine, tu devrais le faire maintenant. La plupart des applications (applis) dont nous allons parler font appel à l’apprentissage machine.

Traitement automatique du langage naturel

As-tu déjà utilisé un moteur de recherche? Ou utilisé la correction automatique pour repérer tes fautes d’orthographe? Si tu réponds oui, tu as utilisé une application qui fait appel au traitement automatique du langage naturel (TALN). Le langage naturel est le langage parlé et écrit utilisé par les humains pour communiquer entre eux.

Toutefois, les humains et les ordinateurs ne parlent pas le même langage. C’est l’un des plus gros problèmes de la communication humain-ordinateur. Le TALN tente de résoudre ce problème.

En tant qu’humains, nous utilisons le texte, la voix et les gestes pour communiquer. Beaucoup de ces moyens de communication ne sont pas immédiatement reconnus par les machines. Pour combler cette lacune, le TALN suit un certain nombre d’étapes.

Prenons un exemple de l’analyse de texte.

Shown is a colour illustration of 22 coloured squares on a white background.
Ensemble de textes représentés par des carrés de couleur (©2023 Parlons sciences).
Image - Version texte

L’illustration en couleur montre 22 carrés colorés devant un fond blanc.

Les carrés sont dispersés au hasard sur l’image et ont la même orientation. Il y a deux ou trois carrés de chaque couleur : orange, rose, bleu pâle, bleu foncé, violet pâle, violet foncé, jaune, vert pâle, vert foncé, rouge et rouge foncé.

Prétraitement

Le prétraitement est la première étape, et souvent la plus importante, du TALN. Beaucoup des choix que les gens font à cette étape affectent la précision des modèles qui sont conçus.

Pendant le prétraitement, on demande aux ordinateurs de préparer un texte pour la lecture automatique. Cela implique :

  1. La segmentation, qui consiste à diviser le texte en mots individuels, appelés unités lexicales, ou en petites phrases, appelées n-grammes
  2. La suppression de la ponctuation
  3. La mise en minuscules de tout le texte
  4. La suppression des mots vides, qui sont des mots courants comme « le », « la », « est », « dans », etc.
Shown are 16 squares, some of which are the same as in the previous image.
Le prétraitement consiste à retirer (carrés retirés) et à modifier du texte (carrés recolorés) (©2023 Parlons sciences).
Image - Version texte

Voici 16 carrés, dont certains sont identiques à ceux de l’image précédente.

Les carrés vert foncé sont passés au vert pâle. Les carrés bleu foncé sont devenus bleu pâle. Les carrés violet foncé sont passés au violet pâle. Ils représentent le fait de mettre les mots en minuscules. Les carrés jaunes, rouges et rose ont été supprimés. Cela représente la suppression de la ponctuation et des mots vides.

Voici un exemple de texte avant le prétraitement :

La journée ensoleillée nous a rempli de joie, et nous avons joué à des jeux dans le parc. Même les nuages sombres n’ont pas étouffé le plaisir. C’était une journée dont nous nous souviendrons toujours et qui nous a accroché un très grand sourire!

Exemple de texte après le prétraitement :

« journée ensoleillée nous a remplis joie joué jeux parc même nuages sombres pas étouffé plaisir journée souviendrons toujours accroché très grand sourire »

Analyse de texte

À cette étape, une personne demande à la machine de transformer les unités lexicales et les n-grammes en données significatives qu’un ordinateur peut utiliser. Il y a plusieurs façons de faire. L’analyse sémantique et l’analyse des sentiments sont deux méthodes courantes.

L’analyse sémantique permet d’examiner le sens des mots dans leur contexte, comme la manière dont ils sont utilisés dans les phrases. L’analyse des sentiments utilise un type particulier de dictionnaire. Le dictionnaire est un ensemble de données distinct dans lequel les mots se voient attribuer des notes en fonction de leur caractère émotionnel.

Voici une illustration en couleur des 16 carrés de l’image précédente. Les carrés sont regroupés par groupes de quatre.
Mots classés en fonction de leur utilisation dans le contexte (©2023 Parlons sciences).
Image - Version texte

Voici une illustration en couleur des 16 carrés de l’image précédente. Les carrés sont regroupés par groupes de quatre.

En commençant par la gauche, les carrés orange correspondent au groupe des « Noms ». En haut à droite, les carrés bleu pâle correspondent au groupe des « Verbes ». En bas à gauche, les carrés vert pâle correspondent au groupe des « Adverbes ». En bas à droite, les carrés violet pâle correspondent au groupe des « Adjectifs ».

La plupart des dictionnaires d’analyse des sentiments notent les mots en fonction de leur caractère positif ou négatif.

Par exemple, si nous appliquons un dictionnaire d’analyse des sentiments à notre ensemble d’unités lexicales précédentes :

« journée ensoleillée nous a remplis joie joué jeux parc même nuages sombres pas étouffé plaisir journée souviendrons toujours accroché très grand sourire »

Il te fournira un ensemble de mots et attribuera des notes. Tu trouveras ci-dessous les notes de notre paragraphe d’exemple. Tout mot non répertorié dans le tableau obtient une note de sentiment de 0.

Mot Négatif Positif
Ensoleillée   1
Joie   1
Sombre 1  
Nuages 1  
Étouffé 1  
Plaisir   1
Sourire   1

Ce paragraphe aurait une note positive de 4 et une note négative de 3. Le TALN utilise généralement de grandes quantités de texte dans son analyse, et ceci serait un morceau de données dans un grand ensemble. La machine utiliserait ce paragraphe comme exemple de paragraphe plutôt neutre.

Le savais-tu?

D’autres dictionnaires décomposent encore plus l’analyse des sentiments. Un exemple est le lexique canadien des sentiments et des émotions du CNRC qui utilise huit groupes d’émotions.

Caractéristiques d’extraction

L’objectif de l’analyse de texte est de transformer notre texte écrit par un humain en données structurées. Une machine exprime généralement ces données sous forme de tableau ou de feuille de calcul. C’est ce que l’on appelle souvent la matrice documents-termes, ou MDT.

Les documents forment les lignes du tableau. Un document est une collection d’unités lexicales. Ça peut être les unités lexicales elles-mêmes. Mais souvent, ce sont des paragraphes, des chapitres ou des rapports entiers.

Les caractéristiques sont les colonnes du tableau. Ce sont les éléments que nous voulons que la machine prenne en compte. Dans cet exemple, les notes positives et négatives seraient les caractéristiques.

Voici une illustration en couleur des 16 carrés de l’image précédente, disposés dans un tableau étiqueté.
Exemple de matrice documents-termes (©2023 Parlons sciences).
Image - Version texte

Voici une illustration en couleur des 16 carrés de l’image précédente, disposés dans un tableau étiqueté.

Le tableau a quatre lignes et quatre colonnes. Les titres des rangées vont de « Document 1 » à « Document 4 ». Les titres des colonnes vont de « Caractéristique 1 » à « Caractéristique 4 ». La première colonne contient des carrés orange, la deuxième des carrés vert pâle, la troisième des carrés bleu pâle et la quatrième des carrés violet pâle. Chaque rangée contient un carré de chaque couleur.

Si nous imaginons que notre paragraphe d’exemple n’est qu’un des nombreux paragraphes d’une histoire, notre matrice documents-termes pourrait ressembler à ceci :

Document Caractéristique (positive) Caractéristique (négative)
Paragraphe 1 (notre exemple ci-dessus) 4 3
Paragraphe 2 2 8
Paragraphe 3 6 1

Dans l’ensemble structuré de données ci-dessus, la colonne positive est une caractéristique, et la colonne négative est une deuxième caractéristique. Les notes individuelles, comme le 4 de la colonne positive du paragraphe 1, sont appelées des vecteurs.

Un modèle d’apprentissage machine pour cet ensemble de données peut alors regrouper les paragraphes en fonction de leurs caractéristiques. Un modèle de classification pourrait créer trois catégories. Une catégorie concernerait les paragraphes très positifs, comme le paragraphe 3. Une autre concernerait les paragraphes très négatifs, comme le paragraphe 2. Et la dernière concernerait les paragraphes plus neutres, comme le paragraphe 1.

Un modèle génératif d’apprentissage machine, comme ChatGPT utiliserait alors ces catégories comme exemples. Si on lui demandait de produire un texte positif, il utiliserait les paragraphes très positifs comme guide pour y parvenir. Bien entendu, un moteur comme GPT-3.5, qui alimente ChatGPT, utilise de nombreuses caractéristiques pour créer un texte. Mais cela te donne une idée simplifiée de son fonctionnement.

Le TALN est utilisé pour :

  • La classification des textes, comme l’organisation des réponses aux requêtes en catégories et la détection des éléments indésirables;
  • La génération de texte, comme demander aux robots conversationnels de construire des phrases en prédisant quel mot suivra chaque mot généré;
  • La traduction, comme l’application DeepL, qui utilise des modèles prédictifs d’apprentissage machine pour traduire un texte d’une langue à l’autre; et,
  • Le résumé, qui consiste à prendre de longs morceaux de texte et à créer de courts résumés, en examinant les mots dans leur contexte.

Robots conversationnels

Les robots conversationnels sont l’une des nombreuses applications qui s’appuient sur le TALN. Le terme « robot conversationnel » vient des mots « robot » et « conversation ». Mais il n’est pas question de robots mécaniques dans ce cas-ci. Les robots conversationnels sont des programmes logiciels.

Les robots conversationnels sont des applications que tu peux trouver sur le Web. De nombreuses entreprises utilisent les robots conversationnels pour leur service à la clientèle. Il peut t’arriver d’en voir un apparaître quand tu visites un site Web. Les robots conversationnels sont souvent le premier point de contact avec une entreprise sur son site Web ou ses canaux de médias sociaux. Ils essaient de répondre aux questions des gens sans devoir les mettre en attente pour parler à un agent humain. Ils doivent donc être capables de comprendre la question du client ou de la cliente et de donner la meilleure réponse possible. De nombreux robots conversationnels de base ont un ensemble prédéfini de questions et de réponses. Souvent, on te demande de choisir parmi une liste de questions et de réponses lorsque tu interagis avec ces robots conversationnels. Les moyens dont ils disposent pour offrir de l’aide sont limités. Certains robots conversationnels sont cependant plus sophistiqués. Ils te permettent de taper ta question comme tu la poserais normalement. C’est là qu’intervient le traitement automatique du langage naturel.

Voici une photo en couleur de mains tapant sur un ordinateur portable. Des bulles de texte flottent en avant-plan.
Personne en train de clavarder avec un robot conversationnel (Source : Blue Planet Studio via iStockphoto).
Image - Version texte

Voici une photo en couleur de mains tapant sur un ordinateur portable. Des bulles de texte flottent en avant-plan.

Un nuage de bulles de texte translucides occupe le centre de l’image. La plus grande bulle indique « Bonjour ». À côté de cette bulle, on retrouve une image d’une tête ronde avec deux antennes, portant un casque d’écoute avec un micro. Le reste des bulles sont de tailles différentes et contiennent trois petits points (« ... »), indiquant que des réponses sont en cours de rédaction. Quelques picots orange sont disséminés parmi les bulles.

Les mains de la personne sont posées sur le clavier. Le bras et la poitrine de la personne sont visibles en arrière-plan.

Le traitement automatique du langage naturel permet aux robots conversationnels de comprendre différentes manières de demander une même chose. Cela peut te sembler facile, mais c’est une tâche difficile pour un ordinateur. Pense à toutes les manières dont une personne peut demander : « quel temps fera-t-il aujourd’hui? ». Une personne pourrait dire : « Ai-je besoin d’un parapluie? » ou « Quelle est la météo dehors? » ou encore « Fera-t-il chaud aujourd’hui? ». Les modèles de langage naturel peuvent regrouper les questions en fonction de l’intention du client ou de la cliente. De cette façon, l’entreprise peut former un robot conversationnel à répondre à différentes intentions, plutôt qu’à des questions précisément formulées.

Le TALN peut même aider des entreprises à comprendre comment les clients et les clientes se sentent en fonction de ce qu’ils et elles écrivent. Par exemple, si une personne utilise des mots associés à la colère, le robot conversationnel peut transférer tout de suite l’appel à une personne!

Le TALN ne peut comprendre que les mots d’une personne. Les systèmes plus complexes utilisent aussi d’autres informations provenant de la parole, comme le ton de la voix. Un système qui analyse le ton de la voix peut reconnaître si une personne semble fâchée, triste ou contente. La combinaison du TALN et de la RAP nous rapproche du jour où les ordinateurs pourront comprendre les humains.

ChatGPT

À l’heure actuelle, le robot conversationnel utilisant le TALN le plus connu est probablement ChatGPT. Il a été conçu par OpenAI et est basé sur leur moteur GPT 3.5. ChatGPT est conçu pour générer un texte qui semble, à première vue, avoir été écrit par une personne. Comme tous les robots conversationnels, il peut engager une conversation avec un utilisateur humain. La différence est qu’il peut comprendre et répondre à un éventail de données beaucoup plus large qu’un robot conversationnel typique. ChatGPT peut générer des idées, aider à modifier le langage pour l’adapter à un certain public, ou travailler avec les gens pour réparer un code informatique. Il a été formé à l’aide d’une énorme quantité de textes provenant d’Internet. ChatGPT peut générer des réponses avec le bon contexte et fournir des détails supplémentaires si on le lui demande.

Outils de recherche

Le TALN est un outil essentiel pour les moteurs de recherche et les moteurs de recommandation. Les outils de recherche Web essaient de trouver l’information la plus pertinente en fonction de ce que tu cherches. Pour cela, ils doivent comprendre ce que contiennent les nombreuses pages Web différentes qu’ils peuvent suggérer. C’est-à-dire qu’ils doivent analyser le texte des articles de presse, des blogues et même le langage des vidéos. Le TALN recherche des mots-clés et des phrases précises pour aider les moteurs de recherche à trouver ce que tu cherches.

Filtres à pourriels

Le TALN est aussi utilisé dans les filtres à pourriels (spam). Le TALN aide à détecter les modèles que l’on trouve couramment dans les pourriels. Il peut aider les filtres à mieux repérer ces courriels et à les rediriger.

Shown is a colour illustration of a laptop, a warning symbol, a magnifying glass and an email icon.
Filtre à pourriels (spam) (Source : axel2001 via iStockphoto).
Image - Version texte

Voici une illustration en couleur d’un ordinateur portable, d’un symbole d’avertissement, d’une loupe et d’une icône de courriel.

En bas à gauche, devant le clavier, on retrouve un triangle rose vif avec un point d’exclamation au centre. L’écran de l’ordinateur portable est encombré d’une pile d’enveloppes et de papiers de couleurs vives. En avant-plan, une enveloppe orange est ouverte, et un long rouleau de papier s’étend derrière elle. Une loupe placée sur le message révèle le mot « Spam ». En haut de l’image, une ligne rose pointillée part du papier et mène à un rectangle bleu contenant plusieurs renseignements.

Résumer un texte

Le TALN peut également être utile pour résumer des documents longs ou compliqués. Par exemple, la recherche scientifique est généralement communiquée dans des articles scientifiques qui sont parfois difficiles à lire.

Les outils de TALN peuvent créer de courts résumés de ces articles scientifiques. Ainsi, les scientifiques peuvent trouver et lire les articles les plus pertinents pour leur travail. Les cabinets juridiques utilisent aussi des outils de TALN pour résumer des documents juridiques. Les outils de TALN permettent de trouver rapidement des informations comme des dates, des noms et l’issue d’un procès.

Reconnaissance automatique de la parole

La reconnaissance automatique de la parole (RAP) utilise également le TALN. Elle permet de convertir des fichiers audios en texte. Parler à un robot conversationnel au téléphone, dicter un message texte à ton ami, ou parler à un assistant virtuel comme Alexa ou Siri sont des exemples de RAP. Les outils de recherche sur le Web utilisent aussi la reconnaissance automatique de la parole pour transcrire les vidéos et les fichiers audio comme les balados.

Parmi les applications de reconnaissance automatique de la parole, les plus populaires sont les assistants virtuels intelligents. Siri d’Apple, Cortana de Microsoft, Alexa d’Amazon et l’assistant de Google en sont des exemples. Les assistants virtuels sont des robots conversationnels plus sophistiqués. Leurs performances en TALN et en RAP sont bien plus avancées. Les assistants virtuels peuvent aussi effectuer d’autres types de tâches. Ils peuvent faire jouer de la musique, trouver un document ou rechercher un itinéraire.

Shown is a colour illustration of a large smart home speaker with people walking around it.
Les assistants virtuels intelligents utilisent la reconnaissance de la parole (Source : ribkhan via iStockphoto).
Image - Version texte

Voici une illustration en couleur d’un grand haut-parleur intelligent et de personnes marchant autour.

Le haut-parleur est un cylindre gris ayant une base arrondie et un sommet plat. Il comporte une grille de petits trous et un symbole de microphone blanc sur le devant. Les personnes font à peu près la moitié de la taille du haut-parleur. Deux d’entre elles tiennent un téléphone intelligent, une autre tape sur un ordinateur portable et une autre tend la main vers le symbole de microphone. Au-dessus du haut-parleur, une arche gris pâle présente sept icônes : un crochet de sécurité, une carte SIM, un symbole Wi-Fi, un cadenas, deux bulles contenant trois petits points, un symbole de localisation et un symbole de téléphone. En arrière-plan, quelques nuages gris clair sont éparpillés dans un ciel vert.

Le savais-tu?

Les premiers assistants virtuels avaient des voix de femme. Afin de donner suite aux commentaires reçus de la part des utilisateurs et utilisatrices, certains services offrent maintenant le choix entre une voix d’homme ou de femme. Mais la meilleure solution pourrait être une voix non genrée, comme celle de Q, l’assistant virtuel intelligent.

Tu trouves probablement très pratique d’avoir un assistant personnel, mais il ne vient pas sans inconvénient. Pour qu’il soit prêt à te répondre, il doit t’écouter en tout temps. C’est un risque pour la vie privée. Toutefois, le risque peut être atténué en ajustant quelques paramètres. Fais preuve de jugement avec tes appareils intelligents, et fais attention à ce que tu dis et fais autour d’eux!

Traduction

Le TALN a permis des percées dans le monde des communications multilingues. Les logiciels de traduction automatique sur le Web sont accessibles à toute personne qui dispose d’une connexion Internet. Ensemble, la reconnaissance automatique de la parole et le TALN permettent à des personnes parlant des langues différentes de communiquer en temps réel.

Accessibilité

Le TALN contribue à éliminer les barrières linguistiques pour les personnes ayant une incapacité. Les personnes qui ont une perte auditive peuvent accéder plus facilement aux sous-titrages des contenus vidéo enregistrés et en direct. Il existe des applications d’IA (en anglais) qui permettent aux personnes sourdes de « voir » les sons.

En combinant cette technologie à la vision par ordinateur, il existe un système capable de transformer la langue des signes en parole (en anglais)!

Que nous réserve l’avenir?

Le TALN est une technologie qui évolue très rapidement. En fait, nous avons déjà dû réviser cet article une fois en raison de toutes les avancées de l’IA. De plus en plus d’entreprises trouvent des moyens de l’utiliser.

Les soins de santé constituent un domaine où le TALN peut être utile. Le TALN peut faire gagner du temps aux médecins en posant des questions de base aux patients et patientes avant leur rendez-vous. De tels outils pourraient s’avérer très utiles dans les régions éloignées où la population n’a pas toujours accès à des médecins. Les robots commencent aussi à être utilisés pour s’occuper des gens, comme les personnes âgées. Le TALN peut aider ces robots à mieux comprendre les personnes auprès de qui ils sont utilisés. De plus, le TALN est aussi un outil utile pour évaluer la santé mentale d’une personne.

En conclusion, la prochaine fois que tu feras une recherche en ligne ou que tu parleras à un robot conversationnel, tu sauras que cette conversation serait impossible sans l’intelligence artificielle et l’apprentissage machine.

Parlons sciences remercie la consultante en technologie Melissa Valdez de AI & Quantum pour sa contribution à la révision de ce document d’information.

Le traitement automatique du langage naturel (2019)
Cette page de Reeport explique ce que le TALN et son historique.

Intelligence artificielle: Est-on enfin prêt à discuter avec un assistant vocal non genré? (2019)
Cette page présente le débat éthique d’utiliser la voix genrée pour les assistants virtuels intelligents.

Traitement naturel du langage : tout savoir sur le Natural Language Processing
Cette page explique ce qu’est le TALN et ses applications.

L'évolution du traitement automatique des langues (2018)
Cette vidéo (2 min 37 s) de Thinkovery présente un expert qui explique ce que nécessite les technologies TALN.

Références

Brownlee, J. (2019, Aug. 7). What Is Natural Language Processing? Machine Learning Mastery.

Joshi, N. (2018, Dec. 23). Yes, Chatbots And Virtual Assistants Are Different! Forbes.

Mahler, L. (2015, Feb. 13). What Is NLP and Why Should Lawyers Care? Lawpracticetoday.org

Mortada, D. (2019, Mar. 11). Meet Q, The Gender-Neutral Voice Assistant. npr.

Rouse, M. (2017, Oct.). Virtual assistant (AI assistant). TechTarget.