Aller au contenu principal

Les grands modèles de langage et le prompt

Comment l'IAG génère-elle des contenus ? : Le grand modèle de langage (LLM)

Icon from Flaticon

 

Les contenus générés par l’IA sont des recompositions statistiques de tout ce qui a été appris. Ils ont du sens parce qu’ils respectent les règles grammaticales, visuelles ou musicales extraites des data sets d’entraînement. Ces règles sont mémorisées sous forme d’un Large Language Model (LLM, voir ci-dessous). Cela permet, entre autres, de synthétiser des informations ou de proposer des contenus originaux.

Revenons sur la définition de LLM. Un LLM est large, car il possède énormément de paramètres (de l’ordre de plusieurs milliards), qui sont autant de pièces d’information. C’est un modèle, car il s’agit d’un réseau de neurones ("deep learning") entraîné sur une grande quantité de textes pour produire des tâches non spécifiques. Il est linguistique, car il reproduit la syntaxe et la sémantique du langage naturel humain en prédisant la suite probable pour une certaine entrée. Cela lui permet également d’avoir une «connaissance» générale sur la base des textes d’entraînement. 

 

Extrait du Guide pratique de l'université de Genève : https://www.unige.ch/numerique/fr/plan-daction/ia1/accueil/guide-pratique-ia/

Le fonctionnement des IA génératives s'appuie donc sur des grands modèles de langage afin de produire des réponses appropriées. Ces modèles fonctionnent de la manière suivante :

 

ALLOUCHE Elie, Direction du numérique pour l'éducation, Ministère de l'éducation nationale, de la jeunesse et des sports 

Comment l'IAG génère-elle des contenus ? : Le prompt

Les outils l’IA générative sont divers, car chacun s’appuie sur des ensembles de données différents et proposent des contenus différents (texte, images, vidéos, …). Il est donc important de choisir l’outil adapté à ses besoins.

Il est donc nécessaire de savoir utiliser l’IAG de manière adéquate, raisonnée et responsable. Ceci commence par l’écriture du prompt.

  • Le prompt : une consigne précise

Afin d’avoir rapidement et précisément une réponse de la part d’une IAG, il est nécessaire de réfléchir en amont à son prompt (requête/consigne). Voici une explication de l’écriture d’un prompt avec la méthode ACTIF :

Les problématiques liées aux IAG : fiabilité, biais et stéréotypes

Icon from Flaticon

 

Il est important de prendre en compte, lorsque l’on fait de recherches, les problématiques liées à l’utilisation des outils d’intelligence artificielle et les données sur lesquelles elles s’appuient pour proposer une réponse :

  • L’origine des données d'entraînement est inconnue, donc nous ne savons pas à quel niveau les réponses des outils d’IAG sont fiables
  • Les réponses ont en général des biais et des stéréotypes de genre, de classe etc, car s’appuie sur ce qu’il se trouve sur internet. Il est nécessaire d’en avoir conscience pour prendre de la distance vis-à-vis des réponses données. 

Comment faire réaliser une tâche à un modèle de langage ?

Fiche de prompting

title
Loading...