vendredi, décembre 1, 2023

L’incitation n’est pas la compétence la plus importante – O’Reilly


Anant Agarwal, professeur au MIT et fondateur de la plateforme éducative EdX, a récemment fait sensation en en disant cette ingénierie rapide était la compétence la plus importante que vous puissiez acquérir. Et qu’on pouvait apprendre les bases en deux heures.

Même si je reconnais que concevoir de bonnes invites pour l’IA est une compétence importante, Agarwal exagère son cas. Mais avant d’expliquer pourquoi, il est important de réfléchir à ce que signifie l’ingénierie rapide.

Apprenez plus vite. Creusez plus profondément. Voir plus loin.

Les tentatives pour définir l’ingénierie rapide se répartissent en deux catégories :

  • Proposer des invites intelligentes pour qu’une IA fasse ce que vous voulez tout en étant assise devant votre ordinateur portable. Cette définition est essentiellement interactive. On peut se demander si cela devrait être appelé « ingénierie » ; à ce stade, il s’agit plus d’un art que d’une science appliquée. C’est probablement la définition qu’Agarwal a en tête.
  • Concevoir et écrire des systèmes logiciels qui génèrent automatiquement des invites. Cette définition n’est pas interactive ; il s’agit d’automatiser une tâche pour la rendre plus facile à réaliser pour les autres. Ce travail relève de plus en plus de la rubrique CHIFFON (Retrieval Augmented Generation), dans lequel un programme prend une requête, recherche les données pertinentes pour cette requête et regroupe le tout dans une invite complexe.

La conception de systèmes d’invite automatisés est clairement importante. Cela vous donne beaucoup plus de contrôle sur ce qu’une IA est susceptible de faire ; si vous regroupez les informations nécessaires pour répondre à une question dans l’invite et dites à l’IA de limiter sa réponse aux informations incluses dans ce package, elle est beaucoup moins susceptible d’« halluciner ». Mais c’est une tâche de programmation qui ne s’apprend pas en quelques heures ; cela implique généralement de générer des intégrations, à l’aide d’une base de données vectorielle, puis de générer une chaîne d’invites auxquelles répondent différents systèmes, de combiner les réponses et éventuellement de générer davantage d’invites. Les bases pourraient-elles être apprises en quelques heures ? Peut-être, si l’apprenant est déjà un programmeur expert, mais c’est ambitieux et peut nécessiter une définition de « base » qui place la barre très basse.

Qu’en est-il de la première définition interactive ? Il convient de noter que toutes les invites ne sont pas égales. Les invites pour ChatGPT sont essentiellement du texte de forme libre. Le texte de forme libre semble simple, et il l’est au début. Cependant, des invites plus détaillées peuvent ressembler à des essais, et lorsque vous les démontez, vous réalisez qu’il s’agit essentiellement de programmes informatiques. Ils indiquent à l’ordinateur quoi faire, même s’ils ne sont pas écrits dans un langage informatique formel. Les invites pour une IA de génération d’images comme Midjourney peuvent inclure des sections écrites dans un métalangage presque formel qui spécifie des exigences telles que la résolution, le rapport hauteur/largeur, les styles, les coordonnées, etc. Il ne s’agit pas de programmer en tant que tel, mais de créer une invite qui produit une sortie de qualité professionnelle cela ressemble beaucoup plus à de la programmation qu’à « un tarsier combattant un python ».

Ainsi, la première chose que tout le monde doit apprendre à propos des invites est qu’écrire de très bonnes invites est plus difficile qu’il n’y paraît. Votre première expérience avec ChatGPT sera probablement « Wow, c’est incroyable », mais à moins que vous ne parveniez à dire précisément à l’IA ce que vous voulez, votre 20e expérience sera probablement « Wow, c’est ennuyeux ».

Deuxièmement, je ne contesterais pas l’affirmation selon laquelle n’importe qui peut apprendre les bases de la rédaction de bonnes invites en quelques heures. La chaîne de pensée (dans laquelle l’invite comprend quelques exemples montrant comment résoudre un problème) n’est pas difficile à comprendre. L’inclusion de preuves que l’IA doit utiliser dans le cadre de l’invite n’inclut pas non plus. La plupart des autres modèles qui créent des invites efficaces ne le sont pas non plus. Il y a étonnamment peu de magie ici. Mais il est important de prendre du recul et de réfléchir à la chaîne de réflexion nécessaire : vous devez dire à l’IA comment résoudre votre problème, étape par étape, ce qui signifie que vous devez d’abord savoir comment résoudre votre problème. Vous devez avoir (ou créer) d’autres exemples que l’IA peut suivre. Et vous devez décider si le résultat généré par l’IA est correct. En bref, vous devez en savoir beaucoup sur le problème que vous demandez à l’IA de résoudre.

C’est pourquoi de nombreux enseignants, notamment en sciences humaines, sont enthousiasmés par l’IA générative. Lorsqu’il est bien utilisé, c’est engageant et ça encourage les étudiants à en apprendre davantage: apprendre les bonnes questions à poser, faire des recherches approfondies pour retrouver les faits, réfléchir attentivement à la logique de la réponse de l’IA, décider si cette réponse a du sens ou non dans son contexte. Les étudiants qui rédigent des invites pour l’IA doivent réfléchir attentivement aux arguments qu’ils souhaitent faire valoir, à la manière dont ils souhaitent les présenter et aux faits à l’appui à utiliser. j’ai fait un argument similaire sur l’utilisation de l’IA en programmation. Les outils d’IA n’élimineront pas la programmation, mais ils mettront davantage l’accent sur des activités de niveau supérieur : comprendre les besoins des utilisateurs, comprendre la conception des logiciels, comprendre la relation entre les composants d’un système beaucoup plus vaste et élaborer une stratégie sur la manière de résoudre un problème. (Sans parler du débogage et des tests.) Si l’IA générative nous aide à mettre fin à l’idée selon laquelle la programmation consiste à utiliser des personnes antisociales pour écrire des lignes de code, et nous aide à réaliser qu’il s’agit en réalité d’êtres humains qui comprennent les problèmes et réfléchissent à la manière de les résoudre. eux, la profession de programmeur sera dans une meilleure situation.

Je n’hésiterais pas à conseiller à quiconque de passer deux heures à apprendre les bases de la rédaction de bonnes invites, ou 4 ou 8 heures, d’ailleurs. Mais la véritable leçon à retenir ici est que l’incitation n’est pas la chose la plus importante que l’on puisse apprendre. Pour être vraiment doué en matière d’invite, vous devez développer une expertise sur le sujet de l’invite. Vous devez devenir plus expert dans ce que vous faites déjà, qu’il s’agisse de programmation, d’art ou de sciences humaines. Vous devez vous intéresser au sujet, pas à l’IA. L’IA n’est qu’un outil : un très bon outil qui fait des choses inimaginables il y a seulement quelques années, mais qui reste un outil. Si vous cédez à la séduction de penser que l’IA est un dépositaire d’expertise et de sagesse qu’un humain ne pourrait pas obtenir, vous ne pourrez jamais l’utiliser de manière productive.

J’ai rédigé une thèse de doctorat sur la littérature anglaise de la fin du XVIIIe et du début du XIXe siècle. Je n’ai pas obtenu ce diplôme pour qu’un ordinateur puisse tout savoir sur le romantisme anglais. Je l’ai eu parce que je voulais savoir. « Vouloir savoir » est exactement ce qu’il faut pour rédiger de bonnes invites. À long terme, la volonté d’apprendre quelque chose par soi-même sera bien plus importante que quelques heures de formation sur des modèles d’incitation efficaces. Utiliser l’IA comme raccourci pour ne pas avoir à apprendre est un grand pas vers la non-pertinence. La « volonté d’apprendre » est ce qui maintiendra votre pertinence et celle de votre travail à l’ère de l’IA.



Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles