mardi, novembre 28, 2023

Nvidia teste une IA générative pour ses ingénieurs



Dans un discours d’ouverture à la Conférence internationale IEEE/ACM sur la conception assistée par ordinateur Lundi, directeur de la technologie de Nvidia Bill Dally a révélé que la société avait testé un une IA à grand langage pour augmenter la productivité de ses concepteurs de puces.

« Même si nous les rendions 5 pour cent plus productifs, c’est une énorme victoire », a déclaré Dally dans une interview avant la conférence. Nvidia ne peut pas encore prétendre avoir atteint cet objectif. Le système, appelé ChipNeMo, n’est pas prêt pour le genre de procès à grande échelle – et long – qui prouverait vraiment sa valeur. Mais un groupe de bénévoles à Nvidia l’utilise, et il y a des indications positives, a déclaré Dally.

ChipNeMo est une version spécialement adaptée d’un grand modèle de langage. Cela commence comme un LLM composé de 43 milliards de paramètres qui acquièrent ses compétences à partir d’un billion de jetons (unités linguistiques fondamentales) de données. «C’est comme lui donner une éducation en arts libéraux», a déclaré Dally. « Mais si vous souhaitez l’envoyer aux études supérieures et le spécialiser, vous l’affinez sur un corpus de données particulier… dans ce cas, la conception de puces. »

Cela a pris deux étapes supplémentaires. Premièrement, ce modèle déjà formé a été à nouveau formé sur 24 milliards de jetons de données spécialisées. Douze milliards de ces jetons provenaient de documents de conception, de rapports de bogues et d’autres données internes en anglais accumulées au cours des 30 années de travail de Nvidia dans la conception de puces. Les 12 milliards restants provenaient de code, comme le langage de description de matériel Verilog et de scripts permettant d’exécuter des tâches avec des outils d’automatisation de la conception électronique industrielle (EDA). Enfin, le modèle résultant a été soumis à un « réglage fin supervisé », une formation sur 130 000 exemples de conversations et de conceptions.

Le résultat, ChipNeMo, s’est vu attribuer trois tâches différentes : en tant que chatboten tant que AED-outil de rédaction de scripts et de résumé des rapports de bogues.

Agir comme un chatbot pour les ingénieurs pourrait faire gagner du temps aux concepteurs, a déclaré Dally. « Les designers seniors passent beaucoup de temps à répondre aux questions des designers juniors », a-t-il déclaré. En tant que chatbot, l’IA peut faire gagner du temps aux concepteurs seniors en répondant à des questions qui nécessitent de l’expérience, comme ce que peut signifier un signal étrange ou comment un test spécifique doit être exécuté.

Les chatbots, cependant, sont connus pour leur volonté de mentir lorsqu’ils ne connaissent pas la réponse et leur tendance à halluciner. Les développeurs de Nvidia ont donc intégré une fonction appelée génération augmentée par récupération dans ChipNeMo pour le maintenir au niveau. Cette fonction oblige l’IA à récupérer des documents à partir des données internes de Nvidia pour sauvegarder ses suggestions.

L’ajout de la génération augmentée par récupération « améliore considérablement la précision », a déclaré Dally. « Plus important encore, cela réduit les hallucinations. »

Dans sa deuxième application, ChipNeMo a aidé les ingénieurs à effectuer des tests sur les conceptions et leurs parties. « Nous utilisons de nombreux outils de conception », a déclaré Dally. « Ces outils sont assez compliqués et impliquent généralement de nombreuses lignes de script. » ChipNeMo simplifie le travail du concepteur en fournissant une « interface humaine très naturelle pour ce qui autrement serait des commandes très obscures ».

Le cas d’utilisation final de ChipNeMo, l’analyse et la synthèse des rapports de bogues, « est probablement celui où nous voyons le plus tôt possible les perspectives de gain de productivité le plus important », a déclaré Dally. Lorsqu’un test échoue, a-t-il expliqué, il est enregistré dans le système de rapport de bogues interne de Nvidia, et chaque rapport peut inclure des pages et des pages de données détaillées. Ensuite, un « ARB » (abréviation de « action requise par ») est envoyé à un concepteur pour un correctif, et le temps commence à tourner.

ChipNeMo résume les nombreuses pages du rapport de bug en un seul paragraphe, accélérant ainsi les décisions. Il peut même rédiger ce résumé en deux modes : un pour l’ingénieur et un pour le manager.

Fabricants d’outils de conception de puces, tels que Synopsis et Cadence, se sont plongés dans l’intégration de l’IA dans leurs systèmes. Mais selon Dally, ils ne pourront pas réaliser la même chose que Nvidia recherche.

« Ce qui nous permet d’y parvenir, ce sont 30 ans de documents de conception et de code dans une base de données », a-t-il déclaré. ChipNeMo apprend « de toute l’expérience de Nvidia ». Les sociétés EDA ne disposent tout simplement pas de ce genre de données.

À partir des articles de votre site

Articles connexes sur le Web

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles