samedi, décembre 9, 2023

Tendances radar à surveiller : septembre 2023 – O’Reilly


Même si le groupe IA reste le plus important, il convient de noter que la programmation, le Web et la sécurité sont tous plus importants qu’ils ne l’ont été ces derniers mois. L’une des raisons est certainement que nous plaçons l’actualité de l’IA dans d’autres catégories, le cas échéant. Mais je pense aussi qu’il est plus difficile d’impressionner avec l’IA qu’avant. Les discussions sur l’IA ont porté bien davantage sur la réglementation et la propriété intellectuelle, ce qui m’amène à me demander si la législation devrait constituer une catégorie distincte.

Malgré cela, il est important qu’OpenAI permette désormais aux utilisateurs d’API d’affiner leurs applications GPT-4. C’est en tant que service, bien sûr. Et RISC-V semble enfin être sérieusement adopté. Pourrait-il rivaliser avec Atom et Intel ? Nous verrons.

Apprenez plus vite. Creusez plus profondément. Voir plus loin.

IA

  • OpenAI a annoncé ChatGPT Entreprise, une version de ChatGPT qui cible les entreprises clientes. ChatGPT Enterprise offre une sécurité améliorée, la promesse qu’ils ne s’entraîneront pas sur vos conversations, une authentification unique, une console d’administration, un contexte 32K plus large, des performances plus élevées et l’élimination des plafonds d’utilisation.
  • Facebook/Meta a publié Code LLaMA, une version de leur modèle LLaMA 2 spécialisée pour l’écriture de code. Il peut être utilisé pour la génération ou la complétion de code. Sa fenêtre contextuelle est de 100 000 tokens, permettant à Code LLaMA d’être plus précis sur des programmes plus volumineux.
  • OpenAI a annoncé que les utilisateurs de l’API peuvent désormais affiner GPT-3.5 pour leurs propres applications. La mise au point de GPT-4 viendra plus tard. Pour préserver la sécurité, les données de réglage sont transmises via le filtre de modération d’OpenAI.
  • txtai est une base de données d’intégrations open source. Il s’agit d’une base de données vectorielles spécialement conçue pour traiter des problèmes de langage naturel.
  • TexteFX est un ensemble d’outils qui utilisent le modèle PaLM 2 de Google pour jouer avec le langage. Il ne répond pas aux questions et n’écrit pas de poèmes ; il permet aux utilisateurs de voir les possibilités des mots comme une aide à leur propre créativité.
  • Un juge américain a gouverné qu’un système d’IA ne peut pas protéger une œuvre par le droit d’auteur. Dans ce cas, c’est l’IA elle-même, et non l’utilisateur humain, qui devait détenir les droits d’auteur. Cette décision est conforme aux directives du Copyright Office : il ne suffit pas de donner des instructions à un algorithme génératif pour créer une œuvre protégée par le droit d’auteur.
  • Malgré un taux d’erreur d’environ 50 % pour ChatGPT, un étude montre que les utilisateurs préfèrent les réponses de ChatGPT aux questions de programmation aux réponses de StackOverflow. Les réponses complètes, articulées et polies de ChatGPT semblent être la cause de cette préférence.
  • L’IA était à l’ordre du jour de la DefCon et, même si les résultats d’un concours d’équipes rouges ne seront pas publiés avant quelques mois, il est clair que la sécurité reste une réflexion après coupet qu’attaquer les modèles d’IA actuels est extrêmement simple.
  • Reconnaissance des émotions est difficile, voire impossible. Il n’est pas clair qu’il existe des cas d’utilisation crédibles. Les systèmes d’IA sont particulièrement mauvais dans ce domaine. Mais les entreprises créent des produits.
  • Le filigrane a été proposé comme technique permettant d’identifier si le contenu a été généré par l’IA, mais ce n’est pas une panacée. Voilà quelque des questions pour aider à évaluer si les filigranes sont utiles dans une situation donnée.
  • Zoom et Grammaire ont tous deux émis de nouveaux accords de licence qui leur permettent d’utiliser les données collectées auprès des utilisateurs pour former l’IA. Zoom a reculé après la réaction des clients, mais cela soulève la question : d’autres applications suivront-elles ?
  • Utiliser de grands modèles de langage pour le travail ou les loisirs est une chose, mais comment en mettre un en production ? 7 cadres pour servir les LLM examine certains outils de déploiement de modèles de langage.
  • Simon Willison donne des instructions pour exécuter LLaMA 2 sur un Mac. Il fournit également des diapositives et une transcription bien éditée de son parler des LLM à North Bay Python.
  • PhotoGuard est un outil permettant de protéger les photos et autres images contre la manipulation par les systèmes d’IA. Il ajoute des données à l’image d’une manière qui n’est pas détectable par les humains, mais qui introduit des distorsions notables lorsque l’image est modifiée.
  • C2PA est un protocole cryptographique permettant d’attester de la provenance des documents électroniques. Il pourrait être utilisé pour spécifier si les documents sont générés par l’IA.
  • DeepMind de Google a construit un modèle vision-langage-action appelé RT-2 (Transformateur robotique 2) qui combine la vision et le langage avec la capacité de contrôler un robot. Il apprend à la fois à partir de données Web (images et textes) et de données robotiques (interactions avec des objets physiques).

La programmation

  • Maccarons est une extension de VSCode qui vous permet de « déléguer » des blocs de code Python à l’IA (GPT-4). Les parties du code qui sont sous le contrôle de l’IA sont automatiquement mises à jour selon les besoins lorsque le code environnant est modifié.
  • Microsoft est ajout de Python comme langage de script pour les formules Excel. Le code Python s’exécute dans un conteneur Azure qui inclut certaines bibliothèques couramment utilisées, notamment Matplotlib et Pandas.
  • De nombreuses entreprises constituent des équipes d’ingénierie de plate-forme afin de rendre les développeurs de logiciels plus efficaces. Ici Voici quelques idées pour démarrer avec l’ingénierie de plate-forme.
  • Un Google étude de son utilisation interne de Rust conforte l’affirmation selon laquelle Rust facilite la production de code de haute qualité. L’étude également brise un certain nombre de mythes sur la langue. Ce n’est pas aussi difficile à apprendre que la plupart des gens le pensent (là encore, il s’agit d’une étude de Google).
  • deno_python est un module Javascript qui permet l’intégration entre Javascript (fonctionnant sur Deno) et Python, permettant aux programmeurs Javascript d’appeler des bibliothèques Python importantes et d’appeler des fonctions Python.
  • Le Conseil de pilotage Python a annoncé qu’il rendra le Global Interpreter Lock (GIL) facultatif dans une future version de Python. Le GIL de Python a longtemps été un obstacle à une informatique multithread efficace. Le changement sera rétrocompatible.

la toile

  • Google controversé Intégrité de l’environnement Web La proposition fournit un moyen pour les serveurs Web d’authentifier cryptographiquement le logiciel de navigation effectuant une demande. WEI pourrait potentiellement réduire la fraude en ligne, mais il présente également des risques importants en matière de confidentialité.
  • Trafilature est un nouvel outil de web scraping conçu avec des recherches quantitatives (par exemple, l’assemblage de données de formation pour des modèles de langage). Il peut extraire du texte et des métadonnées du HTML et générer une sortie dans un certain nombre de formats.
  • Astro est encore un autre framework Web open source conçu pour des performances élevées et une facilité de développement.
  • Même si la « guerre des navigateurs » est loin derrière nous, il est encore difficile pour les développeurs d’écrire du code qui fonctionne correctement sur tous les navigateurs. Référence est un projet du W3C Groupe communautaire WebDX qui spécifie les fonctionnalités sur lesquelles les développeurs Web peuvent s’appuyer dans les navigateurs les plus utilisés.
  • Comment les grands modèles linguistiques ont contribué à la refonte d’un site Web soulève des questions importantes : quand arrêtez-vous d’utiliser ChatGPT et terminez-vous le travail vous-même ? Quand votre propre capacité commence-t-elle à s’atrophier ?
  • Vous vous souvenez de Flash ? Il a un musée… Et les jeux Flash fonctionneront dans un navigateur moderne en utilisant Ébourifferun émulateur Flash Player écrit en WebAssembly.

Sécurité

  • La preuve de travail arrive sur le réseau Tor. Il est utilisé comme défense contre les attaques par déni de service. PoW est désactivé la plupart du temps, mais lorsque le trafic semble inhabituellement élevé, il peut s’activer, obligeant les utilisateurs à « prouver » leur humanité (en fait, leur volonté d’effectuer un travail).
  • UN rétrospective sur l’attaque MoveIT de cette année tire des conclusions importantes sur la protection de vos actifs. La cartographie de la chaîne d’approvisionnement, la gestion des risques liés aux tiers, le zéro confiance et les tests d’intrusion continus sont autant d’éléments importants d’un plan de sécurité.
  • Bitwarden a libéré un gestionnaire de secrets cryptés de bout en bout open source. Le gestionnaire de secrets permet une distribution sécurisée des clés API, des certificats et autres données sensibles.
  • Le gouvernement américain a annoncé le AI Cybersecurity Challenge (AIxCC). AIxCC est un concours de deux ans visant à créer des systèmes d’IA capables de sécuriser les logiciels critiques. Il y a 18,5 millions de dollars en prix, plus la possibilité d’un financement DARPA pour un maximum de sept entreprises.
  • OSC&R est l’Open Source Supply Chain Attack Reference, un nouveau projet qui catalogue et décrit les techniques utilisé pour attaquer les chaînes d’approvisionnement en logiciels. Il est calqué sur le framework ATT&CK de MITRE.
  • Le Groupe Lapsus$ est devenu l’un des acteurs de menace les plus efficaces, bien qu’il soit relativement peu sophistiqué. Ils s’appuient sur la persévérance, une ingénierie sociale intelligente et l’analyse des points faibles de la sécurité d’une organisation plutôt que de compromettre l’infrastructure.
  • La NSA a émis un rapport qui donne des conseils sur la façon de protéger les systèmes contre les bogues de sécurité de la mémoire.
  • Bruce Schneier a un point de vue important sur le conséquences à long terme de la Vents solaires attaque. Ces conséquences incluent le vol d’une clé de signature de compte client Azure qui à son tour a été utilisée par des attaquants pour accéder aux comptes de messagerie du gouvernement américain.
  • Une nouvelle génération d’attaques de ransomwares est ciblant les professionnels de l’informatique via de fausses publicités pour des outils informatiques. Même si les professionnels de l’informatique sont (vraisemblablement) plus méfiants et plus conscients que les autres utilisateurs, ils constituent également des cibles de grande valeur.

Matériel

  • Les producteurs de parmesan expérimentent ajout de micropuces à la croûte du fromage pour authentifier le véritable fromage.
  • L’adoption de RISC-V, une architecture de jeu d’instructions open source libre de droits pour les microprocesseurs, est en augmentation. Pourrait-il déplacer le BRAS?
  • Des bugs d’exécution spéculative ont été découverts pour Intel récent («Chute« ) et AMD (« Création») processeurs. Correctifs pour Linux Ont été libérés.

Opérations

L’informatique quantique

  • Peter Shor, inventeur de l’algorithme quantique de factorisation des nombres premiers (qui pourrait à son tour être utilisé pour briser la cryptographie la plus moderne qui n’est pas résistante aux quantiques), a publié le notes de lecture du cours sur l’informatique quantique qu’il enseigne au MIT.
  • Un ordinateur quantique Honeywell a été utilisé à trouver un matériel qui peut améliorer l’efficacité des cellules solaires. Il est probable que les premières applications de l’informatique quantique impliqueront la simulation de phénomènes quantiques plutôt que le calcul pur.

Crypto-monnaie

  • Si vous êtes intéressé par WorldCoin à balayage d’iris, un cryptographe analyses les promesses de confidentialité faites par leur système. Il reste sceptique, mais s’en sort moins impressionné qu’il ne l’espérait.
  • Paypal a introduit un pièce stable qui prétend être entièrement soutenu par le dollar américain.

La biologie



Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles