L’IA continue de se propager. Ce mois-ci, la catégorie IA se limite aux développements sur l’IA elle-même ; les outils de programmation de l’IA sont traités dans la section Programmation.
L’un des plus gros problèmes de l’IA de nos jours est d’ordre juridique. Getty Images protège les clients qui utilisent leur IA générative contre les poursuites en matière de droits d’auteur ; Microsoft fait de même pour les utilisateurs de ses produits Copilot.
Également sur le plan juridique : le passage de Hashicorp à une licence non open source a conduit la fondation OpenTF à créer OpenTofu, un fork du produit Terraform de Hashicorp. Bien qu’il soit trop tôt pour le dire, OpenTofu a rapidement attiré de nombreux adeptes.
IA
- OpenAI a annoncé que ChatGPT prendra en charge les chats vocaux. Son personnage vocal sera-t-il aussi verbeux et obséquieux que son personnage textuel ?
- Getty Image a annoncé un modèle de création d’images génératives qui a été formé exclusivement sur des images dont Getty détient les droits d’auteur. Getty remboursera les frais juridiques des clients s’ils sont poursuivis pour violation du droit d’auteur. Getty rémunère les artistes pour l’utilisation de leurs œuvres.
- Sony et Meta ont développé de nouvelles façons de mesurer les préjugés raciaux en vision par ordinateur. Sony a développé un modèle bidimensionnel pour un teint qui représente la teinte en plus de l’obscurité. Meta a publié un ensemble de données open source nommé FACETTE pour tester les modèles d’IA.
- Le Toyota Research Institute a construit des robots avec grands modèles de comportement qui utilisent des techniques issues de grands modèles de langage. Ces robots se sont révélés beaucoup plus polyvalents et plus faciles à entraîner que les robots précédents.
- L’IA ouverte a libéré DALL-E 3, une nouvelle IA de synthèse d’images construite sur ChatGPT. Il est bien meilleur pour comprendre des invites simples sans conception d’invites complexes. Cela deviendra une fonctionnalité de ChatGPT+ et a été intégré au Bing de Microsoft.
- Dans un effort pour étouffer un flot de Livres générés par l’IA, Amazon a limité les auteurs à trois livres par jour. Cela semble quand même beaucoup : il est peu probable qu’un auteur humain puisse produire un livre par jour, encore moins trois.
- Mises à jour de Google’s Bard incluent l’intégration avec Maps, Google Docs et un bouton « Vérifiez votre réponse ». La vérification semble se limiter à vérifier les faits à l’aide des résultats de recherche (pour lesquels Bard donne des citations), mais elle reste utile.
- Optimisation par invite est une nouvelle technique pour développer des invites efficaces. OPRO utilise un modèle d’IA pour optimiser les invites utilisées pour résoudre un problème. Commencer par « Respirez profondément » est évidemment utile.
- DeepMind de Google a développé un modèle d’IA capable d’identifier des variantes de gènes susceptibles de provoquer des maladies.
- La concurrence dans le domaine des bases de données vectorielles s’intensifie. LanceDB est encore une autre entrée. Il est open source et est conçu pour être intégré dans des applications, sans serveur externe à gérer. Les données sont stockées sur des disques durs locaux, ce qui les rend conceptuellement similaires à SQLite.
- Stability AI a publié une nouvelle démo d’IA générative pour la musique, appelée (sans surprise) Audio stable. Les approches de l’IA générative en matière de musique sont à la traîne par rapport à l’art ou au texte génératif, mais Stable Audio a clairement fait des progrès.
- Microsoft a annoncé qu’il assumera la responsabilité de la violation du droit d’auteur par tous ses produits Copilot (pas seulement GitHub). Ils prétendent avoir intégré des garde-corps et des filtres dans leurs produits pour empêcher toute contrefaçon.
- HuggingFace propose désormais Cluster de formation en tant que service. Ce service vous permet d’utiliser leur infrastructure pour former de grands modèles de langage à grande échelle. La page d’accueil vous permet de créer une estimation des coûts, basée sur la taille du modèle, la taille des données d’entraînement, ainsi que le nombre et le type de GPU.
- Le suivi des pixels signifie désormais quelque chose de différent. MetaAI a annoncé CoTracker, un outil basé sur Transformer qui suit le mouvement de plusieurs points dans une vidéo. Le code source est disponible sur GitHub sous licence Creative Commons.
- Google a libéré DuetAI, ses extensions basées sur l’IA pour sa combinaison Workspace (GMail, Docs, etc.). Bien qu’il existe un essai gratuit, des frais supplémentaires seront facturés pour l’utilisation de Duet. Il peut prendre des notes sur les réunions dans Google Meet, rédiger des e-mails et des rapports, participer à des discussions, etc.
- DeepMind de Google a lancé SynthID, un outil de filigrane pour les images IA. Il comprend des outils de filigrane et de détection de la présence de filigranes. SynthID est encore expérimental et disponible uniquement pour les utilisateurs d’Imagen de Google, qui lui-même n’est disponible que dans Vertex AI.
La programmation
- Le logiciel libre et open source Godot le moteur de jeu est se révélant être une alternative à Unité. Même si Unity a (pour l’essentiel) renoncé à exiger des frais par installation, il a perdu la confiance d’une grande partie de sa communauté de développement.
- OuvrirTofule fork d’OpenTF de Terraform de Hashicorp, a été soutenu par la Linux Foundation et adopté par plusieurs grandes entreprises.
- DSpy est une alternative à Langchain et Llamaindex pour la programmation d’applications avec de grands modèles de langage. Il met l’accent sur la programmation plutôt que sur l’incitation. Il minimise le besoin d’étiquetage et d’« ingénierie d’invite » et revendique la capacité d’optimiser la formation et l’incitation.
- Zep est encore un autre cadre pour créer des applications avec de grands modèles de langage et les mettre en production. Il intègre Llamaindex et Langchain.
- Les outils qui analysent le code source et retracent ses origines dans les projets open source sont apparaissant. Le développement et l’utilisation de ces outils sont pilotés par des générateurs de code automatisés qui peuvent enfreindre les licences open source.
- Le Terrain de jeu WebAssembly Go est un compilateur Go et un environnement d’exécution qui s’exécute entièrement dans le navigateur.
- Wasmer est un bac à sable pour exécuter des applications WebAssembly. Il vous permet d’exécuter des applications Wasm sur la ligne de commande ou dans le cloud avec un packaging extrêmement léger.
- Conseils est un langage de programmation permettant de contrôler de grands modèles de langage.
- Microsoft et Anaconda ont lancé Python dans Excelqui permet aux utilisateurs d’Excel d’intégrer Python dans des feuilles de calcul.
- Rivet est un IDE graphique permettant de développer des applications pour de grands modèles de langage. Avec un minimum de codage, les utilisateurs peuvent créer des flux d’invites à l’aide d’outils tels que des bases de données vectorielles. Il fait partie d’un écosystème croissant d’outils low-code pour le développement de l’IA.
- JetBrains a libéré RouilleRover, un nouvel IDE pour Rust. RustRover n’intègre pas l’IA, bien qu’il ait la capacité de suggérer des corrections de bugs. Il prend en charge la collaboration et intègre GitHub, la chaîne d’outils Rust (bien sûr) et des outils de tests unitaires.
- Refacter est un nouveau modèle de langage conçu pour prendre en charge la refactorisation ; il comprend un support de remplissage au milieu. Il est relativement petit (1,6 B de paramètres) et offre des performances équivalentes à celles d’autres modèles de langage testables publiquement.
- HuggingFace a développé un nouveau framework d’apprentissage automatique pour Rust appelé Bougie. Candle inclut la prise en charge du GPU. Le dépôt GitHub renvoie à un certain nombre d’exemples.
Sécurité
- Google, Apple et Mozilla ont signalé une grave vulnérabilité dans la bibliothèque de compression d’images WebP qui est activement exploitée. Correctifs sont dans la version stable actuelle de Chrome et d’autres navigateurs, mais d’autres applications qui s’appuient sur WebP sont vulnérables.
- La NSA, le FBI et la Cybersecurity and Infrastructure Security Agency ont publié un Fiche d’information sur la cybersécurité sur les Deepfakes qui comprend des conseils sur la détection des deepfakes et sur la défense contre eux.
- Google publie un API pour leur Outline VPN aux développeurs d’intégrer le VPN dans leurs produits. Outline a été utile pour échapper à la censure du gouvernement. L’API et le SDK faciliteront la création de solutions de contournement lorsque les gouvernements apprendront à détecter l’utilisation d’Outline.
- Tout programme de désinstallation suffisamment avancé ne se distingue pas des logiciels malveillants. Il faut le lire juste pour le titre. Une belle analyse.
- Les failles de sécurité se produisent fréquemment lorsqu’un employé quitte une entreprise, mais conserve l’accès aux applications ou services internes. Accès juste à temps minimise le risque en accordant l’accès aux services uniquement en cas de besoin et pour une durée limitée.
- Rares sont les histoires de sécurité qui se terminent bien. En voici un qui fait: le FBI a réussi à infiltrer le botnet Quakbot, à rediriger le trafic vers ses propres serveurs et à utiliser Quakbot pour désinstaller automatiquement son propre logiciel.
- Comment maintenir la sécurité des logiciels mis à jour à partir d’un référentiel? Une bonne gestion des clés (y compris le maintien des clés hors ligne) et l’expiration des anciennes métadonnées sont importantes.
- MalDoc est une nouvelle attaque dans laquelle un document Word contenant des macros VB malveillantes est intégré dans un document PDF. Le document est traité comme un PDF par les scanners de logiciels malveillants, mais peut être ouvert soit sous forme de document Word (qui exécute les macros), soit sous forme de PDF.
Confidentialité
- Recherche de Mozilla a montré que les voitures connectées sont terribles pour la vie privée. Ils collectent des données personnelles, y compris des vidéos, et les renvoient au fabricant, qui peut les vendre, les transmettre aux forces de l’ordre ou les utiliser d’une autre manière sans consentement. La gestion des données ne répond pas aux normes minimales de sécurité.
- Le Protocole de signal, un protocole de chiffrement de bout en bout, a été mis à niveau pour la cryptographie post-quantique. Le protocole Signal est utilisé par l’application Signal, la messagerie RCS de Google et WhatsApp.
la toile
- Deux nouveaux projets décentralisés fournissent des services qui n’étaient auparavant disponibles que via des serveurs centralisés : Calme, une application de chat en équipe qui constitue une alternative à Slack et Discord ; et Cachets de la posteun service de bookmarking social qui succède au défunt del.icio.us.
- Ondulation est l’éditeur audio Audacity porté sur le navigateur : un autre tour de force pour WASM.
- Cory Doctorow entretien sur la sauvegarde du Web ouvert est une lecture incontournable. L’interopérabilité est la clé.
- LLM Web prend désormais en charge LLaMA 2 dans le navigateur! Tout s’exécute dans le navigateur, en utilisant WebGPU pour l’accélération GPU. (Chrome uniquement. Préparez-vous à un long téléchargement lorsque vous essayez la démo.)
Matériel
- L’écriture la plus ancienne de l’humanité est conservée sur céramique. C’est peut-être aussi l’avenir du stockage de données : une startup a développé ruban à revêtement céramique avec un stockage allant jusqu’à 1 pétaoctet par bande. Un centre de données pourrait facilement héberger des bandes d’une valeur d’un Yottabyte.
- Qualcomm fait un gros investissement dans RISC-V. RISC-V est une architecture de jeu d’instructions open source. Nous avons dit à plusieurs reprises que RISC-V était sur le point de concurrencer ARM et Intel ; l’adoption par un fournisseur comme Qualcomm est une étape importante sur cette voie.
L’informatique quantique
- Les chercheurs ont utilisé un ordinateur quantique pour ralentir un processus chimique d’un facteur 100 milliards, leur permettant de l’observer. Cette expérience démontre l’utilisation d’un ordinateur quantique comme outil de recherche, outre sa capacité de calcul.
- IBM a annoncé un important percée dans la correction d’erreurs quantiques. Bien que la QEC reste un problème difficile et non résolu, leurs travaux réduisent d’un facteur 10 le nombre de qubits physiques nécessaires pour construire un qubit virtuel corrigé des erreurs.
La biologie
- Outils de bricolage qui automatisent les systèmes d’administration d’insuline pour gérer le diabète sont de plus en plus acceptés et peuvent largement surpasser les systèmes commerciaux. Un système DIY a a reçu l’autorisation de la FDA.