vendredi, décembre 1, 2023

Exclusif : Stability AI apporte un réglage avancé de la 3D et de l’image à Stable Diffusion


VentureBeat présente : AI Unleashed – Un événement exécutif exclusif pour les leaders des données d’entreprise. Réseautez et apprenez avec vos pairs du secteur. Apprendre encore plus


IA de stabilité a annoncé aujourd’hui plusieurs nouvelles améliorations de sa plateforme Stable Diffusion. Ces mises à jour offrent non seulement de nouvelles fonctionnalités passionnantes pour la conversion texte-image, mais s’aventurent également dans le domaine de la création de contenu 3D.

L’amélioration la plus notable est le tout nouveau modèle 3D stable. Jusqu’à présent, Stable Diffusion travaillait principalement sur la génération d’images bidimensionnelles (2D). Le modèle Stable 3D va changer cela, en fournissant des fonctionnalités qui pourraient aider à tout type de création de contenu 3D, y compris la conception graphique et même le développement de jeux vidéo.

Parallèlement à son incursion dans la génération de contenu 3D, Stability AI a introduit l’outil Sky Replacer, conçu pour faire exactement ce que son nom l’indique : remplacer le ciel dans des images 2D.

La plate-forme Stable Diffusion propose également désormais un réglage fin stable, conçu pour aider les entreprises à accélérer le processus de réglage fin de l’image pour des cas d’utilisation spécifiques.

Événement

L’IA libérée

Une soirée exclusive d’informations et de réseautage sur invitation uniquement, conçue pour les cadres supérieurs d’entreprise supervisant les piles de données et les stratégies.

Apprendre encore plus

De plus, la société intégrera un filigrane invisible pour l’authentification du contenu dans les images générées par l’API Stability AI. Les nouvelles mises à jour visent à aider les entreprises avec des pipelines de développement créatifs, alors que l’IA générative fait de plus en plus partie des flux de travail courants.

« Il s’agit d’apporter aux conteurs créatifs les outils dont ils ont besoin pour avoir ce niveau de contrôle supplémentaire sur les images », a déclaré Emad Mostaque, PDG de Stability AI, à VentureBeat dans une interview exclusive.

Stable Diffusion ajoute des fonctionnalités dans un paysage GenAI de plus en plus compétitif

Les avancées de Stability AI surviennent à un moment où le marché de la génération de texte en image devient très compétitif.

Adobe a visé le marché avec son Outils Firefly qui sont étroitement intégrés au logiciel de conception de l’entreprise. À mi-parcours ajoute de plus en plus de nouvelles fonctionnalités à sa technologie pour aider les concepteurs à générer des images. Pour ne pas être en reste, OpenAI a récemment publié son DALL-E 3 modèles avec des capacités améliorées pour générer du texte à l’intérieur des images.

Mostaque est bien conscient de ses concurrents et vise à aider à différencier Stability AI de plusieurs manières. En particulier, il a souligné que son entreprise s’éloigne désormais du simple modèle pour se concentrer sur la création d’un pipeline créatif. Avec les nouvelles fonctionnalités Sky Replacer et Fine Tuning, il a noté qu’il s’agissait de deux étapes supplémentaires qui vont au-delà de ce qui se trouve dans un modèle de base de base pour générer des images.

Sky Replacer n’est pas seulement une fonctionnalité, c’est l’objectif d’un cas d’utilisation professionnel

Le concept de remplacement d’un arrière-plan dans une image n’est pas nouveau. Dans les applications d’IA non génératives, les arrière-plans sont généralement remplacés par des techniques telles que les écrans verts et les touches chromatiques.

Mostaque a déclaré que Stability AI s’appuie sur ces techniques classiques et automatise le flux de travail pour rendre le processus rapide et efficace pour les utilisateurs professionnels. Changer la couleur d’arrière-plan du ciel ne consiste pas seulement à ajouter une certaine forme de créativité, c’est une fonctionnalité qui a un cas d’utilisation très spécifique et pratique.

« Sky Replacer est idéal pour l’immobilier par exemple », a déclaré Mostaque.

Mostaque a noté que les utilisateurs souhaitent pouvoir avoir différents arrière-plans, avec différents effets d’éclairage. Fondamentalement, il a souligné qu’il s’agit avant tout d’offrir un contrôle, car les organisations disposent de leurs propres flux de travail pour générer des images et du contenu. Ce que fait Stability AI, c’est créer des flux de travail optimisés pour permettre le contrôle requis par différents cas d’utilisation.

« Sky Replacer est le premier d’une série de produits que nous allons proposer et qui sont très spécifiques à l’industrie et à l’entreprise, en s’appuyant sur les expériences que nous avons vécues au cours des six à 12 derniers mois », a-t-il déclaré.

Stable 3D étend Stable Diffusion pour de nouveaux cas d’utilisation

Le nouveau modèle Stable 3D fonctionne en étendant le modèle de diffusion utilisé dans Stable Diffusion pour inclure des ensembles de données 3D supplémentaires et une vectorisation.

« Je suis incroyablement enthousiasmé par la possibilité de créer des mondes entiers en 3D », a déclaré Mostaque.

Mostaque a expliqué que Stable 3D a été construit à partir du travail de Stable Diffusion et de Stability AI sur Objaverse-XL, qui est l’un des plus grands ensembles de données 3D ouverts au monde. La création et le rendu d’images 3D ont longtemps été un processus gourmand en ressources, mais Mostaque est optimiste quant au fait que Stable 3D sera plus efficace que les approches traditionnelles de génération d’images 3D. Il a souligné que l’IA stable n’en était encore qu’à ses débuts, mais il est optimiste que la technologie évoluera et se développera régulièrement au fil du temps. Stable 3D est initialement disponible en aperçu privé.

« C’est incroyablement efficace par rapport au type classique de création de modèles 3D », a-t-il déclaré. « Les choses qui prenaient traditionnellement beaucoup de temps à construire sont désormais rapidement réalisées. »

Les filigranes et le Biden EO sur l’IA

Avec le Décret exécutif (EO) de l’administration Biden cette semaine sur l’IA, l’un des composants est une direction visant à intégrer des filigranes dans le contenu généré.

Stability AI intègre désormais des filigranes invisibles et des informations d’identification de contenu dans son API. Content Credentials est un effort industriel multifournisseur auquel Adobe et d’autres participent pour aider à fournir des informations sur la paternité du contenu. Mostaque a déclaré que l’ajout de filigranes invisibles et d’informations d’identification de contenu était une chose responsable à faire. Cela fait également partie d’un effort plus large sur lequel Stability AI travaille pour apporter de l’authenticité au contenu généré.

« Nous sommes véritablement pionniers dans un certain nombre d’initiatives et dans d’autres que nous annonçons à ce sujet, ainsi que dans des recherches supplémentaires, car nous voulons savoir ce qui est réel et ce qui est faux », a déclaré Mostaque. « Cela facilite également certains mécanismes d’attribution et autres que nous intégrons pour les versions futures. »

La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie et les transactions d’entreprise transformatrices. Découvrez nos Briefings.

Related Articles

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici

Latest Articles