Fermer l'annonce

Google a lancé hier sa conférence des développeurs d'E/S 2024, auquelé a présenté un certain nombre d'innovations liées à l'intelligence artificielle. L'un d'eux est les nouveaux modèles génératifs de création d'images et de vidéos Imagen 3 et Veo. Que peuvent faire les deux outils ?

Selon Google, Imagen 3 est son modèle d'IA le plus avancé à ce jour pour générer des images à partir de texte. Plus précisément, sa filiale spécialisée dans l'intelligence artificielle DeepMind. On dit qu'il est capablecréez des visuels avec des détails incroyables, un éclairage réaliste et des artefacts moins gênants. Le modèle devrait également être capable de mieux gérer les détails des invites longues que les modèles de génération d'images précédents de Google. (des commandes).

Depuis hier, Imagen 3 est disponible pour les créateurs sélectionnés en tant qu'aperçu privé au sein de l'outil ImageFX. De plus, il sera disponible en plusieurs versions, chacune optimisée pour différents types de tâches, de la génération de croquis rapides aux images haute résolution.

En plus d'Imagen 3, Google a également introduit un nouveau modèle génératif avancé pour la création de vidéos, Veo, qui est également à l'origine de DeepMind. La société affirme que les utilisateurs pourront créer et éditer des vidéos 1080p d’une durée d’une minute dans une variété de styles visuels à l’aide d’invites de texte, d’image ou de vidéo.

Google affirme que Veo possède une compréhension avancée du langage naturel et de la sémantique visuelle, qui, selon lui, peut créer n'importe quelle vidéo basée sur n'importe quel type d'invite. On dit également qu’il comprend les techniques cinématographiques et visuelles, telles que la photographie accélérée. Veo est désormais disponible dans VideoFX pour certains créateurs et devrait également apparaître dans YouTube Shorts et d'autres produits du géant de la technologie.

Le plus lu du jour

.