Google Gemini va à nouveau prendre en charge la génération d’images de personnes par l’IA

Share on facebook
Share on twitter
Share on linkedin
Share on email

Le logo Deepmind est affiché sur un smartphone avec le logo Google Gemini en arrière-plan sur cette illustration photo à Bruxelles, en Belgique, le 8 février 2024.

Jonathan Raa | Nurphoto | Getty Images

Google a déclaré qu’il permettrait bientôt aux utilisateurs de créer des images de personnes à l’aide de son outil d’intelligence artificielle Gemini, après en tirant l’option de génération d’image AI en février.

Dans un article de blog Mercredi, Dave Citron, directeur principal des produits Gemini, a écrit que l’accès anticipé au nouveau générateur Imagen 3 de Google sera disponible pour les utilisateurs de Gemini Advanced, Business et Enterprise à partir de l’anglais dans les prochains jours.

« Nous avons travaillé pour apporter des améliorations techniques au produit, ainsi que des ensembles d’évaluation améliorés, des exercices de red-teaming et des principes de produit clairs », a écrit Citron. Le red-teaming fait référence à une pratique utilisée par les entreprises pour tester les vulnérabilités des produits.

Google a suspendu sa fonction de génération d’images plus tôt cette année après avoir déclaré qu’elle proposait des « inexactitudes » dans des images historiques. Des exemples embarrassants se sont répandus sur les réseaux sociaux.

Un utilisateur a demandé à l’outil de générer une image d’un soldat allemand en 1943, et il a créé un ensemble de soldats racialement diversifiés portant des uniformes militaires allemands. Une autre requête pour une représentation historique d’un roi britannique médiéval a également généré un ensemble d’images racialement diversifiées, y compris une femme dirigeante.

Citron a déclaré qu’Imagen 3 ne prend pas en charge les individus identifiables de manière photoréaliste, les représentations de mineurs ou les scènes excessivement sanglantes, violentes ou sexuelles.

« Bien sûr, comme pour tout outil d’IA générative, toutes les images créées par Gemini ne seront pas parfaites, mais nous continuerons à écouter les commentaires des premiers utilisateurs à mesure que nous nous améliorerons », a écrit Citron. « Nous allons déployer progressivement cette fonctionnalité, dans le but de la proposer bientôt à davantage d’utilisateurs et de langues. »

Ne manquez pas ces informations de CNBC PRO

À suivre