Le logo Deepmind est affiché sur un smartphone avec le logo Google Gemini en arrière-plan sur cette illustration photo à Bruxelles, en Belgique, le 8 février 2024.
Jonathan Raa | Nurphoto | Getty Images
Google a déclaré qu’il permettrait bientôt aux utilisateurs de créer des images de personnes à l’aide de son outil d’intelligence artificielle Gemini, après en tirant l’option de génération d’image AI en février.
Dans un article de blog Mercredi, Dave Citron, directeur principal des produits Gemini, a écrit que l’accès anticipé au nouveau générateur Imagen 3 de Google sera disponible pour les utilisateurs de Gemini Advanced, Business et Enterprise à partir de l’anglais dans les prochains jours.
“« Nous avons travaillé pour apporter des améliorations techniques au produit, ainsi que des ensembles d’évaluation améliorés, des exercices de red-teaming et des principes de produit clairs », a écrit Citron. Le red-teaming fait référence à une pratique utilisée par les entreprises pour tester les vulnérabilités des produits.
Google a suspendu sa fonction de génération d’images plus tôt cette année après avoir déclaré qu’elle proposait des « inexactitudes » dans des images historiques. Des exemples embarrassants se sont répandus sur les réseaux sociaux.
Un utilisateur a demandé à l’outil de générer une image d’un soldat allemand en 1943, et il a créé un ensemble de soldats racialement diversifiés portant des uniformes militaires allemands. Une autre requête pour une représentation historique d’un roi britannique médiéval a également généré un ensemble d’images racialement diversifiées, y compris une femme dirigeante.
Citron a déclaré qu’Imagen 3 ne prend pas en charge les individus identifiables de manière photoréaliste, les représentations de mineurs ou les scènes excessivement sanglantes, violentes ou sexuelles.
« Bien sûr, comme pour tout outil d’IA générative, toutes les images créées par Gemini ne seront pas parfaites, mais nous continuerons à écouter les commentaires des premiers utilisateurs à mesure que nous nous améliorerons », a écrit Citron. « Nous allons déployer progressivement cette fonctionnalité, dans le but de la proposer bientôt à davantage d’utilisateurs et de langues. »