Google Gemini va à nouveau prendre en charge la génération d’images de personnes par l’IA

Le logo Deepmind est affiché sur un smartphone avec le logo Google Gemini en arrière-plan sur cette illustration photo à Bruxelles, en Belgique, le 8 février 2024.

Jonathan Raa | Nurphoto | Getty Images

Google a déclaré qu’il permettrait bientôt aux utilisateurs de créer des images de personnes à l’aide de son outil d’intelligence artificielle Gemini, après en tirant l’option de génération d’image AI en février.

Dans un article de blog Mercredi, Dave Citron, directeur principal des produits Gemini, a écrit que l’accès anticipé au nouveau générateur Imagen 3 de Google sera disponible pour les utilisateurs de Gemini Advanced, Business et Enterprise à partir de l’anglais dans les prochains jours.

“« Nous avons travaillé pour apporter des améliorations techniques au produit, ainsi que des ensembles d’évaluation améliorés, des exercices de red-teaming et des principes de produit clairs », a écrit Citron. Le red-teaming fait référence à une pratique utilisée par les entreprises pour tester les vulnérabilités des produits.

Google a suspendu sa fonction de génération d’images plus tôt cette année après avoir déclaré qu’elle proposait des « inexactitudes » dans des images historiques. Des exemples embarrassants se sont répandus sur les réseaux sociaux.

Un utilisateur a demandé à l’outil de générer une image d’un soldat allemand en 1943, et il a créé un ensemble de soldats racialement diversifiés portant des uniformes militaires allemands. Une autre requête pour une représentation historique d’un roi britannique médiéval a également généré un ensemble d’images racialement diversifiées, y compris une femme dirigeante.

Citron a déclaré qu’Imagen 3 ne prend pas en charge les individus identifiables de manière photoréaliste, les représentations de mineurs ou les scènes excessivement sanglantes, violentes ou sexuelles.

« Bien sûr, comme pour tout outil d’IA générative, toutes les images créées par Gemini ne seront pas parfaites, mais nous continuerons à écouter les commentaires des premiers utilisateurs à mesure que nous nous améliorerons », a écrit Citron. « Nous allons déployer progressivement cette fonctionnalité, dans le but de la proposer bientôt à davantage d’utilisateurs et de langues. »

Google Gemini va à nouveau prendre en charge la génération d’images de personnes par l’IA

Ne manquez pas ces informations de CNBC PRO

À suivre

Kenya : près de 4 000 familles déplacées par des inondations dévastatrices

L’Iran s’immisce dans les élections et les manifestations aux États-Unis

Le chien de garde du travail américain arrête les cas d’Apple après que Donald Trump choisit l’avocat du groupe pour le meilleur emploi

Commentaire : le zoo d’Oakland a raison de repenser le maintien des éléphants en captivité