AccueilTechnologieAperçu anticipé de...

Aperçu anticipé de ChatGPT Images 2.0 : une avancée notable, malgré une limite persistante

Cette nouvelle version marque un changement de perspective : l’image n’est plus simplement décorative, mais devient un véritable langage visuel capable d’expliquer, structurer et argumenter.

En effet, parmi les nouveautés majeures de ChatGPT Images 2.0 figure la capacité à combiner texte et images afin de produire des compositions élaborées, comme des infographies complètes. Selon OpenAI, une image efficace fonctionne comme une phrase bien construite : elle sélectionne, organise et met en valeur l’information.

Une IA capable de raisonner pour créer

Le modèle intègre désormais des capacités de raisonnement avancées. Il peut générer plusieurs visuels cohérents à partir d’une seule demande, tout en maintenant une continuité entre eux. Cette approche permet de transformer des consignes vagues en résultats structurés.

Par exemple, une requête telle que « créer une infographie sur les activités à faire demain en fonction de la météo à San Francisco » déclenche une analyse complète :

Récupération des données météo Sélection d’activités pertinentes Puis création d’un visuel adapté

L’outil se positionne ainsi comme un véritable partenaire créatif, capable d’accompagner un projet de l’idée initiale jusqu’au rendu final.

Précision et meilleur contrôle du design

Images 2.0 améliore nettement la gestion des formats. Il prend désormais en charge des ratios allant de 3:1 à 1:3, répondant à une demande fréquente des utilisateurs.

La qualité visuelle progresse également, avec un rendu plus précis des objets, du texte et des compositions complexes, jusqu’à une résolution de 2K.

Le modèle gère aussi des éléments détaillés comme les interfaces, les petites typographies ou les contraintes stylistiques, même si certains ajustements restent perfectibles.

© ChatGPT/Screenshot by David Gewirtz/ZDNET

Un test concluant, mais imparfait

Lors d’un test, le modèle a démontré de solides capacités en générant une infographie cohérente à partir d’un communiqué et d’une capture d’écran d’un site. Toutefois, une difficulté persistante est apparue : la reproduction fidèle d’un logo.

Malgré plusieurs tentatives et consignes précises, le système n’a pas réussi à restituer correctement le logo d’origine. Les erreurs ont varié, allant d’une légère déformation à l’utilisation d’une version obsolète ou à l’ajout d’éléments inattendus. Même en redémarrant les sessions et en affinant les instructions, le problème n’a pas été résolu.

Ce point souligne une limite actuelle du modèle, en particulier sur les éléments graphiques sensibles comme l’identité visuelle des marques.

Disponibilité et accès

ChatGPT Images 2.0 est désormais accessible aux utilisateurs de ChatGPT et Codex. Les fonctionnalités avancées, notamment les capacités de raisonnement, sont réservées aux abonnements Plus, Pro, Business et Enterprise.

Pour l’instant, l’outil est disponible sur desktop, avec une intégration mobile annoncée prochainement.

Une API, basée sur le modèle gpt-image-2, est également proposée, avec une tarification variable selon la qualité et la complexité des rendus.


Source:

www.zdnet.fr

Annonce publicitairespot_img

Catégories