Intelligenza Artificiale
ChatGPT Images 2.0 cos’è e come funziona

OpenAI lancia ChatGPT Images 2.0: più precisione, formati da 3:1 a 1:3, fino a 8 output per richiesta e accesso API per sviluppatori.

OpenAI ha annunciato il lancio di ChatGPT Images 2.0, il nuovo modello di generazione di immagini disponibile su ChatGPT, Codex e tramite API. L’aggiornamento segna un passo significativo verso un utilizzo professionale della creazione visiva, superando la semplice sperimentazione estetica per rispondere alle esigenze concrete del mondo del lavoro.

Più precisione, più formati, più lingue

Rispetto alle versioni precedenti, Images 2.0 introduce miglioramenti sostanziali su più fronti. Il modello è ora decisamente più efficace nel seguire istruzioni dettagliate, nella resa grafica di testi lunghi e informativamente densi, nel posizionamento preciso degli oggetti all’interno della composizione e nella gestione di una gamma più ampia di formati.

Una delle novità più rilevanti per chi lavora nella comunicazione e nel design è il supporto a proporzioni che vanno da 3:1 a 1:3, che semplifica notevolmente la produzione di asset per banner, slide, poster e contenuti in formato mobile. Il sistema supporta inoltre la generazione di immagini in un numero maggiore di lingue rispetto al passato.

Le funzionalità chiave di ChatGPT Images 2.0

Il nuovo modello introduce capacità pensate per flussi di lavoro creativi complessi. Tra le funzioni principali spicca la generazione avanzata per elementi come testi in piccole dimensioni, interfacce utente, diagrammi e layout ad alta densità di informazioni, elementi spesso critici nella produzione di materiali editoriali e pubblicitari.

Particolarmente interessante per le agenzie e i team creativi è la possibilità di ottenere fino a 8 output coerenti in un’unica richiesta, aprendo la strada a casi d’uso come set di poster, storyboard, fumetti e campagne multiformato. I flussi di lavoro con capacità di ragionamento, disponibili direttamente in ChatGPT, consentono al sistema di analizzare un’attività, consultare il web se necessario e generare più varianti a partire da un singolo prompt.

Accesso tramite API per sviluppatori e aziende

Il modello sottostante, denominato gpt-image-2, è disponibile anche tramite API, permettendo agli sviluppatori di integrare generazione ed editing di immagini direttamente all’interno di prodotti e pipeline di lavoro esistenti. Si tratta di un’apertura significativa per chi intende costruire soluzioni personalizzate basate sulla generazione visiva.

ChatGPT Images 2.0 è disponibile da oggi per tutti gli utenti di ChatGPT e Codex. Gli output avanzati basati su Thinking sono riservati agli abbonati dei piani Plus, Pro, Business ed Enterprise.

Tutti i dettagli tecnici e le specifiche del modello sono disponibili nel blog post ufficiale di OpenAI.

Ecco un esempio di prompt e i suoi output

  • Prompt: Puoi farmi una ricetta di quattro pagine, completa di immagini, su come preparare una Key Lime Pie? La ricetta deve sembrare tratta da un libro di cucina professionale.
Torna indietro