Intelligenza Artificiale
ChatGPT Images 2.0: il nuovo generatore di immagini di OpenAI
ChatGPT Images 2.0 è il nuovo, incredibile aggiornamento sulla generazione di immagini di ChatGPT. I miglioramenti sono notevoli, non ci sono più errori nella lingua italiana anche se aggiungi molto testo e la generazione di immagine da prompt risulta più veloce. Qui la AI dimostra veramente la sua crescita, comprende il prompt in maniera immediata e senza, o con scarso, margine di errore. Ricordo ancora quando provavo a generare immagini che avessero più di quattro frasi: c’erano almeno due frasi ripetute e tantissimi errori grammaticali e typo a non finire. Quando provavo a farglieli correggere cadeva in allucinazione, questo comportava un loop infinito di errori.

Questa è un’immagine che ho creato io per i social, notate come ChatGPT ha curato ogni minimo dettaglio senza errori. Ed è stata la prima immagine generata, non necessitava di rielaborazione.
ChatGPT Images 2.0: meno errori e più precisione
Avete presente i menù dei ristoranti? Quelli molto colorati e strapieni di scritte? Ecco, adesso potete generarne quanti ne volete e senza errori! I generatori di immagini basati sull’intelligenza artificiale hanno storicamente avuto difficoltà con l’ortografia perché generalmente utilizzavano modelli di diffusione, che funzionano ricostruendo le immagini a partire dal rumore.
“I modelli di diffusione […] ricostruiscono un input dato”, ha dichiarato Asmelash Teka Hadgu, fondatore e CEO di Lesan AI, a TechCrunch nel 2024. “Possiamo presumere che le scritte su un’immagine costituiscano una parte molto, molto piccola, quindi il generatore di immagini apprende i modelli che coprono una porzione maggiore di questi pixel.”
Da allora, i ricercatori hanno esplorato altri meccanismi per la generazione di immagini, come i modelli autoregressivi , che fanno previsioni su come dovrebbe apparire un’immagine e funzionano più come un LLM. Sfortunatamente, OpenAI si è rifiutata di rispondere a una domanda durante una conferenza stampa questa settimana riguardo al tipo di modello alla base di ChatGPT Images 2.0.

Oltretutto è anche molto umoristico e segue a ruota quello che gli scrivo, si basa anche sulle chat vecchie per ricordarsi le tue caratteristiche e la tua personalità.
Le dichiarazioni di OpenAI durante la conferenza stampa
L’azienda ha comunque spiegato che il nuovo modello possiede “capacità di pensiero” che gli consentono di effettuare ricerche sul web, creare più immagini a partire da un singolo input e ricontrollare le proprie creazioni. Questo permette a Images 2.0 di creare risorse di marketing di varie dimensioni, nonché fumetti a più vignette.
OpenAI afferma inoltre che Images ha una maggiore capacità di rendering del testo non latino in lingue come giapponese, coreano, hindi e bengalese. Le conoscenze del modello si interromperanno a dicembre 2025, il che potrebbe influire sulla precisione con cui è in grado di generare determinati suggerimenti relativi alle notizie recenti.
“Images 2.0 porta un livello di specificità e fedeltà senza precedenti nella creazione di immagini. Non solo è in grado di concettualizzare immagini più sofisticate, ma le trasforma in realtà in modo efficace, seguendo le istruzioni, preservando i dettagli richiesti e riproducendo gli elementi più minuti che spesso compromettono i modelli di immagine: testo di piccole dimensioni, icone, elementi dell’interfaccia utente, composizioni complesse e sottili vincoli stilistici, il tutto con una risoluzione fino a 2K”, ha dichiarato OpenAI in un comunicato stampa.

Questo è uno dei trend che gira tra gli utenti, creare un’immagine che parli di te e delle tue passioni e personalità. Questa immagine l’ho generata io tramite prompt personalizzato, ormai ChatGPT mi conosce bene.
Questi aggiornamenti valgono sia per gli utenti free che per gli abbonati
Tutti gli utenti di ChatGPT e Codex potranno accedere a Images 2.0. Gli utenti a pagamento potranno generare output più avanzati. L’azienda renderà inoltre disponibile l’API gpt-image-2 , con prezzi variabili in base alla qualità e alla risoluzione degli output. Io riesco a generarne abbastanza ogni giorno in modalità free per gestire al meglio il mio account Instagram. Oltretutto ti permette anche di cambiare lo sfondo, ad esempio ad una ricetta, con immagini davvero belle ed eleganti.
