Il nome sembra uno scherzo, ma gli sviluppatori di intelligenza artificiale di Google non hanno scherzato affatto quando hanno pensato a questo nuovo strumento di creazioni di immagini. Il web sembra infatti impazzito per “Nano Banana”, l’ultima versione dell’editing di immagini incorporato in Gemini, l’IA targata Google.
La denominazione tecnica è Gemini 2.5 Flash Image (“Nano Banana" deriva da una denominazione interna che, data la sua efficacia e la rapidità di adozione, è stata poi informalmente accettata) e si tratta di un modello, che ha rapidamente conquistato la community online grazie alle sue capacità avanzate di generare e modificare immagini attraverso l'utilizzo del linguaggio naturale (prompt testuali).
L’obiettivo principale di “Nano Banana”, secondo gli sviluppatori, è democratizzare l'editing di immagini di alta qualità, rendendo superflua la necessità di padroneggiare software di fotoritocco complessi. L'utente non deve far altro che descrivere l'azione desiderata (ad esempio, "Rimuovi lo sfondo e sostituiscilo con un ufficio moderno" o "Aggiungi un sorriso e cambia la luce con un'illuminazione soffusa"), e l'AI esegue le modifiche in modo preciso e veloce.
Le caratteristiche distintive di “Nano Banana” lo rendono uno strumento estremamente potente anche per le aziende. Prima di tutto, come si diceva è dotato di un editing intuitivo con linguaggio naturale, scompare cioè la necessità di mascheramenti, livelli o selezioni complesse solitamente richiesti dai più avanzati software di fotoritocco. Basta una descrizione testuale per ottenere, in pochi secondi, modifiche mirate e precise come, ad esempio, rimuovere un oggetto specifico o cambiare un dettaglio locale.
Ciò che però stupisce di più è la capacità di mantenere la coerenza del soggetto: si tratta di una delle sfide maggiori nella generazione AI, ovvero quella di conservare l'aspetto di un personaggio o di un prodotto in modo costante in più immagini. Gemini 2.5 Flash Image eccelle in questo, consentendo di posizionare lo stesso prodotto o la stessa persona in scenari, angolazioni o stili diversi senza perdere le sue caratteristiche distintive.
Notevoli anche le performance di “Nano Banana” nella fusione di immagini: il modello permette di unire fino a otto immagini in un'unica composizione, fornendo, secondo quanto dichiarato da Google, un controllo creativo senza precedenti per creare scene immaginarie o anteprime di design.
Da un punto di vista tecnico, Gemini 2.5 Flash Image poi Velocità ha una bassa latenza, garantendo tempi di risposta rapidi che lo rendono ideale per flussi di lavoro ad alto volume e iterativi.
Quali possono dunque essere le applicazioni più interessanti di “Nano Banana” in ambito impresa? Ecco alcuni esempi:
Questa enorme facilità di utilizzo, unita a performance molto avanzate pone però anche un forte tema legato alla sicurezza, ovvero ad un utilizzo manipolatorio delle immagini. In questo senso Google ha affrontato questa preoccupazione con l'implementazione di rigorosi standard di sicurezza per Gemini 2.5 Flash Image.
Tutte le immagini generate o modificate con Gemini 2.5 Flash Image (Nano Banana) contengono un watermark digitale invisibile chiamato SynthID, oltre a metadati che le identificano chiaramente come create dall'intelligenza artificiale. Google ha poi integrato restrizioni sul contenuto generato, bloccando materiale inappropriato, violento o sessualmente esplicito, e implementando misure per prevenire la generazione di contenuti protetti da copyright o l'uso improprio per la falsificazione di identità.
Chiaro che per usare questi strumenti molto potenti serve cautela, in particolare evitando di caricare immagini private o sensibili e rimuovendo i metadati (come i tag di localizzazione) per mitigare i rischi.
ATTENZIONE: La notizia è riferita alla data di pubblicazione dell'articolo indicata in alto, sotto il titolo. Le informazioni contenute possono pertanto, nel corso del tempo, subire delle variazioni non riportate in questa pagina, ma in comunicazioni successive o non essere più attuali.