A due mesi di distanza dal debutto della nuova intelligenza artificiale ‘Gemini’ di Google arriva la nuova generazione ‘1.5’, al momento disponibile nella dimensione ‘Pro’. E’ paragonabile al modello ‘Gemini 1.0 Ultra’ in termini di capacità di elaborazione, pur impiegando minori risorse.
Google ha presentato la generazione ‘1.5’ di Gemini, la sua nuova intelligenza artificiale presentata in origine alla fine dello scorso anno in versione ‘1.0’ e nelle tre dimensioni Ultra, Pro e Nano, ciascuna con le proprie capacità di elaborazione dati. Stando a quanto riferito nel blog di Google The Keyword da Sundar Pichai, CEO di Google e Alphabet, ‘Gemini 1.5 Pro’ è paragonabile al modello ‘Gemini 1.0 Ultra’ in termini di capacità di elaborazione, pur impiegando minori risorse.
Inoltre, Gemini 1.5 Pro introduce una caratteristica sperimentale grazie alla quale il modello è in grado di elaborare una maggiore quantità di informazioni, così da poter comprendere meglio il contesto in testi più lunghi:
“Finestre di contesto più lunghe ci mostrano la promessa di ciò che è possibile. Consentiranno funzionalità completamente nuove e aiuteranno gli sviluppatori a creare modelli e applicazioni molto più utili.”
Demis Hassabis, CEO di Google DeepMind, a proposito del supporto in Gemini 1.5 Pro di finestre di contesto più punghe ha spiegato:
“Attraverso una serie di innovazioni di apprendimento automatico, abbiamo aumentato la capacità della finestra di contesto di 1.5 Pro ben oltre i 32.000 token originali per Gemini 1.0. Ora possiamo gestire fino a 1 milione di token in produzione. Ciò significa che 1.5 Pro può elaborare grandi quantità di informazioni in una volta sola, tra cui 1 ora di video, 11 ore di audio, basi di codice con oltre 30.000 righe di codice o oltre 700.000 parole. Nella nostra ricerca, abbiamo anche testato con successo fino a 10 milioni di token.”
Nei giorni scorsi, Google ha lanciato la sua nuova applicazione ‘Gemini’ per dispositivi iOS e Android basata sul modello ‘Gemini 1.0 Pro’ e, a pagamento, è accessibile l’esperienza ‘Gemini Advanced‘ basata sul modello ‘Gemini 1.0 Ultra’.
Google Gemini 1.5 Pro può analizzare grandi quantità di testo ma anche codice e video
A detta di Hassabis, Gemini 1.5 Pro ha la capacità di analizzare, classificare e riepilogare senza difficoltà grandi quantità di testo. Ad esempio, in un’analisi di circa 400 pagine riguardanti una missione sulla Luna il modello può comprendere il testo ed elaborare le conversazioni, gli eventi e altre informazioni presenti nel documento, così come identificare dettagli curiosi in esso contenuti. Il modello non funziona però solo con i testi ma anche con i video.
Ad esempio, Gemini 1.5 Pro può analizzare eventi della trama ed elaborare ragionamenti su piccoli dettagli di un film muto che dura poco più di 40 minuti. Gemini 1.5 Pro può anche analizzare codici di programmazione e suggerire modifiche utili a risolvere eventuali problemi e anche spiegare le diverse parti di cui si compone. Le demo di questi esempi si possono vedere qui sotto.
Prima di presentare Gemini 1.5 Pro, il team dietro lo sviluppo del modello si è assicurato di adottare il medesimo approccio “all’implementazione responsabile” utilizzato per Gemini 1.0, sottoponendolo a “test etici” e valutando in maniera la sicurezza e potenziali rischi.
Per il momento Gemini 1.5 è disponibile in via sperimentale per sviluppatori e clienti aziendali tramite AI Studio e Vertex AI. Chi interessato può approfondire le dichiarazioni di Sundar Pichai e di Demis Hassabis nel blog The Keyword di Google oppure leggere l’analisi tecnica di Gemini 1.5 Pro all’indirizzo goo.gle/GeminiV1-5.