OpenAI ha presentato al mondo GPT-4o. La “o” sta per “omni”. Ecco quindi di cosa è capace il nuovo LLM pronto a sfidare tutti.
OpenAI ha ufficialmente aperto le porte del suo nuovo modello denominato GPT-4o. La piccola”o” significa omni ed è una etichetta che già ci dice molto sulle capacità della nuova intelligenza artificiale.
La prima caratteristica di questa nuova IA è che è in grado di rispondere molto più velocemente e di farlo con una vasta gamma di input e di output. L’aggiornamento ha portato un miglioramento soprattutto in un aspetto che era quello forse più delicato e difficile per gli LLM precedenti: il riconoscimento vocale. C’è ancora del lavoro da fare, soprattutto su alcune lingue ma i passi avanti registrati sono evidenti e non si fermano alle lingue.
Perché GPT-4o è così importante
L’evoluzione delle intelligenze artificiali terrà banco ancora a lungo. A differenza di altri fenomeni, infatti, le IA e il nostro rapporto con loro è qualcosa con cui faremo i conti negli anni a venire.
Ne è una dimostrazione la quantità di device che cercano in qualche modo di dare agli utenti proprio l’esperienza con una intelligenza artificiale. In questo OpenAI sembra aver bruciato di nuovo tutti. Il nuovo modello GPT-4o, sperimentabile anche dagli utenti non abbonati, è un nuovo modello in grado di riconoscere meglio le varietà di input che gli utenti forniscono. Ciò significa che è in grado di lavorare non solo con domande fatte per iscritto ma a voce o attraverso le immagini. Proprio le capacità di riconoscimento vocale sono state migliorate, come dicevamo. Ma quanto?
Secondo i dati diffusi da OpenAI, per esempio, il miglioramento nel riconoscimento di alcune lingue è del 50% rispetto ai modelli precedenti. Anche se le lingue europee, e il blocco cinese, giapponese e coreano sono ancora nell’ordine di una parola sbagliata ogni 20. Tradotto in termini più umani GPT-4o ha ancora le capacità cognitive linguistiche di un bambino delle medie.
Come risponde GPT-4o? In italiano arriva a B e in cinese è una sufficienza
Per comprendere i passi avanti fatti da OpenAI con il modello GPT-4o conviene continuare a fare un confronto con ciò che sono in grado di fare i ragazzi a scuola. Per esempio, se viene proposto un test per iscritto di livello superiore GPT-4o riesce a prendere una B, quindi un ricco otto, solo in inglese, italiano e in afrikaans mentre per esempio arriva alla sufficienza stiracchiata in tutte le altre lingue.
E c’è ancora un problema nel collegare una figura a un testo. Per il calcolo matematico siamo piuttosto lontani da un risultato soddisfacente. Da ultimo l’aspetto della produzione di risposte vocali è al momento oggetto di limitazioni pesanti soprattutto per evitare che si possa convincere l’intelligenza artificiale a dire cose con un certo tono di voce e poi utilizzare le registrazioni per scopi malevoli.