Giovedì 18/7, OpenAI ha presentato GPT-4o mini, il suo nuovo modello di intelligenza artificiale di dimensioni ridotte.
Questa novità dovrebbe permettere a un maggior numero di aziende e programmi di sfruttare l’IA a un costo significativamente inferiore. Infatti, GPT-4o mini è il 60% più economico rispetto all’offerta base di OpenAI, pur offrendo prestazioni migliori. Disponibile da subito per gli sviluppatori e per gli utenti tramite l’applicazione web e mobile di ChatGPT, il modello sarà accessibile agli utenti enterprise dalla prossima settimana.
Il nuovo modello di OpenAI è stato sviluppato migliorando l’architettura, i dati e il processo di addestramento. La società afferma che GPT-4o mini supera i modelli di piccole dimensioni disponibili sul mercato in diversi benchmark comuni. Ad esempio, su MMLU, un benchmark di intelligenza e ragionamento testuale, ha ottenuto un punteggio dell’82%, rispetto al 77,9% di Gemini Flash e al 73,8% di Claude Haiku. Su MGSM, che misura il ragionamento matematico, ha raggiunto l’87%, contro il 75,5% di Gemini Flash e il 71,7% di Claude Haiku. Inoltre, ha totalizzato l’87,2% su HumanEval, che valuta le prestazioni di codifica, rispetto al 71,5% di Gemini Flash e al 75,9% di Claude Haiku.
Il product manager di OpenAI, Olivier Godement, ha spiegato che l’obiettivo dell’azienda è rendere l’intelligenza artificiale il più accessibile possibile, mettendo a disposizione modelli a un costo inferiore. Questa strategia riflette anche la crescente concorrenza tra i fornitori di servizi cloud per l’AI e l’aumentato interesse verso i modelli open source gratuiti e più contenuti. Per gli sviluppatori che utilizzano le API di OpenAI, GPT-4o mini ha un prezzo di 15 centesimi per milione di token di input e 60 centesimi per milione di token di output, con una finestra di contesto di 128.000 token, all’incirca la lunghezza di un libro, e conoscenza aggiornata a ottobre 2023.
L’interesse per i modelli linguistici suscitato dall’enorme successo di ChatGPT ha spinto i concorrenti di OpenAI a sviluppare offerte simili. Google, con il suo Llm e chatbot Gemini, e startup come Anthropic, Cohere e AI21 stanno investendo ingenti risorse per sviluppare e lanciare i propri modelli linguistici. Tuttavia, alcune aziende hanno scelto di rendere open source i loro prodotti per attirare gli sviluppatori, come il modello Llama di Meta, disponibile gratuitamente.
Godement ha sottolineato che le esigenze dei clienti stanno evolvendo, con sviluppatori e aziende che combinano modelli piccoli e grandi per ottenere la migliore esperienza possibile a un prezzo e una latenza ottimali. Le offerte cloud di OpenAI offrono modelli sottoposti a maggiori test di sicurezza rispetto a quelli della concorrenza, e l’azienda potrebbe in futuro sviluppare sistemi che i clienti possono eseguire sui propri dispositivi.