L’ultima intelligenza artificiale di Alibaba batte GPT-3.5, Claude in numerosi test di benchmark

L’ultima intelligenza artificiale di Alibaba batte GPT-3.5, Claude in numerosi test di benchmark

Questo non è un consiglio di investimento. L’autore non ha alcuna posizione in nessuno dei titoli citati.

Con il 2024 che segna un buon inizio nella corsa globale all’intelligenza artificiale, il colosso tecnologico cinese Alibaba Group ha anche annunciato l’ultima iterazione del suo modello di intelligenza artificiale Qwen. Oltre a ChatGPT di OpenAI, che è il chatbot AI più conosciuto al mondo, altri modelli come Llama di Meta e Claude del partner Amazon Anthropic sono diverse opzioni che i consumatori e le aziende hanno quando scelgono una piattaforma AI per le loro esigenze.

L’ultima iterazione di Qwen di Alibaba è Qwen 1.5 e, secondo i benchmark condivisi sulla piattaforma di social media X, il modello batte sia ChatGPT che Claude in alcuni punteggi di benchmark.

Qwen 1.5 di Alibaba batte Claude e ChatGPT su più benchmark testando la fluidità didattica

Proprio come i sistemi operativi che funzionano su computer o smartphone, anche un modello di intelligenza artificiale è un software. Ciò consente agli ingegneri del software e agli analisti di valutarne le prestazioni e, quando si tratta dell’ultimo Qwen 1.5 di Alibaba, alcuni punteggi mostrano che supera Claude di Anthropic e ChatGPT di OpenAI.

I benchmark che testano i sistemi operativi valutano la loro capacità di elaborare istruzioni ed eseguire applicazioni, e quelli per i modelli di intelligenza artificiale in genere ruotano attorno a testare la capacità dei modelli di generare output.

Due di questi benchmark sono MT-bench e Alapaca-Eval, e i punteggi condivisi su X mostrano che una variante di Qwen 1.5 di Alibaba ha superato ChatGPT e Claude in essi. MT-bench mette alla prova la capacità di un modello di rispondere a una serie di domande predefinite che non solo cercano di differenziarlo dal chatbot, ma cercano anche di determinare se il modello può “mantenere la sua posizione” in un contesto di conversazione difficile che coinvolge due parti che interagiscono rapidamente insieme.

I punteggi dei benchmark mostrano che Qwen è stato il quarto punteggio più alto nel banco MT, ed è rimasto dietro solo a GPT-4 Turbo e alle prime due versioni GPT-4, vale a dire le versioni 0613 e 0314.

Alapaca-Eval è un benchmark che utilizza un modello di riferimento per emulare le interazioni umane e determinare la misura in cui un modello di intelligenza artificiale testato fornisce risultati in linea con lo scenario di base. Fornisce inoltre agli utenti una classifica per tenere traccia dei loro test e i benchmark di oggi mostrano che le prestazioni di Alapaca-Eval di Qwen 1.5 sono solo in ritardo rispetto a GPT-4 Turbo e Yi-34B di HuggingFace con sede a New York.

Qwen1.5 è uno dei più grandi modelli open source nel suo genere ed è supportato dalle enormi risorse informatiche di Alibaba. Un’intelligenza artificiale open source, come il software open source, rende il proprio codice disponibile a utenti e sviluppatori in modo che possano comprendere il modello e creare le proprie varianti. Anche Meta’s Llama, presente nelle partiture di oggi, è un modello open source.

L’inizio del 2024 ha visto la rinomata attenzione di Wall Street e delle aziende sull’intelligenza artificiale. I rapporti sugli utili di giganti della tecnologia a mega capitalizzazione come Meta, Microsoft e Alphabet si sono tutti concentrati sull’intelligenza artificiale. Il capo di Meta, Mark Zuckerberg, punta quest’anno ad acquistare centinaia di migliaia di GPU per alimentare su Llama, e alla conferenza sugli utili dell’azienda il dirigente ha spiegato che la sua decisione di rafforzare la capacità di calcolo di Meta fa seguito a precedenti sviste che hanno portato l’azienda a trovarsi sotto capacità.

Allo stesso modo, anche gli utili dei produttori e progettisti di chip TSMC e AMD hanno visto i loro dirigenti esprimere ottimismo per il futuro dell’intelligenza artificiale. Il management di TSMC è fiducioso che l’azienda abbia una base stabile per soddisfare qualsiasi domanda di intelligenza artificiale, mentre AMD è del parere che l’intelligenza artificiale possa finire per diventare una realtà. arrivando a valere centinaia di miliardi di dollari entro la fine del decennio.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *