Parliamo di Qwen2.5-Max

l’IA cinese che insieme a deepseek fa vacillare i giganti americani

Alibaba ha annunciato il rilascio di Qwen2.5-Max, il suo nuovo modello AI open-source che punta a superare DeepSeek-R1, uno degli LLM (Large Language Model) più discussi del momento. Il tempismo del lancio è interessante: arriva proprio durante il Capodanno cinese e subito dopo l’uscita di DeepSeek-R1, quasi come una risposta diretta. Secondo Alibaba, in alcuni test il nuovo modello supera DeepSeek-V3 (la versione precedente di R-1) e persino Llama 3.1-405B di Meta, il che potrebbe rafforzare la sua posizione nel settore dell’intelligenza artificiale generativa.

immagine evocativa, un robot cinese insegue un robot americano

Come funziona Qwen?

A livello tecnologico, Qwen2.5-Max è un modello multimodale, quindi capace di comprendere testi, immagini e persino generare video. Questo lo mette in competizione con i modelli più avanzati dell’Occidente, come GPT-4o di OpenAI e Claude 3.5 Sonnet di Anthropic.

Alibaba ha spiegato che il modello è stato addestrato su oltre 20 trilioni di token e affinato con tecniche avanzate come Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF). In diversi test di valutazione, come Arena-Hard, LiveBench e LiveCodeBench, Qwen2.5-Max ha dimostrato performance eccellenti, confermando le sue capacità superiori in ambito AI.

I punti critici

Non mancano però alcune perplessità. La gestione dei dati è una delle questioni più delicate: come DeepSeek, anche Qwen2.5-Max conserva le informazioni degli utenti su server cinesi, il che potrebbe sollevare dubbi sulla privacy e sulla possibile accessibilità da parte del governo. In Italia, il Garante della Privacy ha già avviato un’indagine su DeepSeek e gli stores hanno rimosso la sua app in via precauzionale. Se il trend continua, potrebbero esserci restrizioni simili anche per altri modelli AI cinesi.

Un altro limite riguarda la sua accessibilità: pur essendo open-source, il modello non è immediatamente utilizzabile. Per attivarlo, è necessario registrarsi su Alibaba Cloud, abilitare il servizio Model Studio e generare una chiave API, un processo che potrebbe scoraggiare gli utenti meno esperti.

La guerra degli LLM in Cina e nel mondo

L’uscita di DeepSeek-R1 il 20 gennaio ha rivoluzionato il mercato, tanto da influenzare il valore azionario di colossi tech come NVIDIA. Il motivo? DeepSeek ha dimostrato che si possono ottenere modelli AI di alto livello con costi operativi ridotti, sfidando direttamente le big tech occidentali come OpenAI e Google.

La risposta cinese non si è fatta attendere: ByteDance (proprietaria di TikTok) ha aggiornato il suo modello AI, dichiarando che supera OpenAI in test specifici. Alibaba, invece, ha scelto di rilanciare con Qwen2.5-Max.

Nel frattempo, la versione precedente, Qwen2.5, ha già totalizzato 94 milioni di download su Hugging Face, battendo persino Llama 3.1 di Meta e diventando il modello AI open-source più scaricato al mondo.

Il mercato dell’intelligenza artificiale sta cambiando velocemente: i modelli open-source stanno guadagnando sempre più terreno, offrendo alternative più accessibili e personalizzabili ai sistemi chiusi come quelli di OpenAI.

La competizione è appena iniziata.

Entra nel nostro team

Join us

Cookie	Durata	Descrizione
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.