Qwen3 est les débuts d’Alibaba sur les soi-disant «modèles de raisonnement hybride», qui, selon lui, combine des capacités LLM traditionnelles avec un «raisonnement avancé et dynamique».
Images SOPA | LighTrocket | Images getty
Alibaba Sorti la prochaine génération de ses modèles de grande langue open source, QWEN3, mardi – et les experts l’appellent une autre percée dans l’espace d’intelligence artificielle open source en plein essor.
Dans un article de blogle géant chinois de la technologie a déclaré que Qwen3 promet des améliorations du raisonnement, de l’instruction suivante, de l’utilisation des outils et des tâches multilingues, rivalisant avec d’autres modèles de haut niveau tels que R1 de Deepseek dans plusieurs références de l’industrie.
La série LLM comprend huit variations qui s’étendent sur une gamme d’architectures et de tailles, offrant aux développeurs la flexibilité lors de l’utilisation de QWEN pour créer des applications AI pour les appareils Edge comme les téléphones mobiles.
Qwen3 est également les débuts d’Alibaba sur les soi-disant “modèles de raisonnement hybride”, qui, selon elle, combine des capacités LLM traditionnelles avec “un raisonnement avancé et dynamique”.
Selon Alibaba, ces modèles peuvent passer de manière transparente entre un “mode de réflexion” pour les tâches complexes telles que le codage et un “mode non pensé” pour les réponses à usage général plus rapides.
“Notamment, le modèle MWEN3-235B-A22B MOE abaisse considérablement les coûts de déploiement par rapport à d’autres modèles de pointe, renforçant l’engagement d’Alibaba envers l’IA accessible et hautes performances”, a déclaré Alibaba.
Les nouveaux modèles sont déjà disponibles gratuitement pour les utilisateurs individuels sur des plates-formes comme Hugging Face et GitHub, ainsi que l’interface Web d’Alibaba Cloud. Qwen3 est également utilisé pour alimenter Vous avez un assistantQuark.
Avancement de l’IA de la Chine
Les analystes de l’IA ont déclaré à CNBC que le QWEN3 représente un sérieux défi aux homologues d’Alibaba en Chine, ainsi qu’aux leaders de l’industrie aux États-Unis
Dans une déclaration à CNBC, Wei Sun, analyste principal de l’intelligence artificielle chez Counterpoint Research, a déclaré que la série QWEN3 est une “percée importante – non seulement pour ses performances les plus en classe” mais aussi pour plusieurs fonctionnalités qui indiquent le “potentiel d’application des modèles”.
Ces fonctionnalités incluent le mode de pensée hybride de QWEN3, son support multilingue couvrant 119 langues et dialectes et sa disponibilité open source, a ajouté Sun.
Le logiciel open source fait généralement référence aux logiciels dans lesquels le code source est mis librement disponible sur le Web pour une modification et une redistribution possibles. Au début de cette année, le modèle R1 open d’ouverture de Deepseek a secoué le monde de l’IA et est rapidement devenu un Catalyseur pour l’espace d’IA chinois et l’adoption du modèle open source.
“La sortie par Alibaba de la série QWEN 3 souligne en outre les capacités solides des laboratoires chinois pour développer des modèles hautement compétitifs, innovants et open source, malgré la pression croissante des contrôles d’exportation américains resserrés”, a déclaré Ray Wang, un analyste basé à Washington sur la concurrence économique et technologique américaine-Chine.
Selon Alibaba, Qwen est déjà devenu l’un des plus adoptés au monde Série de modèles AI open sourceattirant plus de 300 millions de téléchargements dans le monde et plus de 100 000 modèles dérivés sur les câlins.
Wang a déclaré que cette adoption pourrait se poursuivre avec Qwen3, ajoutant que ses affirmations de performance pourraient en faire le meilleur modèle open-source à l’échelle mondiale – bien que toujours derrière les modèles les plus de pointe du monde comme O3 et O4-Mini d’Openai.
Des concurrents chinois comme Baidu se sont également précipités pour libérer Nouveaux modèles d’IA Après l’émergence de Deepseek, notamment en faisant des plans pour se déplacer vers un modèle commercial plus ouvert.
Pendant ce temps, Reuters signalé En février, Deepseek accélère le lancement de son successeur à son R1, citant des sources anonymes.
“Dans le contexte plus large de la race américaine-chinoise AI, l’écart entre les laboratoires américains et chinois s’est rétréci – à quelques mois, et certains pourraient discuter, même à quelques semaines”, a déclaré Wang.
“Avec la dernière version de Qwen 3 et le prochain lancement du R2 de Deepseek, cet écart est peu susceptible de s’élargir – et peut même continuer à rétrécir.”
(Tagstotranslate) Breaking News: Markets