Cseréld le a 40 rablót egy milliárd paraméterre, és itt van az Alibaba mesterséges intelligenciája, amely új dimenziókat nyit meg!

Bár a kínai Alibaba neve sokakban az e-kereskedelmet idézi (nem is alaptalanul), azonban a vállalat alapvető üzleti prioritásként kezeli a mesterséges intelligenciát is. Ehhez kapcsolódik, hogy a MI-világ egyik vezető hardverszállítójával az Nvidiával kötött partnerséget, illetve hogy piacra dobott egy nagy nyelvi modellt, a cég eddigi legnagyobb és legképzettebb modelljét. A Qwen3-MAX több mint egybillió paramétert, vagyis változót tartalmaz, amelyek meghatározzák, hogyan dolgozza fel egy mesterséges intelligencia rendszer az információkat.
A 36 billió tokenes előképzés nem csupán lenyűgöző a maga mértékével, hanem az is, hogy az új modell képes akár egymillió szó vagy szimbólum hosszúságú bemenetek feldolgozására. Ez a teljesítmény nagyjából annyi, mint több könyv terjedelme, és messze felülmúlja a jelenlegi mesterséges intelligencia rendszerek képességeit. A Mixture of Experts (Szakértők keveréke) architektúra lényege, hogy a modell működése hasonlít egy okos csapat dinamikájára; csak azok a szakértők lépnek működésbe, akikre az adott feladat során szükség van. Így nem aktiválódik az összes egy billió paraméter, hanem a szükséges részhalmazok dolgoznak, ami jelentősen fokozza a hatékonyságot, és elkerüli a nyers számításokkal járó terheket.
Egy friss blogbejegyzésben izgalmas híreket osztottak meg az új betanítási folyamatok finomításáról, amelyek révén a rendszer hatékonysága és megbízhatósága jelentősen javult. Kiemelték a ChunkFlow megközelítést, amely elképesztő módon háromszorosára növelte a rendszer sebességét, különösen hosszú bemenetek esetén. Emellett a betanítási folyamat általános hatékonysága 30%-kal emelkedett az előző Qwen2.5 verzióhoz képest. Továbbá, az újonnan bevezetett biztonsági intézkedések drámaian csökkentették a hardverhibák miatt bekövetkező állásidőt, a korábbi modellekhez viszonyítva pedig a problémák előfordulásának gyakorisága a töredékére esett vissza.
A vállalat éves konferenciáján bemutatott modell kapcsán Zhou Jingren, az Alibaba Cloud technológiai igazgatója kiemelte, hogy a kódgenerálás és az autonóm ágensek terén kiemelkedő teljesítményt nyújt. Ez azt jelenti, hogy a mesterséges intelligencia rendszere jóval kevesebb emberi iránymutatást igényel, mint egy hagyományos chatbot, és képes önálló döntéseket hozni, valamint cselekedni az emberi felhasználó által meghatározott célok elérése érdekében.
Jelenleg két különböző verzió bevezetésére kerül sor: az Instruct modell már aktívan működik az Alibaba Cloudon és a Qwen Chaten, míg egy újabb, fejlettebb "Thinking" verzió, amely az érvelésre és az eszközök integrálására helyezi a hangsúlyt, még mindig fejlesztés alatt áll. A fejlesztők az OpenAI-val kompatibilis API-kon keresztül csatlakozhatnak a Qwen3-Maxhoz, ami megkönnyíti számukra, hogy a már meglévő vezető modellekre építve dolgozhassanak az Alibaba platformján – tájékoztat az eWeek.
A Qwen3-MAX teljesítménye a tesztelések során kiemelkedően alakult. A modell egyik variánsa, a Qwen3-MAX-Instruct, a Text Arena ranglistáján a harmadik helyet szerezte meg, bizonyos tesztekben még a GPT-5-Chatet is maga mögé utasítva. Az SWE-Bench Verified teszten, amely a valós kódolási feladatok megoldásának hatékonyságát méri, impresszív 69,6 pontot ért el, ezzel felülmúlva a DeepSeek V3.1-et, és versenyképes pozíciót foglal el a Claude Opus 4-gyel szemben. A Tau2-Bench teszten, ahol a mesterséges intelligencia modellek eszközhasználati képességeit vizsgálják, egy figyelemre méltó 74,8 ponttal zárt, így lekörözve mind a Claude Opus 4-et, mind a DeepSeek V3.1-et.
Az Alibaba a Qwen3-MAX mellett bemutatta a Qwen3-Omnit, egy sokoldalú multimodális rendszert, amelyet kifejezetten olyan innovatív alkalmazásokhoz terveztek, mint az okosszemüvegek és az intelligens műszerfalak. Ez a lépés azt tükrözi, hogy a vállalat nem csupán a kutatók és fejlesztők igényeit kívánja kielégíteni, hanem a mesterséges intelligencia fogyasztói eszközökbe való integrálására is fókuszál.