На 29 април Alibaba представи Qwen3, най-новия си голям езиков модел и първия хибриден модел на мислене в Китай, който интегрира както бързи, така и бавни режими на мислене, за да намали изчислителните разходи.
Серията Qwen3 включва набор от модели, като фино настроения Qwen3-30B-A3B и неговата предварително обучена база, вече достъпна в основните платформи. Alibaba Cloud също отвори два модела Mixture-of-Experts (MoE): водещият Qwen3-235B-A22B, с над 235 милиарда параметри, и лекият Qwen3-30B-A3B, с общо 30 милиарда и 3 милиарда активни параметри. Според Alibaba Cloud, Qwen3-235B-A22B осигурява конкурентни резултати в тестове за кодиране, математика и общо мислене, съперничейки на топ модели като DeepSeek-R1, o1 и o3-mini на 01.AI, Grok-3 и Gemini 2.5 Pro.
Двата режима на разсъждение на Qwen3 позволяват на потребителите да превключват между задълбочени отговори стъпка по стъпка или бързи отговори, в зависимост от сложността на задачата, гъвкав дизайн, насочен към балансиране на скоростта и интелигентността. [Alibaba, in Chinese]
Свързани
Нашия източник е Българо-Китайска Търговско-промишлена палaта