Yuan 3.0 Ultra: Chiński model 1T, który zaszokował OpenAI

: Opublikowano: 06 marzec 2026

W świecie sztucznej inteligencji od lat panuje przekonanie, że „większe znaczy lepsze”. Giganci tacy jak OpenAI czy Google prześcigają się w budowaniu coraz potężniejszych sieci, zużywając przy tym niewyobrażalne ilości energii i mocy obliczeniowej. Jednak najnowsze doniesienia z Chin rzucają zupełnie nowe światło na tę strategię. Yuan Lab AI zaprezentowało właśnie model Yuan 3.0 Ultra, który nie tylko operuje na oszałamiającej liczbie jednego biliona parametrów, ale robi to w sposób niezwykle elegancki i efektywny, rzucając wyzwanie dotychczasowym liderom rynku.

Sztuka usuwania zbędnego balastu

Najbardziej fascynującym aspektem Yuan 3.0 Ultra nie jest jego rozmiar, lecz proces, w jakim powstał. Inżynierowie z Yuan Lab postanowili pójść pod prąd: zamiast po prostu dodawać kolejne warstwy, stworzyli system, który w trakcie treningu... usuwa sam siebie. Wykorzystując architekturę Mixture of Experts (MoE), badacze zauważyli, że wiele wyspecjalizowanych podsieci (ekspertów) w tak gigantycznym modelu praktycznie nie bierze udziału w pracy.

Zamiast pozwalać im „marnować miejsce”, wprowadzono innowacyjny mechanizm Layer Adaptive Expert Pruning (LEP). System ten monitoruje aktywność ekspertów w czasie rzeczywistym i bezlitośnie eliminuje te jednostki, które nie wnoszą wartości do procesu rozumowania. Efekt? Model usunął około 33% swojej pierwotnej struktury, co paradoksalnie nie tylko go nie osłabiło, ale sprawiło, że stał się o blisko 50% wydajniejszy w treningu. To tak, jakby ogromna korporacja zwolniła jedną trzecią nieefektywnych pracowników, a dzięki temu pozostały zespół zaczął pracować dwa razy szybciej i lepiej.

Inteligentna dystrybucja mocy

Problemem dużych modeli MoE jest często nierównomierne obciążenie procesorów graficznych (GPU). Chińscy naukowcy rozwiązali to za pomocą systemu Expert Rearrangement, który dynamicznie przesuwa najbardziej zapracowanych „ekspertów” między układami scalonymi, tak aby żaden z nich nie stał bezczynnie. Dzięki tej optymalizacji wydajność treningowa skoczyła z 62 do 92 T-flops na jedno GPU.

W fazie post-treningowej postawiono na walkę z tzw. „overthinkingiem” – zjawiskiem, w którym AI generuje zbyt długie i skomplikowane odpowiedzi na proste pytania. Dzięki mechanizmowi RIRM (Reflection Inhibition Reward Mechanism), Yuan 3.0 Ultra uczy się rozwiązywać problemy w jak najmniejszej liczbie kroków. Model jest premiowany za zwięzłość i logiczną precyzję, co przełożyło się na 16-procentowy wzrost dokładności rozumowania przy jednoczesnym skróceniu odpowiedzi o 14%.

Dominacja w testach rzeczywistych

Wyniki benchmarków budzą respekt. Yuan 3.0 Ultra w testach takich jak Docmatics czy Chat Rag wyprzedza potężne systemy, w tym GPT-5.2 (według nomenklatury źródła) oraz Gemini 3.1 Pro. Szczególnie imponuje w zadaniach korporacyjnych: analizie danych tabelarycznych, wyciąganiu informacji z długich dokumentów oraz generowaniu kodu SQL. Z wynikiem 83,9% w teście Spider oraz ponad 91% w HumanEval, chiński model udowadnia, że optymalizacja architektury i usuwanie zbędnych parametrów to droga do stworzenia AI, która jest nie tylko większa, ale przede wszystkim znacznie inteligentniejsza.

Źródło: https://www.youtube.com/watch?v=34jdVUEjM2M