{"id":467937,"date":"2025-07-20T22:08:15","date_gmt":"2025-07-20T22:08:15","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=467937"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=467937","title":{"rendered":"<span>T-Pro 2.0 \u2014 \u043e\u0442\u043a\u0440\u044b\u0442\u0430\u044f \u0433\u0438\u0431\u0440\u0438\u0434\u043d\u043e-\u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u0430\u044f \u0440\u0443\u0441\u0441\u043a\u043e\u044f\u0437\u044b\u0447\u043d\u0430\u044f LLM<\/span>"},"content":{"rendered":"<div><!--[--><!--]--><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<figure class=\"full-width\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/7b6\/f4d\/5c6\/7b6f4d5c6feb6e26220c5ca40055ec15.jpg\" width=\"780\" height=\"440\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/7b6\/f4d\/5c6\/7b6f4d5c6feb6e26220c5ca40055ec15.jpg 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/7b6\/f4d\/5c6\/7b6f4d5c6feb6e26220c5ca40055ec15.jpg 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u0412\u0441\u0435\u043c \u043f\u0440\u0438\u0432\u0435\u0442! \u041d\u0430 \u0441\u0432\u044f\u0437\u0438 \u0422\u043e\u043b\u044f \u041f\u043e\u0442\u0430\u043f\u043e\u0432, MLE \u0432 \u0422-\u0411\u0430\u043d\u043a\u0435. \u041c\u044b \u043f\u0440\u043e\u0434\u043e\u043b\u0436\u0430\u0435\u043c \u0440\u0430\u0437\u0432\u0438\u0432\u0430\u0442\u044c \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e \u043b\u0438\u043d\u0435\u0439\u043a\u0443 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 <strong>GEN-T<\/strong> \u0438 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u044b \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0441\u0432\u043e\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439: \u0430\u0433\u0435\u043d\u0442\u044b \u0432 \u0441\u0430\u043f\u043f\u043e\u0440\u0442\u0435, \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u043a\u043e\u043f\u0438\u043b\u043e\u0442\u044b \u0434\u043b\u044f \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u043e\u0432 \u0438 \u0412\u0441\u0435\u043b\u0435\u043d\u043d\u0443\u044e \u0430\u0441\u0441\u0438\u0441\u0442\u0435\u043d\u0442\u043e\u0432.<\/p>\n<p>\u041c\u044b \u0443\u0436\u0435 \u0434\u0435\u043b\u0438\u043b\u0438\u0441\u044c \u0431\u043e\u043b\u044c\u0448\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u043e\u0432\u044b\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 T-lite 0.1, T-lite 1.0 \u0438 T-pro 1.0. \u041c\u043e\u0434\u0435\u043b\u0438 \u0437\u0430\u0432\u043e\u0435\u0432\u0430\u043b\u0438 \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u043e\u0441\u0442\u044c \u0438 \u0441\u043a\u0430\u0447\u0438\u0432\u0430\u044e\u0442\u0441\u044f \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u043e \u0431\u043e\u043b\u0435\u0435 15\u043a \u0440\u0430\u0437 \u0432 \u043c\u0435\u0441\u044f\u0446.\u00a0<\/p>\n<p>\u0421\u0435\u0433\u043e\u0434\u043d\u044f \u0434\u0435\u043b\u0438\u043c\u0441\u044f \u043d\u043e\u0432\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u044c\u044e <strong>T-pro 2.0<\/strong>, \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 <strong>Qwen3 32B<\/strong>, \u043d\u043e \u0441 <strong>\u0431\u043e\u043b\u0435\u0435 \u043f\u043b\u043e\u0442\u043d\u043e\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0446\u0438\u0435\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435<\/strong>. \u041c\u043e\u0434\u0435\u043b\u044c \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442 <strong>\u0433\u0438\u0431\u0440\u0438\u0434\u043d\u044b\u0439 \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433<\/strong> \u0438 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0441\u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0435 \u043f\u0435\u0440\u0435\u0434 \u0442\u0435\u043c \u043a\u0430\u043a \u043e\u0442\u0432\u0435\u0447\u0430\u0442\u044c. \u042d\u0442\u043e \u043f\u043e\u043c\u043e\u0433\u0430\u0435\u0442 \u0432 \u0441\u043b\u043e\u0436\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445, \u0433\u0434\u0435 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u0432\u044b\u0432\u043e\u0434\u043e\u0432, \u0442\u0430\u043a\u0438\u0445 \u043a\u0430\u043a \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430.\u00a0<\/p>\n<p>\u041c\u044b \u0434\u043e\u043e\u0431\u0443\u0447\u0430\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u044c \u0432 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u044d\u0442\u0430\u043f\u043e\u0432, \u0447\u0442\u043e\u0431\u044b \u043f\u0440\u043e\u043a\u0430\u0447\u0430\u0442\u044c \u043e\u0431\u0449\u0435\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0437\u0430\u0434\u0430\u0447 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u0438 \u0443\u043b\u0443\u0447\u0448\u0438\u0442\u044c \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439.<\/p>\n<p>\u0420\u0430\u0441\u0441\u043a\u0430\u0436\u0443 \u043e\u0431\u0449\u0438\u0435 \u0434\u0435\u0442\u0430\u043b\u0438 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438, \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0438 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0437\u0430\u043c\u0435\u0440\u043e\u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430. \u041f\u043e\u0434\u0435\u043b\u044e\u0441\u044c, \u043a\u0430\u043a\u0438\u0435 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u0443 \u043d\u0430\u0441 \u0432\u043e\u0437\u043d\u0438\u043a\u0430\u043b\u0438 \u0438 \u043d\u0430 \u0447\u0435\u043c \u043f\u043b\u0430\u043d\u0438\u0440\u0443\u0435\u043c \u0441\u043e\u0441\u0440\u0435\u0434\u043e\u0442\u043e\u0447\u0438\u0442\u044c\u0441\u044f.\u00a0<\/p>\n<h2>\u041f\u0440\u043e\u0446\u0435\u0441\u0441 \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f<\/h2>\n<p><strong>C\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u043d\u043e\u0432\u043e\u0433\u043e \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440\u0430 \u0438 \u0435\u0433\u043e \u0430\u0434\u0430\u043f\u0442\u0430\u0446\u0438\u044f: <\/strong>\u043c\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u043d\u044b\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440 \u0434\u043b\u044f \u043c\u0443\u043b\u044c\u0442\u0438\u043b\u0438\u043d\u0433\u0432\u0430\u043b\u044c\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0441 \u0444\u043e\u043a\u0443\u0441\u043e\u043c \u043d\u0430 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u044f\u0437\u044b\u043a\u0438, \u0432\u0437\u044f\u0432 \u0437\u0430 \u043e\u0441\u043d\u043e\u0432\u0443 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440 Qwen3 \u0438 \u0440\u0430\u0441\u0448\u0438\u0440\u0438\u0432 \u0435\u0433\u043e \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0447\u0430\u0441\u0442\u044c \u0431\u043e\u043b\u0435\u0435 \u0447\u0435\u043c \u0432 \u043f\u044f\u0442\u044c \u0440\u0430\u0437.\u00a0<\/p>\n<p>\u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435\u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0438 \u043d\u0435\u043b\u0430\u0442\u0438\u043d\u0441\u043a\u0438\u0435 \u0442\u043e\u043a\u0435\u043d\u044b \u0441\u043e\u043a\u0440\u0430\u0442\u0438\u043b\u0438 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u0438\u0438 \u043e\u0446\u0435\u043d\u043a\u0438 \u0447\u0430\u0441\u0442\u043e\u0442\u043d\u043e\u0441\u0442\u0438 \u043f\u043e \u043d\u0430\u0448\u0435\u043c\u0443 \u043a\u043e\u0440\u043f\u0443\u0441\u0443 \u043f\u0440\u0435\u0434\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 \u043b\u0443\u0447\u0448\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c <abbr class=\"habraabbr\" title=\"\u043a\u0430\u0437\u0430\u0445\u0441\u043a\u0438\u0439, \u0431\u0430\u0448\u043a\u0438\u0440\u0441\u043a\u0438\u0439 \u0438 \u0434\u0440\u0443\u0433\u0438\u0435\" data-title=\"&lt;p&gt;\u043a\u0430\u0437\u0430\u0445\u0441\u043a\u0438\u0439, \u0431\u0430\u0448\u043a\u0438\u0440\u0441\u043a\u0438\u0439 \u0438 \u0434\u0440\u0443\u0433\u0438\u0435&lt;\/p&gt;\" data-abbr=\"\u0441 \u043c\u0430\u043b\u043e\u0440\u0435\u0441\u0443\u0440\u0441\u043d\u044b\u043c\u0438 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u0430\u043c\u0438\">\u0441 \u043c\u0430\u043b\u043e\u0440\u0435\u0441\u0443\u0440\u0441\u043d\u044b\u043c\u0438 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u0430\u043c\u0438<\/abbr> \u043f\u0440\u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 \u0441\u043b\u043e\u0432\u0430\u0440\u044f \u043a\u0430\u043a \u0443 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438. \u0418\u0442\u043e\u0433\u043e\u0432\u044b\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440 \u043d\u0430 30% \u0431\u043e\u043b\u0435\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u0435\u043d \u0434\u043b\u044f \u0440\u0443\u0441\u0441\u043a\u043e\u0433\u043e \u044f\u0437\u044b\u043a\u0430.<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/575\/b63\/86b\/575b6386be90f87cf67464e75d1424bd.png\" width=\"965\" height=\"583\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/575\/b63\/86b\/575b6386be90f87cf67464e75d1424bd.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/575\/b63\/86b\/575b6386be90f87cf67464e75d1424bd.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p><strong>\u0423\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0437\u0430 \u0441\u0447\u0435\u0442 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440\u0430. <\/strong>\u041c\u044b \u0437\u0430\u043c\u0435\u0440\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0437\u0430 \u0441\u0447\u0435\u0442 \u0431\u043e\u043b\u0435\u0435 \u043f\u043b\u043e\u0442\u043d\u043e\u0433\u043e \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440\u0430 \u043d\u0430 \u0434\u0432\u0443\u0445 \u0434\u043e\u043c\u0435\u043d\u0430\u0445 \u2014 \u0447\u0430\u0442\u043e\u0432\u044b\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u044b \u0438\u0437 <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/ru-arena-hard\" rel=\"noopener noreferrer nofollow\">ru-arena-hard<\/a> \u0438 \u043e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u044b\u0435 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u0438\u0437 <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/t-math\" rel=\"noopener noreferrer nofollow\">T-Math<\/a>.\u00a0<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/edd\/b23\/d23\/eddb23d237f1c422e1e1556a5ae517f0.png\" width=\"1380\" height=\"780\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/edd\/b23\/d23\/eddb23d237f1c422e1e1556a5ae517f0.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/edd\/b23\/d23\/eddb23d237f1c422e1e1556a5ae517f0.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/420\/10e\/c68\/42010ec689cd132dff9e225386cc26fd.png\" alt=\"\u041f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043e\u0442 1,5 \u0434\u043e 3 \u0440\u0430\u0437 \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0434\u043e\u043c\u0435\u043d\u0430 \u0438 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u043e\u043c\u043f\u0442\u0430\" title=\"\u041f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043e\u0442 1,5 \u0434\u043e 3 \u0440\u0430\u0437 \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0434\u043e\u043c\u0435\u043d\u0430 \u0438 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u043e\u043c\u043f\u0442\u0430\" width=\"1380\" height=\"780\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/420\/10e\/c68\/42010ec689cd132dff9e225386cc26fd.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/420\/10e\/c68\/42010ec689cd132dff9e225386cc26fd.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u041f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043e\u0442 <strong>1,5 \u0434\u043e 3 \u0440\u0430\u0437<\/strong> \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0434\u043e\u043c\u0435\u043d\u0430 \u0438 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u043e\u043c\u043f\u0442\u0430<\/figcaption><\/div>\n<\/figure>\n<details class=\"spoiler\">\n<summary>\u041a\u0430\u043a \u043c\u044b \u0441\u0447\u0438\u0442\u0430\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435<\/summary>\n<div class=\"spoiler__content\">\n<p>\u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0430 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 SGLang \u0441 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 temperature=0.9 \u0438 presence_penalty=1.0 \u0434\u043b\u044f \u043e\u0431\u0435\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439. \u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043e\u0446\u0435\u043d\u0438\u043b\u0438 \u043c\u0435\u0434\u0438\u0430\u043d\u043d\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0442\u043e\u043a\u0435\u043d\u043e\u0432 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u043e\u0431\u0435\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0438 \u043c\u0435\u0434\u0438\u0430\u043d\u043d\u0443\u044e \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0443 (latency) \u043f\u0440\u0438 \u043f\u0430\u043a\u0435\u0442\u043d\u043e\u0439 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u0441 max_concurrent_workers=100. \u041a\u0430\u043a \u0432\u0438\u0434\u043d\u043e \u0438\u0437 \u0433\u0440\u0430\u0444\u0438\u043a\u043e\u0432, \u043d\u0430 \u0431\u043e\u043b\u0435\u0435 \u0434\u043b\u0438\u043d\u043d\u044b\u0445 \u043e\u0442\u0432\u0435\u0442\u0430\u0445 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u0437\u043d\u0430\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0431\u043e\u043b\u044c\u0448\u0435\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435, \u0441\u0432\u044f\u0437\u0430\u043d\u043d\u043e\u0435 \u0441 \u043a\u0432\u0430\u0434\u0440\u0430\u0442\u0438\u0447\u043d\u043e\u0439 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c\u044e \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u044f \u043c\u0435\u0445\u0430\u043d\u0438\u0437\u043c\u0430 \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u044f.<\/p>\n<\/div>\n<\/details>\n<p><strong>\u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u0431\u043e\u043b\u044c\u0448\u043e\u043c \u0440\u0443\u0441\u0441\u043a\u043e\u044f\u0437\u044b\u0447\u043d\u043e\u043c \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u0438\u0432\u043d\u043e\u043c \u043a\u043e\u0440\u043f\u0443\u0441\u0435<\/strong>: \u0432 \u043f\u0435\u0440\u0432\u043e\u043c \u0440\u0435\u043b\u0438\u0437\u0435 \u043d\u0430\u0448 \u0440\u0435\u0446\u0435\u043f\u0442 \u0441\u043e\u0441\u0442\u043e\u044f\u043b \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u0441\u0442\u0430\u0434\u0438\u0439 \u043f\u0440\u043e\u0434\u043e\u043b\u0436\u0430\u044e\u0449\u0435\u0433\u043e\u0441\u044f \u043f\u0440\u0435\u0434\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441 \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u043c \u0442\u043e\u043a\u0435\u043d-\u0431\u044e\u0434\u0436\u0435\u0442\u043e\u043c 140B. \u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0433\u0438\u0431\u0440\u0438\u0434\u043d\u043e-\u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043f\u043e\u0442\u0440\u0435\u0431\u043e\u0432\u0430\u043b\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0439 \u043f\u0435\u0440\u0435\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0440\u0435\u0446\u0435\u043f\u0442\u0430: \u0434\u0430\u0442\u0430\u043c\u0438\u043a\u0441 \u0432\u0442\u043e\u0440\u043e\u0439 \u0441\u0442\u0430\u0434\u0438\u0438 \u0442\u0435\u043f\u0435\u0440\u044c \u0441\u043e\u0441\u0442\u043e\u0438\u0442 \u0438\u0437 40B \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u0438\u0432\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u0433\u0434\u0435 \u0442\u0440\u0435\u0442\u044c \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0442 \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433 \u0434\u0430\u043d\u043d\u044b\u0435.<\/p>\n<p><strong>\u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u0431\u043e\u043b\u0435\u0435 \u0447\u0438\u0441\u0442\u043e\u043c SFT-\u0441\u0435\u0442\u0435: <\/strong>SFT-\u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d \u0438\u0437 \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043d\u044b\u0445 \u043f\u0440\u043e\u043c\u043f\u0442\u043e\u0432, \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u0438\u0441\u0442\u043e\u0447\u043d\u0438\u043a\u043e\u0432 \u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0445 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u043e\u0432 \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u0430\u043d\u043d\u044b\u0445.\u00a0<\/p>\n<p>\u041e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u0446\u0435\u043b\u044c \u2014 \u0443\u0441\u0438\u043b\u0438\u0442\u044c \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u0435 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0434\u0435\u043b\u0438: \u043e\u0442 \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447 \u0438 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0438 \u0434\u043e \u0434\u0438\u0430\u043b\u043e\u0433\u043e\u0432\u043e\u0441\u0442\u0438, \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u043e\u0433\u043e \u043c\u044b\u0448\u043b\u0435\u043d\u0438\u044f \u0438 \u0440\u0435\u0436\u0438\u043c\u0430 \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439.\u00a0<\/p>\n<p>\u041e\u0431\u0449\u0438\u0439 \u0440\u0430\u0437\u043c\u0435\u0440 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u043e\u043a\u043e\u043b\u043e 500 \u0442\u044b\u0441\u044f\u0447 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435. \u041c\u044b \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u043b\u0438 \u043c\u043d\u043e\u0433\u043e\u044d\u0442\u0430\u043f\u043d\u044b\u0439 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d \u0444\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u0438, \u0447\u0442\u043e\u0431\u044b \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0442\u044c \u0432\u044b\u0441\u043e\u043a\u043e\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0438 \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u0438\u0435.<\/p>\n<p>General-\u0434\u0430\u043d\u043d\u044b\u0435:<\/p>\n<ul>\n<li>\n<p>\u0423\u0441\u0442\u0440\u0430\u043d\u0435\u043d\u0438\u0435 \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u043e\u0432. \u041c\u044b \u0443\u0434\u0430\u043b\u0438\u043b\u0438 \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u044b \u0432 \u0431\u043b\u0438\u0437\u043a\u0438\u0445 \u043f\u043e \u0441\u043c\u044b\u0441\u043b\u0443 \u0441\u044d\u043c\u043f\u043b\u0430\u0445, \u0440\u0430\u0441\u0441\u043c\u0430\u0442\u0440\u0438\u0432\u0430\u044f \u0441\u0445\u043e\u0436\u0435\u0441\u0442\u044c \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u043e\u0432 \u0438 LSH.<\/p>\n<\/li>\n<li>\n<p>\u041a\u043e\u043d\u0442\u0440\u043e\u043b\u044c \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u0438\u044f \u0441 <a href=\"https:\/\/arxiv.org\/abs\/2308.07074\" rel=\"noopener noreferrer nofollow\">#InsTag<\/a> \u2014 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0442\u0435\u0433\u0438 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u0434\u043b\u044f \u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u043a\u0438 \u0442\u0435\u043c \u0438 \u0441\u0442\u0438\u043b\u0435\u0439, \u0438\u0437\u0431\u0435\u0433\u0430\u044f \u0434\u043e\u043c\u0438\u043d\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u043e\u0434\u043d\u0438\u0445 \u0442\u0438\u043f\u043e\u0432 \u0434\u0430\u043d\u043d\u044b\u0445 \u043d\u0430\u0434 \u0434\u0440\u0443\u0433\u0438\u043c\u0438.<\/p>\n<\/li>\n<\/ul>\n<ul>\n<li>\n<p>\u0424\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u044f \u043f\u043e RM-score \u2014 \u043e\u0446\u0435\u043d\u0438\u0432\u0430\u043b\u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e reward model (RM), \u043e\u0442\u0441\u0435\u0438\u0432\u0430\u044f \u043d\u0438\u0437\u043a\u043e\u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u044b.<\/p>\n<\/li>\n<li>\n<p>IFD \u0434\u043b\u044f \u0444\u043e\u043a\u0443\u0441\u0430 \u043d\u0430 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u2014 \u043d\u0430 \u0444\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u043c \u044d\u0442\u0430\u043f\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u043b\u0438 <a href=\"https:\/\/arxiv.org\/abs\/2308.12032\" rel=\"noopener noreferrer nofollow\">Instruction-Following Difficulty (IFD)<\/a> \u0434\u043b\u044f \u043e\u0442\u0431\u043e\u0440\u0430 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0441\u043e \u0441\u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u043e\u0439 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c\u044e, \u0447\u0442\u043e\u0431\u044b \u0438\u0437\u0431\u0435\u0436\u0430\u0442\u044c \u043a\u0430\u043a \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u043f\u0440\u043e\u0441\u0442\u044b\u0445 \u0438 \u043d\u0435\u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u044b\u0445, \u0442\u0430\u043a \u0438 \u0447\u0440\u0435\u0437\u043c\u0435\u0440\u043d\u043e \u0441\u043b\u043e\u0436\u043d\u044b\u0445 \u0438 \u0448\u0443\u043c\u043d\u044b\u0445 \u0441\u043b\u0443\u0447\u0430\u0435\u0432.<\/p>\n<\/li>\n<li>\n<p>\u0424\u0438\u043d\u0430\u043b\u044c\u043d\u044b\u0439 \u0432\u044b\u0431\u043e\u0440 \u043e\u0442\u0432\u0435\u0442\u0430. \u0412 \u0437\u0430\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u0435 \u043c\u044b \u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043f\u043e 8 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432 \u043e\u0442\u0432\u0435\u0442\u0430 \u043d\u0430 \u043a\u0430\u0436\u0434\u044b\u0439 \u0437\u0430\u043f\u0440\u043e\u0441 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u043e\u043b\u0435\u0435 \u043c\u043e\u0449\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0438 \u043b\u0443\u0447\u0448\u0438\u0439 \u0432\u0430\u0440\u0438\u0430\u043d\u0442 \u043f\u043e RM-score.<\/p>\n<\/li>\n<\/ul>\n<p>\u0412 general-\u0447\u0430\u0441\u0442\u044c \u043c\u044b \u0434\u043e\u0431\u0430\u0432\u0438\u043b\u0438 1% \u0441\u0435\u043c\u043f\u043b\u043e\u0432 \u0441 \u0434\u043b\u0438\u043d\u043d\u044b\u043c \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442\u043e\u043c \u0434\u043e 32\u043a \u0442\u043e\u043a\u0435\u043d\u043e\u0432.<\/p>\n<p>\u0414\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0434\u043b\u044f reasoning-\u0434\u0430\u043d\u043d\u044b\u0445:<\/p>\n<ul>\n<li>\n<p>\u041e\u0442\u0431\u043e\u0440 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 KL-\u0434\u0438\u0432\u0435\u0440\u0433\u0435\u043d\u0446\u0438\u0438. \u041c\u044b \u043e\u0446\u0435\u043d\u0438\u043b\u0438 KL-\u0434\u0438\u0432\u0435\u0440\u0433\u0435\u043d\u0446\u0438\u044e \u043c\u0435\u0436\u0434\u0443 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f\u043c\u0438 RM-score \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0439 \u0443\u0447\u0438\u0442\u0435\u043b\u044f \u0438 \u0443\u0447\u0435\u043d\u0438\u043a\u0430 \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u043b\u0438 \u0442\u043e\u043b\u044c\u043a\u043e \u0442\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u044b, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f KL \u043d\u0430\u0445\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u0432 \u0441\u0440\u0435\u0434\u043d\u0435\u043c \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d\u0435. \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u043d\u0430\u043c \u0432\u044b\u0431\u0440\u0430\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u0440\u044b, \u0441\u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043f\u043e \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438.<\/p>\n<\/li>\n<li>\n<p>\u0424\u0438\u043d\u0430\u043b\u044c\u043d\u044b\u0439 \u0432\u044b\u0431\u043e\u0440 \u043e\u0442\u0432\u0435\u0442\u0430. \u0414\u043b\u044f \u0432\u0435\u0440\u0438\u0444\u0438\u0446\u0438\u0440\u0443\u0435\u043c\u044b\u0445 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u043c\u044b \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043b\u0438 \u0432\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u043e\u0442\u0432\u0435\u0442\u0430. \u041e\u043a\u043e\u043d\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u043c \u043e\u0442\u0432\u0435\u0442\u043e\u043c \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0441\u044f \u0441\u0430\u043c\u044b\u0439 \u043a\u043e\u0440\u043e\u0442\u043a\u0438\u0439 \u043f\u043e \u0434\u043b\u0438\u043d\u0435 \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439 \u0441\u0440\u0435\u0434\u0438 \u0442\u043e\u043f-3 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432, \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438-\u0443\u0447\u0438\u0442\u0435\u043b\u044f \u0438 \u043e\u0442\u0441\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0445 \u043f\u043e RM-score. \u0422\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043c\u044b \u0434\u043e\u0441\u0442\u0438\u0433\u043b\u0438 \u0431\u0430\u043b\u0430\u043d\u0441\u0430 \u043c\u0435\u0436\u0434\u0443 \u043a\u0440\u0430\u0442\u043a\u043e\u0441\u0442\u044c\u044e \u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e\u043c.<\/p>\n<\/li>\n<\/ul>\n<p>\u0414\u043b\u044f \u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u0438\u0442\u043e\u0433\u043e\u0432\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u043e\u0442\u0432\u0435\u0442\u044b \u043d\u0430 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0438 \u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u043b\u0438\u0441\u044c \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u043e\u043b\u0435\u0435 \u043c\u043e\u0449\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0442\u0430\u043a\u0438\u0445 \u043a\u0430\u043a DeepSeek-V3 0324 \u0438 Qwen3-235B-A22B, \u0447\u0442\u043e \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0432\u0430\u0435\u0442 \u0432\u044b\u0441\u043e\u043a\u0438\u0439 \u0443\u0440\u043e\u0432\u0435\u043d\u044c \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u0438 \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u043e\u0441\u0442\u0438.<\/p>\n<p><strong>Preference tuning. <\/strong>\u0414\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f DPO \u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u2014 \u0441 \u0444\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u0435\u0439 \u043f\u043e \u0434\u043b\u0438\u043d\u0435 \u0438 \u0442\u0438\u043f\u0443 \u0434\u043b\u044f general-\u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0435\u043c \u0431\u0430\u043b\u0430\u043d\u0441\u0430 \u0434\u043e\u043c\u0435\u043d\u043e\u0432 \u0434\u043b\u044f reasoning-\u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439.\u00a0<\/p>\n<p>\u0414\u043b\u044f \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u044f \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043f\u0430\u0440 \u0438\u0437 16 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0439 \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0438\u0441\u044c \u043b\u0443\u0447\u0448\u0438\u0439 \u0438 \u0445\u0443\u0434\u0448\u0438\u0439 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u044b \u043f\u043e \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430. \u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435\u043f\u043e\u043b\u043d\u044b\u0435 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u0438\u0441\u043a\u043b\u044e\u0447\u0430\u043b\u0438\u0441\u044c, \u0430 \u0441\u0440\u0435\u0434\u0438 \u0442\u0440\u0435\u0445 \u043b\u0443\u0447\u0448\u0438\u0445 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0441\u044f \u0441\u0430\u043c\u044b\u0439 \u043a\u043e\u0440\u043e\u0442\u043a\u0438\u0439 \u043e\u0442\u0432\u0435\u0442.<\/p>\n<p>\u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0439 \u043e\u0431\u0443\u0447\u0438\u043b\u0438 \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e reward-\u043c\u043e\u0434\u0435\u043b\u044c \u043d\u0430 \u0431\u0430\u0437\u0435 Qwen3 32B. \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u043b\u043e\u0441\u044c \u043f\u043e \u0442\u0443\u0440\u043d\u0438\u0440\u043d\u043e\u0439 \u0441\u0445\u0435\u043c\u0435, \u0433\u0434\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441\u0440\u0430\u0432\u043d\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u043f\u043e\u043f\u0430\u0440\u043d\u043e \u043a\u0430\u043a \u0432 \u043f\u043b\u0435\u0439-\u043e\u0444\u0444, \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u043c\u043e\u0434\u0435\u043b\u0438 \u0441\u0445\u043e\u0436\u0435\u0433\u043e \u0443\u0440\u043e\u0432\u043d\u044f \u0441\u0442\u0430\u0432\u0438\u043b\u0438\u0441\u044c \u0440\u044f\u0434\u043e\u043c \u0434\u0440\u0443\u0433 \u0441 \u0434\u0440\u0443\u0433\u043e\u043c. \u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b reward-\u043c\u043e\u0434\u0435\u043b\u0438 \u043d\u0430\u0443\u0447\u0438\u0442\u044c\u0441\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u0430\u0442\u044c \u0442\u043e\u043d\u043a\u0438\u0435 \u0440\u0430\u0437\u043b\u0438\u0447\u0438\u044f \u043c\u0435\u0436\u0434\u0443 \u043f\u043e\u0445\u043e\u0436\u0438\u043c\u0438 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 \u043e\u0442\u0432\u0435\u0442\u0430\u043c\u0438, \u0430 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u044b\u0435 \u0441\u043b\u0443\u0447\u0430\u0438.<\/p>\n<p><strong>Speculative decoding. <\/strong>\u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0434\u0440\u0430\u0444\u0442-\u043c\u043e\u0434\u0435\u043b\u0438 \u0432\u044b\u0431\u0440\u0430\u043b\u0438 <a href=\"https:\/\/arxiv.org\/abs\/2401.15077\" rel=\"noopener noreferrer nofollow\">EAGLE 1<\/a> \u0441 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0435\u0439 \u0434\u0440\u0430\u0444\u0442\u0430 \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e tree attention \u0441\u043e\u0433\u043b\u0430\u0441\u043d\u043e <a href=\"https:\/\/arxiv.org\/abs\/2406.16858\" rel=\"noopener noreferrer nofollow\">EAGLE 2<\/a>.\u00a0<\/p>\n<p>\u041e\u0431\u0443\u0447\u0438\u043b\u0438 \u043e\u0434\u043d\u0443 \u044d\u043f\u043e\u0445\u0443 \u043d\u0430 \u0441\u0435\u043c\u043f\u043b\u0435 SFT-\u0441\u0435\u0442\u0430 \u0441 \u0438\u043d\u043a\u0440\u0435\u043c\u0435\u043d\u0442\u043e\u043c \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u0430, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0434\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f T-Pro 2.0, \u043a\u0430\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0434\u043e \u0434\u0432\u0443\u0445 \u0440\u0430\u0437 \u043d\u0430 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0438 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 \u043d\u0443\u043b\u0435\u0432\u043e\u0439 \u0442\u0435\u043c\u043f\u0435\u0440\u0430\u0442\u0443\u0440\u044b \u0438 \u0431\u0430\u0442\u0447\u0430 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 1. \u041f\u0440\u0438 \u0443\u0432\u0435\u043b\u0438\u0447\u0435\u043d\u0438\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 \u0431\u0430\u0442\u0447\u0430 \u043f\u0440\u0438\u0440\u043e\u0441\u0442 \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u043b\u0441\u044f \u043c\u0435\u043d\u0435\u0435 \u043e\u0449\u0443\u0442\u0438\u043c\u044b\u043c \u0438 \u043f\u0440\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0435 \u0431\u0430\u0442\u0447\u0430 8 \u043f\u0440\u043e\u043f\u0430\u0434\u0430\u043b.\u00a0<\/p>\n<p>\u0414\u0440\u0430\u0444\u0442-\u043c\u043e\u0434\u0435\u043b\u044c \u0441 \u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0439 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0435\u0439 \u0438 \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u043c\u044b\u0435 \u043d\u0430\u0441\u0442\u0440\u043e\u0439\u043a\u0438 \u0441 \u043f\u0440\u0438\u043c\u0435\u0440\u0430\u043c\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0432\u044b\u043b\u043e\u0436\u0438\u043b\u0438 <a href=\"https:\/\/huggingface.co\/t-tech\/T-pro-it-2.0-eagle\" rel=\"noopener noreferrer nofollow\">\u043d\u0430 \u043d\u0430\u0448\u0443 \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u0443 \u0432 huggingface.<\/a><\/p>\n<h2>\u0414\u0438\u0430\u043b\u043e\u0433\u043e\u0432\u044b\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438<\/h2>\n<p>\u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043a \u0432\u0435\u0434\u0435\u043d\u0438\u044e \u0434\u0438\u0430\u043b\u043e\u0433\u0430, \u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u044e \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u044f\u043c \u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u044e \u0437\u0430\u0434\u0430\u0447 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 LLM-as-a-judge-\u0430\u0440\u0435\u043d\u044b: <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/ru-arena-hard\" rel=\"noopener noreferrer nofollow\">Arena Hard Ru<\/a>, <a href=\"https:\/\/github.com\/lmarena\/arena-hard-auto\" rel=\"noopener noreferrer nofollow\">Arena Hard 2<\/a> \u0438 \u0430\u0440\u0435\u043d\u0443, \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u0443\u044e \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445, \u043e\u0442\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0445 \u0430\u0432\u0442\u043e\u0440\u043e\u043c \u0440\u0435\u043f\u043e\u0437\u0438\u0442\u043e\u0440\u0438\u044f <a href=\"https:\/\/github.com\/kuk\/wildchat-hard-ru\/tree\/master\" rel=\"noopener noreferrer nofollow\">WildChat Hard Ru<\/a> \u0438\u0437 \u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u0435\u0439. \u0412 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0435\u0439 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0431\u0435\u0439\u0437\u043b\u0430\u0439\u043d\u0430 \u043e\u0442\u0432\u0435\u0442\u044b \u043c\u043e\u0434\u0435\u043b\u0438 o3-mini. \u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0441\u0443\u0434\u044c\u0438 \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0430\u0440\u0435\u043d \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f DeepSeek V3 0324.<\/p>\n<p>\u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0437\u0430\u043c\u0435\u0440\u043e\u0432 \u043d\u0430 \u0430\u0440\u0435\u043d\u0430\u0445. \u0414\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u044e\u0449\u0438\u0445 \u0440\u0435\u0436\u0438\u043c \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439, \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0437\u0430\u043c\u0435\u0440\u044b \u0432 \/think- \u0438 \/no_think-\u0440\u0435\u0436\u0438\u043c\u0430\u0445. \u0420\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0432 <a href=\"https:\/\/huggingface.co\/t-tech\/T-pro-it-2.0\" rel=\"noopener noreferrer nofollow\">\u043a\u0430\u0440\u0442\u043e\u0447\u043a\u0435 \u043c\u043e\u0434\u0435\u043b\u0438<\/a>.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\"><strong>Model<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Arena Hard Ru<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Arena Hard 2 (Hard)<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Arena Hard 2\u00a0 (Creative)<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>WildChat Hard Ru<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">87.6 \/ 86.28<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>64.3<\/u> \/ 56.8<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>83.1<\/u> \/ 82.2<\/p>\n<\/td>\n<td>\n<p align=\"left\">75 \/ <u>76.6<\/u><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 4 Sonnet *<\/p>\n<\/td>\n<td>\n<p align=\"left\">81.04<\/p>\n<\/td>\n<td>\n<p align=\"left\">44.9<\/p>\n<\/td>\n<td>\n<p align=\"left\">61.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">60.4<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 3.7 Sonnet *<\/p>\n<\/td>\n<td>\n<p align=\"left\">82.58<\/p>\n<\/td>\n<td>\n<p align=\"left\">36.7<\/p>\n<\/td>\n<td>\n<p align=\"left\">61.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">56.5<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 3.5 Sonnet *<\/p>\n<\/td>\n<td>\n<p align=\"left\">69.12<\/p>\n<\/td>\n<td>\n<p align=\"left\">29.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.5<\/p>\n<\/td>\n<td>\n<p align=\"left\">39.6<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>91.32<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">50.9<\/p>\n<\/td>\n<td>\n<p align=\"left\">77.4<\/p>\n<\/td>\n<td>\n<p align=\"left\">76<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek R1<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>90.88<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>67.8<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>95.1<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>83<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Qwen3 32B<\/p>\n<\/td>\n<td>\n<p align=\"left\">83.6 \/ 82.58<\/p>\n<\/td>\n<td>\n<p align=\"left\">56.4 \/ 42<\/p>\n<\/td>\n<td>\n<p align=\"left\">73.6 \/ 63.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">66.1 \/ 59.2<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">64.78<\/p>\n<\/td>\n<td>\n<p align=\"left\">14.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">35.4<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td>\n<p align=\"left\">65.01 \/ 65.99<\/p>\n<\/td>\n<td>\n<p align=\"left\">17 \/ 19.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">31.2 \/ 26.4\u00a0<\/p>\n<\/td>\n<td>\n<p align=\"left\">47.5 \/ 50.4<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Gemma3-27B<\/p>\n<\/td>\n<td>\n<p align=\"left\">75.88<\/p>\n<\/td>\n<td>\n<p align=\"left\">25.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">78.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">52.7<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>* Claude \u0437\u0430\u043c\u0435\u0440\u0435\u043d\u044b \u0432 \u0440\u0435\u0436\u0438\u043c\u0435 \u0431\u0435\u0437 \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439<\/p>\n<p><strong>Common-knowledge-\u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438. <\/strong>\u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u0432 \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0437\u043d\u0430\u043d\u0438\u0439 \u043e \u043c\u0438\u0440\u0435 \u0438 \u043e\u0431\u0449\u0438\u043c \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044f\u043c \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438: <a href=\"https:\/\/mera.a-ai.ru\/ru\/leaderboard\" rel=\"noopener noreferrer nofollow\">MERA<\/a>, <a href=\"https:\/\/mera.a-ai.ru\/ru\/tasks\/22\" rel=\"noopener noreferrer nofollow\">MaMuRAMu<\/a>, <a href=\"https:\/\/mera.a-ai.ru\/ru\/tasks\/9\" rel=\"noopener noreferrer nofollow\">ruMMLU<\/a>, ruMMLU-Pro.<\/p>\n<p>\u0412\u0441\u0435 \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0432 \/no_think-\u0440\u0435\u0436\u0438\u043c\u0435.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\"><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>MERA<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>MaMuRAMu<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruMMLU<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruMMLU-Pro<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.66<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.851<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.790<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.697<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 3.7 Sonnet<\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.682<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.89<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.845<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8212;<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.677<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.882<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.8<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8212;<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Qwen3 32B\u00a0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.584<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.833<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.740<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.677<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek-R1-Distill-Qwen-32B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.508<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.787<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.702<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.537<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.629<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.841<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.769<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.663<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.574<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.823<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.737<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.652<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Gemma3-27B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.577<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.797<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.695<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.665<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Mistral Small 3.1 24B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.526<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.813<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.714<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.617<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p><strong>Reasoning-\u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438. <\/strong>\u041c\u044b \u0432\u0437\u044f\u043b\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u044b\u0445 \u0430\u043a\u0430\u0434\u0435\u043c\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0438 \u0438\u043d\u0434\u0443\u0441\u0442\u0440\u0438\u0430\u043b\u044c\u043d\u044b\u0445 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u0432, \u0447\u0442\u043e\u0431\u044b \u043e\u0431\u044a\u0435\u043a\u0442\u0438\u0432\u043d\u043e \u043e\u0446\u0435\u043d\u0438\u0442\u044c \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u043a \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u044f\u043c \u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u044e \u0441\u043b\u043e\u0436\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447: <a href=\"https:\/\/github.com\/GAIR-NLP\/AIME-Preview\" rel=\"noopener noreferrer nofollow\">AIME<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2305.20050\" rel=\"noopener noreferrer nofollow\">MATH-500<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2311.12022\" rel=\"noopener noreferrer nofollow\">GPQA Diamond<\/a>, <a href=\"https:\/\/huggingface.co\/datasets\/Vikhrmodels\/russian_math\" rel=\"noopener noreferrer nofollow\">Vikhr Math<\/a>, <a href=\"https:\/\/huggingface.co\/datasets\/Vikhrmodels\/russian_physics\" rel=\"noopener noreferrer nofollow\">Vikhr Physics<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2403.07974\" rel=\"noopener noreferrer nofollow\">LiveCodeBench<\/a> v4_v5.\u00a0<\/p>\n<p>\u0414\u043b\u044f Vikhr Math \u0438 Vikhr Physics \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u043a\u043e\u0434\u043e\u043c \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 <a href=\"https:\/\/github.com\/huggingface\/Math-Verify\" rel=\"noopener noreferrer nofollow\">Math-Verify<\/a>. \u0410\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438 \u0431\u044b\u043b\u0438 \u0446\u0435\u043b\u0438\u043a\u043e\u043c \u043b\u043e\u043a\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u043d\u044b \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u0438\u0439 \u044f\u0437\u044b\u043a \u0418\u0418-\u0442\u0440\u0435\u043d\u0435\u0440\u0430\u043c\u0438: ruAIME, ruMATH-500, ru GPQA Diamond, ruLCB.\u00a0<\/p>\n<p>\u041c\u044b \u0441\u043e\u0431\u0440\u0430\u043b\u0438 \u0441\u0432\u043e\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a \u0422-Math, \u0447\u0442\u043e\u0431\u044b \u0440\u0430\u0441\u0448\u0438\u0440\u0438\u0442\u044c \u043e\u0446\u0435\u043d\u043a\u0443 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435.<\/p>\n<p><\/p>\n<p><strong>\u0414\u043b\u044f \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044f T-Math<\/strong> \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u0438\u0437 <a href=\"https:\/\/vos.olimpiada.ru\/\" rel=\"noopener noreferrer nofollow\">\u0412\u0441\u0435\u0440\u043e\u0441\u0441\u0438\u0439\u0441\u043a\u043e\u0439<\/a> \u0438 <a href=\"https:\/\/mos.olimpiada.ru\/\" rel=\"noopener noreferrer nofollow\">\u041c\u043e\u0441\u043a\u043e\u0432\u0441\u043a\u043e\u0439<\/a> \u043e\u043b\u0438\u043c\u043f\u0438\u0430\u0434 \u0448\u043a\u043e\u043b\u044c\u043d\u0438\u043a\u043e\u0432. \u0412\u0441\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u0438\u0437\u0432\u043b\u0435\u0447\u0435\u043d\u044b \u0438 \u043f\u0440\u043e\u0432\u0435\u0440\u0435\u043d\u044b \u043b\u044e\u0434\u044c\u043c\u0438 \u043d\u0430 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u043e\u0441\u0442\u044c. \u0412 \u0438\u0442\u043e\u0433\u0435 \u0441\u043e\u0431\u0440\u0430\u043b\u0438 331 \u0437\u0430\u0434\u0430\u0447\u0443 \u0441 1998 \u043f\u043e 2025 \u0433\u043e\u0434. \u041f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u0441\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0439\u0442\u0438 \u0432 \u043a\u0430\u0440\u0442\u043e\u0447\u043a\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430 \u043d\u0430 <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/t-math\" rel=\"noopener noreferrer nofollow\">huggingface<\/a>.<\/p>\n<p><\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\"><strong>\u0414\u0430\u0442\u0430\u0441\u0435\u0442<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>\u041e\u0431\u043b\u0430\u0441\u0442\u044c<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>\u0420\u0430\u0437\u043c\u0435\u0440<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>\u041c\u0435\u0442\u0440\u0438\u043a\u0430<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>AIME2024, AIME2025<br \/>ruAIME2024, ruAIME2025<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">2 \u00d7 30<\/p>\n<\/td>\n<td>\n<p align=\"left\">Acc avg@16<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>MATH-500<br \/>ruMATH-500<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">500<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>GPQA Diamond<br \/>ruGPQA Diamond<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u0425\u0438\u043c\u0438\u044f, \u0431\u0438\u043e\u043b\u043e\u0433\u0438\u044f, \u0444\u0438\u0437\u0438\u043a\u0430 (\u0443\u0440\u043e\u0432\u0435\u043d\u044c \u044d\u043a\u0441\u043f\u0435\u0440\u0442\u0430)<\/p>\n<\/td>\n<td>\n<p align=\"left\">198<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>LCB, ruLCB<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041a\u043e\u0434<\/p>\n<\/td>\n<td>\n<p align=\"left\">268<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Vikhr Math<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">199<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Vikhr Physics<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u0444\u0438\u0437\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">98<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>T-MATH<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">331<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041c\u0435\u0442\u0440\u0438\u043a\u0438 \u043d\u0430 \u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435. \u0414\u043b\u044f \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433-\u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u0441\u0435 \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u0432 think-\u0440\u0435\u0436\u0438\u043c\u0435.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>AIME2024<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>AIME2025<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>MATH-500<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>GPQA Diamond<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>LCB<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.765<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.679<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.966<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.641<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.556<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.52<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.285<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.942<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.655<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.405<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">DeepSeek R1<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>0.914<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.875<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.983<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.813<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.77<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">Qwen3 32B<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><u>0.808<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.725<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.961<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.668<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.546<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">DeepSeek-R1-Distill-Qwen-32B<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.706<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.573<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.950<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.621<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.572<\/u><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.085<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.052<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.744<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.530<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.243<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.692<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.604<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.948<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.596<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.489<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">Gemma 3 27B<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.260<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.221<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.882<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.515<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.246<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041c\u0435\u0442\u0440\u0438\u043a\u0438 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435. \u0414\u043b\u044f \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433-\u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u0441\u0435 \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u0432 think-\u0440\u0435\u0436\u0438\u043c\u0435.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruAIME<br \/>2024<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruAIME<br \/>2025<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruMATH-500<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ru GPQA Diamond<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>ruLCB<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>T-Math<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Vikhr Math<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\"><strong>Vikhr Physics<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.704<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.646<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.94<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.591<\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><u>0.563<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.541<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.799<\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\"><u>0.51<\/u><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.319<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.285<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.882<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.657<\/u><\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">0.444<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.278<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.613<\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\">0.367<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">DeepSeek R1<\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.8<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.8<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.972<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.763<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>0.69<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.619<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.864<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\">0.469<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">Qwen3 32B<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.706<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.625<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.938<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.606<\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">0.537<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.529<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.809<\/u><\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\"><strong>0.531<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">DeepSeek-R1-Distill-Qwen-32B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.510<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.402<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.898<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.631<\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">0.493<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.254<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.462<\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\">0.286<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.144<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.133<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.788<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.465<\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">0.235<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.163<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.422<\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\">0.316<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.575<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.450<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.926<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.591<\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">0.500<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.444<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.528<\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\">0.337<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">Gemma 3 27B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.248<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.231<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.860<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.439<\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\">0.261<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.208<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.548<\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\">0.276<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<h2>\u0417\u0430\u0447\u0435\u043c \u043c\u044b \u044d\u0442\u0438\u043c \u0437\u0430\u043d\u0438\u043c\u0430\u0435\u043c\u0441\u044f<\/h2>\n<p>\u0417\u0430 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0439 \u0433\u043e\u0434 open-source-\u043c\u043e\u0434\u0435\u043b\u0438 \u043f\u0440\u043e\u0434\u0435\u043b\u0430\u043b\u0438 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u043f\u0443\u0442\u044c; \u0440\u0430\u0437\u0440\u044b\u0432 \u043c\u0435\u0436\u0434\u0443 \u043f\u0440\u043e\u043f\u0440\u0438\u0435\u0442\u0430\u0440\u043d\u044b\u043c\u0438 \u0438 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 \u0441\u043e\u043a\u0440\u0430\u0449\u0430\u0435\u0442\u0441\u044f. \u041f\u043e \u043a\u0440\u0430\u0439\u043d\u0435\u0439 \u043c\u0435\u0440\u0435 \u043f\u043e\u043a\u0430.\u00a0<\/p>\n<p>\u041c\u043e\u0434\u0435\u043b\u0438 <strong>Deepseek V3\/R1<\/strong> \u0438 <strong>Qwen3 235B A22B<\/strong> \u0441\u0434\u0435\u043b\u0430\u043b\u0438 \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u044b\u043c \u0437\u0430\u043f\u0443\u0441\u043a \u043c\u043e\u0434\u0435\u043b\u0438 \u0443\u0440\u043e\u0432\u043d\u044f <strong>gpt4<\/strong> \u043b\u043e\u043a\u0430\u043b\u044c\u043d\u043e \u0432 \u043a\u043e\u043d\u0442\u0443\u0440\u0435.<\/p>\n<p>\u0414\u043b\u044f \u043d\u0430\u0441 \u0432\u0430\u0436\u043d\u043e \u0443\u043c\u0435\u0442\u044c \u0434\u043e\u043e\u0431\u0443\u0447\u0430\u0442\u044c \u0441\u0430\u043c\u044b\u0435 \u043f\u0440\u043e\u0434\u0432\u0438\u043d\u0443\u0442\u044b\u0435 (\u0432 \u0442\u043e\u043c \u0447\u0438\u0441\u043b\u0435 \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u044b\u0435) LLM \u0438 \u043d\u0435 \u0442\u0435\u0440\u044f\u0442\u044c \u0432 \u043e\u0431\u0449\u0438\u0445 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044f\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0432 \u0442\u043e \u0436\u0435 \u0432\u0440\u0435\u043c\u044f \u0440\u0435\u0448\u0430\u044f \u0432\u0430\u0436\u043d\u044b\u0435 \u0434\u043b\u044f \u043d\u0430\u0441 \u0437\u0430\u0434\u0430\u0447\u0438:<\/p>\n<ul>\n<li>\n<p>\u0423\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c\u044e \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0438 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c\u044e \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438.<\/p>\n<\/li>\n<li>\n<p>\u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u0432\u0430\u0436\u043d\u044b\u0435 \u0434\u043b\u044f \u043d\u0430\u0441 \u0434\u043e\u043c\u0435\u043d\u044b. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0434\u043e\u043c\u0435\u043d \u0441\u0430\u043f\u043f\u043e\u0440\u0442\u0430 \u0438\u043b\u0438 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0435\u0433\u043e \u043f\u0440\u043e\u043c\u043f\u0442\u0438\u043d\u0433\u0430.<\/p>\n<\/li>\n<li>\n<p>\u0423\u043c\u0435\u043d\u044c\u0448\u0435\u043d\u0438\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u0430\u0440\u0442\u0435\u0444\u0430\u043a\u0442\u043e\u0432 \u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c \u0441 \u0440\u0443\u0441\u0441\u043a\u0438\u043c \u044f\u0437\u044b\u043a\u043e\u043c.<\/p>\n<\/li>\n<\/ul>\n<p>\u0412 \u0442\u043e \u0436\u0435 \u0432\u0440\u0435\u043c\u044f \u0432 \u043f\u0440\u0438\u043a\u043b\u0430\u0434\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445 \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u044b\u0439 \u0444\u0430\u0439\u043d\u0442\u044e\u043d\u0438\u043d\u0433 \u043d\u0430\u0441 \u0432\u0441\u0435 \u0435\u0449\u0435 \u043d\u0435 \u0443\u0441\u0442\u0440\u0430\u0438\u0432\u0430\u0435\u0442, \u043d\u0430\u043c \u043d\u0443\u0436\u043d\u043e \u0437\u0430\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0442\u044c \u0444\u0430\u043a\u0442\u044b \u0438 \u0443\u043c\u0435\u043d\u0438\u044f \u0432 \u0433\u043e\u0440\u0430\u0437\u0434\u043e \u0431\u043e\u043b\u0435\u0435 \u0440\u0430\u043d\u043d\u0438\u0435 \u0444\u0430\u0437\u044b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u041d\u0430\u0448 \u043e\u043f\u044b\u0442 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442, \u0447\u0442\u043e \u044d\u0442\u043e \u043d\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0431\u0435\u0437 \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u044f \u0432 \u043a\u0430\u043a\u043e\u0439-\u0442\u043e \u0441\u0442\u0435\u043f\u0435\u043d\u0438 \u0432\u0441\u0435\u0445 \u044d\u0442\u0430\u043f\u043e\u0432 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 LLM \u0441 \u043f\u043e\u0434\u043c\u0435\u0448\u0438\u0432\u0430\u043d\u0438\u0435\u043c \u0441\u0432\u043e\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u043e\u0447\u0435\u043d\u044c \u0442\u043e\u043d\u043a\u043e\u0433\u043e \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u043d\u0430\u0441\u043b\u043e\u0435\u043d\u0438\u044f \u044d\u0442\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u043e\u0432\u0435\u0440\u0445 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439.<\/p>\n<p>\u0412\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u043b\u0438\u043d\u0435\u0439\u043a\u0438 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c \u0432 \u0441\u0432\u043e\u0438\u0445 \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u0430\u0445, \u043f\u0440\u043e\u0445\u043e\u0434\u044f\u0442 \u043f\u043e\u0445\u043e\u0436\u0438\u0439 \u043d\u0430 T-Pro 2.0 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f, \u043d\u043e \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u043a\u043e\u0442\u043e\u0440\u044b\u043c\u0438 \u043c\u044b \u043f\u043e \u043f\u043e\u043d\u044f\u0442\u043d\u044b\u043c \u043f\u0440\u0438\u0447\u0438\u043d\u0430\u043c \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u043d\u0435 \u043c\u043e\u0436\u0435\u043c.<\/p>\n<p>\u041c\u043e\u0434\u0435\u043b\u044c <strong>T-pro 2.0<\/strong> \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0430 <strong>\u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445<\/strong> \u0438 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0434\u043b\u044f \u043d\u0430\u0441 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u043c \u0440\u0430\u0431\u043e\u0442\u044b \u043d\u0430\u0434 \u0440\u0435\u0446\u0435\u043f\u0442\u043e\u043c \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0438 \u0430\u0440\u0442\u0435\u0444\u0430\u043a\u0442\u043e\u043c, \u043a\u043e\u0442\u043e\u0440\u044b\u043c \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u0441 \u043a\u043e\u043c\u044c\u044e\u043d\u0438\u0442\u0438. \u041c\u043e\u0434\u0435\u043b\u044c \u043c\u043e\u0436\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c <strong>\u043a\u0430\u043a \u0434\u043b\u044f \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0437\u0430\u0434\u0430\u0447 \u0432 \u043f\u0440\u043e\u043c\u043f\u0442\u0438\u043d\u0433\u0435, \u0442\u0430\u043a \u0438 \u0434\u043b\u044f \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u0441\u0432\u043e\u0438 \u0437\u0430\u0434\u0430\u0447\u0438<\/strong>. <\/p>\n<p>\u041c\u044b \u0432\u043f\u0435\u0440\u0432\u044b\u0435 \u0440\u0435\u0448\u0438\u043b\u0438 \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u0431\u043e\u043b\u044c\u0448\u0438\u043c \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u0438\u0432\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/T-Wix\" rel=\"noopener noreferrer nofollow\"><strong>T-Wix<\/strong><\/a><strong>, <\/strong>\u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u0442 \u043e\u043a\u043e\u043b\u043e <strong>500k <\/strong>\u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432, \u0432\u043a\u043b\u044e\u0447\u0430\u0435\u0442 \u0432 \u0441\u0435\u0431\u044f <strong>\u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u0443\u044e<\/strong> \u0438 <strong>\u043d\u0435\u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u0443\u044e<\/strong> \u0447\u0430\u0441\u0442\u044c. \u041f\u0440\u0438\u043c\u0435\u0440\u044b \u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u043f\u0440\u043e\u0448\u043b\u0438 \u043c\u043d\u043e\u0433\u043e\u0441\u0442\u0430\u0434\u0438\u0439\u043d\u044b\u0439 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u043e\u0447\u0438\u0441\u0442\u043a\u0438 \u0438 \u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u043a\u0438. \u0415\u0433\u043e \u043c\u043e\u0436\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0434\u043b\u044f \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u0438 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0445 LLM \u043a\u0430\u043a \u0441\u0430\u043c\u043e\u0441\u0442\u043e\u044f\u0442\u0435\u043b\u044c\u043d\u043e, \u0442\u0430\u043a \u0438 \u0441 \u0434\u043e\u043c\u0435\u0448\u0438\u0432\u0430\u043d\u0438\u0435\u043c \u0434\u043e\u043c\u0435\u043d\u043d\u044b\u0445 \u0438\u043b\u0438 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445.\u00a0<\/p>\n<p>\u041d\u0430\u0434\u0435\u0435\u043c\u0441\u044f, \u0447\u0442\u043e \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u0442\u0430\u043a\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0432 \u043e\u0442\u043a\u0440\u044b\u0442\u043e\u043c \u0434\u043e\u0441\u0442\u0443\u043f\u0435 \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u0442 \u0431\u043e\u043b\u044c\u0448\u0435\u043c\u0443 \u0447\u0438\u0441\u043b\u0443 \u044d\u043d\u0442\u0443\u0437\u0438\u0430\u0441\u0442\u043e\u0432 \u0438 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0439 \u0434\u0435\u043b\u0430\u0442\u044c \u0441\u0432\u043e\u0438 \u043a\u0440\u0443\u0442\u044b\u0435 \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u044b \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 LLM!<\/p>\n<h2>\u041e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438<\/h2>\n<p><strong>\u0414\u043b\u0438\u043d\u0430 \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442\u0430.<\/strong> \u0412\u0441\u0435 \u0441\u0442\u0430\u0434\u0438\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u043e\u0448\u043b\u0430 \u0441 \u0434\u043b\u0438\u043d\u043e\u0439 \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442\u0430, \u0440\u0430\u0432\u043d\u043e\u0439 <strong>32\u043a<\/strong> \u0442\u043e\u043a\u0435\u043d\u043e\u0432, \u043a\u0430\u043a \u0438 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c Qwen, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442 <strong>\u0434\u043e 128k<\/strong> \u0442\u043e\u043a\u0435\u043d\u043e\u0432 \u0434\u043e\u043b\u0436\u0435\u043d \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 RoPE scaling.\u00a0 <\/p>\n<p><strong>Function calling \u0438 MCP. <\/strong>\u041c\u044b \u043d\u0435 \u0437\u0430\u043d\u0438\u043c\u0430\u043b\u0438\u0441\u044c \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u0438\u0435\u043c function calling \u0438 \u0440\u0430\u0431\u043e\u0442\u043e\u0439 \u0441 MCP, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u044d\u0442\u043e \u0434\u043e\u043b\u0436\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u043d\u0430 \u0443\u0440\u043e\u0432\u043d\u0435 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 Qwen \u0438\u043b\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0445\u0443\u0436\u0435 \u2014 \u043f\u043b\u0430\u043d\u0438\u0440\u0443\u0435\u043c \u0441\u043e\u0441\u0440\u0435\u0434\u043e\u0442\u043e\u0447\u0438\u0442\u044c\u0441\u044f \u043d\u0430 \u044d\u0442\u043e\u043c \u0432 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0445 \u0440\u0435\u043b\u0438\u0437\u0430\u0445.<\/p>\n<h2>\u0412\u044b\u0432\u043e\u0434\u044b<\/h2>\n<p><strong>T-pro 2.0<\/strong>:<\/p>\n<ul>\n<li>\n<p><strong>\u0413\u0438\u0431\u0440\u0438\u0434\u043d\u043e-\u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c, \u043b\u0438\u0434\u0438\u0440\u0443\u044e\u0449\u0430\u044f \u0441\u0440\u0435\u0434\u0438 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u226435B <\/strong>\u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432 \u0432 \u0440\u0443\u0441\u0441\u043a\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430\u0445.<\/p>\n<\/li>\n<li>\n<p><strong>\u0413\u0435\u043d\u0435\u0440\u0438\u0440\u0443\u0435\u0442 \u0442\u0435\u043a\u0441\u0442 \u0434\u043e 2 \u0440\u0430\u0437 \u0431\u044b\u0441\u0442\u0440\u0435\u0435,<\/strong> \u0447\u0435\u043c \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c Qwen, \u0437\u0430 \u0441\u0447\u0435\u0442 \u0431\u043e\u043b\u0435\u0435 \u043f\u043b\u043e\u0442\u043d\u043e\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0446\u0438\u0438 \u0438 \u0441\u043f\u0435\u043a\u0443\u043b\u044f\u0442\u0438\u0432\u043d\u043e\u0433\u043e \u0434\u0435\u043a\u043e\u0434\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f.\u00a0<\/p>\n<\/li>\n<\/ul>\n<p>\u041a\u0430\u043a \u0438 \u043b\u044e\u0431\u0430\u044f LLM, <strong>T-pro 2.0<\/strong> \u043c\u043e\u0436\u0435\u0442 \u0434\u043e\u043f\u0443\u0441\u043a\u0430\u0442\u044c \u0433\u0430\u043b\u043b\u044e\u0446\u0438\u043d\u0430\u0446\u0438\u0438, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u0434\u043b\u044f production-\u0441\u0446\u0435\u043d\u0430\u0440\u0438\u0435\u0432 \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u043c RAG, \u0442\u043e\u043d\u043a\u0438\u0439 fine-tune \u0438 \u0432\u043d\u0435\u0448\u043d\u0438\u0435 \u043c\u0435\u0445\u0430\u043d\u0438\u0437\u043c\u044b \u0431\u0435\u0437\u043e\u043f\u0430\u0441\u043d\u043e\u0441\u0442\u0438.<\/p>\n<p>\u0414\u0435\u0442\u0430\u043b\u044c\u043d\u044b\u0439 \u0440\u0430\u0437\u0431\u043e\u0440 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d\u0430 \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0431\u0443\u0434\u0435\u0442 \u0432 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0439 \u0441\u0442\u0430\u0442\u044c\u0435. \u0410 \u043f\u043e\u043a\u0430 \u043d\u0430\u043c \u0432\u0430\u0436\u043d\u043e \u0432\u0430\u0448\u0435 \u043c\u043d\u0435\u043d\u0438\u0435 \u2014 \u043e\u0442\u043a\u0440\u044b\u0432\u0430\u0439\u0442\u0435 \u0440\u0435\u043f\u043e\u0437\u0438\u0442\u043e\u0440\u0438\u0439, \u0437\u0430\u0432\u043e\u0434\u0438\u0442\u0435 issues \u0438 \u0434\u0435\u043b\u0438\u0442\u0435\u0441\u044c \u043a\u0435\u0439\u0441\u0430\u043c\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f.<\/p>\n<p><strong>\u041f\u043e\u043b\u0435\u0437\u043d\u044b\u0435 \u0441\u0441\u044b\u043b\u043a\u0438:\u00a0<\/strong><\/p>\n<ul>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/t-tech\/T-pro-it-2.0\" rel=\"noopener noreferrer nofollow\">T-pro 2.0 \u043d\u0430 huggingface<\/a><\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/T-Wix\" rel=\"noopener noreferrer nofollow\">SFT \u0434\u0430\u0442\u0430\u0441\u0435\u0442 T-Wix<\/a><\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/t-math\" rel=\"noopener noreferrer nofollow\">T-Math \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a<\/a><\/p>\n<\/li>\n<\/ul>\n<\/div>\n<\/div>\n<\/div>\n<p><!----><!----><\/div>\n<p><!----><!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/articles\/928956\/\"> https:\/\/habr.com\/ru\/articles\/928956\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div><!--[--><!--]--><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<figure class=\"full-width\"><\/figure>\n<p>\u0412\u0441\u0435\u043c \u043f\u0440\u0438\u0432\u0435\u0442! \u041d\u0430 \u0441\u0432\u044f\u0437\u0438 \u0422\u043e\u043b\u044f \u041f\u043e\u0442\u0430\u043f\u043e\u0432, MLE \u0432 \u0422-\u0411\u0430\u043d\u043a\u0435. \u041c\u044b \u043f\u0440\u043e\u0434\u043e\u043b\u0436\u0430\u0435\u043c \u0440\u0430\u0437\u0432\u0438\u0432\u0430\u0442\u044c \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e \u043b\u0438\u043d\u0435\u0439\u043a\u0443 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 <strong>GEN-T<\/strong> \u0438 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u044b \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0441\u0432\u043e\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439: \u0430\u0433\u0435\u043d\u0442\u044b \u0432 \u0441\u0430\u043f\u043f\u043e\u0440\u0442\u0435, \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u043a\u043e\u043f\u0438\u043b\u043e\u0442\u044b \u0434\u043b\u044f \u0441\u043e\u0442\u0440\u0443\u0434\u043d\u0438\u043a\u043e\u0432 \u0438 \u0412\u0441\u0435\u043b\u0435\u043d\u043d\u0443\u044e \u0430\u0441\u0441\u0438\u0441\u0442\u0435\u043d\u0442\u043e\u0432.<\/p>\n<p>\u041c\u044b \u0443\u0436\u0435 \u0434\u0435\u043b\u0438\u043b\u0438\u0441\u044c \u0431\u043e\u043b\u044c\u0448\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u043e\u0432\u044b\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 T-lite 0.1, T-lite 1.0 \u0438 T-pro 1.0. \u041c\u043e\u0434\u0435\u043b\u0438 \u0437\u0430\u0432\u043e\u0435\u0432\u0430\u043b\u0438 \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u043e\u0441\u0442\u044c \u0438 \u0441\u043a\u0430\u0447\u0438\u0432\u0430\u044e\u0442\u0441\u044f \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u043e \u0431\u043e\u043b\u0435\u0435 15\u043a \u0440\u0430\u0437 \u0432 \u043c\u0435\u0441\u044f\u0446.\u00a0<\/p>\n<p>\u0421\u0435\u0433\u043e\u0434\u043d\u044f \u0434\u0435\u043b\u0438\u043c\u0441\u044f \u043d\u043e\u0432\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u044c\u044e <strong>T-pro 2.0<\/strong>, \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 <strong>Qwen3 32B<\/strong>, \u043d\u043e \u0441 <strong>\u0431\u043e\u043b\u0435\u0435 \u043f\u043b\u043e\u0442\u043d\u043e\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0446\u0438\u0435\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435<\/strong>. \u041c\u043e\u0434\u0435\u043b\u044c \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442 <strong>\u0433\u0438\u0431\u0440\u0438\u0434\u043d\u044b\u0439 \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433<\/strong> \u0438 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0441\u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0435 \u043f\u0435\u0440\u0435\u0434 \u0442\u0435\u043c \u043a\u0430\u043a \u043e\u0442\u0432\u0435\u0447\u0430\u0442\u044c. \u042d\u0442\u043e \u043f\u043e\u043c\u043e\u0433\u0430\u0435\u0442 \u0432 \u0441\u043b\u043e\u0436\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445, \u0433\u0434\u0435 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u0432\u044b\u0432\u043e\u0434\u043e\u0432, \u0442\u0430\u043a\u0438\u0445 \u043a\u0430\u043a \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430.\u00a0<\/p>\n<p>\u041c\u044b \u0434\u043e\u043e\u0431\u0443\u0447\u0430\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u044c \u0432 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u044d\u0442\u0430\u043f\u043e\u0432, \u0447\u0442\u043e\u0431\u044b \u043f\u0440\u043e\u043a\u0430\u0447\u0430\u0442\u044c \u043e\u0431\u0449\u0435\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0437\u0430\u0434\u0430\u0447 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u0438 \u0443\u043b\u0443\u0447\u0448\u0438\u0442\u044c \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439.<\/p>\n<p>\u0420\u0430\u0441\u0441\u043a\u0430\u0436\u0443 \u043e\u0431\u0449\u0438\u0435 \u0434\u0435\u0442\u0430\u043b\u0438 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438, \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0438 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0437\u0430\u043c\u0435\u0440\u043e\u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430. \u041f\u043e\u0434\u0435\u043b\u044e\u0441\u044c, \u043a\u0430\u043a\u0438\u0435 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u0443 \u043d\u0430\u0441 \u0432\u043e\u0437\u043d\u0438\u043a\u0430\u043b\u0438 \u0438 \u043d\u0430 \u0447\u0435\u043c \u043f\u043b\u0430\u043d\u0438\u0440\u0443\u0435\u043c \u0441\u043e\u0441\u0440\u0435\u0434\u043e\u0442\u043e\u0447\u0438\u0442\u044c\u0441\u044f.\u00a0<\/p>\n<h2>\u041f\u0440\u043e\u0446\u0435\u0441\u0441 \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f<\/h2>\n<p><strong>C\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u043d\u043e\u0432\u043e\u0433\u043e \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440\u0430 \u0438 \u0435\u0433\u043e \u0430\u0434\u0430\u043f\u0442\u0430\u0446\u0438\u044f: <\/strong>\u043c\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u043d\u044b\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440 \u0434\u043b\u044f \u043c\u0443\u043b\u044c\u0442\u0438\u043b\u0438\u043d\u0433\u0432\u0430\u043b\u044c\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0441 \u0444\u043e\u043a\u0443\u0441\u043e\u043c \u043d\u0430 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u044f\u0437\u044b\u043a\u0438, \u0432\u0437\u044f\u0432 \u0437\u0430 \u043e\u0441\u043d\u043e\u0432\u0443 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440 Qwen3 \u0438 \u0440\u0430\u0441\u0448\u0438\u0440\u0438\u0432 \u0435\u0433\u043e \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0447\u0430\u0441\u0442\u044c \u0431\u043e\u043b\u0435\u0435 \u0447\u0435\u043c \u0432 \u043f\u044f\u0442\u044c \u0440\u0430\u0437.\u00a0<\/p>\n<p>\u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435\u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0438 \u043d\u0435\u043b\u0430\u0442\u0438\u043d\u0441\u043a\u0438\u0435 \u0442\u043e\u043a\u0435\u043d\u044b \u0441\u043e\u043a\u0440\u0430\u0442\u0438\u043b\u0438 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u0438\u0438 \u043e\u0446\u0435\u043d\u043a\u0438 \u0447\u0430\u0441\u0442\u043e\u0442\u043d\u043e\u0441\u0442\u0438 \u043f\u043e \u043d\u0430\u0448\u0435\u043c\u0443 \u043a\u043e\u0440\u043f\u0443\u0441\u0443 \u043f\u0440\u0435\u0434\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 \u043b\u0443\u0447\u0448\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c <abbr class=\"habraabbr\" title=\"\u043a\u0430\u0437\u0430\u0445\u0441\u043a\u0438\u0439, \u0431\u0430\u0448\u043a\u0438\u0440\u0441\u043a\u0438\u0439 \u0438 \u0434\u0440\u0443\u0433\u0438\u0435\" data-title=\"&lt;p&gt;\u043a\u0430\u0437\u0430\u0445\u0441\u043a\u0438\u0439, \u0431\u0430\u0448\u043a\u0438\u0440\u0441\u043a\u0438\u0439 \u0438 \u0434\u0440\u0443\u0433\u0438\u0435&lt;\/p&gt;\" data-abbr=\"\u0441 \u043c\u0430\u043b\u043e\u0440\u0435\u0441\u0443\u0440\u0441\u043d\u044b\u043c\u0438 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u0430\u043c\u0438\">data-abbr=&#187;\u0441 \u043c\u0430\u043b\u043e\u0440\u0435\u0441\u0443\u0440\u0441\u043d\u044b\u043c\u0438 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u0430\u043c\u0438&#187;>\u0441 \u043c\u0430\u043b\u043e\u0440\u0435\u0441\u0443\u0440\u0441\u043d\u044b\u043c\u0438 \u043a\u0438\u0440\u0438\u043b\u043b\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u044f\u0437\u044b\u043a\u0430\u043c\u0438<\/abbr> \u043f\u0440\u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 \u0441\u043b\u043e\u0432\u0430\u0440\u044f \u043a\u0430\u043a \u0443 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438. \u0418\u0442\u043e\u0433\u043e\u0432\u044b\u0439 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440 \u043d\u0430 30% \u0431\u043e\u043b\u0435\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u0435\u043d \u0434\u043b\u044f \u0440\u0443\u0441\u0441\u043a\u043e\u0433\u043e \u044f\u0437\u044b\u043a\u0430.<\/p>\n<figure class=\"full-width\"><\/figure>\n<p><strong>\u0423\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0437\u0430 \u0441\u0447\u0435\u0442 \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440\u0430. <\/strong>\u041c\u044b \u0437\u0430\u043c\u0435\u0440\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0437\u0430 \u0441\u0447\u0435\u0442 \u0431\u043e\u043b\u0435\u0435 \u043f\u043b\u043e\u0442\u043d\u043e\u0433\u043e \u0442\u043e\u043a\u0435\u043d\u0438\u0437\u0430\u0442\u043e\u0440\u0430 \u043d\u0430 \u0434\u0432\u0443\u0445 \u0434\u043e\u043c\u0435\u043d\u0430\u0445 \u2014 \u0447\u0430\u0442\u043e\u0432\u044b\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u044b \u0438\u0437 <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/ru-arena-hard\" rel=\"noopener noreferrer nofollow\">ru-arena-hard<\/a> \u0438 \u043e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u044b\u0435 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u0438\u0437 <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/t-math\" rel=\"noopener noreferrer nofollow\">T-Math<\/a>.\u00a0<\/p>\n<figure class=\"full-width\"><\/figure>\n<figure class=\"full-width\">\n<div><figcaption>\u041f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043e\u0442 <strong>1,5 \u0434\u043e 3 \u0440\u0430\u0437<\/strong> \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0434\u043e\u043c\u0435\u043d\u0430 \u0438 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u043e\u043c\u043f\u0442\u0430<\/figcaption><\/div>\n<\/figure>\n<details class=\"spoiler\">\n<summary>\u041a\u0430\u043a \u043c\u044b \u0441\u0447\u0438\u0442\u0430\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435<\/summary>\n<div class=\"spoiler__content\">\n<p>\u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0430 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 SGLang \u0441 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 temperature=0.9 \u0438 presence_penalty=1.0 \u0434\u043b\u044f \u043e\u0431\u0435\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439. \u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043e\u0446\u0435\u043d\u0438\u043b\u0438 \u043c\u0435\u0434\u0438\u0430\u043d\u043d\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0442\u043e\u043a\u0435\u043d\u043e\u0432 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u043e\u0431\u0435\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0438 \u043c\u0435\u0434\u0438\u0430\u043d\u043d\u0443\u044e \u0437\u0430\u0434\u0435\u0440\u0436\u043a\u0443 (latency) \u043f\u0440\u0438 \u043f\u0430\u043a\u0435\u0442\u043d\u043e\u0439 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u0441 max_concurrent_workers=100. \u041a\u0430\u043a \u0432\u0438\u0434\u043d\u043e \u0438\u0437 \u0433\u0440\u0430\u0444\u0438\u043a\u043e\u0432, \u043d\u0430 \u0431\u043e\u043b\u0435\u0435 \u0434\u043b\u0438\u043d\u043d\u044b\u0445 \u043e\u0442\u0432\u0435\u0442\u0430\u0445 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u0437\u043d\u0430\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0431\u043e\u043b\u044c\u0448\u0435\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435, \u0441\u0432\u044f\u0437\u0430\u043d\u043d\u043e\u0435 \u0441 \u043a\u0432\u0430\u0434\u0440\u0430\u0442\u0438\u0447\u043d\u043e\u0439 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c\u044e \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u044f \u043c\u0435\u0445\u0430\u043d\u0438\u0437\u043c\u0430 \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u044f.<\/p>\n<\/div>\n<\/details>\n<p><strong>\u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u0431\u043e\u043b\u044c\u0448\u043e\u043c \u0440\u0443\u0441\u0441\u043a\u043e\u044f\u0437\u044b\u0447\u043d\u043e\u043c \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u0438\u0432\u043d\u043e\u043c \u043a\u043e\u0440\u043f\u0443\u0441\u0435<\/strong>: \u0432 \u043f\u0435\u0440\u0432\u043e\u043c \u0440\u0435\u043b\u0438\u0437\u0435 \u043d\u0430\u0448 \u0440\u0435\u0446\u0435\u043f\u0442 \u0441\u043e\u0441\u0442\u043e\u044f\u043b \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u0441\u0442\u0430\u0434\u0438\u0439 \u043f\u0440\u043e\u0434\u043e\u043b\u0436\u0430\u044e\u0449\u0435\u0433\u043e\u0441\u044f \u043f\u0440\u0435\u0434\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441 \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u043c \u0442\u043e\u043a\u0435\u043d-\u0431\u044e\u0434\u0436\u0435\u0442\u043e\u043c 140B. \u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0433\u0438\u0431\u0440\u0438\u0434\u043d\u043e-\u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u043e\u0432\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043f\u043e\u0442\u0440\u0435\u0431\u043e\u0432\u0430\u043b\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0439 \u043f\u0435\u0440\u0435\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0440\u0435\u0446\u0435\u043f\u0442\u0430: \u0434\u0430\u0442\u0430\u043c\u0438\u043a\u0441 \u0432\u0442\u043e\u0440\u043e\u0439 \u0441\u0442\u0430\u0434\u0438\u0438 \u0442\u0435\u043f\u0435\u0440\u044c \u0441\u043e\u0441\u0442\u043e\u0438\u0442 \u0438\u0437 40B \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u0438\u0432\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u0433\u0434\u0435 \u0442\u0440\u0435\u0442\u044c \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0442 \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433 \u0434\u0430\u043d\u043d\u044b\u0435.<\/p>\n<p><strong>\u0414\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u0431\u043e\u043b\u0435\u0435 \u0447\u0438\u0441\u0442\u043e\u043c SFT-\u0441\u0435\u0442\u0435: <\/strong>SFT-\u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d \u0438\u0437 \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043d\u044b\u0445 \u043f\u0440\u043e\u043c\u043f\u0442\u043e\u0432, \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u0438\u0441\u0442\u043e\u0447\u043d\u0438\u043a\u043e\u0432 \u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0445 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u043e\u0432 \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u0430\u043d\u043d\u044b\u0445.\u00a0<\/p>\n<p>\u041e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u0446\u0435\u043b\u044c \u2014 \u0443\u0441\u0438\u043b\u0438\u0442\u044c \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u0435 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0434\u0435\u043b\u0438: \u043e\u0442 \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447 \u0438 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0438 \u0434\u043e \u0434\u0438\u0430\u043b\u043e\u0433\u043e\u0432\u043e\u0441\u0442\u0438, \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u043e\u0433\u043e \u043c\u044b\u0448\u043b\u0435\u043d\u0438\u044f \u0438 \u0440\u0435\u0436\u0438\u043c\u0430 \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439.\u00a0<\/p>\n<p>\u041e\u0431\u0449\u0438\u0439 \u0440\u0430\u0437\u043c\u0435\u0440 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u043e\u043a\u043e\u043b\u043e 500 \u0442\u044b\u0441\u044f\u0447 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435. \u041c\u044b \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u043b\u0438 \u043c\u043d\u043e\u0433\u043e\u044d\u0442\u0430\u043f\u043d\u044b\u0439 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d \u0444\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u0438, \u0447\u0442\u043e\u0431\u044b \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0442\u044c \u0432\u044b\u0441\u043e\u043a\u043e\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0438 \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u0438\u0435.<\/p>\n<p>General-\u0434\u0430\u043d\u043d\u044b\u0435:<\/p>\n<ul>\n<li>\n<p>\u0423\u0441\u0442\u0440\u0430\u043d\u0435\u043d\u0438\u0435 \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u043e\u0432. \u041c\u044b \u0443\u0434\u0430\u043b\u0438\u043b\u0438 \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u044b \u0432 \u0431\u043b\u0438\u0437\u043a\u0438\u0445 \u043f\u043e \u0441\u043c\u044b\u0441\u043b\u0443 \u0441\u044d\u043c\u043f\u043b\u0430\u0445, \u0440\u0430\u0441\u0441\u043c\u0430\u0442\u0440\u0438\u0432\u0430\u044f \u0441\u0445\u043e\u0436\u0435\u0441\u0442\u044c \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u043e\u0432 \u0438 LSH.<\/p>\n<\/li>\n<li>\n<p>\u041a\u043e\u043d\u0442\u0440\u043e\u043b\u044c \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u0438\u044f \u0441 <a href=\"https:\/\/arxiv.org\/abs\/2308.07074\" rel=\"noopener noreferrer nofollow\">#InsTag<\/a> \u2014 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0442\u0435\u0433\u0438 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u0434\u043b\u044f \u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u043a\u0438 \u0442\u0435\u043c \u0438 \u0441\u0442\u0438\u043b\u0435\u0439, \u0438\u0437\u0431\u0435\u0433\u0430\u044f \u0434\u043e\u043c\u0438\u043d\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u043e\u0434\u043d\u0438\u0445 \u0442\u0438\u043f\u043e\u0432 \u0434\u0430\u043d\u043d\u044b\u0445 \u043d\u0430\u0434 \u0434\u0440\u0443\u0433\u0438\u043c\u0438.<\/p>\n<\/li>\n<\/ul>\n<ul>\n<li>\n<p>\u0424\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u044f \u043f\u043e RM-score \u2014 \u043e\u0446\u0435\u043d\u0438\u0432\u0430\u043b\u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e reward model (RM), \u043e\u0442\u0441\u0435\u0438\u0432\u0430\u044f \u043d\u0438\u0437\u043a\u043e\u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u044b.<\/p>\n<\/li>\n<li>\n<p>IFD \u0434\u043b\u044f \u0444\u043e\u043a\u0443\u0441\u0430 \u043d\u0430 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u2014 \u043d\u0430 \u0444\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u043c \u044d\u0442\u0430\u043f\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u043b\u0438 <a href=\"https:\/\/arxiv.org\/abs\/2308.12032\" rel=\"noopener noreferrer nofollow\">Instruction-Following Difficulty (IFD)<\/a> \u0434\u043b\u044f \u043e\u0442\u0431\u043e\u0440\u0430 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0441\u043e \u0441\u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u043e\u0439 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c\u044e, \u0447\u0442\u043e\u0431\u044b \u0438\u0437\u0431\u0435\u0436\u0430\u0442\u044c \u043a\u0430\u043a \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u043f\u0440\u043e\u0441\u0442\u044b\u0445 \u0438 \u043d\u0435\u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u044b\u0445, \u0442\u0430\u043a \u0438 \u0447\u0440\u0435\u0437\u043c\u0435\u0440\u043d\u043e \u0441\u043b\u043e\u0436\u043d\u044b\u0445 \u0438 \u0448\u0443\u043c\u043d\u044b\u0445 \u0441\u043b\u0443\u0447\u0430\u0435\u0432.<\/p>\n<\/li>\n<li>\n<p>\u0424\u0438\u043d\u0430\u043b\u044c\u043d\u044b\u0439 \u0432\u044b\u0431\u043e\u0440 \u043e\u0442\u0432\u0435\u0442\u0430. \u0412 \u0437\u0430\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u0435 \u043c\u044b \u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043f\u043e 8 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432 \u043e\u0442\u0432\u0435\u0442\u0430 \u043d\u0430 \u043a\u0430\u0436\u0434\u044b\u0439 \u0437\u0430\u043f\u0440\u043e\u0441 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u043e\u043b\u0435\u0435 \u043c\u043e\u0449\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0438 \u043b\u0443\u0447\u0448\u0438\u0439 \u0432\u0430\u0440\u0438\u0430\u043d\u0442 \u043f\u043e RM-score.<\/p>\n<\/li>\n<\/ul>\n<p>\u0412 general-\u0447\u0430\u0441\u0442\u044c \u043c\u044b \u0434\u043e\u0431\u0430\u0432\u0438\u043b\u0438 1% \u0441\u0435\u043c\u043f\u043b\u043e\u0432 \u0441 \u0434\u043b\u0438\u043d\u043d\u044b\u043c \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442\u043e\u043c \u0434\u043e 32\u043a \u0442\u043e\u043a\u0435\u043d\u043e\u0432.<\/p>\n<p>\u0414\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0434\u043b\u044f reasoning-\u0434\u0430\u043d\u043d\u044b\u0445:<\/p>\n<ul>\n<li>\n<p>\u041e\u0442\u0431\u043e\u0440 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 KL-\u0434\u0438\u0432\u0435\u0440\u0433\u0435\u043d\u0446\u0438\u0438. \u041c\u044b \u043e\u0446\u0435\u043d\u0438\u043b\u0438 KL-\u0434\u0438\u0432\u0435\u0440\u0433\u0435\u043d\u0446\u0438\u044e \u043c\u0435\u0436\u0434\u0443 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f\u043c\u0438 RM-score \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0439 \u0443\u0447\u0438\u0442\u0435\u043b\u044f \u0438 \u0443\u0447\u0435\u043d\u0438\u043a\u0430 \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u043b\u0438 \u0442\u043e\u043b\u044c\u043a\u043e \u0442\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u044b, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f KL \u043d\u0430\u0445\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u0432 \u0441\u0440\u0435\u0434\u043d\u0435\u043c \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d\u0435. \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u043d\u0430\u043c \u0432\u044b\u0431\u0440\u0430\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u0440\u044b, \u0441\u0431\u0430\u043b\u0430\u043d\u0441\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043f\u043e \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438.<\/p>\n<\/li>\n<li>\n<p>\u0424\u0438\u043d\u0430\u043b\u044c\u043d\u044b\u0439 \u0432\u044b\u0431\u043e\u0440 \u043e\u0442\u0432\u0435\u0442\u0430. \u0414\u043b\u044f \u0432\u0435\u0440\u0438\u0444\u0438\u0446\u0438\u0440\u0443\u0435\u043c\u044b\u0445 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u043c\u044b \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043b\u0438 \u0432\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u043e\u0442\u0432\u0435\u0442\u0430. \u041e\u043a\u043e\u043d\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u043c \u043e\u0442\u0432\u0435\u0442\u043e\u043c \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0441\u044f \u0441\u0430\u043c\u044b\u0439 \u043a\u043e\u0440\u043e\u0442\u043a\u0438\u0439 \u043f\u043e \u0434\u043b\u0438\u043d\u0435 \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439 \u0441\u0440\u0435\u0434\u0438 \u0442\u043e\u043f-3 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432, \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438-\u0443\u0447\u0438\u0442\u0435\u043b\u044f \u0438 \u043e\u0442\u0441\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0445 \u043f\u043e RM-score. \u0422\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043c\u044b \u0434\u043e\u0441\u0442\u0438\u0433\u043b\u0438 \u0431\u0430\u043b\u0430\u043d\u0441\u0430 \u043c\u0435\u0436\u0434\u0443 \u043a\u0440\u0430\u0442\u043a\u043e\u0441\u0442\u044c\u044e \u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e\u043c.<\/p>\n<\/li>\n<\/ul>\n<p>\u0414\u043b\u044f \u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u0438\u0442\u043e\u0433\u043e\u0432\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u043e\u0442\u0432\u0435\u0442\u044b \u043d\u0430 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0438 \u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u043b\u0438\u0441\u044c \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u043e\u043b\u0435\u0435 \u043c\u043e\u0449\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0442\u0430\u043a\u0438\u0445 \u043a\u0430\u043a DeepSeek-V3 0324 \u0438 Qwen3-235B-A22B, \u0447\u0442\u043e \u043e\u0431\u0435\u0441\u043f\u0435\u0447\u0438\u0432\u0430\u0435\u0442 \u0432\u044b\u0441\u043e\u043a\u0438\u0439 \u0443\u0440\u043e\u0432\u0435\u043d\u044c \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u0438 \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u043e\u0441\u0442\u0438.<\/p>\n<p><strong>Preference tuning. <\/strong>\u0414\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f DPO \u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u2014 \u0441 \u0444\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u0435\u0439 \u043f\u043e \u0434\u043b\u0438\u043d\u0435 \u0438 \u0442\u0438\u043f\u0443 \u0434\u043b\u044f general-\u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439 \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0435\u043c \u0431\u0430\u043b\u0430\u043d\u0441\u0430 \u0434\u043e\u043c\u0435\u043d\u043e\u0432 \u0434\u043b\u044f reasoning-\u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0439.\u00a0<\/p>\n<p>\u0414\u043b\u044f \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u044f \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043f\u0430\u0440 \u0438\u0437 16 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0439 \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0438\u0441\u044c \u043b\u0443\u0447\u0448\u0438\u0439 \u0438 \u0445\u0443\u0434\u0448\u0438\u0439 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u044b \u043f\u043e \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430. \u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435\u043f\u043e\u043b\u043d\u044b\u0435 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u0438\u0441\u043a\u043b\u044e\u0447\u0430\u043b\u0438\u0441\u044c, \u0430 \u0441\u0440\u0435\u0434\u0438 \u0442\u0440\u0435\u0445 \u043b\u0443\u0447\u0448\u0438\u0445 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 \u0432\u044b\u0431\u0438\u0440\u0430\u043b\u0441\u044f \u0441\u0430\u043c\u044b\u0439 \u043a\u043e\u0440\u043e\u0442\u043a\u0438\u0439 \u043e\u0442\u0432\u0435\u0442.<\/p>\n<p>\u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0439 \u043e\u0431\u0443\u0447\u0438\u043b\u0438 \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e reward-\u043c\u043e\u0434\u0435\u043b\u044c \u043d\u0430 \u0431\u0430\u0437\u0435 Qwen3 32B. \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u043b\u043e\u0441\u044c \u043f\u043e \u0442\u0443\u0440\u043d\u0438\u0440\u043d\u043e\u0439 \u0441\u0445\u0435\u043c\u0435, \u0433\u0434\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441\u0440\u0430\u0432\u043d\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u043f\u043e\u043f\u0430\u0440\u043d\u043e \u043a\u0430\u043a \u0432 \u043f\u043b\u0435\u0439-\u043e\u0444\u0444, \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u043c\u043e\u0434\u0435\u043b\u0438 \u0441\u0445\u043e\u0436\u0435\u0433\u043e \u0443\u0440\u043e\u0432\u043d\u044f \u0441\u0442\u0430\u0432\u0438\u043b\u0438\u0441\u044c \u0440\u044f\u0434\u043e\u043c \u0434\u0440\u0443\u0433 \u0441 \u0434\u0440\u0443\u0433\u043e\u043c. \u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b reward-\u043c\u043e\u0434\u0435\u043b\u0438 \u043d\u0430\u0443\u0447\u0438\u0442\u044c\u0441\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u0430\u0442\u044c \u0442\u043e\u043d\u043a\u0438\u0435 \u0440\u0430\u0437\u043b\u0438\u0447\u0438\u044f \u043c\u0435\u0436\u0434\u0443 \u043f\u043e\u0445\u043e\u0436\u0438\u043c\u0438 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 \u043e\u0442\u0432\u0435\u0442\u0430\u043c\u0438, \u0430 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u044b\u0435 \u0441\u043b\u0443\u0447\u0430\u0438.<\/p>\n<p><strong>Speculative decoding. <\/strong>\u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0434\u0440\u0430\u0444\u0442-\u043c\u043e\u0434\u0435\u043b\u0438 \u0432\u044b\u0431\u0440\u0430\u043b\u0438 <a href=\"https:\/\/arxiv.org\/abs\/2401.15077\" rel=\"noopener noreferrer nofollow\">EAGLE 1<\/a> \u0441 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0435\u0439 \u0434\u0440\u0430\u0444\u0442\u0430 \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e tree attention \u0441\u043e\u0433\u043b\u0430\u0441\u043d\u043e <a href=\"https:\/\/arxiv.org\/abs\/2406.16858\" rel=\"noopener noreferrer nofollow\">EAGLE 2<\/a>.\u00a0<\/p>\n<p>\u041e\u0431\u0443\u0447\u0438\u043b\u0438 \u043e\u0434\u043d\u0443 \u044d\u043f\u043e\u0445\u0443 \u043d\u0430 \u0441\u0435\u043c\u043f\u043b\u0435 SFT-\u0441\u0435\u0442\u0430 \u0441 \u0438\u043d\u043a\u0440\u0435\u043c\u0435\u043d\u0442\u043e\u043c \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433\u0430, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0434\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f T-Pro 2.0, \u043a\u0430\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0434\u043e \u0434\u0432\u0443\u0445 \u0440\u0430\u0437 \u043d\u0430 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0438 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 \u043d\u0443\u043b\u0435\u0432\u043e\u0439 \u0442\u0435\u043c\u043f\u0435\u0440\u0430\u0442\u0443\u0440\u044b \u0438 \u0431\u0430\u0442\u0447\u0430 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 1. \u041f\u0440\u0438 \u0443\u0432\u0435\u043b\u0438\u0447\u0435\u043d\u0438\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 \u0431\u0430\u0442\u0447\u0430 \u043f\u0440\u0438\u0440\u043e\u0441\u0442 \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u043b\u0441\u044f \u043c\u0435\u043d\u0435\u0435 \u043e\u0449\u0443\u0442\u0438\u043c\u044b\u043c \u0438 \u043f\u0440\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0435 \u0431\u0430\u0442\u0447\u0430 8 \u043f\u0440\u043e\u043f\u0430\u0434\u0430\u043b.\u00a0<\/p>\n<p>\u0414\u0440\u0430\u0444\u0442-\u043c\u043e\u0434\u0435\u043b\u044c \u0441 \u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0439 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0435\u0439 \u0438 \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u0435\u043c\u044b\u0435 \u043d\u0430\u0441\u0442\u0440\u043e\u0439\u043a\u0438 \u0441 \u043f\u0440\u0438\u043c\u0435\u0440\u0430\u043c\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0432\u044b\u043b\u043e\u0436\u0438\u043b\u0438 <a href=\"https:\/\/huggingface.co\/t-tech\/T-pro-it-2.0-eagle\" rel=\"noopener noreferrer nofollow\">\u043d\u0430 \u043d\u0430\u0448\u0443 \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u0443 \u0432 huggingface.<\/a><\/p>\n<h2>\u0414\u0438\u0430\u043b\u043e\u0433\u043e\u0432\u044b\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438<\/h2>\n<p>\u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043a \u0432\u0435\u0434\u0435\u043d\u0438\u044e \u0434\u0438\u0430\u043b\u043e\u0433\u0430, \u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u044e \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u044f\u043c \u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u044e \u0437\u0430\u0434\u0430\u0447 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 LLM-as-a-judge-\u0430\u0440\u0435\u043d\u044b: <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/ru-arena-hard\" rel=\"noopener noreferrer nofollow\">Arena Hard Ru<\/a>, <a href=\"https:\/\/github.com\/lmarena\/arena-hard-auto\" rel=\"noopener noreferrer nofollow\">Arena Hard 2<\/a> \u0438 \u0430\u0440\u0435\u043d\u0443, \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u0443\u044e \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445, \u043e\u0442\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0445 \u0430\u0432\u0442\u043e\u0440\u043e\u043c \u0440\u0435\u043f\u043e\u0437\u0438\u0442\u043e\u0440\u0438\u044f <a href=\"https:\/\/github.com\/kuk\/wildchat-hard-ru\/tree\/master\" rel=\"noopener noreferrer nofollow\">WildChat Hard Ru<\/a> \u0438\u0437 \u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u0435\u0439. \u0412 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0435\u0439 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0431\u0435\u0439\u0437\u043b\u0430\u0439\u043d\u0430 \u043e\u0442\u0432\u0435\u0442\u044b \u043c\u043e\u0434\u0435\u043b\u0438 o3-mini. \u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0441\u0443\u0434\u044c\u0438 \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0430\u0440\u0435\u043d \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f DeepSeek V3 0324.<\/p>\n<p>\u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0437\u0430\u043c\u0435\u0440\u043e\u0432 \u043d\u0430 \u0430\u0440\u0435\u043d\u0430\u0445. \u0414\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u044e\u0449\u0438\u0445 \u0440\u0435\u0436\u0438\u043c \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439, \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0437\u0430\u043c\u0435\u0440\u044b \u0432 \/think- \u0438 \/no_think-\u0440\u0435\u0436\u0438\u043c\u0430\u0445. \u0420\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0432 <a href=\"https:\/\/huggingface.co\/t-tech\/T-pro-it-2.0\" rel=\"noopener noreferrer nofollow\">\u043a\u0430\u0440\u0442\u043e\u0447\u043a\u0435 \u043c\u043e\u0434\u0435\u043b\u0438<\/a>.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\"><strong>Model<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Arena Hard Ru<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Arena Hard 2 (Hard)<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Arena Hard 2\u00a0 (Creative)<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>WildChat Hard Ru<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">87.6 \/ 86.28<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>64.3<\/u> \/ 56.8<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>83.1<\/u> \/ 82.2<\/p>\n<\/td>\n<td>\n<p align=\"left\">75 \/ <u>76.6<\/u><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 4 Sonnet *<\/p>\n<\/td>\n<td>\n<p align=\"left\">81.04<\/p>\n<\/td>\n<td>\n<p align=\"left\">44.9<\/p>\n<\/td>\n<td>\n<p align=\"left\">61.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">60.4<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 3.7 Sonnet *<\/p>\n<\/td>\n<td>\n<p align=\"left\">82.58<\/p>\n<\/td>\n<td>\n<p align=\"left\">36.7<\/p>\n<\/td>\n<td>\n<p align=\"left\">61.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">56.5<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 3.5 Sonnet *<\/p>\n<\/td>\n<td>\n<p align=\"left\">69.12<\/p>\n<\/td>\n<td>\n<p align=\"left\">29.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.5<\/p>\n<\/td>\n<td>\n<p align=\"left\">39.6<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>91.32<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">50.9<\/p>\n<\/td>\n<td>\n<p align=\"left\">77.4<\/p>\n<\/td>\n<td>\n<p align=\"left\">76<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek R1<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>90.88<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>67.8<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>95.1<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>83<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Qwen3 32B<\/p>\n<\/td>\n<td>\n<p align=\"left\">83.6 \/ 82.58<\/p>\n<\/td>\n<td>\n<p align=\"left\">56.4 \/ 42<\/p>\n<\/td>\n<td>\n<p align=\"left\">73.6 \/ 63.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">66.1 \/ 59.2<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">64.78<\/p>\n<\/td>\n<td>\n<p align=\"left\">14.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">35.4<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td>\n<p align=\"left\">65.01 \/ 65.99<\/p>\n<\/td>\n<td>\n<p align=\"left\">17 \/ 19.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">31.2 \/ 26.4\u00a0<\/p>\n<\/td>\n<td>\n<p align=\"left\">47.5 \/ 50.4<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Gemma3-27B<\/p>\n<\/td>\n<td>\n<p align=\"left\">75.88<\/p>\n<\/td>\n<td>\n<p align=\"left\">25.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">78.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">52.7<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>* Claude \u0437\u0430\u043c\u0435\u0440\u0435\u043d\u044b \u0432 \u0440\u0435\u0436\u0438\u043c\u0435 \u0431\u0435\u0437 \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u0439<\/p>\n<p><strong>Common-knowledge-\u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438. <\/strong>\u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u0432 \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0437\u043d\u0430\u043d\u0438\u0439 \u043e \u043c\u0438\u0440\u0435 \u0438 \u043e\u0431\u0449\u0438\u043c \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044f\u043c \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438: <a href=\"https:\/\/mera.a-ai.ru\/ru\/leaderboard\" rel=\"noopener noreferrer nofollow\">MERA<\/a>, <a href=\"https:\/\/mera.a-ai.ru\/ru\/tasks\/22\" rel=\"noopener noreferrer nofollow\">MaMuRAMu<\/a>, <a href=\"https:\/\/mera.a-ai.ru\/ru\/tasks\/9\" rel=\"noopener noreferrer nofollow\">ruMMLU<\/a>, ruMMLU-Pro.<\/p>\n<p>\u0412\u0441\u0435 \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0432 \/no_think-\u0440\u0435\u0436\u0438\u043c\u0435.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\"><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>MERA<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>MaMuRAMu<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruMMLU<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruMMLU-Pro<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.66<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.851<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.790<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.697<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Claude 3.7 Sonnet<\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.682<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.89<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.845<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8212;<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.677<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.882<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.8<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8212;<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Qwen3 32B\u00a0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.584<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.833<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.740<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.677<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">DeepSeek-R1-Distill-Qwen-32B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.508<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.787<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.702<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.537<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.629<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.841<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.769<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.663<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.574<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.823<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.737<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.652<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Gemma3-27B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.577<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.797<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.695<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.665<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">Mistral Small 3.1 24B<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.526<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.813<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.714<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.617<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p><strong>Reasoning-\u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438. <\/strong>\u041c\u044b \u0432\u0437\u044f\u043b\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u044b\u0445 \u0430\u043a\u0430\u0434\u0435\u043c\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0438 \u0438\u043d\u0434\u0443\u0441\u0442\u0440\u0438\u0430\u043b\u044c\u043d\u044b\u0445 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u0432, \u0447\u0442\u043e\u0431\u044b \u043e\u0431\u044a\u0435\u043a\u0442\u0438\u0432\u043d\u043e \u043e\u0446\u0435\u043d\u0438\u0442\u044c \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u043a \u0440\u0430\u0441\u0441\u0443\u0436\u0434\u0435\u043d\u0438\u044f\u043c \u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u044e \u0441\u043b\u043e\u0436\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447: <a href=\"https:\/\/github.com\/GAIR-NLP\/AIME-Preview\" rel=\"noopener noreferrer nofollow\">AIME<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2305.20050\" rel=\"noopener noreferrer nofollow\">MATH-500<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2311.12022\" rel=\"noopener noreferrer nofollow\">GPQA Diamond<\/a>, <a href=\"https:\/\/huggingface.co\/datasets\/Vikhrmodels\/russian_math\" rel=\"noopener noreferrer nofollow\">Vikhr Math<\/a>, <a href=\"https:\/\/huggingface.co\/datasets\/Vikhrmodels\/russian_physics\" rel=\"noopener noreferrer nofollow\">Vikhr Physics<\/a>, <a href=\"https:\/\/arxiv.org\/abs\/2403.07974\" rel=\"noopener noreferrer nofollow\">LiveCodeBench<\/a> v4_v5.\u00a0<\/p>\n<p>\u0414\u043b\u044f Vikhr Math \u0438 Vikhr Physics \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u043a\u043e\u0434\u043e\u043c \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 <a href=\"https:\/\/github.com\/huggingface\/Math-Verify\" rel=\"noopener noreferrer nofollow\">Math-Verify<\/a>. \u0410\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0438 \u0431\u044b\u043b\u0438 \u0446\u0435\u043b\u0438\u043a\u043e\u043c \u043b\u043e\u043a\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u043d\u044b \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u0438\u0439 \u044f\u0437\u044b\u043a \u0418\u0418-\u0442\u0440\u0435\u043d\u0435\u0440\u0430\u043c\u0438: ruAIME, ruMATH-500, ru GPQA Diamond, ruLCB.\u00a0<\/p>\n<p>\u041c\u044b \u0441\u043e\u0431\u0440\u0430\u043b\u0438 \u0441\u0432\u043e\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a \u0422-Math, \u0447\u0442\u043e\u0431\u044b \u0440\u0430\u0441\u0448\u0438\u0440\u0438\u0442\u044c \u043e\u0446\u0435\u043d\u043a\u0443 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435.<\/p>\n<p><\/p>\n<p><strong>\u0414\u043b\u044f \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044f T-Math<\/strong> \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u0438\u0437 <a href=\"https:\/\/vos.olimpiada.ru\/\" rel=\"noopener noreferrer nofollow\">\u0412\u0441\u0435\u0440\u043e\u0441\u0441\u0438\u0439\u0441\u043a\u043e\u0439<\/a> \u0438 <a href=\"https:\/\/mos.olimpiada.ru\/\" rel=\"noopener noreferrer nofollow\">\u041c\u043e\u0441\u043a\u043e\u0432\u0441\u043a\u043e\u0439<\/a> \u043e\u043b\u0438\u043c\u043f\u0438\u0430\u0434 \u0448\u043a\u043e\u043b\u044c\u043d\u0438\u043a\u043e\u0432. \u0412\u0441\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u0438\u0437\u0432\u043b\u0435\u0447\u0435\u043d\u044b \u0438 \u043f\u0440\u043e\u0432\u0435\u0440\u0435\u043d\u044b \u043b\u044e\u0434\u044c\u043c\u0438 \u043d\u0430 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u043e\u0441\u0442\u044c. \u0412 \u0438\u0442\u043e\u0433\u0435 \u0441\u043e\u0431\u0440\u0430\u043b\u0438 331 \u0437\u0430\u0434\u0430\u0447\u0443 \u0441 1998 \u043f\u043e 2025 \u0433\u043e\u0434. \u041f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u0441\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0439\u0442\u0438 \u0432 \u043a\u0430\u0440\u0442\u043e\u0447\u043a\u0435 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430 \u043d\u0430 <a href=\"https:\/\/huggingface.co\/datasets\/t-tech\/t-math\" rel=\"noopener noreferrer nofollow\">huggingface<\/a>.<\/p>\n<p><\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\"><strong>\u0414\u0430\u0442\u0430\u0441\u0435\u0442<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>\u041e\u0431\u043b\u0430\u0441\u0442\u044c<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>\u0420\u0430\u0437\u043c\u0435\u0440<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>\u041c\u0435\u0442\u0440\u0438\u043a\u0430<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>AIME2024, AIME2025<br \/>ruAIME2024, ruAIME2025<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">2 \u00d7 30<\/p>\n<\/td>\n<td>\n<p align=\"left\">Acc avg@16<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>MATH-500<br \/>ruMATH-500<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">500<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>GPQA Diamond<br \/>ruGPQA Diamond<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u0425\u0438\u043c\u0438\u044f, \u0431\u0438\u043e\u043b\u043e\u0433\u0438\u044f, \u0444\u0438\u0437\u0438\u043a\u0430 (\u0443\u0440\u043e\u0432\u0435\u043d\u044c \u044d\u043a\u0441\u043f\u0435\u0440\u0442\u0430)<\/p>\n<\/td>\n<td>\n<p align=\"left\">198<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>LCB, ruLCB<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041a\u043e\u0434<\/p>\n<\/td>\n<td>\n<p align=\"left\">268<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Vikhr Math<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">199<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>Vikhr Physics<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u0444\u0438\u0437\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">98<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\"><strong>T-MATH<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u043b\u0438\u043c\u043f\u0438\u0430\u0434\u043d\u0430\u044f \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430<\/p>\n<\/td>\n<td>\n<p align=\"left\">331<\/p>\n<\/td>\n<td>\n<p align=\"left\">pass@1<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041c\u0435\u0442\u0440\u0438\u043a\u0438 \u043d\u0430 \u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435. \u0414\u043b\u044f \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433-\u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u0441\u0435 \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u0432 think-\u0440\u0435\u0436\u0438\u043c\u0435.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>AIME2024<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>AIME2025<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>MATH-500<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>GPQA Diamond<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>LCB<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.765<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.679<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.966<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.641<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.556<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">DeepSeek V3<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.52<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.285<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.942<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.655<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.405<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">DeepSeek R1<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><strong>0.914<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.875<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.983<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.813<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>0.77<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">Qwen3 32B<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\"><u>0.808<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.725<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.961<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.668<\/u><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.546<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">DeepSeek-R1-Distill-Qwen-32B<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.706<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.573<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.950<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.621<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0.572<\/u><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">T-pro 1.0<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.085<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.052<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.744<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.530<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.243<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">RuadaptQwen3-32B-Instruct-v2<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.692<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.604<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.948<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.596<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.489<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">Gemma 3 27B<\/p>\n<\/td>\n<td data-colwidth=\"117\" width=\"117\">\n<p align=\"left\">0.260<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.221<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.882<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.515<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.246<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041c\u0435\u0442\u0440\u0438\u043a\u0438 \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435. \u0414\u043b\u044f \u0440\u0438\u0437\u043e\u043d\u0438\u043d\u0433-\u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u0441\u0435 \u0437\u0430\u043c\u0435\u0440\u044b \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u0432 think-\u0440\u0435\u0436\u0438\u043c\u0435.<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruAIME<br \/>2024<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruAIME<br \/>2025<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ruMATH-500<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>ru GPQA Diamond<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>ruLCB<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>T-Math<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\"><strong>Vikhr Math<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"114\" width=\"114\">\n<p align=\"left\"><strong>Vikhr Physics<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"100\" width=\"100\">\n<p align=\"left\"><strong>T-pro 2.0<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"left\">0.704<\/p>\n<\/td>\n<td>\n<p align=\"left\"><u>0<\/u><\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-467937","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/467937","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=467937"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/467937\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=467937"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=467937"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=467937"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}