{"id":328280,"date":"2022-01-19T15:02:17","date_gmt":"2022-01-19T15:02:17","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=328280"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=328280","title":{"rendered":"<span>\u0411\u043e\u043b\u044c\u0448\u043e\u043c\u0443 \u0445\u0443\u0434\u043e\u0436\u043d\u0438\u043a\u0443 \u2013 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u043a\u0440\u0438\u0442\u0438\u043a: \u043d\u043e\u0432\u044b\u0435 \u0432\u0435\u0440\u0441\u0438\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u0434\u043b\u044f \u0440\u0430\u043d\u0436\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 ruDALL-E (\u0438 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e)<\/span>"},"content":{"rendered":"<div><img loading=\"lazy\" decoding=\"async\" height=\"1\" src=\"https:\/\/www.facebook.com\/tr?id=840613629950599&amp;ev=PageView&amp;noscript=1\" width=\"1\" style=\"display: none;\"><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u0412 \u200b2021 \u0433\u043e\u0434\u0443 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0430\u043a\u0442\u0438\u0432\u043d\u043e \u0440\u0430\u0437\u0432\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u044f\u0437\u044b\u043a\u043e\u0432\u044b\u0435 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b, \u0447\u0442\u043e \u043f\u0440\u0438\u0432\u0435\u043b\u043e \u043a \u043f\u043e\u044f\u0432\u043b\u0435\u043d\u0438\u044e \u043d\u043e\u0432\u044b\u0445 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u043e\u043a \u0432 \u0441\u0444\u0435\u0440\u0435 \u043c\u0443\u043b\u044c\u0442\u0438\u043c\u043e\u0434\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u042f\u0440\u043a\u0438\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u043c \u0441\u0442\u0430\u043b\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0441\u0438\u043d\u0442\u0435\u0437\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u043f\u043e \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u043c \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u044f\u043c <a href=\"https:\/\/openai.com\/blog\/dall-e\/\"><u>DALL-E<\/u><\/a> \u043e\u0442 OpenAI. \u041a\u043e\u043c\u0430\u043d\u0434\u044b \u0421\u0431\u0435\u0440\u0430 &#8212; Sber AI \u0438 SberDevices &#8212; \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u0432\u043e\u0440\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u044d\u0442\u0443 \u0433\u043e\u043d\u043a\u0443 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0438 \u043e\u0431\u0443\u0447\u0438\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u0438: <a href=\"https:\/\/habr.com\/ru\/company\/sberbank\/blog\/586926\/\"><u>ruDALL-E XL<\/u><\/a>, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 \u043d\u0430 <a href=\"https:\/\/github.com\/sberbank-ai\/ru-dalle\"><u>GitHub<\/u><\/a>, \u044d\u043a\u0441\u043a\u043b\u044e\u0437\u0438\u0432\u043d\u0443\u044e ruDALL-E XXL (\u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 \u0432 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud ML Space<\/u><\/a>), <a href=\"https:\/\/arxiv.org\/pdf\/2112.02448.pdf\"><u>ruDALL-E Emojich<\/u><\/a> \u0434\u043b\u044f \u0441\u0438\u043d\u0442\u0435\u0437\u0430 \u044d\u043c\u043e\u0434\u0436\u0438, \u043f\u0435\u0440\u0432\u0443\u044e \u0432\u0435\u0440\u0441\u0438\u044e \u043c\u0443\u043b\u044c\u0442\u0438\u043c\u043e\u0434\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u0443\u043b\u044c\u0442\u0438\u0442\u0430\u0441\u043a \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u044b <a href=\"https:\/\/github.com\/sberbank-ai\/fusion_brain_aij2021\"><u>Fusion Brain<\/u><\/a>, \u0430 \u0441 \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u0435\u043c \u043f\u043e\u043d\u044f\u0442\u0438\u044f \u0433\u0438\u043f\u0435\u0440\u043c\u043e\u0434\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0441\u043e\u0437\u0434\u0430\u043b\u0438 \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c <a href=\"https:\/\/github.com\/sberbank-ai\/ru-dolph\"><u>ruDOLPH<\/u><\/a> (\u043f\u0440\u043e \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0441\u0441\u043a\u0430\u0436\u0435\u043c \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u0435\u0435 \u0432 \u043e\u0434\u043d\u043e\u0439 \u0438\u0437 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0445 \u0441\u0442\u0430\u0442\u0435\u0439).<\/p>\n<p>\u041c\u044b \u0442\u0430\u043a\u0436\u0435 \u043d\u0435 \u043c\u043e\u0433\u043b\u0438 \u043e\u0431\u043e\u0439\u0442\u0438 \u0441\u0442\u043e\u0440\u043e\u043d\u043e\u0439 \u0434\u0440\u0443\u0433\u043e\u0435 \u043f\u043e\u043b\u0435\u0437\u043d\u043e\u0435 \u043f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u0435 \u044f\u0437\u044b\u043a\u043e\u0432\u044b\u0445 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0445 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432, \u2013 \u043c\u043e\u0434\u0435\u043b\u044c <a href=\"https:\/\/openai.com\/blog\/clip\/\"><u>CLIP<\/u><\/a> \u043e\u0442 OpenAI, \u0437\u0430\u0434\u0430\u0447\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u0439 \u2013 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u044f\u0442\u044c \u201c\u0441\u043c\u044b\u0441\u043b\u043e\u0432\u0443\u044e\u201d \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432 \u043d\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u043c (\u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u043e\u043c) \u044f\u0437\u044b\u043a\u0435 \u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439. \u0423\u0441\u043f\u0435\u0448\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u043a\u043e\u043c\u0430\u043d\u0434\u043e\u0439 OpenAI \u0443\u0436\u0435 \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u0441 \u0443\u0432\u0435\u0440\u0435\u043d\u043d\u043e\u0441\u0442\u044c\u044e \u0433\u043e\u0432\u043e\u0440\u0438\u0442\u044c \u043e \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0442\u0430\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447 \u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u043d\u043e\u0433\u043e \u0437\u0440\u0435\u043d\u0438\u044f, \u043a\u0430\u043a, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044f \u0438\u043b\u0438 zero-shot \u0434\u0435\u0442\u0435\u043a\u0446\u0438\u044f \u043e\u0431\u044a\u0435\u043a\u0442\u043e\u0432. \u0412 \u0438\u0442\u043e\u0433\u0435 \u043c\u044b \u043f\u043e\u0441\u0442\u0430\u0432\u0438\u043b\u0438 \u043f\u0435\u0440\u0435\u0434 \u0441\u043e\u0431\u043e\u0439 \u0446\u0435\u043b\u044c \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u201c\u0440\u0443\u0441\u0438\u0444\u0438\u0446\u0438\u0440\u043e\u0432\u0430\u0442\u044c\u201d CLIP, \u0447\u0442\u043e\u0431\u044b \u043c\u043e\u0434\u0435\u043b\u044c \u043c\u043e\u0436\u043d\u043e \u0431\u044b\u043b\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435 \u0438 \u043e\u0431\u0445\u043e\u0434\u0438\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u043e\u0432 \u0432 \u0441\u0432\u044f\u0437\u043a\u0435 \u0441 \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u044c\u044e CLIP. \u041f\u0435\u0440\u0432\u044b\u0435 \u0448\u0430\u0433\u0438 \u0432 \u044d\u0442\u043e\u043c \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0438 \u0431\u044b\u043b\u0438 \u0441\u0434\u0435\u043b\u0430\u043d\u044b \u043d\u0430\u043c\u0438 \u0435\u0449\u0451 \u0432 \u043d\u0430\u0447\u0430\u043b\u0435 2021 \u0433\u043e\u0434\u0430 &#8212; \u0442\u043e\u0433\u0434\u0430 \u043c\u044b \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u044f\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u044c <a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"><u>ruCLIP Small<\/u><\/a> (Russian Contrastive Language \u2013 Image Pre-training). \u0421\u0435\u0439\u0447\u0430\u0441\u00a0 \u0436\u0435 \u043c\u044b \u0445\u043e\u0442\u0438\u043c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u0442\u044c \u043e\u0431 \u0435\u0449\u0451 6 \u0432\u0435\u0440\u0441\u0438\u044f\u0445 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043c\u044b \u043e\u0431\u0443\u0447\u0438\u043b\u0438 \u0437\u0430 \u044d\u0442\u043e \u0432\u0440\u0435\u043c\u044f (<em>\u0434\u043b\u044f \u0431\u043e\u043b\u0435\u0435 \u0434\u0435\u0442\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u043f\u043e\u0433\u0440\u0443\u0436\u0435\u043d\u0438\u044f \u0432 \u0442\u0435\u0440\u043c\u0438\u043d\u043e\u043b\u043e\u0433\u0438\u044e \u0438 \u0441\u0443\u0442\u044c \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0441\u043e\u0432\u0435\u0442\u0443\u0435\u043c \u043f\u0435\u0440\u0435\u0447\u0438\u0442\u0430\u0442\u044c \u043d\u0430\u0448\u0443 \u043f\u0440\u043e\u0448\u043b\u0443\u044e \u0441\u0442\u0430\u0442\u044c\u044e \u043f\u043e <\/em><a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"><em><u>ruCLIP Small<\/u><\/em><\/a>).<\/p>\n<p>\u0412 \u0440\u0435\u043b\u0438\u0437 \u0432\u043e\u0448\u043b\u0438 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0432\u0435\u0440\u0441\u0438\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043e\u0442\u043b\u0438\u0447\u0430\u044e\u0442\u0441\u044f \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u0441\u043b\u043e\u0435\u0432 \u044d\u043d\u043a\u043e\u0434\u0435\u0440\u0430 ViT, \u0440\u0430\u0437\u043c\u0435\u0440\u043e\u043c \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u043d\u043e\u0433\u043e \u043f\u0430\u0442\u0447\u0430 (14\u00d714, 16\u00d716, 32\u00d732) \u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0430\u043c\u0438 \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u2014 224\u00d7224, 336\u00d7336 \u0438 384\u00d7384 \u043f\u0438\u043a\u0441\u0435\u043b\u044f, \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0435\u043d\u043d\u043e. \u0421\u0435\u043c\u0430\u043d\u0442\u0438\u043a\u0430 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c:<\/p>\n<ul>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-base-patch16-224\"><u>ruCLIP Base [vit-base-patch16-224]<\/u><\/a><\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-base-patch32-224\"><u>ruCLIP Base [vit-base-patch32-224]<\/u><\/a><\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-base-patch32-384\"><u>ruCLIP Base [vit-base-patch32-384]<\/u><\/a>\u00a0<\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-large-patch14-224\"><u>ruCLIP Large [vit-large-patch14-224]<\/u><\/a><\/p>\n<\/li>\n<li>\n<p>ruCLIP Base [vit-base-patch16-384] exclusive \u2601\ufe0f<a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-base-exclusive?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud only<\/u><\/a> \ufe0f\u00a0<\/p>\n<\/li>\n<li>\n<p>ruCLIP Large [vit-large-patch14-336] exclusive \u2601\ufe0f<a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-large-exclusive?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud only<\/u><\/a><\/p>\n<\/li>\n<\/ul>\n<p>\u041f\u0435\u0440\u0432\u044b\u0435 4 \u043c\u043e\u0434\u0435\u043b\u0438 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u044b \u0434\u043b\u044f \u043e\u0442\u043a\u0440\u044b\u0442\u043e\u0433\u043e \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u043d\u0430 <a href=\"https:\/\/github.com\/sberbank-ai\/ru-clip\"><u>GitHub<\/u><\/a>, \u0434\u0432\u0435 \u0438\u0437 \u043d\u0438\u0445 &#8212; \u0432 \u0445\u0430\u0431\u0435 \u043f\u0440\u0435\u0434\u043e\u0431\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0438 \u043a\u043e\u043d\u0442\u0435\u0439\u043d\u0435\u0440\u043e\u0432 \u2013 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud ML Space<\/u><\/a>, \u0430 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0435 \u0434\u0432\u0435, \u2013 \u0441\u0430\u043c\u044b\u0435 \u0431\u043e\u043b\u044c\u0448\u0438\u0435 \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0447\u0430\u0442\u044c \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0435\u0440\u0435\u0437 DataHub.<\/p>\n<p>\u0412\u0441\u0435 \u043d\u043e\u0432\u044b\u0435 \u0432\u0435\u0440\u0441\u0438\u0438 ruCLIP \u0431\u044b\u043b\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u044b \u043d\u0430 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u0420\u0443\u043d\u0435\u0442\u0430, \u0430 \u0442\u0430\u043a\u0436\u0435 \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u044d\u043a\u043e\u0441\u0438\u0441\u0442\u0435\u043c\u044b \u0421\u0431\u0435\u0440\u0430. \u0412\u0441\u0435\u0433\u043e \u0443\u0434\u0430\u043b\u043e\u0441\u044c \u0441\u043e\u0431\u0440\u0430\u0442\u044c \u043e\u043a\u043e\u043b\u043e 240 \u043c\u043b\u043d \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0445 \u043f\u0430\u0440 \u201c\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435-\u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u043d\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u043c \u044f\u0437\u044b\u043a\u0435\u201d. \u041c\u043e\u0434\u0435\u043b\u044c \u043c\u044b \u043e\u0431\u0443\u0447\u0430\u043b\u0438 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 12 \u0434\u043d\u0435\u0439 \u043d\u0430 \u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0435 <a href=\"https:\/\/sbercloud.ru\/ru\/aicloud\/mlspace?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>SberCloud ML Space<\/u><\/a> \u0438 \u0441\u0443\u043f\u0435\u0440\u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u0435 <a href=\"https:\/\/sbercloud.ru\/ru\/christofari-neo?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\">Christofari Neo<\/a>, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 256 GPU Tesla A100, \u0447\u0442\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043f\u0440\u0435\u0432\u043e\u0441\u0445\u043e\u0434\u0438\u0442 \u0440\u0435\u0441\u0443\u0440\u0441\u044b, \u0437\u0430\u0442\u0440\u0430\u0447\u0435\u043d\u043d\u044b\u0435 \u0432 \u0445\u043e\u0434\u0435<a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"> <u>\u043f\u0435\u0440\u0432\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP Small<\/u><\/a>. \u0412\u0430\u0436\u043d\u043e \u043f\u043e\u0434\u0447\u0435\u0440\u043a\u043d\u0443\u0442\u044c, \u0447\u0442\u043e \u0432 \u043d\u043e\u0432\u044b\u0445 \u0432\u0435\u0440\u0441\u0438\u044f\u0445 \u043f\u0440\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0431\u0430\u0442\u0447 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 32768, \u0447\u0442\u043e \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u0435\u0442 \u0442\u043e\u043c\u0443, \u043a\u0430\u043a \u043e\u0431\u0443\u0447\u0430\u043b\u0430\u0441\u044c \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c CLIP (\u0432 \u0432\u0435\u0440\u0441\u0438\u0438 ruCLIP Small \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430 \u0431\u044b\u043b \u0440\u0430\u0432\u0435\u043d 16).<\/p>\n<p>\u0412 \u043e\u0441\u043d\u043e\u0432\u0435 \u043d\u043e\u0432\u044b\u0445 \u0432\u0435\u0440\u0441\u0438\u0439 ruCLIP \u043f\u043e-\u043f\u0440\u0435\u0436\u043d\u0435\u043c\u0443 \u043b\u0435\u0436\u0430\u0442 \u0434\u0432\u0435 \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0449\u0438\u0435:<\/p>\n<ol>\n<li>\n<p>Image Encoder \u2014 \u044d\u043d\u043a\u043e\u0434\u0435\u0440, \u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044e\u0449\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439. \u0412 \u043e\u0441\u043d\u043e\u0432\u0435 \u043d\u0430\u0448\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u043e\u0441\u0442\u0430\u043b\u0441\u044f \u0445\u043e\u0440\u043e\u0448\u043e \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u044b\u0439 ViT.<\/p>\n<\/li>\n<li>\n<p>Text Encoder \u2014 \u044d\u043d\u043a\u043e\u0434\u0435\u0440, \u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044e\u0449\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Small, \u043c\u044b \u043d\u0435 \u0441\u0442\u0430\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c RuGPT3Small, \u0430 \u0432\u0437\u044f\u043b\u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0439 \u044d\u043d\u043a\u043e\u0434\u0435\u0440 &#8212; \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0441\u043e \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438:<\/p>\n<\/li>\n<\/ol>\n<ul>\n<li>\n<p>\u0434\u043b\u044f Base \u0432\u0435\u0440\u0441\u0438\u0439<\/p>\n<ul>\n<li>\n<p>Context Length: 77<\/p>\n<\/li>\n<li>\n<p>Transformer Layers: 12<\/p>\n<\/li>\n<li>\n<p>Transformer Width: 512<\/p>\n<\/li>\n<li>\n<p>Transformer Heads: 8<\/p>\n<\/li>\n<\/ul>\n<\/li>\n<li>\n<p>\u0434\u043b\u044f Large \u0432\u0435\u0440\u0441\u0438\u0439<\/p>\n<ul>\n<li>\n<p>Context Length: 77<\/p>\n<\/li>\n<li>\n<p>Transformer Layers: 12<\/p>\n<\/li>\n<li>\n<p>Transformer Width: 768<\/p>\n<\/li>\n<li>\n<p>Transformer Heads: 12<\/p>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2>\u0414\u0430\u043d\u043d\u044b\u0435<\/h2>\n<p>\u041a\u0430\u043a \u043c\u044b \u0443\u0436\u0435 \u0443\u043f\u043e\u043c\u0438\u043d\u0430\u043b\u0438 \u0440\u0430\u043d\u0435\u0435, \u0434\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0438\u0439 \u0438\u0437 240\u041c \u043f\u0430\u0440 \u201c\u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435-\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435\u201d \u0438 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0449\u0438\u0439 \u0438\u0437 \u0441\u0435\u0431\u044f \u0440\u0430\u0441\u0448\u0438\u0440\u0435\u043d\u043d\u0443\u044e \u0432\u0435\u0440\u0441\u0438\u044e \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0435\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 ruDALL-E. \u0421\u043b\u0435\u0434\u0443\u0435\u0442 \u043e\u0442\u043c\u0435\u0442\u0438\u0442\u044c, \u0447\u0442\u043e \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043e\u0434\u043d\u0438\u043c \u0438\u0437 \u0441\u0430\u043c\u044b\u0445 \u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u0440\u0443\u0441\u0441\u043a\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0441\u043e\u0434\u0435\u0440\u0436\u0430\u0449\u0438\u0445 \u043f\u0430\u0440\u044b \u201c\u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435-\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435\u201d, \u043d\u043e \u043d\u0430 \u0444\u043e\u043d\u0435 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u043a\u043e\u043d\u043a\u0443\u0440\u0435\u043d\u0442\u043e\u0432 \u043d\u0430\u0448 \u0441\u0435\u0442 \u0434\u0430\u043b\u0435\u043a \u043f\u043e \u043e\u0431\u044a\u0451\u043c\u0443 \u043e\u0442 \u043b\u0438\u0434\u0435\u0440\u043e\u0432 \u0441\u043f\u0438\u0441\u043a\u0430, \u0447\u0442\u043e \u043c\u043e\u0436\u043d\u043e \u0432\u0438\u0434\u0435\u0442\u044c \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 1.<\/p>\n<p>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1 &#8212; \u0421\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u043e\u0431\u044a\u0435\u043c\u043e\u0432 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0432\u044b\u0431\u043e\u0440\u043e\u043a \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"144\" width=\"144\">\n<p><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"105\" width=\"105\">\n<p><a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"><u>ruCLIP Small<\/u><\/a><\/p>\n<\/td>\n<td>\n<p>ruCLIP<\/p>\n<\/td>\n<td>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2103.00020.pdf\"><u>CLIP<\/u><\/a>\u00a0<\/p>\n<\/td>\n<td>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2102.05918.pdf\"><u>ALIGN<\/u><\/a><\/p>\n<\/td>\n<td>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2111.10050.pdf\"><u>BASIC\u00a0<\/u><\/a><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"144\" width=\"144\">\n<p><strong>\u041a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0430\u0440<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"105\" width=\"105\">\n<p>3M<\/p>\n<\/td>\n<td>\n<p>240M<\/p>\n<\/td>\n<td>\n<p>400M<\/p>\n<\/td>\n<td>\n<p>1.8B<\/p>\n<\/td>\n<td>\n<p>6.6B<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041b\u0438\u0434\u0435\u0440\u0441\u0442\u0432\u043e \u043f\u043e \u043e\u0431\u044a\u0435\u043c\u0430\u043c \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0438\u043d\u0430\u0434\u043b\u0435\u0436\u0438\u0442 Google \u0441 \u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 ALIGN \u0438 BASIC. \u0412 \u043f\u0435\u0440\u0432\u043e\u0439 \u0438\u0437 \u043d\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0435 \u0441\u043e\u0431\u0440\u0430\u043d\u044b \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 Conceptual Captions \u0441 \u0443\u043f\u0440\u043e\u0449\u0451\u043d\u043d\u043e\u0439 \u0444\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u0435\u0439 \u0434\u0430\u043d\u043d\u044b\u0445. \u0412\u043e \u0432\u0442\u043e\u0440\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u0434\u043b\u044f ALIGN \u0434\u043e\u043f\u043e\u043b\u043d\u044f\u0435\u0442\u0441\u044f \u043f\u0440\u0438\u0432\u0430\u0442\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c JFT-3B.<\/p>\n<h2>\u041e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f<\/h2>\n<p>\u041f\u0440\u043e\u0446\u0435\u0441\u0441 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0431\u044b\u043b \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u0439, \u0438 \u043e \u0435\u0433\u043e \u044d\u0442\u0430\u043f\u0430\u0445 \u0445\u043e\u0447\u0435\u0442\u0441\u044f \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u0442\u044c \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u0435\u0435. \u041d\u0430\u0447\u043d\u0435\u043c \u0441 \u043c\u043e\u0434\u0435\u043b\u0438, \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u043e\u0439 \u043d\u0430 ViT-Large. \u041d\u0430 \u043f\u0435\u0440\u0432\u043e\u043c \u044d\u0442\u0430\u043f\u0435 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u043b\u043e\u0441\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 <em>ruCLIP Large [vit-large-patch14-224]<\/em> \u0441 \u043d\u0443\u043b\u044f \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u044d\u0442\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432\u044b\u043f\u043e\u043b\u043d\u044f\u043b\u043e\u0441\u044c \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 380\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439. \u0414\u0430\u043b\u0435\u0435, \u0438\u0437\u043c\u0435\u043d\u0438\u0432 \u0440\u0430\u0437\u043c\u0435\u0440 \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u043f\u0440\u043e\u0432\u0435\u0434\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 \u0435\u0449\u0435 15\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439 \u0431\u044b\u043b\u0430 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0430 \u043c\u043e\u0434\u0435\u043b\u044c <em>ruCLIP Large [vit-large-patch14-336] exclusive<\/em>. \u0427\u0442\u043e \u043a\u0430\u0441\u0430\u0435\u0442\u0441\u044f ViT-Base \u0432\u0435\u0440\u0441\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438, \u0442\u043e \u043e\u043d\u0438 \u043e\u0431\u0443\u0447\u0430\u043b\u0438\u0441\u044c \u043f\u0443\u0442\u0435\u043c \u0442\u044e\u043d\u0438\u043d\u0433\u0430 \u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 140\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439. \u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u0431\u044b\u043b\u0438 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u044b \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Base [vit-base-patch16-224]<\/em> \u0438 <em>ruCLIP Base [vit-base-patch32-224]<\/em>. \u0418\u0437\u043c\u0435\u043d\u0438\u0432 \u0440\u0430\u0437\u043c\u0435\u0440 \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0434\u043e 384 \u0438 \u0432\u044b\u043f\u043e\u043b\u043d\u0438\u0432 \u0442\u044e\u043d\u0438\u043d\u0433 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 \u0435\u0449\u0435 20\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439 \u0431\u044b\u043b\u0438 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u044b \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Base [vit-base-patch32-384]<\/em> \u0438 <em>ruCLIP Base [vit-base-patch16-384] exclusive<\/em>.<\/p>\n<p>\u041d\u0430\u0433\u043b\u044f\u0434\u043d\u043e \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d \u043d\u0438\u0436\u0435 \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a\u0430\u0445 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 loss (\u0440\u0438\u0441\u0443\u043d\u043e\u043a 1). \u0422\u0430\u043a\u0436\u0435 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u0430 \u043c\u0435\u0442\u043e\u0434\u0438\u043a\u0430 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 learning rate.<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"\/img\/image-loader.svg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1 - \u0413\u0440\u0430\u0444\u0438\u043a\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f loss \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f (\u043b\u0435\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0438 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0432\u0430\u0440\u044c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f learning rate (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0434\u043b\u044f 6 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1 - \u0413\u0440\u0430\u0444\u0438\u043a\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f loss \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f (\u043b\u0435\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0438 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0432\u0430\u0440\u044c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f learning rate (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0434\u043b\u044f 6 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP\" height=\"1781\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/33e\/823\/d88\/33e823d88df3bc0caf9e2ab703b33ee4.png\" data-width=\"965\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1 &#8212; \u0413\u0440\u0430\u0444\u0438\u043a\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f loss \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f (\u043b\u0435\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0438 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0432\u0430\u0440\u044c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f learning rate (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0434\u043b\u044f 6 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP<\/figcaption><\/figure>\n<p>\u041d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 2 \u043f\u043e\u043a\u0430\u0437\u0430\u043d \u0433\u0440\u0430\u0444\u0438\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f accuracy \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Large [vit-large-patch14-224].<\/p>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w780q1\/getpro\/habr\/upload_files\/51c\/2a2\/58e\/51c2a258edf14b857c88fbd78ccf7039.jpg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2 - \u0413\u0440\u0430\u0444\u0438\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f accuracy \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP Large [vit-large-patch14-224]\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2 - \u0413\u0440\u0430\u0444\u0438\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f accuracy \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP Large [vit-large-patch14-224]\" width=\"432\" height=\"288\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/51c\/2a2\/58e\/51c2a258edf14b857c88fbd78ccf7039.jpg\" data-blurred=\"true\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2 &#8212; \u0413\u0440\u0430\u0444\u0438\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f accuracy \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP Large [vit-large-patch14-224]<\/figcaption><\/figure>\n<h2>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b<\/h2>\n<p>\u0414\u043b\u044f \u0437\u0430\u043f\u0443\u0441\u043a\u0430 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0436\u0438\u0437\u043d\u0435\u0440\u0430\u0434\u043e\u0441\u0442\u043d\u043e\u0433\u043e <a href=\"https:\/\/ichef.bbci.co.uk\/news\/640\/cpsprodpb\/475B\/production\/_98776281_gettyimages-521697453.jpg\"><u>\u0449\u0435\u043d\u043e\u0447\u043a\u0430<\/u><\/a> (\u0440\u0438\u0441\u0443\u043d\u043e\u043a 3) \u0438 \u0437\u0430\u043a\u0438\u043d\u0435\u043c \u0435\u0433\u043e \u0432 \u043a\u043e\u0434 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043d\u0430\u0448\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438, \u0437\u0430\u0440\u0430\u043d\u0435\u0435 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0432 \u043d\u0430\u0431\u043e\u0440 \u043a\u043b\u0430\u0441\u0441\u043e\u0432 \u0434\u043b\u044f zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438.<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"\/img\/image-loader.svg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3 - \u0412\u0435\u0441\u0435\u043b\u044b\u0439 \u0449\u0435\u043d\u043e\u0447\u0435\u043a\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3 - \u0412\u0435\u0441\u0435\u043b\u044b\u0439 \u0449\u0435\u043d\u043e\u0447\u0435\u043a\" height=\"360\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/75c\/2ed\/049\/75c2ed0498373bed2025529efb7f3fd2.png\" data-width=\"640\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3 &#8212; \u0412\u0435\u0441\u0435\u043b\u044b\u0439 \u0449\u0435\u043d\u043e\u0447\u0435\u043a<\/figcaption><\/figure>\n<pre><code>import ruclip import torch import requests from PIL import Image from io import BytesIO   url_dog = \"https:\/\/ichef.bbci.co.uk\/news\/640\/cpsprodpb\/475B\/production\/_98776281_gettyimages-521697453.jpg\" response = requests.get(url_dog) image = Image.open(BytesIO(response.content))   device = 'cuda' clip, processor = ruclip.load('ruclip-vit-base-patch32-384', device=device) classes = ['\u043a\u043e\u0448\u043a\u0430', '\u0441\u043e\u0431\u0430\u0447\u043a\u0430', '\u043c\u044b\u0448\u043a\u0430', '\u043c\u0430\u0448\u0438\u043d\u0430', '\u0441\u0442\u043e\u043b', '\u0434\u043e\u043c', '\u0436\u0438\u0434\u043a\u043e\u0441\u0442\u044c'] predictor = ruclip.Predictor(clip, processor, device, bs=8)   with torch.no_grad():     text_latents = predictor.get_text_latents(classes)     pred_labels = predictor.run([image], text_latents)   print(f'\u041d\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0438 {classes[pred_labels[0]]}')  -------------------------------------------------- \u041d\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0438 \u0441\u043e\u0431\u0430\u0447\u043a\u0430<\/code><\/pre>\n<p>\u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438, \u0447\u0442\u043e \u0441 \u0431\u043b\u0438\u0437\u043a\u043e\u0439 \u043a \u043d\u0430\u0438\u0431\u043e\u043b\u044c\u0448\u0435\u0439 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c\u044e \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0431\u044b\u043b\u043e \u043e\u0442\u043d\u0435\u0441\u0435\u043d\u043e \u043a \u043a\u043b\u0430\u0441\u0441\u0443 \u201c\u0441\u043e\u0431\u0430\u0447\u043a\u0430\u201d, \u0447\u0442\u043e \u043d\u0435 \u043c\u043e\u0436\u0435\u0442 \u043d\u0435 \u0440\u0430\u0434\u043e\u0432\u0430\u0442\u044c. \u0414\u0430\u043b\u044c\u0448\u0435 \u043c\u044b \u043f\u043e\u043a\u0430\u0436\u0435\u043c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0440\u0430\u0431\u043e\u0442\u044b \u043d\u0430\u0448\u0435\u0439 \u0441\u0430\u043c\u043e\u0439 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Large [vit-large-patch14-224]<\/em> \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u0440\u0430\u0437\u043d\u044b\u0445 \u0434\u043e\u043c\u0435\u043d\u043e\u0432 \u0438 \u043f\u0440\u043e\u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u0435\u043c \u0435\u0435 \u0436\u0438\u0437\u043d\u0435\u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044c \u0432 \u0437\u0430\u0434\u0430\u0447\u0430\u0445 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438.<\/p>\n<p>\u0412 \u0441\u043b\u0443\u0447\u0430\u0435, \u0435\u0441\u043b\u0438 \u0437\u0430\u0445\u043e\u0447\u0435\u0442\u0441\u044f \u0432\u043e\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u044d\u043a\u0441\u043a\u043b\u044e\u0437\u0438\u0432\u043d\u044b\u043c\u0438 \u0432\u0435\u0440\u0441\u0438\u044f\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u0438\u0437 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\">DataHub SberCloud ML Space<\/a>, \u0442\u043e \u0441 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u044f\u043c\u0438 \u043c\u043e\u0436\u043d\u043e \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u043f\u043e \u0441\u0441\u044b\u043b\u043a\u0430\u043c <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-base-exclusive\">ruCLIP Base [vit-base-patch16-384] exclusive<\/a><em> <\/em>\u0438 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-large-exclusive\">ruCLIP Large [vit-large-patch14-336] exclusive<\/a><em>.<\/em><\/p>\n<h2>\u041e\u0446\u0435\u043d\u043a\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430. \u0421\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0435\u0439\u00a0<\/h2>\n<p>\u0412 \u0445\u043e\u0434\u0435 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 \u043c\u044b \u043f\u0440\u0435\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043b\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0446\u0435\u043b\u0435\u0439. \u041f\u0435\u0440\u0432\u0430\u044f \u2013 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0445\u043e\u0440\u043e\u0448\u0438 \u0440\u0430\u0437\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u043e\u0439 \u043f\u0440\u0438\u0440\u043e\u0434\u044b, \u0430 \u0432\u0442\u043e\u0440\u0430\u044f \u2013 \u0441\u0440\u0430\u0432\u043d\u0438\u0442\u044c \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u043d\u0430\u0448\u0435\u0433\u043e \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u043a\u043e\u043c\u0431\u0438\u043d\u0430\u0446\u0438\u0438 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u0430 <a href=\"https:\/\/huggingface.co\/Helsinki-NLP\/opus-mt-ru-en\"><u>OPUS-MT<\/u><\/a> ru-en \u0438 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP. \u0426\u0438\u0444\u0440\u044b \u043d\u0438\u0436\u0435 \u0432\u0441\u0435 \u0441\u043a\u0430\u0436\u0443\u0442 \u0437\u0430 \u0441\u0435\u0431\u044f.<\/p>\n<h3>\u041f\u0440\u043e \u043c\u0435\u0442\u0440\u0438\u043a\u0438<\/h3>\n<p>\u0412 \u043f\u0435\u0440\u0432\u0443\u044e \u043e\u0447\u0435\u0440\u0435\u0434\u044c \u043e\u0446\u0435\u043d\u043a\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u043c\u043e\u0434\u0435\u043b\u0438 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u0441\u044f \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u0439 \u043a\u043e\u0441\u0438\u043d\u0443\u0441\u043d\u043e\u0439 \u043c\u0435\u0442\u0440\u0438\u043a\u0438. \u0422\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044e\u0442\u0441\u044f \u0432 \u0441\u0432\u043e\u0438 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438, \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f &#8212; \u0432 \u0441\u0432\u043e\u0438, \u0434\u0430\u043b\u0435\u0435 \u0441\u0447\u0438\u0442\u0430\u0435\u043c \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0438 \u0432\u044b\u0431\u0438\u0440\u0430\u0435\u043c \u043b\u0443\u0447\u0448\u0443\u044e \u043f\u0430\u0440\u0443.<\/p>\n<p>\u0414\u043b\u044f \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0430\u0446\u0438\u0438 \u0441\u043d\u043e\u0432\u0430 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0442\u0435 \u0436\u0435 \u0441\u0430\u043c\u044b\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u043d\u043e\u0443\u0442\u0431\u0443\u043a\u0435 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP \u0438 \u0432 \u0441\u0442\u0430\u0442\u044c\u0435 \u043f\u0440\u043e <em>ruCLIP Small<\/em>. \u0421\u0440\u0435\u0434\u0438 \u043d\u0430\u0448\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0441\u0430\u043c\u0443\u044e \u0431\u043e\u043b\u044c\u0448\u0443\u044e \u043e\u0442\u043a\u0440\u044b\u0442\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c <em>ruCLIP Large [vit-large-patch14-224]<\/em> \u0438 \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043c \u0435\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e. \u041a\u043e\u0441\u0438\u043d\u0443\u0441\u043d\u0430\u044f \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u043c\u0435\u0436\u0434\u0443 \u0442\u0435\u043a\u0441\u0442\u0430\u043c\u0438 \u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f\u043c\u0438 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Large [vit-large-patch14-224] <\/em>\u0442\u0430\u043a\u0436\u0435 \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u0430 \u043d\u0438\u0436\u0435 \u043d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 4.<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"\/img\/image-loader.svg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4 - \u041c\u0430\u0442\u0440\u0438\u0446\u0430 \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4 - \u041c\u0430\u0442\u0440\u0438\u0446\u0430 \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439\" height=\"580\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/3f1\/521\/05d\/3f152105df2388b991b4f6ad5fc21870.png\" data-width=\"821\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4 &#8212; \u041c\u0430\u0442\u0440\u0438\u0446\u0430 \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439<\/figcaption><\/figure>\n<p>\u041f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u044f \u0442\u043e\u043f 5 \u043a\u043b\u0430\u0441\u0441\u043e\u0432 \u0434\u043b\u044f \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e <em>ruCLIP Large \u00a0[vit-large-patch14-224]<\/em> \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u044b \u043d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 5.<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"\/img\/image-loader.svg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5 - \u0411\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5 - \u0411\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439\" height=\"1600\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/6fc\/981\/140\/6fc98114016d09c0bec75bbb77dd9406.png\" data-width=\"1600\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5 &#8212; \u0411\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439<\/figcaption><\/figure>\n<p>\u0412 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 2 \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u043e \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u0432 \u0440\u0430\u043c\u043a\u0430\u0445 \u0437\u0430\u0434\u0430\u0447\u0438 zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0434\u043e\u043c\u0435\u043d\u043e\u0432. \u0421\u0438\u043c\u0432\u043e\u043b\u043e\u043c ? \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043e \u043b\u0443\u0447\u0448\u0435\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u043c\u0435\u0442\u0440\u0438\u043a\u0438 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0438\u0437 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432. \u0412 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u044f \u043f\u0435\u0440\u0432\u043e\u0439 \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Small, \u0432\u0441\u0435\u0445 6 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP, \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original \u0441 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u043e\u043c OPUS-MT ru-en \u0438 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original. \u0412 8 \u0438\u0437 18 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u043c\u043e\u0434\u0435\u043b\u044c <em>ruCLIP Large [vit-large-patch14-336] exclusive<\/em> \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u043b\u0443\u0447\u0448\u0438\u0439 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u0441\u0440\u0435\u0434\u0438 \u0432\u0441\u0435\u0445 \u0441\u0440\u0430\u0432\u043d\u0438\u0432\u0430\u0435\u043c\u044b\u0445, \u0430 \u0432 \u0442\u0435\u0445, \u0433\u0434\u0435 \u043f\u0440\u043e\u0438\u0433\u0440\u044b\u0432\u0430\u0435\u0442, \u0440\u0430\u0437\u043d\u0438\u0446\u0430 \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0437\u043d\u0430\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u0430\u044f (\u043f\u043e\u0436\u0430\u043b\u0443\u0439, \u043a\u0440\u043e\u043c\u0435 MNIST \u0438 FGVC Aircraft &#8212; \u0437\u0434\u0435\u0441\u044c \u0435\u0449\u0435 \u0435\u0441\u0442\u044c \u043d\u0430\u0434 \u0447\u0435\u043c \u043f\u043e\u0442\u0440\u0443\u0434\u0438\u0442\u044c\u0441\u044f). \u0421\u0442\u043e\u0438\u0442 \u043e\u0442\u043c\u0435\u0442\u0438\u0442\u044c, \u0447\u0442\u043e \u043d\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 MNIST \u0434\u0430\u0436\u0435 \u0441\u0430\u043c\u044b\u043c \u0431\u043e\u043b\u044c\u0448\u0438\u043c \u043c\u043e\u0434\u0435\u043b\u044f\u043c <a href=\"https:\/\/arxiv.org\/pdf\/2102.05918.pdf\"><u>ALIGN<\/u><\/a> \u0438 <a href=\"https:\/\/arxiv.org\/pdf\/2111.10050.pdf\"><u>BASIC<\/u><\/a> \u043d\u0435 \u0443\u0434\u0430\u0435\u0442\u0441\u044f \u043e\u0431\u043e\u0439\u0442\u0438 CLIP \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443. \u0414\u043b\u044f \u0431\u043e\u043b\u044c\u0448\u0438\u043d\u0441\u0442\u0432\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 (11 \u0438\u0437 18) \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u044b\u0435 \u043d\u0430\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u043e\u0431\u0445\u043e\u0434\u044f\u0442 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 \u043c\u043e\u0434\u0435\u043b\u044c <em>CLIP [vit-base-patch16-224] original + OPUS-MT<\/em>. \u041f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432\u043e \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u043c\u043e\u0436\u043d\u043e \u043e\u0431\u044a\u044f\u0441\u043d\u0438\u0442\u044c \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0431<em>\u043e<\/em>\u043b\u044c\u0448\u0438\u043c \u043e\u0431\u044a\u0435\u043c\u043e\u043c \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0435\u0439 \u0432\u044b\u0431\u043e\u0440\u043a\u0438 (400\u041c vs 240\u041c).<\/p>\n<p>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2 &#8212; \u0417\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p><strong>ruCLIP Small [rugpt3-small]<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p><strong>ruCLIP Base [vit-base-patch32-224]<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p><strong>ruCLIP Base [vit-base-patch16-224]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Large [vit-large-patch14-224]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Base [vit-base-patch32-384]<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p><strong>ruCLIP Large [vit-large-patch14-336] exclusive<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Base [vit-large-patch16-384] exclusive<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>CLIP [vit-base-patch16-224] original + <\/strong><a href=\"https:\/\/huggingface.co\/Helsinki-NLP\/opus-mt-ru-en\"><strong><u>OPUS-MT<\/u><\/strong><\/a><\/p>\n<\/td>\n<td>\n<p><strong>CLIP [vit-base-patch16-224] original<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Food101, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.137<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.505<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.552<\/p>\n<\/td>\n<td>\n<p>0.597<\/p>\n<\/td>\n<td>\n<p>0.642<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p><em>0.712<\/em> ?<\/p>\n<\/td>\n<td>\n<p>0.689<\/p>\n<\/td>\n<td>\n<p>0.664<\/p>\n<\/td>\n<td>\n<p>0.883<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>CIFAR10, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.808<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.818<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.810<\/p>\n<\/td>\n<td>\n<p>0.878<\/p>\n<\/td>\n<td>\n<p>0.862<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.906 ?<\/p>\n<\/td>\n<td>\n<p>0.845<\/p>\n<\/td>\n<td>\n<p>0.859<\/p>\n<\/td>\n<td>\n<p>0.893<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>CIFAR100, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.440<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.504<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.496<\/p>\n<\/td>\n<td>\n<p>0.511<\/p>\n<\/td>\n<td>\n<p>0.529<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.591\u00a0<\/p>\n<\/td>\n<td>\n<p>0.569<\/p>\n<\/td>\n<td>\n<p>0.603<strong> <\/strong>?<\/p>\n<\/td>\n<td>\n<p>0.647<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Birdsnap, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.036<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.115<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.117<\/p>\n<\/td>\n<td>\n<p>0.172<\/p>\n<\/td>\n<td>\n<p>0.161<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.213 ?<\/p>\n<\/td>\n<td>\n<p>0.195<\/p>\n<\/td>\n<td>\n<p>0.126<\/p>\n<\/td>\n<td>\n<p>0.396<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>SUN397, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.036<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.452<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.462<\/p>\n<\/td>\n<td>\n<p>0.484<\/p>\n<\/td>\n<td>\n<p>0.510<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.523 ?<\/p>\n<\/td>\n<td>\n<p>0.521<\/p>\n<\/td>\n<td>\n<p>0.447<\/p>\n<\/td>\n<td>\n<p>0.631<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Stanford Cars, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.023<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.433<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.487<\/p>\n<\/td>\n<td>\n<p>0.559<\/p>\n<\/td>\n<td>\n<p>0.572<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.659 ?<\/p>\n<\/td>\n<td>\n<p>0.626<\/p>\n<\/td>\n<td>\n<p>0.567<\/p>\n<\/td>\n<td>\n<p>0.638<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>DTD, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.169<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.380<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.401<\/p>\n<\/td>\n<td>\n<p>0.370<\/p>\n<\/td>\n<td>\n<p>0.390<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.408<\/p>\n<\/td>\n<td>\n<p>0.421 ?<\/p>\n<\/td>\n<td>\n<p>0.243<\/p>\n<\/td>\n<td>\n<p>0.432<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>MNIST, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.137<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.447<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.464<\/p>\n<\/td>\n<td>\n<p>0.337<\/p>\n<\/td>\n<td>\n<p>0.404<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.242<\/p>\n<\/td>\n<td>\n<p>0.478\u00a0<\/p>\n<\/td>\n<td>\n<p>0.559 ?<\/p>\n<\/td>\n<td>\n<p>0.559<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>STL10, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.910<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.932<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.932<\/p>\n<\/td>\n<td>\n<p>0.934<\/p>\n<\/td>\n<td>\n<p>0.946<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.956<\/p>\n<\/td>\n<td>\n<p>0.964\u00a0<\/p>\n<\/td>\n<td>\n<p>0.967 ?<\/p>\n<\/td>\n<td>\n<p>0.970<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>PCam, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.484<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.501<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.505<\/p>\n<\/td>\n<td>\n<p>0.520<\/p>\n<\/td>\n<td>\n<p>0.506<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.554\u00a0<\/p>\n<\/td>\n<td>\n<p>0.501<\/p>\n<\/td>\n<td>\n<p>0.603 ?<\/p>\n<\/td>\n<td>\n<p>0.573<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>CLEVR, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.104<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.148<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.128<\/p>\n<\/td>\n<td>\n<p>0.152<\/p>\n<\/td>\n<td>\n<p>0.188\u00a0<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.142<\/p>\n<\/td>\n<td>\n<p>0.132<\/p>\n<\/td>\n<td>\n<p>0.240 ?<\/p>\n<\/td>\n<td>\n<p>0.240<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Rendered SST2, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.483<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.489<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.527<\/p>\n<\/td>\n<td>\n<p>0.529<\/p>\n<\/td>\n<td>\n<p>0.508<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.539 ?<\/p>\n<\/td>\n<td>\n<p>0.525<\/p>\n<\/td>\n<td>\n<p>0.484<\/p>\n<\/td>\n<td>\n<p>0.484<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>ImageNet, acc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p><abbr title=\"\u0434\u0430\u0442\u0430\u0441\u0435\u0442 ImageNet \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Small, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 zero-shot accuracy \u043d\u0430 \u043d\u0435\u043c \u043d\u0435 \u043c\u043e\u0433\u043b\u043e \u0431\u044b\u0442\u044c \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u043e\">*<\/abbr><\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.375<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.401<\/p>\n<\/td>\n<td>\n<p>0.426<\/p>\n<\/td>\n<td>\n<p>0.451<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.488?<\/p>\n<\/td>\n<td>\n<p>0.482<\/p>\n<\/td>\n<td>\n<p>0.392<\/p>\n<\/td>\n<td>\n<p>0.638<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>FGVC Aircraft, mean-per-class<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.020<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.033<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.043<\/p>\n<\/td>\n<td>\n<p>0.046<\/p>\n<\/td>\n<td>\n<p>0.053<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.075<\/p>\n<\/td>\n<td>\n<p>0.046<\/p>\n<\/td>\n<td>\n<p>0.220 ?<\/p>\n<\/td>\n<td>\n<p>0.244<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Oxford Pets, mean-per-class<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.462<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.560<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.595<\/p>\n<\/td>\n<td>\n<p>0.604<\/p>\n<\/td>\n<td>\n<p>0.587<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.546<\/p>\n<\/td>\n<td>\n<p>0.635 ?<\/p>\n<\/td>\n<td>\n<p>0.507<\/p>\n<\/td>\n<td>\n<p>0.874<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Caltech101, mean-per-class<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.590<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.786<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.775<\/p>\n<\/td>\n<td>\n<p>0.777<\/p>\n<\/td>\n<td>\n<p>0.834<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.835 ?<\/p>\n<\/td>\n<td>\n<p>0.835 ?<\/p>\n<\/td>\n<td>\n<p>0.792<\/p>\n<\/td>\n<td>\n<p>0.883<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Flowers102, mean-per-class<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.063<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.401<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.388<\/p>\n<\/td>\n<td>\n<p>0.455<\/p>\n<\/td>\n<td>\n<p>0.449<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.517 ?<\/p>\n<\/td>\n<td>\n<p>0.452<\/p>\n<\/td>\n<td>\n<p>0.357<\/p>\n<\/td>\n<td>\n<p>0.697<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"72\" width=\"72\">\n<p>Hateful Memes, roc-auc<\/p>\n<\/td>\n<td data-colwidth=\"76\" width=\"76\">\n<p>0.527<\/p>\n<\/td>\n<td data-colwidth=\"74\" width=\"74\">\n<p>0.564\u00a0<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.516<\/p>\n<\/td>\n<td>\n<p>0.530<\/p>\n<\/td>\n<td>\n<p>0.537<\/p>\n<\/td>\n<td data-colwidth=\"67\" width=\"67\">\n<p>0.519<\/p>\n<\/td>\n<td>\n<p>0.543<\/p>\n<\/td>\n<td>\n<p>0.579 ?<\/p>\n<\/td>\n<td>\n<p>0.589<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041d\u0438\u0436\u0435 \u043d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0430\u0445 6 \u0438 7 \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u044b \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0445 \u0438\u0441\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u0439 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 10 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 \u043d\u0430 16 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445. \u0422\u0430\u043a \u0436\u0435, \u043a\u0430\u043a \u0438 \u0432 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435, \u043d\u0430 \u043f\u0440\u0438\u0437\u043d\u0430\u043a\u0430\u0445, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0438\u0437\u0432\u043b\u0435\u043a\u0430\u0435\u0442 CLIP \u0434\u043b\u044f \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439, \u0431\u044b\u043b\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u044b \u043b\u0438\u043d\u0435\u0439\u043d\u044b\u0435 \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0442\u043e\u0440\u044b \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c 1, 2, 4, 8 \u0438 16 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043a\u043b\u0430\u0441\u0441\u0430. \u042d\u0442\u043e \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u043f\u0440\u043e\u0441\u0442\u043e\u0439 \u0438 \u043f\u043e\u043d\u044f\u0442\u043d\u044b\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 transfer learning, \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u043c\u044b\u0439 linear probe, \u043f\u0440\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0434\u043b\u044f \u0438\u0437\u0432\u043b\u0435\u0447\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0437\u043d\u0430\u043a\u043e\u0432, \u0438 \u0434\u0430\u043b\u0435\u0435 \u0434\u043e\u0443\u0447\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u201c\u0433\u043e\u043b\u043e\u0432\u0430\u201d \u0434\u043b\u044f \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0433\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u043a\u043b\u0430\u0441\u0441\u043e\u0432 \u043f\u0440\u0438 \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u043d\u043e\u043c \u043d\u0430\u0431\u043e\u0440\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043a\u043b\u0430\u0441\u0441\u0430. \u041f\u043e\u0441\u043a\u043e\u043b\u044c\u043a\u0443 \u043f\u0440\u0438\u0437\u043d\u0430\u043a\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0438\u0437\u0432\u043b\u0435\u043a\u0430\u044e\u0442\u0441\u044f \u0443 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 CLIP original \u0438 CLIP original + OPUS-MT \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u0435 \u2014 \u0434\u043b\u044f CLIP original + OPUS-MT \u043d\u0435\u0442 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u0433\u0440\u0430\u0444\u0438\u043a\u0430 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438. \u0422\u0430\u043a\u0436\u0435 \u043c\u044b \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u043b\u0438 \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0439 few-shot \u0433\u0440\u0430\u0444\u0438\u043a \u0434\u043b\u044f \u043b\u0443\u0447\u0448\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Large exclusive \u0431\u0435\u0437 \u0443\u0447\u0435\u0442\u0430 \u0442\u0440\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 &#8212; PCam, Oxford Pets \u0438 FGVC Aircraft, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u043e\u0438\u0433\u0440\u044b\u0432\u0430\u0435\u0442 \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0441\u0438\u043b\u044c\u043d\u043e, \u0438 \u043c\u043e\u0436\u043d\u043e \u0432\u0438\u0434\u0435\u0442\u044c (\u043f\u0443\u043d\u043a\u0442\u0438\u0440\u043d\u0430\u044f \u043b\u0438\u043d\u0438\u044f), \u0447\u0442\u043e \u0441\u0440\u0435\u0434\u043d\u0435\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0434\u0430\u0436\u0435 \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u043f\u0440\u0435\u0432\u043e\u0441\u0445\u043e\u0434\u0438\u0442 ruCLIP Small. \u0417\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0430\u043c\u0438 \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u044b \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0439 zero-shot \u043e\u0446\u0435\u043d\u043a\u0438 \u043c\u043e\u0434\u0435\u043b\u0435\u0439.<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w780q1\/getpro\/habr\/upload_files\/70c\/993\/a96\/70c993a96bf4a3baaab29a41a5579354.jpeg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 6 - \u0423\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0439 \u0433\u0440\u0430\u0444\u0438\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 zero-shot (\u0437\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0438) \u0438 few-shot (\u043b\u0438\u043d\u0438\u0438) \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043f\u043e \u0432\u0441\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c, \u0443\u0447\u0430\u0441\u0442\u0432\u043e\u0432\u0430\u0432\u0448\u0438\u043c \u0432 \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 6 - \u0423\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0439 \u0433\u0440\u0430\u0444\u0438\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 zero-shot (\u0437\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0438) \u0438 few-shot (\u043b\u0438\u043d\u0438\u0438) \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043f\u043e \u0432\u0441\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c, \u0443\u0447\u0430\u0441\u0442\u0432\u043e\u0432\u0430\u0432\u0448\u0438\u043c \u0432 \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430\" width=\"615\" height=\"483\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/70c\/993\/a96\/70c993a96bf4a3baaab29a41a5579354.jpeg\" data-blurred=\"true\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 6 &#8212; \u0423\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0439 \u0433\u0440\u0430\u0444\u0438\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 zero-shot (\u0437\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0438) \u0438 few-shot (\u043b\u0438\u043d\u0438\u0438) \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043f\u043e \u0432\u0441\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c, \u0443\u0447\u0430\u0441\u0442\u0432\u043e\u0432\u0430\u0432\u0448\u0438\u043c \u0432 \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430<\/figcaption><\/figure>\n<p>\u041e\u0442\u0434\u0435\u043b\u044c\u043d\u043e \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u043a\u0430\u0440\u0442\u0438\u043d\u0430 \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c (\u0440\u0438\u0441\u0443\u043d\u043e\u043a 7).\u00a0<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w780q1\/getpro\/habr\/upload_files\/178\/901\/bba\/178901bbae21118b225425cf143e5b09.jpeg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 7 - \u0413\u0440\u0430\u0444\u0438\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 zero-shot (\u0437\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0438) \u0438 few-shot (\u043b\u0438\u043d\u0438\u0438) \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0438\u0437 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0443\u0447\u0430\u0441\u0442\u0432\u043e\u0432\u0430\u0432\u0448\u0438\u0445 \u0432 \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 7 - \u0413\u0440\u0430\u0444\u0438\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 zero-shot (\u0437\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0438) \u0438 few-shot (\u043b\u0438\u043d\u0438\u0438) \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0438\u0437 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0443\u0447\u0430\u0441\u0442\u0432\u043e\u0432\u0430\u0432\u0448\u0438\u0445 \u0432 \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430\" width=\"874\" height=\"862\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/178\/901\/bba\/178901bbae21118b225425cf143e5b09.jpeg\" data-blurred=\"true\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 7 &#8212; \u0413\u0440\u0430\u0444\u0438\u043a \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 zero-shot (\u0437\u0432\u0435\u0437\u0434\u043e\u0447\u043a\u0438) \u0438 few-shot (\u043b\u0438\u043d\u0438\u0438) \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0438\u0437 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0443\u0447\u0430\u0441\u0442\u0432\u043e\u0432\u0430\u0432\u0448\u0438\u0445 \u0432 \u043e\u0446\u0435\u043d\u043a\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430<\/figcaption><\/figure>\n<p>\u041f\u043e\u0447\u0435\u043c\u0443 \u0436\u0435 ruCLIP Small \u0438\u043c\u0435\u0435\u0442 \u0442\u0430\u043a\u0438\u0435 \u0445\u043e\u0440\u043e\u0448\u0438\u0435 \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u0438 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u0432 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438? \u0422\u0430\u043a\u043e\u0439 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u043e\u0431\u0443\u0441\u043b\u043e\u0432\u043b\u0435\u043d \u0442\u0435\u043c, \u0447\u0442\u043e \u043f\u0440\u0438 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 ruCLIP Small \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f Image Encoder, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0438\u0439 \u0438\u0437 \u0437\u0430\u043c\u043e\u0440\u043e\u0436\u0435\u043d\u043d\u044b\u0445 \u0432\u0435\u0441\u043e\u0432 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original \u0438 \u0434\u0432\u0443\u0445 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u043b\u0438\u043d\u0435\u0439\u043d\u044b\u0445 \u0441\u043b\u043e\u0435\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0438 \u043f\u043e\u0434\u0432\u0435\u0440\u0433\u0430\u043b\u0438\u0441\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044e. \u0412\u0432\u0438\u0434\u0443 \u0442\u043e\u0433\u043e, \u0447\u0442\u043e \u0434\u043b\u044f linear probe \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0442\u043e\u043b\u044c\u043a\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u0430\u044f \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0449\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u0438, \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e ruCLIP Small \u0434\u043e\u043b\u0436\u043d\u043e \u0431\u044b\u0442\u044c \u043e\u0447\u0435\u043d\u044c \u0431\u043b\u0438\u0437\u043a\u043e \u043a CLIP original. \u041f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0434\u0435\u0442\u0430\u043b\u044c\u043d\u043e\u0435 \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0432\u0441\u0435\u0445 6 \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043c\u043e\u0436\u043d\u043e \u0432 \u043d\u0430\u0448\u0435\u043c \u0440\u0435\u043f\u043e\u0437\u0438\u0442\u043e\u0440\u0438\u0438 \u043d\u0430 <a href=\"https:\/\/github.com\/sberbank-ai\/ru-clip\"><u>GitHub<\/u><\/a>.<\/p>\n<p>\u0412 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 3 \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u043e \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043c\u0435\u0442\u0440\u0438\u043a\u0438\u00a0few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u0432\u043e\u0441\u044c\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u043d\u0430 \u0440\u0430\u0437\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445. \u0412 \u0441\u043e\u0441\u0442\u0430\u0432\u0435 \u0441\u0440\u0430\u0432\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0439 \u0431\u0430\u0437\u044b \u0442\u0430\u043a\u0436\u0435 \u0432\u044b\u0441\u0442\u0443\u043f\u0430\u044e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Small \u0438 CLIP original. \u0418 \u0441\u043d\u043e\u0432\u0430 \u043f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432\u043e \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u043c\u043e\u0436\u043d\u043e \u043e\u0431\u044a\u044f\u0441\u043d\u0438\u0442\u044c \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0431<em>\u043e<\/em>\u043b\u044c\u0448\u0438\u043c \u043e\u0431\u044a\u0435\u043c\u043e\u043c \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0435\u0439 \u0432\u044b\u0431\u043e\u0440\u043a\u0438 (400\u041c vs 240\u041c).<\/p>\n<p>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3 &#8212; \u0423\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<\/td>\n<td>\n<p><strong>ruCLIP Base [vit-base-patch32-224]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Base [vit-base-patch16-224]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Large [vit-large-patch14-224]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Base [vit-base-patch32-384]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Large [vit-large-patch14-336] exclusive<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Base [vit-large-patch16-384] exclusive<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>ruCLIP Small [rugpt3-small]<\/strong><\/p>\n<\/td>\n<td>\n<p><strong>CLIP [vit-base-patch16-224] original<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>Food101<\/p>\n<\/td>\n<td>\n<p>0.765<\/p>\n<\/td>\n<td>\n<p>0.827<\/p>\n<\/td>\n<td>\n<p>0.840<\/p>\n<\/td>\n<td>\n<p>0.851<\/p>\n<\/td>\n<td>\n<p>0.896 ?<\/p>\n<\/td>\n<td>\n<p>0.890<\/p>\n<\/td>\n<td>\n<p>0.874<\/p>\n<\/td>\n<td>\n<p>0.901<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>CIFAR10<\/p>\n<\/td>\n<td>\n<p>0.917<\/p>\n<\/td>\n<td>\n<p>0.922<\/p>\n<\/td>\n<td>\n<p>0.927<\/p>\n<\/td>\n<td>\n<p>0.934<\/p>\n<\/td>\n<td>\n<p>0.943\u00a0<\/p>\n<\/td>\n<td>\n<p>0.942<\/p>\n<\/td>\n<td>\n<p>0.948 ?<\/p>\n<\/td>\n<td>\n<p>0.953<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>CIFAR100<\/p>\n<\/td>\n<td>\n<p>0.716<\/p>\n<\/td>\n<td>\n<p>0.739<\/p>\n<\/td>\n<td>\n<p>0.734<\/p>\n<\/td>\n<td>\n<p>0.745<\/p>\n<\/td>\n<td>\n<p>0.770<\/p>\n<\/td>\n<td>\n<p>0.773\u00a0<\/p>\n<\/td>\n<td>\n<p>0.794 ?<\/p>\n<\/td>\n<td>\n<p>0.808<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>Birdsnap<\/p>\n<\/td>\n<td>\n<p>0.347<\/p>\n<\/td>\n<td>\n<p>0.503<\/p>\n<\/td>\n<td>\n<p>0.567<\/p>\n<\/td>\n<td>\n<p>0.434<\/p>\n<\/td>\n<td>\n<p>0.609<\/p>\n<\/td>\n<td>\n<p>0.612 ?<\/p>\n<\/td>\n<td>\n<p>0.584<\/p>\n<\/td>\n<td>\n<p>0.664<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>SUN397<\/p>\n<\/td>\n<td>\n<p>0.683<\/p>\n<\/td>\n<td>\n<p>0.721<\/p>\n<\/td>\n<td>\n<p>0.731<\/p>\n<\/td>\n<td>\n<p>0.721<\/p>\n<\/td>\n<td>\n<p>0.759 ?<\/p>\n<\/td>\n<td>\n<p>0.758<\/p>\n<\/td>\n<td>\n<p>0.753<\/p>\n<\/td>\n<td>\n<p>0.777<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>Stanford Cars<\/p>\n<\/td>\n<td>\n<p>0.697<\/p>\n<\/td>\n<td>\n<p>0.776<\/p>\n<\/td>\n<td>\n<p>0.797<\/p>\n<\/td>\n<td>\n<p>0.766<\/p>\n<\/td>\n<td>\n<p>0.831<\/p>\n<\/td>\n<td>\n<p>0.840 ?<\/p>\n<\/td>\n<td>\n<p>0.806<\/p>\n<\/td>\n<td>\n<p>0.866<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>DTD<\/p>\n<\/td>\n<td>\n<p>0.690<\/p>\n<\/td>\n<td>\n<p>0.734<\/p>\n<\/td>\n<td>\n<p>0.711<\/p>\n<\/td>\n<td>\n<p>0.703<\/p>\n<\/td>\n<td>\n<p>0.731<\/p>\n<\/td>\n<td>\n<p>0.749 ?<\/p>\n<\/td>\n<td>\n<p>0.738<\/p>\n<\/td>\n<td>\n<p>0.770<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>MNIST<\/p>\n<\/td>\n<td>\n<p>0.963<\/p>\n<\/td>\n<td>\n<p>0.974\u00a0<\/p>\n<\/td>\n<td>\n<p>0.949<\/p>\n<\/td>\n<td>\n<p>0.965<\/p>\n<\/td>\n<td>\n<p>0.949<\/p>\n<\/td>\n<td>\n<p>0.971<\/p>\n<\/td>\n<td>\n<p>0.985 ?<\/p>\n<\/td>\n<td>\n<p>0.989<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>STL10<\/p>\n<\/td>\n<td>\n<p>0.957<\/p>\n<\/td>\n<td>\n<p>0.962<\/p>\n<\/td>\n<td>\n<p>0.973<\/p>\n<\/td>\n<td>\n<p>0.968<\/p>\n<\/td>\n<td>\n<p>0.981 ?<\/p>\n<\/td>\n<td>\n<p>0.974<\/p>\n<\/td>\n<td>\n<p>0.977<\/p>\n<\/td>\n<td>\n<p>0.982<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>PCam<\/p>\n<\/td>\n<td>\n<p>0.827<\/p>\n<\/td>\n<td>\n<p>0.823<\/p>\n<\/td>\n<td>\n<p>0.791<\/p>\n<\/td>\n<td>\n<p>0.835<\/p>\n<\/td>\n<td>\n<p>0.807<\/p>\n<\/td>\n<td>\n<p>0.846 ?<\/p>\n<\/td>\n<td>\n<p>0.833<\/p>\n<\/td>\n<td>\n<p>0.830<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>CLEVR<\/p>\n<\/td>\n<td>\n<p>0.356<\/p>\n<\/td>\n<td>\n<p>0.360<\/p>\n<\/td>\n<td>\n<p>0.358<\/p>\n<\/td>\n<td>\n<p>0.308<\/p>\n<\/td>\n<td>\n<p>0.318<\/p>\n<\/td>\n<td>\n<p>0.378\u00a0<\/p>\n<\/td>\n<td>\n<p>0.524 ?<\/p>\n<\/td>\n<td>\n<p>0.604<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>Rendered SST2<\/p>\n<\/td>\n<td>\n<p>0.603<\/p>\n<\/td>\n<td>\n<p>0.655<\/p>\n<\/td>\n<td>\n<p>0.651<\/p>\n<\/td>\n<td>\n<p>0.651<\/p>\n<\/td>\n<td>\n<p>0.637<\/p>\n<\/td>\n<td>\n<p>0.661 ?<\/p>\n<\/td>\n<td>\n<p>0.568<\/p>\n<\/td>\n<td>\n<p>0.606<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>FGVC Aircraft<\/p>\n<\/td>\n<td>\n<p>0.254<\/p>\n<\/td>\n<td>\n<p>0.312<\/p>\n<\/td>\n<td>\n<p>0.290<\/p>\n<\/td>\n<td>\n<p>0.283<\/p>\n<\/td>\n<td>\n<p>0.341<\/p>\n<\/td>\n<td>\n<p>0.362\u00a0<\/p>\n<\/td>\n<td>\n<p>0.500 ?<\/p>\n<\/td>\n<td>\n<p>0.604<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>Oxford Pets<\/p>\n<\/td>\n<td>\n<p>0.774<\/p>\n<\/td>\n<td>\n<p>0.820<\/p>\n<\/td>\n<td>\n<p>0.819<\/p>\n<\/td>\n<td>\n<p>0.730<\/p>\n<\/td>\n<td>\n<p>0.753<\/p>\n<\/td>\n<td>\n<p>0.856\u00a0<\/p>\n<\/td>\n<td>\n<p>0.895 ?<\/p>\n<\/td>\n<td>\n<p>0.931<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>Caltech101<\/p>\n<\/td>\n<td>\n<p>0.904<\/p>\n<\/td>\n<td>\n<p>0.917<\/p>\n<\/td>\n<td>\n<p>0.914<\/p>\n<\/td>\n<td>\n<p>0.922<\/p>\n<\/td>\n<td>\n<p>0.937 ?<\/p>\n<\/td>\n<td>\n<p>0.932<\/p>\n<\/td>\n<td>\n<p>0.937<\/p>\n<\/td>\n<td>\n<p>0.956<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p>HatefulMemes<\/p>\n<\/td>\n<td>\n<p>0.545<\/p>\n<\/td>\n<td>\n<p>0.568<\/p>\n<\/td>\n<td>\n<p>0.563<\/p>\n<\/td>\n<td>\n<p>0.581<\/p>\n<\/td>\n<td>\n<p>0.585\u00a0<\/p>\n<\/td>\n<td>\n<p>0.578<\/p>\n<\/td>\n<td>\n<p>0.638 ?<\/p>\n<\/td>\n<td>\n<p>0.645<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u0412 \u0434\u043e\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u0435 \u043c\u044b \u0435\u0449\u0435 \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u043b\u0438 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439. \u0417\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u0430 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043d\u0430\u0448\u0435\u0439 \u043b\u0443\u0447\u0448\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Large [vit-large-patch14-336] exclusive \u0431\u043b\u0438\u0436\u0435 \u0434\u0440\u0443\u0433\u0438\u0445 \u043a \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044e \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP (\u0440\u0438\u0441\u0443\u043d\u043e\u043a 8), \u0447\u0442\u043e \u0433\u043e\u0432\u043e\u0440\u0438\u0442 \u043e \u0445\u043e\u0440\u043e\u0448\u0435\u0439 \u043e\u0431\u043e\u0431\u0449\u0430\u044e\u0449\u0435\u0439 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u0438 \u043f\u0435\u0440\u0435\u0445\u043e\u0434\u0435 \u043e\u0442 zero-shot \u043a few-shot \u0437\u0430\u0434\u0430\u0447\u0435.<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"\/img\/image-loader.svg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 8 - \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f \u043c\u0435\u0442\u0440\u0438\u043a \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 8 - \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f \u043c\u0435\u0442\u0440\u0438\u043a \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439\" height=\"788\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/8c2\/e94\/95c\/8c2e9495c5454fced7bd6d75a933cef2.png\" data-width=\"811\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 8 &#8212; \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f \u043c\u0435\u0442\u0440\u0438\u043a \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0439<\/figcaption><\/figure>\n<h2>\u0427\u0442\u043e \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0432 \u0438\u0442\u043e\u0433\u0435?<\/h2>\n<p>\u041d\u0430\u043c \u0443\u0434\u0430\u043b\u043e\u0441\u044c \u043e\u0431\u0443\u0447\u0438\u0442\u044c \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0440\u0430\u0437\u043d\u044b\u0445 \u0432\u0435\u0440\u0441\u0438\u0439 ruCLIP, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0430 \u0440\u044f\u0434\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u043e\u0431\u043e\u0448\u043b\u0438 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0443\u044e \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c CLIP \u0441 \u0440\u0443\u0441\u0441\u043a\u043e-\u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u0438\u043c \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u043e\u043c. \u0412\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0441\u0442\u0440\u043e\u0438\u043b\u043e\u0441\u044c \u043d\u0430 \u0441\u0430\u043c\u043e\u0441\u0442\u043e\u044f\u0442\u0435\u043b\u044c\u043d\u043e \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0438\u0437 240 \u043c\u043b\u043d \u043f\u0430\u0440 \u0438 \u0437\u0430\u043d\u044f\u043b\u043e 12 \u0434\u043d\u0435\u0439 \u043d\u0430 256 Tesla GPU A100 \u0441\u0443\u043f\u0435\u0440\u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u0430 <a href=\"https:\/\/sbercloud.ru\/ru\/christofari-neo\">Christofari Neo<\/a>. \u041e\u0431\u0448\u0438\u0440\u043d\u044b\u0435 \u0438\u0441\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u044f \u043d\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u0438\u0437 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u0434\u043e\u043c\u0435\u043d\u043e\u0432 \u043f\u043e\u043a\u0430\u0437\u0430\u043b\u0438 \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u043c\u043e\u0441\u0442\u044c ruCLIP \u0432 \u0437\u0430\u0434\u0430\u0447\u0430\u0445 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438. \u042d\u0442\u043e \u0431\u0435\u0437\u0443\u0441\u043b\u043e\u0432\u043d\u043e \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0437\u0432\u0430\u0442\u044c \u0443\u0441\u043f\u0435\u0448\u043d\u044b\u043c \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u043e\u043c \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u0438\u0439 \u044f\u0437\u044b\u043a \u043c\u043e\u0434\u0435\u043b\u0438 CLIP (\u0435\u0449\u0435 \u043e\u0434\u0438\u043d \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u043d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 9).\u00a0<\/p>\n<p>\u0412 \u0437\u0430\u0434\u0430\u0447\u0430\u0445 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 \u0432\u0435\u0440\u0441\u0438\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u043f\u0440\u043e\u0438\u0433\u0440\u044b\u0432\u0430\u044e\u0442 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP \u0432 \u0441\u0432\u044f\u0437\u0438 \u0441 \u0442\u0435\u043c, \u0447\u0442\u043e \u0434\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u043c\u0435\u043d\u044c\u0448\u0435\u0433\u043e \u043e\u0431\u044a\u0435\u043c\u0430. \u0421\u043b\u0435\u0434\u0443\u0435\u0442 \u0442\u0430\u043a\u0436\u0435 \u043e\u0442\u043c\u0435\u0442\u0438\u0442\u044c \u0442\u0435\u043d\u0434\u0435\u043d\u0446\u0438\u044e \u043a \u0440\u043e\u0441\u0442\u0443 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0441 \u0440\u043e\u0441\u0442\u043e\u043c \u043e\u0431\u044a\u0435\u043c\u0430 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0432\u044b\u0431\u043e\u0440\u043e\u043a, \u0447\u0442\u043e \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442\u0441\u044f \u043f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432\u043e\u043c ALIGN \u0438 BASIC \u043d\u0430\u0434 CLIP \u0432\u0432\u0438\u0434\u0443 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0431\u043e\u043b\u044c\u0448\u0435\u0433\u043e \u043e\u0431\u044a\u0435\u043c\u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445.<\/p>\n<p>\u0423\u0441\u043f\u0435\u0448\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 ruCLIP \u0438 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u043e\u0441\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432 open source \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u0442 \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e \u0440\u0435\u0448\u0430\u0442\u044c \u043c\u043d\u043e\u0433\u0438\u0435 \u0437\u0430\u0434\u0430\u0447\u0438 \u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u043d\u043e\u0433\u043e \u0437\u0440\u0435\u043d\u0438\u044f \u0432 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u0430\u0445 \u0438 \u0441\u0435\u0440\u0432\u0438\u0441\u0430\u0445 \u0432 \u0440\u0435\u0436\u0438\u043c\u0435 \u00abzero-shot\u00bb, \u0442\u043e \u0435\u0441\u0442\u044c \u0431\u0435\u0437 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438 \u0434\u043e\u0440\u043e\u0433\u043e\u0441\u0442\u043e\u044f\u0449\u0435\u0433\u043e \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u041d\u0430\u043c \u0431\u044b \u043e\u0447\u0435\u043d\u044c \u0445\u043e\u0442\u0435\u043b\u043e\u0441\u044c, \u0447\u0442\u043e\u0431\u044b \u0432\u0441\u0435 \u0437\u0430\u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u0447\u0438\u0442\u0430\u0442\u0435\u043b\u0438 \u0437\u0430\u0433\u0440\u0443\u0437\u0438\u043b\u0438 \u0441\u0435\u0431\u0435 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438, \u043f\u043e\u0442\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u0438\u0445 \u0432 \u0440\u0435\u0436\u0438\u043c\u0435 zero-shot \u0438 \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0438\u043b\u0438 \u0441\u0432\u043e\u0438 \u0438\u0434\u0435\u0438 \u043f\u043e \u0434\u0430\u043b\u044c\u043d\u0435\u0439\u0448\u0435\u043c\u0443 \u0440\u0430\u0437\u0432\u0438\u0442\u0438\u044e\/\u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u044e \u043f\u0440\u043e\u0435\u043a\u0442\u0430. \u0412 \u0434\u043e\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u0435 \u043d\u0430 \u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0435 <a href=\"https:\/\/sbercloud.ru\/ru\/aicloud\/mlspace\/become-customer?product=mlspace-basic&amp;utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>SberCloud ML Space<\/u><\/a> \u0434\u043b\u044f \u043f\u0435\u0440\u0432\u044b\u0445 100 \u043a\u043b\u0438\u0435\u043d\u0442\u043e\u0432-\u044e\u0440\u0438\u0434\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u043b\u0438\u0446 \u0434\u043e\u0441\u0442\u0443\u043f\u0435\u043d \u0433\u0440\u0430\u043d\u0442 \u0432 180 000 \u0440\u0443\u0431. \u043d\u0430 \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0439 \u0434\u043e\u0441\u0442\u0443\u043f \u0438 \u0434\u043e\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0430 \u0432 \u043c\u043e\u0434\u0443\u043b\u0435 DataHub \u0440\u0430\u0437\u043c\u0435\u0449\u0435\u043d\u044b open source \u0438 \u044d\u043a\u0441\u043a\u043b\u044e\u0437\u0438\u0432\u043d\u044b\u0435 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP.<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w780q1\/getpro\/habr\/upload_files\/29b\/cc6\/307\/29bcc630797a7802debc2b79ec0a3271.jpg\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 9 - \u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP:  '\u0441\u043a\u0440\u0438\u043f\u043a\u0430': 0.68,  '\u0433\u0438\u0442\u0430\u0440\u0430': 0.40,  '\u043f\u0438\u0430\u043d\u0438\u043d\u043e': 0.32,  '\u0430\u043a\u043a\u043e\u0440\u0434\u0435\u043e\u043d': 0.26,  '\u0442\u0440\u0443\u0431\u0430': 0.28\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 9 - \u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP:  '\u0441\u043a\u0440\u0438\u043f\u043a\u0430': 0.68,  '\u0433\u0438\u0442\u0430\u0440\u0430': 0.40,  '\u043f\u0438\u0430\u043d\u0438\u043d\u043e': 0.32,  '\u0430\u043a\u043a\u043e\u0440\u0434\u0435\u043e\u043d': 0.26,  '\u0442\u0440\u0443\u0431\u0430': 0.28\" width=\"1920\" height=\"1247\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/29b\/cc6\/307\/29bcc630797a7802debc2b79ec0a3271.jpg\" data-blurred=\"true\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 9 &#8212; \u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP:  &#8216;\u0441\u043a\u0440\u0438\u043f\u043a\u0430&#8217;: 0.68,  &#8216;\u0433\u0438\u0442\u0430\u0440\u0430&#8217;: 0.40,  &#8216;\u043f\u0438\u0430\u043d\u0438\u043d\u043e&#8217;: 0.32,  &#8216;\u0430\u043a\u043a\u043e\u0440\u0434\u0435\u043e\u043d&#8217;: 0.26,  &#8216;\u0442\u0440\u0443\u0431\u0430&#8217;: 0.28<\/figcaption><\/figure>\n<p>\u041a\u043e\u043b\u043b\u0435\u043a\u0442\u0438\u0432 \u0430\u0432\u0442\u043e\u0440\u043e\u0432:    \u00a0<a class=\"mention\" href=\"\/users\/shonenkov\">@shonenkov<\/a><a class=\"mention\" href=\"\/users\/ddimitrov\">@ddimitrov<\/a><a class=\"mention\" href=\"\/users\/danyache\">@Danyache<\/a><a class=\"mention\" href=\"\/users\/nastyamittseva\">@NastyaMittseva<\/a><a class=\"mention\" href=\"\/users\/boomb0om\">@boomb0om<\/a><a class=\"mention\" href=\"\/users\/rybolos\">@Rybolos<\/a><a class=\"mention\" href=\"\/users\/king_menin\">@king_menin<\/a><a class=\"mention\" href=\"\/users\/oulenspiegel\">@oulenspiegel<\/a><a class=\"mention\" href=\"\/users\/gugutse\">@Gugutse<\/a><a class=\"mention\" href=\"\/users\/achertok\">@achertok<\/a><\/p>\n<\/div>\n<\/div>\n<\/div>\n<div class=\"v-portal\" style=\"display:none;\"><\/div>\n<\/div>\n<p> <!----> <!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/company\/sberbank\/blog\/646447\/\"> https:\/\/habr.com\/ru\/company\/sberbank\/blog\/646447\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u0412 \u200b2021 \u0433\u043e\u0434\u0443 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0430\u043a\u0442\u0438\u0432\u043d\u043e \u0440\u0430\u0437\u0432\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u044f\u0437\u044b\u043a\u043e\u0432\u044b\u0435 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b, \u0447\u0442\u043e \u043f\u0440\u0438\u0432\u0435\u043b\u043e \u043a \u043f\u043e\u044f\u0432\u043b\u0435\u043d\u0438\u044e \u043d\u043e\u0432\u044b\u0445 \u0440\u0430\u0437\u0440\u0430\u0431\u043e\u0442\u043e\u043a \u0432 \u0441\u0444\u0435\u0440\u0435 \u043c\u0443\u043b\u044c\u0442\u0438\u043c\u043e\u0434\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u042f\u0440\u043a\u0438\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u043c \u0441\u0442\u0430\u043b\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0441\u0438\u043d\u0442\u0435\u0437\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u043f\u043e \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u043c \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u044f\u043c <a href=\"https:\/\/openai.com\/blog\/dall-e\/\"><u>DALL-E<\/u><\/a> \u043e\u0442 OpenAI. \u041a\u043e\u043c\u0430\u043d\u0434\u044b \u0421\u0431\u0435\u0440\u0430 &#8212; Sber AI \u0438 SberDevices &#8212; \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u0432\u043e\u0440\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u044d\u0442\u0443 \u0433\u043e\u043d\u043a\u0443 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0438 \u043e\u0431\u0443\u0447\u0438\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u0438: <a href=\"https:\/\/habr.com\/ru\/company\/sberbank\/blog\/586926\/\"><u>ruDALL-E XL<\/u><\/a>, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 \u043d\u0430 <a href=\"https:\/\/github.com\/sberbank-ai\/ru-dalle\"><u>GitHub<\/u><\/a>, \u044d\u043a\u0441\u043a\u043b\u044e\u0437\u0438\u0432\u043d\u0443\u044e ruDALL-E XXL (\u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 \u0432 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud ML Space<\/u><\/a>), <a href=\"https:\/\/arxiv.org\/pdf\/2112.02448.pdf\"><u>ruDALL-E Emojich<\/u><\/a> \u0434\u043b\u044f \u0441\u0438\u043d\u0442\u0435\u0437\u0430 \u044d\u043c\u043e\u0434\u0436\u0438, \u043f\u0435\u0440\u0432\u0443\u044e \u0432\u0435\u0440\u0441\u0438\u044e \u043c\u0443\u043b\u044c\u0442\u0438\u043c\u043e\u0434\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u0443\u043b\u044c\u0442\u0438\u0442\u0430\u0441\u043a \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u044b <a href=\"https:\/\/github.com\/sberbank-ai\/fusion_brain_aij2021\"><u>Fusion Brain<\/u><\/a>, \u0430 \u0441 \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u0435\u043c \u043f\u043e\u043d\u044f\u0442\u0438\u044f \u0433\u0438\u043f\u0435\u0440\u043c\u043e\u0434\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0441\u043e\u0437\u0434\u0430\u043b\u0438 \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c <a href=\"https:\/\/github.com\/sberbank-ai\/ru-dolph\"><u>ruDOLPH<\/u><\/a> (\u043f\u0440\u043e \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0441\u0441\u043a\u0430\u0436\u0435\u043c \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u0435\u0435 \u0432 \u043e\u0434\u043d\u043e\u0439 \u0438\u0437 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0445 \u0441\u0442\u0430\u0442\u0435\u0439).<\/p>\n<p>\u041c\u044b \u0442\u0430\u043a\u0436\u0435 \u043d\u0435 \u043c\u043e\u0433\u043b\u0438 \u043e\u0431\u043e\u0439\u0442\u0438 \u0441\u0442\u043e\u0440\u043e\u043d\u043e\u0439 \u0434\u0440\u0443\u0433\u043e\u0435 \u043f\u043e\u043b\u0435\u0437\u043d\u043e\u0435 \u043f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u0435 \u044f\u0437\u044b\u043a\u043e\u0432\u044b\u0445 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0445 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432, \u2013 \u043c\u043e\u0434\u0435\u043b\u044c <a href=\"https:\/\/openai.com\/blog\/clip\/\"><u>CLIP<\/u><\/a> \u043e\u0442 OpenAI, \u0437\u0430\u0434\u0430\u0447\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u0439 \u2013 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u044f\u0442\u044c \u201c\u0441\u043c\u044b\u0441\u043b\u043e\u0432\u0443\u044e\u201d \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432 \u043d\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u043c (\u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u043e\u043c) \u044f\u0437\u044b\u043a\u0435 \u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439. \u0423\u0441\u043f\u0435\u0448\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u043a\u043e\u043c\u0430\u043d\u0434\u043e\u0439 OpenAI \u0443\u0436\u0435 \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u0441 \u0443\u0432\u0435\u0440\u0435\u043d\u043d\u043e\u0441\u0442\u044c\u044e \u0433\u043e\u0432\u043e\u0440\u0438\u0442\u044c \u043e \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0442\u0430\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447 \u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u043d\u043e\u0433\u043e \u0437\u0440\u0435\u043d\u0438\u044f, \u043a\u0430\u043a, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044f \u0438\u043b\u0438 zero-shot \u0434\u0435\u0442\u0435\u043a\u0446\u0438\u044f \u043e\u0431\u044a\u0435\u043a\u0442\u043e\u0432. \u0412 \u0438\u0442\u043e\u0433\u0435 \u043c\u044b \u043f\u043e\u0441\u0442\u0430\u0432\u0438\u043b\u0438 \u043f\u0435\u0440\u0435\u0434 \u0441\u043e\u0431\u043e\u0439 \u0446\u0435\u043b\u044c \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u201c\u0440\u0443\u0441\u0438\u0444\u0438\u0446\u0438\u0440\u043e\u0432\u0430\u0442\u044c\u201d CLIP, \u0447\u0442\u043e\u0431\u044b \u043c\u043e\u0434\u0435\u043b\u044c \u043c\u043e\u0436\u043d\u043e \u0431\u044b\u043b\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e \u043d\u0430 \u0440\u0443\u0441\u0441\u043a\u043e\u043c \u044f\u0437\u044b\u043a\u0435 \u0438 \u043e\u0431\u0445\u043e\u0434\u0438\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u043e\u0432 \u0432 \u0441\u0432\u044f\u0437\u043a\u0435 \u0441 \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u044c\u044e CLIP. \u041f\u0435\u0440\u0432\u044b\u0435 \u0448\u0430\u0433\u0438 \u0432 \u044d\u0442\u043e\u043c \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0438 \u0431\u044b\u043b\u0438 \u0441\u0434\u0435\u043b\u0430\u043d\u044b \u043d\u0430\u043c\u0438 \u0435\u0449\u0451 \u0432 \u043d\u0430\u0447\u0430\u043b\u0435 2021 \u0433\u043e\u0434\u0430 &#8212; \u0442\u043e\u0433\u0434\u0430 \u043c\u044b \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u044f\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u044c <a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"><u>ruCLIP Small<\/u><\/a> (Russian Contrastive Language \u2013 Image Pre-training). \u0421\u0435\u0439\u0447\u0430\u0441\u00a0 \u0436\u0435 \u043c\u044b \u0445\u043e\u0442\u0438\u043c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u0442\u044c \u043e\u0431 \u0435\u0449\u0451 6 \u0432\u0435\u0440\u0441\u0438\u044f\u0445 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043c\u044b \u043e\u0431\u0443\u0447\u0438\u043b\u0438 \u0437\u0430 \u044d\u0442\u043e \u0432\u0440\u0435\u043c\u044f (<em>\u0434\u043b\u044f \u0431\u043e\u043b\u0435\u0435 \u0434\u0435\u0442\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u043f\u043e\u0433\u0440\u0443\u0436\u0435\u043d\u0438\u044f \u0432 \u0442\u0435\u0440\u043c\u0438\u043d\u043e\u043b\u043e\u0433\u0438\u044e \u0438 \u0441\u0443\u0442\u044c \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0441\u043e\u0432\u0435\u0442\u0443\u0435\u043c \u043f\u0435\u0440\u0435\u0447\u0438\u0442\u0430\u0442\u044c \u043d\u0430\u0448\u0443 \u043f\u0440\u043e\u0448\u043b\u0443\u044e \u0441\u0442\u0430\u0442\u044c\u044e \u043f\u043e <\/em><a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"><em><u>ruCLIP Small<\/u><\/em><\/a>).<\/p>\n<p>\u0412 \u0440\u0435\u043b\u0438\u0437 \u0432\u043e\u0448\u043b\u0438 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0432\u0435\u0440\u0441\u0438\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043e\u0442\u043b\u0438\u0447\u0430\u044e\u0442\u0441\u044f \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u0441\u043b\u043e\u0435\u0432 \u044d\u043d\u043a\u043e\u0434\u0435\u0440\u0430 ViT, \u0440\u0430\u0437\u043c\u0435\u0440\u043e\u043c \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u043d\u043e\u0433\u043e \u043f\u0430\u0442\u0447\u0430 (14\u00d714, 16\u00d716, 32\u00d732) \u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u0430\u043c\u0438 \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u2014 224\u00d7224, 336\u00d7336 \u0438 384\u00d7384 \u043f\u0438\u043a\u0441\u0435\u043b\u044f, \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0435\u043d\u043d\u043e. \u0421\u0435\u043c\u0430\u043d\u0442\u0438\u043a\u0430 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c:<\/p>\n<ul>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-base-patch16-224\"><u>ruCLIP Base [vit-base-patch16-224]<\/u><\/a><\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-base-patch32-224\"><u>ruCLIP Base [vit-base-patch32-224]<\/u><\/a><\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-base-patch32-384\"><u>ruCLIP Base [vit-base-patch32-384]<\/u><\/a>\u00a0<\/p>\n<\/li>\n<li>\n<p><a href=\"https:\/\/huggingface.co\/sberbank-ai\/ruclip-vit-large-patch14-224\"><u>ruCLIP Large [vit-large-patch14-224]<\/u><\/a><\/p>\n<\/li>\n<li>\n<p>ruCLIP Base [vit-base-patch16-384] exclusive \u2601\ufe0f<a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-base-exclusive?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud only<\/u><\/a> \ufe0f\u00a0<\/p>\n<\/li>\n<li>\n<p>ruCLIP Large [vit-large-patch14-336] exclusive \u2601\ufe0f<a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-large-exclusive?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud only<\/u><\/a><\/p>\n<\/li>\n<\/ul>\n<p>\u041f\u0435\u0440\u0432\u044b\u0435 4 \u043c\u043e\u0434\u0435\u043b\u0438 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u044b \u0434\u043b\u044f \u043e\u0442\u043a\u0440\u044b\u0442\u043e\u0433\u043e \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u043d\u0430 <a href=\"https:\/\/github.com\/sberbank-ai\/ru-clip\"><u>GitHub<\/u><\/a>, \u0434\u0432\u0435 \u0438\u0437 \u043d\u0438\u0445 &#8212; \u0432 \u0445\u0430\u0431\u0435 \u043f\u0440\u0435\u0434\u043e\u0431\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0438 \u043a\u043e\u043d\u0442\u0435\u0439\u043d\u0435\u0440\u043e\u0432 \u2013 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>DataHub SberCloud ML Space<\/u><\/a>, \u0430 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0435 \u0434\u0432\u0435, \u2013 \u0441\u0430\u043c\u044b\u0435 \u0431\u043e\u043b\u044c\u0448\u0438\u0435 \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0447\u0430\u0442\u044c \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0435\u0440\u0435\u0437 DataHub.<\/p>\n<p>\u0412\u0441\u0435 \u043d\u043e\u0432\u044b\u0435 \u0432\u0435\u0440\u0441\u0438\u0438 ruCLIP \u0431\u044b\u043b\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u044b \u043d\u0430 \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u0420\u0443\u043d\u0435\u0442\u0430, \u0430 \u0442\u0430\u043a\u0436\u0435 \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u044d\u043a\u043e\u0441\u0438\u0441\u0442\u0435\u043c\u044b \u0421\u0431\u0435\u0440\u0430. \u0412\u0441\u0435\u0433\u043e \u0443\u0434\u0430\u043b\u043e\u0441\u044c \u0441\u043e\u0431\u0440\u0430\u0442\u044c \u043e\u043a\u043e\u043b\u043e 240 \u043c\u043b\u043d \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0445 \u043f\u0430\u0440 \u201c\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435-\u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u043d\u0430 \u0435\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u043c \u044f\u0437\u044b\u043a\u0435\u201d. \u041c\u043e\u0434\u0435\u043b\u044c \u043c\u044b \u043e\u0431\u0443\u0447\u0430\u043b\u0438 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 12 \u0434\u043d\u0435\u0439 \u043d\u0430 \u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0435 <a href=\"https:\/\/sbercloud.ru\/ru\/aicloud\/mlspace?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\"><u>SberCloud ML Space<\/u><\/a> \u0438 \u0441\u0443\u043f\u0435\u0440\u043a\u043e\u043c\u043f\u044c\u044e\u0442\u0435\u0440\u0435 <a href=\"https:\/\/sbercloud.ru\/ru\/christofari-neo?utm_source=habr&amp;utm_medium=article&amp;utm_campaign=habr_sber_ruclip_mlspace\">Christofari Neo<\/a>, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 256 GPU Tesla A100, \u0447\u0442\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043f\u0440\u0435\u0432\u043e\u0441\u0445\u043e\u0434\u0438\u0442 \u0440\u0435\u0441\u0443\u0440\u0441\u044b, \u0437\u0430\u0442\u0440\u0430\u0447\u0435\u043d\u043d\u044b\u0435 \u0432 \u0445\u043e\u0434\u0435<a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"> <u>\u043f\u0435\u0440\u0432\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP Small<\/u><\/a>. \u0412\u0430\u0436\u043d\u043e \u043f\u043e\u0434\u0447\u0435\u0440\u043a\u043d\u0443\u0442\u044c, \u0447\u0442\u043e \u0432 \u043d\u043e\u0432\u044b\u0445 \u0432\u0435\u0440\u0441\u0438\u044f\u0445 \u043f\u0440\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0431\u0430\u0442\u0447 \u0440\u0430\u0437\u043c\u0435\u0440\u0430 32768, \u0447\u0442\u043e \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u0435\u0442 \u0442\u043e\u043c\u0443, \u043a\u0430\u043a \u043e\u0431\u0443\u0447\u0430\u043b\u0430\u0441\u044c \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c CLIP (\u0432 \u0432\u0435\u0440\u0441\u0438\u0438 ruCLIP Small \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430 \u0431\u044b\u043b \u0440\u0430\u0432\u0435\u043d 16).<\/p>\n<p>\u0412 \u043e\u0441\u043d\u043e\u0432\u0435 \u043d\u043e\u0432\u044b\u0445 \u0432\u0435\u0440\u0441\u0438\u0439 ruCLIP \u043f\u043e-\u043f\u0440\u0435\u0436\u043d\u0435\u043c\u0443 \u043b\u0435\u0436\u0430\u0442 \u0434\u0432\u0435 \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0449\u0438\u0435:<\/p>\n<ol>\n<li>\n<p>Image Encoder \u2014 \u044d\u043d\u043a\u043e\u0434\u0435\u0440, \u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044e\u0449\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439. \u0412 \u043e\u0441\u043d\u043e\u0432\u0435 \u043d\u0430\u0448\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u043e\u0441\u0442\u0430\u043b\u0441\u044f \u0445\u043e\u0440\u043e\u0448\u043e \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u044b\u0439 ViT.<\/p>\n<\/li>\n<li>\n<p>Text Encoder \u2014 \u044d\u043d\u043a\u043e\u0434\u0435\u0440, \u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044e\u0449\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Small, \u043c\u044b \u043d\u0435 \u0441\u0442\u0430\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c RuGPT3Small, \u0430 \u0432\u0437\u044f\u043b\u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0439 \u044d\u043d\u043a\u043e\u0434\u0435\u0440 &#8212; \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0441\u043e \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438:<\/p>\n<\/li>\n<\/ol>\n<ul>\n<li>\n<p>\u0434\u043b\u044f Base \u0432\u0435\u0440\u0441\u0438\u0439<\/p>\n<ul>\n<li>\n<p>Context Length: 77<\/p>\n<\/li>\n<li>\n<p>Transformer Layers: 12<\/p>\n<\/li>\n<li>\n<p>Transformer Width: 512<\/p>\n<\/li>\n<li>\n<p>Transformer Heads: 8<\/p>\n<\/li>\n<\/ul>\n<\/li>\n<li>\n<p>\u0434\u043b\u044f Large \u0432\u0435\u0440\u0441\u0438\u0439<\/p>\n<ul>\n<li>\n<p>Context Length: 77<\/p>\n<\/li>\n<li>\n<p>Transformer Layers: 12<\/p>\n<\/li>\n<li>\n<p>Transformer Width: 768<\/p>\n<\/li>\n<li>\n<p>Transformer Heads: 12<\/p>\n<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<h2>\u0414\u0430\u043d\u043d\u044b\u0435<\/h2>\n<p>\u041a\u0430\u043a \u043c\u044b \u0443\u0436\u0435 \u0443\u043f\u043e\u043c\u0438\u043d\u0430\u043b\u0438 \u0440\u0430\u043d\u0435\u0435, \u0434\u043b\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0438\u0439 \u0438\u0437 240\u041c \u043f\u0430\u0440 \u201c\u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435-\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435\u201d \u0438 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0449\u0438\u0439 \u0438\u0437 \u0441\u0435\u0431\u044f \u0440\u0430\u0441\u0448\u0438\u0440\u0435\u043d\u043d\u0443\u044e \u0432\u0435\u0440\u0441\u0438\u044e \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0435\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 ruDALL-E. \u0421\u043b\u0435\u0434\u0443\u0435\u0442 \u043e\u0442\u043c\u0435\u0442\u0438\u0442\u044c, \u0447\u0442\u043e \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043e\u0434\u043d\u0438\u043c \u0438\u0437 \u0441\u0430\u043c\u044b\u0445 \u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u0440\u0443\u0441\u0441\u043a\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0441\u043e\u0434\u0435\u0440\u0436\u0430\u0449\u0438\u0445 \u043f\u0430\u0440\u044b \u201c\u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435-\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435\u201d, \u043d\u043e \u043d\u0430 \u0444\u043e\u043d\u0435 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u0430\u043d\u0433\u043b\u043e\u044f\u0437\u044b\u0447\u043d\u044b\u0445 \u043a\u043e\u043d\u043a\u0443\u0440\u0435\u043d\u0442\u043e\u0432 \u043d\u0430\u0448 \u0441\u0435\u0442 \u0434\u0430\u043b\u0435\u043a \u043f\u043e \u043e\u0431\u044a\u0451\u043c\u0443 \u043e\u0442 \u043b\u0438\u0434\u0435\u0440\u043e\u0432 \u0441\u043f\u0438\u0441\u043a\u0430, \u0447\u0442\u043e \u043c\u043e\u0436\u043d\u043e \u0432\u0438\u0434\u0435\u0442\u044c \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 1.<\/p>\n<p>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1 &#8212; \u0421\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u043e\u0431\u044a\u0435\u043c\u043e\u0432 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0432\u044b\u0431\u043e\u0440\u043e\u043a \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"144\" width=\"144\">\n<p><strong>\u041c\u043e\u0434\u0435\u043b\u044c<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"105\" width=\"105\">\n<p><a href=\"https:\/\/habr.com\/ru\/company\/sberdevices\/blog\/564440\/\"><u>ruCLIP Small<\/u><\/a><\/p>\n<\/td>\n<td>\n<p>ruCLIP<\/p>\n<\/td>\n<td>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2103.00020.pdf\"><u>CLIP<\/u><\/a>\u00a0<\/p>\n<\/td>\n<td>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2102.05918.pdf\"><u>ALIGN<\/u><\/a><\/p>\n<\/td>\n<td>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2111.10050.pdf\"><u>BASIC\u00a0<\/u><\/a><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"144\" width=\"144\">\n<p><strong>\u041a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0430\u0440<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"105\" width=\"105\">\n<p>3M<\/p>\n<\/td>\n<td>\n<p>240M<\/p>\n<\/td>\n<td>\n<p>400M<\/p>\n<\/td>\n<td>\n<p>1.8B<\/p>\n<\/td>\n<td>\n<p>6.6B<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041b\u0438\u0434\u0435\u0440\u0441\u0442\u0432\u043e \u043f\u043e \u043e\u0431\u044a\u0435\u043c\u0430\u043c \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0438\u043d\u0430\u0434\u043b\u0435\u0436\u0438\u0442 Google \u0441 \u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 ALIGN \u0438 BASIC. \u0412 \u043f\u0435\u0440\u0432\u043e\u0439 \u0438\u0437 \u043d\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0435 \u0441\u043e\u0431\u0440\u0430\u043d\u044b \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 Conceptual Captions \u0441 \u0443\u043f\u0440\u043e\u0449\u0451\u043d\u043d\u043e\u0439 \u0444\u0438\u043b\u044c\u0442\u0440\u0430\u0446\u0438\u0435\u0439 \u0434\u0430\u043d\u043d\u044b\u0445. \u0412\u043e \u0432\u0442\u043e\u0440\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u0434\u043b\u044f ALIGN \u0434\u043e\u043f\u043e\u043b\u043d\u044f\u0435\u0442\u0441\u044f \u043f\u0440\u0438\u0432\u0430\u0442\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c JFT-3B.<\/p>\n<h2>\u041e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f<\/h2>\n<p>\u041f\u0440\u043e\u0446\u0435\u0441\u0441 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0431\u044b\u043b \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u0439, \u0438 \u043e \u0435\u0433\u043e \u044d\u0442\u0430\u043f\u0430\u0445 \u0445\u043e\u0447\u0435\u0442\u0441\u044f \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u0442\u044c \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u0435\u0435. \u041d\u0430\u0447\u043d\u0435\u043c \u0441 \u043c\u043e\u0434\u0435\u043b\u0438, \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u043e\u0439 \u043d\u0430 ViT-Large. \u041d\u0430 \u043f\u0435\u0440\u0432\u043e\u043c \u044d\u0442\u0430\u043f\u0435 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u043b\u043e\u0441\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 <em>ruCLIP Large [vit-large-patch14-224]<\/em> \u0441 \u043d\u0443\u043b\u044f \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0441\u043e\u0431\u0440\u0430\u043d\u043d\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u044d\u0442\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432\u044b\u043f\u043e\u043b\u043d\u044f\u043b\u043e\u0441\u044c \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 380\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439. \u0414\u0430\u043b\u0435\u0435, \u0438\u0437\u043c\u0435\u043d\u0438\u0432 \u0440\u0430\u0437\u043c\u0435\u0440 \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u043f\u0440\u043e\u0432\u0435\u0434\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 \u0435\u0449\u0435 15\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439 \u0431\u044b\u043b\u0430 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0430 \u043c\u043e\u0434\u0435\u043b\u044c <em>ruCLIP Large [vit-large-patch14-336] exclusive<\/em>. \u0427\u0442\u043e \u043a\u0430\u0441\u0430\u0435\u0442\u0441\u044f ViT-Base \u0432\u0435\u0440\u0441\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438, \u0442\u043e \u043e\u043d\u0438 \u043e\u0431\u0443\u0447\u0430\u043b\u0438\u0441\u044c \u043f\u0443\u0442\u0435\u043c \u0442\u044e\u043d\u0438\u043d\u0433\u0430 \u0430\u043d\u0433\u043b\u0438\u0439\u0441\u043a\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 140\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439. \u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u0431\u044b\u043b\u0438 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u044b \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Base [vit-base-patch16-224]<\/em> \u0438 <em>ruCLIP Base [vit-base-patch32-224]<\/em>. \u0418\u0437\u043c\u0435\u043d\u0438\u0432 \u0440\u0430\u0437\u043c\u0435\u0440 \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0434\u043e 384 \u0438 \u0432\u044b\u043f\u043e\u043b\u043d\u0438\u0432 \u0442\u044e\u043d\u0438\u043d\u0433 \u0432 \u0442\u0435\u0447\u0435\u043d\u0438\u0435 \u0435\u0449\u0435 20\u041a \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0439 \u0431\u044b\u043b\u0438 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u044b \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Base [vit-base-patch32-384]<\/em> \u0438 <em>ruCLIP Base [vit-base-patch16-384] exclusive<\/em>.<\/p>\n<p>\u041d\u0430\u0433\u043b\u044f\u0434\u043d\u043e \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d \u043d\u0438\u0436\u0435 \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a\u0430\u0445 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 loss (\u0440\u0438\u0441\u0443\u043d\u043e\u043a 1). \u0422\u0430\u043a\u0436\u0435 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u0430 \u043c\u0435\u0442\u043e\u0434\u0438\u043a\u0430 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 learning rate.<\/p>\n<figure class=\"full-width\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1 &#8212; \u0413\u0440\u0430\u0444\u0438\u043a\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f loss \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f (\u043b\u0435\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0438 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0432\u0430\u0440\u044c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f learning rate (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u0434\u043b\u044f 6 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP<\/figcaption><\/figure>\n<p>\u041d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 2 \u043f\u043e\u043a\u0430\u0437\u0430\u043d \u0433\u0440\u0430\u0444\u0438\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f accuracy \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Large [vit-large-patch14-224].<\/p>\n<figure class=\"\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2 &#8212; \u0413\u0440\u0430\u0444\u0438\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0441\u0440\u0435\u0434\u043d\u0435\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f accuracy \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f ruCLIP Large [vit-large-patch14-224]<\/figcaption><\/figure>\n<h2>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b<\/h2>\n<p>\u0414\u043b\u044f \u0437\u0430\u043f\u0443\u0441\u043a\u0430 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0436\u0438\u0437\u043d\u0435\u0440\u0430\u0434\u043e\u0441\u0442\u043d\u043e\u0433\u043e <a href=\"https:\/\/ichef.bbci.co.uk\/news\/640\/cpsprodpb\/475B\/production\/_98776281_gettyimages-521697453.jpg\"><u>\u0449\u0435\u043d\u043e\u0447\u043a\u0430<\/u><\/a> (\u0440\u0438\u0441\u0443\u043d\u043e\u043a 3) \u0438 \u0437\u0430\u043a\u0438\u043d\u0435\u043c \u0435\u0433\u043e \u0432 \u043a\u043e\u0434 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043d\u0430\u0448\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438, \u0437\u0430\u0440\u0430\u043d\u0435\u0435 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0432 \u043d\u0430\u0431\u043e\u0440 \u043a\u043b\u0430\u0441\u0441\u043e\u0432 \u0434\u043b\u044f zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438.<\/p>\n<figure class=\"full-width\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3 &#8212; \u0412\u0435\u0441\u0435\u043b\u044b\u0439 \u0449\u0435\u043d\u043e\u0447\u0435\u043a<\/figcaption><\/figure>\n<pre><code>import ruclip import torch import requests from PIL import Image from io import BytesIO   url_dog = \"https:\/\/ichef.bbci.co.uk\/news\/640\/cpsprodpb\/475B\/production\/_98776281_gettyimages-521697453.jpg\" response = requests.get(url_dog) image = Image.open(BytesIO(response.content))   device = 'cuda' clip, processor = ruclip.load('ruclip-vit-base-patch32-384', device=device) classes = ['\u043a\u043e\u0448\u043a\u0430', '\u0441\u043e\u0431\u0430\u0447\u043a\u0430', '\u043c\u044b\u0448\u043a\u0430', '\u043c\u0430\u0448\u0438\u043d\u0430', '\u0441\u0442\u043e\u043b', '\u0434\u043e\u043c', '\u0436\u0438\u0434\u043a\u043e\u0441\u0442\u044c'] predictor = ruclip.Predictor(clip, processor, device, bs=8)   with torch.no_grad():     text_latents = predictor.get_text_latents(classes)     pred_labels = predictor.run([image], text_latents)   print(f'\u041d\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0438 {classes[pred_labels[0]]}')  -------------------------------------------------- \u041d\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0438 \u0441\u043e\u0431\u0430\u0447\u043a\u0430<\/code><\/pre>\n<p>\u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438, \u0447\u0442\u043e \u0441 \u0431\u043b\u0438\u0437\u043a\u043e\u0439 \u043a \u043d\u0430\u0438\u0431\u043e\u043b\u044c\u0448\u0435\u0439 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c\u044e \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0431\u044b\u043b\u043e \u043e\u0442\u043d\u0435\u0441\u0435\u043d\u043e \u043a \u043a\u043b\u0430\u0441\u0441\u0443 \u201c\u0441\u043e\u0431\u0430\u0447\u043a\u0430\u201d, \u0447\u0442\u043e \u043d\u0435 \u043c\u043e\u0436\u0435\u0442 \u043d\u0435 \u0440\u0430\u0434\u043e\u0432\u0430\u0442\u044c. \u0414\u0430\u043b\u044c\u0448\u0435 \u043c\u044b \u043f\u043e\u043a\u0430\u0436\u0435\u043c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0440\u0430\u0431\u043e\u0442\u044b \u043d\u0430\u0448\u0435\u0439 \u0441\u0430\u043c\u043e\u0439 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Large [vit-large-patch14-224]<\/em> \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 \u0440\u0430\u0437\u043d\u044b\u0445 \u0434\u043e\u043c\u0435\u043d\u043e\u0432 \u0438 \u043f\u0440\u043e\u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u0435\u043c \u0435\u0435 \u0436\u0438\u0437\u043d\u0435\u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044c \u0432 \u0437\u0430\u0434\u0430\u0447\u0430\u0445 zero-shot \u0438 few-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438.<\/p>\n<p>\u0412 \u0441\u043b\u0443\u0447\u0430\u0435, \u0435\u0441\u043b\u0438 \u0437\u0430\u0445\u043e\u0447\u0435\u0442\u0441\u044f \u0432\u043e\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u044d\u043a\u0441\u043a\u043b\u044e\u0437\u0438\u0432\u043d\u044b\u043c\u0438 \u0432\u0435\u0440\u0441\u0438\u044f\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u0438\u0437 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\">DataHub SberCloud ML Space<\/a>, \u0442\u043e \u0441 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u044f\u043c\u0438 \u043c\u043e\u0436\u043d\u043e \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u043f\u043e \u0441\u0441\u044b\u043b\u043a\u0430\u043c <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-base-exclusive\">ruCLIP Base [vit-base-patch16-384] exclusive<\/a><em> <\/em>\u0438 <a href=\"https:\/\/sbercloud.ru\/ru\/datahub\/rugpt3family\/ruclip-large-exclusive\">ruCLIP Large [vit-large-patch14-336] exclusive<\/a><em>.<\/em><\/p>\n<h2>\u041e\u0446\u0435\u043d\u043a\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430. \u0421\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0435\u0439\u00a0<\/h2>\n<p>\u0412 \u0445\u043e\u0434\u0435 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432 \u043c\u044b \u043f\u0440\u0435\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043b\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0446\u0435\u043b\u0435\u0439. \u041f\u0435\u0440\u0432\u0430\u044f \u2013 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0445\u043e\u0440\u043e\u0448\u0438 \u0440\u0430\u0437\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u043d\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u043e\u0439 \u043f\u0440\u0438\u0440\u043e\u0434\u044b, \u0430 \u0432\u0442\u043e\u0440\u0430\u044f \u2013 \u0441\u0440\u0430\u0432\u043d\u0438\u0442\u044c \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u043d\u0430\u0448\u0435\u0433\u043e \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u043a\u043e\u043c\u0431\u0438\u043d\u0430\u0446\u0438\u0438 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u0430 <a href=\"https:\/\/huggingface.co\/Helsinki-NLP\/opus-mt-ru-en\"><u>OPUS-MT<\/u><\/a> ru-en \u0438 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP. \u0426\u0438\u0444\u0440\u044b \u043d\u0438\u0436\u0435 \u0432\u0441\u0435 \u0441\u043a\u0430\u0436\u0443\u0442 \u0437\u0430 \u0441\u0435\u0431\u044f.<\/p>\n<h3>\u041f\u0440\u043e \u043c\u0435\u0442\u0440\u0438\u043a\u0438<\/h3>\n<p>\u0412 \u043f\u0435\u0440\u0432\u0443\u044e \u043e\u0447\u0435\u0440\u0435\u0434\u044c \u043e\u0446\u0435\u043d\u043a\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u043c\u043e\u0434\u0435\u043b\u0438 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u0441\u044f \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u0439 \u043a\u043e\u0441\u0438\u043d\u0443\u0441\u043d\u043e\u0439 \u043c\u0435\u0442\u0440\u0438\u043a\u0438. \u0422\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044e\u0442\u0441\u044f \u0432 \u0441\u0432\u043e\u0438 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438, \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f &#8212; \u0432 \u0441\u0432\u043e\u0438, \u0434\u0430\u043b\u0435\u0435 \u0441\u0447\u0438\u0442\u0430\u0435\u043c \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0438 \u0432\u044b\u0431\u0438\u0440\u0430\u0435\u043c \u043b\u0443\u0447\u0448\u0443\u044e \u043f\u0430\u0440\u0443.<\/p>\n<p>\u0414\u043b\u044f \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0430\u0446\u0438\u0438 \u0441\u043d\u043e\u0432\u0430 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0442\u0435 \u0436\u0435 \u0441\u0430\u043c\u044b\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u043d\u043e\u0443\u0442\u0431\u0443\u043a\u0435 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP \u0438 \u0432 \u0441\u0442\u0430\u0442\u044c\u0435 \u043f\u0440\u043e <em>ruCLIP Small<\/em>. \u0421\u0440\u0435\u0434\u0438 \u043d\u0430\u0448\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0441\u0430\u043c\u0443\u044e \u0431\u043e\u043b\u044c\u0448\u0443\u044e \u043e\u0442\u043a\u0440\u044b\u0442\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c <em>ruCLIP Large [vit-large-patch14-224]<\/em> \u0438 \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043c \u0435\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e. \u041a\u043e\u0441\u0438\u043d\u0443\u0441\u043d\u0430\u044f \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u043c\u0435\u0436\u0434\u0443 \u0442\u0435\u043a\u0441\u0442\u0430\u043c\u0438 \u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f\u043c\u0438 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 <em>ruCLIP Large [vit-large-patch14-224] <\/em>\u0442\u0430\u043a\u0436\u0435 \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u0430 \u043d\u0438\u0436\u0435 \u043d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 4.<\/p>\n<figure class=\"full-width\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4 &#8212; \u041c\u0430\u0442\u0440\u0438\u0446\u0430 \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439<\/figcaption><\/figure>\n<p>\u041f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u044f \u0442\u043e\u043f 5 \u043a\u043b\u0430\u0441\u0441\u043e\u0432 \u0434\u043b\u044f \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e <em>ruCLIP Large \u00a0[vit-large-patch14-224]<\/em> \u043f\u043e\u043a\u0430\u0437\u0430\u043d\u044b \u043d\u0430 \u0440\u0438\u0441\u0443\u043d\u043a\u0435 5.<\/p>\n<figure class=\"full-width\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5 &#8212; \u0411\u043b\u0438\u0437\u043e\u0441\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0439 \u0434\u043b\u044f \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439<\/figcaption><\/figure>\n<p>\u0412 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 2 \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u043e \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP \u0432 \u0440\u0430\u043c\u043a\u0430\u0445 \u0437\u0430\u0434\u0430\u0447\u0438 zero-shot \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438 \u0434\u043b\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0434\u043e\u043c\u0435\u043d\u043e\u0432. \u0421\u0438\u043c\u0432\u043e\u043b\u043e\u043c ? \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043e \u043b\u0443\u0447\u0448\u0435\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u043c\u0435\u0442\u0440\u0438\u043a\u0438 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0438\u0437 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432. \u0412 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u044f \u043f\u0435\u0440\u0432\u043e\u0439 \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP Small, \u0432\u0441\u0435\u0445 6 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 ruCLIP, \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original \u0441 \u043f\u0435\u0440\u0435\u0432\u043e\u0434\u0447\u0438\u043a\u043e\u043c OPUS-MT ru-en \u0438 \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original. \u0412 8 \u0438\u0437 18 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u043c\u043e\u0434\u0435\u043b\u044c <em>ruCLIP Large [vit-large-patch14-336] exclusive<\/em> \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u043b\u0443\u0447\u0448\u0438\u0439 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u0441\u0440\u0435\u0434\u0438 \u0432\u0441\u0435\u0445 \u0441\u0440\u0430\u0432\u043d\u0438\u0432\u0430\u0435\u043c\u044b\u0445, \u0430 \u0432 \u0442\u0435\u0445, \u0433\u0434\u0435 \u043f\u0440\u043e\u0438\u0433\u0440\u044b\u0432\u0430\u0435\u0442, \u0440\u0430\u0437\u043d\u0438\u0446\u0430 \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0437\u043d\u0430\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u0430\u044f (\u043f\u043e\u0436\u0430\u043b\u0443\u0439, \u043a\u0440\u043e\u043c\u0435 MNIST \u0438 FGVC Aircraft &#8212; \u0437\u0434\u0435\u0441\u044c \u0435\u0449\u0435 \u0435\u0441\u0442\u044c \u043d\u0430\u0434 \u0447\u0435\u043c \u043f\u043e\u0442\u0440\u0443\u0434\u0438\u0442\u044c\u0441\u044f). \u0421\u0442\u043e\u0438\u0442 \u043e\u0442\u043c\u0435\u0442\u0438\u0442\u044c, \u0447\u0442\u043e \u043d\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 MNIST \u0434\u0430\u0436\u0435 \u0441\u0430\u043c\u044b\u043c \u0431\u043e\u043b\u044c\u0448\u0438\u043c \u043c\u043e\u0434\u0435\u043b\u044f\u043c <a href=\"https:\/\/arxiv.org\/pdf\/2102.05918.pdf\"><u>ALIGN<\/u><\/a> \u0438 <a href=\"https:\/\/arxiv.org\/pdf\/2111.10050.pdf\"><u>BASIC<\/u><\/a> \u043d\u0435 \u0443\u0434\u0430\u0435\u0442\u0441\u044f \u043e\u0431\u043e\u0439\u0442\u0438 CLIP \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443. \u0414\u043b\u044f \u0431\u043e\u043b\u044c\u0448\u0438\u043d\u0441\u0442\u0432\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 (11 \u0438\u0437 18) \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u044b\u0435 \u043d\u0430\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u043e\u0431\u0445\u043e\u0434\u044f\u0442 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 \u043c\u043e\u0434\u0435\u043b\u044c <em>CLIP [vit-base-patch16-224] original + OPUS-MT<\/em>. \u041f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432\u043e \u043c\u043e\u0434\u0435\u043b\u0438 CLIP original (\u043f\u0440\u0430\u0432\u044b\u0439 \u0441\u0442\u043e\u043b\u0431\u0435\u0446) \u043c\u043e\u0436\u043d\u043e \u043e\u0431\u044a\u044f\u0441\u043d\u0438\u0442\u044c \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0431<em>\u043e<\/em>\u043b\u044c\u0448\u0438\u043c \u043e\u0431\u044a\u0435\u043c\u043e\u043c \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0435\u0439 \u0432\u044b\u0431\u043e\u0440\u043a\u0438 (400\u041c vs 240\u041c).<\/p>\n<p>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2 &#8212;<\/p>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-328280","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/328280","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=328280"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/328280\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=328280"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=328280"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=328280"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}