{"id":321794,"date":"2021-04-21T03:00:07","date_gmt":"2021-04-21T03:00:07","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=321794"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=321794","title":{"rendered":"\u0422\u0438\u0445\u0430\u044f \u0440\u0435\u0432\u043e\u043b\u044e\u0446\u0438\u044f \u0438 \u043d\u043e\u0432\u044b\u0439 \u0434\u0438\u043a\u0438\u0439 \u0437\u0430\u043f\u0430\u0434 \u0432 ComputerVision"},"content":{"rendered":"\n<div class=\"post__text post__text_v2\" id=\"post-content-body\">\n<figure class=\"float full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/6bc\/d05\/3e5\/6bcd053e5878fc3755e4691b789809db.jpeg\" width=\"768\" height=\"432\"><figcaption><\/figcaption><\/figure>\n<p>\u041a\u0430\u0437\u0430\u043b\u043e\u0441\u044c \u0431\u044b, \u0440\u0435\u0432\u043e\u043b\u044e\u0446\u0438\u044f \u0441 Computer Vision \u0443\u0436\u0435 \u0431\u044b\u043b\u0430. \u0412 2012 \u0433\u043e\u0434\u0443 \u0432\u044b\u0441\u0442\u0440\u0435\u043b\u0438\u043b\u0438 \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u044b \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043d\u0430 <a href=\"https:\/\/en.wikipedia.org\/wiki\/Convolutional_neural_network\">\u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0445 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u044f\u0445<\/a>.  \u0413\u043e\u0434\u0430 \u0441 2014 \u043e\u043d\u0438 \u0434\u043e\u0448\u043b\u0438 \u0434\u043e \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u043d\u0430, \u0430 \u0433\u043e\u0434\u0430 \u0441 2016 \u0437\u0430\u043f\u043e\u043b\u043e\u043d\u0438\u043b\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/277069\/\">\u0432\u0441\u0435<\/a>.  \u041d\u043e, \u0432 \u043a\u043e\u043d\u0446\u0435 2020 \u0433\u043e\u0434\u0430 \u043f\u0440\u043e\u0448\u0435\u043b \u043d\u043e\u0432\u044b\u0439 \u0432\u0438\u0442\u043e\u043a. \u041d\u0430 \u044d\u0442\u043e\u0442 \u0440\u0430\u0437 \u043d\u0435 \u0437\u0430 4 \u0433\u043e\u0434\u0430, \u0430 \u0437\u0430 \u043e\u0434\u0438\u043d. \u043f\u043e\u0433\u043e\u0432\u043e\u0440\u0438\u043c \u043e \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445 \u0432 ComputerVision. \u0412 \u0441\u0442\u0430\u0442\u044c\u0435 \u0431\u0443\u0434\u0435\u0442 \u043e\u0431\u0437\u043e\u0440 \u043d\u043e\u0432\u0438\u043d\u043e\u043a, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043f\u043e\u044f\u0432\u0438\u043b\u0438\u0441\u044c \u0432 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0439 \u0433\u043e\u0434. \u0415\u0441\u043b\u0438 \u043a\u043e\u043c\u0443-\u0442\u043e \u0443\u0434\u043e\u0431\u043d\u0435\u0435, \u0442\u043e \u0441\u0442\u0430\u0442\u044c\u044f <a href=\"https:\/\/youtu.be\/xQFeeh5DqeY\">\u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 <\/a>\u0432 \u0432\u0438\u0434\u0435 \u0432\u0438\u0434\u0435\u043e \u043d\u0430 youtube.<\/p>\n<p><a href=\"https:\/\/en.wikipedia.org\/wiki\/Transformer_(machine_learning_model)\">\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b <\/a>&#8212; \u044d\u0442\u043e \u0442\u0430\u043a\u043e\u0439 \u0442\u0438\u043f \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439, \u0441\u043e\u0437\u0434\u0430\u043d\u043d\u044b\u0445 \u0432 2017 \u0433\u043e\u0434\u0443.  \u0418\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e, \u043e\u043d\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438\u0441\u044c \u0434\u043b\u044f <a href=\"https:\/\/ai.googleblog.com\/2017\/08\/transformer-novel-neural-network.html\">\u043f\u0435\u0440\u0435\u0432\u043e\u0434\u043e\u0432<\/a>:<\/p>\n<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/674\/a1f\/712\/674a1f7125f4328d5ea2b0999b3b9f90.gif\" width=\"640\" height=\"566\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u043e, \u043a\u0430\u043a \u043e\u043a\u0430\u0437\u0430\u043b\u043e\u0441\u044c, \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u043a\u0430\u043a \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u044f\u0437\u044b\u043a\u0430. \u0418 \u043f\u043e\u0448\u043b\u043e-\u043f\u043e\u0435\u0445\u0430\u043b\u043e. \u0421\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e, \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u0430\u044f <a href=\"https:\/\/ru.wikipedia.org\/wiki\/GPT-3\">GPT-3<\/a> &#8212; \u043f\u043e\u0440\u043e\u0436\u0434\u0435\u043d\u0438\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432.  <\/p>\n<p>\u0410 \u0447\u0442\u043e \u0441 ComputerVision?<br \/>\u0410 \u0432\u043e\u0442 \u0442\u0443\u0442 \u0432\u0441\u0435 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u0435\u043d\u044c\u043a\u043e. \u041d\u0435 \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u0447\u0442\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0445\u043e\u0440\u043e\u0448\u043e \u043f\u043e\u0434\u0445\u043e\u0434\u044f\u0442 \u0434\u043b\u044f \u0442\u0430\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447. \u0412\u0441\u0435-\u0442\u0430\u043a\u0438 \u0432\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u0440\u044f\u0434\u044b, \u0434\u0430 \u043a \u0442\u043e\u043c\u0443 \u0436\u0435 \u043e\u0434\u043d\u043e\u043c\u0435\u0440\u043d\u044b\u0435. \u041d\u043e \u0443\u0436 \u0431\u043e\u043b\u044c\u043d\u043e \u0445\u043e\u0440\u043e\u0448\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u0432 \u0434\u0440\u0443\u0433\u0438\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445. \u0412 \u0441\u0432\u043e\u0435\u043c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0435 \u044f \u043f\u0440\u043e\u0439\u0434\u0443\u0441\u044c \u043f\u043e \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u043c \u0440\u0430\u0431\u043e\u0442\u0430\u043c, \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u043c \u043c\u0435\u0441\u0442\u0430\u043c \u0438\u0445 \u043f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u044f. \u041f\u043e\u0441\u0442\u0430\u0440\u0430\u044e\u0441\u044c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u0442\u044c \u043f\u0440\u043e \u0440\u0430\u0437\u043d\u044b\u0435 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u044b \u043a\u0430\u043a \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0441\u043c\u043e\u0433\u043b\u0438 \u0437\u0430\u043f\u0438\u0445\u0430\u0442\u044c \u0432 CV.<\/p>\n<h2>DETR<\/h2>\n<p>\u041d\u0430 \u0434\u0432\u043e\u0440\u0435 2020. \u041f\u043e\u043f\u0435\u0440\u043b\u043e. \u0421 \u0447\u0435\u0433\u043e? \u0422\u0443\u0442 \u0441\u043b\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0437\u0430\u0442\u044c. \u041d\u043e \u043c\u043d\u0435 \u043a\u0430\u0436\u0435\u0442\u0441\u044f, \u043d\u0430\u0434\u043e \u043d\u0430\u0447\u0430\u0442\u044c \u0441 <a href=\"https:\/\/github.com\/facebookresearch\/detr\">DETR<\/a> (End-to-End Object Detection with Transformers), \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0432\u044b\u0448\u0435\u043b \u0432 \u043c\u0430\u0435 2020 \u0433\u043e\u0434\u0430. \u0422\u0443\u0442 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u044e\u0442\u0441\u044f \u043d\u0435 \u043a \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044e, \u0430 \u043a \u0444\u0438\u0447\u0430\u043c \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043d\u044b\u043c \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u043e\u0439 \u0441\u0435\u0442\u044c\u044e:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/62f\/6d2\/39e\/62f6d239e4b0e907c2952768ff6da2b8.png\" width=\"768\" height=\"205\"><figcaption><\/figcaption><\/figure>\n<p>\u0412 \u0442\u0430\u043a\u043e\u043c \u043f\u043e\u0434\u0445\u043e\u0434\u0435 \u043d\u0435\u0442 \u043e\u0441\u043e\u0431\u043e\u0439 \u043d\u043e\u0432\u0438\u0437\u043d\u044b, <a href=\"https:\/\/arxiv.org\/pdf\/1506.04878.pdf\">ReInspect <\/a>\u0432 2015 \u0434\u0435\u043b\u0430\u043b \u0447\u0442\u043e-\u0442\u043e \u043f\u043e\u0445\u043e\u0436\u0435\u0435, \u043f\u043e\u0434\u0430\u0432\u0430\u044f \u0432\u044b\u0445\u043e\u0434 BackBone \u0441\u0435\u0442\u0438 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0440\u0435\u043a\u0443\u0440\u0440\u0435\u043d\u0442\u043d\u043e\u0439 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u0438. \u041d\u043e \u043d\u0430 \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0440\u0435\u043a\u0443\u0440\u0440\u0435\u043d\u0442\u043d\u0430\u044f \u0441\u0435\u0442\u044c \u0445\u0443\u0436\u0435 \u0447\u0435\u043c \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 &#8212; \u043d\u0430\u0441\u0442\u043e\u043b\u044c\u043a\u043e \u0436\u0435 ReInspect \u043f\u0440\u043e\u0438\u0433\u0440\u044b\u0432\u0430\u043b Detr. \u0422\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u0438 \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0432\u044b\u0440\u043e\u0441\u043b\u043e \u0432 \u0440\u0430\u0437\u044b.&nbsp;  <\/p>\n<p>\u041a\u043e\u043d\u0435\u0447\u043d\u043e, \u0435\u0441\u0442\u044c \u043f\u0430\u0440\u0430 \u0437\u0430\u0431\u0430\u0432\u043d\u044b\u0445 \u0448\u0442\u0443\u043a, \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0434\u043e DETR \u043d\u0438\u043a\u0442\u043e \u043d\u0435 \u0434\u0435\u043b\u0430\u043b (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u043a\u0430\u043a \u0440\u0435\u0430\u043b\u0438\u0437\u0443\u0435\u0442\u0441\u044f \u043f\u043e\u0437\u0438\u0446\u0438\u043e\u043d\u043d\u043e\u0435 \u043a\u043e\u0434\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435, \u043a\u043e\u0442\u043e\u0440\u043e\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430).  \u042f \u043e\u043f\u0438\u0441\u0430\u043b \u0441\u0432\u043e\u0438 \u0432\u043f\u0435\u0447\u0430\u0442\u043b\u0435\u043d\u0438\u044f <a href=\"http:\/\/cv-blog.ru\/?p=310\">\u0442\u0443\u0442<\/a>.  <br \/>\u041c\u043e\u0433\u0443 \u043b\u0438\u0448\u044c \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c, \u0447\u0442\u043e DETR \u043e\u0442\u043a\u0440\u044b\u043b \u043f\u0443\u0442\u044c \u043a \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0434\u043b\u044f ComputerVision.\u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043b\u0438 \u0435\u0433\u043e \u043d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435? \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043b\u0438 \u043e\u043d \u0441\u0435\u0439\u0447\u0430\u0441? \u041d\u0435 \u0434\u0443\u043c\u0430\u044e:   <\/p>\n<ol>\n<li>\n<p>\u041e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u0435\u0433\u043e \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 &#8212; \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435, \u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u0432\u0440\u0435\u043c\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f.&nbsp; \u0427\u0430\u0441\u0442\u0438\u0447\u043d\u043e \u044d\u0442\u0443 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0443 \u0440\u0435\u0448\u0438\u043b <a href=\"https:\/\/github.com\/fundamentalvision\/Deformable-DETR\">Deformable DETR<\/a>. <\/p>\n<\/li>\n<li>\n<p>DETR \u043d\u0435 \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u044b\u0439. \u0415\u0441\u0442\u044c \u0437\u0430\u0434\u0430\u0447\u0438 \u0433\u0434\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043b\u0443\u0447\u0448\u0435 \u0434\u0440\u0443\u0433\u0438\u0435 \u043f\u043e\u0434\u0445\u043e\u0434\u044b. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0442\u043e\u0442 \u0436\u0435 <a href=\"https:\/\/github.com\/saic-vul\/iterdet\">iterdet<\/a>. \u041d\u043e \u0432 \u043a\u0430\u043a\u0438\u0445-\u0442\u043e \u0437\u0430\u0434\u0430\u0447\u0430\u0445 \u043b\u0438\u0434\u0435\u0440\u0441\u0442\u0432\u043e \u0434\u0435\u0440\u0436\u0438\u0442 \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 (\u0438\u043b\u0438 \u0435\u0433\u043e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u044b\u0435 &#8212; <a href=\"https:\/\/paperswithcode.com\/sota\/panoptic-segmentation-on-coco-panoptic\"><u>https:\/\/paperswithcode.com\/sota\/panoptic-segmentation-on-coco-panoptic<\/u><\/a> ).<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/7d0\/ad7\/4a0\/7d0ad74a00c7dc8b852eaf9519c4a26b.png\" width=\"1402\" height=\"599\"><figcaption><\/figcaption><\/figure>\n<\/li>\n<\/ol>\n<p>\u0421\u0440\u0430\u0437\u0443 \u043f\u043e\u0441\u043b\u0435 DETR \u0432\u044b\u0448\u0435\u043b <strong>Visual Transformer<\/strong> (<a href=\"https:\/\/arxiv.org\/pdf\/2006.03677.pdf\">\u0441\u0442\u0430\u0442\u044c\u044f  <\/a>+ <a href=\"https:\/\/habr.com\/ru\/company\/ru_mts\/blog\/512258\/\">\u043d\u0435\u043f\u043b\u043e\u0445\u043e\u0439 \u043e\u0431\u0437\u043e\u0440<\/a>) \u0434\u043b\u044f \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438. \u0422\u0443\u0442 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0442\u043e\u0436\u0435 \u0431\u0435\u0440\u0443\u0442 \u0432\u044b\u0445\u043e\u0434\u043d\u043e\u0439 Feature map \u0441 \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u0433\u043e backbone:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/831\/fcc\/318\/831fcc318958cc2248313200ad7c880b.png\" width=\"656\" height=\"356\"><figcaption><\/figcaption><\/figure>\n<p>\u042f \u0431\u044b \u043d\u0435 \u043d\u0430\u0437\u0432\u0430\u043b Visual Transformer \u0431\u043e\u043b\u044c\u0448\u0438\u043c \u0448\u0430\u0433\u043e\u043c, \u043d\u043e \u044d\u0442\u043e \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u043d\u0430\u044f \u0434\u043b\u044f \u0442\u0435\u0445 \u0432\u0440\u0435\u043c\u0435\u043d \u043c\u044b\u0441\u043b\u044c. \u041f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043a \u0442\u0435\u043c \u0438\u043b\u0438 \u0438\u043d\u044b\u043c \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043d\u044b\u043c \u0447\u0435\u0440\u0435\u0437 backbone \u0444\u0438\u0447\u0430\u043c.&nbsp;  <\/p>\n<h2>VIT<\/h2>\n<p>\u041f\u043e\u0435\u0445\u0430\u043b\u0438 \u0434\u0430\u043b\u044c\u0448\u0435. \u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0448\u0430\u0433 \u044d\u0442\u043e  <a href=\"https:\/\/ai.googleblog.com\/2020\/12\/transformers-for-image-recognition-at.html%20\">ViT<\/a>:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/c07\/f44\/bbc\/c07f44bbc62ad6068150a1f3e4debc13.gif\" width=\"1600\" height=\"1100\"><figcaption><\/figcaption><\/figure>\n<p>\u041e\u043d \u0431\u044b\u043b <a href=\"https:\/\/ai.googleblog.com\/2020\/12\/transformers-for-image-recognition-at.html\">\u043e\u043f\u0443\u0431\u043b\u0438\u043a\u043e\u0432\u0430\u043d <\/a>\u0432 <a href=\"https:\/\/arxiv.org\/pdf\/2010.11929.pdf%20\">\u043d\u0430\u0447\u0430\u043b\u0435 \u0434\u0435\u043a\u0430\u0431\u0440\u044f<\/a> 2020 \u0433\u043e\u0434\u0430 (<a href=\"https:\/\/github.com\/lucidrains\/vit-pytorch\">\u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f<\/a>). \u0418 \u0442\u0443\u0442 \u0432\u0441\u0435 \u0443\u0436\u0435 \u043f\u043e-\u0432\u0437\u0440\u043e\u0441\u043b\u043e\u043c\u0443. \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043a\u0430\u043a \u043e\u043d \u0435\u0441\u0442\u044c. \u041a\u0430\u0440\u0442\u0438\u043d\u043a\u0430 \u0440\u0430\u0437\u0431\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u043d\u0430 \u043c\u0438\u043d\u0438-\u0443\u0447\u0430\u0441\u0442\u043a\u0438 16*16. \u041a\u0430\u0436\u0434\u044b\u0439 \u0443\u0447\u0430\u0441\u0442\u043e\u043a \u043f\u043e\u0434\u0430\u0435\u0442\u0441\u044f \u0432 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043a\u0430\u043a \u201c\u0441\u043b\u043e\u0432\u043e\u201d, \u0434\u043e\u043f\u043e\u043b\u043d\u044f\u044f\u0441\u044c \u043f\u043e\u0437\u0438\u0446\u0438\u043e\u043d\u043d\u044b\u043c \u044d\u043d\u043a\u043e\u0434\u0435\u0440\u043e\u043c.&nbsp;<\/p>\n<p>\u0418, \u0432\u043d\u0435\u0437\u0430\u043f\u043d\u043e, \u044d\u0442\u043e \u0432\u0441\u0435 \u0437\u0430\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u041d\u0435 \u0441\u0447\u0438\u0442\u0430\u044f \u0442\u043e\u0433\u043e \u0447\u0442\u043e \u0443\u0447\u0438\u043b\u043e\u0441\u044c \u0432\u0441\u0435 \u0434\u043e\u043b\u0433\u043e (\u0438 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0435 state-of-art). \u0418 \u043d\u0430 \u0431\u0430\u0437\u0430\u0445 \u043c\u0435\u043d\u044c\u0448\u0435 14 \u043c\u0438\u043b\u043b\u0438\u043e\u043d\u043e\u0432 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e \u043a\u0430\u043a-\u0442\u043e \u043d\u0435 \u0442\u043e\u043f\u043e\u0432\u043e. <br \/>\u041d\u043e \u0432\u0441\u0435 \u044d\u0442\u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0440\u0435\u0448\u0438\u043b \u0430\u043d\u0430\u043b\u043e\u0433. \u041d\u0430 \u044d\u0442\u043e\u0442 \u0440\u0430\u0437 <a href=\"https:\/\/github.com\/facebookresearch\/deit\">\u043e\u0442 FaceBook <\/a>&#8212; <a href=\"https:\/\/arxiv.org\/pdf\/2012.12877.pdf\">Deit<\/a>. \u041a\u043e\u0442\u043e\u0440\u044b\u0439 \u0441\u0438\u043b\u044c\u043d\u043e \u0443\u043f\u0440\u043e\u0449\u0430\u043b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441.  <\/p>\n<p>\u041d\u0430 \u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u044d\u0442\u043e\u0442 \u043f\u043e\u0434\u0445\u043e\u0434 \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u0434\u0435\u0440\u0436\u0438\u0442 \u043f\u0435\u0440\u0432\u044b\u0435 \u043c\u0435\u0441\u0442\u0430 \u043f\u043e\u0447\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044f\u0445 &#8212; https:\/\/paperswithcode.com\/paper\/going-deeper-with-image-transformers  <\/p>\n<p>\u041d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435 \u043c\u044b \u043a\u0430\u043a-\u0442\u043e \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0432 \u043e\u0434\u043d\u043e\u0439 \u0437\u0430\u0434\u0430\u0447\u0435. \u041d\u043e, \u0441 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c \u0432 ~2-3 \u0442\u044b\u0441\u044f\u0447\u0438 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a, \u0432\u0441\u0435 \u044d\u0442\u043e \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0437\u0430\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u0418 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0435 ResNet&nbsp; \u0431\u044b\u043b\u0438 \u043a\u0443\u0434\u0430 \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u0435\u0435 \u0438 \u043b\u0443\u0447\u0448\u0435.&nbsp;   <\/p>\n<h2>CLIP   <\/h2>\n<p>\u041f\u043e\u0439\u0434\u0435\u043c \u0434\u0430\u043b\u044c\u0448\u0435. <a href=\"https:\/\/openai.com\/blog\/clip\/\">CLIP<\/a>. \u042d\u0442\u043e \u043e\u0447\u0435\u043d\u044c \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0441\u043e\u0432\u0441\u0435\u043c \u0441 \u0434\u0440\u0443\u0433\u043e\u0439 \u0441\u0442\u043e\u0440\u043e\u043d\u044b. \u0412 CLIP \u0437\u0430\u0434\u0430\u0447\u0430 \u043f\u0435\u0440\u0435\u0444\u043e\u0440\u043c\u0443\u043b\u0438\u0440\u043e\u0432\u0430\u043d\u0430. \u0417\u0430\u0434\u0430\u0447\u0430 \u043d\u0435 \u0432 \u0442\u043e\u043c \u0447\u0442\u043e\u0431\u044b \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0442\u044c \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435, \u0430 \u043d\u0430\u0439\u0442\u0438 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e \u0431\u043b\u0438\u0437\u043a\u043e\u0435 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0434\u043b\u044f \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f. \u0417\u0434\u0435\u0441\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0443\u0447\u0438\u0442 \u043b\u0438\u043d\u0433\u0432\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0447\u0430\u0441\u0442\u044c \u044d\u043c\u0431\u0435\u0434\u0438\u043d\u0433\u0430, \u0430 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u0430\u044f \u0441\u0435\u0442\u044c &#8212; \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u044d\u043c\u0431\u0435\u0434\u0438\u043d\u0433\u0438:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/9a9\/714\/e24\/9a9714e24d5c1207e236f43447514bfd.png\" width=\"681\" height=\"452\"><figcaption><\/figcaption><\/figure>\n<p>\u0422\u0430\u043a\u0430\u044f \u0448\u0442\u0443\u043a\u0430 \u0443\u0447\u0438\u0442\u044c\u0441\u044f \u043e\u0447\u0435\u043d\u044c \u0434\u043e\u043b\u0433\u043e, \u0437\u0430\u0442\u043e \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u043e\u0439. \u041e\u043d \u043d\u0435 \u0434\u0435\u0433\u0440\u0430\u0434\u0438\u0440\u0443\u0435\u0442 \u043f\u0440\u0438 \u0441\u043c\u0435\u043d\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. \u0421\u0435\u0442\u044c \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u0430 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u0442\u044c \u0432\u0435\u0449\u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0432\u0438\u0434\u0435\u043b\u0430 \u0441\u043e\u0432\u0441\u0435\u043c \u0432 \u0434\u0440\u0443\u0433\u043e\u043c \u0432\u0438\u0434\u0435:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/159\/711\/8ba\/1597118ba5063925965816d1a64c0580.png\" width=\"655\" height=\"656\"><figcaption><\/figcaption><\/figure>\n<p>\u0418\u043d\u043e\u0433\u0434\u0430 \u044d\u0442\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0434\u0430\u0436\u0435 \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u043a\u0440\u0443\u0442\u043e:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/73e\/10d\/19a\/73e10d19a427696d4896673cd47f6599.png\" width=\"920\" height=\"613\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u043e, \u043d\u0435 \u0441\u043c\u043e\u0442\u0440\u044f \u043d\u0430 \u0442\u043e \u0447\u0442\u043e \u044d\u0442\u043e \u0445\u043e\u0440\u043e\u0448\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043d\u0430 \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 &#8212; \u044d\u0442\u043e \u043d\u0435 \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u044b\u0439 \u043f\u043e\u0434\u0445\u043e\u0434:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/cd0\/a16\/e57\/cd0a16e57db650622dfae939e2a337f0.png\" width=\"1210\" height=\"1302\"><figcaption><\/figcaption><\/figure>\n<p>\u0422\u0443\u0442 \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0441 \u043b\u0438\u043d\u0435\u0439\u043d\u044b\u043c \u043f\u0440\u0438\u0431\u043b\u0438\u0436\u0435\u043d\u0438\u0435\u043c ResNet50. \u041d\u043e \u043d\u0430\u0434\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u0442\u044c, \u0447\u0442\u043e \u043f\u043e \u0447\u0430\u0441\u0442\u0438 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0441\u0438\u043b\u044c\u043d\u043e \u0445\u0443\u0436\u0435 \u0447\u0435\u043c \u043c\u043e\u0434\u0435\u043b\u044c\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u0430\u044f \u043f\u043e 100 \u043a\u0430\u0440\u0442\u0438\u043d\u043a\u0430\u043c.<\/p>\n<p>\u041c\u044b \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b\u0438 \u0438\u0437 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u0430 \u043f\u0440\u043e\u0442\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0439\/\u043e\u0434\u0435\u0436\u0434\u044b. \u0418 \u0432\u0435\u0437\u0434\u0435 CLIP \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043e\u0447\u0435\u043d\u044c \u043f\u043b\u043e\u0445\u043e. \u0412\u043e\u043e\u0431\u0449\u0435 \u043f\u0440\u043e CLIP \u043c\u043e\u0436\u043d\u043e \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043e\u0447\u0435\u043d\u044c \u0434\u043e\u043b\u0433\u043e. \u041d\u0430 \u0425\u0430\u0431\u0440\u0435 \u0435\u0441\u0442\u044c <a href=\"https:\/\/habr.com\/ru\/post\/539312\/\">\u0445\u043e\u0440\u043e\u0448\u0430\u044f \u0441\u0442\u0430\u0442\u044c\u044f<\/a>. \u0410 \u044f \u0434\u0435\u043b\u0430\u043b \u0432\u0438\u0434\u0435\u043e, \u0433\u0434\u0435 \u0433\u043e\u0432\u043e\u0440\u0438\u043b \u043f\u0440\u043e \u043d\u0435\u0433\u043e:<\/p>\n<p><iframe id=\"607f328d388fa3867a8ff42d\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f328d388fa3867a8ff42d\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/p>\n<h2>Vision Transformers for Dense Prediction  <\/h2>\n<p>\u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0430\u044f \u0441\u0435\u0442\u043a\u0430, \u043a\u043e\u0442\u043e\u0440\u0430\u044f, \u043d\u0430 \u043c\u043e\u0439 \u0432\u0437\u0433\u043b\u044f\u0434 \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u0430 &#8212; \u201c<a href=\"https:\/\/arxiv.org\/pdf\/2103.13413.pdf\">Vision Transformers for Dense Prediction<\/a>\u201d, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0432\u044b\u0448\u043b\u0430 \u043c\u0435\u0441\u044f\u0446 \u043d\u0430\u0437\u0430\u0434. \u0412 \u043d\u0435\u0439 \u043c\u043e\u0436\u043d\u043e \u043f\u0435\u0440\u0435\u043a\u043b\u044e\u0447\u0430\u0442\u044c\u0441\u044f \u043c\u0435\u0436\u0434\u0443 \u043f\u043e\u0434\u0445\u043e\u0434\u0430\u043c\u0438 Vit\/Detr. \u041c\u043e\u0436\u043d\u043e \u0434\u043b\u044f \u043f\u0435\u0440\u0432\u043e\u0433\u043e \u0443\u0440\u043e\u0432\u043d\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0441\u0432\u0435\u0440\u0442\u043a\u0438, \u0430 \u043c\u043e\u0436\u043d\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b.   <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/160\/85a\/648\/16085a648e4e312fa3233e041ce459d4.png\" width=\"995\" height=\"331\"><figcaption><\/figcaption><\/figure>\n<p>\u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u0441\u0435\u0442\u043a\u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u043d\u0435 \u0434\u043b\u044f \u0434\u0435\u0442\u0435\u043a\u0446\u0438\u0438\/\u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438, \u0430 \u0434\u043b\u044f \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438\/\u043e\u0446\u0435\u043d\u043a\u0438 \u0433\u043b\u0443\u0431\u0438\u043d\u044b. \u0427\u0442\u043e \u0434\u0430\u0435\u0442 <a href=\"https:\/\/paperswithcode.com\/paper\/vision-transformers-for-dense-prediction\">State-of-art \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442<\/a> \u0441\u0440\u0430\u0437\u0443 \u043f\u043e \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u044f\u043c, \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u0432 RealTime. \u0412\u043e\u043e\u0431\u0449\u0435 \u043e\u0447\u0435\u043d\u044c \u043f\u0435\u0447\u0430\u043b\u044c\u043d\u043e \u0447\u0442\u043e  @<a href=\"https:\/\/habr.com\/users\/AlexeyAB\/\"><strong>AlexeyAB<\/strong><\/a>  (\u0430\u0432\u0442\u043e\u0440 <a href=\"https:\/\/habr.com\/ru\/post\/503200\/&nbsp;\">Yolov4  <\/a>\u0438 \u043e\u0434\u0438\u043d \u0438\u0437 \u0430\u0432\u0442\u043e\u0440\u043e\u0432 \u0441\u0442\u0430\u0442\u044c\u0438), \u043d\u0435 \u0431\u0430\u0445\u043d\u0443\u043b \u0441\u044e\u0434\u0430 \u043f\u0443\u0431\u043b\u0438\u043a\u0430\u0446\u0438\u044e \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u0443\u044e \u043f\u0440\u043e \u043d\u0435\u0433\u043e. \u0412 \u0446\u0435\u043b\u043e\u043c \u0441\u0435\u0442\u043a\u0430 \u043f\u0440\u0438\u044f\u0442\u043d\u0430\u044f, \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u0435\u0442\u0441\u044f \u0438\u0437 \u043a\u043e\u0440\u043e\u0431\u043a\u0438, \u043d\u043e \u043f\u043e\u043a\u0430 \u043d\u0438\u0433\u0434\u0435 \u043d\u0435 \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b. \u0415\u0441\u043b\u0438 \u043a\u043e\u043c\u0443-\u0442\u043e \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e, \u044f \u0434\u0435\u043b\u0430\u043b \u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u044b\u0439 \u043e\u0431\u0437\u043e\u0440 \u0442\u0443\u0442:<\/p>\n<p><iframe id=\"607f33526c0aef8697ca9187\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f33526c0aef8697ca9187\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/p>\n<h2>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<\/h2>\n<p>\u0412 \u044d\u0442\u043e\u043c \u043c\u0435\u0441\u0442\u0435 \u043d\u0443\u0436\u043d\u043e \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u043f\u0435\u0440\u0435\u0445\u043e\u0434\u043d\u0443\u0442\u044c. \u0412\u0441\u0435 \u0447\u0442\u043e \u0431\u044b\u043b\u043e \u0432\u044b\u0448\u0435 &#8212; \u044d\u0442\u043e \u0441\u0430\u043c\u044b\u0435 \u044f\u0440\u043a\u0438\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0445 \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432:<\/p>\n<ul>\n<li>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0434\u043b\u044f \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u043e\u0439 \u0441\u0435\u0442\u0438<\/p>\n<\/li>\n<li>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0434\u043b\u044f \u043d\u0430\u0445\u043e\u0436\u0434\u0435\u043d\u0438\u044f \u043b\u043e\u0433\u0438\u043a\u0438 \u043f\u043e\u0432\u0435\u0440\u0445 \u0432\u044b\u0434\u0430\u0447\u0438 \u0441\u0435\u0442\u0438<\/p>\n<\/li>\n<li>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u044f\u0441\u044c \u043a \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044e<\/p>\n<\/li>\n<li>\n<p>\u0413\u0438\u0431\u0440\u0438\u0434 \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432 1-2<\/p>\n<\/li>\n<\/ul>\n<p>\u0412\u0441\u0435 \u0447\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0438\u0436\u0435 &#8212; \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u0442\u043e\u0433\u043e \u043a\u0430\u043a \u0442\u0435 \u0436\u0435 \u0441\u0430\u043c\u044b\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b\/\u043f\u043e\u0434\u0445\u043e\u0434\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0434\u043b\u044f \u0434\u0440\u0443\u0433\u0438\u0445 \u0437\u0430\u0434\u0430\u0447. \u041f\u043e\u0435\u0445\u0430\u043b\u0438.  <\/p>\n<h2>PoseFormer  <\/h2>\n<p><a href=\"https:\/\/github.com\/zczcwh\/PoseFormer\">Pose3D<\/a>. \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u0442\u044c \u0438 \u043a \u044f\u0432\u043d\u044b\u043c \u0444\u0438\u0447\u0430\u043c, \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043d\u044b\u043c \u0443\u0436\u0435 \u0433\u043e\u0442\u043e\u0432\u043e\u0439 \u0441\u0435\u0442\u044c\u044e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u043a \u0441\u043a\u0435\u043b\u0435\u0442\u0430\u043c:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/3df\/094\/a7e\/3df094a7e894dc78493535a0526d351a.gif\" width=\"1363\" height=\"720\"><figcaption><\/figcaption><\/figure>\n<p>\u0412 \u044d\u0442\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u0435 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0434\u043b\u044f \u0432\u043e\u0441\u0441\u0442\u0430\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f 3\u0434 \u043c\u043e\u0434\u0435\u043b\u0438 \u0447\u0435\u043b\u043e\u0432\u0435\u043a\u0430 \u043f\u043e \u0441\u0435\u0440\u0438\u0438 \u043a\u0430\u0434\u0440\u043e\u0432. \u0412 CherryLabs \u043c\u044b \u0434\u0435\u043b\u0430\u043b\u0438 \u0442\u0430\u043a\u043e\u0435 (\u0438 \u0431\u043e\u043b\u0435\u0435 \u0441\u043b\u043e\u0436\u043d\u044b\u0435 \u0440\u0435\u043a\u043e\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0438) \u0435\u0449\u0451 \u0433\u043e\u0434\u0430 3 \u043d\u0430\u0437\u0430\u0434, \u0442\u043e\u043b\u044c\u043a\u043e \u0431\u0435\u0437 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432, \u0441 \u044d\u043c\u0431\u0435\u0434\u0438\u043d\u0433\u0430\u043c\u0438. \u041d\u043e, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0442 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u044d\u0442\u043e \u0431\u044b\u0441\u0442\u0440\u0435\u0435 \u0438 \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u0435\u0435. \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 &#8212; \u0432\u043f\u043e\u043b\u043d\u0435 \u043d\u0435\u043f\u043b\u043e\u0445\u043e\u0435 \u0438 \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u043e\u0435 3D, \u0431\u0435\u0437 \u043f\u0435\u0440\u0435\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/343\/f43\/aaa\/343f43aaa359bf7662d3cb474eadd7c4.gif\" width=\"544\" height=\"306\"><figcaption><\/figcaption><\/figure>\n<p>\u041f\u043b\u044e\u0441 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0432 \u0434\u0430\u043d\u043d\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 &#8212; \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 \u0434\u0430\u043d\u043d\u044b\u043c\u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0435 \u043e\u0431\u043b\u0430\u0434\u0430\u044e\u0442 \u043b\u043e\u043a\u0430\u043b\u044c\u043d\u043e\u0439 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0435\u0439. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 (\u0432 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0445). \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0443 \u043e\u0431\u0443\u0447\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u0441\u043b\u043e\u0436\u043d\u044b\u0435 \u0438 \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043d\u044b\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u044b.<\/p>\n<p>\u0415\u0441\u043b\u0438 \u0447\u0442\u043e, \u0438\u0434\u0435\u044f \u043f\u0440\u0438\u0448\u043b\u0430 \u043e\u0434\u043d\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e \u043c\u043d\u043e\u0433\u043e \u043a\u043e\u043c\u0443. \u0412\u043e\u0442 <a href=\"https:\/\/arxiv.org\/pdf\/2103.14304v5.pdf\">\u0435\u0449\u0451 \u043e\u0434\u0438\u043d \u043f\u043e\u0434\u0445\u043e\u0434<\/a>\/\u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0442\u043e\u0439 \u0436\u0435 \u0438\u0434\u0435\u0438.<\/p>\n<h2>TransPose   <\/h2>\n<p>\u0415\u0441\u043b\u0438 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0433\u0434\u0435 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 \u043d\u0435 \u0445\u0432\u0430\u0442\u0430\u0435\u0442 \u0438\u043c\u0435\u043d\u043d\u043e \u043f\u043e\u0442\u043e\u043c\u0443 \u0447\u0442\u043e \u043f\u0440\u0438\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u0435\u0442 \u0432\u043b\u043e\u0436\u0435\u043d\u043d\u0430\u044f \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u044f\u044f \u043b\u043e\u0433\u0438\u043a\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f, \u0442\u043e \u0441\u0440\u0430\u0437\u0443 \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442 \u043d\u0430 \u0443\u043c \u0438\u043c\u0435\u043d\u043d\u043e \u043f\u043e\u0437\u0430. <a href=\"https:\/\/github.com\/yangsenius\/TransPose\">TransPose  <\/a>&#8212; \u0441\u0435\u0442\u043a\u0430 \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0435\u0442 \u043f\u043e\u0437\u0443 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u0443\u044f \u0441\u0432\u0435\u0440\u0442\u043a\u0438:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/d07\/3d4\/c59\/d073d4c597d92f078c1c0af4f3c81d16.png\" width=\"1653\" height=\"532\"><figcaption><\/figcaption><\/figure>\n<p>\u0421\u0440\u0430\u0432\u043d\u0438\u0442\u0435 \u0441 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u043f\u043e\u0434\u0445\u043e\u0434\u0430\u043c\u0438 \u0432 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0438 \u043f\u043e\u0437\u044b (\u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0441\u0442\u0430\u0440\u0430\u044f \u0432\u0435\u0440\u0441\u0438\u044f <a href=\"https:\/\/russianblogs.com\/article\/7823213439\/%20%20https:\/\/arxiv.org\/pdf\/1812.08008.pdf\">OpenPose<\/a>)   <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/21f\/fca\/ff5\/21ffcaff55d6c01fa8b133fbaf4fd513.png\" width=\"9488\" height=\"2699\"><figcaption><\/figcaption><\/figure>\n<p>\u0418 \u0442\u0430\u043a\u0438\u0445 \u0441\u0442\u0435\u0439\u0434\u0436\u0435\u0439 \u0431\u044b\u043b\u043e \u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0440\u0430\u0431\u043e\u0442\u0430\u0445 \u0434\u043e \u0434\u0435\u0441\u044f\u0442\u043a\u0430. \u0421\u0435\u0439\u0447\u0430\u0441 \u043e\u043d\u0438 \u0437\u0430\u043c\u0435\u043d\u0435\u043d\u044b \u043e\u0434\u043d\u0438\u043c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u043c. <a href=\"https:\/\/arxiv.org\/pdf\/2012.14214.pdf%20\">\u041f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f<\/a>, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0441\u0438\u043b\u044c\u043d\u043e \u043b\u0443\u0447\u0448\u0435 \u0447\u0435\u043c \u0443 \u0441\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/e93\/9fa\/920\/e939fa9206a460441bba74a1a81acb76.png\" width=\"590\" height=\"264\"><figcaption><\/figcaption><\/figure>\n<h2>SWIN  <\/h2>\n<p>\u0412\u044b\u0448\u0435 \u043c\u044b \u0443\u0436\u0435 \u0443\u043f\u043e\u043c\u0438\u043d\u0430\u043b\u0438 \u043e\u0434\u043d\u0443 \u0441\u0435\u0442\u043a\u0443 \u043f\u043e \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438 \u043d\u0430 \u0431\u0430\u0437\u0435 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u043e\u0442 Intel. <a href=\"https:\/\/arxiv.org\/pdf\/2103.14030.pdf\">SWIN <\/a>\u043e\u0442 <a href=\"https:\/\/github.com\/microsoft\/Swin-Transformer\">Microsoft <\/a>\u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043b\u0443\u0447\u0448\u0435, \u043d\u043e \u0443\u0436\u0435 \u043d\u0435 \u0432 RealTime.\u041f\u043e \u0441\u0443\u0442\u0438 \u044d\u0442\u043e \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u043d\u044b\u0439 \u0438 \u0440\u0430\u0441\u0448\u0438\u0440\u0435\u043d\u043d\u044b\u0439 VIT\/Deit, \u043f\u0435\u0440\u0435\u0440\u0430\u0431\u043e\u0442\u0430\u043d\u043d\u044b\u0439 \u043f\u043e\u0434 \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u044e:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/b02\/d06\/a23\/b02d06a2357760a172f38e59ab7b6836.png\" width=\"648\" height=\"368\"><figcaption><\/figcaption><\/figure>\n<p>\u042d\u0442\u043e \u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u043d\u0430 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u0438, \u0437\u0430\u0442\u043e \u0432\u043d\u0443\u0448\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e, \u043b\u0438\u0434\u0435\u0440\u0441\u0442\u0432\u043e \u0432 \u043c\u043d\u043e\u0436\u0435\u0441\u0442\u0432\u0435 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0439 &#8212;   <a href=\"https:\/\/paperswithcode.com\/paper\/swin-transformer-hierarchical-vision\"><u>https:\/\/paperswithcode.com\/paper\/swin-transformer-hierarchical-vision<\/u><\/a>  <\/p>\n<h2>LOFTR<\/h2>\n<p>\u0415\u0441\u0442\u044c \u0437\u0430\u0434\u0430\u0447\u0438 \u0432 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0435 \u0441\u0435\u0442\u0438 \u0432\u043e\u043e\u0431\u0449\u0435 \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0437\u0430\u0434\u0430\u0447\u0430 \u0441\u043e\u043f\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044f \u0434\u0432\u0443\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439. \u0413\u043e\u0434\u0430 \u043f\u043e\u043b\u0442\u043e\u0440\u0430 \u043d\u0430\u0437\u0430\u0434 \u0434\u043b\u044f \u0442\u0430\u043a\u043e\u0433\u043e \u0437\u0430\u0447\u0430\u0441\u0442\u0443\u044e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d \u0447\u0435\u0440\u0435\u0437 SIFT\/SURF+RANSAK ( <a href=\"https:\/\/local-features-tutorial.github.io\/pdfs\/Local_features_from_paper_to_practice.pdf\">\u0445\u043e\u0440\u043e\u0448\u0438\u0439 \u0433\u0430\u0439\u0434 \u043d\u0430 \u044d\u0442\u0443 \u0442\u0435\u043c\u0443<\/a>  + <a href=\"https:\/\/youtu.be\/kBZVZbKiTk4\">\u0432\u0438\u0434\u0435\u043e <\/a>\u043a\u043e\u0442\u043e\u0440\u043e\u0435 \u044f \u0437\u0430\u043f\u0438\u0441\u044b\u0432\u0430\u043b \u0433\u043e\u0434 \u043d\u0430\u0437\u0430\u0434 ). \u0413\u043e\u0434 \u043d\u0430\u0437\u0430\u0434 \u043f\u043e\u044f\u0432\u0438\u043b\u0441\u044f <a href=\"https:\/\/arxiv.org\/pdf\/1911.11763.pdf\">SuperGlue<\/a>&#8212; \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0435 \u043a\u0440\u0443\u0442\u043e\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 <a href=\"http:\/\/cv-blog.ru\/?p=341\">Graph Neural Network \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u044f \u0432\u0438\u0434\u0435\u043b<\/a> \u0432 ComputerVision. \u041f\u0440\u0438 \u044d\u0442\u043e\u043c SuperGlue \u0440\u0435\u0448\u0430\u043b \u0442\u043e\u043b\u044c\u043a\u043e \u0437\u0430\u0434\u0430\u0447\u0443 \u0441\u043e\u043f\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044f. \u0410 \u0442\u0435\u043f\u0435\u0440\u044c \u0435\u0441\u0442\u044c \u0440\u0435\u0448\u0435\u043d\u0438\u0435 \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445,<a href=\"https:\/\/zju3dv.github.io\/loftr\/\"> LOFTR<\/a>  \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 End-To-End:<\/p>\n<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/4f3\/e91\/2ee\/4f3e912ee2dd8840cf0ebb69c3acb542.png\" width=\"1600\" height=\"830\"><figcaption><\/figcaption><\/figure>\n<p>\u0421\u0430\u043c \u044f \u043f\u043e\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u043d\u0435 \u0443\u0441\u043f\u0435\u043b, \u043d\u043e \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u043a\u0440\u0443\u0442\u043e:<\/p>\n<p><iframe id=\"607f3605563ace6d7a18d81b\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f3605563ace6d7a18d81b\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/p>\n<h2>\u0420\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0439  <\/h2>\n<p>\u0412 \u0446\u0435\u043b\u043e\u043c, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0445\u043e\u0440\u043e\u0448\u0438 \u0432\u0441\u044e\u0434\u0443 \u0433\u0434\u0435 \u0435\u0441\u0442\u044c \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438, \u0441\u043b\u043e\u0436\u043d\u0430\u044f \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0438\u043b\u0438 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u0438\u0445 \u0430\u043d\u0430\u043b\u0438\u0437. \u0423\u0436\u0435 \u0435\u0441\u0442\u044c \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0435\u0442\u0435\u0439 \u0433\u0434\u0435 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u044e\u0442\u0441\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u043c\u0438: (<a href=\"https:\/\/arxiv.org\/pdf\/2102.00719.pdf\">Video Transformer Network<\/a>, <a href=\"https:\/\/github.com\/Axe--\/ActionBERT\">ActionBert<\/a>). \u041e\u0431\u0435\u0449\u0430\u044e\u0442 \u0432 \u0431\u043b\u0438\u0436\u0430\u0439\u0448\u0435\u0435 \u0432\u0440\u0435\u043c\u044f \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0432 <a href=\"https:\/\/github.com\/open-mmlab\/mmaction2\">MMAction<\/a>.<\/p>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/c71\/f1a\/071\/c71f1a07151d0a5c9e8d4c675fba4b5d.gif\" width=\"320\" height=\"240\"><figcaption><\/figcaption><\/figure>\n<h2>\u0422\u0440\u0435\u043a\u0438\u043d\u0433  <\/h2>\n<p>\u042f \u0443\u0436\u0435 \u043f\u0438\u0441\u0430\u043b \u0433\u043e\u0434 \u043d\u0430\u0437\u0430\u0434 <a href=\"https:\/\/habr.com\/ru\/company\/recognitor\/blog\/505694\/%20\">\u043e\u0433\u0440\u043e\u043c\u043d\u0443\u044e \u0441\u0442\u0430\u0442\u044c\u044e \u043d\u0430 \u0425\u0430\u0431\u0440\u0435 <\/a>\u0447\u0442\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0432 \u0442\u0440\u0435\u043a\u0438\u043d\u0433\u0435 \u0438 \u043a\u0430\u043a \u0442\u0440\u0435\u043a\u0430\u0442\u044c \u043e\u0431\u044a\u0435\u043a\u0442\u044b. \u041c\u043d\u043e\u0436\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432, \u0441\u043b\u043e\u0436\u043d\u0430\u044f \u043b\u043e\u0433\u0438\u043a\u0430. \u041f\u0440\u043e\u0448\u0435\u043b \u0432\u0441\u0435\u0433\u043e \u0433\u043e\u0434, \u0438 \u043f\u043e <a href=\"https:\/\/paperswithcode.com\/task\/visual-object-tracking\">\u043c\u043d\u043e\u0433\u0438\u043c \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430\u043c<\/a> \u0435\u0441\u0442\u044c \u0431\u0435\u0437\u0443\u0441\u043b\u043e\u0432\u043d\u044b\u0439 \u043b\u0438\u0434\u0435\u0440 &#8212; <a href=\"https:\/\/github.com\/researchmm\/Stark\">STARK<\/a>:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/803\/bad\/b1d\/803badb1d52cfd241836cbe2fc92cf0c.png\" width=\"3900\" height=\"1530\"><figcaption><\/figcaption><\/figure>\n<p>\u041a\u043e\u043d\u0435\u0447\u043d\u043e, \u043e\u043d \u043d\u0435 \u0440\u0435\u0448\u0430\u0435\u0442 \u0432\u0441\u0435\u0445 \u043a\u0435\u0439\u0441\u043e\u0432. \u0418 \u043d\u0435 \u0432\u043e \u0432\u0441\u0435\u0445 \u043a\u0435\u0439\u0441\u0430\u0445 \u043f\u043e\u0431\u0435\u0436\u0434\u0430\u044e\u0442 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b. \u041d\u043e, \u0441\u043a\u043e\u0440\u0435\u0435 \u0432\u0441\u0435\u0433\u043e, \u044d\u0442\u043e \u043d\u0435 \u043d\u0430\u0434\u043e\u043b\u0433\u043e.   \u0412\u043e\u0442, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440,<a href=\"https:\/\/arxiv.org\/pdf\/2104.07244v1.pdf\"> \u0442\u0440\u0435\u043a\u0438\u043d\u0433 \u0433\u043b\u0430\u0437<\/a> \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445.  <a href=\"https:\/\/github.com\/chenxin-dlut\/TransT\">\u0412\u043e\u0442 \u0442\u0440\u0435\u043a\u0438\u043d\u0433 \u043f\u043e \u0442\u0438\u043f\u0443 \u0441\u0438\u0430\u043c\u0441\u043a\u0438\u0445 \u0441\u0435\u0442\u0435\u0439<\/a> \u043f\u0430\u0440\u0443 \u043d\u0435\u0434\u0435\u043b\u044c\u043d\u043e\u0439 \u0434\u0430\u0432\u043d\u043e\u0441\u0442\u0438.  \u0412\u043e\u0442 \u0442\u0440\u0435\u043a\u0438\u043d\u0433 BBOX + \u0444\u0438\u0447\u0438 <a href=\"https:\/\/github.com\/PeizeSun\/TransTrack\">\u043e\u0434\u0438\u043d<\/a>, \u0430 \u0432\u043e\u0442 <a href=\"https:\/\/arxiv.org\/pdf\/2101.02702v1.pdf\">\u0434\u0440\u0443\u0433\u043e\u0439<\/a>, \u0441 \u043f\u043e\u0447\u0442\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u043c\u0438 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f\u043c\u0438  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/d86\/9b8\/efb\/d869b8efbe35f2994a9fd0efb76a0271.png\" alt=\"TransTrack\" title=\"TransTrack\" width=\"3496\" height=\"1112\"><figcaption>TransTrack<\/figcaption><\/figure>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/bd4\/174\/7f3\/bd41747f3b5a7db74071fe02bea0dee5.png\" alt=\"TransT\" title=\"TransT\" width=\"509\" height=\"366\"><figcaption>TransT<\/figcaption><\/figure>\n<p>\u0418 \u0432\u0441\u0435 \u0438\u043c\u0435\u044e\u0442 \u043d\u0435\u043f\u043b\u043e\u0445\u0438\u0435 \u0441\u043a\u043e\u0440\u044b.<\/p>\n<h2>ReID  <\/h2>\n<p>\u0420\u0435\u0438\u043d\u0434\u0435\u043d\u0442\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044e \u043c\u043e\u0436\u043d\u043e \u0432\u044b\u043d\u0435\u0441\u0442\u0438 \u0438\u0437 \u0442\u0440\u0435\u043a\u0438\u043d\u0433\u0430, \u043a\u0430\u043a <a href=\"https:\/\/habr.com\/ru\/company\/recognitor\/blog\/505694\/\">\u0432\u044b \u043f\u043e\u043c\u043d\u0438\u0442\u0435<\/a>.  &nbsp;20 \u0434\u043d\u0435\u0439 \u043d\u0430\u0437\u0430\u0434 \u0432\u044b\u0448\u0435\u043b \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0441 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435\u043c <a href=\"https:\/\/github.com\/heshuting555\/TransReID\">ReID<\/a>&nbsp;&#8212;   \u0432\u0435\u0441\u044c\u043c\u0430 \u043d\u0435\u043f\u043b\u043e\u0445\u043e \u043c\u043e\u0436\u0435\u0442 \u0431\u0443\u0441\u0442\u0430\u043d\u0443\u0442\u044c \u0442\u0440\u0435\u043a\u0438\u043d\u0433.  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/3eb\/446\/325\/3eb4463258f270894058aa1d56538b85.png\" width=\"1488\" height=\"744\"><figcaption><\/figcaption><\/figure>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2103.14803v2.pdf%20\">\u0420\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u044f \u043b\u0438\u0446 <\/a>\u0447\u0435\u0440\u0435\u0437 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u043d\u0435\u0434\u0435\u043b\u044c\u043d\u043e\u0439 \u0434\u0430\u0432\u043d\u043e\u0441\u0442\u0438 \u043f\u043e\u0445\u043e\u0436\u0435 \u0442\u043e\u0436\u0435 \u043f\u043e\u0434\u043e\u0448\u043b\u043e:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/413\/d3e\/027\/413d3e02738eb0d3737637e457c18477.png\" width=\"1600\" height=\"628\"><figcaption><\/figcaption><\/figure>\n<h2>\u041c\u0435\u0434\u0438\u0446\u0438\u043d\u0430<\/h2>\n<p>\u0415\u0441\u043b\u0438 \u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0431\u043e\u043b\u0435\u0435 \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u044b\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0442\u0443\u0442 \u0442\u043e\u0436\u0435 \u043c\u043d\u043e\u0433\u043e \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0433\u043e. VIT \u0443\u0436\u0435 \u0432\u043e\u0432\u0441\u044e \u0437\u0430\u043f\u0438\u0445\u0438\u0432\u0430\u044e\u0442 \u0434\u043b\u044f \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u041a\u0422 \u0438 \u041c\u0420\u0422 (<a href=\"https:\/\/github.com\/junyuchen245\/ViT-V-Net_for_3D_Image_Registration_Pytorch\">1<\/a>,<a href=\"https:\/\/github.com\/Beckschen\/TransUNet\">2<\/a>):<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/e49\/985\/b4c\/e49985b4c0de9740db403b42a7173e81.png\" width=\"1600\" height=\"759\"><figcaption><\/figcaption><\/figure>\n<p>\u0418 \u0434\u043b\u044f \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438 (<a href=\"https:\/\/github.com\/jeya-maria-jose\/Medical-Transformer\">1<\/a>,<a href=\"https:\/\/arxiv.org\/pdf\/2102.04306v1.pdf\">2<\/a>):<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/c20\/84c\/645\/c2084c6450b56b42a3f20b690389af21.png\" width=\"1257\" height=\"574\"><figcaption><\/figcaption><\/figure>\n<h2>\u0423\u0434\u0438\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0435  <\/h2>\n<p>\u0427\u0442\u043e \u043c\u0435\u043d\u044f \u0443\u0434\u0438\u0432\u043b\u044f\u0435\u0442 &#8212; \u044f \u043d\u0435 \u0432\u0438\u0436\u0443 \u0445\u043e\u0440\u043e\u0448\u0435\u0439 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 OCR \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445. \u0415\u0441\u0442\u044c \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432, \u043d\u043e \u043f\u043e \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430\u043c \u043e\u043d\u0438 <a href=\"https:\/\/github.com\/fengxinjie\/Transformer-OCR\">\u043a\u0430\u043a-\u0442\u043e \u043d\u0430 \u0434\u043d\u0435<\/a>:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/3ef\/f73\/456\/3eff734564ac811a2383f0c2ed6adef4.png\" width=\"1600\" height=\"1449\"><figcaption><\/figcaption><\/figure>\n<p>\u0412\u0441\u0435 state-of-art \u043f\u043e\u043a\u0430 \u043d\u0430 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u043f\u043e\u0434\u0445\u043e\u0434\u0430\u0445. \u041d\u043e \u043b\u044e\u0434\u0438 \u043f\u0440\u043e\u0431\u0443\u044e\u0442. \u0414\u0430\u0436\u0435 \u0441\u0430\u043c \u0447\u0442\u043e-\u0442\u043e \u0433\u043e\u0434\u0430 2 \u043d\u0430\u0437\u0430\u0434 \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b \u043f\u0440\u0438\u043a\u0440\u0443\u0442\u0438\u0442\u044c. \u041d\u043e \u0447\u0442\u043e-\u0442\u043e \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0430 \u044d\u0442\u043e \u043d\u0435 \u0434\u0430\u0435\u0442.  <\/p>\n<h2>\u0415\u0449\u0451 \u0438\u0437 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0433\u043e  <\/h2>\n<p>\u041d\u0438\u043a\u043e\u0433\u0434\u0430 \u0431\u044b \u043d\u0435 \u043f\u043e\u0434\u0443\u043c\u0430\u043b, \u043d\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b <a href=\"https:\/\/github.com\/google-research\/google-research\/tree\/master\/coltran\">\u0443\u0436\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u043b\u0438 <\/a>\u0434\u043b\u044f \u0440\u0430\u0441\u043a\u0440\u0430\u0441\u043a\u0438 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a. \u0418, \u043d\u0430\u0432\u0435\u0440\u043d\u043e\u0435, \u044d\u0442\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u043e:  <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/12e\/728\/bd0\/12e728bd088a1dc9f472d658e0fd9b99.png\" width=\"1125\" height=\"279\"><figcaption><\/figcaption><\/figure>\n<h2>\u0427\u0442\u043e \u0434\u0430\u043b\u044c\u0448\u0435<\/h2>\n<p>\u041c\u043d\u0435 \u043a\u0430\u0436\u0435\u0442\u0441\u044f \u0447\u0442\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0434\u043e\u043b\u0436\u043d\u044b \u0432\u044b\u0439\u0442\u0438 \u0432 \u0442\u043e\u043f \u043f\u043e\u0447\u0442\u0438 \u043f\u043e \u0432\u0441\u0435\u043c \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u044f\u043c \u0434\u043b\u044f ComputerVision. \u0418, \u0431\u0435\u0437\u0443\u0441\u043b\u043e\u0432\u043d\u043e, \u0434\u043b\u044f \u043b\u044e\u0431\u043e\u0439 \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a\u0438 \u0432\u0438\u0434\u0435\u043e.&nbsp;<\/p>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0435\u0434\u044f\u0442 \u0432\u0445\u043e\u0434\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u043b\u0438\u043d\u0435\u0439\u043d\u043e. \u0420\u0430\u0437\u043d\u044b\u043c\u0438 \u0445\u0438\u0442\u0440\u044b\u043c\u0438 \u0441\u043f\u043e\u0441\u043e\u0431\u0430\u043c\u0438 \u0432 \u043d\u0438\u0445 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u044e\u0442 \u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e. \u041d\u043e \u043a\u0430\u0436\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u0440\u0430\u043d\u043e \u0438\u043b\u0438 \u043f\u043e\u0437\u043d\u043e \u043a\u0442\u043e-\u043d\u0438\u0431\u0443\u0434\u044c \u043f\u0440\u0438\u0434\u0443\u043c\u0430\u0435\u0442 \u0431\u043e\u043b\u0435\u0435 \u0430\u043a\u0442\u0443\u0430\u043b\u044c\u043d\u0443\u044e \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044e, \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e \u0433\u0434\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0438 2\u0434 \u0441\u0432\u0435\u0440\u0442\u043a\u0430 \u0431\u0443\u0434\u0443\u0442 \u043e\u0431\u044a\u0435\u0434\u0438\u043d\u0435\u043d\u044b. \u0418, \u043b\u044e\u0434\u0438 <a href=\"https:\/\/github.com\/rishikksh20\/convolution-vision-transformers\">\u0443\u0436\u0435 <\/a><a href=\"https:\/\/arxiv.org\/pdf\/2103.15808v1.pdf%20\">\u043f\u044b\u0442\u0430\u044e\u0442\u0441\u044f<\/a> &#8212; <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/2e7\/d73\/8e1\/2e7d738e1e7fd292b0636620855a9b76.png\" width=\"1056\" height=\"488\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u0443 \u0430 \u043f\u043e\u043a\u0430, \u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 \u0442\u043e \u043a\u0430\u043a \u0438\u0437\u043c\u0435\u043d\u044f\u0435\u0442\u0441\u044f \u043c\u0438\u0440. \u0411\u0443\u043a\u0432\u0430\u043b\u044c\u043d\u043e \u043a\u0430\u0436\u0434\u044b\u0439 \u0434\u0435\u043d\u044c. \u041a\u043e\u0433\u0434\u0430 \u043c\u0430\u0442\u0435\u0440\u0438\u0430\u043b\u0430 \u043d\u0430\u043a\u0430\u043f\u043b\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e &#8212; \u044f \u043e\u0431\u044b\u0447\u043d\u043e \u0432\u044b\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u044e \u0431\u043e\u043b\u044c\u0448\u0443\u044e \u0441\u0442\u0430\u0442\u044c\u044e \u043d\u0430 \u0445\u0430\u0431\u0440. \u0410 \u043f\u0440\u043e \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0435 \u0441\u0442\u0430\u0442\u044c\u0438\/\u0438\u0434\u0435\u0438 \u043e\u0431\u044b\u0447\u043d\u043e \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u044e \u0443 \u0441\u0435\u0431\u044f \u0432 \u043a\u0430\u043d\u0430\u043b\u0435 &#8212; <a href=\"https:\/\/t.me\/CVML_team\"><u>https:\/\/t.me\/CVML_team<\/u><\/a> (\u0434\u0443\u0431\u043b\u0438\u0440\u0443\u044e \u0441\u044e\u0434\u0430 <a href=\"https:\/\/vk.com\/cvml_team\"><u>https:\/\/vk.com\/cvml_team<\/u><\/a> ).<\/p>\n<p>\u0410 \u0442\u0435\u043a\u0443\u0449\u0430\u044f \u0441\u0442\u0430\u0442\u044c\u044f, \u0435\u0441\u043b\u0438 \u043a\u043e\u043c\u0443 \u0443\u0434\u043e\u0431\u043d\u0435\u0435, \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 \u043d\u0430 youtube:<\/p>\n<p><iframe id=\"607f5fd529e351865d365475\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f5fd529e351865d365475\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/div>\n<p> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/company\/recognitor\/blog\/553478\/\"> https:\/\/habr.com\/ru\/company\/recognitor\/blog\/553478\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"\n<div class=\"post__text post__text_v2\" id=\"post-content-body\">\n<figure class=\"float full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041a\u0430\u0437\u0430\u043b\u043e\u0441\u044c \u0431\u044b, \u0440\u0435\u0432\u043e\u043b\u044e\u0446\u0438\u044f \u0441 Computer Vision \u0443\u0436\u0435 \u0431\u044b\u043b\u0430. \u0412 2012 \u0433\u043e\u0434\u0443 \u0432\u044b\u0441\u0442\u0440\u0435\u043b\u0438\u043b\u0438 \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u044b \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043d\u0430 <a href=\"https:\/\/en.wikipedia.org\/wiki\/Convolutional_neural_network\">\u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0445 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u044f\u0445<\/a>.  \u0413\u043e\u0434\u0430 \u0441 2014 \u043e\u043d\u0438 \u0434\u043e\u0448\u043b\u0438 \u0434\u043e \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u043d\u0430, \u0430 \u0433\u043e\u0434\u0430 \u0441 2016 \u0437\u0430\u043f\u043e\u043b\u043e\u043d\u0438\u043b\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/277069\/\">\u0432\u0441\u0435<\/a>.  \u041d\u043e, \u0432 \u043a\u043e\u043d\u0446\u0435 2020 \u0433\u043e\u0434\u0430 \u043f\u0440\u043e\u0448\u0435\u043b \u043d\u043e\u0432\u044b\u0439 \u0432\u0438\u0442\u043e\u043a. \u041d\u0430 \u044d\u0442\u043e\u0442 \u0440\u0430\u0437 \u043d\u0435 \u0437\u0430 4 \u0433\u043e\u0434\u0430, \u0430 \u0437\u0430 \u043e\u0434\u0438\u043d. \u043f\u043e\u0433\u043e\u0432\u043e\u0440\u0438\u043c \u043e \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445 \u0432 ComputerVision. \u0412 \u0441\u0442\u0430\u0442\u044c\u0435 \u0431\u0443\u0434\u0435\u0442 \u043e\u0431\u0437\u043e\u0440 \u043d\u043e\u0432\u0438\u043d\u043e\u043a, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043f\u043e\u044f\u0432\u0438\u043b\u0438\u0441\u044c \u0432 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0439 \u0433\u043e\u0434. \u0415\u0441\u043b\u0438 \u043a\u043e\u043c\u0443-\u0442\u043e \u0443\u0434\u043e\u0431\u043d\u0435\u0435, \u0442\u043e \u0441\u0442\u0430\u0442\u044c\u044f <a href=\"https:\/\/youtu.be\/xQFeeh5DqeY\">\u0434\u043e\u0441\u0442\u0443\u043f\u043d\u0430 <\/a>\u0432 \u0432\u0438\u0434\u0435 \u0432\u0438\u0434\u0435\u043e \u043d\u0430 youtube.<\/p>\n<p><a href=\"https:\/\/en.wikipedia.org\/wiki\/Transformer_(machine_learning_model)\">\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b <\/a>&#8212; \u044d\u0442\u043e \u0442\u0430\u043a\u043e\u0439 \u0442\u0438\u043f \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439, \u0441\u043e\u0437\u0434\u0430\u043d\u043d\u044b\u0445 \u0432 2017 \u0433\u043e\u0434\u0443.  \u0418\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e, \u043e\u043d\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438\u0441\u044c \u0434\u043b\u044f <a href=\"https:\/\/ai.googleblog.com\/2017\/08\/transformer-novel-neural-network.html\">\u043f\u0435\u0440\u0435\u0432\u043e\u0434\u043e\u0432<\/a>:<\/p>\n<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u043e, \u043a\u0430\u043a \u043e\u043a\u0430\u0437\u0430\u043b\u043e\u0441\u044c, \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u043a\u0430\u043a \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u044f\u0437\u044b\u043a\u0430. \u0418 \u043f\u043e\u0448\u043b\u043e-\u043f\u043e\u0435\u0445\u0430\u043b\u043e. \u0421\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e, \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u0430\u044f <a href=\"https:\/\/ru.wikipedia.org\/wiki\/GPT-3\">GPT-3<\/a> &#8212; \u043f\u043e\u0440\u043e\u0436\u0434\u0435\u043d\u0438\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432.  <\/p>\n<p>\u0410 \u0447\u0442\u043e \u0441 ComputerVision?<br \/>\u0410 \u0432\u043e\u0442 \u0442\u0443\u0442 \u0432\u0441\u0435 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u0435\u043d\u044c\u043a\u043e. \u041d\u0435 \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u0447\u0442\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0445\u043e\u0440\u043e\u0448\u043e \u043f\u043e\u0434\u0445\u043e\u0434\u044f\u0442 \u0434\u043b\u044f \u0442\u0430\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447. \u0412\u0441\u0435-\u0442\u0430\u043a\u0438 \u0432\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u0440\u044f\u0434\u044b, \u0434\u0430 \u043a \u0442\u043e\u043c\u0443 \u0436\u0435 \u043e\u0434\u043d\u043e\u043c\u0435\u0440\u043d\u044b\u0435. \u041d\u043e \u0443\u0436 \u0431\u043e\u043b\u044c\u043d\u043e \u0445\u043e\u0440\u043e\u0448\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u0432 \u0434\u0440\u0443\u0433\u0438\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445. \u0412 \u0441\u0432\u043e\u0435\u043c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0435 \u044f \u043f\u0440\u043e\u0439\u0434\u0443\u0441\u044c \u043f\u043e \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u043c \u0440\u0430\u0431\u043e\u0442\u0430\u043c, \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u043c \u043c\u0435\u0441\u0442\u0430\u043c \u0438\u0445 \u043f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u044f. \u041f\u043e\u0441\u0442\u0430\u0440\u0430\u044e\u0441\u044c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u0442\u044c \u043f\u0440\u043e \u0440\u0430\u0437\u043d\u044b\u0435 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u044b \u043a\u0430\u043a \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0441\u043c\u043e\u0433\u043b\u0438 \u0437\u0430\u043f\u0438\u0445\u0430\u0442\u044c \u0432 CV.<\/p>\n<h2>DETR<\/h2>\n<p>\u041d\u0430 \u0434\u0432\u043e\u0440\u0435 2020. \u041f\u043e\u043f\u0435\u0440\u043b\u043e. \u0421 \u0447\u0435\u0433\u043e? \u0422\u0443\u0442 \u0441\u043b\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0437\u0430\u0442\u044c. \u041d\u043e \u043c\u043d\u0435 \u043a\u0430\u0436\u0435\u0442\u0441\u044f, \u043d\u0430\u0434\u043e \u043d\u0430\u0447\u0430\u0442\u044c \u0441 <a href=\"https:\/\/github.com\/facebookresearch\/detr\">DETR<\/a> (End-to-End Object Detection with Transformers), \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0432\u044b\u0448\u0435\u043b \u0432 \u043c\u0430\u0435 2020 \u0433\u043e\u0434\u0430. \u0422\u0443\u0442 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u044e\u0442\u0441\u044f \u043d\u0435 \u043a \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044e, \u0430 \u043a \u0444\u0438\u0447\u0430\u043c \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043d\u044b\u043c \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u043e\u0439 \u0441\u0435\u0442\u044c\u044e:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0412 \u0442\u0430\u043a\u043e\u043c \u043f\u043e\u0434\u0445\u043e\u0434\u0435 \u043d\u0435\u0442 \u043e\u0441\u043e\u0431\u043e\u0439 \u043d\u043e\u0432\u0438\u0437\u043d\u044b, <a href=\"https:\/\/arxiv.org\/pdf\/1506.04878.pdf\">ReInspect <\/a>\u0432 2015 \u0434\u0435\u043b\u0430\u043b \u0447\u0442\u043e-\u0442\u043e \u043f\u043e\u0445\u043e\u0436\u0435\u0435, \u043f\u043e\u0434\u0430\u0432\u0430\u044f \u0432\u044b\u0445\u043e\u0434 BackBone \u0441\u0435\u0442\u0438 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0440\u0435\u043a\u0443\u0440\u0440\u0435\u043d\u0442\u043d\u043e\u0439 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u0438. \u041d\u043e \u043d\u0430 \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0440\u0435\u043a\u0443\u0440\u0440\u0435\u043d\u0442\u043d\u0430\u044f \u0441\u0435\u0442\u044c \u0445\u0443\u0436\u0435 \u0447\u0435\u043c \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 &#8212; \u043d\u0430\u0441\u0442\u043e\u043b\u044c\u043a\u043e \u0436\u0435 ReInspect \u043f\u0440\u043e\u0438\u0433\u0440\u044b\u0432\u0430\u043b Detr. \u0422\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u0438 \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0432\u044b\u0440\u043e\u0441\u043b\u043e \u0432 \u0440\u0430\u0437\u044b.&nbsp;  <\/p>\n<p>\u041a\u043e\u043d\u0435\u0447\u043d\u043e, \u0435\u0441\u0442\u044c \u043f\u0430\u0440\u0430 \u0437\u0430\u0431\u0430\u0432\u043d\u044b\u0445 \u0448\u0442\u0443\u043a, \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0434\u043e DETR \u043d\u0438\u043a\u0442\u043e \u043d\u0435 \u0434\u0435\u043b\u0430\u043b (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u043a\u0430\u043a \u0440\u0435\u0430\u043b\u0438\u0437\u0443\u0435\u0442\u0441\u044f \u043f\u043e\u0437\u0438\u0446\u0438\u043e\u043d\u043d\u043e\u0435 \u043a\u043e\u0434\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435, \u043a\u043e\u0442\u043e\u0440\u043e\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430).  \u042f \u043e\u043f\u0438\u0441\u0430\u043b \u0441\u0432\u043e\u0438 \u0432\u043f\u0435\u0447\u0430\u0442\u043b\u0435\u043d\u0438\u044f <a href=\"http:\/\/cv-blog.ru\/?p=310\">\u0442\u0443\u0442<\/a>.  <br \/>\u041c\u043e\u0433\u0443 \u043b\u0438\u0448\u044c \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c, \u0447\u0442\u043e DETR \u043e\u0442\u043a\u0440\u044b\u043b \u043f\u0443\u0442\u044c \u043a \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0434\u043b\u044f ComputerVision.\u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043b\u0438 \u0435\u0433\u043e \u043d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435? \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043b\u0438 \u043e\u043d \u0441\u0435\u0439\u0447\u0430\u0441? \u041d\u0435 \u0434\u0443\u043c\u0430\u044e:   <\/p>\n<ol>\n<li>\n<p>\u041e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u0435\u0433\u043e \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 &#8212; \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435, \u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u0432\u0440\u0435\u043c\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f.&nbsp; \u0427\u0430\u0441\u0442\u0438\u0447\u043d\u043e \u044d\u0442\u0443 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0443 \u0440\u0435\u0448\u0438\u043b <a href=\"https:\/\/github.com\/fundamentalvision\/Deformable-DETR\">Deformable DETR<\/a>. <\/p>\n<\/li>\n<li>\n<p>DETR \u043d\u0435 \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u044b\u0439. \u0415\u0441\u0442\u044c \u0437\u0430\u0434\u0430\u0447\u0438 \u0433\u0434\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043b\u0443\u0447\u0448\u0435 \u0434\u0440\u0443\u0433\u0438\u0435 \u043f\u043e\u0434\u0445\u043e\u0434\u044b. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0442\u043e\u0442 \u0436\u0435 <a href=\"https:\/\/github.com\/saic-vul\/iterdet\">iterdet<\/a>. \u041d\u043e \u0432 \u043a\u0430\u043a\u0438\u0445-\u0442\u043e \u0437\u0430\u0434\u0430\u0447\u0430\u0445 \u043b\u0438\u0434\u0435\u0440\u0441\u0442\u0432\u043e \u0434\u0435\u0440\u0436\u0438\u0442 \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 (\u0438\u043b\u0438 \u0435\u0433\u043e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u044b\u0435 &#8212; <a href=\"https:\/\/paperswithcode.com\/sota\/panoptic-segmentation-on-coco-panoptic\"><u>https:\/\/paperswithcode.com\/sota\/panoptic-segmentation-on-coco-panoptic<\/u><\/a> ).<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<\/li>\n<\/ol>\n<p>\u0421\u0440\u0430\u0437\u0443 \u043f\u043e\u0441\u043b\u0435 DETR \u0432\u044b\u0448\u0435\u043b <strong>Visual Transformer<\/strong> (<a href=\"https:\/\/arxiv.org\/pdf\/2006.03677.pdf\">\u0441\u0442\u0430\u0442\u044c\u044f  <\/a>+ <a href=\"https:\/\/habr.com\/ru\/company\/ru_mts\/blog\/512258\/\">\u043d\u0435\u043f\u043b\u043e\u0445\u043e\u0439 \u043e\u0431\u0437\u043e\u0440<\/a>) \u0434\u043b\u044f \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438. \u0422\u0443\u0442 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0442\u043e\u0436\u0435 \u0431\u0435\u0440\u0443\u0442 \u0432\u044b\u0445\u043e\u0434\u043d\u043e\u0439 Feature map \u0441 \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u0433\u043e backbone:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u042f \u0431\u044b \u043d\u0435 \u043d\u0430\u0437\u0432\u0430\u043b Visual Transformer \u0431\u043e\u043b\u044c\u0448\u0438\u043c \u0448\u0430\u0433\u043e\u043c, \u043d\u043e \u044d\u0442\u043e \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u043d\u0430\u044f \u0434\u043b\u044f \u0442\u0435\u0445 \u0432\u0440\u0435\u043c\u0435\u043d \u043c\u044b\u0441\u043b\u044c. \u041f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043a \u0442\u0435\u043c \u0438\u043b\u0438 \u0438\u043d\u044b\u043c \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043d\u044b\u043c \u0447\u0435\u0440\u0435\u0437 backbone \u0444\u0438\u0447\u0430\u043c.&nbsp;  <\/p>\n<h2>VIT<\/h2>\n<p>\u041f\u043e\u0435\u0445\u0430\u043b\u0438 \u0434\u0430\u043b\u044c\u0448\u0435. \u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0448\u0430\u0433 \u044d\u0442\u043e  <a href=\"https:\/\/ai.googleblog.com\/2020\/12\/transformers-for-image-recognition-at.html%20\">ViT<\/a>:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041e\u043d \u0431\u044b\u043b <a href=\"https:\/\/ai.googleblog.com\/2020\/12\/transformers-for-image-recognition-at.html\">\u043e\u043f\u0443\u0431\u043b\u0438\u043a\u043e\u0432\u0430\u043d <\/a>\u0432 <a href=\"https:\/\/arxiv.org\/pdf\/2010.11929.pdf%20\">\u043d\u0430\u0447\u0430\u043b\u0435 \u0434\u0435\u043a\u0430\u0431\u0440\u044f<\/a> 2020 \u0433\u043e\u0434\u0430 (<a href=\"https:\/\/github.com\/lucidrains\/vit-pytorch\">\u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f<\/a>). \u0418 \u0442\u0443\u0442 \u0432\u0441\u0435 \u0443\u0436\u0435 \u043f\u043e-\u0432\u0437\u0440\u043e\u0441\u043b\u043e\u043c\u0443. \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043a\u0430\u043a \u043e\u043d \u0435\u0441\u0442\u044c. \u041a\u0430\u0440\u0442\u0438\u043d\u043a\u0430 \u0440\u0430\u0437\u0431\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u043d\u0430 \u043c\u0438\u043d\u0438-\u0443\u0447\u0430\u0441\u0442\u043a\u0438 16*16. \u041a\u0430\u0436\u0434\u044b\u0439 \u0443\u0447\u0430\u0441\u0442\u043e\u043a \u043f\u043e\u0434\u0430\u0435\u0442\u0441\u044f \u0432 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043a\u0430\u043a \u201c\u0441\u043b\u043e\u0432\u043e\u201d, \u0434\u043e\u043f\u043e\u043b\u043d\u044f\u044f\u0441\u044c \u043f\u043e\u0437\u0438\u0446\u0438\u043e\u043d\u043d\u044b\u043c \u044d\u043d\u043a\u043e\u0434\u0435\u0440\u043e\u043c.&nbsp;<\/p>\n<p>\u0418, \u0432\u043d\u0435\u0437\u0430\u043f\u043d\u043e, \u044d\u0442\u043e \u0432\u0441\u0435 \u0437\u0430\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u041d\u0435 \u0441\u0447\u0438\u0442\u0430\u044f \u0442\u043e\u0433\u043e \u0447\u0442\u043e \u0443\u0447\u0438\u043b\u043e\u0441\u044c \u0432\u0441\u0435 \u0434\u043e\u043b\u0433\u043e (\u0438 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0435 state-of-art). \u0418 \u043d\u0430 \u0431\u0430\u0437\u0430\u0445 \u043c\u0435\u043d\u044c\u0448\u0435 14 \u043c\u0438\u043b\u043b\u0438\u043e\u043d\u043e\u0432 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e \u043a\u0430\u043a-\u0442\u043e \u043d\u0435 \u0442\u043e\u043f\u043e\u0432\u043e. <br \/>\u041d\u043e \u0432\u0441\u0435 \u044d\u0442\u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0440\u0435\u0448\u0438\u043b \u0430\u043d\u0430\u043b\u043e\u0433. \u041d\u0430 \u044d\u0442\u043e\u0442 \u0440\u0430\u0437 <a href=\"https:\/\/github.com\/facebookresearch\/deit\">\u043e\u0442 FaceBook <\/a>&#8212; <a href=\"https:\/\/arxiv.org\/pdf\/2012.12877.pdf\">Deit<\/a>. \u041a\u043e\u0442\u043e\u0440\u044b\u0439 \u0441\u0438\u043b\u044c\u043d\u043e \u0443\u043f\u0440\u043e\u0449\u0430\u043b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0438 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441.  <\/p>\n<p>\u041d\u0430 \u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u044d\u0442\u043e\u0442 \u043f\u043e\u0434\u0445\u043e\u0434 \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u0434\u0435\u0440\u0436\u0438\u0442 \u043f\u0435\u0440\u0432\u044b\u0435 \u043c\u0435\u0441\u0442\u0430 \u043f\u043e\u0447\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044f\u0445 &#8212; https:\/\/paperswithcode.com\/paper\/going-deeper-with-image-transformers  <\/p>\n<p>\u041d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435 \u043c\u044b \u043a\u0430\u043a-\u0442\u043e \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0432 \u043e\u0434\u043d\u043e\u0439 \u0437\u0430\u0434\u0430\u0447\u0435. \u041d\u043e, \u0441 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c \u0432 ~2-3 \u0442\u044b\u0441\u044f\u0447\u0438 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a, \u0432\u0441\u0435 \u044d\u0442\u043e \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0437\u0430\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u0418 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0435 ResNet&nbsp; \u0431\u044b\u043b\u0438 \u043a\u0443\u0434\u0430 \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u0435\u0435 \u0438 \u043b\u0443\u0447\u0448\u0435.&nbsp;   <\/p>\n<h2>CLIP   <\/h2>\n<p>\u041f\u043e\u0439\u0434\u0435\u043c \u0434\u0430\u043b\u044c\u0448\u0435. <a href=\"https:\/\/openai.com\/blog\/clip\/\">CLIP<\/a>. \u042d\u0442\u043e \u043e\u0447\u0435\u043d\u044c \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0441\u043e\u0432\u0441\u0435\u043c \u0441 \u0434\u0440\u0443\u0433\u043e\u0439 \u0441\u0442\u043e\u0440\u043e\u043d\u044b. \u0412 CLIP \u0437\u0430\u0434\u0430\u0447\u0430 \u043f\u0435\u0440\u0435\u0444\u043e\u0440\u043c\u0443\u043b\u0438\u0440\u043e\u0432\u0430\u043d\u0430. \u0417\u0430\u0434\u0430\u0447\u0430 \u043d\u0435 \u0432 \u0442\u043e\u043c \u0447\u0442\u043e\u0431\u044b \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0442\u044c \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435, \u0430 \u043d\u0430\u0439\u0442\u0438 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e \u0431\u043b\u0438\u0437\u043a\u043e\u0435 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0434\u043b\u044f \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f. \u0417\u0434\u0435\u0441\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0443\u0447\u0438\u0442 \u043b\u0438\u043d\u0433\u0432\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0447\u0430\u0441\u0442\u044c \u044d\u043c\u0431\u0435\u0434\u0438\u043d\u0433\u0430, \u0430 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u0430\u044f \u0441\u0435\u0442\u044c &#8212; \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u044d\u043c\u0431\u0435\u0434\u0438\u043d\u0433\u0438:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0422\u0430\u043a\u0430\u044f \u0448\u0442\u0443\u043a\u0430 \u0443\u0447\u0438\u0442\u044c\u0441\u044f \u043e\u0447\u0435\u043d\u044c \u0434\u043e\u043b\u0433\u043e, \u0437\u0430\u0442\u043e \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u043e\u0439. \u041e\u043d \u043d\u0435 \u0434\u0435\u0433\u0440\u0430\u0434\u0438\u0440\u0443\u0435\u0442 \u043f\u0440\u0438 \u0441\u043c\u0435\u043d\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. \u0421\u0435\u0442\u044c \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u0430 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u0442\u044c \u0432\u0435\u0449\u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0432\u0438\u0434\u0435\u043b\u0430 \u0441\u043e\u0432\u0441\u0435\u043c \u0432 \u0434\u0440\u0443\u0433\u043e\u043c \u0432\u0438\u0434\u0435:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0418\u043d\u043e\u0433\u0434\u0430 \u044d\u0442\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0434\u0430\u0436\u0435 \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u043a\u0440\u0443\u0442\u043e:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u043e, \u043d\u0435 \u0441\u043c\u043e\u0442\u0440\u044f \u043d\u0430 \u0442\u043e \u0447\u0442\u043e \u044d\u0442\u043e \u0445\u043e\u0440\u043e\u0448\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043d\u0430 \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 &#8212; \u044d\u0442\u043e \u043d\u0435 \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u044b\u0439 \u043f\u043e\u0434\u0445\u043e\u0434:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0422\u0443\u0442 \u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0441 \u043b\u0438\u043d\u0435\u0439\u043d\u044b\u043c \u043f\u0440\u0438\u0431\u043b\u0438\u0436\u0435\u043d\u0438\u0435\u043c ResNet50. \u041d\u043e \u043d\u0430\u0434\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u0442\u044c, \u0447\u0442\u043e \u043f\u043e \u0447\u0430\u0441\u0442\u0438 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0441\u0438\u043b\u044c\u043d\u043e \u0445\u0443\u0436\u0435 \u0447\u0435\u043c \u043c\u043e\u0434\u0435\u043b\u044c\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u0430\u044f \u043f\u043e 100 \u043a\u0430\u0440\u0442\u0438\u043d\u043a\u0430\u043c.<\/p>\n<p>\u041c\u044b \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b\u0438 \u0438\u0437 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u0430 \u043f\u0440\u043e\u0442\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u0437\u0430\u0434\u0430\u0447\u0430\u0445, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0439\/\u043e\u0434\u0435\u0436\u0434\u044b. \u0418 \u0432\u0435\u0437\u0434\u0435 CLIP \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043e\u0447\u0435\u043d\u044c \u043f\u043b\u043e\u0445\u043e. \u0412\u043e\u043e\u0431\u0449\u0435 \u043f\u0440\u043e CLIP \u043c\u043e\u0436\u043d\u043e \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043e\u0447\u0435\u043d\u044c \u0434\u043e\u043b\u0433\u043e. \u041d\u0430 \u0425\u0430\u0431\u0440\u0435 \u0435\u0441\u0442\u044c <a href=\"https:\/\/habr.com\/ru\/post\/539312\/\">\u0445\u043e\u0440\u043e\u0448\u0430\u044f \u0441\u0442\u0430\u0442\u044c\u044f<\/a>. \u0410 \u044f \u0434\u0435\u043b\u0430\u043b \u0432\u0438\u0434\u0435\u043e, \u0433\u0434\u0435 \u0433\u043e\u0432\u043e\u0440\u0438\u043b \u043f\u0440\u043e \u043d\u0435\u0433\u043e:<\/p>\n<p><iframe id=\"607f328d388fa3867a8ff42d\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f328d388fa3867a8ff42d\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/p>\n<h2>Vision Transformers for Dense Prediction  <\/h2>\n<p>\u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0430\u044f \u0441\u0435\u0442\u043a\u0430, \u043a\u043e\u0442\u043e\u0440\u0430\u044f, \u043d\u0430 \u043c\u043e\u0439 \u0432\u0437\u0433\u043b\u044f\u0434 \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u0430 &#8212; \u201c<a href=\"https:\/\/arxiv.org\/pdf\/2103.13413.pdf\">Vision Transformers for Dense Prediction<\/a>\u201d, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0432\u044b\u0448\u043b\u0430 \u043c\u0435\u0441\u044f\u0446 \u043d\u0430\u0437\u0430\u0434. \u0412 \u043d\u0435\u0439 \u043c\u043e\u0436\u043d\u043e \u043f\u0435\u0440\u0435\u043a\u043b\u044e\u0447\u0430\u0442\u044c\u0441\u044f \u043c\u0435\u0436\u0434\u0443 \u043f\u043e\u0434\u0445\u043e\u0434\u0430\u043c\u0438 Vit\/Detr. \u041c\u043e\u0436\u043d\u043e \u0434\u043b\u044f \u043f\u0435\u0440\u0432\u043e\u0433\u043e \u0443\u0440\u043e\u0432\u043d\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0441\u0432\u0435\u0440\u0442\u043a\u0438, \u0430 \u043c\u043e\u0436\u043d\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b.   <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u0441\u0435\u0442\u043a\u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u043d\u0435 \u0434\u043b\u044f \u0434\u0435\u0442\u0435\u043a\u0446\u0438\u0438\/\u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438, \u0430 \u0434\u043b\u044f \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438\/\u043e\u0446\u0435\u043d\u043a\u0438 \u0433\u043b\u0443\u0431\u0438\u043d\u044b. \u0427\u0442\u043e \u0434\u0430\u0435\u0442 <a href=\"https:\/\/paperswithcode.com\/paper\/vision-transformers-for-dense-prediction\">State-of-art \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442<\/a> \u0441\u0440\u0430\u0437\u0443 \u043f\u043e \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u044f\u043c, \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u0432 RealTime. \u0412\u043e\u043e\u0431\u0449\u0435 \u043e\u0447\u0435\u043d\u044c \u043f\u0435\u0447\u0430\u043b\u044c\u043d\u043e \u0447\u0442\u043e  @<a href=\"https:\/\/habr.com\/users\/AlexeyAB\/\"><strong>AlexeyAB<\/strong><\/a>  (\u0430\u0432\u0442\u043e\u0440 <a href=\"https:\/\/habr.com\/ru\/post\/503200\/&nbsp;\">Yolov4  <\/a>\u0438 \u043e\u0434\u0438\u043d \u0438\u0437 \u0430\u0432\u0442\u043e\u0440\u043e\u0432 \u0441\u0442\u0430\u0442\u044c\u0438), \u043d\u0435 \u0431\u0430\u0445\u043d\u0443\u043b \u0441\u044e\u0434\u0430 \u043f\u0443\u0431\u043b\u0438\u043a\u0430\u0446\u0438\u044e \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u0443\u044e \u043f\u0440\u043e \u043d\u0435\u0433\u043e. \u0412 \u0446\u0435\u043b\u043e\u043c \u0441\u0435\u0442\u043a\u0430 \u043f\u0440\u0438\u044f\u0442\u043d\u0430\u044f, \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u0435\u0442\u0441\u044f \u0438\u0437 \u043a\u043e\u0440\u043e\u0431\u043a\u0438, \u043d\u043e \u043f\u043e\u043a\u0430 \u043d\u0438\u0433\u0434\u0435 \u043d\u0435 \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b. \u0415\u0441\u043b\u0438 \u043a\u043e\u043c\u0443-\u0442\u043e \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e, \u044f \u0434\u0435\u043b\u0430\u043b \u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u044b\u0439 \u043e\u0431\u0437\u043e\u0440 \u0442\u0443\u0442:<\/p>\n<p><iframe id=\"607f33526c0aef8697ca9187\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f33526c0aef8697ca9187\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/p>\n<h2>&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;&#8212;<\/h2>\n<p>\u0412 \u044d\u0442\u043e\u043c \u043c\u0435\u0441\u0442\u0435 \u043d\u0443\u0436\u043d\u043e \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u043f\u0435\u0440\u0435\u0445\u043e\u0434\u043d\u0443\u0442\u044c. \u0412\u0441\u0435 \u0447\u0442\u043e \u0431\u044b\u043b\u043e \u0432\u044b\u0448\u0435 &#8212; \u044d\u0442\u043e \u0441\u0430\u043c\u044b\u0435 \u044f\u0440\u043a\u0438\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0445 \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432:<\/p>\n<ul>\n<li>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0434\u043b\u044f \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u043e\u0439 \u0441\u0435\u0442\u0438<\/p>\n<\/li>\n<li>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0434\u043b\u044f \u043d\u0430\u0445\u043e\u0436\u0434\u0435\u043d\u0438\u044f \u043b\u043e\u0433\u0438\u043a\u0438 \u043f\u043e\u0432\u0435\u0440\u0445 \u0432\u044b\u0434\u0430\u0447\u0438 \u0441\u0435\u0442\u0438<\/p>\n<\/li>\n<li>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u044f\u0441\u044c \u043a \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044e<\/p>\n<\/li>\n<li>\n<p>\u0413\u0438\u0431\u0440\u0438\u0434 \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432 1-2<\/p>\n<\/li>\n<\/ul>\n<p>\u0412\u0441\u0435 \u0447\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0438\u0436\u0435 &#8212; \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u0442\u043e\u0433\u043e \u043a\u0430\u043a \u0442\u0435 \u0436\u0435 \u0441\u0430\u043c\u044b\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b\/\u043f\u043e\u0434\u0445\u043e\u0434\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0434\u043b\u044f \u0434\u0440\u0443\u0433\u0438\u0445 \u0437\u0430\u0434\u0430\u0447. \u041f\u043e\u0435\u0445\u0430\u043b\u0438.  <\/p>\n<h2>PoseFormer  <\/h2>\n<p><a href=\"https:\/\/github.com\/zczcwh\/PoseFormer\">Pose3D<\/a>. \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u0442\u044c \u0438 \u043a \u044f\u0432\u043d\u044b\u043c \u0444\u0438\u0447\u0430\u043c, \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u043d\u044b\u043c \u0443\u0436\u0435 \u0433\u043e\u0442\u043e\u0432\u043e\u0439 \u0441\u0435\u0442\u044c\u044e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u043a \u0441\u043a\u0435\u043b\u0435\u0442\u0430\u043c:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0412 \u044d\u0442\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u0435 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0434\u043b\u044f \u0432\u043e\u0441\u0441\u0442\u0430\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f 3\u0434 \u043c\u043e\u0434\u0435\u043b\u0438 \u0447\u0435\u043b\u043e\u0432\u0435\u043a\u0430 \u043f\u043e \u0441\u0435\u0440\u0438\u0438 \u043a\u0430\u0434\u0440\u043e\u0432. \u0412 CherryLabs \u043c\u044b \u0434\u0435\u043b\u0430\u043b\u0438 \u0442\u0430\u043a\u043e\u0435 (\u0438 \u0431\u043e\u043b\u0435\u0435 \u0441\u043b\u043e\u0436\u043d\u044b\u0435 \u0440\u0435\u043a\u043e\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0438) \u0435\u0449\u0451 \u0433\u043e\u0434\u0430 3 \u043d\u0430\u0437\u0430\u0434, \u0442\u043e\u043b\u044c\u043a\u043e \u0431\u0435\u0437 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432, \u0441 \u044d\u043c\u0431\u0435\u0434\u0438\u043d\u0433\u0430\u043c\u0438. \u041d\u043e, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0442 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u044d\u0442\u043e \u0431\u044b\u0441\u0442\u0440\u0435\u0435 \u0438 \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u0435\u0435. \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 &#8212; \u0432\u043f\u043e\u043b\u043d\u0435 \u043d\u0435\u043f\u043b\u043e\u0445\u043e\u0435 \u0438 \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u043e\u0435 3D, \u0431\u0435\u0437 \u043f\u0435\u0440\u0435\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041f\u043b\u044e\u0441 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0432 \u0434\u0430\u043d\u043d\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 &#8212; \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 \u0434\u0430\u043d\u043d\u044b\u043c\u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0435 \u043e\u0431\u043b\u0430\u0434\u0430\u044e\u0442 \u043b\u043e\u043a\u0430\u043b\u044c\u043d\u043e\u0439 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0435\u0439. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 (\u0432 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0445). \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0443 \u043e\u0431\u0443\u0447\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u0441\u043b\u043e\u0436\u043d\u044b\u0435 \u0438 \u0440\u0430\u0437\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043d\u044b\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u044b.<\/p>\n<p>\u0415\u0441\u043b\u0438 \u0447\u0442\u043e, \u0438\u0434\u0435\u044f \u043f\u0440\u0438\u0448\u043b\u0430 \u043e\u0434\u043d\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e \u043c\u043d\u043e\u0433\u043e \u043a\u043e\u043c\u0443. \u0412\u043e\u0442 <a href=\"https:\/\/arxiv.org\/pdf\/2103.14304v5.pdf\">\u0435\u0449\u0451 \u043e\u0434\u0438\u043d \u043f\u043e\u0434\u0445\u043e\u0434<\/a>\/\u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0442\u043e\u0439 \u0436\u0435 \u0438\u0434\u0435\u0438.<\/p>\n<h2>TransPose   <\/h2>\n<p>\u0415\u0441\u043b\u0438 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0433\u0434\u0435 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 \u043d\u0435 \u0445\u0432\u0430\u0442\u0430\u0435\u0442 \u0438\u043c\u0435\u043d\u043d\u043e \u043f\u043e\u0442\u043e\u043c\u0443 \u0447\u0442\u043e \u043f\u0440\u0438\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u0435\u0442 \u0432\u043b\u043e\u0436\u0435\u043d\u043d\u0430\u044f \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u044f\u044f \u043b\u043e\u0433\u0438\u043a\u0430 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f, \u0442\u043e \u0441\u0440\u0430\u0437\u0443 \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442 \u043d\u0430 \u0443\u043c \u0438\u043c\u0435\u043d\u043d\u043e \u043f\u043e\u0437\u0430. <a href=\"https:\/\/github.com\/yangsenius\/TransPose\">TransPose  <\/a>&#8212; \u0441\u0435\u0442\u043a\u0430 \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0435\u0442 \u043f\u043e\u0437\u0443 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u0443\u044f \u0441\u0432\u0435\u0440\u0442\u043a\u0438:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0421\u0440\u0430\u0432\u043d\u0438\u0442\u0435 \u0441 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u043c\u0438 \u043f\u043e\u0434\u0445\u043e\u0434\u0430\u043c\u0438 \u0432 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0438 \u043f\u043e\u0437\u044b (\u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0441\u0442\u0430\u0440\u0430\u044f \u0432\u0435\u0440\u0441\u0438\u044f <a href=\"https:\/\/russianblogs.com\/article\/7823213439\/%20%20https:\/\/arxiv.org\/pdf\/1812.08008.pdf\">OpenPose<\/a>)   <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0418 \u0442\u0430\u043a\u0438\u0445 \u0441\u0442\u0435\u0439\u0434\u0436\u0435\u0439 \u0431\u044b\u043b\u043e \u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0440\u0430\u0431\u043e\u0442\u0430\u0445 \u0434\u043e \u0434\u0435\u0441\u044f\u0442\u043a\u0430. \u0421\u0435\u0439\u0447\u0430\u0441 \u043e\u043d\u0438 \u0437\u0430\u043c\u0435\u043d\u0435\u043d\u044b \u043e\u0434\u043d\u0438\u043c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u043c. <a href=\"https:\/\/arxiv.org\/pdf\/2012.14214.pdf%20\">\u041f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f<\/a>, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0441\u0438\u043b\u044c\u043d\u043e \u043b\u0443\u0447\u0448\u0435 \u0447\u0435\u043c \u0443 \u0441\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<h2>SWIN  <\/h2>\n<p>\u0412\u044b\u0448\u0435 \u043c\u044b \u0443\u0436\u0435 \u0443\u043f\u043e\u043c\u0438\u043d\u0430\u043b\u0438 \u043e\u0434\u043d\u0443 \u0441\u0435\u0442\u043a\u0443 \u043f\u043e \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438 \u043d\u0430 \u0431\u0430\u0437\u0435 \u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u043e\u0442 Intel. <a href=\"https:\/\/arxiv.org\/pdf\/2103.14030.pdf\">SWIN <\/a>\u043e\u0442 <a href=\"https:\/\/github.com\/microsoft\/Swin-Transformer\">Microsoft <\/a>\u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043b\u0443\u0447\u0448\u0435, \u043d\u043e \u0443\u0436\u0435 \u043d\u0435 \u0432 RealTime.\u041f\u043e \u0441\u0443\u0442\u0438 \u044d\u0442\u043e \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u043d\u044b\u0439 \u0438 \u0440\u0430\u0441\u0448\u0438\u0440\u0435\u043d\u043d\u044b\u0439 VIT\/Deit, \u043f\u0435\u0440\u0435\u0440\u0430\u0431\u043e\u0442\u0430\u043d\u043d\u044b\u0439 \u043f\u043e\u0434 \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u044e:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u042d\u0442\u043e \u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u043d\u0430 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u0438, \u0437\u0430\u0442\u043e \u0432\u043d\u0443\u0448\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e, \u043b\u0438\u0434\u0435\u0440\u0441\u0442\u0432\u043e \u0432 \u043c\u043d\u043e\u0436\u0435\u0441\u0442\u0432\u0435 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0439 &#8212;   <a href=\"https:\/\/paperswithcode.com\/paper\/swin-transformer-hierarchical-vision\"><u>https:\/\/paperswithcode.com\/paper\/swin-transformer-hierarchical-vision<\/u><\/a>  <\/p>\n<h2>LOFTR<\/h2>\n<p>\u0415\u0441\u0442\u044c \u0437\u0430\u0434\u0430\u0447\u0438 \u0432 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0441\u0432\u0435\u0440\u0442\u043e\u0447\u043d\u044b\u0435 \u0441\u0435\u0442\u0438 \u0432\u043e\u043e\u0431\u0449\u0435 \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0437\u0430\u0434\u0430\u0447\u0430 \u0441\u043e\u043f\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044f \u0434\u0432\u0443\u0445 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439. \u0413\u043e\u0434\u0430 \u043f\u043e\u043b\u0442\u043e\u0440\u0430 \u043d\u0430\u0437\u0430\u0434 \u0434\u043b\u044f \u0442\u0430\u043a\u043e\u0433\u043e \u0437\u0430\u0447\u0430\u0441\u0442\u0443\u044e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d \u0447\u0435\u0440\u0435\u0437 SIFT\/SURF+RANSAK ( <a href=\"https:\/\/local-features-tutorial.github.io\/pdfs\/Local_features_from_paper_to_practice.pdf\">\u0445\u043e\u0440\u043e\u0448\u0438\u0439 \u0433\u0430\u0439\u0434 \u043d\u0430 \u044d\u0442\u0443 \u0442\u0435\u043c\u0443<\/a>  + <a href=\"https:\/\/youtu.be\/kBZVZbKiTk4\">\u0432\u0438\u0434\u0435\u043e <\/a>\u043a\u043e\u0442\u043e\u0440\u043e\u0435 \u044f \u0437\u0430\u043f\u0438\u0441\u044b\u0432\u0430\u043b \u0433\u043e\u0434 \u043d\u0430\u0437\u0430\u0434 ). \u0413\u043e\u0434 \u043d\u0430\u0437\u0430\u0434 \u043f\u043e\u044f\u0432\u0438\u043b\u0441\u044f <a href=\"https:\/\/arxiv.org\/pdf\/1911.11763.pdf\">SuperGlue<\/a>&#8212; \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0435 \u043a\u0440\u0443\u0442\u043e\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 <a href=\"http:\/\/cv-blog.ru\/?p=341\">Graph Neural Network \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u044f \u0432\u0438\u0434\u0435\u043b<\/a> \u0432 ComputerVision. \u041f\u0440\u0438 \u044d\u0442\u043e\u043c SuperGlue \u0440\u0435\u0448\u0430\u043b \u0442\u043e\u043b\u044c\u043a\u043e \u0437\u0430\u0434\u0430\u0447\u0443 \u0441\u043e\u043f\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044f. \u0410 \u0442\u0435\u043f\u0435\u0440\u044c \u0435\u0441\u0442\u044c \u0440\u0435\u0448\u0435\u043d\u0438\u0435 \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445,<a href=\"https:\/\/zju3dv.github.io\/loftr\/\"> LOFTR<\/a>  \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 End-To-End:<\/p>\n<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0421\u0430\u043c \u044f \u043f\u043e\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u043d\u0435 \u0443\u0441\u043f\u0435\u043b, \u043d\u043e \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u043a\u0440\u0443\u0442\u043e:<\/p>\n<p><iframe id=\"607f3605563ace6d7a18d81b\" src=\"https:\/\/embedd.srv.habr.com\/iframe\/607f3605563ace6d7a18d81b\" class=\"embed_video embed__content\" allowfullscreen=\"true\"><\/iframe><\/p>\n<h2>\u0420\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0439  <\/h2>\n<p>\u0412 \u0446\u0435\u043b\u043e\u043c, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0445\u043e\u0440\u043e\u0448\u0438 \u0432\u0441\u044e\u0434\u0443 \u0433\u0434\u0435 \u0435\u0441\u0442\u044c \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438, \u0441\u043b\u043e\u0436\u043d\u0430\u044f \u043b\u043e\u0433\u0438\u0447\u0435\u0441\u043a\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0438\u043b\u0438 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u0438\u0445 \u0430\u043d\u0430\u043b\u0438\u0437. \u0423\u0436\u0435 \u0435\u0441\u0442\u044c \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0435\u0442\u0435\u0439 \u0433\u0434\u0435 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u044e\u0442\u0441\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u043c\u0438: (<a href=\"https:\/\/arxiv.org\/pdf\/2102.00719.pdf\">Video Transformer Network<\/a>, <a href=\"https:\/\/github.com\/Axe--\/ActionBERT\">ActionBert<\/a>). \u041e\u0431\u0435\u0449\u0430\u044e\u0442 \u0432 \u0431\u043b\u0438\u0436\u0430\u0439\u0448\u0435\u0435 \u0432\u0440\u0435\u043c\u044f \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0432 <a href=\"https:\/\/github.com\/open-mmlab\/mmaction2\">MMAction<\/a>.<\/p>\n<figure class=\"\"><figcaption><\/figcaption><\/figure>\n<h2>\u0422\u0440\u0435\u043a\u0438\u043d\u0433  <\/h2>\n<p>\u042f \u0443\u0436\u0435 \u043f\u0438\u0441\u0430\u043b \u0433\u043e\u0434 \u043d\u0430\u0437\u0430\u0434 <a href=\"https:\/\/habr.com\/ru\/company\/recognitor\/blog\/505694\/%20\">\u043e\u0433\u0440\u043e\u043c\u043d\u0443\u044e \u0441\u0442\u0430\u0442\u044c\u044e \u043d\u0430 \u0425\u0430\u0431\u0440\u0435 <\/a>\u0447\u0442\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0432 \u0442\u0440\u0435\u043a\u0438\u043d\u0433\u0435 \u0438 \u043a\u0430\u043a \u0442\u0440\u0435\u043a\u0430\u0442\u044c \u043e\u0431\u044a\u0435\u043a\u0442\u044b. \u041c\u043d\u043e\u0436\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432, \u0441\u043b\u043e\u0436\u043d\u0430\u044f \u043b\u043e\u0433\u0438\u043a\u0430. \u041f\u0440\u043e\u0448\u0435\u043b \u0432\u0441\u0435\u0433\u043e \u0433\u043e\u0434, \u0438 \u043f\u043e <a href=\"https:\/\/paperswithcode.com\/task\/visual-object-tracking\">\u043c\u043d\u043e\u0433\u0438\u043c \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430\u043c<\/a> \u0435\u0441\u0442\u044c \u0431\u0435\u0437\u0443\u0441\u043b\u043e\u0432\u043d\u044b\u0439 \u043b\u0438\u0434\u0435\u0440 &#8212; <a href=\"https:\/\/github.com\/researchmm\/Stark\">STARK<\/a>:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u041a\u043e\u043d\u0435\u0447\u043d\u043e, \u043e\u043d \u043d\u0435 \u0440\u0435\u0448\u0430\u0435\u0442 \u0432\u0441\u0435\u0445 \u043a\u0435\u0439\u0441\u043e\u0432. \u0418 \u043d\u0435 \u0432\u043e \u0432\u0441\u0435\u0445 \u043a\u0435\u0439\u0441\u0430\u0445 \u043f\u043e\u0431\u0435\u0436\u0434\u0430\u044e\u0442 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b. \u041d\u043e, \u0441\u043a\u043e\u0440\u0435\u0435 \u0432\u0441\u0435\u0433\u043e, \u044d\u0442\u043e \u043d\u0435 \u043d\u0430\u0434\u043e\u043b\u0433\u043e.   \u0412\u043e\u0442, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440,<a href=\"https:\/\/arxiv.org\/pdf\/2104.07244v1.pdf\"> \u0442\u0440\u0435\u043a\u0438\u043d\u0433 \u0433\u043b\u0430\u0437<\/a> \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445.  <a href=\"https:\/\/github.com\/chenxin-dlut\/TransT\">\u0412\u043e\u0442 \u0442\u0440\u0435\u043a\u0438\u043d\u0433 \u043f\u043e \u0442\u0438\u043f\u0443 \u0441\u0438\u0430\u043c\u0441\u043a\u0438\u0445 \u0441\u0435\u0442\u0435\u0439<\/a> \u043f\u0430\u0440\u0443 \u043d\u0435\u0434\u0435\u043b\u044c\u043d\u043e\u0439 \u0434\u0430\u0432\u043d\u043e\u0441\u0442\u0438.  \u0412\u043e\u0442 \u0442\u0440\u0435\u043a\u0438\u043d\u0433 BBOX + \u0444\u0438\u0447\u0438 <a href=\"https:\/\/github.com\/PeizeSun\/TransTrack\">\u043e\u0434\u0438\u043d<\/a>, \u0430 \u0432\u043e\u0442 <a href=\"https:\/\/arxiv.org\/pdf\/2101.02702v1.pdf\">\u0434\u0440\u0443\u0433\u043e\u0439<\/a>, \u0441 \u043f\u043e\u0447\u0442\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u043c\u0438 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f\u043c\u0438  <\/p>\n<figure class=\"full-width\"><figcaption>TransTrack<\/figcaption><\/figure>\n<figure class=\"\"><figcaption>TransT<\/figcaption><\/figure>\n<p>\u0418 \u0432\u0441\u0435 \u0438\u043c\u0435\u044e\u0442 \u043d\u0435\u043f\u043b\u043e\u0445\u0438\u0435 \u0441\u043a\u043e\u0440\u044b.<\/p>\n<h2>ReID  <\/h2>\n<p>\u0420\u0435\u0438\u043d\u0434\u0435\u043d\u0442\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u044e \u043c\u043e\u0436\u043d\u043e \u0432\u044b\u043d\u0435\u0441\u0442\u0438 \u0438\u0437 \u0442\u0440\u0435\u043a\u0438\u043d\u0433\u0430, \u043a\u0430\u043a <a href=\"https:\/\/habr.com\/ru\/company\/recognitor\/blog\/505694\/\">\u0432\u044b \u043f\u043e\u043c\u043d\u0438\u0442\u0435<\/a>.  &nbsp;20 \u0434\u043d\u0435\u0439 \u043d\u0430\u0437\u0430\u0434 \u0432\u044b\u0448\u0435\u043b \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440 \u0441 \u0440\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u0435\u043c <a href=\"https:\/\/github.com\/heshuting555\/TransReID\">ReID<\/a>&nbsp;&#8212;   \u0432\u0435\u0441\u044c\u043c\u0430 \u043d\u0435\u043f\u043b\u043e\u0445\u043e \u043c\u043e\u0436\u0435\u0442 \u0431\u0443\u0441\u0442\u0430\u043d\u0443\u0442\u044c \u0442\u0440\u0435\u043a\u0438\u043d\u0433.  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p><a href=\"https:\/\/arxiv.org\/pdf\/2103.14803v2.pdf%20\">\u0420\u0430\u0441\u043f\u043e\u0437\u043d\u0430\u0432\u0430\u043d\u0438\u044f \u043b\u0438\u0446 <\/a>\u0447\u0435\u0440\u0435\u0437 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u043d\u0435\u0434\u0435\u043b\u044c\u043d\u043e\u0439 \u0434\u0430\u0432\u043d\u043e\u0441\u0442\u0438 \u043f\u043e\u0445\u043e\u0436\u0435 \u0442\u043e\u0436\u0435 \u043f\u043e\u0434\u043e\u0448\u043b\u043e:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<h2>\u041c\u0435\u0434\u0438\u0446\u0438\u043d\u0430<\/h2>\n<p>\u0415\u0441\u043b\u0438 \u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0431\u043e\u043b\u0435\u0435 \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u044b\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0442\u0443\u0442 \u0442\u043e\u0436\u0435 \u043c\u043d\u043e\u0433\u043e \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0433\u043e. VIT \u0443\u0436\u0435 \u0432\u043e\u0432\u0441\u044e \u0437\u0430\u043f\u0438\u0445\u0438\u0432\u0430\u044e\u0442 \u0434\u043b\u044f \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u041a\u0422 \u0438 \u041c\u0420\u0422 (<a href=\"https:\/\/github.com\/junyuchen245\/ViT-V-Net_for_3D_Image_Registration_Pytorch\">1<\/a>,<a href=\"https:\/\/github.com\/Beckschen\/TransUNet\">2<\/a>):<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0418 \u0434\u043b\u044f \u0441\u0435\u0433\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438 (<a href=\"https:\/\/github.com\/jeya-maria-jose\/Medical-Transformer\">1<\/a>,<a href=\"https:\/\/arxiv.org\/pdf\/2102.04306v1.pdf\">2<\/a>):<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<h2>\u0423\u0434\u0438\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0435  <\/h2>\n<p>\u0427\u0442\u043e \u043c\u0435\u043d\u044f \u0443\u0434\u0438\u0432\u043b\u044f\u0435\u0442 &#8212; \u044f \u043d\u0435 \u0432\u0438\u0436\u0443 \u0445\u043e\u0440\u043e\u0448\u0435\u0439 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 OCR \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u0445. \u0415\u0441\u0442\u044c \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432, \u043d\u043e \u043f\u043e \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0430\u043c \u043e\u043d\u0438 <a href=\"https:\/\/github.com\/fengxinjie\/Transformer-OCR\">\u043a\u0430\u043a-\u0442\u043e \u043d\u0430 \u0434\u043d\u0435<\/a>:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0412\u0441\u0435 state-of-art \u043f\u043e\u043a\u0430 \u043d\u0430 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u043f\u043e\u0434\u0445\u043e\u0434\u0430\u0445. \u041d\u043e \u043b\u044e\u0434\u0438 \u043f\u0440\u043e\u0431\u0443\u044e\u0442. \u0414\u0430\u0436\u0435 \u0441\u0430\u043c \u0447\u0442\u043e-\u0442\u043e \u0433\u043e\u0434\u0430 2 \u043d\u0430\u0437\u0430\u0434 \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b \u043f\u0440\u0438\u043a\u0440\u0443\u0442\u0438\u0442\u044c. \u041d\u043e \u0447\u0442\u043e-\u0442\u043e \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0430 \u044d\u0442\u043e \u043d\u0435 \u0434\u0430\u0435\u0442.  <\/p>\n<h2>\u0415\u0449\u0451 \u0438\u0437 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0433\u043e  <\/h2>\n<p>\u041d\u0438\u043a\u043e\u0433\u0434\u0430 \u0431\u044b \u043d\u0435 \u043f\u043e\u0434\u0443\u043c\u0430\u043b, \u043d\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b <a href=\"https:\/\/github.com\/google-research\/google-research\/tree\/master\/coltran\">\u0443\u0436\u0435 \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u043b\u0438 <\/a>\u0434\u043b\u044f \u0440\u0430\u0441\u043a\u0440\u0430\u0441\u043a\u0438 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a. \u0418, \u043d\u0430\u0432\u0435\u0440\u043d\u043e\u0435, \u044d\u0442\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u043e:  <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<h2>\u0427\u0442\u043e \u0434\u0430\u043b\u044c\u0448\u0435<\/h2>\n<p>\u041c\u043d\u0435 \u043a\u0430\u0436\u0435\u0442\u0441\u044f \u0447\u0442\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0434\u043e\u043b\u0436\u043d\u044b \u0432\u044b\u0439\u0442\u0438 \u0432 \u0442\u043e\u043f \u043f\u043e\u0447\u0442\u0438 \u043f\u043e \u0432\u0441\u0435\u043c \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u044f\u043c \u0434\u043b\u044f ComputerVision. \u0418, \u0431\u0435\u0437\u0443\u0441\u043b\u043e\u0432\u043d\u043e, \u0434\u043b\u044f \u043b\u044e\u0431\u043e\u0439 \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a\u0438 \u0432\u0438\u0434\u0435\u043e.&nbsp;<\/p>\n<p>\u0422\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u044b \u0435\u0434\u044f\u0442<\/p>\n<\/p>\n<\/p>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-321794","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/321794","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=321794"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/321794\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=321794"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=321794"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=321794"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}