{"id":474112,"date":"2025-09-06T15:00:10","date_gmt":"2025-09-06T15:00:10","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=474112"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=474112","title":{"rendered":"<span>\u0414\u043e\u043b\u0433\u0430\u044f \u0434\u043e\u0440\u043e\u0433\u0430 \u043a DiT (\u0447\u0430\u0441\u0442\u044c 1)<\/span>"},"content":{"rendered":"<div><!--[--><!--]--><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u042d\u0442\u043e \u043b\u0435\u0442\u043e \u043e\u0431\u0440\u0430\u0434\u043e\u0432\u0430\u043b\u043e \u043d\u0430\u0441 \u043f\u0440\u043e\u0440\u044b\u0432\u043e\u043c \u0432 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0435\u0439. \u041e\u0434\u043d\u0430 \u0437\u0430 \u0434\u0440\u0443\u0433\u043e\u0439 \u0432\u044b\u0445\u043e\u0434\u044f\u0442 \u0442\u0430\u043a\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u043a\u0430\u043a Flux.1 Kontext, Qwen-Image-Edit, Gemini 2.4 Flash Image Preview (Nano Banana) \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u044f \u043d\u0435\u0434\u043e\u0441\u0442\u0438\u0436\u0438\u043c\u044b\u0439 \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u0443\u0440\u043e\u0432\u0435\u043d\u044c \u043c\u0430\u043d\u0438\u043f\u0443\u043b\u044f\u0446\u0438\u0438 \u0446\u0438\u0444\u0440\u043e\u0432\u044b\u043c \u043a\u043e\u043d\u0442\u0435\u043d\u0442\u043e\u043c. \u042d\u0442\u043e \u043d\u0435 \u0437\u0430\u043c\u0435\u043d\u0430 \u0424\u043e\u0442\u043e\u0448\u043e\u043f\u0443, \u0430 \u0442\u0435\u0445\u043d\u043e\u043b\u043e\u0433\u0438\u044f, \u043e\u0442\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0430\u044f \u0432\u0440\u0430\u0442\u0430 \u0432 \u0431\u0435\u0441\u043a\u043e\u043d\u0435\u0447\u043d\u044b\u0435 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u043c\u0438\u0440\u044b \u0438 \u0432\u0441\u0451 \u0431\u043b\u0430\u0433\u043e\u0434\u0430\u0440\u044f \u043c\u043e\u0449\u0438 <strong>Diffusion Transformer (DiT)<\/strong> \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u044b. \u0412\u043f\u0435\u0447\u0430\u0442\u043b\u0438\u0432\u0448\u0438\u0441\u044c, \u044f \u0440\u0435\u0448\u0438\u043b \u043f\u043e\u0431\u043b\u0438\u0436\u0435 \u043f\u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u0441 \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u043c\u0438 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u043c\u0438 &#8212; \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0440\u0443\u0447\u043d\u043e \u043d\u0430\u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0441\u0432\u043e\u044e \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e DiT-\u043c\u043e\u0434\u0435\u043b\u044c. \u041e\u0431 \u044d\u0442\u043e\u043c \u0438 \u0431\u0443\u0434\u0435\u0442 \u044d\u0442\u0430 \u0441\u0442\u0430\u0442\u044c\u044f.<\/p>\n<p>\u041d\u043e \u043d\u0430\u0447\u0430\u0442\u044c \u0441\u0442\u043e\u0438\u0442 \u0441 \u043c\u0430\u043b\u043e\u0433\u043e.<\/p>\n<h3>\u0411\u0430\u0437\u043e\u0432\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c<\/h3>\n<p>\u041a\u0430\u043a \u0432\u043e\u043e\u0431\u0449\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u044d\u0442\u0438 \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438? \u0415\u0441\u0442\u044c \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u044c, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0437\u0430\u0448\u0443\u043c\u043b\u0451\u043d\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435, \u0430 \u043d\u0430 \u0432\u044b\u0445\u043e\u0434\u0435 \u0432\u044b\u0434\u0430\u0451\u0442 \u0448\u0443\u043c (noise). \u0418 \u0441\u043f\u0440\u0430\u0448\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0437\u0430\u0447\u0435\u043c \u043d\u0430\u043c \u044d\u0442\u043e\u0442 \u0448\u0443\u043c? \u0410 \u0437\u0430\u0442\u0435\u043c \u0447\u0442\u043e \u0442\u0435\u043f\u0435\u0440\u044c \u0438\u043c\u0435\u044f \u0448\u0443\u043c\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0438 \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u043d\u044b\u0439 \u0448\u0443\u043c \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0432\u044b\u0447\u0435\u0441\u0442\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u043d\u044b\u0439 \u0448\u0443\u043c \u0438\u0437 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0438 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0441 \u043c\u0435\u043d\u044c\u0448\u0438\u043c \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u0448\u0443\u043c\u0430. \u042f \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0442\u043e \u0441\u043a\u0430\u0437\u0430\u043b &#171;\u0441 \u043c\u0435\u043d\u044c\u0448\u0438\u043c \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u0448\u0443\u043c\u0430&#187;, \u043d\u043e \u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u044d\u0442\u043e \u043d\u0435 \u0442\u0430\u043a. \u041d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u0432\u0441\u0451 \u0441\u043b\u043e\u0436\u043d\u0435\u0435.<\/p>\n<p>\u041d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043e\u0442\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0435. \u0414\u043b\u044f \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u044f \u0431\u0443\u0434\u0443 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0443 <strong>PyTorch<\/strong>. \u0412\u0441\u0435 \u0442\u0435\u0440\u043c\u0438\u043d\u044b \u0442\u0430\u043a\u0438\u0435 \u043a\u0430\u043a \u0442\u0435\u043d\u0437\u043e\u0440 (tensor), \u0431\u0430\u0442\u0447 (batch), \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 (dimension), \u0448\u0435\u0439\u043f (shape) \u043e\u0442\u0442\u0443\u0434\u0430. \u041e\u0436\u0438\u0434\u0430\u044e \u043e\u0442 \u0447\u0438\u0442\u0430\u0442\u0435\u043b\u0435\u0439 \u0445\u043e\u0442\u044f \u0431\u044b \u043f\u043e\u0432\u0435\u0440\u0445\u043d\u043e\u0441\u0442\u043d\u043e\u0433\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u043d\u0438\u044f.<\/p>\n<h3>\u0410 \u0447\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u0435\u043c-\u0442\u043e?<\/h3>\n<p>\u0412\u044b \u043d\u0435 \u0437\u0430\u0434\u0443\u043c\u044b\u0432\u0430\u043b\u0438\u0441\u044c \u0447\u0442\u043e \u0432\u043e\u043e\u0431\u0449\u0435 <em>\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u044e\u0442<\/em> \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438? \u0410 \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u044e\u0442 \u043e\u043d\u0438 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0432 \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435. \u0412\u043e\u0437\u043d\u0438\u043a\u0430\u0435\u0442 \u043b\u043e\u0433\u0438\u0447\u043d\u044b\u0439 \u0432\u043e\u043f\u0440\u043e\u0441: \u0447\u0442\u043e \u0435\u0449\u0451 \u0437\u0430 &#171;\u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435&#187;? \u041b\u0435\u0433\u0447\u0435 \u0432\u0441\u0435\u0433\u043e \u044d\u0442\u043e \u043f\u0440\u043e\u0438\u043b\u043b\u044e\u0441\u0442\u0440\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043d\u0430 \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0434\u0432\u0443\u0445 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439. \u0412\u043e\u0442 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u044d\u043c\u043f\u043b\u043e\u0432 (\u0442\u043e\u0447\u0435\u043a \u043d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438) \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. <strong>\u041e\u0442\u0441\u044e\u0434\u0430 \u0438 \u0434\u0430\u043b\u0435\u0435, \u043a\u043e\u0433\u0434\u0430 \u044f \u043f\u0438\u0448\u0443 &#171;\u0441\u044d\u043c\u043f\u043b&#187;, \u0442\u043e \u0438\u043c\u0435\u044e \u0432\u0432\u0438\u0434\u0443 \u0434\u0432\u0443\u043c\u0435\u0440\u043d\u044b\u0439 \u0442\u0435\u043d\u0437\u043e\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u043a\u0430\u043a \u0442\u043e\u0447\u043a\u0443 \u043d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438<\/strong>: <\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/gkUodK0.png\" alt=\"https:\/\/i.imgur.com\/gkUodK0.png\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/gkUodK0.png 780w,&#10;       https:\/\/i.imgur.com\/gkUodK0.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>https:\/\/i.imgur.com\/gkUodK0.png<\/figcaption><\/div>\n<\/figure>\n<p> \u0421\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u043e\u0447\u0435\u043d\u044c \u043f\u0440\u043e\u0441\u0442\u043e &#8212; \u0432\u044b\u0437\u044b\u0432\u0430\u0435\u043c <code>torch.randn(2)<\/code> \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043d\u0430\u0434\u043e \u0440\u0430\u0437 \u0438 \u0432\u0441\u0451. <\/p>\n<p>\u0410 \u0432\u043e\u0442 \u0442\u0430\u043a \u043d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438 \u043c\u043e\u0433\u043b\u0438 \u0431\u044b \u0432\u044b\u0433\u043b\u044f\u0434\u0435\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f: <\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/AOL4Xze.png\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/AOL4Xze.png 780w,&#10;       https:\/\/i.imgur.com\/AOL4Xze.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u042d\u0442\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u043c\u043e\u0436\u043d\u043e \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442\u044c \u043a\u0430\u043a &#171;\u0432\u0441\u0435 \u0442\u043e\u0447\u043a\u0438 \u043b\u0435\u0436\u0430\u0449\u0438\u0435 \u043d\u0430 \u043a\u0440\u0438\u0432\u044b\u0445, \u043e\u0431\u0440\u0430\u0437\u0443\u044e\u0449\u0438\u0445 \u0440\u0438\u0441\u0443\u043d\u043e\u043a \u043a\u043e\u0442\u0451\u043d\u043a\u0430&#187;. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0443 \u043d\u0430\u0441 \u043d\u0435\u0442 \u0433\u043e\u0442\u043e\u0432\u043e\u0439 \u0444\u043e\u0440\u043c\u0443\u043b\u044b, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0431\u044b \u043c\u043e\u0433\u043b\u0430 \u0432\u044b\u0442\u0430\u0441\u043a\u0438\u0432\u0430\u0442\u044c \u0442\u043e\u0447\u043a\u0438 (\u0441\u044d\u043c\u043f\u043b\u044b) \u0438\u043c\u0435\u043d\u043d\u043e \u0438\u0437 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<p>\u0418 \u0442\u0443\u0442 \u0432\u0441\u0435\u043c \u043b\u044e\u0431\u0438\u0442\u0435\u043b\u044f\u043c \u043a\u043e\u0442\u043e\u0432 \u043d\u0430 \u043f\u043e\u043c\u043e\u0449\u044c \u043f\u0440\u0438\u0445\u043e\u0434\u044f\u0442 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438. \u0412\u0441\u0435\u0433\u043e \u0442\u043e \u0438 \u043d\u0430\u0434\u043e, \u0447\u0442\u043e \u043e\u0431\u0443\u0447\u0438\u0442\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044e (\u043c\u043e\u0434\u0435\u043b\u044c), \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f, \u0430 \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0435\u0442 \u0441\u044d\u043c\u043f\u043b \u0443\u0436\u0435 \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u0412\u043e\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u0442\u0430\u043a\u0430\u044f \u043f\u043e\u0441\u0442\u0430\u043d\u043e\u0432\u043a\u0430 \u0437\u0430\u0434\u0430\u0447\u0438 &#8212; <strong>\u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f<\/strong> &#8212; \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u0441\u043b\u043e\u0436\u043d\u0430\u044f. \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u043f\u0435\u0440\u0435\u0444\u0440\u0430\u0437\u0438\u0440\u0443\u0435\u043c:<\/p>\n<blockquote>\n<p>\u041f\u0440\u0438\u043d\u0438\u043c\u0430\u044f \u043d\u0430 \u0432\u0445\u043e\u0434 \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0442\u044c \u0432\u0435\u043a\u0442\u043e\u0440 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u044f, \u0434\u0432\u0438\u0433\u0430\u044f\u0441\u044c \u043f\u043e \u043a\u043e\u0442\u043e\u0440\u043e\u043c\u0443 \u043c\u044b \u0434\u043e\u0441\u0442\u0438\u0433\u043d\u0435\u043c \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<\/blockquote>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/9o3dUdM.png\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/9o3dUdM.png 780w,&#10;       https:\/\/i.imgur.com\/9o3dUdM.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u041f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u0447\u0442\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0434\u043b\u044f \u0441\u044d\u043c\u043f\u043b\u0430 (0.1, -0.5) \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0436\u0435\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 (1.05, 0.46). \u0422\u0435\u043f\u0435\u0440\u044c \u0441\u043b\u043e\u0436\u0438\u043c \u044d\u0442\u043e\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 \u0441 \u0438\u0441\u0445\u043e\u0434\u043d\u044b\u043c \u0441\u044d\u043c\u043f\u043b\u043e\u043c. \u041f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u0442\u043e\u0447\u043a\u0443 \u043d\u0430 \u0446\u0435\u043b\u0435\u0432\u043e\u043c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0438. \u0418 \u0442\u0430\u043a \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0441\u044d\u043c\u043f\u043b\u0430 \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<p>\u0422\u043e \u0447\u0442\u043e \u044f \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0442\u043e \u043e\u043f\u0438\u0441\u0430\u043b (\u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u0430) &#8212; \u044d\u0442\u043e \u0432\u0430\u0440\u0438\u0430\u043d\u0442 \u0434\u0438\u0444\u0444\u0443\u0437\u0438\u0438 \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u043c\u044b\u0439 <a href=\"https:\/\/arxiv.org\/abs\/2403.03206\" rel=\"noopener noreferrer nofollow\">Rectified Flow<\/a>. \u041e\u043d \u043e\u0442\u043b\u0438\u0447\u0430\u0435\u0442\u0441\u044f \u043e\u0442 \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u043e\u0433\u043e \u0432\u0441\u0435\u043c <a href=\"https:\/\/arxiv.org\/abs\/2006.11239\" rel=\"noopener noreferrer nofollow\">DDPM<\/a> \u0438 \u043e\u0442\u043b\u0438\u0447\u0430\u0435\u0442\u0441\u044f \u0432 \u043b\u0443\u0447\u0448\u0443\u044e \u0441\u0442\u043e\u0440\u043e\u043d\u0443. \u041d\u043e \u044f \u043e\u0442 \u044d\u0442\u043e\u043c \u0440\u0430\u043d\u043e \u0437\u0430\u0433\u043e\u0432\u043e\u0440\u0438\u043b, \u043f\u0440\u043e\u0434\u043e\u043b\u0436\u0430\u0435\u043c.<\/p>\n<p>\u0418\u0442\u0430\u043a, \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u0447\u0442\u043e \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0431\u0443\u0434\u0435\u0442 \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043f\u0440\u043e\u0441\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f (\u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0435, \u043e\u043d\u043e \u0436\u0435 \u0413\u0430\u0443\u0441\u0441\u043e\u0432\u043e) \u0432 \u0441\u043b\u043e\u0436\u043d\u043e\u0435 \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435.<\/p>\n<p>\u0417\u0432\u0443\u0447\u0438\u0442 \u0445\u043e\u0440\u043e\u0448\u043e, \u0434\u0430 \u0432\u043e\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0432 \u043e\u0434\u0438\u043d \u0448\u0430\u0433 &#8212; \u044d\u0442\u043e \u0442\u044f\u0436\u0435\u043b\u043e\u0432\u0430\u0442\u0430 \u0437\u0430\u0434\u0430\u0447\u0430 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f. \u0412\u043e\u043d GAN-\u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0442\u0430\u043a\u0438\u043c \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u043c \u0434\u0430\u043b\u0435\u043a\u043e \u043d\u0435 \u043f\u0440\u043e\u0434\u0432\u0438\u043d\u0443\u043b\u0438\u0441\u044c. \u041b\u0430\u0434\u043d\u043e, \u0441 GAN-\u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 \u044f \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u0443\u0442\u0440\u0438\u0440\u0443\u044e, \u043d\u043e \u0433\u043e\u0440\u0430\u0437\u0434\u043e \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u043d\u0435\u0435 \u043e\u043f\u0438\u0440\u0430\u0442\u044c\u0441\u044f \u0438\u043c\u0435\u043d\u043d\u043e \u043d\u0430 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e &#8212; \u043a\u0430\u043a \u0448\u0430\u0433 \u0437\u0430 \u0448\u0430\u0433\u043e\u043c \u043f\u0440\u043e\u0441\u0442\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0438\u0440\u0443\u0435\u0442\u0441\u044f \u0432 \u0441\u043b\u043e\u0436\u043d\u043e\u0435.<\/p>\n<p>\u0427\u0442\u043e \u044f \u0438\u043c\u0435\u044e \u0432 \u0432\u0438\u0434\u0443 \u043a\u043e\u0433\u0434\u0430 \u0433\u043e\u0432\u043e\u0440\u044e, \u0447\u0442\u043e \u043c\u043e\u0436\u043d\u043e \u043e\u043f\u0438\u0440\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e? \u0421\u043c\u043e\u0442\u0440\u0438\u0442\u0435, \u0438\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e \u0434\u0430\u043d\u043d\u044b\u0435 \u0434\u043b\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438 \u043d\u0430\u0448\u0435\u0439 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438 \u0441\u043e\u0441\u0442\u043e\u044f\u043b\u0438 \u0442\u043e\u043b\u044c\u043a\u043e \u0438\u0437 \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f (\u0442\u043e\u0447\u043a\u0438, \u043b\u0435\u0436\u0430\u0449\u0438\u0435 \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a\u0435 \u043a\u043e\u0442\u0430), \u0430 \u0442\u0430\u043a\u0436\u0435 \u0442\u0430\u043a\u043e\u0433\u043e \u0436\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 (\u0448\u0443\u043c\u0430 \u043a\u043e\u0440\u043e\u0447\u0435). \u041d\u043e \u0440\u0430\u0437 \u043c\u044b \u0434\u043e\u0433\u0430\u0434\u0430\u043b\u0438\u0441\u044c \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f &#171;\u043f\u043e \u0448\u0430\u0433\u0430\u043c&#187;, \u0442\u043e \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u043e\u0431\u043e\u0433\u0430\u0442\u0438\u0442\u044c \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0432\u0441\u0435\u043c\u0438 \u043f\u0440\u043e\u043c\u0435\u0436\u0443\u0442\u043e\u0447\u043d\u044b\u043c\u0438 \u0441\u043e\u0441\u0442\u043e\u044f\u043d\u0438\u044f\u043c\u0438, \u0442\u043e \u0435\u0441\u0442\u044c \u0446\u0435\u043b\u0435\u0432\u044b\u043c\u0438 \u0441\u044d\u043c\u043f\u043b\u0430\u043c\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0437\u0430\u0448\u0443\u043c\u043b\u0435\u043d\u044b \u043d\u0430 10%, 20%, 76% \u0438\u043b\u0438 \u0432\u043e\u043e\u0431\u0449\u0435 \u043d\u0430 \u043b\u044e\u0431\u043e\u0439 \u043f\u0440\u043e\u0446\u0435\u043d\u0442. \u0414\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438, \u0442\u043e\u0447\u043a\u0430\u043c\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0430\u0445\u043e\u0434\u044f\u0442\u0441\u044f \u0433\u0434\u0435-\u0442\u043e \u043d\u0430 \u043f\u043e\u043b\u043f\u0443\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u044b\u043c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435\u043c \u0438 \u0446\u0435\u043b\u0435\u0432\u044b\u043c.<\/p>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0435\u0449\u0451 \u0440\u0430\u0437 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043a\u0430\u043a \u043f\u043e\u0434\u0445\u043e\u0434 &#171;\u0432\u044b\u0443\u0447\u0438\u0442\u044c \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e \u0437\u0430 \u0440\u0430\u0437&#187; \u0438 &#171;\u0432\u044b\u0443\u0447\u0438\u0442\u044c \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e \u043f\u043e \u0448\u0430\u0433\u0430\u043c&#187; \u043c\u0435\u043d\u044f\u0435\u0442 \u043d\u0430\u0448\u0443 \u043c\u043e\u0434\u0435\u043b\u044c.<\/p>\n<p>\u0412 \u043f\u0435\u0440\u0432\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0438\u0440\u0443\u0435\u0442 \u0432\u043e\u0442 \u0442\u0430\u043a:<br \/> <code>vector_to_target = model.predict(normal_noise_sample)<\/code> &#8212; \u043d\u0430 \u0432\u0445\u043e\u0434 \u0442\u043e\u043b\u044c\u043a\u043e \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<p>\u0410 \u0432 \u0441\u043b\u0443\u0447\u0430\u0435 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438 \u043f\u043e \u0448\u0430\u0433\u0430\u043c \u043c\u043e\u0434\u0435\u043b\u044c \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0442\u0430\u043a:<br \/> <code>vector_to_target = model.predict(point_between_noise_and_target_distribution, time)<\/code><br \/> \u0417\u0434\u0435\u0441\u044c <code>time<\/code>  &#8212; \u044d\u0442\u043e \u0434\u043e\u043b\u044f \u043f\u0443\u0442\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0442\u043e\u0447\u043a\u0430 \u043f\u0440\u043e\u0448\u043b\u0430 \u043e\u0442 \u0448\u0443\u043c\u0430, \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u041f\u0440\u043e\u0446\u0435\u043d\u0442 \u0437\u0430\u0448\u0443\u043c\u043b\u0451\u043d\u043d\u043e\u0441\u0442\u0438, \u0434\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438. \u0412\u0430\u0436\u043d\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u0442\u044c: \u043f\u043e \u0441\u0443\u0442\u0438, \u0437\u0430\u0434\u0430\u0447\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f <strong>\u0440\u0430\u0437\u0431\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u043d\u0430 \u043c\u0435\u043b\u043a\u0438\u0435 \u043f\u043e\u0434\u0437\u0430\u0434\u0430\u0447\u0438<\/strong>: &#171;\u043d\u0430\u0443\u0447\u0438\u0441\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043f\u0443\u0442\u044c \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043f\u0440\u0438 10% \u0448\u0443\u043c\u0430&#187;, &#171;\u043d\u0430\u0443\u0447\u0438\u0441\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043f\u0443\u0442\u044c \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043f\u0440\u0438 15% \u0448\u0443\u043c\u0430&#187; \u0438 \u0442.\u0434. \u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0433\u043e\u0440\u0430\u0437\u0434\u043e \u043b\u0443\u0447\u0448\u0435 \u0441\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0439, \u0447\u0442\u043e \u043f\u043e\u0432\u044b\u0448\u0430\u0435\u0442 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c &#171;\u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u044f&#187;.<\/p>\n<p>\u0417\u0430 \u0441\u0447\u0451\u0442 \u0447\u0435\u0433\u043e \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c? \u0410 \u0437\u0430 \u0441\u0447\u0451\u0442 \u0442\u043e\u0433\u043e, \u0447\u0442\u043e \u0442\u0435\u043f\u0435\u0440\u044c \u0438\u043c\u0435\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u0441 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u043c \u0443\u0441\u043b\u043e\u0432\u0438\u0435\u043c <code>time<\/code> \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0432\u044b\u0442\u0430\u0441\u043a\u0438\u0432\u0430\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043d\u0438 \u0441 \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0439 \u043f\u043e\u043f\u044b\u0442\u043a\u0438, \u0430 \u0434\u0435\u043b\u0430\u044f \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0443\u0433\u043e\u0434\u043d\u043e &#171;\u0443\u0442\u043e\u0447\u043d\u0435\u043d\u0438\u0439&#187; \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438. \u041b\u0435\u0433\u0447\u0435 \u043f\u043e\u043d\u044f\u0442\u044c \u0435\u0441\u043b\u0438 \u0432\u0437\u0433\u043b\u044f\u043d\u0443\u0442\u044c \u043d\u0430 \u043a\u043e\u0434 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430:<\/p>\n<pre><code class=\"python\">noise = sample_noise()  # \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f steps = 200  # \u0440\u0430\u0437\u043e\u0431\u044a\u0435\u043c \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e \u043d\u0430 200 \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0438\u0445 \u0448\u0430\u0433\u043e\u0432 for step in range(steps): time = step \/ steps  # \u0431\u0443\u0434\u0435\u0442 \u043c\u0435\u043d\u044f\u0442\u044c\u0441\u044f \u0432 \u0438\u043d\u0442\u0435\u0440\u0432\u0430\u043b\u0435 [0, 1)  # \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e \u043e\u0442 time \u044d\u0442\u043e\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0434\u043d\u043e\u0439 \u0434\u043b\u0438\u043d\u044b # \u0432 \u0438\u0434\u0435\u0430\u043b\u0435 \u0432\u043e\u043e\u0431\u0449\u0435 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0434\u0438\u043d \u0438 \u0442\u043e\u0442 \u0436\u0435 predicted_vector = model.predict(noise, time)  scaled_vector = predicted_vector * (1 \/ steps)  # \u043e\u0434\u043d\u0430 200-\u044f \u043f\u0443\u0442\u0438 noise = noise + scaled_vector  # \u041d\u0430\u0448 \u0438\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u044b\u0439 \u0448\u0443\u043c \u043d\u0430 0.5% \u043f\u0440\u0438\u0431\u043b\u0438\u0437\u0438\u043b\u0441\u044f                                 # \u043a \u0446\u0435\u043b\u0435\u0432\u043e\u043c\u0443 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044e                                 # \u041f\u043e\u0441\u043b\u0435 \u0437\u0430\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u0446\u0438\u043a\u043b\u0430 \u043d\u0430\u0448 noise - \u044d\u0442\u043e \u0443\u0436\u0435 \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f <\/code><\/pre>\n<p>\u041f\u043e\u043c\u043d\u0438\u0442\u0435, \u0447\u0442\u043e \u0432 \u043d\u0430\u0448\u0435\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0432\u0441\u0435 \u0441\u044d\u043c\u043f\u043b\u044b \u044d\u0442\u043e \u0434\u0432\u0443\u043c\u0435\u0440\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b (x, y) &#8212; \u0442\u043e\u0447\u043a\u0438 \u043d\u0430 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438.  \u041f\u043e\u043b\u044c\u0437\u0443\u044f\u0441\u044c \u0442\u0435\u0440\u043c\u0438\u043d\u043e\u043b\u043e\u0433\u0438\u0435 PyTorch &#8212; \u0442\u0435\u043d\u0437\u043e\u0440\u044b \u0441 \u0448\u0435\u0439\u043f\u043e\u043c (2). \u0410 \u0442\u0430\u043a-\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u044c \u043c\u043e\u0436\u043d\u043e \u0441\u043e\u0437\u0434\u0430\u0432\u0430\u0442\u044c \u0434\u043b\u044f \u0442\u0435\u043d\u0437\u043e\u0440\u043e\u0432 \u043b\u044e\u0431\u043e\u0439 \u0444\u043e\u0440\u043c\u044b.<\/p>\n<h3>\u0414\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0442\u0435\u043e\u0440\u0438\u0438<\/h3>\n<p>\u0414\u043b\u044f \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0430\u0446\u0438\u0438 \u043d\u0430\u043c \u043f\u043e\u043d\u0430\u0434\u043e\u0431\u0438\u0442\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442. \u0412\u0441\u0435 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u044b \u0438\u0437 \u043d\u0435\u0433\u043e \u0431\u0443\u0434\u0443\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u044d\u043c\u043f\u043b\u044b\u043c\u0438 \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0432\u043e\u0442 \u0442\u0430\u043a\u043e\u0433\u043e:<\/p>\n<pre><code class=\"python\">def make_simple_dataset(amount):       cluster_1 = torch.rand((amount \/\/ 2), 2) * 1.5 + 0.6       cluster_2 = torch.rand((amount \/\/ 4), 2) * 0.8 + torch.tensor([-.8, .6])       cluster_3 = torch.rand((amount \/\/ 4), 2) * torch.tensor([1.2, 0.4]) + torch.tensor([-2.4, 0.6])          return torch.cat([cluster_1, cluster_2, cluster_3], dim=0) <\/code><\/pre>\n<p>\u041d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438 800 \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0431\u0443\u0434\u0443\u0442 \u0432\u044b\u0433\u043b\u044f\u0434\u0435\u0442\u044c \u0432\u043e\u0442 \u0442\u0430\u043a: <\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/Y8aCpoZ.png\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/Y8aCpoZ.png 780w,&#10;       https:\/\/i.imgur.com\/Y8aCpoZ.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p> \u0422\u0435\u043f\u0435\u0440\u044c \u043f\u043e\u0440\u0430 \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0442\u044c\u0441\u044f \u0437\u0430 PyTorch \u043c\u043e\u0434\u0435\u043b\u044c. <\/p>\n<p>\u0411\u0443\u0434\u0435\u0442 \u044d\u0442\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0441\u043e\u0441\u0442\u043e\u044f\u0442\u044c \u0438\u0437 \u0442\u0440\u0451\u0445 \u0447\u0430\u0441\u0442\u0435\u0439:<\/p>\n<ol>\n<li>\n<p>\u042d\u043d\u043a\u043e\u0434\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u0440\u043e\u0435\u0446\u0438\u0440\u0443\u0435\u0442 \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0438\u0437 \u0434\u0432\u0443\u0445 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439 \u0432\u043e \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0438\u0437 \u0431\u043e\u043b\u044c\u0448\u0435\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439 (16). \u0417\u0430\u0447\u0435\u043c \u043d\u0430\u043c \u0431\u043e\u043b\u044c\u0448\u0435\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439? \u0427\u0442\u043e\u0431\u044b \u043c\u043e\u0434\u0435\u043b\u0438 \u0431\u044b\u043b\u043e \u0433\u0434\u0435 &#171;\u0440\u0430\u0437\u0432\u0435\u0440\u043d\u0443\u0442\u044c\u0441\u044f&#187;.<\/p>\n<\/li>\n<li>\n<p>\u041e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0430\u044f \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 MLP-\u0431\u043b\u043e\u043a\u043e\u0432. \u0411\u0443\u0434\u0435\u0442 \u043d\u0435\u043f\u043e\u0441\u0440\u0435\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0439 \u0437\u0430\u043d\u0438\u043c\u0430\u0442\u044c\u0441\u044f \u0434\u0435\u043d\u043e\u0439\u0437\u0438\u043d\u0433\u043e\u043c \u0432\u0445\u043e\u0434\u044f\u0449\u0438\u0445 &#171;\u0448\u0443\u043c\u043d\u044b\u0445&#187; \u0441\u044d\u043c\u043f\u043b\u043e\u0432. MLP &#8212; \u044d\u0442\u043e multilayer perceptron, \u0442\u0430 \u0441\u0430\u043c\u0430\u044f &#171;\u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0430\u044f&#187; \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c.<\/p>\n<\/li>\n<li>\n<p>\u0414\u0435\u043a\u043e\u0434\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u0435\u0442 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u043e\u0431\u0440\u0430\u0442\u043d\u043e \u0432 \u0434\u0432\u0435 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u044b.<\/p>\n<\/li>\n<\/ol>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/UU6R4Oj.jpeg\" alt=\"\u0421\u0445\u0435\u043c\u0430\u0442\u0438\u0447\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438\" title=\"\u0421\u0445\u0435\u043c\u0430\u0442\u0438\u0447\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/UU6R4Oj.jpeg 780w,&#10;       https:\/\/i.imgur.com\/UU6R4Oj.jpeg 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0421\u0445\u0435\u043c\u0430\u0442\u0438\u0447\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438<\/figcaption><\/div>\n<\/figure>\n<p>\u0412\u043e\u0442 \u0442\u0430\u043a \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0443\u043f\u0440\u043e\u0449\u0451\u043d\u043d\u0430\u044f \u0441\u0445\u0435\u043c\u0430. <strong>Linear A<\/strong> &#8212; \u044d\u0442\u043e \u044d\u043d\u043a\u043e\u0434\u0435\u0440. \u0421\u043e\u0441\u0442\u043e\u0438\u0442 \u0438\u0437 \u043e\u0434\u043d\u043e\u0433\u043e \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f <code>nn.Linear<\/code> (\u0437\u0434\u0435\u0441\u044c \u0438 \u0434\u0430\u043b\u0435\u0435 \u0432\u0441\u0451 \u0442\u0438\u043f\u044b \u0438\u0437 PyTorch). \u041f\u043e \u0441\u0443\u0442\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u043c\u0430\u0442\u0440\u0438\u0446\u0430, \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 2-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0442\u0435\u043d\u0437\u043e\u0440\u0430 \u0432 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439. <strong>\u041f\u0440\u044f\u043c\u043e\u0443\u0433\u043e\u043b\u044c\u043d\u0438\u043a \u043f\u043e\u0441\u0435\u0440\u0435\u0434\u0438\u043d\u0435<\/strong> &#8212; \u044d\u0442\u043e \u0441\u0430\u043c \u0434\u0435\u043d\u043e\u0439\u0437\u0435\u0440, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0438\u0439 \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u0431\u043b\u043e\u043a\u043e\u0432\/\u0443\u0440\u043e\u0432\u043d\u0435\u0439. \u041d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0435\u0439, \u0432\u044b\u0441\u0442\u0440\u043e\u0435\u043d\u043d\u044b\u0445 \u0432 \u0440\u044f\u0434, \u043a\u043e\u0440\u043e\u0447\u0435. <strong>Linear B<\/strong> &#8212; \u044d\u0442\u043e \u0434\u0435\u043a\u043e\u0434\u0435\u0440. \u041e\u043f\u044f\u0442\u044c \u0436\u0435, \u043c\u0430\u0442\u0440\u0438\u0446\u0430 \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0442\u0435\u043d\u0437\u043e\u0440\u0430 \u043e\u0431\u0440\u0430\u0442\u043d\u043e \u0432 2 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u044b \u043d\u0430 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438. \u041d\u0430 \u0441\u0445\u0435\u043c\u0435 \u0432\u043c\u0435\u0441\u0442\u0435 2 \u0438 16 \u043d\u0430\u043f\u0438\u0441\u0430\u043d\u043e (B, 2) \u0438 (B, 16), \u043f\u043e\u0442\u043e\u043c\u0443 \u0447\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0441\u044d\u043c\u043f\u043b\u044b \u043d\u0435 \u043f\u043e \u043e\u0434\u043d\u043e\u043c\u0443 \u0430 \u0441\u0440\u0430\u0437\u0443 \u0433\u0440\u0443\u043f\u043f\u043e\u0439 (\u0431\u0430\u0442\u0447\u0435\u043c). B &#8212; \u044d\u0442\u043e \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430 (\u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432).<\/p>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0441\u0440\u0430\u0437\u0443 \u0440\u0430\u0437\u0431\u0435\u0440\u0451\u043c\u0441\u044f \u043a\u0430\u043a \u0443\u0441\u0442\u0440\u043e\u0435\u043d\u044b \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u0431\u043b\u043e\u043a\u0438. \u0417\u0430\u043e\u0434\u043d\u043e \u0432\u0441\u043f\u043e\u043c\u043d\u0438\u043c \u043a\u0430\u043a \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432 PyTorch Multilayered perceptron.<\/p>\n<p>\u0418\u0442\u0430\u043a, \u043a\u0430\u043a \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u0432\u043e\u0442 \u0442\u0430\u043a\u0443\u044e \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u044c (\u043c\u043e\u0434\u0435\u043b\u044c)?<\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/avOO5uQ.png\" alt=\"\u0421\u0442\u0435\u0440\u0435\u043e\u0442\u0438\u043f\u043d\u0430\u044f '\u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c'\" title=\"\u0421\u0442\u0435\u0440\u0435\u043e\u0442\u0438\u043f\u043d\u0430\u044f '\u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c'\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/avOO5uQ.png 780w,&#10;       https:\/\/i.imgur.com\/avOO5uQ.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0421\u0442\u0435\u0440\u0435\u043e\u0442\u0438\u043f\u043d\u0430\u044f &#8216;\u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c&#8217;<\/figcaption><\/div>\n<\/figure>\n<p>\u041d\u0430 PyTorch \u043f\u0440\u043e\u0449\u0435 \u043f\u0440\u043e\u0441\u0442\u043e\u0433\u043e:<\/p>\n<pre><code class=\"python\">model = nn.Sequential( nn.Linear(4, 3),  # \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u0439 \u0441\u043b\u043e\u0439 nn.SiLU(),  # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0430\u043a\u0442\u0438\u0432\u0430\u0446\u0438\u0438 nn.Linear(3, 5),  # \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u0439 \u0441\u043b\u043e\u0439 ) <\/code><\/pre>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0437\u0430\u0432\u0435\u0440\u043d\u0451\u043c \u044d\u0442\u043e \u0432 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0439 \u043a\u043b\u0430\u0441\u0441:<\/p>\n<pre><code class=\"python\">class MyBlock(nn.Module): def __init__(self):       super().__init__()     self.mlp = nn.Sequential( nn.Linear(4, 3), nn.SiLU(), nn.Linear(3, 5), )  def forward(x):  # \u044d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0430\u0435\u0442 \u0432\u0445\u043e\u0434\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0441\u043a\u0432\u043e\u0437\u044c \u043d\u0430\u0448\u0443 \u043c\u043e\u0434\u0435\u043b\u044c return self.mlp(x) <\/code><\/pre>\n<p><code>nn.Module<\/code> &#8212; \u044d\u0442\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u044b\u0439 \u043a\u043b\u0430\u0441\u0441, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043e\u0431\u043b\u0435\u0433\u0447\u0430\u0435\u0442 \u043f\u043e\u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0443\u044e \u0440\u0430\u0431\u043e\u0442\u0443 \u0441 \u043c\u043e\u0434\u0435\u043b\u044c\u044e.<\/p>\n<p>\u0414\u0443\u043c\u0430\u044e, \u043a\u043e\u0434 \u0431\u0443\u0434\u0435\u0442 \u0433\u0438\u0431\u0447\u0435, \u0435\u0441\u043b\u0438 \u0432\u044b\u043d\u0435\u0441\u0442\u0438 \u0441\u043a\u0430\u043b\u044f\u0440\u043d\u044b\u0435 \u043a\u043e\u043d\u0441\u0442\u0430\u043d\u0442\u044b \u0432 \u043a\u043e\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u043e\u0440:<\/p>\n<pre><code class=\"python\">class MyBlock(nn.Module): def __init__(self, hidden_dim, mlp_ratio):       super().__init__()     self.mlp = nn.Sequential( nn.Linear(hidden_dim, hidden_dim * mlp_ratio), nn.SiLU(), nn.Linear(hidden_dim * mlp_ratio, hidden_dim), )  def forward(x): return self.mlp(x) <\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c &#171;\u0448\u0438\u0440\u0438\u043d\u0443&#187; \u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u0432\u0445\u043e\u0434\u043d\u043e\u0433\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u0430 \u0434\u043b\u044f \u044d\u0442\u043e\u0439 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438 \u043c\u043e\u0436\u043d\u043e \u0443\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043f\u0440\u0438 \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u0438.<\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u043e\u043b\u043d\u044b\u0439 \u043a\u043e\u0434<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\">import torch.nn as nn  class DenoiserBlock(nn.Module): def __init__(self, hidden_dim, mlp_ratio):       super().__init__()     self.ln = nn.LayerNorm(hidden_dim)     self.mlp = nn.Sequential( nn.Linear(hidden_dim, hidden_dim * mlp_ratio), nn.SiLU(), nn.Linear(hidden_dim * mlp_ratio, hidden_dim), )  def forward(self, x): z = self.ln(x)  # \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0435\u043c \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440 \u0447\u0435\u0440\u0435\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044e return self.mlp(z)  # \u0430 \u043f\u043e\u0442\u043e\u043c \u0447\u0435\u0440\u0435\u0437 MLP <\/code><\/pre>\n<\/div>\n<\/details>\n<p>\u0412 \u0438\u0442\u043e\u0433\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0430\u0441\u044c \u043c\u043e\u0434\u0435\u043b\u044c \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0435\u0433\u043e \u0431\u043b\u043e\u043a\u0430, \u0438\u0437 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u043e\u0441\u0442\u043e\u044f\u0442\u044c \u043d\u0430\u0448\u0430 \u043e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c-\u0434\u0435\u043d\u043e\u0439\u0437\u0435\u0440. \u0422\u0430\u043a, \u0430 \u043e\u0442\u043a\u0443\u0434\u0430 \u0432\u0437\u044f\u043b\u0441\u044f <code>nn.LayerNorm<\/code> ? \u0421\u0435\u0439\u0447\u0430\u0441 \u0432\u0434\u0430\u0432\u0430\u0442\u044c\u0441\u044f \u0432 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043d\u0435 \u0431\u0443\u0434\u0443, \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043a\u0430\u0436\u0443, \u0447\u0442\u043e <code>nn.LayerNorm<\/code> \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0443\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0442\u0435\u043d\u0437\u043e\u0440\u043e\u0432 (\u0442\u043e\u0447\u0435\u043a) \u0433\u0434\u0435-\u0442\u043e \u0432 \u043f\u0440\u0435\u0434\u0435\u043b\u0430\u0445 [-2, 2].<\/p>\n<p>\u0412\u043e\u0442 \u0434\u043b\u044f \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0435 \u0434\u043e \u0438 \u043f\u043e\u0441\u043b\u0435 \u043d\u043e\u0440\u043c\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 <\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/uJvj47i.png\" alt=\"\u0421\u043a\u043e\u043c\u043a\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u0446\u0435\u043d\u0442\u0440\u0435, \u043d\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u043b\u0438 \u0444\u043e\u0440\u043c\u0443\" title=\"\u0421\u043a\u043e\u043c\u043a\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u0446\u0435\u043d\u0442\u0440\u0435, \u043d\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u043b\u0438 \u0444\u043e\u0440\u043c\u0443\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/uJvj47i.png 780w,&#10;       https:\/\/i.imgur.com\/uJvj47i.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0421\u043a\u043e\u043c\u043a\u0438\u0432\u0430\u043b\u0438\u0441\u044c \u0432 \u0446\u0435\u043d\u0442\u0440\u0435, \u043d\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u043b\u0438 \u0444\u043e\u0440\u043c\u0443<\/figcaption><\/div>\n<\/figure>\n<p>\u0414\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438, \u043d\u043e\u0440\u043c\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u0442\u044c &#8212; \u044d\u0442\u043e \u0437\u043d\u0430\u0447\u0438\u0442 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u0442\u044c \u0434\u0430\u043d\u043d\u044b\u0435 \u0442\u0430\u043a, \u0447\u0442\u043e\u0431\u044b \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0431\u044b\u043b\u0430 0, \u0430 \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u0435 \u043e\u0442\u043a\u043b\u043e\u043d\u0435\u043d\u0438\u0435 1. \u041e\u0431\u044b\u043a\u043d\u043e\u0432\u0435\u043d\u043d\u0430\u044f \u0444\u043e\u0440\u043c\u0443\u043b\u0430 \u0438\u0437 \u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0438. \u0422\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c <code>nn.LayerNorm<\/code> \u043e\u0431\u043b\u0435\u0433\u0447\u0430\u0435\u0442 \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0443 \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 \u0438\u043c\u0435\u0435\u0442 \u0435\u0449\u0451 \u043e\u0434\u043d\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u043e\u0435 \u0441\u0432\u043e\u0439\u0441\u0442\u0432\u043e, \u043e \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u044f, \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e, \u0440\u0430\u0441\u0441\u043a\u0430\u0436\u0443 \u043f\u043e\u0437\u0436\u0435.<\/p>\n<p>\u041a\u0441\u0442\u0430\u0442\u0438, \u0432\u043e\u043f\u0440\u043e\u0441 \u043a \u0437\u0430\u043b\u0443: \u0442\u0435\u043d\u0437\u043e\u0440 \u043a\u0430\u043a\u043e\u0439 \u0444\u043e\u0440\u043c\u044b \u0441\u043c\u043e\u0436\u0435\u0442 \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0442\u044c \u043d\u0430 \u0432\u0445\u043e\u0434 \u0432\u043e\u0442 \u044d\u0442\u0430 \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c:<\/p>\n<pre><code>model = DenoiserBlock(25, 3) <\/code><\/pre>\n<p>\u041e\u0442\u0432\u0435\u0442: \u043b\u044e\u0431\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440, \u0443 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0435\u0435 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 \u0440\u0430\u0432\u043d\u043e 25. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 <code>(25), (72, 25), (1, 25), (8, 3, 25, 25)<\/code>, \u0438 \u0442.\u043f.<\/p>\n<p>\u041b\u0430\u0434\u043d\u043e, \u0441 \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u043c \u0431\u043b\u043e\u043a\u043e\u043c \u0440\u0430\u0437\u043e\u0431\u0440\u0430\u043b\u0438\u0441\u044c, \u043f\u0435\u0440\u0435\u0445\u043e\u0434\u0438\u043c \u043a \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438.<\/p>\n<pre><code class=\"python\">class Denoiser(nn.Module):       def __init__(self, hidden_dims):           super().__init__()           self.input_encoder = nn.Linear(2, hidden_dims)           self.blocks = []         self.output_decoder = nn.Linear(hidden_dims, 2)      <\/code><\/pre>\n<p>\u041a\u0430\u043a \u0438 \u043d\u0430 \u0441\u0445\u0435\u043c\u0435 \u0432\u044b\u0448\u0435, \u0441\u043b\u043e\u0439 \u0434\u043b\u044f \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0435\u043d\u0438\u044f \u0432\u0445\u043e\u0434\u043d\u043e\u0433\u043e 2-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0442\u0435\u043d\u0437\u043e\u0440 \u0432 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439, \u0441\u043b\u043e\u0439 \u0434\u043b\u044f \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0435\u043d\u0438\u044f \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0435\u0433\u043e 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0442\u0435\u043d\u0437\u043e\u0440\u0430 \u043e\u0431\u0440\u0430\u0442\u043d\u043e \u0432 2-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439. \u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0435\u0449\u0451 \u0440\u0430\u0437 \u043d\u0430\u043f\u043e\u043c\u043d\u044e, \u0447\u0442\u043e \u0437\u0434\u0435\u0441\u044c 2-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439 \u0442\u0435\u043d\u0437\u043e\u0440\u0430 \u044d\u0442\u043e \u0442\u0435\u043d\u0437\u043e\u0440 \u0441 \u0448\u0435\u0439\u043f\u043e\u043c (\u0440\u0435\u0437\u043c\u0435\u0440\u043e\u043c) (B, 2), \u0430 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439 \u0441 \u0448\u0435\u0439\u043f\u043e\u043c (B, 16). \u0417\u0434\u0435\u0441\u044c B &#8212; \u044d\u0442\u043e \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430 (\u0433\u0440\u0443\u043f\u043f\u044b). \u0421\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u044d\u043c\u043f\u043b\u043e\u0432 (\u0442\u043e\u0447\u0435\u043a) \u043c\u044b \u043e\u0431\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0435\u043c \u0437\u0430 \u0440\u0430\u0437, \u0434\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438. \u0415\u0441\u043b\u0438, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440 \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0437\u043c\u0435\u0440\u043e\u043c (64, 2), \u0442\u043e \u043f\u0440\u043e\u0439\u0434\u044f \u0447\u0435\u0440\u0435\u0437 <code>input_encoder<\/code> \u043e\u043d \u043f\u0440\u0435\u0432\u0440\u0430\u0442\u0438\u0442\u0441\u044f \u0432 \u0442\u0435\u043d\u0437\u043e\u0440 (64, 16).<\/p>\n<p>\u0414\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u0431\u043b\u043e\u043a\u0438:<\/p>\n<pre><code class=\"python\">class Denoiser(nn.Module):       def __init__(self, hidden_dims, num_blocks):           super().__init__()           self.input_encoder = nn.Linear(2, hidden_dims)         block_list = [DenoiserBlock(hidden_dims, 4) for _ in range(num_blocks)]         self.blocks = nn.ModuleList(block_list)         self.output_decoder = nn.Linear(hidden_dims, 2)      <\/code><\/pre>\n<p>\u0417\u0430\u0447\u0435\u043c \u043e\u0431\u043e\u0440\u0430\u0447\u0438\u0432\u0430\u0442\u044c \u0432  <code>nn.ModuleList<\/code>? \u0412\u0441\u0451 \u0434\u043b\u044f \u0442\u043e\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u0432\u0441\u0435\u0445 \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439 \u0432 \u0441\u043f\u0438\u0441\u043a\u0435 \u0431\u044b\u043b\u0438 \u0434\u043e\u0441\u0442\u0443\u043f\u043d\u044b \u0432\u043d\u0435\u0448\u043d\u0435\u0439 \u043c\u043e\u0434\u0435\u043b\u0438. \u0414\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438, \u0447\u0442\u043e\u0431\u044b <code>Denoiser<\/code> \u0441\u043e \u0441\u043f\u0438\u0441\u043a\u043e\u043c <code>DenoiserBlock<\/code> \u0432\u043d\u0443\u0442\u0440\u0438 \u0443\u043f\u0440\u0430\u0432\u043b\u044f\u043b\u0441\u044f \u043a\u0430\u043a \u0435\u0434\u0438\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c.<\/p>\n<p>\u041e\u0441\u0442\u0430\u043b\u043e\u0441\u044c \u0442\u043e\u043b\u044c\u043a\u043e \u0434\u043e\u043f\u0438\u0441\u0430\u0442\u044c \u043c\u0435\u0442\u043e\u0434 <code>forward<\/code><\/p>\n<pre><code class=\"python\">def forward(self, x):       hidden = self.input_encoder(x)  # (B, 2) -&gt; (B, 16)     for block in self.blocks:         hidden = block(hidden)  # \u0432\u044b\u0445\u043e\u0434 \u043e\u0434\u043d\u043e\u0433\u043e \u0431\u043b\u043e\u043a\u0430 \u043f\u0435\u0440\u0435\u0434\u0430\u0451\u0442\u0441\u044f \u043d\u0430 \u0432\u0445\u043e\u0434 \u0432\u0442\u043e\u0440\u043e\u043c\u0443     return self.output_decoder(hidden)  # (B, 16) -&gt; (B, 2) <\/code><\/pre>\n<p>\u0410 \u043a\u043e\u0434-\u0442\u043e \u043d\u0435\u0432\u0435\u0440\u043d\u044b\u0439! \u0411\u043b\u043e\u043a\u0438 \u0432\u043d\u0443\u0442\u0440\u0438 \u0434\u0435\u043d\u043e\u0439\u0437\u0435\u0440\u0430 \u0434\u043e\u043b\u0436\u043d\u044b \u0431\u044b\u0442\u044c \u0441\u043e\u0435\u0434\u0438\u043d\u0435\u043d\u044b \u043d\u0435 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e, \u0430 \u0447\u0435\u0440\u0435\u0437 skip-connection. \u041d\u0435 \u0437\u0430\u0431\u044b\u0432\u0430\u0439\u0442\u0435, \u0447\u0442\u043e \u043a\u043e\u043d\u0435\u0447\u043d\u0430\u044f \u0446\u0435\u043b\u044c &#8212; \u044d\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u044c-\u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440, \u0430 \u0443 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u043e\u0432 \u0441\u043b\u043e\u0438 (\u0431\u043b\u043e\u043a\u0438) \u0441\u043e\u0435\u0434\u0438\u043d\u0435\u043d\u044b \u0447\u0435\u0440\u0435\u0437 skip-connection, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u043f\u0435\u0440\u0435\u0434\u0435\u043b\u044b\u0432\u0430\u0435\u043c \u0442\u043e, \u043a\u0430\u043a \u0441\u043e\u0435\u0434\u0438\u043d\u0435\u043d\u044b \u0431\u043b\u043e\u043a\u0438 \u0438 \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u0435\u043c Denoiser \u0432 <a href=\"https:\/\/en.wikipedia.org\/wiki\/Residual_neural_network\" rel=\"noopener noreferrer nofollow\">\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u0443\u044e<\/a> \u0441\u0435\u0442\u044c:<\/p>\n<pre><code class=\"python\">def forward(self, x):       hidden = self.input_encoder(x)  # (B, 2) -&gt; (B, 16)     for block in self.blocks:     # \u0412\u044b\u0445\u043e\u0434 \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0431\u043b\u043e\u043a\u0430 \u043f\u0440\u0438\u0431\u0430\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043a \u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e\u043c\u0443 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044e \u0438 \u043f\u0435\u0440\u0435\u0434\u0430\u0451\u0442\u0441\u044f \u0434\u0430\u043b\u044c\u0448\u0435         hidden = hidden + block(hidden)  #      return self.output_decoder(hidden)  # (B, 16) -&gt; (B, 2) <\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0441\u0451 \u0432\u043c\u0435\u0441\u0442\u0435 \u044d\u0442\u043e \u0442\u0435\u043f\u0435\u0440\u044c \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0432\u043e\u0442 \u0442\u0430\u043a<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\">import torch.nn as nn  class DenoiserBlock(nn.Module): def __init__(self, hidden_dim, mlp_ratio):       super().__init__()     self.ln = nn.LayerNorm(hidden_dims)     self.mlp = nn.Sequential( nn.Linear(hidden_dim, hidden_dim * mlp_ratio), nn.SiLU(), nn.Linear(hidden_dim * mlp_ratio, hidden_dim), )  def forward(x): z = self.ln(x)  # \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0435\u043c \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440 \u0447\u0435\u0440\u0435\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044e return self.mlp(z)  # \u0430 \u043f\u043e\u0442\u043e\u043c \u0447\u0435\u0440\u0435\u0437 MLP   class Denoiser(nn.Module):       def __init__(self, hidden_dims, num_blocks):           super().__init__()           self.input_encoder = nn.Linear(2, hidden_dims)         block_list = [Denoiser2DBlock(hidden_dims, 4) for _ in range(num_blocks)]         self.blocks = nn.ModuleList(block_list)         self.output_decoder = nn.Linear(hidden_dims, 2)          def forward(self, x):       hidden = self.input_encoder(x)  # (B, 2) -&gt; (B, 16)     for block in self.blocks:     # \u0412\u041d\u0418\u041c\u0410\u041d\u0418\u0415: \u044d\u0442\u043e \u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u0430\u044f (residual) \u0441\u0435\u0442\u044c, \u0442\u043e \u0435\u0441\u0442\u044c       # \u043f\u043e\u0441\u043b\u0435 \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u043c\u044b \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u043c \u043d\u0430\u0448\u0435 \u0441\u043a\u0440\u044b\u0442\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u043f\u0440\u0438\u0431\u0430\u0432\u043b\u044f\u044f \u043a \u043d\u0435\u043c\u0443 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u0440\u0430\u0431\u043e\u0442\u044b \u0431\u043b\u043e\u043a\u0430       hidden = hidden + block(hidden + time_embedding)         hidden = block(hidden)  # \u0432\u044b\u0445\u043e\u0434 \u043e\u0434\u043d\u043e\u0433\u043e \u0431\u043b\u043e\u043a\u0430 \u043f\u0435\u0440\u0435\u0434\u0430\u0451\u0442\u0441\u044f \u043d\u0430 \u0432\u0445\u043e\u0434 \u0432\u0442\u043e\u0440\u043e\u043c\u0443     return self.output_decoder(hidden)  # (B, 16) -&gt; (B, 2) <\/code><\/pre>\n<\/div>\n<\/details>\n<h3>\u041e\u0441\u0442\u0430\u043b\u043e\u0441\u044c \u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u043a\u043e\u0434 \u0434\u043b\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438<\/h3>\n<p>\u0412 \u0441\u0430\u043c\u043e\u043c \u043d\u0430\u0447\u0430\u043b\u0435 \u043d\u0430\u0434\u043e \u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0434\u0430\u0442\u0430\u0441\u0435\u0442:<\/p>\n<pre><code class=\"python\">BATCH_SIZE = 128 simple_dataset = TensorDataset(make_simple_dataset(4096))   data_loader = DataLoader(dataset=simple_dataset,                             batch_size=BATCH_SIZE,                             shuffle=True) <\/code><\/pre>\n<p>\u041a\u043e\u0440\u043e\u0447\u0435, <code>data_loader<\/code> &#8212; \u044d\u0442\u043e \u0438\u0442\u0435\u0440\u0430\u0442\u043e\u0440 \u043f\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0438\u0437 4096 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0431\u0443\u0434\u0435\u0442 \u0437\u0430 \u0440\u0430\u0437 \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0442\u044c \u043f\u043e 128 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432 \u0438\u0437 \u044d\u0442\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430, \u0432 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u043c \u043f\u043e\u0440\u044f\u0434\u043a\u0435 (\u043d\u043e \u0431\u0435\u0437 \u043f\u043e\u0432\u0442\u043e\u0440\u0435\u043d\u0438\u0439). \u0415\u0441\u043b\u0438 \u0432\u0441\u0435 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u044b \u043a\u043e\u043d\u0447\u0430\u0442\u0441\u044f, \u0442\u043e \u043f\u0440\u043e\u0441\u0442\u043e \u043d\u0430\u0447\u043d\u0451\u0442 \u0441\u043d\u0430\u0447\u0430\u043b\u0430.<\/p>\n<p>\u0421\u0430\u043c\u0430 \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0430, \u044d\u0442\u043e \u0432\u043e\u0442 \u0442\u0430\u043a\u043e\u0439 \u0446\u0438\u043a\u043b:<\/p>\n<pre><code class=\"python\">for x, in data_loader: # \u043e\u0434\u043d\u0430 \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438 <\/code><\/pre>\n<p>\u0410 \u043f\u043e\u0447\u0435\u043c\u0443 <code>x,<\/code> \u0430 \u043d\u0435 \u043f\u0440\u043e\u0441\u0442\u043e <code>x<\/code> \u0431\u0435\u0437 \u0437\u0430\u043f\u044f\u0442\u043e\u0439? \u0414\u0430 \u043f\u043e\u0442\u043e\u043c\u0443, \u0447\u0442\u043e <code>data_loader<\/code> \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0435\u0442 \u0441\u043f\u0438\u0441\u043e\u043a, \u0432\u0435\u0434\u044c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u044b \u043e\u0431\u044b\u0447\u043d\u043e \u0441\u043e\u0441\u0442\u043e\u044f\u0442 \u0438\u0437 \u043f\u0430\u0440 \u0442\u0438\u043f\u0430 (\u0432\u043e\u043f\u0440\u043e\u0441 -&gt; \u043e\u0442\u0432\u0435\u0442) \u0438\u043b\u0438 (\u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 -&gt; \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435).<\/p>\n<p>\u041e\u0434\u0438\u043d \u0440\u0430\u0437 \u043f\u0440\u043e\u0439\u0442\u0438 \u043f\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0447\u0430\u0441\u0442\u043e \u0431\u044b\u0432\u0430\u0435\u0442 \u043d\u0435\u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e. \u041c\u043e\u0434\u0435\u043b\u044c \u0434\u043e\u043b\u0436\u043d\u0430 \u0443\u0432\u0438\u0434\u0435\u0442\u044c \u043e\u0434\u0438\u043d \u0438 \u0442\u043e\u0442 \u0436\u0435 \u0441\u044d\u043c\u043f\u043b \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0440\u0430\u0437. \u041e\u0434\u0438\u043d \u043f\u0440\u043e\u0445\u043e\u0434 \u043f\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u044d\u043f\u043e\u0445\u0430 (epoch). \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u043e\u0431\u043e\u0440\u0430\u0447\u0438\u0432\u0430\u0435\u043c \u043a\u043e\u0434 \u0432 \u0435\u0449\u0451 \u043e\u0434\u0438\u043d \u0446\u0438\u043a\u043b:<\/p>\n<pre><code class=\"python\">EPOCH = 2000 for epoch in range(EPOCH): epoch_loss = 0  # \u0447\u0442\u043e\u0431\u044b \u043e\u0442\u0441\u043b\u0435\u0436\u0438\u0432\u0430\u0442\u044c \u043a\u0430\u043a\u0430\u044f \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u0430\u044f \u043e\u0448\u0438\u0431\u043a\u0430 \u0437\u0430 \u044d\u043f\u043e\u0445\u0443 for x, in data_loader: # \u043e\u0434\u043d\u0430 \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438 # \u043d\u0430\u043a\u0430\u043f\u043b\u0438\u0432\u0430\u0435\u043c epoch_loss if epoch % 100 == 0:  # \u043f\u0438\u0448\u0435\u043c \u0432 \u043a\u043e\u043d\u0441\u043e\u043b\u044c \u043a\u0430\u0436\u0434\u044b\u0435 100 \u044d\u043f\u043e\u0445 print(f\"Epoch {epoch + 1} completed. Loss: {epoch_loss:.2f}\") <\/code><\/pre>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0442\u0435\u043f\u0435\u0440\u044c \u0434\u043e\u0431\u0430\u0432\u0438\u043c \u043c\u043e\u0434\u0435\u043b\u044c \u0434\u043b\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438:<\/p>\n<pre><code class=\"python\">LR = 3e-4  # Learning rate. \u041d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e \u0437\u0430 \u0440\u0430\u0437 \u0431\u0443\u0434\u0435\u043c \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0442\u044c \u0432\u0435\u0441\u0430 \u043c\u043e\u0434\u0435\u043b\u0438 DEVICE = \"cuda\"  # \u041d\u0443 \u043d\u0435 \u043d\u0430 CPU \u0436\u0435.  # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043c\u043e\u0434\u0435\u043b\u044c \u0441 8 \u0431\u043b\u043e\u043a\u0430\u043c\u0438 \u0432\u043d\u0443\u0442\u0440\u0438 model = Denoiser(hidden_dims=16, num_blocks=8) model.to(DEVICE)  # \u0438 \u043e\u0442\u043f\u0440\u0430\u0432\u043b\u044f\u0435\u043c \u0432\u0435\u0441\u0430 \u043c\u043e\u0434\u0435\u043b\u0438 \u043d\u0430 GPU  # \u043e\u043f\u0442\u0438\u043c\u0430\u0439\u0437\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0431\u0443\u0434\u0435\u0442 \u043f\u043e-\u0443\u043c\u043d\u043e\u043c\u0443 \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0442\u044c \u0432\u0435\u0441\u0430 \u0443 \u043c\u043e\u0434\u0435\u043b\u0438 (\u0441 \u0438\u043d\u0435\u0440\u0446\u0438\u0435\u0439 \u0438 \u0442.\u043f.) optimizer = torch.optim.AdamW(model.parameters(), lr=LR)                              EPOCH = 2000 for epoch in range(EPOCH): epoch_loss = 0  # \u0447\u0442\u043e\u0431\u044b \u043e\u0442\u0441\u043b\u0435\u0436\u0438\u0432\u0430\u0442\u044c \u043a\u0430\u043a\u0430\u044f \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u0430\u044f \u043e\u0448\u0438\u0431\u043a\u0430 \u0437\u0430 \u044d\u043f\u043e\u0445\u0443 for x, in data_loader: # \u0437\u0434\u0435\u0441\u044c \u043f\u043e\u0434\u0433\u043e\u0442\u043e\u0432\u043a\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 # \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u0435 xt \u0438 true_vector \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0441\u044d\u043c\u043f\u043b\u0430 x \u0438\u043d\u044b\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438  # \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0435\u043c \u0432\u0445\u043e\u0434\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0441\u043a\u0432\u043e\u0437\u044c \u043c\u043e\u0434\u0435\u043b\u044c \u0438 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u0435 predicted_vector = model(xt) # \u0441\u0440\u0430\u0432\u043d\u0438\u0432\u0430\u0435\u043c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u043d\u044b\u0439 \u043c\u043e\u0434\u0435\u043b\u044c\u044e \u0432\u0435\u043a\u0442\u043e\u0440 \u0441 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0438 \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u043e\u0448\u0438\u0431\u043a\u0443 loss = torch.mean((true_vector - predicted_vector) ** 2)    optimizer.zero_grad()  # \u043e\u0447\u0438\u0449\u0430\u0435\u043c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442 \u043e\u0441\u0442\u0430\u0432\u0448\u0438\u0439\u0441\u044f \u0441 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0435\u0433\u043e \u0446\u0438\u043a\u043b\u0430 loss.backward()  # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442 \u043c\u0435\u0442\u043e\u0434\u043e\u043c backpropagation optimizer.step()  # \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u043c \u0432\u0435\u0441\u0430  if epoch % 100 == 0:  # \u043f\u0438\u0448\u0435\u043c \u0432 \u043a\u043e\u043d\u0441\u043e\u043b\u044c \u043a\u0430\u0436\u0434\u044b\u0435 100 \u044d\u043f\u043e\u0445 print(f\"Epoch {epoch + 1} completed. Loss: {epoch_loss:.2f}\") <\/code><\/pre>\n<p>\u041c\u043d\u043e\u0433\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442 \u0441\u0442\u0430\u0442\u0435\u0439, \u0433\u0434\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e \u0440\u0430\u0441\u043f\u0438\u0441\u0430\u043d \u043c\u0435\u0445\u0430\u043d\u0438\u0437\u043c \u043e\u0431\u0440\u0430\u0442\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u043e\u0448\u0438\u0431\u043a\u0438, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u043e\u043f\u0438\u0448\u0443 \u0432\u0441\u0451 \u043e\u0447\u0435\u043d\u044c \u043f\u0440\u043e\u0441\u0442\u043e, \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0430\u044f \u0432\u0430\u0436\u043d\u044b\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0441\u0442\u0438.<\/p>\n<p>\u0412 \u043e\u0431\u0449\u0435\u043c, \u0432\u043e\u0442 \u044d\u0442\u043e\u0442 \u043a\u043e\u0434 \u0441\u043e\u0437\u0434\u0430\u0451\u0442 \u0433\u0440\u0430\u0444 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439, \u0432 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u044b \u0432\u0441\u0435 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u044f, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043f\u0440\u043e\u0438\u0437\u043e\u0448\u043b\u0438, \u043a\u043e\u0433\u0434\u0430 \u0434\u0430\u043d\u043d\u044b\u0435 \u0447\u0435\u0440\u0435\u0437 \u043c\u043e\u0434\u0435\u043b\u044c:<\/p>\n<pre><code class=\"python\">predicted_vector = model(xt) loss = torch.mean((true_vector - predicted_vector) ** 2) <\/code><\/pre>\n<p>\u041f\u043e\u043b\u0443\u0447\u0438\u0432\u0448\u0438\u0439\u0441\u044f \u0442\u0435\u043d\u0437\u043e\u0440 <code>loss<\/code> \u0442\u043e\u0436\u0435 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0447\u0430\u0441\u0442\u044c\u044e \u044d\u0442\u043e\u0433\u043e \u0433\u0440\u0430\u0444\u0430, \u0438 \u043f\u043e\u044d\u0442\u043e\u043c\u0443, \u043a\u043e\u0433\u0434\u0430 \u043c\u044b \u0432\u044b\u0437\u044b\u0432\u0430\u0435\u043c<\/p>\n<pre><code class=\"python\">loss.backward() <\/code><\/pre>\n<p>PyTorch \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442 \u0438\u043c\u0435\u044e\u0449\u0438\u0439\u0441\u044f \u0433\u0440\u0430\u0444 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439, \u0447\u0442\u043e\u0431\u044b \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442\u044c (\u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u044c) \u043a\u0430\u043a \u0434\u043e\u043b\u0436\u043d\u044b \u043f\u043e\u043c\u0435\u043d\u044f\u0442\u044c\u0441\u044f \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u0432\u0441\u0435\u0445 \u0443\u0447\u0430\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u0432 \u0433\u0440\u0430\u0444\u0435 \u0442\u0435\u043d\u0437\u043e\u0440\u043e\u0432, \u0447\u0442\u043e\u0431\u044b \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 <code>loss<\/code> \u0441\u0442\u0430\u043b\u043e \u043c\u0435\u043d\u044c\u0448\u0435. \u041f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u0443\u044e \u0441\u0447\u0438\u0442\u0430\u0435\u0442, \u043a\u043e\u0440\u043e\u0447\u0435. \u041f\u043e\u0441\u043b\u0435 \u044d\u0442\u043e\u0433\u043e \u0443 \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430 \u0432\u043d\u0443\u0442\u0440\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u043f\u043e\u044f\u0432\u0438\u043b\u043e\u0441\u044c \u0435\u0449\u0451 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u0447\u0438\u0441\u043b\u043e, \u043a\u043e\u0442\u043e\u0440\u043e\u0435 \u0438 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u044d\u0442\u043e\u0439 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u043e\u0439. \u042d\u0442\u043e \u0438 \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f <strong>\u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442<\/strong>. \u0422\u0435\u043f\u0435\u0440\u044c \u0437\u0430 \u0434\u0435\u043b\u043e \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442\u0441\u044f <code>optimizer<\/code>. \u041e\u043d \u0438\u043c\u0435\u0435\u0442 \u0434\u043e\u0441\u0442\u0443\u043f \u043a\u043e \u0432\u0441\u0435\u043c \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c \u043c\u043e\u0434\u0435\u043b\u0438 (\u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u0442\u0435 \u043a\u0430\u043a \u043e\u043d \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043b\u0441\u044f), \u0430 \u0437\u043d\u0430\u0447\u0438\u0442 \u0438 \u043a \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u0443. \u041a\u043e\u043c\u0430\u043d\u0434\u0430 <code>optimizer.step()<\/code> \u0437\u0430\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u043e\u043f\u0442\u0438\u043c\u0430\u0439\u0437\u0435\u0440 \u043e\u0431\u043d\u043e\u0432\u0438\u0442\u044c \u0432\u0441\u0435 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0440\u0443\u043a\u043e\u0432\u043e\u0434\u0441\u0442\u0432\u0443\u044f\u0441\u044c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u043e\u043c, learning rate \u0438 \u0441\u0432\u043e\u0438\u043c \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u043c \u0441\u043e\u0441\u0442\u043e\u044f\u043d\u0438\u0435\u043c (\u0445\u0438\u0442\u0440\u043e \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c\u0430\u044f \u0438\u043d\u0435\u0440\u0446\u0438\u044f). \u041a\u0441\u0442\u0430\u0442\u0438, \u0437\u0430\u043c\u0435\u0442\u044c\u0442\u0435, \u0447\u0442\u043e \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043e\u0431\u043d\u043e\u0432\u0438\u043b\u0438\u0441\u044c, \u043d\u043e \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442 \u043d\u0438\u043a\u0443\u0434\u0430 \u043d\u0435 \u0434\u0435\u043b\u0441\u044f \u0438 \u0442\u0430\u043a \u0438 \u043e\u0441\u0442\u0430\u043b\u0441\u044f \u043f\u0440\u0438\u0432\u044f\u0437\u0430\u043d \u043a \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c. \u041f\u043e\u044d\u0442\u043e\u043c\u0443, \u0432 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u043c \u0446\u0438\u043a\u043b\u0435 \u0438 \u0432\u044b\u0437\u044b\u0432\u0430\u0435\u043c <code>optimizer.zero_grad()<\/code>,  \u0447\u0442\u043e\u0431\u044b \u043e\u0447\u0438\u0441\u0442\u0438\u0442\u044c \u0435\u0433\u043e, \u0438\u043d\u0430\u0447\u0435 <code>loss.backward()<\/code> \u043d\u0430\u043b\u043e\u0436\u0438\u0442 \u0441\u0442\u0430\u0440\u044b\u0439 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442 \u043d\u0430 \u043d\u043e\u0432\u044b\u0439. \u042d\u0442\u043e \u0438\u043d\u043e\u0433\u0434\u0430 \u0431\u044b\u0432\u0430\u0435\u0442 \u043f\u043e\u043b\u0435\u0437\u043d\u043e, \u043d\u043e \u0432 \u0442\u0430\u043a\u0438\u0435 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u0432\u0434\u0430\u0432\u0430\u0442\u044c\u0441\u044f \u043d\u0435 \u0431\u0443\u0434\u0435\u043c.<\/p>\n<p>\u0414\u043e\u043f\u0438\u0441\u044b\u0432\u0430\u0435\u043c \u043e\u0441\u0442\u0430\u0432\u0448\u0443\u044e\u0441\u044f \u0447\u0430\u0441\u0442\u044c \u0446\u0438\u043a\u043b\u0430:<\/p>\n<pre><code class=\"python\">BATCH_SIZE = 128   LR = 3e-4 DEVICE = \"cuda\" EPOCH = 1000  for epoch in range(EPOCH): epoch_loss = 0 for x, in data_loader:     # \u043a\u043e\u043f\u0438\u0440\u0443\u0435\u043c \u0441\u044d\u043c\u043f\u043b \u043d\u0430 GRU x0 = x.to(DEVICE)  # (128, 2) - \u0444\u043e\u0440\u043c\u0430 \u0442\u0435\u043d\u0437\u043e\u0440\u0430  # \u0441\u043e\u0437\u0434\u0430\u0451\u043c \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u0422\u043e\u0436\u0435 (128, 2) noise = torch.randn_like(x, device=DEVICE)  # \u0441\u0440\u0430\u0437\u0443 \u0436\u0435 \u043e\u043a\u0430\u0436\u0435\u0442\u0441\u044f \u043d\u0430 GPU  # \u0430 \u044d\u0442\u043e \u0443\u0436\u0435 \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0440\u0430\u0432\u043d\u043e\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0432 \u0438\u043d\u0442\u0435\u0440\u0432\u0430\u043b\u0435 \u043e\u0442 0 \u0434\u043e 1 time = torch.rand((BATCH_SIZE, 1), device=DEVICE)  # (128, 1)   # \u041a\u0430\u043a\u043e\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u043d\u0430\u0434\u043e \u043f\u0440\u0438\u0431\u0430\u0432\u0438\u0442\u044c \u043a \u0448\u0443\u043c\u0443, \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 true_vector = x0 - noise  # \u0441\u0440\u0430\u0437\u0443 128 \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432 \u0437\u0430 \u0440\u0430\u0437 # xt - \u044d\u0442\u043e \u0442\u043e\u0447\u043a\u0438 \u043b\u0435\u0436\u0430\u0449\u0438\u0435 \"\u043d\u0430 \u043f\u043e\u043b\u043f\u0443\u0442\u0438\" \u043e\u0442 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0434\u043e \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e xt = noise + true_vector * (1 - time)  predicted_vector = model(xt) loss = torch.mean((true_vector - predicted_vector) ** 2) epoch_loss += loss.item()  # \u043d\u0430\u043a\u0430\u043f\u043b\u0438\u0432\u0430\u0435\u043c \u043e\u0448\u0438\u0431\u043a\u0443 \u0434\u043b\u044f \u043b\u043e\u0433\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f    optimizer.zero_grad() loss.backward() optimizer.step() if epoch % 100 == 0: print(f\"Epoch {epoch + 1} completed. Loss: {epoch_loss:.2f}\") <\/code><\/pre>\n<p>\u041a\u0430\u043a\u0430\u044f \u0443 \u043d\u0430\u0441 \u0437\u0430\u0434\u0430\u0447\u0430 \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438? \u0415\u0441\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f <code>x0<\/code>, \u0435\u0441\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f <code>noise<\/code>. \u0427\u0442\u043e\u0431\u044b \u043d\u0430\u0443\u0447\u0438\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0448\u0443\u043c\u043d\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0432 \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u043c\u044b \u0441\u043e\u0437\u0434\u0430\u0451\u043c \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 <code>xt<\/code> &#8212; \u044d\u0442\u043e \u0442\u043e\u0447\u043a\u0438 \u043b\u0435\u0436\u0430\u0449\u0438\u0435 \u0433\u0434\u0435-\u0442\u043e \u043d\u0430 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438 \u043e\u0442 \u0448\u0443\u043c\u043d\u043e\u0433\u043e (\u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e) \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e. \u0412\u043e\u0442 \u0432\u044b \u0441\u043f\u0440\u043e\u0441\u0438\u0442\u0435, \u0430 \u043a\u0430\u043a\u0430\u044f \u0443 \u043a\u0430\u0436\u0434\u043e\u0439 \u0442\u043e\u0447\u043a\u0438 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044f \u0432\u043e\u043e\u0431\u0449\u0435? \u0422\u0443\u0442 \u043f\u0440\u043e\u0441\u0442\u043e, \u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435: \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0441\u044d\u043c\u043f\u043b\u0430 \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043c\u044b \u0431\u0435\u0440\u0451\u043c \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0439 \u0435\u043c\u0443 (\u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043e\u0432\u043f\u0430\u0432\u0448\u0438\u0439 \u043f\u043e \u0438\u043d\u0434\u0435\u043a\u0441\u0443) \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u0422\u0430\u043a-\u043a\u0430\u043a \u044d\u0442\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0435, \u0442\u043e \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u0447\u0442\u043e \u043a\u0430\u0436\u0434\u043e\u043c\u0443 \u0441\u044d\u043c\u043f\u043b\u0443 (\u0442\u043e\u0447\u043a\u0435) \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0431\u0435\u0440\u0451\u0442\u0441\u044f \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u0430\u044f \u0442\u043e\u0447\u043a\u0430 \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u041d\u0435 \u0441\u0430\u043c\u0430\u044f \u0431\u043b\u0438\u0436\u0430\u0439\u0448\u0430\u044f, \u0430 \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u0430\u044f, \u0434\u0430. \u0412 \u0442\u0430\u043a\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 <code>true_vector<\/code> &#8212; \u044d\u0442\u043e \u043f\u0440\u043e\u0441\u0442\u043e \u0432\u0435\u043a\u0442\u043e\u0440, \u0441\u043e\u0435\u0434\u0438\u043d\u044f\u044e\u0449\u0438\u0439 \u044d\u0442\u0443 \u043f\u0430\u0440\u0443 \u0442\u043e\u0447\u0435\u043a. \u0418 \u0442\u0430\u043a\u0438\u0445 \u043f\u0430\u0440 128 &#8212; \u043f\u043e \u0440\u0430\u0437\u043c\u0435\u0440\u0443 \u0431\u0430\u0442\u0447\u0430. \u0422\u0435\u043f\u0435\u0440\u044c \u0440\u0430\u0437 \u0443 \u043d\u0430\u0441 \u0435\u0441\u0442\u044c \u0442\u043e\u0447\u043a\u0438 (\u0441\u044d\u043c\u043f\u043b\u044b) \u0438\u0437 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0438 \u0432\u0435\u043a\u0442\u043e\u0440\u0430, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0443\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0442 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0434\u043e (\u043a\u0430\u043a\u043e\u0433\u043e-\u0442\u043e) \u0441\u044d\u043c\u043f\u043b\u0430 \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f, \u043d\u0430\u043c \u043d\u0438\u0447\u0435\u0433\u043e \u043d\u0435 \u0441\u0442\u043e\u0438\u0442 \u0441\u043e\u0437\u0434\u0430\u0442\u044c \u043d\u0430\u0431\u043e\u0440 \u0442\u043e\u0447\u0435\u043a, \u043b\u0435\u0436\u0430\u0449\u0438\u0439 \u043d\u0430 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438 \u043e\u0442 \u0442\u043e\u0447\u0435\u043a \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0434\u043e \u0442\u043e\u0447\u0435\u043a \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e &#8212; \u043f\u0440\u043e\u0441\u0442\u043e \u043f\u0440\u0438\u0431\u0430\u0432\u0438\u0442\u044c \u043a \u0442\u043e\u0447\u043a\u0430\u043c \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440, \u043f\u0440\u0435\u0434\u0432\u0430\u0440\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0435\u0433\u043e \u043c\u0430\u0441\u0448\u0442\u0430\u0431\u0438\u0440\u043e\u0432\u0430\u0432 (10% \u0438\u043b\u0438 \u0442\u0430\u043c 87%). \u041f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f <code>time<\/code> \u0441\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c\u0438 \u0447\u0438\u0441\u043b\u0430\u043c\u0438 \u043e\u0442 0 \u0434\u043e 1 \u043a\u0430\u043a \u0440\u0430\u0437 \u0434\u043b\u044f \u044d\u0442\u043e\u0433\u043e. \u0422\u0430\u043a \u0438 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 <code>xt<\/code> \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0438 \u0441\u043a\u0430\u0440\u043c\u043b\u0438\u0432\u0430\u0435\u043c \u043c\u043e\u0434\u0435\u043b\u0438:<\/p>\n<pre><code class=\"python\">xt = noise + true_vector * (1 - time) predicted_vector = model(xt) <\/code><\/pre>\n<p>\u0415\u0441\u043b\u0438 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e \u043f\u043e\u0447\u0435\u043c\u0443 <code>(1 - time)<\/code>, \u0430 \u043d\u0435 \u043f\u0440\u043e\u0441\u0442\u043e <code>time<\/code>, \u0442\u043e \u044d\u0442\u043e \u043c\u044b \u043f\u0440\u0438\u0432\u044f\u0437\u044b\u0432\u0430\u0435\u043c\u0441\u044f \u043d\u0430 \u0442\u043e, \u0447\u0442\u043e \u0447\u0435\u043c \u0431\u043e\u043b\u044c\u0448\u0435 <code>time<\/code> \u0442\u0435\u043c \u0431\u043e\u043b\u044c\u0448\u0435 \u0448\u0443\u043c\u0430.<\/p>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c \u043a\u043e\u0434 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0433\u043e\u0442\u043e\u0432, \u043d\u043e \u0435\u0441\u043b\u0438 \u043c\u044b \u043f\u043e\u043f\u044b\u0442\u0430\u0435\u043c\u0441\u044f \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u044c \u044d\u0442\u043e\u0442 \u043c\u043e\u0434\u0443\u043b\u044c, \u0442\u043e \u0432 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043b\u0438\u0448\u044c \u0443\u0432\u0438\u0434\u0438\u043c \u0441 \u0434\u0435\u0441\u044f\u0442\u043e\u043a \u0437\u0430\u043f\u0438\u0441\u0435\u0439 \u0432 \u043a\u043e\u043d\u0441\u043e\u043b\u044c. \u041c\u044b \u0434\u0430\u0436\u0435 \u043c\u043e\u0434\u0435\u043b\u044c \u043d\u0435 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u043c \u0434\u043b\u044f \u0434\u0430\u043b\u044c\u043d\u0435\u0439\u0448\u0435\u0433\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f. \u0418 \u0441\u0430\u043c\u043e\u0435 \u0433\u043b\u0430\u0432\u043d\u043e\u0435 &#8212; \u043d\u0435 \u0432\u0438\u0434\u0438\u043c \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0435\u043d\u0438\u044f \u0442\u043e\u0433\u043e, \u0447\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u0435\u043c\u0430\u044f \u043d\u0430\u043c\u0438 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044f \u043f\u0440\u043e\u0441\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0432 \u0441\u043b\u043e\u0436\u043d\u043e\u0435 \u0432\u043e\u043e\u0431\u0449\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442. \u0427\u0442\u043e \u0434\u0435\u043b\u0430\u0442\u044c? \u041d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u043a\u043e\u0434 \u0441\u044d\u043c\u043f\u043b\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f (\u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430), \u0433\u0434\u0435 \u043c\u044b \u0431\u0443\u0434\u0435\u043c \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043d\u0430\u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c, \u0447\u0442\u043e\u0431\u044b \u0438\u0437\u0432\u043b\u0435\u043a\u0430\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f (\u043d\u0430\u0434\u0435\u044e\u0441\u044c).<\/p>\n<p>\u041b\u0430\u0434\u043d\u043e, \u0432\u043e\u0442 \u043a\u043e\u0434 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430:<\/p>\n<pre><code class=\"python\">samples = torch.randn((400, 2), device=DEVICE)   with torch.no_grad():       STEPS = 50       for step in range(STEPS, 0, -1):           predicted = model(samples)           samples += predicted * (1 \/ STEPS) <\/code><\/pre>\n<p>\u0427\u0442\u043e \u0442\u0443\u0442 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442? \u041c\u044b \u0433\u0435\u043d\u0435\u0440\u0438\u0440\u0443\u0435\u043c \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f, \u043f\u043e\u0442\u043e\u043c 50 \u0440\u0430\u0437 \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0435\u043c \u0435\u0433\u043e \u0441\u043a\u0432\u043e\u0437\u044c \u043c\u043e\u0434\u0435\u043b\u044c \u043a\u0430\u0436\u0434\u044b\u0439 \u0440\u0430\u0437 \u0443\u0442\u043e\u0447\u043d\u044f\u044f \u0432\u0435\u043a\u0442\u043e\u0440 <code>predicted<\/code>. \u041f\u043e\u0441\u043b\u0435 \u043a\u0430\u0436\u0434\u043e\u0439 \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0438 \u0446\u0438\u043a\u043b\u0430 <code>samples<\/code> \u0441\u0442\u0430\u043d\u043e\u0432\u044f\u0442\u0441\u044f \u0432\u0441\u0451 \u0431\u043b\u0438\u0436\u0435 \u0438 \u0431\u043b\u0438\u0436\u0435 \u043a \u0446\u0435\u043b\u0435\u0432\u043e\u043c\u0443 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044e, \u043d\u0443<br \/> \u0430 <code>torch.no_grad()<\/code> \u043e\u0442\u043a\u043b\u044e\u0447\u0430\u0435\u0442 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0435 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u0430. \u041f\u043e\u043b\u0435\u0437\u043d\u043e, \u0435\u0441\u043b\u0438 \u043c\u044b \u0445\u043e\u0442\u0438\u043c \u0437\u0430\u043d\u0438\u043c\u0430\u0442\u044c\u0441\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u043e\u043c \u043f\u0440\u044f\u043c\u043e \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438 \u0438 \u043d\u0435 \u0445\u043e\u0442\u0438\u043c, \u0447\u0442\u043e\u0431\u044b \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0439 \u043f\u0440\u043e\u0433\u043e\u043d \u043c\u043e\u0434\u0435\u043b\u0438 \u043a\u0430\u043a-\u0442\u043e \u043d\u0430 \u044d\u0442\u0443 \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0443 \u0432\u043b\u0438\u044f\u043b.<\/p>\n<p>\u041e\u0441\u0442\u0430\u043b\u043e\u0441\u044c \u043b\u0438\u0448\u044c \u043d\u0430\u043d\u0435\u0441\u0442\u0438 \u0442\u043e\u0447\u043a\u0438 \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a, \u043f\u0440\u0435\u0434\u0432\u0430\u0440\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0438\u043c\u043f\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u0430\u0432 <code>pyplot<\/code>:<\/p>\n<pre><code class=\"python\">import matplotlib.pyplot as plt <\/code><\/pre>\n<p>\u0414\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0442\u043e\u0447\u043a\u0438 \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a:<\/p>\n<pre><code class=\"python\">samples = torch.permute(samples, (1, 0)).cpu().detach()  # (400, 2) -&gt; (2, 400)    plt.figure(figsize=(6, 6))   plt.xlim(-3, 3)   plt.ylim(-3, 3)   plt.grid(True)   plt.axhline(0, color='black', linewidth=0.5)   plt.axvline(0, color='black', linewidth=0.5)   plt.scatter(samples[0], samples[1], s=4, c='blue')   plt.show() <\/code><\/pre>\n<p>\u0418 \u0432 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u0432\u043e\u0442 \u0442\u0430\u043a\u0443\u044e \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044e (\u0441\u0440\u0430\u0432\u043d\u0435\u043d\u0438\u0435 \u0441 \u0446\u0435\u043b\u0435\u0432\u043e\u0439): <\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/CrTTwU3.png\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/CrTTwU3.png 780w,&#10;       https:\/\/i.imgur.com\/CrTTwU3.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u0418\u0442\u0430\u043a, \u0441\u0435\u0433\u043e\u0434\u043d\u044f \u043c\u044b \u043d\u0430\u0443\u0447\u0438\u043b\u0438\u0441\u044c \u043f\u0440\u043e\u0435\u043a\u0442\u0438&#8230; \u041f\u043e\u0433\u043e\u0434\u0438\u0442\u0435-\u043a\u0430! \u0412\u043e\u0442 \u0432\u0430\u043c \u043d\u0435 \u043a\u0430\u0436\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u043c\u044b \u0447\u0442\u043e-\u0442\u043e \u0443\u043f\u0443\u0441\u0442\u0438\u043b\u0438, \u043d\u0435\u0442? \u0412\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0447\u0438\u0442\u0430\u0442\u0435\u043b\u044c \u0443\u0436\u0435 \u0434\u043e\u0433\u0430\u0434\u0430\u043b\u0441\u044f &#8212; \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e \u0438\u0433\u043d\u043e\u0440\u0438\u0440\u0443\u0435\u0442 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0443\u044e <code>time<\/code>. \u0410 \u044d\u0442\u043e \u0437\u043d\u0430\u0447\u0438\u0442 \u043c\u043e\u0434\u0435\u043b\u044c \u0443\u0447\u0438\u043b\u0430\u0441\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u043d\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u044f \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0439 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 \u043e \u0442\u043e\u043c, \u043d\u0430 \u043a\u0430\u043a\u043e\u043c \u0443\u0447\u0430\u0441\u0442\u043a\u0435 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438 \u043d\u0430\u0445\u043e\u0434\u0438\u043b\u0438\u0441\u044c \u043f\u0435\u0440\u0435\u0434\u0430\u043d\u043d\u044b\u0435 \u0435\u0439 \u0441\u044d\u043c\u043f\u043b\u044b. \u041d\u0435\u0443\u0434\u0438\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e, \u0447\u0442\u043e \u0432\u043c\u0435\u0441\u0442\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a\u0435 \u043a\u043b\u044f\u043a\u0441\u0430 \u043a\u0430\u043a\u0430\u044f-\u0442\u043e!<\/p>\n<p>\u041e\u043a, \u043d\u0430\u043c \u043d\u0430\u0434\u043e \u043a\u0430\u043a\u0438\u043c-\u0442\u043e \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043f\u0435\u0440\u0435\u0434\u0430\u0442\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u044c \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 (\u0448\u0430\u0433\u0435). \u041d\u0430 \u0440\u0443\u043a\u0430\u0445 \u0443 \u043d\u0430\u0441 \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0438\u0441\u043b\u043e \u043e\u0442 0 \u0434\u043e 1, \u043d\u043e \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u043e\u0441\u0442\u044b\u0435 \u0447\u0438\u0441\u043b\u0430 \u043d\u0435 \u043f\u0435\u0440\u0435\u0432\u0430\u0440\u0438\u0432\u0430\u0435\u0442 &#8212; \u043d\u0443\u0436\u043d\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435. \u0414\u043b\u044f \u043f\u0440\u043e\u0441\u0442\u043e\u0442\u044b \u0441\u043a\u0430\u0436\u0435\u043c \u0447\u0442\u043e \u0432\u0435\u043a\u0442\u043e\u0440 \u0434\u043e\u043b\u0436\u0435\u043d \u0431\u044b\u0442\u044c 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u043c &#8212; \u0442\u0430\u043a\u043e\u0439 \u0436\u0435 \u0434\u043b\u0438\u043d\u044b \u043a\u0430\u043a \u0438 \u0441\u043a\u0440\u044b\u0442\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438. \u041f\u043e\u043b\u0443\u0447\u0438\u0432 \u044d\u0442\u043e\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 (<code>time_embedding<\/code>) \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0439 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u0432 \u0438\u043d\u0442\u0435\u0440\u0432\u0430\u043b\u0435 \u043e\u0442 0 \u0434\u043e 1, \u043c\u044b \u043f\u0440\u043e\u0441\u0442\u043e \u0431\u0443\u0434\u0435\u043c \u043f\u0440\u0438\u0431\u0430\u0432\u043b\u044f\u0442\u044c \u0435\u0433\u043e \u043a \u0441\u043a\u0440\u044b\u0442\u043e\u043c\u0443 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u044e \u043d\u0430 \u043a\u0430\u0436\u0434\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435, \u0432\u043e\u0442 \u0442\u0430\u043a:<\/p>\n<pre><code class=\"python\">hidden = hidden + block(hidden + time_embedding) <\/code><\/pre>\n<p>\u0422\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c, &#171;\u0432\u043f\u0435\u0447\u0430\u0442\u044b\u0432\u0430\u044f&#187; \u0432 \u0441\u043a\u0440\u044b\u0442\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043e \u0442\u043e\u043c, \u043d\u0430 \u043a\u0430\u043a\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 &#171;\u0437\u0430\u0448\u0443\u043c\u043b\u0435\u043d\u0438\u044f&#187; \u043d\u0430\u0445\u043e\u0434\u044f\u0442\u0441\u044f \u043f\u0435\u0440\u0435\u0434\u0430\u043d\u043d\u044b\u0435 \u0432 \u043c\u043e\u0434\u0435\u043b\u044c \u0434\u0430\u043d\u043d\u044b\u0435. \u041d\u0430\u043f\u043e\u043c\u043d\u044e \u0435\u0449\u0451 \u0440\u0430\u0437, \u044d\u0442\u043e \u043d\u0443\u0436\u043d\u043e \u0434\u043b\u044f \u0442\u043e\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u043c\u043e\u0434\u0435\u043b\u0438 \u0431\u044b\u043b\u043e \u043b\u0435\u0433\u0447\u0435 \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0439 &#8212; \u0432\u0435\u0434\u044c \u0442\u0435\u043f\u0435\u0440\u044c \u043e\u043d\u0430 \u0441\u043c\u043e\u0436\u0435\u0442 \u0432\u044b\u044f\u0432\u043b\u044f\u0442\u044c \u0437\u0430\u043a\u043e\u043d\u043e\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u0443\u0440\u043e\u0432\u043d\u0435\u043c \u0448\u0443\u043c\u0430 (time) \u0438 \u043f\u0435\u0440\u0435\u0434\u0430\u043d\u043d\u044b\u043c\u0438 \u0434\u0430\u043d\u043d\u044b\u043c\u0438, \u0442\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043e\u0431\u0443\u0447\u0430\u044f\u0441\u044c \u043b\u0443\u0447\u0448\u0435 (\u0432 \u0442\u0435\u043e\u0440\u0438\u0438).<\/p>\n<p>\u0422\u043e\u043b\u044c\u043a\u043e \u0442\u0435\u043f\u0435\u0440\u044c \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430: \u043a\u0430\u043a \u0436\u0435 \u043d\u0430\u043c \u0438\u0437 \u0447\u0438\u0441\u043b\u0430 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440? \u042f \u0445\u043e\u0442\u0435\u043b \u0442\u0443\u0442 \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u043f\u0440\u043e sinusoidal \u0438 \u043f\u0440\u043e\u0447\u0438\u0435 \u044d\u043a\u0441\u043f\u043e\u043d\u0435\u043d\u0442\u044b, \u043d\u043e, \u0435\u0441\u043b\u0438 \u0447\u0435\u0441\u0442\u043d\u043e, \u0442\u043e \u043f\u0440\u043e\u0441\u0442\u043e\u0439 \u043f\u0440\u043e\u0435\u043a\u0446\u0438\u0438 \u0445\u0432\u0430\u0442\u0438\u0442.<\/p>\n<p>\u0414\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0432\u043d\u0443\u0442\u0440\u044c \u043a\u043e\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u043e\u0440\u0430 <code>Denoiser<\/code>:<\/p>\n<pre><code class=\"python\">self.time_linear = nn.Sequential(       nn.Linear(1, hidden_dims),       nn.LayerNorm(hidden_dims)   ) <\/code><\/pre>\n<p><code>LayerNorm<\/code> \u043f\u0440\u043e\u0441\u0442\u043e \u0447\u0442\u043e\u0431\u044b \u0432\u044b\u0445\u043e\u0434\u043d\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0431\u044b\u043b\u0438 \u0433\u0434\u0435-\u0442\u043e \u0432 \u0440\u0430\u0439\u043e\u043d\u0435 [-2, 2].<\/p>\n<p>\u041c\u0435\u043d\u044f\u0435\u043c <code>forward<\/code> \u043c\u0435\u0442\u043e\u0434:<\/p>\n<pre><code class=\"python\">def forward(self, x, t):  # \u0442\u0435\u043f\u0435\u0440\u044c \u043d\u0430 \u0432\u0445\u043e\u0434 \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u0438 \u0432\u0440\u0435\u043c\u044f     hidden = self.input_encoder(x)  # (B, 2) -&gt; (B, 16)            # \u0434\u0435\u043b\u0430\u0435\u043c \u0435\u0433\u043e \u043f\u043e\u043c\u0435\u043d\u044c\u0448\u0435, \u0447\u0442\u043e\u0431\u044b \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 \u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0435 \u0431\u044b\u043b\u0430     # \u043d\u043e \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435 \"\u043f\u0435\u0440\u0435\u0437\u0430\u043f\u0438\u0441\u0430\u0442\u044c\" \u0441\u0430\u043c\u043e \u0441\u043a\u0440\u044b\u0442\u043e\u0435 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u0438\u0435     time_embedding = self.time_linear(t) * 0.02       for block in self.blocks:           hidden = hidden + block(hidden + time_embedding)       return self.output_decoder(hidden) <\/code><\/pre>\n<p>\u041e\u0441\u0442\u0430\u043b\u043e\u0441\u044c \u043b\u0438\u0448\u044c \u043f\u043e\u043f\u0440\u0430\u0432\u0438\u0442\u044c \u043a\u043e\u0434 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430<\/p>\n<pre><code class=\"python\">samples = torch.randn((400, 2), device=DEVICE)   with torch.no_grad():       STEPS = 50       for step in range(STEPS, 0, -1):     # \u0442\u0435\u043d\u0437\u043e\u0440 \u0441 \u0448\u0435\u0439\u043f\u043e\u043c (1)         time = torch.tensor(step \/ STEPS, device=DEVICE)         # \u0440\u0430\u0441\u0448\u0438\u0440\u044f\u0435\u043c \u0435\u0433\u043e \u0434\u043e \u0448\u0435\u0439\u043f\u0430 (400, 1)     time = time.expand(samples.size(0), 1)         predicted = model(samples, time)           samples += predicted * (1 \/ STEPS) <\/code><\/pre>\n<p>\u0417\u0430\u043f\u0443\u0441\u043a\u0430\u0435\u043c \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0443 \u0441 \u0442\u0435\u043c\u0438 \u0436\u0435 \u0441\u0430\u043c\u044b\u043c\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438 \u0438 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c:<\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/j4xDi8x.png\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/j4xDi8x.png 780w,&#10;       https:\/\/i.imgur.com\/j4xDi8x.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u0412\u043e\u0442 \u0442\u0430\u043a!<\/p>\n<details class=\"spoiler\">\n<summary>\u0422\u0443\u0442 \u043f\u0430\u0440\u0430 \u0430\u043d\u0438\u043c\u0430\u0446\u0438\u0435\u0439 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430<\/summary>\n<div class=\"spoiler__content\">\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/5dNt0Mm.gif\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/5dNt0Mm.gif 780w,&#10;       https:\/\/i.imgur.com\/5dNt0Mm.gif 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u0411\u0430\u0440\u0430\u043d\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 <\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/i.imgur.com\/NCfOmL4.gif\" alt=\"\u0411\u0430\u0440\u0430\u043d\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\" title=\"\u0411\u0430\u0440\u0430\u043d\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\" sizes=\"(max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/i.imgur.com\/NCfOmL4.gif 780w,&#10;       https:\/\/i.imgur.com\/NCfOmL4.gif 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0411\u0430\u0440\u0430\u043d\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442<\/figcaption><\/div>\n<\/figure>\n<\/div>\n<\/details>\n<h3>\u0412\u0430\u0436\u043d\u044b\u0435 \u0434\u0435\u0442\u0430\u043b\u0438:<\/h3>\n<ol>\n<li>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0435\u0449\u0451 \u0440\u0430\u0437 \u0441\u043a\u0430\u0436\u0443, \u043c\u043e\u0434\u0435\u043b\u044c \u0432\u044b\u0443\u0447\u0438\u043b\u0430 \u043d\u0435 \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435, \u0430 \u0438\u043c\u0435\u043d\u043d\u043e \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u0415\u0441\u043b\u0438 \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u0441 \u0434\u0440\u0443\u0433\u0438\u043c \u0441\u0438\u0434\u043e\u043c, \u0442\u043e \u0442\u043e\u0447\u043a\u0438 \u0443\u0436\u0435 \u0431\u0443\u0434\u0443\u0442 \u0432 \u0434\u0440\u0443\u0433\u043e\u043c \u0440\u0430\u0441\u043f\u043e\u043b\u043e\u0436\u0435\u043d\u0438\u0438, \u043d\u043e \u0432\u0441\u0451 \u0435\u0449\u0451 \u0432 \u043f\u0440\u0435\u0434\u0435\u043b\u0430\u0445 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<\/li>\n<li>\n<p>\u042d\u0442\u043e \u043d\u0435 DDPM \u043c\u043e\u0434\u0435\u043b\u044c! \u041f\u0440\u0438 DDPM \u043c\u044b \u0431\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u0444\u043e\u0440\u043c\u0443\u043b\u0443 <a href=\"https:\/\/lilianweng.github.io\/posts\/2021-07-11-diffusion-models\/\" rel=\"noopener noreferrer nofollow\">forward diffusion<\/a>, \u0430 \u0442\u0443\u0442 \u0443 \u043d\u0430\u0441 <a href=\"https:\/\/arxiv.org\/abs\/2210.02747\" rel=\"noopener noreferrer nofollow\"><strong>rectified flow<\/strong><\/a>, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u0434\u043b\u044f &#171;\u0437\u0430\u0448\u0443\u043c\u043b\u0435\u043d\u0438\u044f&#187; \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c \u043f\u0440\u043e\u0441\u0442\u0443\u044e \u043b\u0438\u043d\u0435\u0439\u043d\u0443\u044e \u0438\u043d\u0442\u0435\u0440\u043f\u043e\u043b\u044f\u0446\u0438\u044e <code>xt = x0 * (1 - time) + noise * time<\/code>. \u0418 \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u043c\u043e\u0434\u0435\u043b\u044c flow-\u0432\u0435\u043a\u0442\u043e\u0440 (velocity), \u0430 \u043d\u0435 \u0448\u0443\u043c, \u043a\u0430\u043a \u0432 DDPM.<\/p>\n<\/li>\n<li>\n<p>\u0412\u0435\u0441\u044c \u043d\u0430\u043f\u0438\u0441\u0430\u043d\u043d\u044b\u0439 \u043a\u043e\u0434 \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0439\u0442\u0438 <a href=\"https:\/\/gist.github.com\/arturshamsiev314\/fb9e168f0b22463a5d96f8b7a654da71\" rel=\"noopener noreferrer nofollow\">\u0437\u0434\u0435\u0441\u044c<\/a>.<\/p>\n<\/li>\n<\/ol>\n<h3>\u0417\u0430\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u0435<\/h3>\n<p>\u0412 \u044d\u0442\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435 \u044f \u0448\u0430\u0433 \u0437\u0430 \u0448\u0430\u0433\u043e\u043c \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u043b \u043a\u0430\u043a \u0441 \u043d\u0443\u043b\u044f \u043e\u0431\u0443\u0447\u0438\u0442\u044c <strong>\u043c\u0438\u043d\u0438-\u0434\u0438\u0444\u0444\u0443\u0437\u043d\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c<\/strong> \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e \u043f\u0440\u043e\u0441\u0442\u043e\u0439 \u0441\u0438\u043d\u0442\u0435\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442.<\/p>\n<p>\u041a\u043b\u044e\u0447\u0435\u0432\u044b\u043c \u043c\u043e\u043c\u0435\u043d\u0442\u043e\u043c \u0441\u0442\u0430\u043b\u0430 \u0438\u0434\u0435\u044f <strong>\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e<\/strong> \u043f\u0440\u043e\u0441\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f (\u0448\u0443\u043c\u0430) \u0432 \u0441\u043b\u043e\u0436\u043d\u043e\u0435 (\u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442) \u043d\u0435 \u0437\u0430 \u043e\u0434\u0438\u043d \u0448\u0430\u0433, \u0430 \u043f\u043e\u0448\u0430\u0433\u043e\u0432\u043e, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f <strong>Rectified Flow<\/strong> \u0432\u043c\u0435\u0441\u0442\u043e DDPM. \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u043d\u0430\u043c \u043e\u0431\u043e\u0433\u0430\u0442\u0438\u0442\u044c \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0439 \u043d\u0430\u0431\u043e\u0440 \u043f\u0440\u043e\u043c\u0435\u0436\u0443\u0442\u043e\u0447\u043d\u044b\u043c\u0438 \u0441\u043e\u0441\u0442\u043e\u044f\u043d\u0438\u044f\u043c\u0438 \u0438 \u0441\u043e\u0437\u0434\u0430\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u044c, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 <strong>\u0432\u0435\u043a\u0442\u043e\u0440 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u044f<\/strong> (flow-vector) \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0448\u0430\u0433\u0430.<\/p>\n<p>\u041d\u0430 \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0443\u0431\u0435\u0434\u0438\u043b\u0438\u0441\u044c, \u043a\u0430\u043a\u043e\u0435 \u0432\u0430\u0436\u043d\u043e\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u0438\u0433\u0440\u0430\u0435\u0442 time-embedding \u0434\u043b\u044f \u043f\u043e\u0432\u044b\u0448\u0435\u043d\u0438\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 &#8212; \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 \u0443\u0447\u0438\u0442\u044b\u0432\u0430\u0442\u044c \u0441\u0442\u0435\u043f\u0435\u043d\u044c \u0437\u0430\u0448\u0443\u043c\u043b\u0435\u043d\u0438\u044f \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u043b\u0443\u0447\u0448\u0435 \u043e\u0431\u0443\u0447\u0430\u0442\u044c\u0441\u044f.<\/p>\n<p>\u0414\u0443\u043c\u0430\u044e, \u044f \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u0430\u043b \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u0443 \u0432\u0430\u0441 \u043f\u043e\u044f\u0432\u0438\u043b\u043e\u0441\u044c \u0431\u0430\u0437\u043e\u0432\u043e\u0435 \u043f\u043e\u043d\u0438\u043c\u0430\u043d\u0438\u0435 \u0440\u0430\u0431\u043e\u0442\u044b \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u0445 \u043c\u043e\u0434\u0435\u043b\u0435\u0439, \u0430 \u0437\u043d\u0430\u0447\u0438\u0442 \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0442\u044c\u0441\u044f \u0437\u0430 \u0447\u0442\u043e-\u0442\u043e \u043f\u043e\u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u0435\u0435. \u0427\u0430\u0441\u0442\u044c 2 \u0431\u0443\u0434\u0435\u0442 \u043f\u0440\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0443\u0436\u0435 \u043d\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 EMNIST. \u0411\u0443\u0434\u0435\u043c \u0441\u043e\u0437\u0434\u0430\u0432\u0430\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u044c, \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u0443\u044e \u0433\u0435\u043d\u0435\u0440\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0440\u0438\u0441\u0443\u043d\u043a\u0438 \u0447\u0438\u0441\u0435\u043b \u0438 \u0431\u0443\u043a\u0432. \u041f\u0440\u043e\u0434\u043e\u043b\u0436\u0435\u043d\u0438\u0435 \u0441\u043b\u0435\u0434\u0443\u0435\u0442&#8230;<\/p>\n<\/div>\n<\/div>\n<\/div>\n<p><!----><!----><\/div>\n<p><!----><!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/articles\/944530\/\"> https:\/\/habr.com\/ru\/articles\/944530\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div><!--[--><!--]--><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u042d\u0442\u043e \u043b\u0435\u0442\u043e \u043e\u0431\u0440\u0430\u0434\u043e\u0432\u0430\u043b\u043e \u043d\u0430\u0441 \u043f\u0440\u043e\u0440\u044b\u0432\u043e\u043c \u0432 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0439 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0435\u0439. \u041e\u0434\u043d\u0430 \u0437\u0430 \u0434\u0440\u0443\u0433\u043e\u0439 \u0432\u044b\u0445\u043e\u0434\u044f\u0442 \u0442\u0430\u043a\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u043a\u0430\u043a Flux.1 Kontext, Qwen-Image-Edit, Gemini 2.4 Flash Image Preview (Nano Banana) \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u044f \u043d\u0435\u0434\u043e\u0441\u0442\u0438\u0436\u0438\u043c\u044b\u0439 \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u0443\u0440\u043e\u0432\u0435\u043d\u044c \u043c\u0430\u043d\u0438\u043f\u0443\u043b\u044f\u0446\u0438\u0438 \u0446\u0438\u0444\u0440\u043e\u0432\u044b\u043c \u043a\u043e\u043d\u0442\u0435\u043d\u0442\u043e\u043c. \u042d\u0442\u043e \u043d\u0435 \u0437\u0430\u043c\u0435\u043d\u0430 \u0424\u043e\u0442\u043e\u0448\u043e\u043f\u0443, \u0430 \u0442\u0435\u0445\u043d\u043e\u043b\u043e\u0433\u0438\u044f, \u043e\u0442\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0430\u044f \u0432\u0440\u0430\u0442\u0430 \u0432 \u0431\u0435\u0441\u043a\u043e\u043d\u0435\u0447\u043d\u044b\u0435 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u043c\u0438\u0440\u044b \u0438 \u0432\u0441\u0451 \u0431\u043b\u0430\u0433\u043e\u0434\u0430\u0440\u044f \u043c\u043e\u0449\u0438 <strong>Diffusion Transformer (DiT)<\/strong> \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u044b. \u0412\u043f\u0435\u0447\u0430\u0442\u043b\u0438\u0432\u0448\u0438\u0441\u044c, \u044f \u0440\u0435\u0448\u0438\u043b \u043f\u043e\u0431\u043b\u0438\u0436\u0435 \u043f\u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u0441 \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u043c\u0438 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0435\u0440\u0430\u043c\u0438 &#8212; \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0440\u0443\u0447\u043d\u043e \u043d\u0430\u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0441\u0432\u043e\u044e \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u0443\u044e DiT-\u043c\u043e\u0434\u0435\u043b\u044c. \u041e\u0431 \u044d\u0442\u043e\u043c \u0438 \u0431\u0443\u0434\u0435\u0442 \u044d\u0442\u0430 \u0441\u0442\u0430\u0442\u044c\u044f.<\/p>\n<p>\u041d\u043e \u043d\u0430\u0447\u0430\u0442\u044c \u0441\u0442\u043e\u0438\u0442 \u0441 \u043c\u0430\u043b\u043e\u0433\u043e.<\/p>\n<h3>\u0411\u0430\u0437\u043e\u0432\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c<\/h3>\n<p>\u041a\u0430\u043a \u0432\u043e\u043e\u0431\u0449\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u044d\u0442\u0438 \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438? \u0415\u0441\u0442\u044c \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u044c, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0437\u0430\u0448\u0443\u043c\u043b\u0451\u043d\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435, \u0430 \u043d\u0430 \u0432\u044b\u0445\u043e\u0434\u0435 \u0432\u044b\u0434\u0430\u0451\u0442 \u0448\u0443\u043c (noise). \u0418 \u0441\u043f\u0440\u0430\u0448\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0437\u0430\u0447\u0435\u043c \u043d\u0430\u043c \u044d\u0442\u043e\u0442 \u0448\u0443\u043c? \u0410 \u0437\u0430\u0442\u0435\u043c \u0447\u0442\u043e \u0442\u0435\u043f\u0435\u0440\u044c \u0438\u043c\u0435\u044f \u0448\u0443\u043c\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0438 \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u043d\u044b\u0439 \u0448\u0443\u043c \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0432\u044b\u0447\u0435\u0441\u0442\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u043d\u044b\u0439 \u0448\u0443\u043c \u0438\u0437 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0438 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0441 \u043c\u0435\u043d\u044c\u0448\u0438\u043c \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u0448\u0443\u043c\u0430. \u042f \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0442\u043e \u0441\u043a\u0430\u0437\u0430\u043b &#171;\u0441 \u043c\u0435\u043d\u044c\u0448\u0438\u043c \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u0448\u0443\u043c\u0430&#187;, \u043d\u043e \u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u044d\u0442\u043e \u043d\u0435 \u0442\u0430\u043a. \u041d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u0432\u0441\u0451 \u0441\u043b\u043e\u0436\u043d\u0435\u0435.<\/p>\n<p>\u041d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043e\u0442\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0435. \u0414\u043b\u044f \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u044f \u0431\u0443\u0434\u0443 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0443 <strong>PyTorch<\/strong>. \u0412\u0441\u0435 \u0442\u0435\u0440\u043c\u0438\u043d\u044b \u0442\u0430\u043a\u0438\u0435 \u043a\u0430\u043a \u0442\u0435\u043d\u0437\u043e\u0440 (tensor), \u0431\u0430\u0442\u0447 (batch), \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 (dimension), \u0448\u0435\u0439\u043f (shape) \u043e\u0442\u0442\u0443\u0434\u0430. \u041e\u0436\u0438\u0434\u0430\u044e \u043e\u0442 \u0447\u0438\u0442\u0430\u0442\u0435\u043b\u0435\u0439 \u0445\u043e\u0442\u044f \u0431\u044b \u043f\u043e\u0432\u0435\u0440\u0445\u043d\u043e\u0441\u0442\u043d\u043e\u0433\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u043d\u0438\u044f.<\/p>\n<h3>\u0410 \u0447\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u0435\u043c-\u0442\u043e?<\/h3>\n<p>\u0412\u044b \u043d\u0435 \u0437\u0430\u0434\u0443\u043c\u044b\u0432\u0430\u043b\u0438\u0441\u044c \u0447\u0442\u043e \u0432\u043e\u043e\u0431\u0449\u0435 <em>\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u044e\u0442<\/em> \u0434\u0438\u0444\u0444\u0443\u0437\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438? \u0410 \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u044e\u0442 \u043e\u043d\u0438 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0432 \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435. \u0412\u043e\u0437\u043d\u0438\u043a\u0430\u0435\u0442 \u043b\u043e\u0433\u0438\u0447\u043d\u044b\u0439 \u0432\u043e\u043f\u0440\u043e\u0441: \u0447\u0442\u043e \u0435\u0449\u0451 \u0437\u0430 &#171;\u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435&#187;? \u041b\u0435\u0433\u0447\u0435 \u0432\u0441\u0435\u0433\u043e \u044d\u0442\u043e \u043f\u0440\u043e\u0438\u043b\u043b\u044e\u0441\u0442\u0440\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043d\u0430 \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0434\u0432\u0443\u0445 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439. \u0412\u043e\u0442 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u044d\u043c\u043f\u043b\u043e\u0432 (\u0442\u043e\u0447\u0435\u043a \u043d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438) \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. <strong>\u041e\u0442\u0441\u044e\u0434\u0430 \u0438 \u0434\u0430\u043b\u0435\u0435, \u043a\u043e\u0433\u0434\u0430 \u044f \u043f\u0438\u0448\u0443 &#171;\u0441\u044d\u043c\u043f\u043b&#187;, \u0442\u043e \u0438\u043c\u0435\u044e \u0432\u0432\u0438\u0434\u0443 \u0434\u0432\u0443\u043c\u0435\u0440\u043d\u044b\u0439 \u0442\u0435\u043d\u0437\u043e\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u043a\u0430\u043a \u0442\u043e\u0447\u043a\u0443 \u043d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438<\/strong>: <\/p>\n<figure class=\"\">\n<div><figcaption>https:\/\/i.imgur.com\/gkUodK0.png<\/figcaption><\/div>\n<\/figure>\n<p> \u0421\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u043e\u0447\u0435\u043d\u044c \u043f\u0440\u043e\u0441\u0442\u043e &#8212; \u0432\u044b\u0437\u044b\u0432\u0430\u0435\u043c <code>torch.randn(2)<\/code> \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043d\u0430\u0434\u043e \u0440\u0430\u0437 \u0438 \u0432\u0441\u0451. <\/p>\n<p>\u0410 \u0432\u043e\u0442 \u0442\u0430\u043a \u043d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438 \u043c\u043e\u0433\u043b\u0438 \u0431\u044b \u0432\u044b\u0433\u043b\u044f\u0434\u0435\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f: <\/p>\n<figure class=\"\"><\/figure>\n<p>\u042d\u0442\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u043c\u043e\u0436\u043d\u043e \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442\u044c \u043a\u0430\u043a &#171;\u0432\u0441\u0435 \u0442\u043e\u0447\u043a\u0438 \u043b\u0435\u0436\u0430\u0449\u0438\u0435 \u043d\u0430 \u043a\u0440\u0438\u0432\u044b\u0445, \u043e\u0431\u0440\u0430\u0437\u0443\u044e\u0449\u0438\u0445 \u0440\u0438\u0441\u0443\u043d\u043e\u043a \u043a\u043e\u0442\u0451\u043d\u043a\u0430&#187;. \u0412 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0443 \u043d\u0430\u0441 \u043d\u0435\u0442 \u0433\u043e\u0442\u043e\u0432\u043e\u0439 \u0444\u043e\u0440\u043c\u0443\u043b\u044b, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0431\u044b \u043c\u043e\u0433\u043b\u0430 \u0432\u044b\u0442\u0430\u0441\u043a\u0438\u0432\u0430\u0442\u044c \u0442\u043e\u0447\u043a\u0438 (\u0441\u044d\u043c\u043f\u043b\u044b) \u0438\u043c\u0435\u043d\u043d\u043e \u0438\u0437 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<p>\u0418 \u0442\u0443\u0442 \u0432\u0441\u0435\u043c \u043b\u044e\u0431\u0438\u0442\u0435\u043b\u044f\u043c \u043a\u043e\u0442\u043e\u0432 \u043d\u0430 \u043f\u043e\u043c\u043e\u0449\u044c \u043f\u0440\u0438\u0445\u043e\u0434\u044f\u0442 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438. \u0412\u0441\u0435\u0433\u043e \u0442\u043e \u0438 \u043d\u0430\u0434\u043e, \u0447\u0442\u043e \u043e\u0431\u0443\u0447\u0438\u0442\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044e (\u043c\u043e\u0434\u0435\u043b\u044c), \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f, \u0430 \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0435\u0442 \u0441\u044d\u043c\u043f\u043b \u0443\u0436\u0435 \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u0412\u043e\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u0442\u0430\u043a\u0430\u044f \u043f\u043e\u0441\u0442\u0430\u043d\u043e\u0432\u043a\u0430 \u0437\u0430\u0434\u0430\u0447\u0438 &#8212; <strong>\u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f<\/strong> &#8212; \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u0441\u043b\u043e\u0436\u043d\u0430\u044f. \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u043f\u0435\u0440\u0435\u0444\u0440\u0430\u0437\u0438\u0440\u0443\u0435\u043c:<\/p>\n<blockquote>\n<p>\u041f\u0440\u0438\u043d\u0438\u043c\u0430\u044f \u043d\u0430 \u0432\u0445\u043e\u0434 \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0442\u044c \u0432\u0435\u043a\u0442\u043e\u0440 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u044f, \u0434\u0432\u0438\u0433\u0430\u044f\u0441\u044c \u043f\u043e \u043a\u043e\u0442\u043e\u0440\u043e\u043c\u0443 \u043c\u044b \u0434\u043e\u0441\u0442\u0438\u0433\u043d\u0435\u043c \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<\/blockquote>\n<figure class=\"\"><\/figure>\n<p>\u041f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u0447\u0442\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0434\u043b\u044f \u0441\u044d\u043c\u043f\u043b\u0430 (0.1, -0.5) \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0436\u0435\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 (1.05, 0.46). \u0422\u0435\u043f\u0435\u0440\u044c \u0441\u043b\u043e\u0436\u0438\u043c \u044d\u0442\u043e\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 \u0441 \u0438\u0441\u0445\u043e\u0434\u043d\u044b\u043c \u0441\u044d\u043c\u043f\u043b\u043e\u043c. \u041f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u0442\u043e\u0447\u043a\u0443 \u043d\u0430 \u0446\u0435\u043b\u0435\u0432\u043e\u043c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0438. \u0418 \u0442\u0430\u043a \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0441\u044d\u043c\u043f\u043b\u0430 \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<p>\u0422\u043e \u0447\u0442\u043e \u044f \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0442\u043e \u043e\u043f\u0438\u0441\u0430\u043b (\u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u0430) &#8212; \u044d\u0442\u043e \u0432\u0430\u0440\u0438\u0430\u043d\u0442 \u0434\u0438\u0444\u0444\u0443\u0437\u0438\u0438 \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u043c\u044b\u0439 <a href=\"https:\/\/arxiv.org\/abs\/2403.03206\" rel=\"noopener noreferrer nofollow\">Rectified Flow<\/a>. \u041e\u043d \u043e\u0442\u043b\u0438\u0447\u0430\u0435\u0442\u0441\u044f \u043e\u0442 \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u043e\u0433\u043e \u0432\u0441\u0435\u043c <a href=\"https:\/\/arxiv.org\/abs\/2006.11239\" rel=\"noopener noreferrer nofollow\">DDPM<\/a> \u0438 \u043e\u0442\u043b\u0438\u0447\u0430\u0435\u0442\u0441\u044f \u0432 \u043b\u0443\u0447\u0448\u0443\u044e \u0441\u0442\u043e\u0440\u043e\u043d\u0443. \u041d\u043e \u044f \u043e\u0442 \u044d\u0442\u043e\u043c \u0440\u0430\u043d\u043e \u0437\u0430\u0433\u043e\u0432\u043e\u0440\u0438\u043b, \u043f\u0440\u043e\u0434\u043e\u043b\u0436\u0430\u0435\u043c.<\/p>\n<p>\u0418\u0442\u0430\u043a, \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u0447\u0442\u043e \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0431\u0443\u0434\u0435\u0442 \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043f\u0440\u043e\u0441\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f (\u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0435, \u043e\u043d\u043e \u0436\u0435 \u0413\u0430\u0443\u0441\u0441\u043e\u0432\u043e) \u0432 \u0441\u043b\u043e\u0436\u043d\u043e\u0435 \u0446\u0435\u043b\u0435\u0432\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435.<\/p>\n<p>\u0417\u0432\u0443\u0447\u0438\u0442 \u0445\u043e\u0440\u043e\u0448\u043e, \u0434\u0430 \u0432\u043e\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0432 \u043e\u0434\u0438\u043d \u0448\u0430\u0433 &#8212; \u044d\u0442\u043e \u0442\u044f\u0436\u0435\u043b\u043e\u0432\u0430\u0442\u0430 \u0437\u0430\u0434\u0430\u0447\u0430 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f. \u0412\u043e\u043d GAN-\u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0442\u0430\u043a\u0438\u043c \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u043c \u0434\u0430\u043b\u0435\u043a\u043e \u043d\u0435 \u043f\u0440\u043e\u0434\u0432\u0438\u043d\u0443\u043b\u0438\u0441\u044c. \u041b\u0430\u0434\u043d\u043e, \u0441 GAN-\u043c\u043e\u0434\u0435\u043b\u044f\u043c\u0438 \u044f \u043d\u0435\u043c\u043d\u043e\u0433\u043e \u0443\u0442\u0440\u0438\u0440\u0443\u044e, \u043d\u043e \u0433\u043e\u0440\u0430\u0437\u0434\u043e \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u043d\u0435\u0435 \u043e\u043f\u0438\u0440\u0430\u0442\u044c\u0441\u044f \u0438\u043c\u0435\u043d\u043d\u043e \u043d\u0430 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e &#8212; \u043a\u0430\u043a \u0448\u0430\u0433 \u0437\u0430 \u0448\u0430\u0433\u043e\u043c \u043f\u0440\u043e\u0441\u0442\u043e\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0438\u0440\u0443\u0435\u0442\u0441\u044f \u0432 \u0441\u043b\u043e\u0436\u043d\u043e\u0435.<\/p>\n<p>\u0427\u0442\u043e \u044f \u0438\u043c\u0435\u044e \u0432 \u0432\u0438\u0434\u0443 \u043a\u043e\u0433\u0434\u0430 \u0433\u043e\u0432\u043e\u0440\u044e, \u0447\u0442\u043e \u043c\u043e\u0436\u043d\u043e \u043e\u043f\u0438\u0440\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e? \u0421\u043c\u043e\u0442\u0440\u0438\u0442\u0435, \u0438\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e \u0434\u0430\u043d\u043d\u044b\u0435 \u0434\u043b\u044f \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043a\u0438 \u043d\u0430\u0448\u0435\u0439 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438 \u0441\u043e\u0441\u0442\u043e\u044f\u043b\u0438 \u0442\u043e\u043b\u044c\u043a\u043e \u0438\u0437 \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f (\u0442\u043e\u0447\u043a\u0438, \u043b\u0435\u0436\u0430\u0449\u0438\u0435 \u043d\u0430 \u0433\u0440\u0430\u0444\u0438\u043a\u0435 \u043a\u043e\u0442\u0430), \u0430 \u0442\u0430\u043a\u0436\u0435 \u0442\u0430\u043a\u043e\u0433\u043e \u0436\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 (\u0448\u0443\u043c\u0430 \u043a\u043e\u0440\u043e\u0447\u0435). \u041d\u043e \u0440\u0430\u0437 \u043c\u044b \u0434\u043e\u0433\u0430\u0434\u0430\u043b\u0438\u0441\u044c \u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f &#171;\u043f\u043e \u0448\u0430\u0433\u0430\u043c&#187;, \u0442\u043e \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u043e\u0431\u043e\u0433\u0430\u0442\u0438\u0442\u044c \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0432\u0441\u0435\u043c\u0438 \u043f\u0440\u043e\u043c\u0435\u0436\u0443\u0442\u043e\u0447\u043d\u044b\u043c\u0438 \u0441\u043e\u0441\u0442\u043e\u044f\u043d\u0438\u044f\u043c\u0438, \u0442\u043e \u0435\u0441\u0442\u044c \u0446\u0435\u043b\u0435\u0432\u044b\u043c\u0438 \u0441\u044d\u043c\u043f\u043b\u0430\u043c\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0437\u0430\u0448\u0443\u043c\u043b\u0435\u043d\u044b \u043d\u0430 10%, 20%, 76% \u0438\u043b\u0438 \u0432\u043e\u043e\u0431\u0449\u0435 \u043d\u0430 \u043b\u044e\u0431\u043e\u0439 \u043f\u0440\u043e\u0446\u0435\u043d\u0442. \u0414\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438, \u0442\u043e\u0447\u043a\u0430\u043c\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0430\u0445\u043e\u0434\u044f\u0442\u0441\u044f \u0433\u0434\u0435-\u0442\u043e \u043d\u0430 \u043f\u043e\u043b\u043f\u0443\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u044b\u043c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435\u043c \u0438 \u0446\u0435\u043b\u0435\u0432\u044b\u043c.<\/p>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0435\u0449\u0451 \u0440\u0430\u0437 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043a\u0430\u043a \u043f\u043e\u0434\u0445\u043e\u0434 &#171;\u0432\u044b\u0443\u0447\u0438\u0442\u044c \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e \u0437\u0430 \u0440\u0430\u0437&#187; \u0438 &#171;\u0432\u044b\u0443\u0447\u0438\u0442\u044c \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e \u043f\u043e \u0448\u0430\u0433\u0430\u043c&#187; \u043c\u0435\u043d\u044f\u0435\u0442 \u043d\u0430\u0448\u0443 \u043c\u043e\u0434\u0435\u043b\u044c.<\/p>\n<p>\u0412 \u043f\u0435\u0440\u0432\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u043d\u0430\u0448\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0438\u0440\u0443\u0435\u0442 \u0432\u043e\u0442 \u0442\u0430\u043a:<br \/> <code>vector_to_target = model.predict(normal_noise_sample)<\/code> &#8212; \u043d\u0430 \u0432\u0445\u043e\u0434 \u0442\u043e\u043b\u044c\u043a\u043e \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f.<\/p>\n<p>\u0410 \u0432 \u0441\u043b\u0443\u0447\u0430\u0435 \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438 \u043f\u043e \u0448\u0430\u0433\u0430\u043c \u043c\u043e\u0434\u0435\u043b\u044c \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0442\u0430\u043a:<br \/> <code>vector_to_target = model.predict(point_between_noise_and_target_distribution, time)<\/code><br \/> \u0417\u0434\u0435\u0441\u044c <code>time<\/code>  &#8212; \u044d\u0442\u043e \u0434\u043e\u043b\u044f \u043f\u0443\u0442\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0442\u043e\u0447\u043a\u0430 \u043f\u0440\u043e\u0448\u043b\u0430 \u043e\u0442 \u0448\u0443\u043c\u0430, \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u041f\u0440\u043e\u0446\u0435\u043d\u0442 \u0437\u0430\u0448\u0443\u043c\u043b\u0451\u043d\u043d\u043e\u0441\u0442\u0438, \u0434\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u0432\u0430\u043c\u0438. \u0412\u0430\u0436\u043d\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u0442\u044c: \u043f\u043e \u0441\u0443\u0442\u0438, \u0437\u0430\u0434\u0430\u0447\u0430 \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f <strong>\u0440\u0430\u0437\u0431\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u043d\u0430 \u043c\u0435\u043b\u043a\u0438\u0435 \u043f\u043e\u0434\u0437\u0430\u0434\u0430\u0447\u0438<\/strong>: &#171;\u043d\u0430\u0443\u0447\u0438\u0441\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043f\u0443\u0442\u044c \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043f\u0440\u0438 10% \u0448\u0443\u043c\u0430&#187;, &#171;\u043d\u0430\u0443\u0447\u0438\u0441\u044c \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043f\u0443\u0442\u044c \u0434\u043e \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043f\u0440\u0438 15% \u0448\u0443\u043c\u0430&#187; \u0438 \u0442.\u0434. \u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0433\u043e\u0440\u0430\u0437\u0434\u043e \u043b\u0443\u0447\u0448\u0435 \u0441\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0439, \u0447\u0442\u043e \u043f\u043e\u0432\u044b\u0448\u0430\u0435\u0442 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c &#171;\u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u044f&#187;.<\/p>\n<p>\u0417\u0430 \u0441\u0447\u0451\u0442 \u0447\u0435\u0433\u043e \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c? \u0410 \u0437\u0430 \u0441\u0447\u0451\u0442 \u0442\u043e\u0433\u043e, \u0447\u0442\u043e \u0442\u0435\u043f\u0435\u0440\u044c \u0438\u043c\u0435\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u0441 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u043c \u0443\u0441\u043b\u043e\u0432\u0438\u0435\u043c <code>time<\/code> \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0432\u044b\u0442\u0430\u0441\u043a\u0438\u0432\u0430\u0442\u044c \u0441\u044d\u043c\u043f\u043b\u044b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043d\u0438 \u0441 \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0439 \u043f\u043e\u043f\u044b\u0442\u043a\u0438, \u0430 \u0434\u0435\u043b\u0430\u044f \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0443\u0433\u043e\u0434\u043d\u043e &#171;\u0443\u0442\u043e\u0447\u043d\u0435\u043d\u0438\u0439&#187; \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u0438. \u041b\u0435\u0433\u0447\u0435 \u043f\u043e\u043d\u044f\u0442\u044c \u0435\u0441\u043b\u0438 \u0432\u0437\u0433\u043b\u044f\u043d\u0443\u0442\u044c \u043d\u0430 \u043a\u043e\u0434 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430:<\/p>\n<pre><code class=\"python\">noise = sample_noise()  # \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f steps = 200  # \u0440\u0430\u0437\u043e\u0431\u044a\u0435\u043c \u0442\u0440\u0430\u0435\u043a\u0442\u043e\u0440\u0438\u044e \u043d\u0430 200 \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0438\u0445 \u0448\u0430\u0433\u043e\u0432 for step in range(steps): time = step \/ steps  # \u0431\u0443\u0434\u0435\u0442 \u043c\u0435\u043d\u044f\u0442\u044c\u0441\u044f \u0432 \u0438\u043d\u0442\u0435\u0440\u0432\u0430\u043b\u0435 [0, 1)  # \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e \u043e\u0442 time \u044d\u0442\u043e\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0434\u043d\u043e\u0439 \u0434\u043b\u0438\u043d\u044b # \u0432 \u0438\u0434\u0435\u0430\u043b\u0435 \u0432\u043e\u043e\u0431\u0449\u0435 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0434\u0438\u043d \u0438 \u0442\u043e\u0442 \u0436\u0435 predicted_vector = model.predict(noise, time)  scaled_vector = predicted_vector * (1 \/ steps)  # \u043e\u0434\u043d\u0430 200-\u044f \u043f\u0443\u0442\u0438 noise = noise + scaled_vector  # \u041d\u0430\u0448 \u0438\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u044b\u0439 \u0448\u0443\u043c \u043d\u0430 0.5% \u043f\u0440\u0438\u0431\u043b\u0438\u0437\u0438\u043b\u0441\u044f                                 # \u043a \u0446\u0435\u043b\u0435\u0432\u043e\u043c\u0443 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044e                                 # \u041f\u043e\u0441\u043b\u0435 \u0437\u0430\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u0446\u0438\u043a\u043b\u0430 \u043d\u0430\u0448 noise - \u044d\u0442\u043e \u0443\u0436\u0435 \u0441\u044d\u043c\u043f\u043b \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f <\/code><\/pre>\n<p>\u041f\u043e\u043c\u043d\u0438\u0442\u0435, \u0447\u0442\u043e \u0432 \u043d\u0430\u0448\u0435\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0432\u0441\u0435 \u0441\u044d\u043c\u043f\u043b\u044b \u044d\u0442\u043e \u0434\u0432\u0443\u043c\u0435\u0440\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b (x, y) &#8212; \u0442\u043e\u0447\u043a\u0438 \u043d\u0430 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438.  \u041f\u043e\u043b\u044c\u0437\u0443\u044f\u0441\u044c \u0442\u0435\u0440\u043c\u0438\u043d\u043e\u043b\u043e\u0433\u0438\u0435 PyTorch &#8212; \u0442\u0435\u043d\u0437\u043e\u0440\u044b \u0441 \u0448\u0435\u0439\u043f\u043e\u043c (2). \u0410 \u0442\u0430\u043a-\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u044c \u043c\u043e\u0436\u043d\u043e \u0441\u043e\u0437\u0434\u0430\u0432\u0430\u0442\u044c \u0434\u043b\u044f \u0442\u0435\u043d\u0437\u043e\u0440\u043e\u0432 \u043b\u044e\u0431\u043e\u0439 \u0444\u043e\u0440\u043c\u044b.<\/p>\n<h3>\u0414\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0442\u0435\u043e\u0440\u0438\u0438<\/h3>\n<p>\u0414\u043b\u044f \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0430\u0446\u0438\u0438 \u043d\u0430\u043c \u043f\u043e\u043d\u0430\u0434\u043e\u0431\u0438\u0442\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442. \u0412\u0441\u0435 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u044b \u0438\u0437 \u043d\u0435\u0433\u043e \u0431\u0443\u0434\u0443\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u044d\u043c\u043f\u043b\u044b\u043c\u0438 \u0438\u0437 \u0446\u0435\u043b\u0435\u0432\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0432\u043e\u0442 \u0442\u0430\u043a\u043e\u0433\u043e:<\/p>\n<pre><code class=\"python\">def make_simple_dataset(amount):       cluster_1 = torch.rand((amount \/\/ 2), 2) * 1.5 + 0.6       cluster_2 = torch.rand((amount \/\/ 4), 2) * 0.8 + torch.tensor([-.8, .6])       cluster_3 = torch.rand((amount \/\/ 4), 2) * torch.tensor([1.2, 0.4]) + torch.tensor([-2.4, 0.6])          return torch.cat([cluster_1, cluster_2, cluster_3], dim=0) <\/code><\/pre>\n<p>\u041d\u0430 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438 800 \u0441\u044d\u043c\u043f\u043b\u043e\u0432 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0431\u0443\u0434\u0443\u0442 \u0432\u044b\u0433\u043b\u044f\u0434\u0435\u0442\u044c \u0432\u043e\u0442 \u0442\u0430\u043a: <\/p>\n<figure class=\"\"><\/figure>\n<p> \u0422\u0435\u043f\u0435\u0440\u044c \u043f\u043e\u0440\u0430 \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0442\u044c\u0441\u044f \u0437\u0430 PyTorch \u043c\u043e\u0434\u0435\u043b\u044c. <\/p>\n<p>\u0411\u0443\u0434\u0435\u0442 \u044d\u0442\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u0441\u043e\u0441\u0442\u043e\u044f\u0442\u044c \u0438\u0437 \u0442\u0440\u0451\u0445 \u0447\u0430\u0441\u0442\u0435\u0439:<\/p>\n<ol>\n<li>\n<p>\u042d\u043d\u043a\u043e\u0434\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u0440\u043e\u0435\u0446\u0438\u0440\u0443\u0435\u0442 \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0438\u0437 \u0434\u0432\u0443\u0445 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439 \u0432\u043e \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0438\u0437 \u0431\u043e\u043b\u044c\u0448\u0435\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439 (16). \u0417\u0430\u0447\u0435\u043c \u043d\u0430\u043c \u0431\u043e\u043b\u044c\u0448\u0435\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439? \u0427\u0442\u043e\u0431\u044b \u043c\u043e\u0434\u0435\u043b\u0438 \u0431\u044b\u043b\u043e \u0433\u0434\u0435 &#171;\u0440\u0430\u0437\u0432\u0435\u0440\u043d\u0443\u0442\u044c\u0441\u044f&#187;.<\/p>\n<\/li>\n<li>\n<p>\u041e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0430\u044f \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 MLP-\u0431\u043b\u043e\u043a\u043e\u0432. \u0411\u0443\u0434\u0435\u0442 \u043d\u0435\u043f\u043e\u0441\u0440\u0435\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0439 \u0437\u0430\u043d\u0438\u043c\u0430\u0442\u044c\u0441\u044f \u0434\u0435\u043d\u043e\u0439\u0437\u0438\u043d\u0433\u043e\u043c \u0432\u0445\u043e\u0434\u044f\u0449\u0438\u0445 &#171;\u0448\u0443\u043c\u043d\u044b\u0445&#187; \u0441\u044d\u043c\u043f\u043b\u043e\u0432. MLP &#8212; \u044d\u0442\u043e multilayer perceptron, \u0442\u0430 \u0441\u0430\u043c\u0430\u044f &#171;\u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0430\u044f&#187; \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c.<\/p>\n<\/li>\n<li>\n<p>\u0414\u0435\u043a\u043e\u0434\u0435\u0440, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u0435\u0442 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u043e\u0431\u0440\u0430\u0442\u043d\u043e \u0432 \u0434\u0432\u0435 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u044b.<\/p>\n<\/li>\n<\/ol>\n<figure class=\"\">\n<div><figcaption>\u0421\u0445\u0435\u043c\u0430\u0442\u0438\u0447\u043d\u043e\u0435 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438<\/figcaption><\/div>\n<\/figure>\n<p>\u0412\u043e\u0442 \u0442\u0430\u043a \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0443\u043f\u0440\u043e\u0449\u0451\u043d\u043d\u0430\u044f \u0441\u0445\u0435\u043c\u0430. <strong>Linear A<\/strong> &#8212; \u044d\u0442\u043e \u044d\u043d\u043a\u043e\u0434\u0435\u0440. \u0421\u043e\u0441\u0442\u043e\u0438\u0442 \u0438\u0437 \u043e\u0434\u043d\u043e\u0433\u043e \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f <code>nn.Linear<\/code> (\u0437\u0434\u0435\u0441\u044c \u0438 \u0434\u0430\u043b\u0435\u0435 \u0432\u0441\u0451 \u0442\u0438\u043f\u044b \u0438\u0437 PyTorch). \u041f\u043e \u0441\u0443\u0442\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u043c\u0430\u0442\u0440\u0438\u0446\u0430, \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 2-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0442\u0435\u043d\u0437\u043e\u0440\u0430 \u0432 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0439. <strong>\u041f\u0440\u044f\u043c\u043e\u0443\u0433\u043e\u043b\u044c\u043d\u0438\u043a \u043f\u043e\u0441\u0435\u0440\u0435\u0434\u0438\u043d\u0435<\/strong> &#8212; \u044d\u0442\u043e \u0441\u0430\u043c \u0434\u0435\u043d\u043e\u0439\u0437\u0435\u0440, \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0438\u0439 \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0445 \u0431\u043b\u043e\u043a\u043e\u0432\/\u0443\u0440\u043e\u0432\u043d\u0435\u0439. \u041d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0435\u0439, \u0432\u044b\u0441\u0442\u0440\u043e\u0435\u043d\u043d\u044b\u0445 \u0432 \u0440\u044f\u0434, \u043a\u043e\u0440\u043e\u0447\u0435. <strong>Linear B<\/strong> &#8212; \u044d\u0442\u043e \u0434\u0435\u043a\u043e\u0434\u0435\u0440. \u041e\u043f\u044f\u0442\u044c \u0436\u0435, \u043c\u0430\u0442\u0440\u0438\u0446\u0430 \u0434\u043b\u044f \u0442\u0440\u0430\u043d\u0441\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 16-\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u0442\u0435\u043d\u0437\u043e\u0440\u0430 \u043e\u0431\u0440\u0430\u0442\u043d\u043e \u0432 2 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u044b \u043d\u0430 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438. \u041d\u0430 \u0441\u0445\u0435\u043c\u0435 \u0432\u043c\u0435\u0441\u0442\u0435 2 \u0438 16 \u043d\u0430\u043f\u0438\u0441\u0430\u043d\u043e (B, 2) \u0438 (B, 16), \u043f\u043e\u0442\u043e\u043c\u0443 \u0447\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u044c \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u043d\u0430 \u0432\u0445\u043e\u0434 \u0441\u044d\u043c\u043f\u043b\u044b \u043d\u0435 \u043f\u043e \u043e\u0434\u043d\u043e\u043c\u0443 \u0430 \u0441\u0440\u0430\u0437\u0443 \u0433\u0440\u0443\u043f\u043f\u043e\u0439 (\u0431\u0430\u0442\u0447\u0435\u043c). B &#8212; \u044d\u0442\u043e \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430 (\u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432).<\/p>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0441\u0440\u0430\u0437\u0443 \u0440\u0430\u0437\u0431\u0435\u0440\u0451\u043c\u0441\u044f \u043a\u0430\u043a \u0443\u0441\u0442\u0440\u043e\u0435\u043d\u044b \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0438\u0435 \u0431\u043b\u043e\u043a\u0438. \u0417\u0430\u043e\u0434\u043d\u043e \u0432\u0441\u043f\u043e\u043c\u043d\u0438\u043c \u043a\u0430\u043a \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432 PyTorch Multilayered perceptron.<\/p>\n<p>\u0418\u0442\u0430\u043a, \u043a\u0430\u043a \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u0432\u043e\u0442 \u0442\u0430\u043a\u0443\u044e \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u044c (\u043c\u043e\u0434\u0435\u043b\u044c)?<\/p>\n<figure class=\"\">\n<div><figcaption>\u0421\u0442\u0435\u0440\u0435\u043e\u0442\u0438\u043f\u043d\u0430\u044f &#8216;\u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0430\u044f \u0441\u0435\u0442\u044c&#8217;<\/figcaption><\/div>\n<\/figure>\n<p>\u041d\u0430 PyTorch \u043f\u0440\u043e\u0449\u0435 \u043f\u0440\u043e\u0441\u0442\u043e\u0433\u043e:<\/p>\n<pre><code class=\"python\">model = nn.Sequential( nn.Linear(4, 3),  # \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u0439 \u0441\u043b\u043e\u0439 nn.SiLU(),  # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0430\u043a\u0442\u0438\u0432\u0430\u0446\u0438\u0438 nn.Linear(3, 5),  # \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u0439 \u0441\u043b\u043e\u0439 ) <\/code><\/pre>\n<p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0437\u0430\u0432\u0435\u0440\u043d\u0451\u043c \u044d\u0442\u043e \u0432 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0439 \u043a\u043b\u0430\u0441\u0441:<\/p>\n<pre><code class=\"python\">class MyBlock(nn.Module): def __init__(self):       super().__init__()     self.mlp = nn.Sequential( nn.Linear(4, 3), nn.SiLU(), nn.Linear(3, 5), )  def forward(x):  # \u044d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0430\u0435\u0442 \u0432\u0445\u043e\u0434\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0441\u043a\u0432\u043e\u0437\u044c \u043d\u0430\u0448\u0443 \u043c\u043e\u0434\u0435\u043b\u044c return self.mlp(x) <\/code><\/pre>\n<p><code>nn.Module<\/code> &#8212; \u044d\u0442\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u044b\u0439 \u043a\u043b\u0430\u0441\u0441, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043e\u0431\u043b\u0435\u0433\u0447\u0430\u0435\u0442 \u043f\u043e\u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0443\u044e \u0440\u0430\u0431\u043e\u0442\u0443 \u0441 \u043c\u043e\u0434\u0435\u043b\u044c\u044e.<\/p>\n<p>\u0414\u0443\u043c\u0430\u044e, \u043a\u043e\u0434 \u0431\u0443\u0434\u0435\u0442 \u0433\u0438\u0431\u0447\u0435, \u0435\u0441\u043b\u0438 \u0432\u044b\u043d\u0435\u0441\u0442\u0438 \u0441\u043a\u0430\u043b\u044f\u0440\u043d\u044b\u0435 \u043a\u043e\u043d\u0441\u0442\u0430\u043d\u0442\u044b \u0432 \u043a\u043e\u043d\u0441\u0442\u0440\u0443\u043a\u0442\u043e\u0440:<\/p>\n<pre><code class=\"python\">class MyBlock(nn.Module): def __init__(self, hidden_dim, mlp_ratio):       super().__init__()     self.mlp = nn.Sequential( nn.Linear(hidden_dim, hidden_dim * mlp_ratio), nn.SiLU(), nn.Linear(hidden_dim * mlp_ratio, hidden_dim), )  def forward(x): return self.mlp(x) <\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c &#171;\u0448\u0438\u0440\u0438\u043d\u0443&#187; \u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u0432\u0445\u043e\u0434\u043d\u043e\u0433\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u0430 \u0434\u043b\u044f \u044d\u0442\u043e\u0439 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0438 \u043c\u043e\u0436\u043d\u043e \u0443\u043a\u0430\u0437\u044b\u0432\u0430\u0442\u044c \u043f\u0440\u0438 \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u0438.<\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u043e\u043b\u043d\u044b\u0439 \u043a\u043e\u0434<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\">import torch.nn as nn  class DenoiserBlock(nn.Module): def __init__(self, hidden_dim, mlp_ratio):       super().__init__()     self.ln = nn.LayerNorm(hidden_dim)     self.mlp = nn.Sequential( nn.Linear(hidden_dim, hidden_dim * mlp_ratio), nn.SiLU(), nn.Linear(hidden_dim * mlp_ratio, hidden_dim), )  def forward(self, x): z = self.ln(x)  # \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0435\u043c \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440 \u0447\u0435\u0440\u0435\u0437 \u043d\u043e\u0440\u043c\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044e return self.mlp(z)  # \u0430 \u043f\u043e\u0442\u043e\u043c \u0447\u0435\u0440\u0435\u0437 MLP <\/code><\/pre>\n<\/div>\n<\/details>\n<p>\u0412 \u0438\u0442\u043e\u0433\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0430\u0441\u044c \u043c\u043e\u0434\u0435\u043b\u044c \u0432\u043d\u0443\u0442\u0440\u0435\u043d\u043d\u0435\u0433\u043e \u0431\u043b\u043e\u043a\u0430, \u0438\u0437 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u043e\u0441\u0442\u043e\u044f\u0442\u044c \u043d\u0430\u0448\u0430 \u043e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c-\u0434\u0435\u043d\u043e\u0439\u0437\u0435\u0440. \u0422\u0430\u043a, \u0430 \u043e\u0442\u043a\u0443\u0434\u0430 \u0432\u0437\u044f\u043b\u0441\u044f <code>nn.LayerNorm<\/code> ? \u0421\u0435\u0439\u0447\u0430\u0441 \u0432\u0434\u0430\u0432\u0430\u0442\u044c\u0441\u044f \u0432 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043d\u0435 \u0431\u0443\u0434\u0443, \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043a\u0430\u0436\u0443, \u0447\u0442\u043e <code>nn.LayerNorm<\/code><\/p>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-474112","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/474112","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=474112"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/474112\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=474112"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=474112"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=474112"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}