{"id":323565,"date":"2021-05-21T15:01:31","date_gmt":"2021-05-21T15:01:31","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=323565"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=323565","title":{"rendered":"Quantization Aware Training. \u0418\u043b\u0438 \u043a\u0430\u043a \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c fp16 inference \u0432 TensorRT"},"content":{"rendered":"\n<div class=\"post__text post__text_v2\" id=\"post-content-body\">\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/e84\/5ed\/e08\/e845ede086fae78c10bddd46fa02ea03.png\" width=\"950\" height=\"534\"><figcaption><\/figcaption><\/figure>\n<p>Low-precision inference \u0432 TensorRT \u0441\u0435\u0433\u043e\u0434\u043d\u044f &#8212; \u043c\u0430\u0441\u0442\u0445\u044d\u0432, \u0431\u0435\u0441\u0442 \u043f\u0440\u0430\u043a\u0442\u0438\u0441 \u0438 \u043f\u0440\u043e\u0447\u0438\u0435 \u0438\u043d\u043e\u0441\u0442\u0440\u0430\u043d\u043d\u044b\u0435. \u0421\u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u0442\u044c \u0438\u0437 TensorFlow \u043b\u0435\u0433\u043a\u043e, \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u044c \u043b\u0435\u0433\u043a\u043e, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c fp16 \u043b\u0435\u0433\u043a\u043e. \u0414\u0430 \u0438 \u041a\u041f\u0414 \u0432\u044b\u0448\u0435, \u0447\u0435\u043c \u0443 pruning \u0438\u043b\u0438 distillation. \u041d\u0430 \u043f\u0435\u0440\u0432\u044b\u0439 \u0432\u0437\u0433\u043b\u044f\u0434 \u0432\u0441\u0451 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0438\u0434\u0435\u0430\u043b\u044c\u043d\u043e. \u041d\u043e \u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u0432\u0441\u0451 \u043b\u0438 \u0442\u0430\u043a \u0433\u043b\u0430\u0434\u043a\u043e? \u0420\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u043c, \u043a\u0430\u043a \u043c\u044b \u0432 TrafficData \u0441\u043f\u043e\u0442\u043a\u043d\u0443\u043b\u0438\u0441\u044c \u043e\u0431 fp16, \u0432\u0441\u0442\u0430\u043b\u0438 \u0438 \u043d\u0430\u043f\u0438\u0441\u0430\u043b\u0438 \u0441\u0442\u0430\u0442\u044c\u044e.<\/p>\n<p><strong>\u0415\u0441\u043b\u0438 \u0442\u044b \u0447\u0438\u0442\u0430\u0435\u0448\u044c \u044d\u0442\u0443 \u0441\u0442\u0430\u0442\u044c\u044e \u0440\u0430\u0434\u0438 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0433\u043e \u0442\u0443\u0442\u043e\u0440\u0438\u0430\u043b\u0430 \u043e \u0437\u0430\u043f\u0443\u0441\u043a\u0435 TensorRT, \u0442\u043e \u0435\u0433\u043e \u0442\u0443\u0442 \u043d\u0435\u0442. \u041e\u043d \u0435\u0441\u0442\u044c <\/strong><a href=\"https:\/\/docs.nvidia.com\/deeplearning\/tensorrt\/developer-guide\" rel=\"noopener noreferrer nofollow\"><strong>\u0442\u0443\u0442<\/strong><\/a><strong>. \u0417\u0434\u0435\u0441\u044c \u0436\u0435 \u043f\u0440\u043e \u043e\u043f\u044b\u0442 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0432\u0430\u0436\u043d\u044b\u0445 \u043c\u043e\u043c\u0435\u043d\u0442\u043e\u0432, \u043e \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043d\u0435 \u0433\u043e\u0432\u043e\u0440\u044f\u0442 \u0432 \u043e\u0444\u0438\u0446\u0438\u0430\u043b\u044c\u043d\u043e\u0439 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438. <\/strong><\/p>\n<h3>\u0427\u0442\u043e \u0437\u0430 \u0437\u0432\u0435\u0440\u044c \u0432\u0430\u0448 low-precision?<\/h3>\n<h4>float16<\/h4>\n<p>\u0418 \u0442\u0430\u043a, <strong>low-precision inference<\/strong> &#8212; \u0437\u0430\u043f\u0443\u0441\u043a \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 \u0432 \u0442\u0438\u043f\u0435 \u043f\u043e\u043d\u0438\u0436\u0435\u043d\u043d\u043e\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. \u041d\u043e \u0437\u0430\u0447\u0435\u043c \u044d\u0442\u043e \u043d\u0443\u0436\u043d\u043e? \u041f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u0432\u0441\u0435 \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0438 \u0443\u0447\u0430\u0442 \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u044e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432 \u0442\u0438\u043f\u0435 float32. \u041e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0437\u043d\u0430\u043a\u043e\u0432 \u0432\u043e fp32 &#8212; \u0447\u0430\u0441\u0442\u043e \u0438\u0437\u0431\u044b\u0442\u043e\u0447\u043d\u043e. \u041d\u0443 \u0430 \u0437\u0430\u0447\u0435\u043c \u043d\u0430\u043c \u044d\u0442\u0438 \u0441\u043e\u0442\u043d\u0438 \u0437\u043d\u0430\u043a\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u0437\u0430\u043f\u044f\u0442\u043e\u0439? \u041c\u043e\u0436\u043d\u043e \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043a\u0430\u0441\u0442\u043e\u0432\u0430\u0442\u044c fp32 \u0432\u0435\u0441\u0430 \u0432\u043e fp16, \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u043f\u0440\u044f\u043c\u043e\u0433\u043e \u043f\u0440\u043e\u0433\u043e\u043d\u0430 \u0438 \u0443\u043c\u0435\u043d\u044c\u0448\u0435\u043d\u0438\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c\u043e\u0439 \u043f\u0430\u043c\u044f\u0442\u0438 \u0432 2 \u0440\u0430\u0437\u0430. \u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u0432 \u0438\u0441\u0445\u043e\u0434\u043d\u0443\u044e \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u0438. \u0415\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0435 \u0443\u0441\u043b\u043e\u0432\u0438\u0435 &#8212; \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u0442\u0435\u043d\u0437\u043e\u0440\u043d\u044b\u0445 \u044f\u0434\u0435\u0440 \u0432 \u0432\u0430\u0448\u0435\u043c GPU. <\/p>\n<h4>int8 \u0438 \u043f\u0440\u043e\u0447\u0435\u0435<\/h4>\n<p>\u041a\u0440\u043e\u043c\u0435 fp16 \u0441 \u043f\u0440\u043e\u0441\u0442\u044b\u043c \u043a\u0430\u0441\u0442\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0435\u0441\u0442\u044c \u043c\u043d\u043e\u0433\u043e \u0438\u0434\u0435\u0439 \u043f\u043e \u0431\u043e\u043b\u0435\u0435 \u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e\u043c\u0443 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044e \u0431\u0438\u0442 \u0432 16-\u0431\u0438\u0442\u043d\u043e\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0438. \u041f\u0440\u043e\u0441\u0442\u043e \u0447\u0442\u043e\u0431\u044b \u043d\u0430\u043f\u043e\u043c\u043d\u0438\u0442\u044c:<\/p>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/90e\/535\/111\/90e5351112a00d7f5048939429a2ef3f.png\" alt=\"\" title=\"\" width=\"400\" height=\"255\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u043e \u044d\u0442\u043e\u0433\u043e \u043c\u0430\u043b\u043e. \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 \u0432 \u0432\u044b\u0441\u043e\u043a\u043e\u043d\u0430\u0433\u0440\u0443\u0436\u0435\u043d\u043d\u044b\u0445 \u0441\u0438\u0441\u0442\u0435\u043c\u0430\u0445 \u0438 \u043c\u043e\u0431\u0438\u043b\u044c\u043d\u044b\u0445 \u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0430\u0445 \u0437\u0430\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0435\u0449\u0435 \u0441\u0438\u043b\u044c\u043d\u0435\u0435 \u0443\u0436\u0438\u043c\u0430\u0442\u044c \u0441\u0435\u0442\u0438 \u0438 \u0443\u0441\u043a\u043e\u0440\u044f\u0442\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441. \u0414\u043e\u0431\u0440\u043e \u043f\u043e\u0436\u0430\u043b\u043e\u0432\u0430\u0442\u044c \u0432 \u043c\u0438\u0440 int8 \u0438 int4. \u0414\u0430, \u0432 \u043d\u0438\u0445 \u043a\u0432\u0430\u043d\u0442\u0443\u044e\u0442. \u0414\u0430, \u0432 int8 \u0432\u0441\u0435\u0433\u043e 256 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439. \u0414\u0430, \u044d\u0442\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442. \u0421\u043e \u0441\u0432\u043e\u0438\u043c\u0438 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044f\u043c\u0438, \u043a\u043e\u043d\u0435\u0447\u043d\u043e &#8212; \u0437\u0434\u0435\u0441\u044c \u0443\u0436\u0435 \u043f\u0440\u043e\u0441\u0442\u043e \u0442\u0430\u043a \u043d\u0435 \u043a\u0430\u0441\u0442\u0430\u043d\u0451\u0448\u044c, \u043a\u0430\u043a \u0432 \u0441\u043b\u0443\u0447\u0430\u0435 \u0441 fp16. \u041d\u0443\u0436\u043d\u043e \u0432\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0438\u0437\u0443\u0447\u0430\u0442\u044c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u0432 \u0441\u043b\u043e\u044f\u0445, \u0447\u0442\u043e\u0431\u044b \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u0435\u0434\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u043d\u044b\u0439 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439.<\/p>\n<p>\u041e\u0431\u044a\u044f\u0441\u043d\u044e, \u043f\u043e\u0447\u0435\u043c\u0443 \u043c\u044b \u043d\u0435 \u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 8\/4 \u0431\u0438\u0442\u043d\u044b\u0435 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438. \u0414\u0435\u043b\u043e \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e \u0437\u0434\u0435\u0441\u044c \u043d\u0435 \u043e\u0431\u043e\u0439\u0442\u0438\u0441\u044c \u0431\u0435\u0437 \u043f\u043e\u0442\u0435\u0440\u0438 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, <a href=\"https:\/\/arxiv.org\/pdf\/1902.06822.pdf\" rel=\"noopener noreferrer nofollow\">\u0442\u0443\u0442 <\/a>\u0433\u043e\u0432\u043e\u0440\u044f\u0442 \u043a\u0430\u043a \u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e \u044e\u0437\u0430\u0442\u044c int4 \u0438 \u0440\u0430\u0434\u0443\u044e\u0442\u0441\u044f, \u0447\u0442\u043e \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u043d\u0435 15%, \u0430 8% \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. \u0418\u043b\u0438 \u0432\u043e\u0442 \u043a\u0440\u0430\u0441\u043d\u043e\u0440\u0435\u0447\u0438\u0432\u0430\u044f \u0442\u0430\u0431\u043b\u0438\u0447\u043a\u0430 \u043e\u0442 Nvidia \u043e \u0437\u0430\u043f\u0430\u0434\u0435\u043d\u0438\u0438 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 int8:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/8d4\/ef0\/aa0\/8d4ef0aa0da00cfb53ac6395fffda849.png\" width=\"595\" height=\"501\"><figcaption><\/figcaption><\/figure>\n<p>\u042f \u0441\u043b\u044b\u0448\u0430\u043b \u043d\u0430 \u043a\u043e\u043d\u0444\u0435\u0440\u0435\u043d\u0446\u0438\u044f\u0445, \u0447\u0442\u043e \u043d\u0430 \u0442\u0430\u043a\u0443\u044e \u043f\u043e\u0442\u0435\u0440\u044e \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e \u0441\u043c\u043e\u0442\u0440\u044f\u0442 \u0432 \u043c\u043e\u0431\u0438\u043b\u044c\u043d\u044b\u0445 \u0440\u0435\u0448\u0435\u043d\u0438\u044f\u0445. \u041e\u0441\u043e\u0431\u0435\u043d\u043d\u043e, \u0435\u0441\u043b\u0438 \u044d\u0442\u043e \u043a\u0430\u043a\u043e\u0439-\u0442\u043e \u0440\u0430\u0437\u0432\u043b\u0435\u043a\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043a\u043e\u043d\u0442\u0435\u043d\u0442 \u0442\u0438\u043f\u0430 \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0430 \u0441\u0442\u0438\u043b\u0435\u0439 \u043d\u0430 GANax \u0438 \u0442\u0434. \u041d\u0443 \u0438\u0437\u043c\u0435\u043d\u0438\u043b\u0441\u044f \u0441\u0442\u0438\u043b\u044c \u043d\u0435\u043c\u043d\u043e\u0433\u043e &#8212; \u043d\u0438\u0447\u0435\u0433\u043e \u0441\u0442\u0440\u0430\u0448\u043d\u043e\u0433\u043e.<br \/>\u0412 \u043d\u0430\u0448\u0435\u043c \u0440\u0435\u0448\u0435\u043d\u0438\u0438 \u043a\u0430\u0436\u0434\u044b\u0439 \u043f\u0440\u043e\u0446\u0435\u043d\u0442 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 &#8212; \u043d\u0430\u0448\u0435 \u0437\u043e\u043b\u043e\u0442\u0446\u0435. \u0418 \u043f\u043e\u043a\u0430 \u043c\u044b \u043d\u0435 \u043d\u0430\u0443\u0447\u0438\u043b\u0438\u0441\u044c \u043d\u0435 \u0442\u0435\u0440\u044f\u0442\u044c \u0438\u0445 \u0432 int8.<\/p>\n<h4>TensorRT<\/h4>\n<p>\u0415\u0441\u043b\u0438 \u0443 \u0432\u0430\u0441 \u043c\u043e\u0431\u0438\u043b\u044c\u043d\u044b\u0435 \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0438\u043b\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u043d\u0430 CPU, \u0442\u043e \u043f\u043e\u043f\u0440\u043e\u0431\u0443\u0439\u0442\u0435 <a href=\"https:\/\/www.tensorflow.org\/lite\/performance\/post_training_quantization\" rel=\"noopener noreferrer nofollow\">TensorFlow Lite<\/a>. \u041d\u043e \u0432 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u043c, \u0433\u043e\u0432\u043e\u0440\u044f \u043f\u0440\u043e low-precision inference \u0432 \u043f\u0440\u043e\u0434\u0435, \u0441\u0435\u0433\u043e\u0434\u043d\u044f \u0438\u043c\u0435\u044e\u0442 \u0432\u0432\u0438\u0434\u0443 <a href=\"https:\/\/docs.nvidia.com\/deeplearning\/tensorrt\/developer-guide\" rel=\"noopener noreferrer nofollow\">TensorRT <\/a>&#8212; \u043a\u0440\u043e\u0441\u0441\u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0435\u043d\u043d\u044b\u0439 SDK \u0434\u043b\u044f \u0441\u0443\u043f\u0435\u0440-\u0431\u044b\u0441\u0442\u0440\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u044b \u043d\u0430 GPU \u043e\u0442 Nvidia. TensorRT \u043b\u0435\u0433\u043a\u043e \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u0435\u0442 \u0432\u0430\u0448\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0435 <strong>Engines<\/strong>. \u0421\u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u0442\u044c \u043c\u043e\u0436\u043d\u043e \u0438\u0437 \u043b\u044e\u0431\u043e\u0433\u043e \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0435\u0432\u043e\u0433\u043e \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0430 \u0447\u0435\u0440\u0435\u0437 ONNX. Engine &#8212; \u043e\u0447\u0435\u043d\u044c \u0432\u0430\u0436\u043d\u0430\u044f \u0441\u0443\u0449\u043d\u043e\u0441\u0442\u044c \u0432 TensorRT. \u041f\u0440\u0438 \u0431\u0438\u043b\u0434\u0435 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u044f \u043f\u043e\u0434 \u0442\u0435\u043a\u0443\u0449\u0438\u0439 GPU &#8212; \u043d\u0430 \u0434\u0440\u0443\u0433\u0438\u0445 GPU engine \u043b\u0438\u0431\u043e \u043d\u0435 \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u0441\u044f, \u043b\u0438\u0431\u043e \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u043d\u0435\u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e. \u041a\u043e\u0440\u043e\u0447\u0435 \u0433\u043e\u0432\u043e\u0440\u044f, \u0435\u0441\u0442\u044c \u0440\u044f\u0434 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0443\u0436\u043d\u043e \u0437\u043d\u0430\u0442\u044c \u0438\u043b\u0438 \u0437\u0430\u0434\u0430\u0442\u044c \u0437\u0430\u0440\u0430\u043d\u0435\u0435:<\/p>\n<ul>\n<li>\n<p>GPU. \u041d\u0430 \u0447\u0451\u043c \u0441\u043e\u0431\u0440\u0430\u043b\u0438 Engine, \u043d\u0430 \u0442\u043e\u043c \u043f\u0443\u0441\u0442\u044c \u043e\u043d \u0438 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442. \u041d\u043e \u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c \u043e\u0431\u0449\u0438\u0439 \u0431\u0438\u043b\u0434 \u0434\u043b\u044f \u043a\u0430\u0440\u0442\u043e\u0447\u0435\u043a \u043e\u0434\u043d\u043e\u0433\u043e \u0441\u0435\u043c\u0435\u0439\u0441\u0442\u0432\u0430 &#8212; Turing \u0438\u043b\u0438 Ampere. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u043c\u044b \u0431\u0438\u043b\u0434\u0438\u043b\u0438 Engine \u0434\u043b\u044f RTX 2060 \u0438 \u043e\u043d \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043d\u0430 RTX 2080 Super. \u0421\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0433\u043e Engine \u0434\u043b\u044f RTX 2080 Super \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0433\u043e \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043d\u0435 \u0441\u043e\u0437\u0434\u0430\u0435\u0442.<\/p>\n<\/li>\n<li>\n<p>BatchSize. \u041d\u0443\u0436\u043d\u043e \u0437\u0430\u0434\u0430\u0442\u044c \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 &#8212; \u0434\u043b\u044f \u043d\u0435\u0433\u043e \u0438 \u0431\u0443\u0434\u0435\u0442 \u0441\u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d Engine. \u0412 \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0435 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0434\u0430\u0432\u0430\u0442\u044c \u0431\u0430\u0442\u0447\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u043e\u043c \u043c\u0435\u043d\u044c\u0448\u0435 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e, \u043d\u043e \u044d\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0435\u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e.<\/p>\n<\/li>\n<li>\n<p>InputSize. \u041c\u044b \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u043c \u0441 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f\u043c\u0438. \u0418 \u0440\u0430\u0437\u043c\u0435\u0440 \u0432\u0445\u043e\u0434\u043d\u043e\u0433\u043e \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0438\u043d\u043e\u0433\u0434\u0430 \u043c\u043e\u0436\u0435\u0442 \u043c\u0435\u043d\u044f\u0442\u044c\u0441\u044f \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0430. \u041d\u043e TRT \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u0435\u0433\u043e \u0437\u0430\u0434\u0430\u0432\u0430\u0442\u044c \u0436\u0435\u0441\u0442\u043a\u043e, \u0447\u0442\u043e \u043b\u043e\u0433\u0438\u0447\u043d\u043e. \u0414\u0430, \u0435\u0441\u0442\u044c \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u0437\u0430\u0434\u0430\u0442\u044c \u043c\u0438\u043d\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 \u0438 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 \u0440\u0430\u0437\u043c\u0435\u0440\u044b, \u0430 TRT \u0441\u043e\u0437\u0434\u0430\u0441\u0442 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u043e\u0444\u0438\u043b\u0435\u0439 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438. \u041d\u043e \u0432\u0441\u0451 \u0436\u0435 \u044d\u0442\u043e \u043d\u0435 \u0442\u0430\u043a \u0433\u0438\u0431\u043a\u043e, \u043a\u0430\u043a \u0432 TensorFlow, \u0430 \u0438\u043d\u043e\u0433\u0434\u0430 \u043d\u0443\u0436\u043d\u043e.<\/p>\n<\/li>\n<li>\n<p>Precision. \u0421\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0437\u0430\u0434\u0430\u0442\u044c fp32\/fp16\/int8. \u041f\u0435\u0440\u0432\u044b\u0435 \u0434\u0432\u0430 \u0440\u0430\u0437\u043b\u0438\u0447\u0430\u044e\u0442\u0441\u044f \u043b\u0438\u0448\u044c \u0432\u044b\u0431\u043e\u0440\u043e\u043c \u0444\u043b\u0430\u0433\u0430. \u0421 int8 \u044f \u043c\u0430\u043b\u043e \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0438\u0440\u043e\u0432\u0430\u043b. \u041d\u043e \u0441\u0443\u0434\u044f \u043f\u043e \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438, \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043b\u0438\u0448\u044c \u0432 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438 \u043a\u0430\u043b\u0438\u0431\u0440\u043e\u0432\u043e\u0447\u043d\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 &#8212; \u043d\u0430\u0431\u043e\u0440\u0430 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a, \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u0438\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e TRT \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043d\u0430 \u0440\u0430\u0437\u043d\u044b\u0445 \u0441\u043b\u043e\u044f\u0445. <\/p>\n<\/li>\n<\/ul>\n<p>\u041d\u0443 \u0438 \u043f\u043e\u0434 \u043a\u043e\u043d\u0435\u0446 \u0435\u0449\u0435 \u0434\u043e\u0431\u0430\u0432\u043b\u044e, \u0447\u0442\u043e \u0432 \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0435 \u044d\u0442\u0438 \u0434\u0432\u0438\u0436\u043a\u0438 \u043e\u0442\u0436\u0438\u0440\u0430\u044e\u0442 \u043b\u0438\u0448\u044c \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u044b\u0439 \u043c\u0438\u043d\u0438\u043c\u0443\u043c GPU RAM \u0438 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u043e (\u0435\u0441\u043b\u0438 \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 TensorRT Context \u0432 \u0432\u0430\u0448\u0435\u043c \u043a\u043e\u0434\u0435 \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0430). <\/p>\n<h3>\u041a\u043e\u043d\u0442\u0435\u043a\u0441\u0442 \u0437\u0430\u0434\u0430\u0447\u0438<\/h3>\n<p>\u041e\u043a\u0435\u0439, \u0447\u0442\u043e\u0431\u044b \u0431\u044b\u043b\u043e \u043f\u043e\u043d\u044f\u0442\u043d\u0435\u0435, \u043a\u0430\u043a\u0438\u0435 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0432\u043e\u0437\u043d\u0438\u043a\u043b\u0438, \u043f\u0430\u0440\u0430 \u0441\u043b\u043e\u0432 \u043e \u043d\u0430\u0448\u0435\u043c \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u0435. \u041c\u044b \u043f\u0438\u043b\u0438\u043c <a href=\"https:\/\/trafficdata.ru\/\" rel=\"noopener noreferrer nofollow\">TrafficData <\/a>&#8212; \u041f\u041e \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0442\u0440\u0430\u0444\u0438\u043a\u0430 c \u043a\u0430\u043c\u0435\u0440 \u0438 \u0434\u0440\u043e\u043d\u043e\u0432, \u0432 \u0440\u0438\u043b\u0442\u0430\u0439\u043c\u0435 \u0438 \u043f\u043e\u0441\u0442\u0444\u0430\u043a\u0442\u0443\u043c, \u0432 \u0434\u043e\u0436\u0434\u044c \u0438 \u0441\u043d\u0435\u0433. \u041d\u0430\u043c \u0432\u0430\u0436\u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u043d\u043e\u0447\u044c\u044e \u0434\u0435\u0442\u0435\u043a\u0442\u0438\u043b\u043e\u0441\u044c \u0432\u043e\u0442 \u0442\u0430\u043a:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/768\/555\/be2\/768555be25666601a2168d253b584705.png\" width=\"701\" height=\"523\"><figcaption><\/figcaption><\/figure>\n<p>\u0418 \u043d\u0435 \u0445\u0443\u0436\u0435.<\/p>\n<p>\u041d\u0430 <a href=\"https:\/\/opentalks.ai\/\" rel=\"noopener noreferrer nofollow\">opentalks.ai2020<\/a> \u043c\u044b \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u043b\u0438, \u043a\u0430\u043a, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f Pruning \u0438 \u0444\u0438\u0437\u0438\u0447\u043d\u043e\u0441\u0442\u044c \u0434\u0430\u043d\u043d\u044b\u0445, \u0443\u0441\u043a\u043e\u0440\u0438\u043b\u0438 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0443 \u0432 4 \u0440\u0430\u0437\u0430 \u0438 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u0432 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. <a href=\"https:\/\/habr.com\/ru\/post\/482050\/\" rel=\"noopener noreferrer nofollow\">\u0421\u0442\u0430\u0442\u044c\u044e <\/a>\u043f\u0440\u043e Pruning \u044f \u0443\u0436\u0435 \u0432\u044b\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u043b. \u041d\u043e \u0441\u0435\u0433\u043e\u0434\u043d\u044f \u0434\u0430\u0432\u0430\u0439\u0442\u0435 \u043f\u043e\u0433\u043e\u0432\u043e\u0440\u0438\u043c \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u043e \u043f\u0440\u043e low-precision inference.<\/p>\n<h3>\u041a\u0430\u043a \u043c\u044b \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u043b\u0438\u0441\u044c \u0438 \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u043d\u0435\u0436\u043d\u044b\u0435 \u0444\u0438\u0447\u0438<\/h3>\n<p>\u0421\u043a\u0430\u0447\u0438\u0432\u0430\u044f \u043b\u0438\u0431\u044b TensorRT, \u0431\u043e\u043d\u0443\u0441\u043e\u043c \u0432\u044b \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0435 \u043d\u0430\u0431\u043e\u0440 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0441 \u043a\u043e\u0434\u043e\u043c \u0434\u043b\u044f \u0441\u0430\u043c\u044b\u0445 \u0440\u0430\u0437\u043d\u044b\u0445 \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440 \u0438 \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u0439. \u0414\u043b\u044f \u0431\u0438\u043b\u0434\u0430 \u0434\u0432\u0438\u0436\u043a\u043e\u0432 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043f\u0440\u0438\u043c\u0435\u0440 <em>SampleUffSSD (<\/em>UFF &#8212; \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u044b\u0439 \u0444\u043e\u0440\u043c\u0430\u0442 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u044f \u0441\u0435\u0442\u0438, \u0447\u0435\u0440\u0435\u0437 \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043c\u044b \u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u043b\u0438 \u043d\u0430\u0448\u0438 .pb<em>), <\/em>c\u043b\u0435\u0433\u043a\u0430 \u0435\u0433\u043e \u0437\u0430\u043a\u0430\u0441\u0442\u043e\u043c\u0438\u0432 \u043f\u043e\u0434 \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440 \u043e\u0442 YOLO. \u0418 \u0445\u043e\u0442\u044f TensorRT \u043e\u0447\u0435\u043d\u044c \u043c\u043d\u043e\u0433\u043e \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0438 \u0432\u0441\u0451 \u0431\u043e\u043b\u044c\u0448\u0435 \u043d\u043e\u0432\u044b\u0445 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u0445 \u0441\u043b\u043e\u0435\u0432 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442, \u0442\u043e\u0433\u0434\u0430 \u043c\u044b \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u043b\u0438\u0441\u044c \u043d\u0430 \u0432\u0435\u0440\u0441\u0438\u0438, \u0433\u0434\u0435 \u043d\u0435 \u0431\u044b\u043b\u043e \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 ResizeBilinear \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0438 \u0434\u043b\u044f Upsample \u0441\u043b\u043e\u044f. \u0418 \u043c\u044b \u043d\u0430\u043a\u043e\u0441\u0442\u044b\u043b\u0438\u043b\u0438 Conv2DTranspose \u0432\u043c\u0435\u0441\u0442\u043e \u043d\u0435\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u043f\u0438\u0441\u0430\u0442\u044c \u043a\u0430\u0441\u0442\u043e\u043c\u043d\u044b\u0439 \u0441\u043b\u043e\u0439. \u041f\u0435\u0440\u0432\u0430\u044f \u0441\u043a\u043e\u043d\u0432\u0435\u0440\u0447\u0435\u043d\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u0431\u044b\u043b\u0430 \u0440\u0430\u0434\u043e\u0441\u0442\u044c\u044e, \u043a\u0430\u043a \u0438 \u0435\u0451 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u0440\u0430\u0431\u043e\u0442\u044b. <\/p>\n<p>\u0414\u0430\u0436\u0435 \u0435\u0441\u043b\u0438 \u043f\u0435\u0440\u0435\u0439\u0442\u0438 \u0441 fp32 \u0438\u0437 TF \u0432 fp32 TRT, \u0442\u043e \u0443\u0436\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u043d\u0435\u0441\u043b\u0430\u0431\u043e\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 &#8212; \u043d\u0430 15-20%. \u0412 \u043a\u043e\u043d\u0446\u0435 \u043a\u043e\u043d\u0446\u043e\u0432 TRT \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442 \u0438 \u043c\u043d\u043e\u0433\u043e \u0434\u0440\u0443\u0433\u0438\u0445 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0439, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0433\u043e\u0440\u0438\u0437\u043e\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0435, \u0432\u0435\u0440\u0442\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0435 \u0438 \u043b\u044e\u0431\u044b\u0435 \u0434\u0440\u0443\u0433\u0438\u0435 <a href=\"https:\/\/sisyphus.gitbook.io\/project\/deep-learning-basics\/computation-graph-optimization\/tensorrt-computation-graph-optimization\" rel=\"noopener noreferrer nofollow\">LayerFusion<\/a>. <\/p>\n<p>\u0414\u043b\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043c\u044b \u0437\u0430\u043a\u0430\u0441\u0442\u043e\u043c\u0438\u043b\u0438 \u043f\u0440\u0438\u043c\u0435\u0440 <em>trtExec, <\/em>\u043e\u0431\u0435\u0440\u043d\u0443\u0432 \u0435\u0433\u043e \u0434\u043b\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0432 .NET \u043a\u043e\u0434\u0435. \u041d\u0430 \u0432\u0445\u043e\u0434 &#8212; \u0431\u0430\u0439\u0442\u044b \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f, \u043d\u0430 \u0432\u044b\u0445\u043e\u0434\u0435 &#8212; \u043d\u0435\u0440\u0430\u0441\u043f\u0430\u0440\u0441\u0435\u043d\u043d\u044b\u0435 \u0431\u0430\u0439\u0442\u044b \u0432\u044b\u0445\u043e\u0434\u0430 YOLO. \u0417\u0434\u0435\u0441\u044c \u0430\u043a\u043a\u0443\u0440\u0430\u0442\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0439\u0442\u0435 \u0441 CudaStream \u0438 ExecutionContext. \u0422\u043e\u0433\u0434\u0430 \u043d\u0438 \u043f\u0430\u043c\u044f\u0442\u044c \u043d\u0435 \u0443\u0442\u0435\u0447\u0435\u0442, \u043d\u0438 \u043f\u043e\u0442\u043e\u043a\u0438 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u043d\u0435 \u0437\u0430\u043a\u043e\u0440\u0440\u0430\u043f\u0442\u044f\u0442\u0441\u044f.<\/p>\n<p>\u0418 \u0442\u0430\u043a, \u043c\u044b \u0440\u0435\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u043b\u0438 TensorRT fp16 inference. \u0421\u0431\u0438\u043b\u0434\u0438\u043b\u0438 \u0434\u0432\u0438\u0436\u043a\u0438 \u0434\u043b\u044f \u0440\u0430\u0437\u043d\u044b\u0445 \u043a\u0430\u0440\u0442\u043e\u0447\u0435\u043a. \u041f\u0440\u043e\u0433\u043d\u0430\u043b\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0442\u0435\u0441\u0442\u044b &#8212; \u043a\u043e\u043b\u0435\u0431\u0430\u043d\u0438\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u0432 \u043f\u0440\u0435\u0434\u0435\u043b\u0430\u0445 \u043f\u043e\u0433\u0440\u0435\u0448\u043d\u043e\u0441\u0442\u0438. \u0418 \u0432\u0441\u0451 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043c\u0435\u0441\u044f\u0446\u0435\u0432. \u0410 \u0434\u0430\u043b\u044c\u0448\u0435 &#8212; \u0438\u0441\u0442\u043e\u0440\u0438\u044f.<br \/>10:00. \u0417\u0432\u043e\u043d\u043e\u043a \u043a\u043b\u0438\u0435\u043d\u0442\u0430:<br \/>&#8212; \u0423 \u043d\u0430\u0441 \u0442\u0443\u0442 \u043d\u0430 \u043e\u0434\u043d\u043e\u043c \u0440\u043e\u043b\u0438\u043a\u0435 TrafficData \u043f\u043b\u043e\u0445\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 &#8212; \u043c\u0430\u0448\u0438\u043d\u043a\u0438 \u0434\u0432\u043e\u044f\u0442\u0441\u044f.<br \/>&#8212; \u041e\u043a\u0435\u0439, \u0441\u043a\u0438\u043d\u044c\u0442\u0435 \u0440\u043e\u043b\u0438\u043a \u0440\u0430\u0437\u0431\u0435\u0440\u0435\u043c\u0441\u044f.<br \/>\u0421\u043c\u043e\u0442\u0440\u0438\u043c \u0440\u043e\u043b\u0438\u043a &#8212; \u0434\u0430, \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0435\u0441\u0442\u044c. \u0420\u043e\u043b\u0438\u043a \u0441 \u0442\u0435\u043d\u044f\u043c\u0438 \u0438 \u043d\u0430 \u043d\u0451\u043c \u0442\u0435\u043d\u0438 \u043e\u0442\u043c\u0435\u0447\u0430\u044e\u0442\u0441\u044f, \u043a\u0430\u043a \u0432\u0442\u043e\u0440\u043e\u0435 \u0430\u0432\u0442\u043e.<\/p>\n<p>13:00. \u0414\u043e\u0431\u0440\u0430\u043b\u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0432 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442. \u041f\u043e\u0441\u0442\u0430\u0432\u0438\u043b\u0438 \u0434\u043e\u0443\u0447\u0438\u0442\u044c\u0441\u044f \u0441 \u043d\u0438\u0437\u043a\u0438\u043c LR.<\/p>\n<p>16:00. \u0422\u0435\u0441\u0442\u0438\u043c \u043d\u0430 \u0432\u0435\u0440\u0441\u0438\u0438 \u0441 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u043e\u043c \u0432 TensorFlow &#8212; \u0432\u0441\u0451 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e. \u0411\u0438\u043b\u0434\u0438\u043c \u043d\u043e\u0432\u044b\u0439 Engine. \u0422\u0435\u0441\u0442\u0438\u043c \u043d\u0430 \u0432\u0435\u0440\u0441\u0438\u0438 \u0441 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u043e\u043c \u0432 TensorRT &#8212; \u043e\u043f\u044f\u0442\u044c \u043c\u0430\u0448\u0438\u043d\u044b \u0434\u0432\u043e\u044f\u0442\u0441\u044f:<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/2fb\/884\/412\/2fb8844121e93ebc553ea7155251bbda.JPG\" width=\"1121\" height=\"505\"><figcaption><\/figcaption><\/figure>\n<p>17:00. \u0418\u0434\u0451\u043c \u0434\u043e\u043c\u043e\u0439.<\/p>\n<p>\u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0435 \u0443\u0442\u0440\u043e \u043d\u0430\u0447\u0430\u043b\u043e\u0441\u044c \u0441 \u043c\u0435\u043c\u0430:<\/p>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/445\/66f\/80b\/44566f80b82ed7d769f07d7ed913bdff.jpeg\" width=\"480\" height=\"285\"><figcaption><\/figcaption><\/figure>\n<p>\u0421\u0442\u0430\u043b\u043e \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u043e, \u0447\u0442\u043e \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0432 TensorRT, \u0430 \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u043e &#8212; \u0432 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u0438 \u0432\u0435\u0441\u043e\u0432 \u0432\u043e fp16. \u041c\u044b \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043b\u0438 \u0435\u0449\u0435 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0434\u0440\u0443\u0433\u0438\u0445 \u0440\u043e\u043b\u0438\u043a\u043e\u0432 \u0441\u043e \u0441\u043b\u043e\u0436\u043d\u044b\u043c\u0438 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u043c\u0438 \u0438 \u0443\u0432\u0438\u0434\u0435\u043b\u0438, \u0447\u0442\u043e \u043f\u043e\u0441\u043b\u0435 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0432\u043e fp16 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u043f\u043e\u044f\u0432\u0438\u043b\u0438\u0441\u044c \u0438 \u0432 \u0434\u0440\u0443\u0433\u0438\u0445 \u043c\u0435\u0441\u0442\u0430\u0445. \u0421\u0442\u0430\u043b\u0438 \u043f\u043e\u044f\u0432\u043b\u044f\u0442\u044c\u0441\u044f \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0438 \u0434\u0435\u0442\u0435\u043a\u0446\u0438\u0438 \u043d\u0430 \u043d\u043e\u0447\u043d\u044b\u0445 \u0432\u0438\u0434\u0435\u043e, \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u0438\u043b\u0431\u043e\u0440\u0434\u044b \u0441\u0442\u0430\u043b\u0438 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u044f\u0442\u044c\u0441\u044f \u043a\u0430\u043a \u0430\u0432\u0442\u043e. \u041a\u043e\u0440\u043e\u0447\u0435 \u0432\u043e\u0442 \u0442\u0430\u043a \u043c\u044b \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u043d\u0435\u0436\u043d\u044b\u0435, \u043d\u043e \u0432\u0430\u0436\u043d\u044b\u0435 \u0444\u0438\u0447\u0438, \u043f\u0440\u043e \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0430\u044f \u0441\u0435\u0442\u044c \u0432\u043e fp32 \u0437\u043d\u0430\u043b\u0430, \u0430 \u0432\u043e\u0442 \u0432\u043e fp16 \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u0437\u0430\u0431\u044b\u043b\u0430. \u0427\u0442\u043e \u0434\u0435\u043b\u0430\u0442\u044c?<\/p>\n<h3>Quntization Aware Training. \u0423\u0447\u0438 \u043d\u0430 \u0442\u043e\u043c, \u043d\u0430 \u0447\u0435\u043c \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c<\/h3>\n<p>\u041f\u043e\u0434\u0441\u043e\u0437\u043d\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u043c\u044b \u0441\u0440\u0430\u0437\u0443 \u043f\u043e\u043d\u0438\u043c\u0430\u043b\u0438, \u0447\u0442\u043e \u0435\u0441\u043b\u0438 \u043c\u044b \u043e\u0431\u0443\u0447\u0430\u0435\u043c \u043d\u0430 fp32, \u0430 \u043f\u043e\u0442\u043e\u043c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0438\u043c \u043d\u0430 fp16, \u0442\u043e \u0432\u044b\u0439\u0434\u0435\u0442 \u043d\u0435\u043f\u0440\u0438\u044f\u0442\u043d\u0430\u044f \u0432\u0435\u0449\u044c. \u0412\u043e\u0442 \u044d\u0442\u0438 \u0436\u0430\u043b\u043a\u0438\u0435 \u0446\u0438\u0444\u0435\u0440\u043a\u0438 \u0434\u0430\u043b\u0435\u043a\u043e \u043f\u043e\u0441\u043b\u0435 \u0437\u0430\u043f\u044f\u0442\u043e\u0439 \u043f\u043e\u0442\u0435\u0440\u044f\u043d\u044b \u0438 \u0442\u0430\u043a \u0432\u043b\u0438\u044f\u044e\u0442. \u0422\u043e\u0433\u0434\u0430 \u0437\u0430\u0447\u0435\u043c \u043c\u044b \u0438\u0445 \u0443\u0447\u0438\u043b\u0438 \u043d\u0430 \u043a\u0430\u0436\u0434\u043e\u043c \u0431\u0430\u0442\u0447\u0435? \u0418\u0434\u0435\u044f Quntization Aware Training \u043a\u0440\u0430\u0439\u043d\u0435 \u043f\u0440\u043e\u0441\u0442\u0430 &#8212; \u0443\u0447\u0438 \u0438 \u043f\u043e\u043c\u043d\u0438 \u043e \u0442\u043e\u043c \u0442\u0438\u043f\u0435, \u0432 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0435\u0448\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0438\u0442\u044c. \u0422.\u0435. \u0432 \u0442\u0438\u043f\u0435 fp16 \u0434\u043e\u043b\u0436\u043d\u044b \u0431\u044b\u0442\u044c \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u0432\u0435\u0440\u0442\u043e\u043a, \u0430\u043a\u0442\u0438\u0432\u0430\u0446\u0438\u0439 \u0438 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u043e\u0432. \u041d\u0435 \u0443\u0434\u0438\u0432\u043b\u044f\u0439\u0442\u0435\u0441\u044c, \u0435\u0441\u043b\u0438 \u043f\u0435\u0440\u0432\u044b\u0435 \u0437\u0430\u043f\u0443\u0441\u043a\u0438 \u0432 TensorFlow \u043e\u043a\u0430\u0436\u0443\u0442\u0441\u044f \u0441 NaN-\u043b\u043e\u0441\u0441\u043e\u043c. \u041f\u0440\u043e\u0441\u0442\u043e \u0432\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0438\u043d\u0441\u043f\u0435\u043a\u0442\u0438\u0440\u0443\u0439\u0442\u0435 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u044f\u0449\u0435\u0435. \u041c\u044b \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u043b\u0438 \u043f\u0430\u0440\u0443 \u043d\u0435\u0434\u0435\u043b\u044c, \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u0430\u043b\u0438 \u0432\u0441\u0451 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 fp16 \u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0431\u044b\u043b\u0430 \u0440\u0435\u0448\u0435\u043d\u0430.<\/p>\n<h4>\u041a\u0430\u043a \u0432 Tensorflow 2.0?<\/h4>\n<p>\u0422\u0443\u0442 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043e\u0442\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0435 \u043e \u0442\u043e\u043c, \u043a\u0430\u043a \u043c\u044b \u0431\u044b\u043b\u0438 \u0440\u0430\u0434\u044b \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044e TF2.0. \u0420\u0430\u0431\u043e\u0442\u0430\u044f \u043f\u043e\u0434 TF1.15 \u043c\u044b \u043a\u0443\u0441\u0430\u043b\u0438 \u043b\u043e\u043a\u0442\u0438, \u0437\u0430\u0441\u0442\u0430\u0432\u043b\u044f\u044f \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u044c\u0441\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0432\u043e fp16, \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u044b\u0432\u0430\u044f \u0441\u043b\u043e\u0438. \u041d\u043e \u044d\u0442\u043e \u0437\u0430\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u0410 \u043f\u043e\u0442\u043e\u043c \u043f\u0440\u0438\u0448\u0435\u043b TF2.0 &#8212; \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0448\u044c <em>tf.train.experimental.enable_mixed_precision_graph_rewrite<\/em> \u043d\u0430\u0434 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u043e\u043c \u0438 \u0432\u0441\u0451 \u0437\u0430\u0432\u043e\u0434\u0438\u0442\u0441\u044f, \u043a\u0430\u043a \u043c\u043e\u044f Lada Granta. \u041d\u043e \u0432\u0441\u0451 \u0436\u0435 \u0441\u0442\u043e\u0438\u0442 \u043e\u0431\u0440\u0430\u0442\u0438\u0442\u044c \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u0435 \u043d\u0430 <a href=\"https:\/\/www.tensorflow.org\/api_docs\/python\/tf\/train\/experimental\/enable_mixed_precision_graph_rewrite\" rel=\"noopener noreferrer nofollow\">whitelist<\/a> &#8212; \u043d\u0435 \u0432\u0441\u0435 \u043d\u043e\u0434\u044b \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0432\u043e fp16. \u0427\u0430\u0441\u0442\u044c \u0441\u0442\u043e\u0438\u0442 \u043f\u043e\u043f\u0440\u0430\u0432\u0438\u0442\u044c \u0440\u0443\u043a\u0430\u043c\u0438. \u041d\u0443 \u0438 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0431\u043e\u043d\u0443\u0441 &#8212; \u043e\u0433\u0440\u043e\u043c\u043d\u0430\u044f \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u044f \u043f\u0430\u043c\u044f\u0442\u0438, \u043a\u043e\u0442\u043e\u0440\u043e\u0439 \u043d\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u043b\u043e\u0441\u044c \u0432 TF1.15. \u0411\u0430\u0442\u0447-\u0441\u0430\u0439\u0437 \u0434\u043b\u044f \u043d\u0430\u0448\u0435\u0439 \u043a\u0430\u0441\u0442\u043e\u043c\u043d\u043e\u0439 YOLOv4.5 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u043b\u0441\u044f \u0432 2 \u0440\u0430\u0437\u0430 &#8212; \u0441 4 \u0434\u043e 8. \u0411\u043e\u043b\u044c\u0448\u0435 \u0431\u0430\u0442\u0447 &#8212; \u043b\u0443\u0447\u0448\u0435 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b.<\/p>\n<h3>\u0412\u044b\u0432\u043e\u0434\u044b<\/h3>\n<p>Fp16 inference &#8212; \u044d\u0442\u043e \u0437\u0434\u043e\u0440\u043e\u0432\u043e. \u0422\u043e\u043b\u044c\u043a\u043e \u043d\u0435 \u0441\u0442\u043e\u0438\u0442 \u0437\u0430\u0431\u044b\u0432\u0430\u0442\u044c \u043f\u0440\u043e Quntization Aware Training, \u0435\u0441\u043b\u0438 \u0432\u044b \u0445\u043e\u0442\u0438\u0442\u0435 \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438. \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u043d\u0430\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0435\u0449\u0435 \u0448\u0430\u0433 \u0432 \u0441\u0442\u043e\u0440\u043e\u043d\u0443 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438 \u043d\u0430\u0448\u0438\u0445 \u0438 \u043a\u043b\u0438\u0435\u043d\u0442\u0441\u043a\u0438\u0445 \u043c\u043e\u0449\u043d\u043e\u0441\u0442\u0435\u0439: <\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/983\/d61\/4bf\/983d614bfff7d429ca322cb986d77905.png\" width=\"1059\" height=\"308\"><figcaption><\/figcaption><\/figure>\n<p>\u0427\u0442\u043e \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0432\u0430\u0436\u043d\u043e \u0432 \u0433\u043e\u0434\u044b \u0434\u0435\u0444\u0438\u0446\u0438\u0442\u0430 \u0447\u0438\u043f\u043e\u0432 \u0438 \u0434\u043e\u0440\u043e\u0433\u0438\u0445 GPU. \u042f \u0432\u0441\u0451 \u0436\u0435 \u0437\u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 GPU \u0432 \u0442\u0435\u0445 \u043c\u0435\u0441\u0442\u0430\u0445, \u0433\u0434\u0435 \u043e\u043d\u0438 \u043f\u0440\u0438\u043d\u043e\u0441\u044f\u0442 \u043f\u043e\u043b\u044c\u0437\u0443 \u043b\u044e\u0434\u044f\u043c, \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0437\u0438\u0440\u0443\u044f \u0447\u0442\u043e-\u0442\u043e. \u0410 \u043d\u0435 \u0442\u0430\u043c, \u0433\u0434\u0435 \u043e\u043d\u0438 \u043f\u0440\u0438\u043d\u043e\u0441\u044f\u0442 \u043f\u0440\u0438\u0431\u044b\u043b\u044c, \u0434\u0435\u043b\u0430\u044f \u0434\u0435\u043d\u044c\u0433\u0438 \u0438\u0437 \u043f\u043e\u0434\u043e\u0433\u0440\u0435\u0442\u043e\u0433\u043e \u0432\u043e\u0437\u0434\u0443\u0445\u0430. <\/p>\n<p>\u0410 \u0432\u043e\u043e\u0431\u0449\u0435 \u0432\u0441\u044f \u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0441\u0435\u0442\u0435\u0439 \u0441\u0435\u0433\u043e\u0434\u043d\u044f &#8212; \u043e\u0447\u0435\u043d\u044c \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0435 \u043f\u043e\u043b\u0435 \u0434\u043b\u044f \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432. \u0425\u043e\u0447\u0435\u0442\u0441\u044f \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u0434\u0435\u0441\u044f\u0442\u043a\u0438 \u043d\u043e\u0432\u044b\u0445 \u0441\u043f\u043e\u0441\u043e\u0431\u043e\u0432 Pruning, Distillation \u0438\u043b\u0438 \u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u0438\u044f \u0432 int4, \u043d\u043e \u0432\u0441\u0435\u0445 \u0411\u0430\u043a\u0441\u043e\u0432 \u0411\u0430\u043d\u043d\u0438 \u043d\u0435 \u0434\u043e\u0433\u043e\u043d\u0438\u0448\u044c. \u041f\u0440\u043e\u0431\u0443\u0439\u0442\u0435 \u043d\u043e\u0432\u043e\u0435, \u043d\u043e \u043d\u0435 \u0437\u0430\u0431\u044b\u0432\u0430\u0439\u0442\u0435 \u043e\u0442\u0434\u044b\u0445\u0430\u0442\u044c.<\/p>\n<p><strong>UPD: \u041e\u0442\u0432\u0435\u0447\u0430\u044f \u043d\u0430 \u0432\u043e\u043f\u0440\u043e\u0441 DistortNeo \u043f\u0440\u043e \u0440\u0435\u0430\u043b\u044c\u043d\u0443\u044e \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u0443\u044e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435.<br \/><\/strong>\u0412 \u0442\u0435\u043e\u0440\u0438\u0438 TensorRT, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f tensor cores, \u043c\u043e\u0436\u0435\u0442 \u0434\u0430\u0442\u044c \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u043e\u0431\u0449\u0435\u0439 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0434\u043e 6 \u0440\u0430\u0437. \u0422\u043e \u0435\u0441\u0442\u044c \u0432\u0430\u0436\u043d\u043e \u0433\u043e\u0432\u043e\u0440\u0438\u0442\u044c \u043a\u0430\u043a \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0434\u043b\u044f 1 \u043f\u043e\u0442\u043e\u043a\u0430 \u0432 2 \u0440\u0430\u0437\u0430 \u0437\u0430 \u0441\u0447\u0435\u0442 fp16 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439, \u0442\u0430\u043a \u0438 \u043f\u0440\u043e \u0443\u0432\u0435\u043b\u0438\u0447\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u043e\u0439 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043f\u0430\u043c\u044f\u0442\u0438 \u0438 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0432 tensor cores. \u0427\u0442\u043e \u0436\u0435 \u043d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435?<br \/>\u041d\u0430\u0448 \u043e\u043f\u044b\u0442 \u0442\u0430\u043a\u043e\u0439 \u2014 \u043f\u0440\u0438 \u0440\u0430\u0431\u043e\u0442\u0435 \u0432 1 \u043f\u043e\u0442\u043e\u043a\u0435 \u043c\u044b \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 2\u0445. \u041e\u0434\u043d\u0430\u043a\u043e, \u0435\u0441\u043b\u0438 \u0433\u043e\u0432\u043e\u0440\u0438\u0442\u044c \u043f\u0440\u043e \u043c\u043d\u043e\u0433\u043e\u043f\u043e\u0442\u043e\u0447\u043d\u0443\u044e \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0443, \u0442\u043e \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u044f \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u0435\u0435. \u0412\u043e fp32 \u043d\u0430 TF \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u043e\u0431\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0442\u044c \u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u043e 2.5 \u043f\u043e\u0442\u043e\u043a\u0430 \u0432\u0438\u0434\u0435\u043e 30 fps, \u0442.\u0435. \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u043e 75 \u043a\u0430\u0434\u0440\u043e\u0432 \u0432 \u0441\u0435\u043a\u0443\u043d\u0434\u0443. \u041f\u0440\u0438 \u043f\u0435\u0440\u0435\u0445\u043e\u0434\u0435 \u043d\u0430 fp16 \u0432 TensorRT \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u0432\u044b\u0440\u0430\u0441\u0442\u0430\u0435\u0442 \u0434\u043e 8 \u043f\u043e\u0442\u043e\u043a\u043e\u0432 30 fps = 240 \u043a\u0430\u0434\u0440\u043e\u0432 \u0432 \u0441\u0435\u043a\u0443\u043d\u0434\u0443. \u0422.\u0435. \u0444\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043f\u0440\u0438 \u043f\u043e\u043b\u043d\u043e\u0439 \u0443\u0442\u0438\u043b\u0438\u0437\u0430\u0446\u0438\u0438 tensor cores \u043c\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u0443\u0432\u0435\u043b\u0438\u0447\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0432 3.2 \u0440\u0430\u0437\u0430 \u2014 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043c\u0435\u043d\u044c\u0448\u0435 \u0442\u0435\u043e\u0440\u0435\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e\u0439. \u0421\u043a\u043e\u0440\u0435\u0435 \u0432\u0441\u0435\u0433\u043e, \u044d\u0442\u043e \u0441\u0432\u044f\u0437\u0430\u043d\u043e \u0441 \u0442\u0435\u043c, \u0447\u0442\u043e \u043c\u044b \u043e\u0431\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0435\u043c \u043f\u043e\u0442\u043e\u043a\u0438 \u0441 \u0431\u0430\u0442\u0447\u0435\u043c = 1, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0442\u044c latency \u043f\u0440\u0438\u0445\u043e\u0434\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u043e \u043a\u0430\u0436\u0434\u043e\u043c\u0443 \u043a\u0430\u0434\u0440\u0443. \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u0431\u043e\u043b\u044c\u0448\u0435\u0433\u043e \u0431\u0430\u0442\u0447\u0430 \u0432 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0435 \u043c\u043e\u0436\u0435\u0442 \u043f\u043e\u0434\u043d\u044f\u0442\u044c \u0438\u0442\u043e\u0433\u043e\u0432\u044b\u0439 \u0431\u0443\u0441\u0442 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0435\u0449\u0435 \u0431\u043b\u0438\u0436\u0435 \u043a \u0442\u0435\u043e\u0440\u0435\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u043c 6\u0445.<\/p>\n<p><strong>UDP2: Q&amp;A \u043a \u0432\u043e\u043f\u0440\u043e\u0441\u0430\u043c kremnik.<\/strong><br \/><strong>1) \u041f\u043e\u0447\u0435\u043c\u0443 \u043d\u0435 \u0440\u0435\u0448\u0438\u043b\u0438\u0441\u044c \u043f\u0438\u0441\u0430\u0442\u044c \u043a\u0430\u0441\u0442\u043e\u043c\u043d\u044b\u0435 \u0441\u043b\u043e\u0438 \u043f\u043e\u0434 trt? \u041b\u0435\u0433\u0447\u0435 \u0431\u044b\u043b\u043e \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u0441\u0432\u043e\u0439 \u0441\u043b\u043e\u0439 \u043d\u0430 tf, \u0447\u0435\u043c \u043d\u0430 trt?<br \/><\/strong>\u041c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 YOLO-\u043f\u043e\u0434\u043e\u0431\u043d\u0443\u044e \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u0443 \u0438 \u0437\u043d\u0430\u043b\u0438, \u0447\u0442\u043e Upsample \u0442\u0430\u043c \u043b\u0435\u0433\u043a\u043e \u0437\u0430\u043c\u0435\u043d\u044f\u0435\u0442\u0441\u044f \u043d\u0430 Conv2DTranspose. \u0425\u043e\u0442\u044f \u0438 \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u043e, \u0447\u0442\u043e Conv2DTranspose \u0437\u0434\u0435\u0441\u044c \u043c\u0435\u043d\u0435\u0435 \u043f\u0440\u0435\u0434\u043f\u043e\u0447\u0442\u0438\u0442\u0435\u043b\u0435\u043d \u0438\u0437-\u0437\u0430 \u0441\u0432\u043e\u0439\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0445 \u0435\u043c\u0443<a href=\"https:\/\/towardsdatascience.com\/transposed-convolution-demystified-84ca81b4baba\" rel=\"noopener noreferrer nofollow\"> \u043a\u0440\u0430\u0435\u0432\u044b\u0445 \u044d\u0444\u0444\u0435\u043a\u0442\u043e\u0432<\/a>. \u041c\u044b \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u043b\u0438 \u044d\u0442\u043e \u0431\u043e\u043b\u0435\u0435 \u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u043c \u043f\u043e \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u0438 \u043f\u0443\u0442\u0451\u043c, \u0447\u0435\u043c \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u043a\u0430\u0441\u0442\u043e\u043c\u043d\u044b\u0445 \u0441\u043b\u043e\u0451\u0432.<strong><br \/>2) \u0412\u0441\u0442\u0440\u0435\u0442\u0438\u043b\u0438\u0441\u044c \u043b\u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0441 \u0434\u0440\u0443\u0433\u0438\u043c\u0438 \u0441\u043b\u043e\u044f\u043c\u0438 \u043f\u0440\u0438 \u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0430\u0446\u0438\u0438 \u0438\u0437 tf \u0432 uff? \u041d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u044f \u043f\u043e\u043d\u0438\u043c\u0430\u044e, \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u043a\u0430 uff \u0437\u0430\u043a\u0430\u043d\u0447\u0438\u0432\u0430\u0435\u0442\u0441\u044f, \u043e\u043d \u043c\u0430\u043b\u043e \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0438 \u0432\u0441\u0435 \u043f\u043e\u0442\u0438\u0445\u043e\u043d\u044c\u043a\u0443 \u043f\u0435\u0440\u0435\u0445\u043e\u0434\u044f\u0442 \u043d\u0430 onnx, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442 \u0433\u043e\u0440\u0430\u0437\u0434\u043e \u0431\u043e\u043b\u044c\u0448\u0435 \u0441\u043b\u043e\u0451\u0432.<br \/><\/strong>\u0414\u0440\u0443\u0433\u0438\u0445 \u043f\u0440\u043e\u0431\u043b\u0435\u043c \u043d\u0435 \u0431\u044b\u043b\u043e. \u041d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e \u0437\u0430\u0445\u043e\u0434\u044f\u0442 \u0438 Mish-\u0430\u043a\u0442\u0438\u0432\u0430\u0446\u0438\u0438, \u0438 Separable2DConv. \u041d\u043e \u0434\u0430, \u0440\u0430\u0437 uff \u0441\u0442\u0430\u043d\u043e\u0432\u0438\u0442\u0441\u044f deprecated, \u043c\u044b \u0431\u0443\u0434\u0435\u043c \u044e\u0437\u0430\u0442\u044c onnx.<strong><br \/>3) \u0415\u0441\u043b\u0438 \u0431\u044b\u043b BatchNorm, \u043f\u0440\u043e\u0431\u043e\u0432\u0430\u043b\u0438 \u043b\u0438 \u0434\u0435\u043b\u0430\u0442\u044c BatchNorm Folding \u0438\u043b\u0438 \u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043d\u0430\u043f\u0440\u044f\u043c\u0443\u044e? \u041d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u044f \u0437\u043d\u0430\u044e, \u0443 uff \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0441 BatchNorm-\u0441\u043b\u043e\u044f\u043c\u0438.<br \/><\/strong>BatchNormalization \u0441\u043b\u043e\u0438, \u043a\u043e\u043d\u0435\u0447\u043d\u043e, \u0431\u044b\u043b\u0438. \u041f\u0440\u043e\u0431\u043b\u0435\u043c \u043f\u0440\u0438 \u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0430\u0446\u0438\u0438 \u043d\u0435 \u0432\u043e\u0437\u043d\u0438\u043a\u043b\u043e \u0438 \u0432\u0440\u043e\u0434\u0435 \u043d\u0438\u0433\u0434\u0435 \u043d\u0435 \u043d\u0430\u0442\u044b\u043a\u0430\u043b\u0441\u044f \u043d\u0430 \u0442\u0430\u043a\u0443\u044e \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e.<strong><br \/>4) \u041a\u0430\u0440\u0442\u0438\u043d\u043a\u0438 \u043f\u0440\u0438 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0435 \u043e\u0442\u0434\u0430\u0451\u0442\u0435 \u0431\u0430\u0442\u0447\u0430\u043c\u0438 \u0438\u043b\u0438 \u043f\u043e \u043e\u0434\u043d\u043e\u0439? \u0415\u0441\u0442\u044c \u043b\u0438 \u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u043d\u0430 \u043e\u0434\u043d\u0443 \u043a\u0430\u0440\u0442\u0438\u043d\u0443 \u043f\u0440\u0438 \u0431\u0430\u0442\u0447\u0435==1 \u0438 \u0431\u0430\u0442\u0447\u0435==N?<br \/><\/strong>\u041a\u0430\u043a \u043f\u0438\u0441\u0430\u043b \u0432 UPD \u0432\u044b\u0448\u0435 &#8212; \u043f\u043e\u0434\u0430\u0451\u043c \u043f\u043e \u043e\u0434\u043d\u043e\u0439, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u0431\u044b\u043b\u043e \u0431\u043e\u043b\u044c\u0448\u043e\u0433\u043e latency \u043c\u0435\u0436\u0434\u0443 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u0430\u043d\u043d\u044b\u043c\u0438 \u043a\u0430\u0434\u0440\u0430\u043c\u0438, \u0442.\u043a. \u043f\u043e\u0441\u043b\u0435 \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043a\u0430\u0434\u0440\u0430 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u0435\u0449\u0435 \u043c\u043d\u043e\u0433\u0438\u0435 \u0434\u0440\u0443\u0433\u0438\u0435 \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u044b. \u041f\u043e\u043c\u043d\u044e, \u0447\u0442\u043e \u043c\u044b \u0442\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u0431\u0430\u0442\u0447 = 8 \u0438 \u0442\u0430\u043c \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043d\u0430 1 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043d\u0435 \u0431\u044b\u043b\u043e &#8212; \u043e\u043a\u043e\u043b\u043e 5% \u0432 \u0440\u0430\u043c\u043a\u0430\u0445 \u043f\u043e\u0433\u0440\u0435\u0448\u043d\u043e\u0441\u0442\u0438. \u041c\u043e\u0433\u0443 \u043f\u0440\u0435\u0434\u043f\u043e\u043b\u043e\u0436\u0438\u0442\u044c, \u0447\u0442\u043e \u0431\u0430\u0442\u0447\u0438\u043d\u0433 \u0441\u043a\u043e\u0440\u0435\u0435 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0442 \u043e\u0431\u0449\u0443\u044e \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u0443\u044e \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044c, \u0447\u0435\u043c \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043e\u0434\u043d\u043e\u0433\u043e \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f.<strong><br \/>5) \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043b\u0438 Triton \u0438\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0435 \u0447\u0442\u043e-\u0442\u043e \u0441\u0432\u043e\u0451?  <br \/><\/strong>\u0418\u0441\u0442\u043e\u0440\u0438\u0447\u0435\u0441\u043a\u0438 \u043d\u0430\u0448 \u043f\u0435\u0440\u0432\u044b\u0439 \u043f\u0440\u043e\u0434\u0443\u043a\u0442 &#8212; \u043c\u043e\u043d\u043e\u043b\u0438\u0442\u043d\u043e\u0435 \u0434\u0435\u0441\u043a\u0442\u043e\u043f\u043d\u043e\u0435 \u043f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u0435. \u0423\u0447\u0438\u0442\u044b\u0432\u0430\u044f \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u0435\u0433\u043e \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440\u044b, \u0431\u044b\u043b\u043e \u043b\u043e\u0433\u0438\u0447\u043d\u0435\u0435 \u043d\u0430\u043f\u0438\u0441\u0430\u0442\u044c \u0441\u0432\u043e\u044e \u043e\u0431\u0451\u0440\u0442\u043a\u0443 \u043d\u0430\u0434 \u0421++ \u043a\u043e\u0434\u043e\u043c. \u0422.\u0435. \u043c\u044b \u0441\u0430\u043c\u0438 \u0441\u043e\u0437\u0434\u0430\u0451\u043c ExecutionContext, CudaStream \u0438 \u0441\u0430\u043c\u0438 \u043a\u043e\u043d\u0442\u0440\u043e\u043b\u0438\u0440\u0443\u0435\u043c \u043e\u0447\u0435\u0440\u0435\u0434\u0438 \u043d\u0430 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0443. \u0417\u0430\u0442\u0435\u043c \u0443 \u043d\u0430\u0441 \u043f\u043e\u044f\u0432\u0438\u043b\u043e\u0441\u044c \u043e\u0431\u043b\u0430\u0447\u043d\u043e\u0435 \u0440\u0435\u0448\u0435\u043d\u0438\u0435, \u0433\u0434\u0435 \u043c\u043e\u0433 \u0431\u044b \u0431\u044b\u0442\u044c \u043b\u043e\u0433\u0438\u0447\u043d\u0435\u0435 Triton. \u041d\u043e \u043d\u0430\u043c \u0443\u0436\u0435 \u043e\u0447\u0435\u043d\u044c \u043f\u043e\u043d\u0440\u0430\u0432\u0438\u043b\u043e\u0441\u044c \u0441\u0430\u043c\u0438\u043c \u043a\u043e\u043d\u0442\u0440\u043e\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u044b \u0432 TRT \u0438 \u043c\u044b \u043e\u0441\u0442\u0430\u0432\u0438\u043b\u0438 \u043d\u0430\u0448\u0443 \u043e\u0431\u0451\u0440\u0442\u043a\u0443.<\/p>\n<\/div>\n<p> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/558406\/\"> https:\/\/habr.com\/ru\/post\/558406\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"\n<div class=\"post__text post__text_v2\" id=\"post-content-body\">\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>Low-precision inference \u0432 TensorRT \u0441\u0435\u0433\u043e\u0434\u043d\u044f &#8212; \u043c\u0430\u0441\u0442\u0445\u044d\u0432, \u0431\u0435\u0441\u0442 \u043f\u0440\u0430\u043a\u0442\u0438\u0441 \u0438 \u043f\u0440\u043e\u0447\u0438\u0435 \u0438\u043d\u043e\u0441\u0442\u0440\u0430\u043d\u043d\u044b\u0435. \u0421\u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u0442\u044c \u0438\u0437 TensorFlow \u043b\u0435\u0433\u043a\u043e, \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u044c \u043b\u0435\u0433\u043a\u043e, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c fp16 \u043b\u0435\u0433\u043a\u043e. \u0414\u0430 \u0438 \u041a\u041f\u0414 \u0432\u044b\u0448\u0435, \u0447\u0435\u043c \u0443 pruning \u0438\u043b\u0438 distillation. \u041d\u0430 \u043f\u0435\u0440\u0432\u044b\u0439 \u0432\u0437\u0433\u043b\u044f\u0434 \u0432\u0441\u0451 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0438\u0434\u0435\u0430\u043b\u044c\u043d\u043e. \u041d\u043e \u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u0432\u0441\u0451 \u043b\u0438 \u0442\u0430\u043a \u0433\u043b\u0430\u0434\u043a\u043e? \u0420\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u043c, \u043a\u0430\u043a \u043c\u044b \u0432 TrafficData \u0441\u043f\u043e\u0442\u043a\u043d\u0443\u043b\u0438\u0441\u044c \u043e\u0431 fp16, \u0432\u0441\u0442\u0430\u043b\u0438 \u0438 \u043d\u0430\u043f\u0438\u0441\u0430\u043b\u0438 \u0441\u0442\u0430\u0442\u044c\u044e.<\/p>\n<p><strong>\u0415\u0441\u043b\u0438 \u0442\u044b \u0447\u0438\u0442\u0430\u0435\u0448\u044c \u044d\u0442\u0443 \u0441\u0442\u0430\u0442\u044c\u044e \u0440\u0430\u0434\u0438 \u043f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0433\u043e \u0442\u0443\u0442\u043e\u0440\u0438\u0430\u043b\u0430 \u043e \u0437\u0430\u043f\u0443\u0441\u043a\u0435 TensorRT, \u0442\u043e \u0435\u0433\u043e \u0442\u0443\u0442 \u043d\u0435\u0442. \u041e\u043d \u0435\u0441\u0442\u044c <\/strong><a href=\"https:\/\/docs.nvidia.com\/deeplearning\/tensorrt\/developer-guide\" rel=\"noopener noreferrer nofollow\"><strong>\u0442\u0443\u0442<\/strong><\/a><strong>. \u0417\u0434\u0435\u0441\u044c \u0436\u0435 \u043f\u0440\u043e \u043e\u043f\u044b\u0442 \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0432\u0430\u0436\u043d\u044b\u0445 \u043c\u043e\u043c\u0435\u043d\u0442\u043e\u0432, \u043e \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043d\u0435 \u0433\u043e\u0432\u043e\u0440\u044f\u0442 \u0432 \u043e\u0444\u0438\u0446\u0438\u0430\u043b\u044c\u043d\u043e\u0439 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438. <\/strong><\/p>\n<h3>\u0427\u0442\u043e \u0437\u0430 \u0437\u0432\u0435\u0440\u044c \u0432\u0430\u0448 low-precision?<\/h3>\n<h4>float16<\/h4>\n<p>\u0418 \u0442\u0430\u043a, <strong>low-precision inference<\/strong> &#8212; \u0437\u0430\u043f\u0443\u0441\u043a \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 \u0432 \u0442\u0438\u043f\u0435 \u043f\u043e\u043d\u0438\u0436\u0435\u043d\u043d\u043e\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. \u041d\u043e \u0437\u0430\u0447\u0435\u043c \u044d\u0442\u043e \u043d\u0443\u0436\u043d\u043e? \u041f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u0432\u0441\u0435 \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0438 \u0443\u0447\u0430\u0442 \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u044e\u0442 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432 \u0442\u0438\u043f\u0435 float32. \u041e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0437\u043d\u0430\u043a\u043e\u0432 \u0432\u043e fp32 &#8212; \u0447\u0430\u0441\u0442\u043e \u0438\u0437\u0431\u044b\u0442\u043e\u0447\u043d\u043e. \u041d\u0443 \u0430 \u0437\u0430\u0447\u0435\u043c \u043d\u0430\u043c \u044d\u0442\u0438 \u0441\u043e\u0442\u043d\u0438 \u0437\u043d\u0430\u043a\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u0437\u0430\u043f\u044f\u0442\u043e\u0439? \u041c\u043e\u0436\u043d\u043e \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u043a\u0430\u0441\u0442\u043e\u0432\u0430\u0442\u044c fp32 \u0432\u0435\u0441\u0430 \u0432\u043e fp16, \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u043f\u0440\u044f\u043c\u043e\u0433\u043e \u043f\u0440\u043e\u0433\u043e\u043d\u0430 \u0438 \u0443\u043c\u0435\u043d\u044c\u0448\u0435\u043d\u0438\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c\u043e\u0439 \u043f\u0430\u043c\u044f\u0442\u0438 \u0432 2 \u0440\u0430\u0437\u0430. \u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u0432 \u0438\u0441\u0445\u043e\u0434\u043d\u0443\u044e \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u0438. \u0415\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0435 \u0443\u0441\u043b\u043e\u0432\u0438\u0435 &#8212; \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u0442\u0435\u043d\u0437\u043e\u0440\u043d\u044b\u0445 \u044f\u0434\u0435\u0440 \u0432 \u0432\u0430\u0448\u0435\u043c GPU. <\/p>\n<h4>int8 \u0438 \u043f\u0440\u043e\u0447\u0435\u0435<\/h4>\n<p>\u041a\u0440\u043e\u043c\u0435 fp16 \u0441 \u043f\u0440\u043e\u0441\u0442\u044b\u043c \u043a\u0430\u0441\u0442\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0435\u0441\u0442\u044c \u043c\u043d\u043e\u0433\u043e \u0438\u0434\u0435\u0439 \u043f\u043e \u0431\u043e\u043b\u0435\u0435 \u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e\u043c\u0443 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044e \u0431\u0438\u0442 \u0432 16-\u0431\u0438\u0442\u043d\u043e\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0438. \u041f\u0440\u043e\u0441\u0442\u043e \u0447\u0442\u043e\u0431\u044b \u043d\u0430\u043f\u043e\u043c\u043d\u0438\u0442\u044c:<\/p>\n<figure class=\"\"><figcaption><\/figcaption><\/figure>\n<p>\u041d\u043e \u044d\u0442\u043e\u0433\u043e \u043c\u0430\u043b\u043e. \u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439 \u0432 \u0432\u044b\u0441\u043e\u043a\u043e\u043d\u0430\u0433\u0440\u0443\u0436\u0435\u043d\u043d\u044b\u0445 \u0441\u0438\u0441\u0442\u0435\u043c\u0430\u0445 \u0438 \u043c\u043e\u0431\u0438\u043b\u044c\u043d\u044b\u0445 \u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0430\u0445 \u0437\u0430\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0435\u0449\u0435 \u0441\u0438\u043b\u044c\u043d\u0435\u0435 \u0443\u0436\u0438\u043c\u0430\u0442\u044c \u0441\u0435\u0442\u0438 \u0438 \u0443\u0441\u043a\u043e\u0440\u044f\u0442\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441. \u0414\u043e\u0431\u0440\u043e \u043f\u043e\u0436\u0430\u043b\u043e\u0432\u0430\u0442\u044c \u0432 \u043c\u0438\u0440 int8 \u0438 int4. \u0414\u0430, \u0432 \u043d\u0438\u0445 \u043a\u0432\u0430\u043d\u0442\u0443\u044e\u0442. \u0414\u0430, \u0432 int8 \u0432\u0441\u0435\u0433\u043e 256 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439. \u0414\u0430, \u044d\u0442\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442. \u0421\u043e \u0441\u0432\u043e\u0438\u043c\u0438 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044f\u043c\u0438, \u043a\u043e\u043d\u0435\u0447\u043d\u043e &#8212; \u0437\u0434\u0435\u0441\u044c \u0443\u0436\u0435 \u043f\u0440\u043e\u0441\u0442\u043e \u0442\u0430\u043a \u043d\u0435 \u043a\u0430\u0441\u0442\u0430\u043d\u0451\u0448\u044c, \u043a\u0430\u043a \u0432 \u0441\u043b\u0443\u0447\u0430\u0435 \u0441 fp16. \u041d\u0443\u0436\u043d\u043e \u0432\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0438\u0437\u0443\u0447\u0430\u0442\u044c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u0432 \u0441\u043b\u043e\u044f\u0445, \u0447\u0442\u043e\u0431\u044b \u044d\u0444\u0444\u0435\u043a\u0442\u0438\u0432\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u0435\u0434\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u043d\u044b\u0439 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439.<\/p>\n<p>\u041e\u0431\u044a\u044f\u0441\u043d\u044e, \u043f\u043e\u0447\u0435\u043c\u0443 \u043c\u044b \u043d\u0435 \u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 8\/4 \u0431\u0438\u0442\u043d\u044b\u0435 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438. \u0414\u0435\u043b\u043e \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e \u0437\u0434\u0435\u0441\u044c \u043d\u0435 \u043e\u0431\u043e\u0439\u0442\u0438\u0441\u044c \u0431\u0435\u0437 \u043f\u043e\u0442\u0435\u0440\u0438 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, <a href=\"https:\/\/arxiv.org\/pdf\/1902.06822.pdf\" rel=\"noopener noreferrer nofollow\">\u0442\u0443\u0442 <\/a>\u0433\u043e\u0432\u043e\u0440\u044f\u0442 \u043a\u0430\u043a \u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e \u044e\u0437\u0430\u0442\u044c int4 \u0438 \u0440\u0430\u0434\u0443\u044e\u0442\u0441\u044f, \u0447\u0442\u043e \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u043d\u0435 15%, \u0430 8% \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. \u0418\u043b\u0438 \u0432\u043e\u0442 \u043a\u0440\u0430\u0441\u043d\u043e\u0440\u0435\u0447\u0438\u0432\u0430\u044f \u0442\u0430\u0431\u043b\u0438\u0447\u043a\u0430 \u043e\u0442 Nvidia \u043e \u0437\u0430\u043f\u0430\u0434\u0435\u043d\u0438\u0438 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 int8:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u042f \u0441\u043b\u044b\u0448\u0430\u043b \u043d\u0430 \u043a\u043e\u043d\u0444\u0435\u0440\u0435\u043d\u0446\u0438\u044f\u0445, \u0447\u0442\u043e \u043d\u0430 \u0442\u0430\u043a\u0443\u044e \u043f\u043e\u0442\u0435\u0440\u044e \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e \u0441\u043c\u043e\u0442\u0440\u044f\u0442 \u0432 \u043c\u043e\u0431\u0438\u043b\u044c\u043d\u044b\u0445 \u0440\u0435\u0448\u0435\u043d\u0438\u044f\u0445. \u041e\u0441\u043e\u0431\u0435\u043d\u043d\u043e, \u0435\u0441\u043b\u0438 \u044d\u0442\u043e \u043a\u0430\u043a\u043e\u0439-\u0442\u043e \u0440\u0430\u0437\u0432\u043b\u0435\u043a\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043a\u043e\u043d\u0442\u0435\u043d\u0442 \u0442\u0438\u043f\u0430 \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0430 \u0441\u0442\u0438\u043b\u0435\u0439 \u043d\u0430 GANax \u0438 \u0442\u0434. \u041d\u0443 \u0438\u0437\u043c\u0435\u043d\u0438\u043b\u0441\u044f \u0441\u0442\u0438\u043b\u044c \u043d\u0435\u043c\u043d\u043e\u0433\u043e &#8212; \u043d\u0438\u0447\u0435\u0433\u043e \u0441\u0442\u0440\u0430\u0448\u043d\u043e\u0433\u043e.<br \/>\u0412 \u043d\u0430\u0448\u0435\u043c \u0440\u0435\u0448\u0435\u043d\u0438\u0438 \u043a\u0430\u0436\u0434\u044b\u0439 \u043f\u0440\u043e\u0446\u0435\u043d\u0442 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 &#8212; \u043d\u0430\u0448\u0435 \u0437\u043e\u043b\u043e\u0442\u0446\u0435. \u0418 \u043f\u043e\u043a\u0430 \u043c\u044b \u043d\u0435 \u043d\u0430\u0443\u0447\u0438\u043b\u0438\u0441\u044c \u043d\u0435 \u0442\u0435\u0440\u044f\u0442\u044c \u0438\u0445 \u0432 int8.<\/p>\n<h4>TensorRT<\/h4>\n<p>\u0415\u0441\u043b\u0438 \u0443 \u0432\u0430\u0441 \u043c\u043e\u0431\u0438\u043b\u044c\u043d\u044b\u0435 \u0440\u0435\u0448\u0435\u043d\u0438\u044f \u0438\u043b\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441 \u043d\u0430 CPU, \u0442\u043e \u043f\u043e\u043f\u0440\u043e\u0431\u0443\u0439\u0442\u0435 <a href=\"https:\/\/www.tensorflow.org\/lite\/performance\/post_training_quantization\" rel=\"noopener noreferrer nofollow\">TensorFlow Lite<\/a>. \u041d\u043e \u0432 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u043c, \u0433\u043e\u0432\u043e\u0440\u044f \u043f\u0440\u043e low-precision inference \u0432 \u043f\u0440\u043e\u0434\u0435, \u0441\u0435\u0433\u043e\u0434\u043d\u044f \u0438\u043c\u0435\u044e\u0442 \u0432\u0432\u0438\u0434\u0443 <a href=\"https:\/\/docs.nvidia.com\/deeplearning\/tensorrt\/developer-guide\" rel=\"noopener noreferrer nofollow\">TensorRT <\/a>&#8212; \u043a\u0440\u043e\u0441\u0441\u043f\u043b\u0430\u0442\u0444\u043e\u0440\u043c\u0435\u043d\u043d\u044b\u0439 SDK \u0434\u043b\u044f \u0441\u0443\u043f\u0435\u0440-\u0431\u044b\u0441\u0442\u0440\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u044b \u043d\u0430 GPU \u043e\u0442 Nvidia. TensorRT \u043b\u0435\u0433\u043a\u043e \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u0435\u0442 \u0432\u0430\u0448\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0435 <strong>Engines<\/strong>. \u0421\u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u0442\u044c \u043c\u043e\u0436\u043d\u043e \u0438\u0437 \u043b\u044e\u0431\u043e\u0433\u043e \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u0435\u0432\u043e\u0433\u043e \u0444\u0440\u0435\u0439\u043c\u0432\u043e\u0440\u043a\u0430 \u0447\u0435\u0440\u0435\u0437 ONNX. Engine &#8212; \u043e\u0447\u0435\u043d\u044c \u0432\u0430\u0436\u043d\u0430\u044f \u0441\u0443\u0449\u043d\u043e\u0441\u0442\u044c \u0432 TensorRT. \u041f\u0440\u0438 \u0431\u0438\u043b\u0434\u0435 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u044f \u043f\u043e\u0434 \u0442\u0435\u043a\u0443\u0449\u0438\u0439 GPU &#8212; \u043d\u0430 \u0434\u0440\u0443\u0433\u0438\u0445 GPU engine \u043b\u0438\u0431\u043e \u043d\u0435 \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u0441\u044f, \u043b\u0438\u0431\u043e \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u043d\u0435\u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e. \u041a\u043e\u0440\u043e\u0447\u0435 \u0433\u043e\u0432\u043e\u0440\u044f, \u0435\u0441\u0442\u044c \u0440\u044f\u0434 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0443\u0436\u043d\u043e \u0437\u043d\u0430\u0442\u044c \u0438\u043b\u0438 \u0437\u0430\u0434\u0430\u0442\u044c \u0437\u0430\u0440\u0430\u043d\u0435\u0435:<\/p>\n<ul>\n<li>\n<p>GPU. \u041d\u0430 \u0447\u0451\u043c \u0441\u043e\u0431\u0440\u0430\u043b\u0438 Engine, \u043d\u0430 \u0442\u043e\u043c \u043f\u0443\u0441\u0442\u044c \u043e\u043d \u0438 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442. \u041d\u043e \u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c \u043e\u0431\u0449\u0438\u0439 \u0431\u0438\u043b\u0434 \u0434\u043b\u044f \u043a\u0430\u0440\u0442\u043e\u0447\u0435\u043a \u043e\u0434\u043d\u043e\u0433\u043e \u0441\u0435\u043c\u0435\u0439\u0441\u0442\u0432\u0430 &#8212; Turing \u0438\u043b\u0438 Ampere. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u043c\u044b \u0431\u0438\u043b\u0434\u0438\u043b\u0438 Engine \u0434\u043b\u044f RTX 2060 \u0438 \u043e\u043d \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043d\u0430 RTX 2080 Super. \u0421\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0433\u043e Engine \u0434\u043b\u044f RTX 2080 Super \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0433\u043e \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u043d\u0435 \u0441\u043e\u0437\u0434\u0430\u0435\u0442.<\/p>\n<\/li>\n<li>\n<p>BatchSize. \u041d\u0443\u0436\u043d\u043e \u0437\u0430\u0434\u0430\u0442\u044c \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 &#8212; \u0434\u043b\u044f \u043d\u0435\u0433\u043e \u0438 \u0431\u0443\u0434\u0435\u0442 \u0441\u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d Engine. \u0412 \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0435 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0434\u0430\u0432\u0430\u0442\u044c \u0431\u0430\u0442\u0447\u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u043e\u043c \u043c\u0435\u043d\u044c\u0448\u0435 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e\u0433\u043e, \u043d\u043e \u044d\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0435\u043e\u043f\u0442\u0438\u043c\u0430\u043b\u044c\u043d\u043e.<\/p>\n<\/li>\n<li>\n<p>InputSize. \u041c\u044b \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u043c \u0441 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f\u043c\u0438. \u0418 \u0440\u0430\u0437\u043c\u0435\u0440 \u0432\u0445\u043e\u0434\u043d\u043e\u0433\u043e \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0438\u043d\u043e\u0433\u0434\u0430 \u043c\u043e\u0436\u0435\u0442 \u043c\u0435\u043d\u044f\u0442\u044c\u0441\u044f \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0430. \u041d\u043e TRT \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u0435\u0433\u043e \u0437\u0430\u0434\u0430\u0432\u0430\u0442\u044c \u0436\u0435\u0441\u0442\u043a\u043e, \u0447\u0442\u043e \u043b\u043e\u0433\u0438\u0447\u043d\u043e. \u0414\u0430, \u0435\u0441\u0442\u044c \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u0437\u0430\u0434\u0430\u0442\u044c \u043c\u0438\u043d\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 \u0438 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 \u0440\u0430\u0437\u043c\u0435\u0440\u044b, \u0430 TRT \u0441\u043e\u0437\u0434\u0430\u0441\u0442 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u043e\u0444\u0438\u043b\u0435\u0439 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438. \u041d\u043e \u0432\u0441\u0451 \u0436\u0435 \u044d\u0442\u043e \u043d\u0435 \u0442\u0430\u043a \u0433\u0438\u0431\u043a\u043e, \u043a\u0430\u043a \u0432 TensorFlow, \u0430 \u0438\u043d\u043e\u0433\u0434\u0430 \u043d\u0443\u0436\u043d\u043e.<\/p>\n<\/li>\n<li>\n<p>Precision. \u0421\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0437\u0430\u0434\u0430\u0442\u044c fp32\/fp16\/int8. \u041f\u0435\u0440\u0432\u044b\u0435 \u0434\u0432\u0430 \u0440\u0430\u0437\u043b\u0438\u0447\u0430\u044e\u0442\u0441\u044f \u043b\u0438\u0448\u044c \u0432\u044b\u0431\u043e\u0440\u043e\u043c \u0444\u043b\u0430\u0433\u0430. \u0421 int8 \u044f \u043c\u0430\u043b\u043e \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0438\u0440\u043e\u0432\u0430\u043b. \u041d\u043e \u0441\u0443\u0434\u044f \u043f\u043e \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\u0446\u0438\u0438, \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043b\u0438\u0448\u044c \u0432 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438 \u043a\u0430\u043b\u0438\u0431\u0440\u043e\u0432\u043e\u0447\u043d\u043e\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 &#8212; \u043d\u0430\u0431\u043e\u0440\u0430 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a, \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0430\u043d\u0438\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e TRT \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043d\u0430 \u0440\u0430\u0437\u043d\u044b\u0445 \u0441\u043b\u043e\u044f\u0445. <\/p>\n<\/li>\n<\/ul>\n<p>\u041d\u0443 \u0438 \u043f\u043e\u0434 \u043a\u043e\u043d\u0435\u0446 \u0435\u0449\u0435 \u0434\u043e\u0431\u0430\u0432\u043b\u044e, \u0447\u0442\u043e \u0432 \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0435 \u044d\u0442\u0438 \u0434\u0432\u0438\u0436\u043a\u0438 \u043e\u0442\u0436\u0438\u0440\u0430\u044e\u0442 \u043b\u0438\u0448\u044c \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u044b\u0439 \u043c\u0438\u043d\u0438\u043c\u0443\u043c GPU RAM \u0438 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u043e (\u0435\u0441\u043b\u0438 \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 TensorRT Context \u0432 \u0432\u0430\u0448\u0435\u043c \u043a\u043e\u0434\u0435 \u0440\u0430\u043d\u0442\u0430\u0439\u043c\u0430). <\/p>\n<h3>\u041a\u043e\u043d\u0442\u0435\u043a\u0441\u0442 \u0437\u0430\u0434\u0430\u0447\u0438<\/h3>\n<p>\u041e\u043a\u0435\u0439, \u0447\u0442\u043e\u0431\u044b \u0431\u044b\u043b\u043e \u043f\u043e\u043d\u044f\u0442\u043d\u0435\u0435, \u043a\u0430\u043a\u0438\u0435 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u0432\u043e\u0437\u043d\u0438\u043a\u043b\u0438, \u043f\u0430\u0440\u0430 \u0441\u043b\u043e\u0432 \u043e \u043d\u0430\u0448\u0435\u043c \u043f\u0440\u043e\u0434\u0443\u043a\u0442\u0435. \u041c\u044b \u043f\u0438\u043b\u0438\u043c <a href=\"https:\/\/trafficdata.ru\/\" rel=\"noopener noreferrer nofollow\">TrafficData <\/a>&#8212; \u041f\u041e \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0442\u0440\u0430\u0444\u0438\u043a\u0430 c \u043a\u0430\u043c\u0435\u0440 \u0438 \u0434\u0440\u043e\u043d\u043e\u0432, \u0432 \u0440\u0438\u043b\u0442\u0430\u0439\u043c\u0435 \u0438 \u043f\u043e\u0441\u0442\u0444\u0430\u043a\u0442\u0443\u043c, \u0432 \u0434\u043e\u0436\u0434\u044c \u0438 \u0441\u043d\u0435\u0433. \u041d\u0430\u043c \u0432\u0430\u0436\u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u043d\u043e\u0447\u044c\u044e \u0434\u0435\u0442\u0435\u043a\u0442\u0438\u043b\u043e\u0441\u044c \u0432\u043e\u0442 \u0442\u0430\u043a:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0418 \u043d\u0435 \u0445\u0443\u0436\u0435.<\/p>\n<p>\u041d\u0430 <a href=\"https:\/\/opentalks.ai\/\" rel=\"noopener noreferrer nofollow\">opentalks.ai2020<\/a> \u043c\u044b \u0440\u0430\u0441\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u043b\u0438, \u043a\u0430\u043a, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f Pruning \u0438 \u0444\u0438\u0437\u0438\u0447\u043d\u043e\u0441\u0442\u044c \u0434\u0430\u043d\u043d\u044b\u0445, \u0443\u0441\u043a\u043e\u0440\u0438\u043b\u0438 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0443 \u0432 4 \u0440\u0430\u0437\u0430 \u0438 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u0432 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438. <a href=\"https:\/\/habr.com\/ru\/post\/482050\/\" rel=\"noopener noreferrer nofollow\">\u0421\u0442\u0430\u0442\u044c\u044e <\/a>\u043f\u0440\u043e Pruning \u044f \u0443\u0436\u0435 \u0432\u044b\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u043b. \u041d\u043e \u0441\u0435\u0433\u043e\u0434\u043d\u044f \u0434\u0430\u0432\u0430\u0439\u0442\u0435 \u043f\u043e\u0433\u043e\u0432\u043e\u0440\u0438\u043c \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u043e \u043f\u0440\u043e low-precision inference.<\/p>\n<h3>\u041a\u0430\u043a \u043c\u044b \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u043b\u0438\u0441\u044c \u0438 \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u043d\u0435\u0436\u043d\u044b\u0435 \u0444\u0438\u0447\u0438<\/h3>\n<p>\u0421\u043a\u0430\u0447\u0438\u0432\u0430\u044f \u043b\u0438\u0431\u044b TensorRT, \u0431\u043e\u043d\u0443\u0441\u043e\u043c \u0432\u044b \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0435 \u043d\u0430\u0431\u043e\u0440 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0441 \u043a\u043e\u0434\u043e\u043c \u0434\u043b\u044f \u0441\u0430\u043c\u044b\u0445 \u0440\u0430\u0437\u043d\u044b\u0445 \u0430\u0440\u0445\u0438\u0442\u0435\u043a\u0442\u0443\u0440 \u0438 \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u0439. \u0414\u043b\u044f \u0431\u0438\u043b\u0434\u0430 \u0434\u0432\u0438\u0436\u043a\u043e\u0432 \u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043b\u0438 \u043f\u0440\u0438\u043c\u0435\u0440 <em>SampleUffSSD (<\/em>UFF &#8212; \u0443\u043d\u0438\u0432\u0435\u0440\u0441\u0430\u043b\u044c\u043d\u044b\u0439 \u0444\u043e\u0440\u043c\u0430\u0442 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u044f \u0441\u0435\u0442\u0438, \u0447\u0435\u0440\u0435\u0437 \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043c\u044b \u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0438\u043b\u0438 \u043d\u0430\u0448\u0438 .pb<em>), <\/em>c\u043b\u0435\u0433\u043a\u0430 \u0435\u0433\u043e \u0437\u0430\u043a\u0430\u0441\u0442\u043e\u043c\u0438\u0432 \u043f\u043e\u0434 \u0432\u0445\u043e\u0434\u043d\u043e\u0439 \u0442\u0435\u043d\u0437\u043e\u0440 \u043e\u0442 YOLO. \u0418 \u0445\u043e\u0442\u044f TensorRT \u043e\u0447\u0435\u043d\u044c \u043c\u043d\u043e\u0433\u043e \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0438 \u0432\u0441\u0451 \u0431\u043e\u043b\u044c\u0448\u0435 \u043d\u043e\u0432\u044b\u0445 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u0445 \u0441\u043b\u043e\u0435\u0432 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442, \u0442\u043e\u0433\u0434\u0430 \u043c\u044b \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u043b\u0438\u0441\u044c \u043d\u0430 \u0432\u0435\u0440\u0441\u0438\u0438, \u0433\u0434\u0435 \u043d\u0435 \u0431\u044b\u043b\u043e \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 ResizeBilinear \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0438 \u0434\u043b\u044f Upsample \u0441\u043b\u043e\u044f. \u0418 \u043c\u044b \u043d\u0430\u043a\u043e\u0441\u0442\u044b\u043b\u0438\u043b\u0438 Conv2DTranspose \u0432\u043c\u0435\u0441\u0442\u043e \u043d\u0435\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u043f\u0438\u0441\u0430\u0442\u044c \u043a\u0430\u0441\u0442\u043e\u043c\u043d\u044b\u0439 \u0441\u043b\u043e\u0439. \u041f\u0435\u0440\u0432\u0430\u044f \u0441\u043a\u043e\u043d\u0432\u0435\u0440\u0447\u0435\u043d\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u0431\u044b\u043b\u0430 \u0440\u0430\u0434\u043e\u0441\u0442\u044c\u044e, \u043a\u0430\u043a \u0438 \u0435\u0451 \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u0440\u0430\u0431\u043e\u0442\u044b. <\/p>\n<p>\u0414\u0430\u0436\u0435 \u0435\u0441\u043b\u0438 \u043f\u0435\u0440\u0435\u0439\u0442\u0438 \u0441 fp32 \u0438\u0437 TF \u0432 fp32 TRT, \u0442\u043e \u0443\u0436\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f \u043d\u0435\u0441\u043b\u0430\u0431\u043e\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 &#8212; \u043d\u0430 15-20%. \u0412 \u043a\u043e\u043d\u0446\u0435 \u043a\u043e\u043d\u0446\u043e\u0432 TRT \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442 \u0438 \u043c\u043d\u043e\u0433\u043e \u0434\u0440\u0443\u0433\u0438\u0445 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0439, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0433\u043e\u0440\u0438\u0437\u043e\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0435, \u0432\u0435\u0440\u0442\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0435 \u0438 \u043b\u044e\u0431\u044b\u0435 \u0434\u0440\u0443\u0433\u0438\u0435 <a href=\"https:\/\/sisyphus.gitbook.io\/project\/deep-learning-basics\/computation-graph-optimization\/tensorrt-computation-graph-optimization\" rel=\"noopener noreferrer nofollow\">LayerFusion<\/a>. <\/p>\n<p>\u0414\u043b\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u043c\u044b \u0437\u0430\u043a\u0430\u0441\u0442\u043e\u043c\u0438\u043b\u0438 \u043f\u0440\u0438\u043c\u0435\u0440 <em>trtExec, <\/em>\u043e\u0431\u0435\u0440\u043d\u0443\u0432 \u0435\u0433\u043e \u0434\u043b\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0432 .NET \u043a\u043e\u0434\u0435. \u041d\u0430 \u0432\u0445\u043e\u0434 &#8212; \u0431\u0430\u0439\u0442\u044b \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f, \u043d\u0430 \u0432\u044b\u0445\u043e\u0434\u0435 &#8212; \u043d\u0435\u0440\u0430\u0441\u043f\u0430\u0440\u0441\u0435\u043d\u043d\u044b\u0435 \u0431\u0430\u0439\u0442\u044b \u0432\u044b\u0445\u043e\u0434\u0430 YOLO. \u0417\u0434\u0435\u0441\u044c \u0430\u043a\u043a\u0443\u0440\u0430\u0442\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0439\u0442\u0435 \u0441 CudaStream \u0438 ExecutionContext. \u0422\u043e\u0433\u0434\u0430 \u043d\u0438 \u043f\u0430\u043c\u044f\u0442\u044c \u043d\u0435 \u0443\u0442\u0435\u0447\u0435\u0442, \u043d\u0438 \u043f\u043e\u0442\u043e\u043a\u0438 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u043d\u0435 \u0437\u0430\u043a\u043e\u0440\u0440\u0430\u043f\u0442\u044f\u0442\u0441\u044f.<\/p>\n<p>\u0418 \u0442\u0430\u043a, \u043c\u044b \u0440\u0435\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u043b\u0438 TensorRT fp16 inference. \u0421\u0431\u0438\u043b\u0434\u0438\u043b\u0438 \u0434\u0432\u0438\u0436\u043a\u0438 \u0434\u043b\u044f \u0440\u0430\u0437\u043d\u044b\u0445 \u043a\u0430\u0440\u0442\u043e\u0447\u0435\u043a. \u041f\u0440\u043e\u0433\u043d\u0430\u043b\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0442\u0435\u0441\u0442\u044b &#8212; \u043a\u043e\u043b\u0435\u0431\u0430\u043d\u0438\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u0432 \u043f\u0440\u0435\u0434\u0435\u043b\u0430\u0445 \u043f\u043e\u0433\u0440\u0435\u0448\u043d\u043e\u0441\u0442\u0438. \u0418 \u0432\u0441\u0451 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043c\u0435\u0441\u044f\u0446\u0435\u0432. \u0410 \u0434\u0430\u043b\u044c\u0448\u0435 &#8212; \u0438\u0441\u0442\u043e\u0440\u0438\u044f.<br \/>10:00. \u0417\u0432\u043e\u043d\u043e\u043a \u043a\u043b\u0438\u0435\u043d\u0442\u0430:<br \/>&#8212; \u0423 \u043d\u0430\u0441 \u0442\u0443\u0442 \u043d\u0430 \u043e\u0434\u043d\u043e\u043c \u0440\u043e\u043b\u0438\u043a\u0435 TrafficData \u043f\u043b\u043e\u0445\u043e \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 &#8212; \u043c\u0430\u0448\u0438\u043d\u043a\u0438 \u0434\u0432\u043e\u044f\u0442\u0441\u044f.<br \/>&#8212; \u041e\u043a\u0435\u0439, \u0441\u043a\u0438\u043d\u044c\u0442\u0435 \u0440\u043e\u043b\u0438\u043a \u0440\u0430\u0437\u0431\u0435\u0440\u0435\u043c\u0441\u044f.<br \/>\u0421\u043c\u043e\u0442\u0440\u0438\u043c \u0440\u043e\u043b\u0438\u043a &#8212; \u0434\u0430, \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0435\u0441\u0442\u044c. \u0420\u043e\u043b\u0438\u043a \u0441 \u0442\u0435\u043d\u044f\u043c\u0438 \u0438 \u043d\u0430 \u043d\u0451\u043c \u0442\u0435\u043d\u0438 \u043e\u0442\u043c\u0435\u0447\u0430\u044e\u0442\u0441\u044f, \u043a\u0430\u043a \u0432\u0442\u043e\u0440\u043e\u0435 \u0430\u0432\u0442\u043e.<\/p>\n<p>13:00. \u0414\u043e\u0431\u0440\u0430\u043b\u0438 \u0438\u0437\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u0432 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442. \u041f\u043e\u0441\u0442\u0430\u0432\u0438\u043b\u0438 \u0434\u043e\u0443\u0447\u0438\u0442\u044c\u0441\u044f \u0441 \u043d\u0438\u0437\u043a\u0438\u043c LR.<\/p>\n<p>16:00. \u0422\u0435\u0441\u0442\u0438\u043c \u043d\u0430 \u0432\u0435\u0440\u0441\u0438\u0438 \u0441 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u043e\u043c \u0432 TensorFlow &#8212; \u0432\u0441\u0451 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e. \u0411\u0438\u043b\u0434\u0438\u043c \u043d\u043e\u0432\u044b\u0439 Engine. \u0422\u0435\u0441\u0442\u0438\u043c \u043d\u0430 \u0432\u0435\u0440\u0441\u0438\u0438 \u0441 \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u043e\u043c \u0432 TensorRT &#8212; \u043e\u043f\u044f\u0442\u044c \u043c\u0430\u0448\u0438\u043d\u044b \u0434\u0432\u043e\u044f\u0442\u0441\u044f:<\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>17:00. \u0418\u0434\u0451\u043c \u0434\u043e\u043c\u043e\u0439.<\/p>\n<p>\u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0435 \u0443\u0442\u0440\u043e \u043d\u0430\u0447\u0430\u043b\u043e\u0441\u044c \u0441 \u043c\u0435\u043c\u0430:<\/p>\n<figure class=\"\"><figcaption><\/figcaption><\/figure>\n<p>\u0421\u0442\u0430\u043b\u043e \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u043e, \u0447\u0442\u043e \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0432 TensorRT, \u0430 \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u043e &#8212; \u0432 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u0438 \u0432\u0435\u0441\u043e\u0432 \u0432\u043e fp16. \u041c\u044b \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043b\u0438 \u0435\u0449\u0435 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0434\u0440\u0443\u0433\u0438\u0445 \u0440\u043e\u043b\u0438\u043a\u043e\u0432 \u0441\u043e \u0441\u043b\u043e\u0436\u043d\u044b\u043c\u0438 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u043c\u0438 \u0438 \u0443\u0432\u0438\u0434\u0435\u043b\u0438, \u0447\u0442\u043e \u043f\u043e\u0441\u043b\u0435 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0432\u043e fp16 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u043f\u043e\u044f\u0432\u0438\u043b\u0438\u0441\u044c \u0438 \u0432 \u0434\u0440\u0443\u0433\u0438\u0445 \u043c\u0435\u0441\u0442\u0430\u0445. \u0421\u0442\u0430\u043b\u0438 \u043f\u043e\u044f\u0432\u043b\u044f\u0442\u044c\u0441\u044f \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0438 \u0434\u0435\u0442\u0435\u043a\u0446\u0438\u0438 \u043d\u0430 \u043d\u043e\u0447\u043d\u044b\u0445 \u0432\u0438\u0434\u0435\u043e, \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u0438\u043b\u0431\u043e\u0440\u0434\u044b \u0441\u0442\u0430\u043b\u0438 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u044f\u0442\u044c\u0441\u044f \u043a\u0430\u043a \u0430\u0432\u0442\u043e. \u041a\u043e\u0440\u043e\u0447\u0435 \u0432\u043e\u0442 \u0442\u0430\u043a \u043c\u044b \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u0438 \u043d\u0435\u0436\u043d\u044b\u0435, \u043d\u043e \u0432\u0430\u0436\u043d\u044b\u0435 \u0444\u0438\u0447\u0438, \u043f\u0440\u043e \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u0430\u044f \u0441\u0435\u0442\u044c \u0432\u043e fp32 \u0437\u043d\u0430\u043b\u0430, \u0430 \u0432\u043e\u0442 \u0432\u043e fp16 \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u0437\u0430\u0431\u044b\u043b\u0430. \u0427\u0442\u043e \u0434\u0435\u043b\u0430\u0442\u044c?<\/p>\n<h3>Quntization Aware Training. \u0423\u0447\u0438 \u043d\u0430 \u0442\u043e\u043c, \u043d\u0430 \u0447\u0435\u043c \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c<\/h3>\n<p>\u041f\u043e\u0434\u0441\u043e\u0437\u043d\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u043c\u044b \u0441\u0440\u0430\u0437\u0443 \u043f\u043e\u043d\u0438\u043c\u0430\u043b\u0438, \u0447\u0442\u043e \u0435\u0441\u043b\u0438 \u043c\u044b \u043e\u0431\u0443\u0447\u0430\u0435\u043c \u043d\u0430 fp32, \u0430 \u043f\u043e\u0442\u043e\u043c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0438\u043c \u043d\u0430 fp16, \u0442\u043e \u0432\u044b\u0439\u0434\u0435\u0442 \u043d\u0435\u043f\u0440\u0438\u044f\u0442\u043d\u0430\u044f \u0432\u0435\u0449\u044c. \u0412\u043e\u0442 \u044d\u0442\u0438 \u0436\u0430\u043b\u043a\u0438\u0435 \u0446\u0438\u0444\u0435\u0440\u043a\u0438 \u0434\u0430\u043b\u0435\u043a\u043e \u043f\u043e\u0441\u043b\u0435 \u0437\u0430\u043f\u044f\u0442\u043e\u0439 \u043f\u043e\u0442\u0435\u0440\u044f\u043d\u044b \u0438 \u0442\u0430\u043a \u0432\u043b\u0438\u044f\u044e\u0442. \u0422\u043e\u0433\u0434\u0430 \u0437\u0430\u0447\u0435\u043c \u043c\u044b \u0438\u0445 \u0443\u0447\u0438\u043b\u0438 \u043d\u0430 \u043a\u0430\u0436\u0434\u043e\u043c \u0431\u0430\u0442\u0447\u0435? \u0418\u0434\u0435\u044f Quntization Aware Training \u043a\u0440\u0430\u0439\u043d\u0435 \u043f\u0440\u043e\u0441\u0442\u0430 &#8212; \u0443\u0447\u0438 \u0438 \u043f\u043e\u043c\u043d\u0438 \u043e \u0442\u043e\u043c \u0442\u0438\u043f\u0435, \u0432 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0435\u0448\u044c \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0438\u0442\u044c. \u0422.\u0435. \u0432 \u0442\u0438\u043f\u0435 fp16 \u0434\u043e\u043b\u0436\u043d\u044b \u0431\u044b\u0442\u044c \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u0432\u0435\u0440\u0442\u043e\u043a, \u0430\u043a\u0442\u0438\u0432\u0430\u0446\u0438\u0439 \u0438 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u043e\u0432. \u041d\u0435 \u0443\u0434\u0438\u0432\u043b\u044f\u0439\u0442\u0435\u0441\u044c, \u0435\u0441\u043b\u0438 \u043f\u0435\u0440\u0432\u044b\u0435 \u0437\u0430\u043f\u0443\u0441\u043a\u0438 \u0432 TensorFlow \u043e\u043a\u0430\u0436\u0443\u0442\u0441\u044f \u0441 NaN-\u043b\u043e\u0441\u0441\u043e\u043c. \u041f\u0440\u043e\u0441\u0442\u043e \u0432\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0438\u043d\u0441\u043f\u0435\u043a\u0442\u0438\u0440\u0443\u0439\u0442\u0435 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u044f\u0449\u0435\u0435. \u041c\u044b \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u043b\u0438 \u043f\u0430\u0440\u0443 \u043d\u0435\u0434\u0435\u043b\u044c, \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u0430\u043b\u0438 \u0432\u0441\u0451 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 fp16 \u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0431\u044b\u043b\u0430 \u0440\u0435\u0448\u0435\u043d\u0430.<\/p>\n<h4>\u041a\u0430\u043a \u0432 Tensorflow 2.0?<\/h4>\n<p>\u0422\u0443\u0442 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043e\u0442\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0435 \u043e \u0442\u043e\u043c, \u043a\u0430\u043a \u043c\u044b \u0431\u044b\u043b\u0438 \u0440\u0430\u0434\u044b \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044e TF2.0. \u0420\u0430\u0431\u043e\u0442\u0430\u044f \u043f\u043e\u0434 TF1.15 \u043c\u044b \u043a\u0443\u0441\u0430\u043b\u0438 \u043b\u043e\u043a\u0442\u0438, \u0437\u0430\u0441\u0442\u0430\u0432\u043b\u044f\u044f \u0437\u0430\u043f\u0443\u0441\u0442\u0438\u0442\u044c\u0441\u044f \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0432\u043e fp16, \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u044b\u0432\u0430\u044f \u0441\u043b\u043e\u0438. \u041d\u043e \u044d\u0442\u043e \u0437\u0430\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u0410 \u043f\u043e\u0442\u043e\u043c \u043f\u0440\u0438\u0448\u0435\u043b TF2.0 &#8212; \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0448\u044c <em>tf.train.experimental.enable_mixed_precision_graph_rewrite<\/em> \u043d\u0430\u0434 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u043e\u043c \u0438 \u0432\u0441\u0451 \u0437\u0430\u0432\u043e\u0434\u0438\u0442\u0441\u044f, \u043a\u0430\u043a \u043c\u043e\u044f Lada Granta. \u041d\u043e \u0432\u0441\u0451 \u0436\u0435 \u0441\u0442\u043e\u0438\u0442 \u043e\u0431\u0440\u0430\u0442\u0438\u0442\u044c \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u0435 \u043d\u0430 <a href=\"https:\/\/www.tensorflow.org\/api_docs\/python\/tf\/train\/experimental\/enable_mixed_precision_graph_rewrite\" rel=\"noopener noreferrer nofollow\">whitelist<\/a> &#8212; \u043d\u0435 \u0432\u0441\u0435 \u043d\u043e\u0434\u044b \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0432\u043e fp16. \u0427\u0430\u0441\u0442\u044c \u0441\u0442\u043e\u0438\u0442 \u043f\u043e\u043f\u0440\u0430\u0432\u0438\u0442\u044c \u0440\u0443\u043a\u0430\u043c\u0438. \u041d\u0443 \u0438 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0431\u043e\u043d\u0443\u0441 &#8212; \u043e\u0433\u0440\u043e\u043c\u043d\u0430\u044f \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u044f \u043f\u0430\u043c\u044f\u0442\u0438, \u043a\u043e\u0442\u043e\u0440\u043e\u0439 \u043d\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u043b\u043e\u0441\u044c \u0432 TF1.15. \u0411\u0430\u0442\u0447-\u0441\u0430\u0439\u0437 \u0434\u043b\u044f \u043d\u0430\u0448\u0435\u0439 \u043a\u0430\u0441\u0442\u043e\u043c\u043d\u043e\u0439 YOLOv4.5 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u043b\u0441\u044f \u0432 2 \u0440\u0430\u0437\u0430 &#8212; \u0441 4 \u0434\u043e 8. \u0411\u043e\u043b\u044c\u0448\u0435 \u0431\u0430\u0442\u0447 &#8212; \u043b\u0443\u0447\u0448\u0435 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b.<\/p>\n<h3>\u0412\u044b\u0432\u043e\u0434\u044b<\/h3>\n<p>Fp16 inference &#8212; \u044d\u0442\u043e \u0437\u0434\u043e\u0440\u043e\u0432\u043e. \u0422\u043e\u043b\u044c\u043a\u043e \u043d\u0435 \u0441\u0442\u043e\u0438\u0442 \u0437\u0430\u0431\u044b\u0432\u0430\u0442\u044c \u043f\u0440\u043e Quntization Aware Training, \u0435\u0441\u043b\u0438 \u0432\u044b \u0445\u043e\u0442\u0438\u0442\u0435 \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438. \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b\u043e \u043d\u0430\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0435\u0449\u0435 \u0448\u0430\u0433 \u0432 \u0441\u0442\u043e\u0440\u043e\u043d\u0443 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438 \u043d\u0430\u0448\u0438\u0445 \u0438 \u043a\u043b\u0438\u0435\u043d\u0442\u0441\u043a\u0438\u0445 \u043c\u043e\u0449\u043d\u043e\u0441\u0442\u0435\u0439: <\/p>\n<figure class=\"full-width\"><figcaption><\/figcaption><\/figure>\n<p>\u0427\u0442\u043e \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0432\u0430\u0436\u043d\u043e \u0432 \u0433\u043e\u0434\u044b \u0434\u0435\u0444\u0438\u0446\u0438\u0442\u0430 \u0447\u0438\u043f\u043e\u0432 \u0438 \u0434\u043e\u0440\u043e\u0433\u0438\u0445 GPU. \u042f \u0432\u0441\u0451 \u0436\u0435 \u0437\u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 GPU \u0432 \u0442\u0435\u0445 \u043c\u0435\u0441\u0442\u0430\u0445, \u0433\u0434\u0435 \u043e\u043d\u0438 \u043f\u0440\u0438\u043d\u043e\u0441\u044f\u0442 \u043f\u043e\u043b\u044c\u0437\u0443 \u043b\u044e\u0434\u044f\u043c, \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0437\u0438\u0440\u0443\u044f \u0447\u0442\u043e-\u0442\u043e. \u0410 \u043d\u0435 \u0442\u0430\u043c, \u0433\u0434\u0435 \u043e\u043d\u0438 \u043f\u0440\u0438\u043d\u043e\u0441\u044f\u0442 \u043f\u0440\u0438\u0431\u044b\u043b\u044c, \u0434\u0435\u043b\u0430\u044f \u0434\u0435\u043d\u044c\u0433\u0438 \u0438\u0437 \u043f\u043e\u0434\u043e\u0433\u0440\u0435\u0442\u043e\u0433\u043e \u0432\u043e\u0437\u0434\u0443\u0445\u0430. <\/p>\n<p>\u0410 \u0432\u043e\u043e\u0431\u0449\u0435 \u0432\u0441\u044f \u0442\u0435\u043c\u0430\u0442\u0438\u043a\u0430 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0441\u0435\u0442\u0435\u0439 \u0441\u0435\u0433\u043e\u0434\u043d\u044f &#8212; \u043e\u0447\u0435\u043d\u044c \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0435 \u043f\u043e\u043b\u0435 \u0434\u043b\u044f \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u043e\u0432. \u0425\u043e\u0447\u0435\u0442\u0441\u044f \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u0434\u0435\u0441\u044f\u0442\u043a\u0438 \u043d\u043e\u0432\u044b\u0445 \u0441\u043f\u043e\u0441\u043e\u0431\u043e\u0432 Pruning, Distillation \u0438\u043b\u0438 \u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u0438\u044f \u0432 int4, \u043d\u043e \u0432\u0441\u0435\u0445 \u0411\u0430\u043a\u0441\u043e\u0432 \u0411\u0430\u043d\u043d\u0438 \u043d\u0435 \u0434\u043e\u0433\u043e\u043d\u0438\u0448\u044c. \u041f\u0440\u043e\u0431\u0443\u0439\u0442\u0435 \u043d\u043e\u0432\u043e\u0435, \u043d\u043e \u043d\u0435 \u0437\u0430\u0431\u044b\u0432\u0430\u0439\u0442\u0435 \u043e\u0442\u0434\u044b\u0445\u0430\u0442\u044c.<\/p>\n<p><strong>UPD: \u041e\u0442\u0432\u0435\u0447\u0430\u044f \u043d\u0430 \u0432\u043e\u043f\u0440\u043e\u0441 DistortNeo \u043f\u0440\u043e \u0440\u0435\u0430\u043b\u044c\u043d\u0443\u044e \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u0443\u044e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435.<br \/><\/strong>\u0412 \u0442\u0435\u043e\u0440\u0438\u0438 TensorRT, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f tensor cores, \u043c\u043e\u0436\u0435\u0442 \u0434\u0430\u0442\u044c \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u0435 \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u043e\u0431\u0449\u0435\u0439 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u0434\u043e 6 \u0440\u0430\u0437. \u0422\u043e \u0435\u0441\u0442\u044c \u0432\u0430\u0436\u043d\u043e \u0433\u043e\u0432\u043e\u0440\u0438\u0442\u044c \u043a\u0430\u043a \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 \u0434\u043b\u044f 1 \u043f\u043e\u0442\u043e\u043a\u0430 \u0432 2 \u0440\u0430\u0437\u0430 \u0437\u0430 \u0441\u0447\u0435\u0442 fp16 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439, \u0442\u0430\u043a \u0438 \u043f\u0440\u043e \u0443\u0432\u0435\u043b\u0438\u0447\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043d\u043e\u0439 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043f\u0430\u043c\u044f\u0442\u0438 \u0438 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0432 tensor cores. \u0427\u0442\u043e \u0436\u0435 \u043d\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435?<br \/>\u041d\u0430\u0448 \u043e\u043f\u044b\u0442 \u0442\u0430\u043a\u043e\u0439 \u2014 \u043f\u0440\u0438 \u0440\u0430\u0431\u043e\u0442\u0435 \u0432 1 \u043f\u043e\u0442\u043e\u043a\u0435 \u043c\u044b \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u0443\u0441\u043a\u043e\u0440\u0435\u043d\u0438\u0435 2\u0445. \u041e\u0434\u043d\u0430\u043a\u043e, \u0435\u0441\u043b\u0438 \u0433\u043e\u0432\u043e\u0440\u0438\u0442\u044c \u043f\u0440\u043e \u043c\u043d\u043e\u0433\u043e\u043f\u043e\u0442\u043e\u0447\u043d\u0443\u044e \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0443, \u0442\u043e \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u044f \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u0435\u0435. \u0412\u043e fp32 \u043d\u0430 TF \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u043e\u0431\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0442\u044c \u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u043e 2.5 \u043f\u043e\u0442\u043e\u043a\u0430 \u0432\u0438\u0434\u0435\u043e 30 fps, \u0442.\u0435.<\/br><\/strong><\/p>\n<p><\/br><\/br><\/br><\/p>\n<\/p>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-323565","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/323565","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=323565"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/323565\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=323565"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=323565"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=323565"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}