{"id":316012,"date":"2021-01-06T09:00:52","date_gmt":"2021-01-06T09:00:52","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=316012"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=316012","title":{"rendered":"\u00ab\u0412\u0441\u043f\u043e\u043c\u043d\u0438\u0442\u044c \u0432\u0441\u0435\u00bb \u0438\u043b\u0438 \u0440\u0435\u0448\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u043a\u0430\u0442\u0430\u0441\u0442\u0440\u043e\u0444\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0437\u0430\u0431\u044b\u0432\u0447\u0438\u0432\u043e\u0441\u0442\u0438 \u0434\u043b\u044f \u0447\u0430\u0439\u043d\u0438\u043a\u043e\u0432"},"content":{"rendered":"\n<div class=\"post__text post__text_v2\" id=\"post-content-body\">\n<p>\u042d\u0442\u0430 \u043c\u043e\u044f \u0441\u0442\u0430\u0442\u044c\u044f \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u0441\u0432\u044f\u0449\u0435\u043d\u0430 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0435 \u043a\u0430\u0442\u0430\u0441\u0442\u0440\u043e\u0444\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0437\u0430\u0431\u044b\u0432\u0447\u0438\u0432\u043e\u0441\u0442\u0438 \u0438 \u043d\u043e\u0432\u0435\u0439\u0448\u0438\u043c \u043c\u0435\u0442\u043e\u0434\u0430\u043c \u0435\u0435 \u0440\u0435\u0448\u0435\u043d\u0438\u044f. \u0411\u0443\u0434\u0443\u0442 \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u044b \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u044d\u0442\u0438\u0445 \u043c\u0435\u0442\u043e\u0434\u043e\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043b\u0435\u0433\u043a\u043e \u0430\u0434\u0430\u043f\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043f\u043e\u0434 \u043f\u043e\u0447\u0442\u0438 \u043b\u044e\u0431\u0443\u044e \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u044e \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u0438.<\/p>\n<p> \u0421\u043d\u0430\u0447\u0430\u043b\u0430 \u043d\u0430\u043f\u043e\u043c\u043d\u0438\u043c, \u0447\u0442\u043e \u044d\u0442\u043e, \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e, \u0437\u0430 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430. \u0415\u0441\u043b\u0438 \u0432\u0434\u0440\u0443\u0433 \u0442\u0430\u043a \u043e\u043a\u0430\u0437\u0430\u043b\u043e\u0441\u044c, \u0447\u0442\u043e \u0432\u0430\u043c \u043d\u0443\u0436\u043d\u043e \u043e\u0431\u0443\u0447\u0430\u0442\u044c \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0443\u044e \u0441\u0435\u0442\u043a\u0443 \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u043d\u0430 \u043e\u0434\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435, \u0430 \u0437\u0430\u0442\u0435\u043c \u043d\u0430 \u0434\u0440\u0443\u0433\u043e\u043c, \u0442\u043e \u0432\u044b \u043e\u0431\u043d\u0430\u0440\u0443\u0436\u0438\u0442\u0435, \u0447\u0442\u043e \u043f\u043e \u043c\u0435\u0440\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u0432\u0442\u043e\u0440\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0441\u0435\u0442\u043a\u0430 \u0431\u044b\u0441\u0442\u0440\u043e \u0437\u0430\u0431\u044b\u0432\u0430\u0435\u0442 \u043f\u0435\u0440\u0432\u044b\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u0442\u043e \u0435\u0441\u0442\u044c \u0442\u0435\u0440\u044f\u0435\u0442 \u043d\u0430\u0432\u044b\u043a, \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0439 \u043f\u0440\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u043d\u0430 \u043d\u0435\u043c. \u0418\u043b\u0438 \u0436\u0435 \u0435\u0441\u043b\u0438 \u0432\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0435 transfer learning \u0438 \u0434\u043e\u0443\u0447\u0438\u0432\u0430\u0435\u0442\u0435 \u0433\u043e\u0442\u043e\u0432\u0443\u044e \u0441\u0435\u0442\u043a\u0443 \u043d\u0430 \u0441\u0432\u043e\u0438\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u0430\u0445, \u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0430\u0431\u043b\u044e\u0434\u0430\u0442\u044c\u0441\u044f \u0442\u043e\u0442 \u0436\u0435 \u044d\u0444\u0444\u0435\u043a\u0442 \u2013 \u0441\u0435\u0442\u043a\u0430 \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u0434\u043e\u0443\u0447\u0438\u0442\u0441\u044f \u043d\u0430 \u0432\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u043d\u043e \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0443\u0442\u0435\u0440\u044f\u0435\u0442 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u0435 \u043d\u0430\u0432\u044b\u043a\u0438, \u0442\u043e \u0435\u0441\u0442\u044c \u0442\u043e, \u0440\u0430\u0434\u0438 \u0447\u0435\u0433\u043e \u0432\u0435\u0441\u044c transfer learning \u0438 \u0437\u0430\u0442\u0435\u0432\u0430\u043b\u0441\u044f. \u0415\u0441\u043b\u0438 \u0432\u0434\u0440\u0443\u0433 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043d\u0430\u0434\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0443\u0447\u0438\u0442\u044c\u0441\u044f, \u043d\u0435 \u0434\u0432\u0430 \u0430, \u043a \u043f\u0440\u0438\u043c\u0435\u0440\u0443, \u043f\u044f\u0442\u044c, \u0442\u043e \u043a \u043a\u043e\u043d\u0446\u0443 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u043f\u044f\u0442\u043e\u043c \u0441\u0435\u0442\u043a\u0430 \u0437\u0430\u0431\u0443\u0434\u0435\u0442 \u043f\u0435\u0440\u0432\u044b\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e. <\/p>\n<p>\u0421 \u044d\u0442\u043e\u0439 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u043e\u0439 \u043c\u044b \u0438\u043c\u0435\u0435\u043c \u0434\u0435\u043b\u043e \u0441 \u0441\u0435\u0440\u0435\u0434\u0438\u043d\u044b \u043f\u0440\u043e\u0448\u043b\u043e\u0433\u043e \u0432\u0435\u043a\u0430, \u0442\u043e \u0435\u0441\u0442\u044c \u0441 \u043c\u043e\u043c\u0435\u043d\u0442\u0430, \u043a\u043e\u0433\u0434\u0430 \u043d\u0430\u0447\u0430\u043b\u0438 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u044c\u0441\u044f \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u044b \u043f\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044e \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439. \u0417\u0430 \u043f\u0440\u043e\u0448\u0435\u0434\u0448\u0435\u0435 \u0432\u0440\u0435\u043c\u044f \u043e\u0431 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0443 \u043e\u0431\u043b\u043e\u043c\u0430\u043b\u0438 \u043d\u0435\u043c\u0430\u043b\u043e \u0437\u0443\u0431\u043e\u0432, \u0438 \u043e\u043d\u0430 \u0443\u0441\u043f\u0435\u043b\u0430 \u0432\u043f\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0432 \u043a\u043e\u043b\u043b\u0435\u043a\u0442\u0438\u0432\u043d\u043e\u0435 \u0431\u0435\u0441\u0441\u043e\u0437\u043d\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043a\u0430\u043a \u043d\u0435\u0447\u0442\u043e \u0442\u0440\u0443\u0434\u043d\u043e\u0440\u0430\u0437\u0440\u0435\u0448\u0438\u043c\u043e\u0435, \u0441 \u0447\u0435\u043c \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u043c\u0438\u0440\u0438\u0442\u044c\u0441\u044f \u0438\u043b\u0438 \u043f\u0440\u0438\u0434\u0443\u043c\u044b\u0432\u0430\u0442\u044c \u0440\u0430\u0437\u043d\u044b\u0435 \u0442\u0440\u044e\u043a\u0438 \u0434\u043b\u044f \u0442\u043e\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u0445\u043e\u0442\u044c \u043a\u0430\u043a-\u0442\u043e \u0441\u043d\u0438\u0437\u0438\u0442\u044c \u0435\u0435 \u043d\u0435\u0433\u0430\u0442\u0438\u0432\u043d\u043e\u0435 \u0432\u043b\u0438\u044f\u043d\u0438\u0435.<\/p>\n<p> \u041e\u0434\u043d\u0430\u043a\u043e \u0447\u0435\u0442\u044b\u0440\u0435 \u0433\u043e\u0434\u0430 \u043d\u0430\u0437\u0430\u0434 \u0433\u0440\u0443\u043f\u043f\u043e\u0439 \u00ab\u0431\u0440\u0438\u0442\u0430\u043d\u0441\u043a\u0438\u0445 \u0443\u0447\u0435\u043d\u044b\u0445\u00bb (\u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u044d\u0442\u043e \u0431\u044b\u043b\u0438 \u043f\u0430\u0440\u043d\u0438 \u0438\u0437 \u0431\u0440\u0438\u0442\u0430\u043d\u0441\u043a\u043e\u0433\u043e \u043e\u0442\u0434\u0435\u043b\u0435\u043d\u0438\u044f DeepMind) \u0431\u044b\u043b \u0441\u0434\u0435\u043b\u0430\u043d \u0437\u043d\u0430\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043f\u0440\u043e\u0440\u044b\u0432 \u2013 \u043e\u043d\u0438 \u043f\u0440\u0438\u0434\u0443\u043c\u0430\u043b\u0438 \u043c\u0435\u0442\u043e\u0434 \u044d\u043b\u0430\u0441\u0442\u0438\u0447\u043d\u043e\u0433\u043e \u0437\u0430\u043a\u0440\u0435\u043f\u043b\u0435\u043d\u0438\u044f \u0432\u0435\u0441\u043e\u0432 (<a href=\"https:\/\/www.pnas.org\/content\/114\/13\/3521\" rel=\"noopener noreferrer nofollow\"><abbr title=\"Elastic Weight Consolidation\">EWC<\/abbr><\/a>). \u0415\u0441\u043b\u0438 \u043e\u0431\u044a\u044f\u0441\u043d\u044f\u0442\u044c \u043d\u0430 \u043f\u0430\u043b\u044c\u0446\u0430\u0445, \u0442\u043e \u0435\u0433\u043e \u0441\u0443\u0442\u044c \u0432 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u043c. \u0415\u0441\u043b\u0438 \u043d\u0430\u0432\u044b\u043a \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u043a\u0438 \u0437\u0430\u043a\u043b\u044e\u0447\u0435\u043d \u0432 \u0432\u0435\u0441\u0430\u0445 \u0435\u0435 \u0441\u0432\u044f\u0437\u0435\u0439 (\u0438 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0441\u0432\u044f\u0437\u0435\u0439, \u0430 \u0432\u043e\u043e\u0431\u0449\u0435 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432), \u0442\u043e \u00ab\u043d\u0435 \u0432\u0441\u0435 \u043e\u043d\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u044b\u00bb. \u0422\u043e \u0435\u0441\u0442\u044c \u043a\u0430\u043a\u0438\u0435-\u0442\u043e \u0441\u0432\u044f\u0437\u0438 \u0431\u043e\u043b\u0435\u0435 \u0432\u0430\u0436\u043d\u044b \u0434\u043b\u044f \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u043e\u0433\u043e \u043d\u0430\u0432\u044b\u043a\u0430, \u043a\u0430\u043a\u0438\u0435-\u0442\u043e \u043c\u0435\u043d\u0435\u0435. \u0418\u0434\u0435\u044f \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e\u0431\u044b, \u043a\u043e\u0433\u0434\u0430 \u0441\u0435\u0442\u043a\u0430 \u0443\u0436\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0430 \u043d\u0430\u0432\u044b\u043a\u0443 (\u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443), \u043f\u0440\u0438 \u0434\u0430\u043b\u044c\u043d\u0435\u0439\u0448\u0435\u043c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u0434\u0440\u0443\u0433\u0438\u043c \u043d\u0430\u0432\u044b\u043a\u0430\u043c \u043d\u0435 \u0434\u0430\u0432\u0430\u0442\u044c \u0432\u0430\u0436\u043d\u044b\u043c \u0432\u0435\u0441\u0430\u043c \u0443\u0445\u043e\u0434\u0438\u0442\u044c \u0434\u0430\u043b\u0435\u043a\u043e \u043e\u0442 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439, \u0442\u043e \u0435\u0441\u0442\u044c \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u0435\u0440\u0432\u043e\u043c\u0443 \u043d\u0430\u0432\u044b\u043a\u0443. \u0420\u0435\u0430\u043b\u0438\u0437\u0443\u0435\u0442\u0441\u044f \u044d\u0442\u043e \u0434\u043e\u0431\u0430\u0432\u043b\u0435\u043d\u0438\u0435\u043c \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u043e\u0433\u043e-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u0430 \u0432 \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438, \u0442\u0430\u043a \u0447\u0442\u043e \u043f\u0440\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440 \u0442\u044f\u043d\u0435\u0442 \u0435\u0433\u043e \u043d\u0430\u0437\u0430\u0434, \u0432 \u0441\u0442\u043e\u0440\u043e\u043d\u0443, \u043f\u0440\u043e\u0442\u0438\u0432\u043e\u043f\u043e\u043b\u043e\u0436\u043d\u0443\u044e \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044e. \u0418 \u0447\u0435\u043c \u00ab\u0432\u0430\u0436\u043d\u0435\u0435\u00bb \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440, \u0442\u0435\u043c \u0441\u0438\u043b\u044c\u043d\u0435\u0435 \u0435\u0433\u043e \u0442\u044f\u043d\u0435\u0442 \u043e\u0431\u0440\u0430\u0442\u043d\u043e. \u041f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043a\u0430\u043a \u0431\u0443\u0434\u0442\u043e \u043f\u0440\u0438\u0432\u044f\u0437\u0430\u043d\u044b \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c \u0440\u0435\u0437\u0438\u043d\u043a\u0430\u043c\u0438 \u0440\u0430\u0437\u043d\u043e\u0439 \u0443\u043f\u0440\u0443\u0433\u043e\u0441\u0442\u0438. <\/p>\n<p> \u0412\u0441\u0435 \u044d\u0442\u043e \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u043f\u0440\u043e\u0441\u0442\u043e \u0438 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e, \u043e\u0434\u043d\u0430\u043a\u043e \u043e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u2013 \u043a\u0430\u043a \u043f\u043e\u043d\u044f\u0442\u044c, \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043a\u0430\u0436\u0434\u044b\u0439 \u0432\u0435\u0441 \u0438\u043b\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440 \u0441\u0435\u0442\u0438 \u0432\u0430\u0436\u0435\u043d \u0438\u043b\u0438 \u043d\u0430\u043e\u0431\u043e\u0440\u043e\u0442 \u2013 \u043d\u0435 \u0432\u0430\u0436\u0435\u043d. \u0422\u0443\u0442 \u00ab\u0431\u0440\u0438\u0442\u0430\u043d\u0441\u043a\u0438\u0435 \u0443\u0447\u0435\u043d\u044b\u0435\u00bb \u0442\u043e\u0436\u0435 \u043d\u0435 \u043e\u043f\u043b\u043e\u0448\u0430\u043b\u0438 \u0438 \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0438\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u00ab\u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438\u00bb \u0432\u0435\u0441\u043e\u0432 \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u044b \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0424\u0438\u0448\u0435\u0440\u0430. \u0418 \u044d\u0442\u043e \u043e\u0442\u043b\u0438\u0447\u043d\u043e \u0441\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e! \u0422\u043e \u0435\u0441\u0442\u044c, \u0435\u0441\u043b\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u043f\u0435\u0440\u0432\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0442\u0430\u043a\u0438\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u043e\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432, \u0430 \u043f\u043e\u0442\u043e\u043c, \u043f\u0440\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u043d\u0430 \u0432\u0442\u043e\u0440\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435, \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440 \u0432 \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438, \u0442\u043e \u0441\u0435\u0442\u043a\u0430 \u043d\u0430\u0443\u0447\u0438\u0442\u0441\u044f \u0432\u0442\u043e\u0440\u043e\u043c\u0443 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u0432 \u043d\u0430\u0432\u044b\u043a\u0430 \u043f\u0435\u0440\u0432\u043e\u0433\u043e. \u041d\u0443 \u043f\u043e\u0447\u0442\u0438 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u0432. \u0418 \u0442\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043c\u043e\u0436\u043d\u043e \u0434\u043e\u043e\u0431\u0443\u0447\u0438\u0442\u044c \u0441\u0435\u0442\u043a\u0443 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0445\u043e\u0442\u044c \u043d\u0430 \u0434\u0435\u0441\u044f\u0442\u043a\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044f \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0435 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b. \u0418 \u0432\u0441\u0435 \u043d\u0430\u0432\u044b\u043a\u0438 \u0431\u0443\u0434\u0443\u0442 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0442\u044c\u0441\u044f \u043f\u043e\u043a\u0430 \u0431\u0443\u0434\u0435\u0442 \u0445\u0432\u0430\u0442\u0430\u0442\u044c \u0435\u043c\u043a\u043e\u0441\u0442\u0438 \u0441\u0435\u0442\u043a\u0438. <\/p>\n<p> \u041a \u0441\u0447\u0430\u0441\u0442\u044c\u044e, \u043f\u043e\u0442\u043e\u043c \u0435\u0449\u0435 \u043e\u0434\u0438\u043d \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a <a href=\"https:\/\/www.pnas.org\/content\/115\/11\/E2496\" rel=\"noopener noreferrer nofollow\">\u0434\u043e\u043a\u0430\u0437\u0430\u043b<\/a>, \u0447\u0442\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u0435\u0435 \u043d\u0435 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0442\u044c, \u0430 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u0441\u0443\u043c\u043c\u0438\u0440\u043e\u0432\u0430\u0442\u044c, \u0447\u0442\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043f\u0440\u043e\u0449\u0435. \u041a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e, \u0443 \u043c\u0435\u0442\u043e\u0434\u0430 \u0432\u0441\u0435 \u0436\u0435 \u0435\u0441\u0442\u044c \u043f\u0430\u0440\u0430 \u043d\u0435\u0434\u043e\u0441\u0442\u0430\u0442\u043a\u043e\u0432: \u0447\u0442\u043e\u0431 \u0432\u0441\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e, \u0432\u044b\u0445\u043e\u0434 \u0441\u0435\u0442\u0438 \u0434\u043e\u043b\u0436\u0435\u043d \u0431\u044b\u0442\u044c \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u043d\u044b\u043c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435\u043c (\u0442\u043e \u0435\u0441\u0442\u044c softmax), \u0438 \u0438\u0437 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043d\u0443\u0436\u043d\u043e \u0441\u044d\u043c\u043f\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c, \u0430 \u043f\u043e\u0442\u043e\u043c \u0438 \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0434\u043b\u044f \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u0438 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0424\u0438\u0448\u0435\u0440\u0430 \u0438 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0435\u0433\u043e \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. \u0425\u043e\u0440\u043e\u0448\u0430\u044f \u043d\u043e\u0432\u043e\u0441\u0442\u044c \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e tensorflow \u0438\u043b\u0438 torch \u0432\u0441\u0435 \u0441\u0434\u0435\u043b\u0430\u0435\u0442 \u0437\u0430 \u0432\u0430\u0441, \u043f\u043b\u043e\u0445\u0430\u044f \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u0442\u044c \u043f\u0440\u0438\u0434\u0435\u0442\u0441\u044f \u043c\u043d\u043e\u0433\u043e.<\/p>\n<\/p>\n<p>\u0414\u0430\u043b\u0435\u0435 \u043f\u0440\u0438\u0432\u043e\u0436\u0443 \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 EWC \u0434\u043b\u044f \u0433\u043b\u0443\u0431\u043e\u043a\u043e\u0439 \u0441\u0435\u0442\u043a\u0438 \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u0445 \u0441\u043b\u043e\u0435\u0432. \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0441\u0435\u0442\u043a\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u0441\u044f \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c: \u0431\u0435\u0440\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043e\u0442\u043a\u0440\u044b\u0432\u0430\u0435\u043c \u0443\u0440\u043e\u043a \u0434\u043b\u044f \u0441\u0435\u0442\u043a\u0438, \u0443\u0447\u0438\u043c \u0435\u0435, \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u0435\u043c \u0443\u0440\u043e\u043a, \u0441\u0447\u0438\u0442\u0430\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0442\u0435\u043a\u0443\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0438, \u0441\u0443\u043c\u043c\u0438\u0440\u0443\u044f \u0441 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u043c\u0438 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c\u0438 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438, \u043f\u043e\u0432\u0442\u043e\u0440\u044f\u0435\u043c \u0432\u0441\u0435 \u0434\u043b\u044f \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. <\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 EWC \u0442\u0443\u0442.<\/summary>\n<div class=\"spoiler__content\">\n<pre><code># \u043a\u043e\u0434 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d \u043d\u0430 python 3.7 \u0438 tensorflow 1.15.0  import datetime from copy import deepcopy  import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data   def _weight_variable(shape):     # \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u041a\u0430\u0439\u043c\u0438\u043d\u0443 \u0413\u0435 (\u0425\u0435)     stddev = 2. \/ np.sqrt(shape[0])     initial = tf.random.truncated_normal(shape=shape, mean=0.0, stddev=stddev)     return tf.Variable(initial, dtype=tf.float32)   def _bias_variable(shape):     # \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043d\u0443\u043b\u044f\u043c\u0438     initial = tf.constant(0.0, shape=shape)     return tf.Variable(initial, dtype=tf.float32)   class Model:     def __init__(self, shape, session):         \"\"\"         :param shape:   \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438 - \u0441\u043f\u0438\u0441\u043e\u043a \u0438\u0437 \u0447\u0438\u0441\u0435\u043b \u043d\u0435\u0439\u0440\u043e\u043d\u043e\u0432 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u043b\u043e\u0435 \u0441\u0435\u0442\u0438                         \u043e\u0442 \u0432\u0445\u043e\u0434\u0430 \u043a \u0432\u044b\u0445\u043e\u0434\u0443 \u0441\u043f\u0440\u0430\u0432\u0430 \u043d\u0430\u043b\u0435\u0432\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, [784, 100, 10]         :param session: tensorflow-\u0441\u0435\u0441\u0441\u0438\u044f \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u0432 \u0441\u0435\u0442\u0438         \"\"\"          self.session = session         self._shape = shape         depth = len(shape) - 1         if depth &lt; 1:             raise ValueError(\"\u041d\u0435\u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438!\")          # \u0437\u0430\u0433\u043b\u0443\u0448\u043a\u0438 \u0434\u043b\u044f \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445         self.x = tf.placeholder(tf.float32, shape=[None, shape[0]])         self.labels = tf.placeholder(tf.float32, shape=[None, shape[-1]])          # \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u043b\u043e\u0435\u0432 \u0441\u0435\u0442\u0438 \u0431\u0443\u0434\u0435\u043c \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0432 \u0441\u043f\u0438\u0441\u043a\u0435         self.var_list = []         for ins, outs in zip(shape[:-1], shape[1:]):             self.var_list.append(_weight_variable([ins, outs]))             self.var_list.append(_bias_variable([outs]))          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438         for v in self.var_list:             session.run(v.initializer)          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438         self.wb_importance = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u0442\u0440\u043e\u0438\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444         x, y, z = self.x, None, None         for i in range(depth):             z = tf.matmul(x, self.var_list[i * 2]) + self.var_list[i * 2 + 1]             y = tf.nn.softmax(z) if i == depth-1 else tf.nn.leaky_relu(z)             x = y          # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438         self.loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=self.labels))          # \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c (accuracy)         self.correct_preds = tf.equal(tf.argmax(z, axis=1), tf.argmax(self.labels, axis=1))         self.accuracy = tf.reduce_mean(tf.cast(self.correct_preds, tf.float32))          # \u0441\u044d\u043c\u043f\u043b\u0438\u0440\u0443\u0435\u043c \u0438\u0437 \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0435\u0442\u0438 \u043a\u0430\u043a \u0438\u0437 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f         class_ind = tf.cast(tf.random.categorical(tf.math.log(y), 1)[0][0], tf.int32)         # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u0438         self.prob_grads = tf.gradients(tf.math.log(y[0, class_ind]), self.var_list)          self.train_step = None      def open_lesson(self, learning_rate=1.0, lmbda=0.0):         \"\"\"         \u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         :param learning_rate: \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f SGD         :param lmbda:         \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 - \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e                               \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0442\u044f\u043d\u0443\u0442 \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c         \"\"\"         loss = self.loss          if hasattr(self, \"star_vars\") and lmbda != 0:             # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u043a \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u044b\u0435-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b             for v in range(len(self._shape)*2-2):                 loss += tf.reduce_sum(tf.multiply(                     tf.constant(lmbda \/ 2. * self.wb_importance[v], tf.float32),                     tf.square(self.var_list[v] - tf.constant(self.star_vars[v], tf.float32))                 ))         # \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0448\u0430\u0433 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u0430         self.train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)      def close_lesson(self, closing_set=None):         \"\"\"         \u0417\u0430\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435. \u0420\u0430\u0441\u0447\u0435\u0442 \u0438 \u043d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432.         :param closing_set: \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u044b \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         :return:         \"\"\"          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043d\u0430 \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         addendum = self._compute_fisher(closing_set)         # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043a \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u043d\u044b\u043c         for i, a in zip(self.wb_importance, addendum):             i += a         # \u0437\u0430\u043f\u043e\u043c\u0438\u043d\u0430\u0435\u043c \u0442\u0435\u043a\u0443\u0449\u0438\u0435 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0435 \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         self._store_weights_and_biases()      def _store_weights_and_biases(self):         self.star_vars = [v.eval() for v in self.var_list]      def _compute_fisher(self, closing_set):         # \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0435 \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0445 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439         # \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0424\u0438\u0448\u0435\u0440\u0430 \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438 \u043d\u0430 \u0437\u0430\u0434\u0430\u043d\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         num_samples = len(closing_set)          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043d\u0443\u043b\u044f\u043c\u0438         fisher = [np.zeros(self.var_list[v].shape, dtype=np.float32) for v in range(len(self.var_list))]          for i in range(num_samples):             # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u043f\u0435\u0440\u0432\u044b\u0435 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u044b\u0435 \u043b\u043e\u0433\u0430\u0440\u0438\u0444\u043c\u0430 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u0438             feed_dict = {self.x: closing_set[i:i+1]}             derivatives = self.session.run(self.prob_grads, feed_dict=feed_dict)             # \u0432\u043e\u0437\u0432\u043e\u0434\u0438\u043c \u0438\u0445 \u0432 \u043a\u0432\u0430\u0434\u0440\u0430\u0442 \u0442. \u043a. \u044d\u0442\u043e \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u044b             for f, d in zip(fisher, derivatives):                 f += np.square(d)          # \u0443\u0441\u0440\u0435\u0434\u043d\u044f\u0435\u043c \u043f\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0443 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435.         # \u0442\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u0440\u0438\u043c\u0435\u043d\u0438\u043c \u0435\u0441\u043b\u0438 \u043c\u044b \u0445\u043e\u0442\u0438\u043c \u0447\u0442\u043e\u0431 \u043a\u0430\u0436\u0434\u044b\u0439 \u0443\u0440\u043e\u043a \u043e\u043a\u0430\u0437\u044b\u0432\u0430\u043b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u0439 \u0432\u043a\u043b\u0430\u0434 \u0432 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438.         # \u0435\u0441\u043b\u0438 \u0436\u0435 \u043c\u044b \u0445\u043e\u0442\u0438\u043c \u0447\u0442\u043e\u0431 \u043a\u0430\u0436\u0434\u044b\u0439 \u043f\u0440\u0438\u043c\u0435\u0440 \u043f\u0440\u0438 \u0437\u0430\u043a\u0440\u044b\u0442\u0438\u0438 \u0443\u0440\u043e\u043a\u0430 \u043e\u043a\u0430\u0437\u044b\u0432\u0430\u043b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e\u0435 \u0432\u043b\u0438\u044f\u043d\u0438\u0435, \u0442\u043e         # \u043d\u0443\u0436\u043d\u043e \u0434\u0435\u043b\u0438\u0442\u044c \u043d\u0430 \u043d\u0435\u043a\u0443\u044e \u043f\u043e\u0434\u043e\u0431\u0440\u0430\u043d\u043d\u0443\u044e \u043a\u043e\u043d\u0441\u0442\u0430\u043d\u0442\u0443, \u0430 \u043d\u0435 \u043d\u0430 \u0447\u0438\u0441\u043b\u043e \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432.         for f in fisher:             f \/= num_samples          return fisher   # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043f\u0435\u0440\u0435\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0432\u0445\u043e\u0434\u044b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 def permute_mnist(mnist):     perm_inds = list(range(mnist.train.images.shape[1]))     np.random.shuffle(perm_inds)     mnist2 = deepcopy(mnist)     sets = [\"train\", \"validation\", \"test\"]     for set_name in sets:         this_set = getattr(mnist2, set_name)         this_set._images = np.transpose(np.array([this_set.images[:, c] for c in perm_inds]))     return mnist2   def train_model(model, train_set, test_sets, batch_size=100, epochs=1):     \"\"\"     \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438     :param model:       \u043e\u0431\u0443\u0447\u0430\u0435\u043c\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c     :param train_set:   \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442     :param test_sets:   \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c     :param batch_size:  \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430     :param epochs:      \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043f\u043e\u0445 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :return:            \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     \"\"\"     num_iters = int(np.ceil(len(train_set.train.labels) * epochs \/ batch_size))     for idx in range(num_iters):         train_batch = train_set.train.next_batch(batch_size)         feed_dict = {model.x: train_batch[0], model.labels: train_batch[1]}         model.train_step.run(feed_dict=feed_dict)         print(f'\\rTraining  {idx + 1}\/{num_iters} done.', end='')      print(f'\\rTraining  {num_iters}\/{num_iters} iterations done.')      accuracy = 0.     for t, test_set in enumerate(test_sets):         feed_dict = {model.x: test_set.test.images, model.labels: test_set.test.labels}         accuracy += model.accuracy.eval(feed_dict=feed_dict)     accuracy \/= len(test_sets)     print(f'Evaluating on {len(test_sets)} test sets done. Accuracy {accuracy}')     return accuracy   def continual_learning(net_struct, data_sets, session, lr, lmbda):     \"\"\"     \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u0430\u0445     :param net_struct: \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438     :param data_sets:  \u0441\u043f\u0438\u0441\u043e\u043a \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param session:    tf-\u0441\u0435\u0441\u0441\u0438\u044f     :param lr:         \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param lmbda:      \u0441\u0442\u0435\u043f\u0435\u043d\u044c \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435     :return:           \u0441\u043f\u0438\u0441\u043e\u043a \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0445 \u043f\u043e \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043e\u0446\u0435\u043d\u043e\u043a     \"\"\"     model = Model(net_struct, session)     test_sets = []     accuracies = []     for data_set in data_sets:         test_sets.append(data_set)         model.open_lesson(lr, lmbda)         accuracy = train_model(model, data_set, test_sets, 100, 4)         accuracies.append(accuracy)         model.close_lesson(data_set.validation.images)     del model     return accuracies  # \u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435 MNIST mnist = input_data.read_data_sets('MNIST_data', one_hot=True) # \u0441\u043e\u0437\u0434\u0430\u0435\u043c tf-\u0441\u0435\u0441\u0441\u0438\u044e sess = tf.InteractiveSession()  # \u0441\u043e\u0437\u0434\u0430\u0435\u043c 10 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f mnist0 = mnist mnist1 = permute_mnist(mnist) mnist2 = permute_mnist(mnist) mnist3 = permute_mnist(mnist) mnist4 = permute_mnist(mnist) mnist5 = permute_mnist(mnist) mnist6 = permute_mnist(mnist) mnist7 = permute_mnist(mnist) mnist8 = permute_mnist(mnist) mnist9 = permute_mnist(mnist)  start_time = datetime.datetime.now()  # \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043c \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f data_sets = [mnist0, mnist1, mnist2, mnist3, mnist4, mnist5, mnist6, mnist7, mnist8, mnist9] net_struct = [784, 300, 150, 10] lmbda = 15. learning_rate = 0.2  accuracies = continual_learning(net_struct, data_sets, sess, lr=learning_rate, lmbda=lmbda) print ('Total time spent', datetime.datetime.now() - start_time)  dataset_num = range(1, len(accuracies) + 1)  # \u043d\u0430\u0440\u0438\u0441\u0443\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0438 \u0441\u0440\u0435\u0434\u043d\u0435\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 plt.figure(figsize=(7, 3.5)) plt.ylim(0.40, 1.) plt.xlim(1, len(accuracies)) plt.ylabel('Total accuracy') plt.xlabel('Number of tasks') plt.plot(dataset_num, accuracies, marker=\".\") #plt.legend() plt.show()<\/code><\/pre>\n<\/p>\n<\/div>\n<\/details>\n<p>\u0414\u043b\u044f \u0438\u043b\u043b\u044e\u0441\u0442\u0440\u0430\u0446\u0438\u0438 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u044b \u043a\u0430\u0442\u0430\u0441\u0442\u0440\u043e\u0444\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0437\u0430\u0431\u044b\u0432\u0447\u0438\u0432\u043e\u0441\u0442\u0438 \u0432 \u044d\u0442\u043e\u043c \u043a\u043e\u0434\u0435 \u043c\u043e\u0436\u043d\u043e \u0432\u044b\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u043b\u044f\u043c\u0431\u0434\u0430 \u0432 0, \u0438 \u0443\u0432\u0438\u0434\u0435\u0442\u044c, \u043a\u0430\u043a \u0441\u0438\u043b\u044c\u043d\u043e \u043d\u0430\u0447\u043d\u0435\u0442 \u043f\u0430\u0434\u0430\u0442\u044c \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c.<\/p>\n<\/p>\n<p>\u041f\u0440\u0438\u043c\u0435\u0440\u043d\u043e \u0447\u0435\u0440\u0435\u0437 \u0442\u0440\u0438 \u043c\u0435\u0441\u044f\u0446\u0430 \u0438\u0437\u043e\u0431\u0440\u0435\u043b\u0438 \u0434\u0440\u0443\u0433\u043e\u0439 \u0441\u043f\u043e\u0441\u043e\u0431 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 Synaptic Intelligence (<a href=\"https:\/\/arxiv.org\/abs\/1703.04200v3\" rel=\"noopener noreferrer nofollow\"><abbr title=\"Synaptic Intelligence\">SI<\/abbr><\/a>) \u2013 \u044d\u0442\u043e \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043c\u0435\u043d\u044f\u043b\u0430\u0441\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 \u043f\u0440\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f\u0445 \u0432\u0435\u0441\u0430 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0434\u043e\u0441\u0442\u043e\u0438\u043d\u0441\u0442\u0432\u0430 \u043c\u0435\u0442\u043e\u0434\u0430 \u0430\u0432\u0442\u043e\u0440\u044b \u0443\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0442, \u0447\u0442\u043e \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0441\u0447\u0438\u0442\u0430\u044e\u0442\u0441\u044f \u043f\u0440\u044f\u043c\u043e \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u043a\u0438. \u0410\u0432\u0442\u043e\u0440\u044b \u0442\u0430\u043a\u0436\u0435 \u0443\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u044e\u0442, \u0447\u0442\u043e \u0441 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u043c\u0438 \u0442\u0430\u043a\u0438\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u043e\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u044f\u043c\u0438 \u043d\u0430\u0432\u044b\u043a\u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u044e\u0442\u0441\u044f \u043b\u0443\u0447\u0448\u0435, \u0447\u0435\u043c \u0443 EWC. \u041d\u043e \u0441\u0442\u0440\u043e\u0433\u0438\u0445 \u0434\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044c\u0441\u0442\u0432 \u043d\u0435 \u043f\u0440\u0438\u0432\u043e\u0434\u044f\u0442, \u043a\u0440\u043e\u043c\u0435 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430, \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d\u043d\u043e\u0433\u043e \u043d\u0430 \u043a\u043e\u043d\u043a\u0440\u0435\u0442\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u0445 \u0433\u0438\u043f\u0435\u0440\u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432 \u0441\u0435\u0442\u0438.<\/p>\n<\/p>\n<p>\u0412 \u044d\u0442\u043e\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u0435 \u0445\u043e\u0440\u043e\u0448\u043e \u0442\u043e, \u0447\u0442\u043e \u043e\u043d \u0442\u043e\u0436\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442, \u0430 \u0442\u0430\u043a\u0436\u0435, \u0447\u0442\u043e \u0435\u0433\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u043d\u0435 \u0437\u0430\u0432\u0438\u0441\u0438\u0442 \u043e\u0442 \u0442\u0438\u043f\u0430 \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0435\u0442\u0438 (\u0442\u043e \u0435\u0441\u0442\u044c \u0432\u044b\u0445\u043e\u0434 \u043d\u0435 \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0434\u043e\u043b\u0436\u0435\u043d \u0431\u044b\u0442\u044c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435\u043c\/softmax). \u0412\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043c\u0435\u0442\u043e\u0434 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043b\u0435\u0433\u0447\u0435, \u0447\u0435\u043c \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u044b\u0439 EWC. \u041d\u043e \u0442\u0430\u043a\u0436\u0435 \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u0433\u0440\u0430\u0444\u0430 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0438 \u043d\u0435\u043e\u0442\u0434\u0435\u043b\u0438\u043c\u043e \u0441\u043e\u043f\u0440\u043e\u0432\u043e\u0436\u0434\u0430\u0435\u0442 \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f, \u0442\u043e \u0435\u0441\u0442\u044c \u0438\u043c\u0435\u0435\u0442 \u043f\u0440\u043e\u043f\u043e\u0440\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u0443\u044e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044e \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u0443\u044e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c, \u0447\u0442\u043e \u043d\u0435 \u0435\u0441\u0442\u044c \u0445\u043e\u0440\u043e\u0448\u043e.<\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 SI \u0442\u0443\u0442.<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\"># \u043a\u043e\u0434 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d \u043d\u0430 python 3.7 \u0438 tensorflow 1.15.0  import datetime from copy import deepcopy  import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data   _epsilon = 0.1   def _weight_variable(shape):     # \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u041a\u0430\u0439\u043c\u0438\u043d\u0443 \u0413\u0435 (\u0425\u0435)     stddev = 2. \/ np.sqrt(shape[0])     initial = tf.random.truncated_normal(shape=shape, mean=0.0, stddev=stddev)     return tf.Variable(initial, dtype=tf.float32)   def _bias_variable(shape):     # \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043d\u0443\u043b\u044f\u043c\u0438     initial = tf.constant(0.0, shape=shape)     return tf.Variable(initial, dtype=tf.float32)   class Model:     def __init__(self, shape, session):         \"\"\"         :param shape:   \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438 - \u0441\u043f\u0438\u0441\u043e\u043a \u0438\u0437 \u0447\u0438\u0441\u0435\u043b \u043d\u0435\u0439\u0440\u043e\u043d\u043e\u0432 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u043b\u043e\u0435 \u0441\u0435\u0442\u0438                         \u043e\u0442 \u0432\u0445\u043e\u0434\u0430 \u043a \u0432\u044b\u0445\u043e\u0434\u0443 \u0441\u043f\u0440\u0430\u0432\u0430 \u043d\u0430\u043b\u0435\u0432\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, [784, 100, 10]         :param session: tensorflow-\u0441\u0435\u0441\u0441\u0438\u044f \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u0432 \u0441\u0435\u0442\u0438         \"\"\"          self.session = session         self._shape = shape         depth = len(shape) - 1         if depth &lt; 1:             raise ValueError(\"\u041d\u0435\u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438!\")          # \u0437\u0430\u0433\u043b\u0443\u0448\u043a\u0438 \u0434\u043b\u044f \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445         self.x = tf.placeholder(tf.float32, shape=[None, shape[0]])         self.labels = tf.placeholder(tf.float32, shape=[None, shape[-1]])          # \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u043b\u043e\u0435\u0432 \u0441\u0435\u0442\u0438 \u0431\u0443\u0434\u0435\u043c \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0432 \u0441\u043f\u0438\u0441\u043a\u0435         self.var_list = []         for ins, outs in zip(shape[:-1], shape[1:]):             self.var_list.append(_weight_variable([ins, outs]))             self.var_list.append(_bias_variable([outs]))          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438         for v in self.var_list:             session.run(v.initializer)          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u043d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438 \u0437\u0430 \u0442\u0435\u043a\u0443\u0449\u0438\u0439 \u0443\u0440\u043e\u043a         self._accums = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438 \u0437\u0430 \u0432\u0441\u0435 \u0437\u0430\u0432\u0435\u0440\u0448\u0435\u043d\u043d\u044b\u0435 \u0443\u0440\u043e\u043a\u0438         self.wb_importance = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u0442\u0440\u043e\u0438\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444         x, y, z = self.x, None, None         for i in range(depth):             z = tf.matmul(x, self.var_list[i * 2]) + self.var_list[i * 2 + 1]             y = tf.nn.softmax(z) if i == depth-1 else tf.nn.leaky_relu(z)             x = y          # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438         self.loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=self.labels))          # \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c (accuracy)         self.correct_preds = tf.equal(tf.argmax(z, axis=1), tf.argmax(self.labels, axis=1))         self.accuracy = tf.reduce_mean(tf.cast(self.correct_preds, tf.float32))          self.grads = tf.gradients(self.loss, self.var_list)          self._train_step = None      def open_lesson(self, learning_rate=1.0, lmbda=0.0):         \"\"\"         \u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         :param learning_rate: \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f SGD         :param lmbda:         \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 - \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e                               \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0442\u044f\u043d\u0443\u0442 \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c         \"\"\"         loss = self.loss          if hasattr(self, \"star_vars\"):             if lmbda != 0:                 # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u043a \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u044b\u0435-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b                 for v in range(len(self._shape)*2-2):                     loss += tf.reduce_sum(tf.multiply(                         tf.constant(lmbda \/ 2. * self.wb_importance[v], tf.float32),                         tf.square(self.var_list[v] - tf.constant(self.star_vars[v], tf.float32))                     ))         else:             # \u0437\u0430\u043f\u043e\u043c\u0438\u043d\u0430\u0435\u043c \u0442\u0435\u043a\u0443\u0449\u0438\u0435 \u0432\u0435\u0441\u0430             self.star_vars = [v.eval() for v in self.var_list]          # \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0448\u0430\u0433 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u0430         self._train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)          #         self.cur_vars = [v.eval() for v in self.var_list]      def train_step_run(self, feed_dict):         self._train_step.run(feed_dict=feed_dict)          # \u0441\u0447\u0438\u0442\u0430\u0435\u043c \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u043d\u044b\u0435 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u043e\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432 \u0441\u0435\u0442\u0438         new_vars = [v.eval() for v in self.var_list]          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u0435\u043c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b         grads = self.session.run(self.grads, feed_dict=feed_dict)          # \u0430\u043a\u043a\u0443\u043c\u0443\u043b\u0438\u0440\u0443\u0435\u043c \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 (\u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u0430\u044f         # \u043f\u043e \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0443, \u0443\u043c\u043d\u043e\u0436\u0435\u043d\u043d\u0430\u044f \u043d\u0430 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430)         for acc, grad, prev_var, new_var in zip(self._accums, grads, self.cur_vars, new_vars):             acc -= grad * (new_var - prev_var)          # \u043c\u0430\u0441\u0442\u0435\u0440\u0430 tensorflow \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e \u0441\u043c\u043e\u0433\u0443\u0442 \u0438\u0437 train_step.run \u0432\u044b\u0442\u0430\u0449\u0438\u0442\u044c         # \u0443\u0436\u0435 \u043f\u043e\u0434\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b \u043f\u043e \u0432\u0435\u0441\u0430\u043c \u0438 \u0441\u0430\u043c\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0432\u0435\u0441\u043e\u0432 \u0447\u0442\u043e\u0431\u044b         # \u043d\u0435 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0438\u0445 \u0435\u0449\u0435 \u0440\u0430\u0437 \u0438 \u0441\u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0442\u044c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0435 \u0440\u0435\u0441\u0443\u0440\u0441\u044b          # \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u043c \u043d\u043e\u0432\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0432\u0435\u0441\u043e\u0432 \u0434\u043b\u044f \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0439 \u0438\u0442\u0435\u0440\u0430\u0446\u0438\u0438         self.cur_vars = new_vars      def close_lesson(self):         \"\"\"         \u0417\u0430\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438. \u041d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432.         :return:         \"\"\"          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u0435\u043c \u043a\u0432\u0430\u0434\u0440\u0430\u0442\u044b \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u0439 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432         deltas = [np.square(v.eval() - prev_v) + _epsilon                   for v, prev_v in zip(self.var_list, self.star_vars)]          # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043a \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u043d\u044b\u043c         for i, a, d in zip(self.wb_importance, self._accums, deltas):             i += a \/ d          # \u0437\u0430\u043f\u043e\u043c\u0438\u043d\u0430\u0435\u043c \u0442\u0435\u043a\u0443\u0449\u0438\u0435 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0435 \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         self.star_vars = [v.eval() for v in self.var_list]   # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043f\u0435\u0440\u0435\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0432\u0445\u043e\u0434\u044b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 def permute_mnist(mnist):     perm_inds = list(range(mnist.train.images.shape[1]))     np.random.shuffle(perm_inds)     mnist2 = deepcopy(mnist)     sets = [\"train\", \"validation\", \"test\"]     for set_name in sets:         this_set = getattr(mnist2, set_name)         this_set._images = np.transpose(np.array([this_set.images[:, c] for c in perm_inds]))     return mnist2   def train_model(model, train_set, test_sets, batch_size=100, epochs=1):     \"\"\"     \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438     :param model:       \u043e\u0431\u0443\u0447\u0430\u0435\u043c\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c     :param train_set:   \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442     :param test_sets:   \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c     :param batch_size:  \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430     :param epochs:      \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043f\u043e\u0445 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :return:            \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     \"\"\"     num_iters = int(np.ceil(len(train_set.train.labels) * epochs \/ batch_size))     for idx in range(num_iters):         train_batch = train_set.train.next_batch(batch_size)         feed_dict = {model.x: train_batch[0], model.labels: train_batch[1]}         model.train_step_run(feed_dict=feed_dict)         print(f'\\rTraining  {idx + 1}\/{num_iters} done.', end='')      print(f'\\rTraining  {num_iters}\/{num_iters} iterations done.')      accuracy = 0.     for t, test_set in enumerate(test_sets):         feed_dict = {model.x: test_set.test.images, model.labels: test_set.test.labels}         accuracy += model.accuracy.eval(feed_dict=feed_dict)     accuracy \/= len(test_sets)     print(f'Evaluating on {len(test_sets)} test sets done. Accuracy {accuracy}')     return accuracy   def continual_learning(net_struct, data_sets, session, lr, lmbda):     \"\"\"     \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u0430\u0445     :param net_struct: \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438     :param data_sets:  \u0441\u043f\u0438\u0441\u043e\u043a \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param session:    tf-\u0441\u0435\u0441\u0441\u0438\u044f     :param lr:         \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param lmbda:      \u0441\u0442\u0435\u043f\u0435\u043d\u044c \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435     :return:           \u0441\u043f\u0438\u0441\u043e\u043a \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0445 \u043f\u043e \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043e\u0446\u0435\u043d\u043e\u043a     \"\"\"     model = Model(net_struct, session)     test_sets = []     accuracies = []     for data_set in data_sets:         test_sets.append(data_set)         model.open_lesson(lr, lmbda)         accuracy = train_model(model, data_set, test_sets, 100, 4)         accuracies.append(accuracy)         model.close_lesson()     del model     return accuracies  # \u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435 MNIST mnist = input_data.read_data_sets('MNIST_data', one_hot=True) # \u0441\u043e\u0437\u0434\u0430\u0435\u043c tf-\u0441\u0435\u0441\u0441\u0438\u044e sess = tf.InteractiveSession()  # \u0441\u043e\u0437\u0434\u0430\u0435\u043c 10 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f mnist0 = mnist mnist1 = permute_mnist(mnist) mnist2 = permute_mnist(mnist) mnist3 = permute_mnist(mnist) mnist4 = permute_mnist(mnist) mnist5 = permute_mnist(mnist) mnist6 = permute_mnist(mnist) mnist7 = permute_mnist(mnist) mnist8 = permute_mnist(mnist) mnist9 = permute_mnist(mnist)  start_time = datetime.datetime.now()  # \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043c \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f data_sets = [mnist0, mnist1, mnist2, mnist3, mnist4, mnist5, mnist6, mnist7, mnist8, mnist9] net_struct = [784, 300, 150, 10] lmbda = 0.1 learning_rate = 0.02  accuracies = continual_learning(net_struct, data_sets, sess, lr=learning_rate, lmbda=lmbda) print ('Total time spent', datetime.datetime.now() - start_time)  dataset_num = range(1, len(accuracies) + 1)  # \u043d\u0430\u0440\u0438\u0441\u0443\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0438 \u0441\u0440\u0435\u0434\u043d\u0435\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 plt.figure(figsize=(7, 3.5)) plt.ylim(0.40, 1.) plt.xlim(1, len(accuracies)) plt.ylabel('Total accuracy') plt.xlabel('Number of tasks') plt.plot(dataset_num, accuracies, marker=\".\") #plt.legend() plt.show()<\/code><\/pre>\n<\/p>\n<\/div>\n<\/details>\n<p>\u0415\u0449\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u043d\u043e \u0447\u0435\u0440\u0435\u0437 \u043f\u043e\u043b\u0433\u043e\u0434\u0430 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u044c \u0432\u0435\u0441\u043e\u0432 \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0438\u043b\u0438 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u043f\u043e \u0441\u0442\u0435\u043f\u0435\u043d\u0438 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u0432\u044b\u0445\u043e\u0434\u043d\u044b\u0445 \u0441\u0438\u0433\u043d\u0430\u043b\u043e\u0432 \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u043a\u0438 \u043e\u0442 \u0432\u0435\u0441\u043e\u0432 \u043d\u0430 \u043a\u0430\u0436\u0434\u043e\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430, \u0447\u0442\u043e \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u043b\u043e\u0433\u0438\u0447\u043d\u043e. \u042d\u0442\u043e\u0442 \u043c\u0435\u0442\u043e\u0434 \u043d\u0430\u0437\u0432\u0430\u043b\u0438 Memory Aware Synapses (<a href=\"https:\/\/arxiv.org\/abs\/1711.09601v4\" rel=\"noopener noreferrer nofollow\"><abbr title=\"Memory Aware Synapses\">MAS<\/abbr><\/a>). \u041c\u0435\u0442\u043e\u0434 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0445\u043e\u0440\u043e\u0448\u0438\u0435 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u2013 \u043b\u0443\u0447\u0448\u0435, \u0447\u0435\u043c \u0443 \u043e\u0431\u043e\u0438\u0445 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u0445, \u043d\u043e \u0442\u0430\u043a\u0436\u0435 \u0431\u0435\u0437 \u0441\u0442\u0440\u043e\u0433\u043e\u0433\u043e \u0434\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044c\u0441\u0442\u0432\u0430. \u041c\u0435\u0442\u043e\u0434 \u043d\u0435 \u0442\u0440\u0435\u0431\u0443\u0435\u0442 softmax-\u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0435\u0442\u0438. \u041f\u043e\u043b\u043d\u043e\u0446\u0435\u043d\u043d\u0430\u044f \u0432\u0435\u0440\u0441\u0438\u044f MAS \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043b\u0435\u0433\u0447\u0435 EWC \u0438 \u0441\u0440\u0430\u0432\u043d\u0438\u043c\u0430 \u0441 SI. \u041e\u0434\u043d\u0430\u043a\u043e, \u0432 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 SI, \u043e\u0442\u0434\u0435\u043b\u0438\u043c\u0430 \u043e\u0442 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f.<\/p>\n<\/p>\n<p>\u0418\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e, \u0447\u0442\u043e \u043f\u0440\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0438 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u043a\u0438 \u0441 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u043c\u0438 \u0441\u043b\u043e\u044f\u043c\u0438 \u0438 ReLU-\u0430\u043a\u0442\u0438\u0432\u0430\u0446\u0438\u044f\u043c\u0438 \u0432 \u043c\u0435\u0442\u043e\u0434\u0435 MAS \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u044c \u0441\u0432\u044f\u0437\u0438 \u043c\u0435\u0436\u0434\u0443 \u043d\u0435\u0439\u0440\u043e\u043d\u0430\u043c\u0438 \u0440\u0430\u0432\u043d\u0430 \u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u044e \u0432\u044b\u0445\u043e\u0434\u0430 \u043d\u0435\u0439\u0440\u043e\u043d\u0430-\u0438\u0441\u0442\u043e\u0447\u043d\u0438\u043a\u0430 \u043d\u0430 \u0432\u044b\u0445\u043e\u0434 \u043d\u0435\u0439\u0440\u043e\u043d\u0430-\u043f\u0440\u0438\u0435\u043c\u043d\u0438\u043a\u0430. \u0418 \u044d\u0442\u043e \u043f\u0440\u044f\u043c\u043e \u043e\u0434\u0438\u043d \u0432 \u043e\u0434\u0438\u043d \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043f\u043e \u0425\u0435\u0431\u0431\u0443, \u0442\u043e\u043b\u044c\u043a\u043e \u0432 \u0445\u0435\u0431\u0431\u043e\u0432\u043e\u043c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u0442\u0430\u043a \u0441\u0447\u0438\u0442\u0430\u0435\u0442\u0441\u044f \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u0432\u0435\u0441\u0430 \u0441\u0432\u044f\u0437\u0438, \u0430 \u0432 MAS \u044d\u0442\u043e \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u044c \u0441\u0432\u044f\u0437\u0438.<\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u043f\u043e\u043b\u043d\u043e\u0446\u0435\u043d\u043d\u043e\u0433\u043e MAS \u0442\u0443\u0442.<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\"># \u043a\u043e\u0434 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d \u043d\u0430 python 3.7 \u0438 tensorflow 1.15.0  import datetime from copy import deepcopy  import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data   def _weight_variable(shape):     # \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u041a\u0430\u0439\u043c\u0438\u043d\u0443 \u0413\u0435 (\u0425\u0435)     stddev = 2. \/ np.sqrt(shape[0])     initial = tf.random.truncated_normal(shape=shape, mean=0.0, stddev=stddev)     return tf.Variable(initial, dtype=tf.float32)   def _bias_variable(shape):     # \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043d\u0443\u043b\u044f\u043c\u0438     initial = tf.constant(0.0, shape=shape)     return tf.Variable(initial, dtype=tf.float32)   class Model:     def __init__(self, shape, session):         \"\"\"         :param shape:   \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438 - \u0441\u043f\u0438\u0441\u043e\u043a \u0438\u0437 \u0447\u0438\u0441\u0435\u043b \u043d\u0435\u0439\u0440\u043e\u043d\u043e\u0432 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u043b\u043e\u0435 \u0441\u0435\u0442\u0438                         \u043e\u0442 \u0432\u0445\u043e\u0434\u0430 \u043a \u0432\u044b\u0445\u043e\u0434\u0443 \u0441\u043f\u0440\u0430\u0432\u0430 \u043d\u0430\u043b\u0435\u0432\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, [784, 100, 10]         :param session: tensorflow-\u0441\u0435\u0441\u0441\u0438\u044f \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u0432 \u0441\u0435\u0442\u0438         \"\"\"          self.session = session         self._shape = shape         depth = len(shape) - 1         if depth &lt; 1:             raise ValueError(\"\u041d\u0435\u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438!\")          # \u0437\u0430\u0433\u043b\u0443\u0448\u043a\u0438 \u0434\u043b\u044f \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445         self.x = tf.placeholder(tf.float32, shape=[None, shape[0]])         self.labels = tf.placeholder(tf.float32, shape=[None, shape[-1]])          # \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u043b\u043e\u0435\u0432 \u0441\u0435\u0442\u0438 \u0431\u0443\u0434\u0435\u043c \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0432 \u0441\u043f\u0438\u0441\u043a\u0435         self.var_list = []         for ins, outs in zip(shape[:-1], shape[1:]):             self.var_list.append(_weight_variable([ins, outs]))             self.var_list.append(_bias_variable([outs]))          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438         for v in self.var_list:             session.run(v.initializer)          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438         self.wb_importance = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u0442\u0440\u043e\u0438\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444         x, y, z = self.x, None, None         for i in range(depth):             z = tf.matmul(x, self.var_list[i * 2]) + self.var_list[i * 2 + 1]             y = tf.nn.softmax(z) if i == depth-1 else tf.nn.leaky_relu(z)             x = y          # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438         self.loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=self.labels))          # \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c (accuracy)         self.correct_preds = tf.equal(tf.argmax(z, axis=1), tf.argmax(self.labels, axis=1))         self.accuracy = tf.reduce_mean(tf.cast(self.correct_preds, tf.float32))          # \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0432\u044b\u0445\u043e\u0434\u043e\u0432 \u0441\u0435\u0442\u0438         F = tf.reduce_mean(tf.reduce_sum(tf.square(y), axis=1))          # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043f\u043e \u0432\u0435\u0441\u0430\u043c         self.cur_importances = [tf.abs(grad) for grad in tf.gradients(F, self.var_list)]          self.train_step = None      def open_lesson(self, learning_rate=1.0, lmbda=0.0):         \"\"\"         \u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         :param learning_rate: \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f SGD         :param lmbda:         \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 - \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e                               \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0442\u044f\u043d\u0443\u0442 \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c         \"\"\"         loss = self.loss          if hasattr(self, \"star_vars\") and lmbda != 0:             # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u043a \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u044b\u0435-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b             for v in range(len(self._shape)*2-2):                 loss += tf.reduce_sum(tf.multiply(                     tf.constant(lmbda \/ 2. * self.wb_importance[v], tf.float32),                     tf.square(self.var_list[v] - tf.constant(self.star_vars[v], tf.float32))                 ))          # \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0448\u0430\u0433 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u0430         self.train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)      def close_lesson(self, closing_set=None):         \"\"\"         \u0417\u0430\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435. \u0420\u0430\u0441\u0447\u0435\u0442 \u0438 \u043d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432.         :param closing_set: \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u044b \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         :return:         \"\"\"          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043d\u0430 \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         addendum = self.session.run(self.cur_importances, feed_dict={self.x: closing_set})          # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043a \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u043d\u044b\u043c         for i, a in zip(self.wb_importance, addendum):             i += a          # \u0437\u0430\u043f\u043e\u043c\u0438\u043d\u0430\u0435\u043c \u0442\u0435\u043a\u0443\u0449\u0438\u0435 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0435 \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         self.star_vars = [v.eval() for v in self.var_list]   # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043f\u0435\u0440\u0435\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0432\u0445\u043e\u0434\u044b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 def permute_mnist(mnist):     perm_inds = list(range(mnist.train.images.shape[1]))     np.random.shuffle(perm_inds)     mnist2 = deepcopy(mnist)     sets = [\"train\", \"validation\", \"test\"]     for set_name in sets:         this_set = getattr(mnist2, set_name)         this_set._images = np.transpose(np.array([this_set.images[:, c] for c in perm_inds]))     return mnist2   def train_model(model, train_set, test_sets, batch_size=100, epochs=1):     \"\"\"     \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438     :param model:       \u043e\u0431\u0443\u0447\u0430\u0435\u043c\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c     :param train_set:   \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442     :param test_sets:   \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c     :param batch_size:  \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430     :param epochs:      \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043f\u043e\u0445 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :return:            \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     \"\"\"     num_iters = int(np.ceil(len(train_set.train.labels) * epochs \/ batch_size))     for idx in range(num_iters):         train_batch = train_set.train.next_batch(batch_size)         feed_dict = {model.x: train_batch[0], model.labels: train_batch[1]}         model.train_step.run(feed_dict=feed_dict)         print(f'\\rTraining  {idx + 1}\/{num_iters} done.', end='')      print(f'\\rTraining  {num_iters}\/{num_iters} iterations done.')      accuracy = 0.     for t, test_set in enumerate(test_sets):         feed_dict = {model.x: test_set.test.images, model.labels: test_set.test.labels}         accuracy += model.accuracy.eval(feed_dict=feed_dict)     accuracy \/= len(test_sets)     print(f'Evaluating on {len(test_sets)} test sets done. Accuracy {accuracy}')     return accuracy   def continual_learning(net_struct, data_sets, session, lr, lmbda):     \"\"\"     \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u0430\u0445     :param net_struct: \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438     :param data_sets:  \u0441\u043f\u0438\u0441\u043e\u043a \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param session:    tf-\u0441\u0435\u0441\u0441\u0438\u044f     :param lr:         \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param lmbda:      \u0441\u0442\u0435\u043f\u0435\u043d\u044c \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435     :return:           \u0441\u043f\u0438\u0441\u043e\u043a \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0445 \u043f\u043e \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043e\u0446\u0435\u043d\u043e\u043a     \"\"\"     model = Model(net_struct, session)     test_sets = []     accuracies = []     for data_set in data_sets:         test_sets.append(data_set)         model.open_lesson(lr, lmbda)         accuracy = train_model(model, data_set, test_sets, 100, 4)         accuracies.append(accuracy)         model.close_lesson(data_set.validation.images)     del model     return accuracies  # \u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435 MNIST mnist = input_data.read_data_sets('MNIST_data', one_hot=True) # \u0441\u043e\u0437\u0434\u0430\u0435\u043c tf-\u0441\u0435\u0441\u0441\u0438\u044e sess = tf.InteractiveSession()  # \u0441\u043e\u0437\u0434\u0430\u0435\u043c 10 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f mnist0 = mnist mnist1 = permute_mnist(mnist) mnist2 = permute_mnist(mnist) mnist3 = permute_mnist(mnist) mnist4 = permute_mnist(mnist) mnist5 = permute_mnist(mnist) mnist6 = permute_mnist(mnist) mnist7 = permute_mnist(mnist) mnist8 = permute_mnist(mnist) mnist9 = permute_mnist(mnist)  start_time = datetime.datetime.now()  # \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043c \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f data_sets = [mnist0, mnist1, mnist2, mnist3, mnist4, mnist5, mnist6, mnist7, mnist8, mnist9] net_struct = [784, 300, 150, 10] lmbda = 15. learning_rate = 0.2  accuracies = continual_learning(net_struct, data_sets, sess, lr=learning_rate, lmbda=lmbda) print ('Total time spent', datetime.datetime.now() - start_time)  dataset_num = range(1, len(accuracies) + 1)  # \u043d\u0430\u0440\u0438\u0441\u0443\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0438 \u0441\u0440\u0435\u0434\u043d\u0435\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 plt.figure(figsize=(7, 3.5)) plt.ylim(0.40, 1.) plt.xlim(1, len(accuracies)) plt.ylabel('Total accuracy') plt.xlabel('Number of tasks') plt.plot(dataset_num, accuracies, marker=\".\") #plt.legend() plt.show()<\/code><\/pre>\n<\/p>\n<\/div>\n<\/details>\n<p>\u041d\u0430\u043a\u043e\u043d\u0435\u0446 \u043d\u0435\u0434\u0430\u0432\u043d\u043e \u0430\u0432\u0442\u043e\u0440 (\u044d\u0442\u043e\u0433\u043e \u043e\u043f\u0443\u0441\u0430) \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u043e \u043e\u0431\u043d\u0430\u0440\u0443\u0436\u0438\u043b, \u0447\u0442\u043e \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u0430 \u0441\u0432\u044f\u0437\u0438 \u043c\u043e\u0436\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043f\u0440\u043e\u0441\u0442\u043e \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u0439 \u043f\u043e \u043c\u043e\u0434\u0443\u043b\u044e \u0441\u0438\u0433\u043d\u0430\u043b, \u043f\u0440\u043e\u0448\u0435\u0434\u0448\u0438\u0439 \u0447\u0435\u0440\u0435\u0437 \u0441\u0432\u044f\u0437\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u043a\u0438 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0430\u043d\u0438\u044f \u0447\u0435\u0440\u0435\u0437 \u043d\u0435\u0435 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0435\u0433\u043e \u043d\u0430\u0431\u043e\u0440\u0430.  \u0418 \u0442\u0430\u043a\u043e\u0439 \u043c\u0435\u0442\u043e\u0434 EWC-signal (<a href=\"https:\/\/arxiv.org\/abs\/2005.07107\" rel=\"noopener noreferrer nofollow\"><abbr title=\"Signal-based EWC\">EWC-S<\/abbr><\/a>) \u0442\u043e\u0436\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442, \u0445\u043e\u0442\u044c \u0438 \u043d\u0435\u043c\u043d\u043e\u0433\u0438\u043c \u0445\u0443\u0436\u0435, \u0447\u0435\u043c \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u0435 \u043c\u0435\u0442\u043e\u0434\u044b EWC, SI \u0438 MAS. \u0412 \u0441\u043c\u044b\u0441\u043b\u0435 \u0436\u0435 \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0439 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u0438 \u044d\u0442\u043e\u0442 \u043c\u0435\u0442\u043e\u0434 \u0437\u0430\u0441\u043b\u0443\u0436\u0435\u043d\u043d\u043e \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0437\u0432\u0430\u0442\u044c \u043a\u0438\u0442\u0430\u0439\u0441\u043a\u0438\u043c \u2013 \u043d\u0430\u0441\u0442\u043e\u043b\u044c\u043a\u043e \u043e\u043d \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0434\u0435\u0448\u0435\u0432. \u041e\u043d \u043d\u0435 \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u043d\u0438 \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0435\u0442\u0438 \u0432 \u0432\u0438\u0434\u0435 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f\/softmax, \u043d\u0438 \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u043a\u0430\u043a\u0438\u0445-\u043b\u0438\u0431\u043e \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u044b\u0445 \u0438\u043b\u0438 \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u043e\u0432. \u041a\u0440\u043e\u043c\u0435 \u0442\u043e\u0433\u043e, \u0441 \u0435\u0433\u043e \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0436\u043d\u043e \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u043f\u0440\u044f\u043c\u043e \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u0437\u0430\u0432\u0435\u0440\u0448\u0430\u044e\u0449\u0438\u0445 \u044d\u0442\u0430\u043f\u043e\u0432 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u041e\u0434\u043d\u0430\u043a\u043e, \u0434\u043b\u044f \u044d\u0442\u043e\u0433\u043e \u043c\u0435\u0442\u043e\u0434\u0430 tensorflow \u0438 torch \u043d\u0435 \u043f\u043e\u0441\u0442\u0440\u043e\u044f\u0442 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u044f \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0439 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0437\u0430 \u0432\u0430\u0441, \u0438 \u043a\u043e\u0434 \u043f\u0440\u0438\u0434\u0435\u0442\u0441\u044f \u043f\u0438\u0441\u0430\u0442\u044c \u0440\u0443\u043a\u0430\u043c\u0438.<\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 EWC-S \u0442\u0443\u0442.<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\"># \u043a\u043e\u0434 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d \u043d\u0430 python 3.7 \u0438 tensorflow 1.15.0  import datetime from copy import deepcopy  import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data   def _weight_variable(shape):     # \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u041a\u0430\u0439\u043c\u0438\u043d\u0443 \u0413\u0435 (\u0425\u0435)     stddev = 2. \/ np.sqrt(shape[0])     initial = tf.random.truncated_normal(shape=shape, mean=0.0, stddev=stddev)     return tf.Variable(initial, dtype=tf.float32)   def _bias_variable(shape):     # \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043d\u0443\u043b\u044f\u043c\u0438     initial = tf.constant(0.0, shape=shape)     return tf.Variable(initial, dtype=tf.float32)   class Model:     def __init__(self, shape, session):         \"\"\"         :param shape:   \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438 - \u0441\u043f\u0438\u0441\u043e\u043a \u0438\u0437 \u0447\u0438\u0441\u0435\u043b \u043d\u0435\u0439\u0440\u043e\u043d\u043e\u0432 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u043b\u043e\u0435 \u0441\u0435\u0442\u0438                         \u043e\u0442 \u0432\u0445\u043e\u0434\u0430 \u043a \u0432\u044b\u0445\u043e\u0434\u0443 \u0441\u043f\u0440\u0430\u0432\u0430 \u043d\u0430\u043b\u0435\u0432\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, [784, 100, 10]         :param session: tensorflow-\u0441\u0435\u0441\u0441\u0438\u044f \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u0432 \u0441\u0435\u0442\u0438         \"\"\"          self.session = session         self._shape = shape         depth = len(shape) - 1         if depth &lt; 1:             raise ValueError(\"\u041d\u0435\u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438!\")          # \u0437\u0430\u0433\u043b\u0443\u0448\u043a\u0438 \u0434\u043b\u044f \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445         self.x = tf.placeholder(tf.float32, shape=[None, shape[0]])         self.labels = tf.placeholder(tf.float32, shape=[None, shape[-1]])          # \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u043b\u043e\u0435\u0432 \u0441\u0435\u0442\u0438 \u0431\u0443\u0434\u0435\u043c \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0432 \u0441\u043f\u0438\u0441\u043a\u0435         self.var_list = []         for ins, outs in zip(shape[:-1], shape[1:]):             self.var_list.append(_weight_variable([ins, outs]))             self.var_list.append(_bias_variable([outs]))          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438         for v in self.var_list:             session.run(v.initializer)          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438         self.wb_importance = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u0442\u0440\u043e\u0438\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444         outputs = []         x, y, z = self.x, None, None         for i in range(depth):             z = tf.matmul(x, self.var_list[i * 2]) + self.var_list[i * 2 + 1]             y = tf.nn.softmax(z) if i == depth-1 else tf.nn.leaky_relu(z)             outputs.append(y)             x = y          # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438         self.loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=self.labels))          # \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c (accuracy)         self.correct_preds = tf.equal(tf.argmax(z, axis=1), tf.argmax(self.labels, axis=1))         self.accuracy = tf.reduce_mean(tf.cast(self.correct_preds, tf.float32))          # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u0439 \u043f\u043e \u043c\u043e\u0434\u0443\u043b\u044e \u043f\u0440\u043e\u0448\u0435\u0434\u0448\u0438\u0439 \u0441\u0438\u0433\u043d\u0430\u043b         self.signals = []          os = tf.reduce_mean(tf.abs(self.x), axis=0)         for i in range(depth):             ws = tf.transpose(tf.multiply(os, tf.transpose(tf.abs(self.var_list[i*2]))))             self.signals.append(ws)             os = tf.reduce_mean(tf.abs(outputs[i]), axis=0)             self.signals.append(os)          self.train_step = None      def open_lesson(self, learning_rate=1.0, lmbda=0.0):         \"\"\"         \u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         :param learning_rate: \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f SGD         :param lmbda:         \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 - \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e                               \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0442\u044f\u043d\u0443\u0442 \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c         \"\"\"         loss = self.loss          if hasattr(self, \"star_vars\") and lmbda != 0:             # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u043a \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u044b\u0435-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b             for v in range(len(self._shape)*2-2):                 loss += tf.reduce_sum(tf.multiply(                     tf.constant(lmbda \/ 2. * self.wb_importance[v], tf.float32),                     tf.square(self.var_list[v] - tf.constant(self.star_vars[v], tf.float32))                 ))          # \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0448\u0430\u0433 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u0430         self.train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)      def close_lesson(self, closing_set=None):         \"\"\"         \u0417\u0430\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435. \u0420\u0430\u0441\u0447\u0435\u0442 \u0438 \u043d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432.         :param closing_set: \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u044b \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         :return:         \"\"\"          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043d\u0430 \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         addendum = self.session.run(self.signals, feed_dict={self.x: closing_set})          # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043a \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u043d\u044b\u043c         for i, a in zip(self.wb_importance, addendum):             i += a          # \u0437\u0430\u043f\u043e\u043c\u0438\u043d\u0430\u0435\u043c \u0442\u0435\u043a\u0443\u0449\u0438\u0435 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0435 \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         self.star_vars = [v.eval() for v in self.var_list]   # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043f\u0435\u0440\u0435\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0432\u0445\u043e\u0434\u044b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 def permute_mnist(mnist):     perm_inds = list(range(mnist.train.images.shape[1]))     np.random.shuffle(perm_inds)     mnist2 = deepcopy(mnist)     sets = [\"train\", \"validation\", \"test\"]     for set_name in sets:         this_set = getattr(mnist2, set_name)         this_set._images = np.transpose(np.array([this_set.images[:, c] for c in perm_inds]))     return mnist2   def train_model(model, train_set, test_sets, batch_size=100, epochs=1):     \"\"\"     \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438     :param model:       \u043e\u0431\u0443\u0447\u0430\u0435\u043c\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c     :param train_set:   \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442     :param test_sets:   \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c     :param batch_size:  \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430     :param epochs:      \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043f\u043e\u0445 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :return:            \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     \"\"\"     num_iters = int(np.ceil(len(train_set.train.labels) * epochs \/ batch_size))     for idx in range(num_iters):         train_batch = train_set.train.next_batch(batch_size)         feed_dict = {model.x: train_batch[0], model.labels: train_batch[1]}         model.train_step.run(feed_dict=feed_dict)         print(f'\\rTraining  {idx + 1}\/{num_iters} done.', end='')      print(f'\\rTraining  {num_iters}\/{num_iters} iterations done.')      accuracy = 0.     for t, test_set in enumerate(test_sets):         feed_dict = {model.x: test_set.test.images, model.labels: test_set.test.labels}         accuracy += model.accuracy.eval(feed_dict=feed_dict)     accuracy \/= len(test_sets)     print(f'Evaluating on {len(test_sets)} test sets done. Accuracy {accuracy}')     return accuracy   def continual_learning(net_struct, data_sets, session, lr, lmbda):     \"\"\"     \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u0430\u0445     :param net_struct: \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438     :param data_sets:  \u0441\u043f\u0438\u0441\u043e\u043a \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param session:    tf-\u0441\u0435\u0441\u0441\u0438\u044f     :param lr:         \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param lmbda:      \u0441\u0442\u0435\u043f\u0435\u043d\u044c \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435     :return:           \u0441\u043f\u0438\u0441\u043e\u043a \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0445 \u043f\u043e \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043e\u0446\u0435\u043d\u043e\u043a     \"\"\"     model = Model(net_struct, session)     test_sets = []     accuracies = []     for data_set in data_sets:         test_sets.append(data_set)         model.open_lesson(lr, lmbda)         accuracy = train_model(model, data_set, test_sets, 100, 4)         accuracies.append(accuracy)         model.close_lesson(data_set.validation.images)     del model     return accuracies  # \u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435 MNIST mnist = input_data.read_data_sets('MNIST_data', one_hot=True) # \u0441\u043e\u0437\u0434\u0430\u0435\u043c tf-\u0441\u0435\u0441\u0441\u0438\u044e sess = tf.InteractiveSession()  # \u0441\u043e\u0437\u0434\u0430\u0435\u043c 10 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f mnist0 = mnist mnist1 = permute_mnist(mnist) mnist2 = permute_mnist(mnist) mnist3 = permute_mnist(mnist) mnist4 = permute_mnist(mnist) mnist5 = permute_mnist(mnist) mnist6 = permute_mnist(mnist) mnist7 = permute_mnist(mnist) mnist8 = permute_mnist(mnist) mnist9 = permute_mnist(mnist)  start_time = datetime.datetime.now()  # \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043c \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f data_sets = [mnist0, mnist1, mnist2, mnist3, mnist4, mnist5, mnist6, mnist7, mnist8, mnist9] net_struct = [784, 300, 150, 10] lmbda = 1. learning_rate = 0.2  accuracies = continual_learning(net_struct, data_sets, sess, lr=learning_rate, lmbda=lmbda) print ('Total time spent', datetime.datetime.now() - start_time)  dataset_num = range(1, len(accuracies) + 1)  # \u043d\u0430\u0440\u0438\u0441\u0443\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0438 \u0441\u0440\u0435\u0434\u043d\u0435\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 plt.figure(figsize=(7, 3.5)) plt.ylim(0.40, 1.) plt.xlim(1, len(accuracies)) plt.ylabel('Total accuracy') plt.xlabel('Number of tasks') plt.plot(dataset_num, accuracies, marker=\".\") #plt.legend() plt.show()<\/code><\/pre>\n<\/p>\n<\/div>\n<\/details>\n<p>\u0422\u0430\u043a\u0436\u0435 \u0431\u044b\u043b\u043e \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u043e \u043e\u0431\u043d\u0430\u0440\u0443\u0436\u0435\u043d\u043e, \u0447\u0442\u043e, \u0434\u043b\u044f \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043d\u0430\u0432\u044b\u043a\u043e\u0432 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u043a\u0438, \u043c\u043e\u0436\u043d\u043e \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u0438\u0432\u044f\u0437\u044b\u0432\u0430\u0442\u044c \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u043d\u0430 \u0440\u0435\u0437\u0438\u043d\u043e\u0447\u043a\u0430\u0445 \u0440\u0430\u0437\u043d\u043e\u0439 \u0443\u043f\u0440\u0443\u0433\u043e\u0441\u0442\u0438 (\u0433\u0434\u0435 \u0443\u043f\u0440\u0443\u0433\u043e\u0441\u0442\u044c \u043f\u0440\u043e\u043f\u043e\u0440\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u0430 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0441\u0432\u044f\u0437\u0438), \u043d\u043e \u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u0437\u0430\u043c\u0435\u0434\u043b\u044f\u0442\u044c \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f (\u0442\u043e \u0435\u0441\u0442\u044c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b) \u0432\u0435\u0441\u043e\u0432, \u043a\u0430\u043a \u0431\u0443\u0434\u0442\u043e \u0434\u043b\u044f \u043d\u0438\u0445 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0441\u0438\u043b\u0430 \u0442\u0440\u0435\u043d\u0438\u044f \u043f\u0440\u0438 \u0441\u0434\u0432\u0438\u0433\u0435 \u043f\u0440\u043e\u043f\u043e\u0440\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u0430 \u0441\u0432\u044f\u0437\u0438. \u042d\u0442\u043e \u043e\u043f\u044f\u0442\u044c \u0441\u043b\u0435\u0433\u043a\u0430 \u0443\u0445\u0443\u0434\u0448\u0430\u0435\u0442 \u0441\u043f\u043e\u0441\u043e\u0431\u043d\u043e\u0441\u0442\u044c \u043c\u0435\u0442\u043e\u0434\u0430 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0442\u044c \u043d\u0430\u0432\u044b\u043a\u0438 \u043f\u0440\u0438 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u043c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438, \u043d\u043e \u0441\u0438\u043b\u044c\u043d\u043e \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0442 \u043f\u0430\u043c\u044f\u0442\u044c, \u043f\u043e\u0442\u043e\u043c\u0443 \u0447\u0442\u043e \u043d\u0435 \u043d\u0430\u0434\u043e \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0435 \u0432\u0435\u0441\u0430. \u0422\u0430\u043a\u043e\u0439 \u043c\u0435\u0442\u043e\u0434 \u043d\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f Weight Velocity Attenuation (WVA).<\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 WVA \u043d\u0430 \u0431\u0430\u0437\u0435 \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u043e\u0433\u043e \u043f\u043e \u043c\u043e\u0434\u0443\u043b\u044e \u0441\u0438\u0433\u043d\u0430\u043b\u0430 \u0442\u0443\u0442.<\/summary>\n<div class=\"spoiler__content\">\n<pre><code class=\"python\"># \u043a\u043e\u0434 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d \u043d\u0430 python 3.7 \u0438 tensorflow 1.15.0  import datetime from copy import deepcopy  import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data from tensorflow.python.training.optimizer import Optimizer   def _weight_variable(shape):     # \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u041a\u0430\u0439\u043c\u0438\u043d\u0443 \u0413\u0435 (\u0425\u0435)     stddev = 2. \/ np.sqrt(shape[0])     initial = tf.random.truncated_normal(shape=shape, mean=0.0, stddev=stddev)     return tf.Variable(initial, dtype=tf.float32)   def _bias_variable(shape):     # \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043d\u0443\u043b\u044f\u043c\u0438     initial = tf.constant(0.0, shape=shape)     return tf.Variable(initial, dtype=tf.float32)   class _WVA_SGD(tf.train.GradientDescentOptimizer):      def __init__(self, learning_rate, use_locking=False, name=\"GradientDescent\"):         super(_WVA_SGD, self).__init__(learning_rate, use_locking, name)      def minimize(self, loss, global_step=None, var_list=None,                  gate_gradients=Optimizer.GATE_OP, aggregation_method=None,                  colocate_gradients_with_ops=False, name=None,                  grad_loss=None, impacts=None):         \"\"\" comments \"\"\"         grads_and_vars = self.compute_gradients(             loss, var_list=var_list, gate_gradients=gate_gradients,             aggregation_method=aggregation_method,             colocate_gradients_with_ops=colocate_gradients_with_ops,             grad_loss=grad_loss)          vars_with_grad = [v for g, v in grads_and_vars if g is not None]         if not vars_with_grad:             raise ValueError(                 \"No gradients provided for any variable, check your graph for ops\"                 \" that do not support gradients, between variables %s and loss %s.\" %                 ([str(v) for _, v in grads_and_vars], loss))          if impacts is None:             processed_grads_and_vars = grads_and_vars         else:             impact = iter(impacts)             processed_grads_and_vars = []             for g, v in grads_and_vars:                 if g is None:                     processed_grads_and_vars.append((g, v))                 else:                     processed_grads_and_vars.append((tf.multiply(g, next(impact)), v))          return self.apply_gradients(processed_grads_and_vars,                                     global_step=global_step,                                     name=name)   class Model:     def __init__(self, shape, session):         \"\"\"         :param shape:   \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438 - \u0441\u043f\u0438\u0441\u043e\u043a \u0438\u0437 \u0447\u0438\u0441\u0435\u043b \u043d\u0435\u0439\u0440\u043e\u043d\u043e\u0432 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u043b\u043e\u0435 \u0441\u0435\u0442\u0438                         \u043e\u0442 \u0432\u0445\u043e\u0434\u0430 \u043a \u0432\u044b\u0445\u043e\u0434\u0443 \u0441\u043f\u0440\u0430\u0432\u0430 \u043d\u0430\u043b\u0435\u0432\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, [784, 100, 10]         :param session: tensorflow-\u0441\u0435\u0441\u0441\u0438\u044f \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u0432 \u0441\u0435\u0442\u0438         \"\"\"          self.session = session         self._shape = shape         depth = len(shape) - 1         if depth &lt; 1:             raise ValueError(\"\u041d\u0435\u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438!\")          # \u0437\u0430\u0433\u043b\u0443\u0448\u043a\u0438 \u0434\u043b\u044f \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445         self.x = tf.placeholder(tf.float32, shape=[None, shape[0]])         self.labels = tf.placeholder(tf.float32, shape=[None, shape[-1]])          # \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u043b\u043e\u0435\u0432 \u0441\u0435\u0442\u0438 \u0431\u0443\u0434\u0435\u043c \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0432 \u0441\u043f\u0438\u0441\u043a\u0435         self.var_list = []         for ins, outs in zip(shape[:-1], shape[1:]):             self.var_list.append(_weight_variable([ins, outs]))             self.var_list.append(_bias_variable([outs]))          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438         for v in self.var_list:             session.run(v.initializer)          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438         self.wb_importance = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u0442\u0440\u043e\u0438\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444         outputs = []         x, y, z = self.x, None, None         for i in range(depth):             z = tf.matmul(x, self.var_list[i * 2]) + self.var_list[i * 2 + 1]             y = tf.nn.softmax(z) if i == depth-1 else tf.nn.leaky_relu(z)             outputs.append(y)             x = y          # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438         self.loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=self.labels))          # \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c (accuracy)         self.correct_preds = tf.equal(tf.argmax(z, axis=1), tf.argmax(self.labels, axis=1))         self.accuracy = tf.reduce_mean(tf.cast(self.correct_preds, tf.float32))          # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0441\u0443\u043c\u043c\u0430\u0440\u043d\u044b\u0439 \u043f\u043e \u043c\u043e\u0434\u0443\u043b\u044e \u043f\u0440\u043e\u0448\u0435\u0434\u0448\u0438\u0439 \u0441\u0438\u0433\u043d\u0430\u043b         self.signals = []          os = tf.reduce_mean(tf.abs(self.x), axis=0)         for i in range(depth):             ws = tf.transpose(tf.multiply(os, tf.transpose(tf.abs(self.var_list[i*2]))))             self.signals.append(ws)             os = tf.reduce_mean(tf.abs(outputs[i]), axis=0)             self.signals.append(os)          self.train_step = None      def open_lesson(self, learning_rate=1.0, lmbda=0.0):         \"\"\"         \u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         :param learning_rate: \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f SGD         :param lmbda:         \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 - \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e                               \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0442\u044f\u043d\u0443\u0442 \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c         \"\"\"         impacts = [tf.constant(1. \/ (1. + lmbda * v)) for v in self.wb_importance]          # \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0448\u0430\u0433 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u0430         self.train_step = _WVA_SGD(learning_rate).minimize(self.loss, impacts=impacts)      def close_lesson(self, closing_set=None):         \"\"\"         \u0417\u0430\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435. \u0420\u0430\u0441\u0447\u0435\u0442 \u0438 \u043d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432.         :param closing_set: \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u044b \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         :return:         \"\"\"          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043d\u0430 \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         addendum = self.session.run(self.signals, feed_dict={self.x: closing_set})          # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043a \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u043d\u044b\u043c         for i, a in zip(self.wb_importance, addendum):             i += a   # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043f\u0435\u0440\u0435\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u0432\u0445\u043e\u0434\u044b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u0434\u043b\u044f \u0432\u0441\u0435\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 def permute_mnist(mnist):     perm_inds = list(range(mnist.train.images.shape[1]))     np.random.shuffle(perm_inds)     mnist2 = deepcopy(mnist)     sets = [\"train\", \"validation\", \"test\"]     for set_name in sets:         this_set = getattr(mnist2, set_name)         this_set._images = np.transpose(np.array([this_set.images[:, c] for c in perm_inds]))     return mnist2   def train_model(model, train_set, test_sets, batch_size=100, epochs=1):     \"\"\"     \u041e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438     :param model:       \u043e\u0431\u0443\u0447\u0430\u0435\u043c\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c     :param train_set:   \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442     :param test_sets:   \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0431\u0443\u0434\u0435\u0442 \u0441\u0447\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c     :param batch_size:  \u0440\u0430\u0437\u043c\u0435\u0440 \u0431\u0430\u0442\u0447\u0430     :param epochs:      \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u044d\u043f\u043e\u0445 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :return:            \u0441\u0440\u0435\u0434\u043d\u044f\u044f \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u043d\u0430 \u0442\u0435\u0441\u0442\u043e\u0432\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     \"\"\"     num_iters = int(np.ceil(len(train_set.train.labels) * epochs \/ batch_size))     for idx in range(num_iters):         train_batch = train_set.train.next_batch(batch_size)         feed_dict = {model.x: train_batch[0], model.labels: train_batch[1]}         model.train_step.run(feed_dict=feed_dict)         print(f'\\rTraining  {idx + 1}\/{num_iters} done.', end='')      print(f'\\rTraining  {num_iters}\/{num_iters} iterations done.')      accuracy = 0.     for t, test_set in enumerate(test_sets):         feed_dict = {model.x: test_set.test.images, model.labels: test_set.test.labels}         accuracy += model.accuracy.eval(feed_dict=feed_dict)     accuracy \/= len(test_sets)     print(f'Evaluating on {len(test_sets)} test sets done. Accuracy {accuracy}')     return accuracy   def continual_learning(net_struct, data_sets, session, lr, lmbda):     \"\"\"     \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043d\u0430 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u0430\u0445     :param net_struct: \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438     :param data_sets:  \u0441\u043f\u0438\u0441\u043e\u043a \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param session:    tf-\u0441\u0435\u0441\u0441\u0438\u044f     :param lr:         \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f     :param lmbda:      \u0441\u0442\u0435\u043f\u0435\u043d\u044c \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u043d\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435     :return:           \u0441\u043f\u0438\u0441\u043e\u043a \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u044b\u0445 \u043f\u043e \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043e\u0446\u0435\u043d\u043e\u043a     \"\"\"     model = Model(net_struct, session)     test_sets = []     accuracies = []     for data_set in data_sets:         test_sets.append(data_set)         model.open_lesson(lr, lmbda)         accuracy = train_model(model, data_set, test_sets, 100, 4)         accuracies.append(accuracy)         model.close_lesson(data_set.validation.images)     del model     return accuracies  # \u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435 MNIST mnist = input_data.read_data_sets('MNIST_data', one_hot=True) # \u0441\u043e\u0437\u0434\u0430\u0435\u043c tf-\u0441\u0435\u0441\u0441\u0438\u044e sess = tf.InteractiveSession()  # \u0441\u043e\u0437\u0434\u0430\u0435\u043c 10 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u0445 \u043e\u0431\u0443\u0447\u0430\u044e\u0449\u0438\u0445 \u043d\u0430\u0431\u043e\u0440\u043e\u0432 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f mnist0 = mnist mnist1 = permute_mnist(mnist) mnist2 = permute_mnist(mnist) mnist3 = permute_mnist(mnist) mnist4 = permute_mnist(mnist) mnist5 = permute_mnist(mnist) mnist6 = permute_mnist(mnist) mnist7 = permute_mnist(mnist) mnist8 = permute_mnist(mnist) mnist9 = permute_mnist(mnist)  start_time = datetime.datetime.now()  # \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043c \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f data_sets = [mnist0, mnist1, mnist2, mnist3, mnist4, mnist5, mnist6, mnist7, mnist8, mnist9] net_struct = [784, 300, 150, 10] lmbda = 250. learning_rate = 0.2  accuracies = continual_learning(net_struct, data_sets, sess, lr=learning_rate, lmbda=lmbda) print ('Total time spent', datetime.datetime.now() - start_time)  dataset_num = range(1, len(accuracies) + 1)  # \u043d\u0430\u0440\u0438\u0441\u0443\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0438 \u0441\u0440\u0435\u0434\u043d\u0435\u0439 \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0432\u0441\u0435\u0445 \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u0445 plt.figure(figsize=(7, 3.5)) plt.ylim(0.40, 1.) plt.xlim(1, len(accuracies)) plt.ylabel('Total accuracy') plt.xlabel('Number of tasks') plt.plot(dataset_num, accuracies, marker=\".\") #plt.legend() plt.show()<\/code><\/pre>\n<\/p>\n<\/div>\n<\/details>\n<p>\u0420\u0435\u0437\u044e\u043c\u0438\u0440\u0443\u0435\u043c. \u0415\u0441\u043b\u0438 \u0432\u044b \u043f\u043b\u0430\u043d\u0438\u0440\u0443\u0435\u0442\u0435 \u0443\u0447\u0438\u0442\u044c \u0432\u0430\u0448\u0443 \u043d\u0435\u0439\u0440\u043e\u0441\u0435\u0442\u043a\u0443 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0438 \u0440\u0430\u0437\u043d\u043e\u043c\u0443, \u0438 \u0443 \u0432\u0430\u0441 \u043c\u0430\u043b\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0438 \u043f\u0430\u043c\u044f\u0442\u0438, \u0442\u043e \u0441\u0442\u043e\u0438\u0442 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c WVA. \u0415\u0441\u043b\u0438 \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u043c\u0430\u043b\u043e, \u043d\u043e \u043f\u0430\u043c\u044f\u0442\u0438 \u0437\u0430\u0432\u0430\u043b\u0438\u0441\u044c, \u0442\u043e \u0441\u0442\u043e\u0438\u0442 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u043d\u0430 EWC-S. \u0415\u0441\u043b\u0438 \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0432\u0430\u0433\u043e\u043d, \u0430 \u043f\u0430\u043c\u044f\u0442\u0438 \u043c\u0430\u043b\u043e, \u0442\u043e \u0441\u0442\u043e\u0438\u0442 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0442\u044c \u043a\u0430\u043a \u0432 MAS, \u0430 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043a\u0430\u043a \u0432 WVA, \u0442\u043e \u0435\u0441\u0442\u044c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0433\u0438\u0431\u0440\u0438\u0434 WVA-MAS. \u0415\u0441\u043b\u0438 \u0435\u0441\u0442\u044c \u0438 \u0432\u0440\u0435\u043c\u044f, \u0438 \u043f\u0430\u043c\u044f\u0442\u044c, \u0438 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043d\u0430\u0438\u043b\u0443\u0447\u0448\u0435\u0435 \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0435 \u043d\u0430\u0432\u044b\u043a\u043e\u0432 \u0431\u0435\u0437 \u043a\u043e\u043c\u043f\u0440\u043e\u043c\u0438\u0441\u0441\u043e\u0432, \u0438 \u043a\u043e\u0434 \u043f\u0438\u0441\u0430\u0442\u044c \u043d\u0443 \u043e\u0447\u0435\u043d\u044c \u043b\u0435\u043d\u0438\u0432\u043e, \u0442\u043e \u0441\u0442\u043e\u0438\u0442 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u043f\u043e\u043b\u043d\u043e\u0446\u0435\u043d\u043d\u044b\u0439 MAS.<\/p>\n<\/p>\n<p>P.S. \u041f\u043e\u0434\u043e\u0437\u0440\u0435\u0432\u0430\u044e, \u0447\u0442\u043e MAS \u0431\u0443\u0434\u0435\u0442 \u0432\u044b\u0431\u0438\u0440\u0430\u0442\u044c\u0441\u044f \u0447\u0430\u0449\u0435 \u0432\u0441\u0435\u0433\u043e \u0438\u043c\u0435\u043d\u043d\u043e \u043f\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0435\u0439 \u043f\u0440\u0438\u0447\u0438\u043d\u0435\u2026<\/p>\n<\/p>\n<p>P.P.S. \u0423 \u0432\u0441\u0435\u0445 \u043f\u0435\u0440\u0435\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u0445 \u043c\u0435\u0442\u043e\u0434\u043e\u0432 \u0435\u0441\u0442\u044c \u043e\u0434\u043d\u0430 \u0442\u043e\u043d\u043a\u043e\u0441\u0442\u044c \u2013 \u043e\u043d\u0438 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u0435\u0441\u043b\u0438 \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0435\u0442\u0438 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0433\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0435\u0441\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u0435\u0433\u043e (\u0432\u044b\u0445\u043e\u0434) \u0430\u043a\u0442\u0438\u0432\u0438\u0440\u0443\u044e\u0449\u0438\u0435. \u0415\u0441\u043b\u0438 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u0442 \u043f\u0440\u0438\u043c\u0435\u0440\u044b, \u0430\u043a\u0442\u0438\u0432\u0438\u0440\u0443\u044e\u0449\u0438\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0447\u0430\u0441\u0442\u044c \u0432\u044b\u0445\u043e\u0434\u043e\u0432, \u043d\u0443\u0436\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u0442\u044c \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u044c\u043d\u044b\u0435 \u0442\u0440\u044e\u043a\u0438 (\u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u043f\u043e\u0442\u0435\u0440\u044c \u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430 \u0430\u043a\u0442\u0438\u0432\u0438\u0440\u0443\u0435\u043c\u044b\u0445 \u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0432\u044b\u0445\u043e\u0434\u0430\u0445). \u041f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0432 \u0441\u0442\u0430\u0442\u044c\u0435 \u043f\u0440\u043e Synaptic Intelligence \u2013 \u0441\u043c. Split MNIST.<\/p>\n<\/p>\n<\/div>\n<p> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/536094\/\"> https:\/\/habr.com\/ru\/post\/536094\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"\n<div class=\"post__text post__text_v2\" id=\"post-content-body\">\n<p>\u042d\u0442\u0430 \u043c\u043e\u044f \u0441\u0442\u0430\u0442\u044c\u044f \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u0441\u0432\u044f\u0449\u0435\u043d\u0430 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0435 \u043a\u0430\u0442\u0430\u0441\u0442\u0440\u043e\u0444\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0437\u0430\u0431\u044b\u0432\u0447\u0438\u0432\u043e\u0441\u0442\u0438 \u0438 \u043d\u043e\u0432\u0435\u0439\u0448\u0438\u043c \u043c\u0435\u0442\u043e\u0434\u0430\u043c \u0435\u0435 \u0440\u0435\u0448\u0435\u043d\u0438\u044f. \u0411\u0443\u0434\u0443\u0442 \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u044b \u043f\u0440\u0438\u043c\u0435\u0440\u044b \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u044d\u0442\u0438\u0445 \u043c\u0435\u0442\u043e\u0434\u043e\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043b\u0435\u0433\u043a\u043e \u0430\u0434\u0430\u043f\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043f\u043e\u0434 \u043f\u043e\u0447\u0442\u0438 \u043b\u044e\u0431\u0443\u044e \u043a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u044e \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u0438.<\/p>\n<p> \u0421\u043d\u0430\u0447\u0430\u043b\u0430 \u043d\u0430\u043f\u043e\u043c\u043d\u0438\u043c, \u0447\u0442\u043e \u044d\u0442\u043e, \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e, \u0437\u0430 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430. \u0415\u0441\u043b\u0438 \u0432\u0434\u0440\u0443\u0433 \u0442\u0430\u043a \u043e\u043a\u0430\u0437\u0430\u043b\u043e\u0441\u044c, \u0447\u0442\u043e \u0432\u0430\u043c \u043d\u0443\u0436\u043d\u043e \u043e\u0431\u0443\u0447\u0430\u0442\u044c \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u0443\u044e \u0441\u0435\u0442\u043a\u0443 \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u043d\u0430 \u043e\u0434\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435, \u0430 \u0437\u0430\u0442\u0435\u043c \u043d\u0430 \u0434\u0440\u0443\u0433\u043e\u043c, \u0442\u043e \u0432\u044b \u043e\u0431\u043d\u0430\u0440\u0443\u0436\u0438\u0442\u0435, \u0447\u0442\u043e \u043f\u043e \u043c\u0435\u0440\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u0432\u0442\u043e\u0440\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0441\u0435\u0442\u043a\u0430 \u0431\u044b\u0441\u0442\u0440\u043e \u0437\u0430\u0431\u044b\u0432\u0430\u0435\u0442 \u043f\u0435\u0440\u0432\u044b\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u0442\u043e \u0435\u0441\u0442\u044c \u0442\u0435\u0440\u044f\u0435\u0442 \u043d\u0430\u0432\u044b\u043a, \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0439 \u043f\u0440\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u043d\u0430 \u043d\u0435\u043c. \u0418\u043b\u0438 \u0436\u0435 \u0435\u0441\u043b\u0438 \u0432\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0435 transfer learning \u0438 \u0434\u043e\u0443\u0447\u0438\u0432\u0430\u0435\u0442\u0435 \u0433\u043e\u0442\u043e\u0432\u0443\u044e \u0441\u0435\u0442\u043a\u0443 \u043d\u0430 \u0441\u0432\u043e\u0438\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u0430\u0445, \u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0430\u0431\u043b\u044e\u0434\u0430\u0442\u044c\u0441\u044f \u0442\u043e\u0442 \u0436\u0435 \u044d\u0444\u0444\u0435\u043a\u0442 \u2013 \u0441\u0435\u0442\u043a\u0430 \u0443\u0441\u043f\u0435\u0448\u043d\u043e \u0434\u043e\u0443\u0447\u0438\u0442\u0441\u044f \u043d\u0430 \u0432\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445, \u043d\u043e \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0443\u0442\u0435\u0440\u044f\u0435\u0442 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u0435 \u043d\u0430\u0432\u044b\u043a\u0438, \u0442\u043e \u0435\u0441\u0442\u044c \u0442\u043e, \u0440\u0430\u0434\u0438 \u0447\u0435\u0433\u043e \u0432\u0435\u0441\u044c transfer learning \u0438 \u0437\u0430\u0442\u0435\u0432\u0430\u043b\u0441\u044f. \u0415\u0441\u043b\u0438 \u0432\u0434\u0440\u0443\u0433 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043d\u0430\u0434\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0443\u0447\u0438\u0442\u044c\u0441\u044f, \u043d\u0435 \u0434\u0432\u0430 \u0430, \u043a \u043f\u0440\u0438\u043c\u0435\u0440\u0443, \u043f\u044f\u0442\u044c, \u0442\u043e \u043a \u043a\u043e\u043d\u0446\u0443 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u043f\u044f\u0442\u043e\u043c \u0441\u0435\u0442\u043a\u0430 \u0437\u0430\u0431\u0443\u0434\u0435\u0442 \u043f\u0435\u0440\u0432\u044b\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e. <\/p>\n<p>\u0421 \u044d\u0442\u043e\u0439 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u043e\u0439 \u043c\u044b \u0438\u043c\u0435\u0435\u043c \u0434\u0435\u043b\u043e \u0441 \u0441\u0435\u0440\u0435\u0434\u0438\u043d\u044b \u043f\u0440\u043e\u0448\u043b\u043e\u0433\u043e \u0432\u0435\u043a\u0430, \u0442\u043e \u0435\u0441\u0442\u044c \u0441 \u043c\u043e\u043c\u0435\u043d\u0442\u0430, \u043a\u043e\u0433\u0434\u0430 \u043d\u0430\u0447\u0430\u043b\u0438 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u044c\u0441\u044f \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u044b \u043f\u043e \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044e \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u044b\u0445 \u0441\u0435\u0442\u0435\u0439. \u0417\u0430 \u043f\u0440\u043e\u0448\u0435\u0434\u0448\u0435\u0435 \u0432\u0440\u0435\u043c\u044f \u043e\u0431 \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0443 \u043e\u0431\u043b\u043e\u043c\u0430\u043b\u0438 \u043d\u0435\u043c\u0430\u043b\u043e \u0437\u0443\u0431\u043e\u0432, \u0438 \u043e\u043d\u0430 \u0443\u0441\u043f\u0435\u043b\u0430 \u0432\u043f\u0438\u0442\u0430\u0442\u044c\u0441\u044f \u0432 \u043a\u043e\u043b\u043b\u0435\u043a\u0442\u0438\u0432\u043d\u043e\u0435 \u0431\u0435\u0441\u0441\u043e\u0437\u043d\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043a\u0430\u043a \u043d\u0435\u0447\u0442\u043e \u0442\u0440\u0443\u0434\u043d\u043e\u0440\u0430\u0437\u0440\u0435\u0448\u0438\u043c\u043e\u0435, \u0441 \u0447\u0435\u043c \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u043c\u0438\u0440\u0438\u0442\u044c\u0441\u044f \u0438\u043b\u0438 \u043f\u0440\u0438\u0434\u0443\u043c\u044b\u0432\u0430\u0442\u044c \u0440\u0430\u0437\u043d\u044b\u0435 \u0442\u0440\u044e\u043a\u0438 \u0434\u043b\u044f \u0442\u043e\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u0445\u043e\u0442\u044c \u043a\u0430\u043a-\u0442\u043e \u0441\u043d\u0438\u0437\u0438\u0442\u044c \u0435\u0435 \u043d\u0435\u0433\u0430\u0442\u0438\u0432\u043d\u043e\u0435 \u0432\u043b\u0438\u044f\u043d\u0438\u0435.<\/p>\n<p> \u041e\u0434\u043d\u0430\u043a\u043e \u0447\u0435\u0442\u044b\u0440\u0435 \u0433\u043e\u0434\u0430 \u043d\u0430\u0437\u0430\u0434 \u0433\u0440\u0443\u043f\u043f\u043e\u0439 \u00ab\u0431\u0440\u0438\u0442\u0430\u043d\u0441\u043a\u0438\u0445 \u0443\u0447\u0435\u043d\u044b\u0445\u00bb (\u043d\u0430 \u0441\u0430\u043c\u043e\u043c \u0434\u0435\u043b\u0435 \u044d\u0442\u043e \u0431\u044b\u043b\u0438 \u043f\u0430\u0440\u043d\u0438 \u0438\u0437 \u0431\u0440\u0438\u0442\u0430\u043d\u0441\u043a\u043e\u0433\u043e \u043e\u0442\u0434\u0435\u043b\u0435\u043d\u0438\u044f DeepMind) \u0431\u044b\u043b \u0441\u0434\u0435\u043b\u0430\u043d \u0437\u043d\u0430\u0447\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043f\u0440\u043e\u0440\u044b\u0432 \u2013 \u043e\u043d\u0438 \u043f\u0440\u0438\u0434\u0443\u043c\u0430\u043b\u0438 \u043c\u0435\u0442\u043e\u0434 \u044d\u043b\u0430\u0441\u0442\u0438\u0447\u043d\u043e\u0433\u043e \u0437\u0430\u043a\u0440\u0435\u043f\u043b\u0435\u043d\u0438\u044f \u0432\u0435\u0441\u043e\u0432 (<a href=\"https:\/\/www.pnas.org\/content\/114\/13\/3521\" rel=\"noopener noreferrer nofollow\"><abbr title=\"Elastic Weight Consolidation\">EWC<\/abbr><\/a>). \u0415\u0441\u043b\u0438 \u043e\u0431\u044a\u044f\u0441\u043d\u044f\u0442\u044c \u043d\u0430 \u043f\u0430\u043b\u044c\u0446\u0430\u0445, \u0442\u043e \u0435\u0433\u043e \u0441\u0443\u0442\u044c \u0432 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u043c. \u0415\u0441\u043b\u0438 \u043d\u0430\u0432\u044b\u043a \u043e\u0431\u0443\u0447\u0435\u043d\u043d\u043e\u0439 \u043d\u0435\u0439\u0440\u043e\u043d\u043d\u043e\u0439 \u0441\u0435\u0442\u043a\u0438 \u0437\u0430\u043a\u043b\u044e\u0447\u0435\u043d \u0432 \u0432\u0435\u0441\u0430\u0445 \u0435\u0435 \u0441\u0432\u044f\u0437\u0435\u0439 (\u0438 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0441\u0432\u044f\u0437\u0435\u0439, \u0430 \u0432\u043e\u043e\u0431\u0449\u0435 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432), \u0442\u043e \u00ab\u043d\u0435 \u0432\u0441\u0435 \u043e\u043d\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u044b\u00bb. \u0422\u043e \u0435\u0441\u0442\u044c \u043a\u0430\u043a\u0438\u0435-\u0442\u043e \u0441\u0432\u044f\u0437\u0438 \u0431\u043e\u043b\u0435\u0435 \u0432\u0430\u0436\u043d\u044b \u0434\u043b\u044f \u0432\u044b\u0443\u0447\u0435\u043d\u043d\u043e\u0433\u043e \u043d\u0430\u0432\u044b\u043a\u0430, \u043a\u0430\u043a\u0438\u0435-\u0442\u043e \u043c\u0435\u043d\u0435\u0435. \u0418\u0434\u0435\u044f \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e\u0431\u044b, \u043a\u043e\u0433\u0434\u0430 \u0441\u0435\u0442\u043a\u0430 \u0443\u0436\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0430 \u043d\u0430\u0432\u044b\u043a\u0443 (\u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443), \u043f\u0440\u0438 \u0434\u0430\u043b\u044c\u043d\u0435\u0439\u0448\u0435\u043c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u0434\u0440\u0443\u0433\u0438\u043c \u043d\u0430\u0432\u044b\u043a\u0430\u043c \u043d\u0435 \u0434\u0430\u0432\u0430\u0442\u044c \u0432\u0430\u0436\u043d\u044b\u043c \u0432\u0435\u0441\u0430\u043c \u0443\u0445\u043e\u0434\u0438\u0442\u044c \u0434\u0430\u043b\u0435\u043a\u043e \u043e\u0442 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439, \u0442\u043e \u0435\u0441\u0442\u044c \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043f\u0435\u0440\u0432\u043e\u043c\u0443 \u043d\u0430\u0432\u044b\u043a\u0443. \u0420\u0435\u0430\u043b\u0438\u0437\u0443\u0435\u0442\u0441\u044f \u044d\u0442\u043e \u0434\u043e\u0431\u0430\u0432\u043b\u0435\u043d\u0438\u0435\u043c \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u043e\u0433\u043e-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u0430 \u0432 \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438, \u0442\u0430\u043a \u0447\u0442\u043e \u043f\u0440\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440 \u0442\u044f\u043d\u0435\u0442 \u0435\u0433\u043e \u043d\u0430\u0437\u0430\u0434, \u0432 \u0441\u0442\u043e\u0440\u043e\u043d\u0443, \u043f\u0440\u043e\u0442\u0438\u0432\u043e\u043f\u043e\u043b\u043e\u0436\u043d\u0443\u044e \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044e. \u0418 \u0447\u0435\u043c \u00ab\u0432\u0430\u0436\u043d\u0435\u0435\u00bb \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440, \u0442\u0435\u043c \u0441\u0438\u043b\u044c\u043d\u0435\u0435 \u0435\u0433\u043e \u0442\u044f\u043d\u0435\u0442 \u043e\u0431\u0440\u0430\u0442\u043d\u043e. \u041f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043a\u0430\u043a \u0431\u0443\u0434\u0442\u043e \u043f\u0440\u0438\u0432\u044f\u0437\u0430\u043d\u044b \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c \u0440\u0435\u0437\u0438\u043d\u043a\u0430\u043c\u0438 \u0440\u0430\u0437\u043d\u043e\u0439 \u0443\u043f\u0440\u0443\u0433\u043e\u0441\u0442\u0438. <\/p>\n<p> \u0412\u0441\u0435 \u044d\u0442\u043e \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u043f\u0440\u043e\u0441\u0442\u043e \u0438 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u043e, \u043e\u0434\u043d\u0430\u043a\u043e \u043e\u0441\u043d\u043e\u0432\u043d\u0430\u044f \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u2013 \u043a\u0430\u043a \u043f\u043e\u043d\u044f\u0442\u044c, \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043a\u0430\u0436\u0434\u044b\u0439 \u0432\u0435\u0441 \u0438\u043b\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440 \u0441\u0435\u0442\u0438 \u0432\u0430\u0436\u0435\u043d \u0438\u043b\u0438 \u043d\u0430\u043e\u0431\u043e\u0440\u043e\u0442 \u2013 \u043d\u0435 \u0432\u0430\u0436\u0435\u043d. \u0422\u0443\u0442 \u00ab\u0431\u0440\u0438\u0442\u0430\u043d\u0441\u043a\u0438\u0435 \u0443\u0447\u0435\u043d\u044b\u0435\u00bb \u0442\u043e\u0436\u0435 \u043d\u0435 \u043e\u043f\u043b\u043e\u0448\u0430\u043b\u0438 \u0438 \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0438\u043b\u0438 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u00ab\u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438\u00bb \u0432\u0435\u0441\u043e\u0432 \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0435 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u044b \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0424\u0438\u0448\u0435\u0440\u0430. \u0418 \u044d\u0442\u043e \u043e\u0442\u043b\u0438\u0447\u043d\u043e \u0441\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e! \u0422\u043e \u0435\u0441\u0442\u044c, \u0435\u0441\u043b\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u043d\u0430 \u043f\u0435\u0440\u0432\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0442\u0430\u043a\u0438\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u043e\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432, \u0430 \u043f\u043e\u0442\u043e\u043c, \u043f\u0440\u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0438 \u043d\u0430 \u0432\u0442\u043e\u0440\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435, \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440 \u0432 \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438, \u0442\u043e \u0441\u0435\u0442\u043a\u0430 \u043d\u0430\u0443\u0447\u0438\u0442\u0441\u044f \u0432\u0442\u043e\u0440\u043e\u043c\u0443 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u0432 \u043d\u0430\u0432\u044b\u043a\u0430 \u043f\u0435\u0440\u0432\u043e\u0433\u043e. \u041d\u0443 \u043f\u043e\u0447\u0442\u0438 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u0432. \u0418 \u0442\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043c\u043e\u0436\u043d\u043e \u0434\u043e\u043e\u0431\u0443\u0447\u0438\u0442\u044c \u0441\u0435\u0442\u043a\u0443 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0445\u043e\u0442\u044c \u043d\u0430 \u0434\u0435\u0441\u044f\u0442\u043a\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u0432, \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044f \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0435 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b. \u0418 \u0432\u0441\u0435 \u043d\u0430\u0432\u044b\u043a\u0438 \u0431\u0443\u0434\u0443\u0442 \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0442\u044c\u0441\u044f \u043f\u043e\u043a\u0430 \u0431\u0443\u0434\u0435\u0442 \u0445\u0432\u0430\u0442\u0430\u0442\u044c \u0435\u043c\u043a\u043e\u0441\u0442\u0438 \u0441\u0435\u0442\u043a\u0438. <\/p>\n<p> \u041a \u0441\u0447\u0430\u0441\u0442\u044c\u044e, \u043f\u043e\u0442\u043e\u043c \u0435\u0449\u0435 \u043e\u0434\u0438\u043d \u043c\u0430\u0442\u0435\u043c\u0430\u0442\u0438\u043a <a href=\"https:\/\/www.pnas.org\/content\/115\/11\/E2496\" rel=\"noopener noreferrer nofollow\">\u0434\u043e\u043a\u0430\u0437\u0430\u043b<\/a>, \u0447\u0442\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u0435\u0435 \u043d\u0435 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0442\u044c, \u0430 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u0441\u0443\u043c\u043c\u0438\u0440\u043e\u0432\u0430\u0442\u044c, \u0447\u0442\u043e \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043f\u0440\u043e\u0449\u0435. \u041a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e, \u0443 \u043c\u0435\u0442\u043e\u0434\u0430 \u0432\u0441\u0435 \u0436\u0435 \u0435\u0441\u0442\u044c \u043f\u0430\u0440\u0430 \u043d\u0435\u0434\u043e\u0441\u0442\u0430\u0442\u043a\u043e\u0432: \u0447\u0442\u043e\u0431 \u0432\u0441\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e, \u0432\u044b\u0445\u043e\u0434 \u0441\u0435\u0442\u0438 \u0434\u043e\u043b\u0436\u0435\u043d \u0431\u044b\u0442\u044c \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u043d\u044b\u043c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435\u043c (\u0442\u043e \u0435\u0441\u0442\u044c softmax), \u0438 \u0438\u0437 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043d\u0443\u0436\u043d\u043e \u0441\u044d\u043c\u043f\u043b\u0438\u0440\u043e\u0432\u0430\u0442\u044c, \u0430 \u043f\u043e\u0442\u043e\u043c \u0438 \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444 \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0439 \u0434\u043b\u044f \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u0438 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0424\u0438\u0448\u0435\u0440\u0430 \u0438 \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u0435\u0433\u043e \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. \u0425\u043e\u0440\u043e\u0448\u0430\u044f \u043d\u043e\u0432\u043e\u0441\u0442\u044c \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e tensorflow \u0438\u043b\u0438 torch \u0432\u0441\u0435 \u0441\u0434\u0435\u043b\u0430\u0435\u0442 \u0437\u0430 \u0432\u0430\u0441, \u043f\u043b\u043e\u0445\u0430\u044f \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u0442\u044c \u043f\u0440\u0438\u0434\u0435\u0442\u0441\u044f \u043c\u043d\u043e\u0433\u043e.<\/p>\n<\/p>\n<p>\u0414\u0430\u043b\u0435\u0435 \u043f\u0440\u0438\u0432\u043e\u0436\u0443 \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 EWC \u0434\u043b\u044f \u0433\u043b\u0443\u0431\u043e\u043a\u043e\u0439 \u0441\u0435\u0442\u043a\u0438 \u0438\u0437 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u044b\u0445 \u0441\u043b\u043e\u0435\u0432. \u041f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u0441\u0435\u0442\u043a\u0438 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430\u043c \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442\u0441\u044f \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c: \u0431\u0435\u0440\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043e\u0442\u043a\u0440\u044b\u0432\u0430\u0435\u043c \u0443\u0440\u043e\u043a \u0434\u043b\u044f \u0441\u0435\u0442\u043a\u0438, \u0443\u0447\u0438\u043c \u0435\u0435, \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u0435\u043c \u0443\u0440\u043e\u043a, \u0441\u0447\u0438\u0442\u0430\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043d\u0430 \u0442\u0435\u043a\u0443\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435 \u0438, \u0441\u0443\u043c\u043c\u0438\u0440\u0443\u044f \u0441 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u043c\u0438 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c\u0438 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438, \u043f\u043e\u0432\u0442\u043e\u0440\u044f\u0435\u043c \u0432\u0441\u0435 \u0434\u043b\u044f \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430. <\/p>\n<details class=\"spoiler\">\n<summary>\u041f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 EWC \u0442\u0443\u0442.<\/summary>\n<div class=\"spoiler__content\">\n<pre><code># \u043a\u043e\u0434 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d \u043d\u0430 python 3.7 \u0438 tensorflow 1.15.0  import datetime from copy import deepcopy  import matplotlib.pyplot as plt import numpy as np import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data   def _weight_variable(shape):     # \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u043b\u043d\u043e\u0441\u0432\u044f\u0437\u043d\u043e\u0433\u043e \u0441\u043b\u043e\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u041a\u0430\u0439\u043c\u0438\u043d\u0443 \u0413\u0435 (\u0425\u0435)     stddev = 2. \/ np.sqrt(shape[0])     initial = tf.random.truncated_normal(shape=shape, mean=0.0, stddev=stddev)     return tf.Variable(initial, dtype=tf.float32)   def _bias_variable(shape):     # \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044f \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u043d\u0443\u043b\u044f\u043c\u0438     initial = tf.constant(0.0, shape=shape)     return tf.Variable(initial, dtype=tf.float32)   class Model:     def __init__(self, shape, session):         \"\"\"         :param shape:   \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438 - \u0441\u043f\u0438\u0441\u043e\u043a \u0438\u0437 \u0447\u0438\u0441\u0435\u043b \u043d\u0435\u0439\u0440\u043e\u043d\u043e\u0432 \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u043b\u043e\u0435 \u0441\u0435\u0442\u0438                         \u043e\u0442 \u0432\u0445\u043e\u0434\u0430 \u043a \u0432\u044b\u0445\u043e\u0434\u0443 \u0441\u043f\u0440\u0430\u0432\u0430 \u043d\u0430\u043b\u0435\u0432\u043e, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, [784, 100, 10]         :param session: tensorflow-\u0441\u0435\u0441\u0441\u0438\u044f \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u0432 \u0441\u0435\u0442\u0438         \"\"\"          self.session = session         self._shape = shape         depth = len(shape) - 1         if depth &lt; 1:             raise ValueError(\"\u041d\u0435\u0434\u043e\u043f\u0443\u0441\u0442\u0438\u043c\u0430\u044f \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0441\u0435\u0442\u0438!\")          # \u0437\u0430\u0433\u043b\u0443\u0448\u043a\u0438 \u0434\u043b\u044f \u0432\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445         self.x = tf.placeholder(tf.float32, shape=[None, shape[0]])         self.labels = tf.placeholder(tf.float32, shape=[None, shape[-1]])          # \u0432\u0441\u0435 \u0432\u0435\u0441\u0430 \u0441\u043b\u043e\u0435\u0432 \u0441\u0435\u0442\u0438 \u0431\u0443\u0434\u0435\u043c \u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0432 \u0441\u043f\u0438\u0441\u043a\u0435         self.var_list = []         for ins, outs in zip(shape[:-1], shape[1:]):             self.var_list.append(_weight_variable([ins, outs]))             self.var_list.append(_bias_variable([outs]))          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438         for v in self.var_list:             session.run(v.initializer)          # \u0441\u043f\u0438\u0441\u043e\u043a \u0434\u043b\u044f \u0445\u0440\u0430\u043d\u0435\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438         self.wb_importance = [np.zeros(v.shape, dtype=np.float32) for v in self.var_list]          # \u0441\u0442\u0440\u043e\u0438\u043c \u0432\u044b\u0447\u0438\u0441\u043b\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0433\u0440\u0430\u0444         x, y, z = self.x, None, None         for i in range(depth):             z = tf.matmul(x, self.var_list[i * 2]) + self.var_list[i * 2 + 1]             y = tf.nn.softmax(z) if i == depth-1 else tf.nn.leaky_relu(z)             x = y          # \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438         self.loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=z, labels=self.labels))          # \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c (accuracy)         self.correct_preds = tf.equal(tf.argmax(z, axis=1), tf.argmax(self.labels, axis=1))         self.accuracy = tf.reduce_mean(tf.cast(self.correct_preds, tf.float32))          # \u0441\u044d\u043c\u043f\u043b\u0438\u0440\u0443\u0435\u043c \u0438\u0437 \u0432\u044b\u0445\u043e\u0434\u0430 \u0441\u0435\u0442\u0438 \u043a\u0430\u043a \u0438\u0437 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u043d\u043e\u0433\u043e \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f         class_ind = tf.cast(tf.random.categorical(tf.math.log(y), 1)[0][0], tf.int32)         # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0433\u0440\u0430\u0434\u0438\u0435\u043d\u0442\u044b \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u0438         self.prob_grads = tf.gradients(tf.math.log(y[0, class_ind]), self.var_list)          self.train_step = None      def open_lesson(self, learning_rate=1.0, lmbda=0.0):         \"\"\"         \u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         :param learning_rate: \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0434\u043b\u044f SGD         :param lmbda:         \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 - \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0438\u043b\u044c\u043d\u043e                               \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0442\u044f\u043d\u0443\u0442 \u0432\u0435\u0441\u0430 \u043a \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c         \"\"\"         loss = self.loss          if hasattr(self, \"star_vars\") and lmbda != 0:             # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u043a \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u0438 \u0441\u043b\u0430\u0433\u0430\u0435\u043c\u044b\u0435-\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0442\u043e\u0440\u044b             for v in range(len(self._shape)*2-2):                 loss += tf.reduce_sum(tf.multiply(                     tf.constant(lmbda \/ 2. * self.wb_importance[v], tf.float32),                     tf.square(self.var_list[v] - tf.constant(self.star_vars[v], tf.float32))                 ))         # \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0448\u0430\u0433 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0442\u043e\u0440\u0430         self.train_step = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)      def close_lesson(self, closing_set=None):         \"\"\"         \u0417\u0430\u043a\u0440\u044b\u0442\u0438\u0435 \u0443\u0440\u043e\u043a\u0430 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0435\u0442\u0438 \u043d\u0430 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435. \u0420\u0430\u0441\u0447\u0435\u0442 \u0438 \u043d\u0430\u043a\u043e\u043f\u043b\u0435\u043d\u0438\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0435\u0439 \u0432\u0435\u0441\u043e\u0432.         :param closing_set: \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u0431\u0443\u0434\u0443\u0442 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u044b \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         :return:         \"\"\"          # \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0432\u0435\u0441\u043e\u0432 \u043d\u0430 \u0437\u0430\u043a\u0440\u044b\u0432\u0430\u044e\u0449\u0435\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         addendum = self._compute_fisher(closing_set)         # \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u043c \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043a \u0441\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u043d\u044b\u043c         for i, a in zip(self.wb_importance, addendum):             i += a         # \u0437\u0430\u043f\u043e\u043c\u0438\u043d\u0430\u0435\u043c \u0442\u0435\u043a\u0443\u0449\u0438\u0435 \u044d\u0442\u0430\u043b\u043e\u043d\u043d\u044b\u0435 \u0432\u0435\u0441\u0430 \u0441\u0435\u0442\u0438 \u043f\u043e\u0441\u043b\u0435 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f         self._store_weights_and_biases()      def _store_weights_and_biases(self):         self.star_vars = [v.eval() for v in self.var_list]      def _compute_fisher(self, closing_set):         # \u0432\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0435 \u0434\u0438\u0430\u0433\u043e\u043d\u0430\u043b\u044c\u043d\u044b\u0445 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439         # \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0424\u0438\u0448\u0435\u0440\u0430 \u0434\u043b\u044f \u0432\u0435\u0441\u043e\u0432 \u0441\u0435\u0442\u0438 \u043d\u0430 \u0437\u0430\u0434\u0430\u043d\u043d\u043e\u043c \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0435         num_samples = len(closing_set)          # \u0438\u043d\u0438\u0446\u0438\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043d\u0443\u043b\u044f\u043c\u0438         fisher = [np.zeros(self.var_list[v].shape, dtype=np.float32) for v in range(len(self.var_list))]          for i in range(num_samples):             # \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u043f\u0435\u0440\u0432\u044b\u0435 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u043d\u044b\u0435 \u043b\u043e\u0433\u0430\u0440\u0438\u0444\u043c\u0430 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u0438             feed_dict = {self.x: closing_set[i:i+1]}             derivatives =<\/code><\/pre>\n<\/div>\n<\/details>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-316012","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/316012","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=316012"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/316012\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=316012"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=316012"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=316012"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}