{"id":296141,"date":"2019-12-20T15:00:37","date_gmt":"2019-12-20T15:00:37","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=296141"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=296141","title":{"rendered":"EDA \u043f\u043e\u0434 \u0434\u0440\u0443\u0433\u0438\u043c \u0443\u0433\u043b\u043e\u043c"},"content":{"rendered":"\n<div class=\"post__text post__text-html js-mediator-article\" id=\"post-content-body\" data-io-article-url=\"https:\/\/habr.com\/ru\/post\/480532\/\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/zr\/g9\/ed\/zrg9ed_nsynok9a9aa2st6s0vjo.jpeg\" alt=\"image\"><\/p>\n<p>  \u041f\u043e\u0433\u043e\u0432\u043e\u0440\u0438\u043c \u043d\u0435 \u043f\u0440\u043e \u0435\u0434\u0443, \u0430 \u043f\u0440\u043e \u0440\u0430\u0437\u0432\u0435\u0434\u043e\u0447\u043d\u044b\u0439 \u0430\u043d\u0430\u043b\u0438\u0437 \u0434\u0430\u043d\u043d\u044b\u0445 (<a href=\"https:\/\/en.wikipedia.org\/wiki\/Exploratory_data_analysis\" rel=\"nofollow\">exploratory data analysis, EDA<\/a>) \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0439 \u043f\u0440\u0435\u043b\u044e\u0434\u0438\u0435\u0439 \u043f\u0435\u0440\u0435\u0434 \u043b\u044e\u0431\u044b\u043c \u0441\u0443\u0440\u043e\u0432\u044b\u043c ML.<br \/>  \u0411\u0443\u0434\u0435\u043c \u0447\u0435\u0441\u0442\u043d\u044b, \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0437\u0430\u043d\u0443\u0434\u043d\u044b\u0439, \u0438 \u0447\u0442\u043e\u0431\u044b \u0432\u044b\u0446\u0435\u043f\u0438\u0442\u044c \u0445\u043e\u0442\u044c \u043a\u0430\u043a\u0438\u0435-\u0442\u043e \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u0438\u043d\u0441\u0430\u0439\u0442\u044b \u043f\u0440\u043e \u043d\u0430\u0448\u0438 \u0434\u0430\u043d\u043d\u044b\u0435 \u2014 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0430\u043a\u0442\u0438\u0432\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f \u043b\u044e\u0431\u0438\u043c\u0443\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0443 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438.<br \/>  \u0410 \u0442\u0435\u043f\u0435\u0440\u044c \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u0438\u043c \u0447\u0442\u043e \u043c\u044b \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u043b\u0435\u043d\u0438\u0432\u044b (\u043d\u043e \u043b\u044e\u0431\u043e\u043f\u044b\u0442\u043d\u044b) \u0438 \u0431\u0443\u0434\u0435\u043c \u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u044c \u044d\u0442\u043e\u043c\u0443 \u043f\u043e\u0441\u0442\u0443\u043b\u0430\u0442\u0443 \u0432\u0441\u044e \u044d\u0442\u0443 \u0441\u0442\u0430\u0442\u044c\u044e.<br \/>  <a name=\"habracut\"><\/a><br \/>  \u0418\u0441\u0445\u043e\u0434\u044f \u0438\u0437 \u044d\u0442\u043e\u0433\u043e \u0437\u0430\u0434\u0430\u0434\u0438\u043c \u0441\u0435\u0431\u0435 \u0432\u043e\u043f\u0440\u043e\u0441: \u043d\u0435\u0442 \u043b\u0438 \u0432 \u043f\u0440\u0438\u0440\u043e\u0434\u0435 \u0442\u0430\u043a\u043e\u0433\u043e \u0445\u0438\u0442\u0440\u043e\u0433\u043e \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0431\u044b \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u043b \u043f\u0440\u043e\u0441\u0442\u043e \u043d\u0430\u0436\u0430\u0442\u044c CTRL+ENTER \u0432 \u043b\u044e\u0431\u0438\u043c\u043e\u0439 IDE \u0438 \u0432\u044b\u0432\u0435\u0441\u0442\u0438 \u043d\u0430 \u043e\u0434\u043d\u043e\u043c \u043b\u0438\u0448\u044c \u044d\u043a\u0440\u0430\u043d\u0435 (\u0431\u0435\u0437 \u043f\u0440\u043e\u043a\u0440\u0443\u0442\u043e\u043a \u0432\u043d\u0438\u0437 \u0438 \u0431\u0435\u0441\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u0445 \u043c\u0438\u043a\u0440\u043e\u0441\u043a\u043e\u043f\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0444\u0430\u0441\u0435\u0442\u043e\u0432) \u0446\u0435\u043b\u043e\u0441\u0442\u043d\u0443\u044e \u043a\u0430\u0440\u0442\u0438\u043d\u0443 \u0441 \u043f\u043e\u043b\u0435\u0437\u043d\u043e\u0439 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0435\u0439 \u043f\u0440\u043e \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442?<br \/>  \u041f\u0440\u0438 \u044d\u0442\u043e\u043c \u0434\u0435\u0440\u0436\u0438\u043c \u0432 \u0433\u043e\u043b\u043e\u0432\u0435 \u0434\u0440\u0443\u0433\u0443\u044e \u043c\u044b\u0441\u043b\u044c \u2014 \u0435\u0441\u043b\u0438 \u0442\u0430\u043a\u043e\u0439 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442 \u0438 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442, \u0442\u043e \u043e\u043d \u043d\u0435 \u0437\u0430\u043c\u0435\u043d\u0438\u0442 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u0438\u0439 EDA, \u043d\u043e \u0441\u0442\u0430\u043d\u0435\u0442 \u0434\u043b\u044f \u043d\u0430\u0441 \u0441\u0438\u043b\u044c\u043d\u044b\u043c \u043f\u043e\u0434\u0441\u043f\u043e\u0440\u044c\u0435\u043c \u0434\u043b\u044f \u0442\u0435\u0445 \u0441\u043b\u0443\u0447\u0430\u0435\u0432 \u043a\u043e\u0433\u0434\u0430 \u043d\u0435 \u0441\u0442\u043e\u0438\u0442 \u0447\u0430\u0441\u0430\u043c\u0438 \u0443\u043f\u0430\u0440\u044b\u0432\u0430\u0442\u044c\u0441\u044f \u043f\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u0447\u0442\u043e\u0431\u044b \u0431\u044b\u0441\u0442\u0440\u043e \u043f\u043e\u0434\u0447\u0435\u0440\u043a\u043d\u0443\u0442\u044c \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u043f\u0430\u0442\u0442\u0435\u0440\u043d\u044b \u0432 \u043d\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445.<\/p>\n<p>  \u0421\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u044d\u0442\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0438:  <\/p>\n<ol>\n<li> <a href=\"#preprocess\">\u041d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u043f\u0440\u0435\u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0438\u043d\u0433<\/a><\/li>\n<li> <a href=\"#lessinform\">\u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432<\/a><\/li>\n<li> <a href=\"#discret\">\u0414\u0438\u0441\u043a\u0440\u0435\u0442\u0438\u0437\u0430\u0446\u0438\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445<\/a><\/li>\n<li> <a href=\"#corfun\">Correlationfunnel<\/a><\/li>\n<li> <a href=\"#lrs\">Ranked Cross-Correlations<\/a><\/li>\n<li> <a href=\"#alluv\">easyalluvial<\/a><\/li>\n<\/ol>\n<p>  \u0417\u0430\u043a\u043e\u043d\u0447\u0438\u043c \u0441 \u0432\u0432\u043e\u0434\u043d\u043e\u0439 \u0438 \u0432\u043e\u0437\u044c\u043c\u0435\u043c \u0437\u0430 \u043e\u0441\u043d\u043e\u0432\u0443 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u043f\u0440\u0438\u043c\u0435\u0440.   <\/p>\n<div class=\"spoiler\"><b class=\"spoiler_title\">\u041f\u043e\u0434\u0445\u043e\u0434 \u043a \u0432\u044b\u0431\u043e\u0440\u0443 \u043f\u0440\u0438\u043c\u0435\u0440\u0430<\/b><\/p>\n<div class=\"spoiler_text\"><sub><i>\u0418\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e \u0445\u043e\u0442\u0435\u043b \u0432\u0437\u044f\u0442\u044c \u043a\u0430\u043a\u043e\u0439-\u0442\u043e \u043c\u0430\u043b\u043e\u0438\u0437\u0432\u0435\u0441\u0442\u043d\u044b\u0439 \u043c\u0430\u0441\u0441\u0438\u0432 \u0434\u0430\u043d\u043d\u044b\u0445, \u043d\u043e \u0432 \u0438\u0442\u043e\u0433\u0435 \u043f\u043e\u043d\u044f\u043b \u0447\u0442\u043e \u0434\u043b\u044f \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u044d\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u0445\u043e\u0440\u043e\u0448\u043e \u2014 \u043d\u0430\u0439\u0434\u0435\u043d\u043d\u044b\u0435 \u0437\u0430\u043a\u043e\u043d\u043e\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043c\u043e\u0433\u0443\u0442 \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u044c\u0441\u044f \u043d\u0435\u043e\u0447\u0435\u0432\u0438\u0434\u043d\u044b\u043c\u0438 \u0438 \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u0441\u043f\u043e\u0440\u043d\u044b\u043c\u0438, \u0430 \u0443 \u043d\u0430\u0441 \u0446\u0435\u043b\u044c -\u043f\u0440\u0435\u043f\u0430\u0440\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043c\u0430\u0441\u0441\u0438\u0432 \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u0430\u043c\u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0435 \u043e\u0431\u043b\u0430\u0434\u0430\u044f \u0430\u043f\u0440\u0438\u043e\u0440\u043d\u043e\u0439 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0435\u0439, \u043f\u043e\u043a\u0430\u0436\u0443\u0442 \u043d\u0430\u043c \u0442\u043e \u0447\u0442\u043e \u043c\u044b \u0438 \u0442\u0430\u043a \u0437\u043d\u0430\u0435\u043c, \u0442\u0435\u043c \u0441\u0430\u043c\u044b\u043c \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u044f \u0441\u0432\u043e\u044e \u0441\u043e\u0441\u0442\u043e\u044f\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c.<\/i><br \/>  <\/sub>  <\/div>\n<\/div>\n<p>  \u041d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0443\u0434\u043e\u0431\u043d\u044b\u043c \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u043c\u043d\u0435 \u043f\u043e\u043a\u0430\u0437\u0430\u043b\u0441\u044f \u0422\u0438\u0442\u0430\u043d\u0438\u043a, \u0435\u0433\u043e \u0440\u0430\u0437\u043c\u0435\u0440\u044b \u043d\u0435 \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u043c\u0430\u043b\u044b \u043a\u0430\u043a Iris, \u043e\u043d \u0438\u043c\u0435\u0435\u0442 \u043c\u0430\u043b\u043e\u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u044b\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435, \u043e\u043d \u0445\u043e\u0440\u043e\u0448\u043e \u0438\u0437\u0443\u0447\u0435\u043d \u0438 \u0438\u043c\u0435\u0435\u0442 \u043f\u043e\u043d\u044f\u0442\u043d\u044b\u0435 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u044b \u0438 \u0447\u0442\u043e \u043d\u0435\u043c\u0430\u043b\u043e\u0432\u0430\u0436\u043d\u043e \u2014 \u0438\u0441\u0442\u043e\u0440\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u043e\u0441\u043d\u043e\u0432\u0443. <br \/>  \u0422\u0435\u043c \u0431\u043e\u043b\u0435\u0435, \u0447\u0442\u043e \u044f \u043d\u0430\u0448\u0435\u043b \u043d\u0430 \u0425\u0430\u0431\u0440\u0435 \u0441\u0442\u0430\u0442\u044c\u044e \u0433\u0434\u0435 \u0430\u0432\u0442\u043e\u0440 \u043f\u0440\u043e\u0432\u0435\u043b \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0441\u043a\u0440\u0443\u043f\u0443\u043b\u0435\u0437\u043d\u044b\u0439 EDA \u044d\u0442\u043e\u0433\u043e \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u043a\u0430\u0440\u0442\u0438\u043d\u043e\u043a \u043f\u0440\u043e\u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u043e\u0432\u0430\u043b \u043d\u0430\u0439\u0434\u0435\u043d\u043d\u044b\u0435 \u0432\u044b\u0432\u043e\u0434\u044b. \u042d\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u0441\u0432\u043e\u0435 \u0440\u043e\u0434\u0430 \u043d\u0430\u0448 Baseline. <br \/>  \u0421\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u0441\u0442\u0430\u0442\u044c\u044e \u0441 \u0433\u0440\u043e\u043c\u043a\u0438\u043c \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435\u043c \u0434\u043b\u044f \u043d\u0430\u0448\u0435\u0433\u043e \u00abBaseline_EDA\u00bb: <br \/>  <a href=\"https:\/\/habr.com\/ru\/company\/mlclass\/blog\/270973\/\">\u0422\u0438\u0442\u0430\u043d\u0438\u043a \u043d\u0430 Kaggle: \u0432\u044b \u043d\u0435 \u0434\u043e\u0447\u0438\u0442\u0430\u0435\u0442\u0435 \u044d\u0442\u043e\u0442 \u043f\u043e\u0441\u0442 \u0434\u043e \u043a\u043e\u043d\u0446\u0430<\/a><\/p>\n<p>  \u0427\u0442\u043e\u0431\u044b \u043d\u0435 \u0437\u0430\u043c\u043e\u0440\u0430\u0447\u0438\u0432\u0430\u0442\u044c\u0441\u044f \u0441\u043e \u0441\u043a\u0430\u0447\u0438\u0432\u0430\u043d\u0438\u0435\u043c\/\u0447\u0442\u0435\u043d\u0438\u0435\u043c csv \u0438\u0437 \u0441\u0435\u0442\u0438 \u0441\u0440\u0430\u0437\u0443 \u0446\u0435\u043f\u043b\u044f\u0435\u043c \u0438\u0437 CRAN \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044c\u043d\u044b\u0439 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 <\/p>\n<pre><code class=\"plaintext\">install.packages(\"titanic\")  data(\"titanic_train\",package=\"titanic\") <\/code><\/pre>\n<h1><a name=\"preprocess\"><\/a>\u041a\u0440\u0430\u0442\u043a\u0438\u0439 \u043f\u0440\u0435\u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0438\u043d\u0433<\/h1>\n<p>  \u0414\u0430\u043d\u043d\u044b\u0439 \u043f\u0440\u0438\u043c\u0435\u0440 \u043d\u0430\u0441\u0442\u043e\u043b\u044c\u043a\u043e \u0438\u0437\u044a\u0435\u0437\u0436\u0435\u043d \u0432 \u0441\u0435\u0442\u0438 \u043f\u0440\u0435\u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0438\u043d\u0433\u043e\u043c \u0432\u0434\u043e\u043b\u044c \u0438 \u043f\u043e\u043f\u0435\u0440\u0435\u043a, \u0447\u0442\u043e \u043e\u0441\u043e\u0431\u043e \u043e\u0431\u0441\u0430\u0441\u044b\u0432\u0430\u0442\u044c \u044d\u0442\u0443 \u0442\u0435\u043c\u0443 \u043d\u0435 \u0431\u0443\u0434\u0443, \u0434\u0435\u043b\u0430\u044e \u0431\u0430\u0437\u043e\u0432\u044b\u0435 \u0432\u0435\u0449\u0438: \u0438\u0437\u0432\u043b\u0435\u043a\u0430\u044e \u0438\u0437 \u0438\u043c\u0435\u043d\u0438 \u0433\u043e\u043d\u043e\u0440\u0430\u0442\u0438\u0432 (\u0442\u0438\u0442\u0443\u043b) \u043a\u0430\u043a \u0432\u0430\u0436\u043d\u044b\u0439 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440, \u043f\u043e \u043d\u0435\u043c\u0443 \u0434\u0435\u043b\u0430\u044e \u043c\u0435\u0434\u0438\u0430\u043d\u043d\u043e\u0435 \u0437\u0430\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u0435 \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u043e\u0432 \u0432 \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u0435.<\/p>\n<pre><code class=\"plaintext\">library(tidyverse) titanic_train %&gt;% str  d &lt;- titanic_train %&gt;% as_tibble %&gt;%   mutate(title=str_extract(Name,\"\\\\w+\\\\.\") %&gt;% str_replace(fixed(\".\"),\"\")) %&gt;%   mutate(title=case_when(title %in% c('Mlle','Ms')~'Miss', # \u043d\u043e\u0440\u043c\u0430\u043b\u0438\u0437\u0443\u0435\u043c \u0432\u0430\u0440\u0438\u0430\u0446\u0438\u0438                          title=='Mme'~ 'Mrs',                          title %in% c('Capt','Don','Major','Sir','Jonkheer', 'Col')~'Sir',                          title %in% c('Dona', 'Lady', 'Countess')~'Lady',                          TRUE~title)) %&gt;%   mutate(title=as_factor(title),          Survived=factor(Survived,levels = c(0,1),labels=c(\"no\",\"yes\")),          Sex=as_factor(Sex),          Pclass=factor(Pclass,ordered = T)) %&gt;%   group_by(title) %&gt;% # \u043d\u0438\u0436\u0435 - \u0437\u0430\u043f\u043e\u043b\u043d\u044f\u0435\u043c \u043f\u0440\u043e\u043f\u0443\u0441\u043a\u0438 \u043c\u0435\u0434\u0438\u0430\u043d\u0430\u043c\u0438 \u043f\u043e \u0442\u0438\u0442\u0443\u043b\u0443   mutate(Age=replace_na(Age,replace = median(Age,na.rm = T))) %&gt;% ungroup  # \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0442\u0438\u0442\u0443\u043b\u043e\u0432 \u043f\u043e \u043f\u043e\u043b\u0443 \u0447\u0442\u043e\u0431\u044b \u0443\u0431\u0435\u0434\u0438\u0442\u044c\u0441\u044f \u0447\u0442\u043e \u0432\u0441\u0435 \u0432 \u043f\u043e\u0440\u044f\u0434\u043a\u0435 table(d$title,d$Sex)  <\/code><\/pre>\n<div class=\"scrollable-table\">\n<table>\n<tr>\n<th>title<\/th>\n<th>male<\/th>\n<th>female<\/th>\n<\/tr>\n<tr>\n<td>Mr<\/td>\n<td>517<\/td>\n<td>0<\/td>\n<\/tr>\n<tr>\n<td>Mrs<\/td>\n<td>0<\/td>\n<td>126<\/td>\n<\/tr>\n<tr>\n<td>Miss<\/td>\n<td>0<\/td>\n<td>185<\/td>\n<\/tr>\n<tr>\n<td>Master<\/td>\n<td>40<\/td>\n<td>0<\/td>\n<\/tr>\n<tr>\n<td>Sir<\/td>\n<td>8<\/td>\n<td>0<\/td>\n<\/tr>\n<tr>\n<td>Rev<\/td>\n<td>6<\/td>\n<td>0<\/td>\n<\/tr>\n<tr>\n<td>Dr<\/td>\n<td>6<\/td>\n<td>1<\/td>\n<\/tr>\n<tr>\n<td>Lady<\/td>\n<td>0<\/td>\n<td>2<\/td>\n<\/tr>\n<\/table>\n<\/div>\n<h1><a name=\"lessinform\"><\/a>\u041d\u0435 \u0432\u0441\u0435 \u0439\u043e\u0433\u0443\u0440\u0442\u044b \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u043f\u043e\u043b\u0435\u0437\u043d\u044b\u2026 <\/h1>\n<p>  \u041e\u0431\u044b\u0447\u043d\u043e \u043d\u0430 \u0441\u0442\u0430\u0440\u0442\u0435 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u043e\u0442\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u044e \u043c\u0430\u043b\u043e\u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u044b\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u0432 \u0441\u0442\u043e\u0440\u043e\u043d\u0443 (\u043e\u0442\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u044e \u0430 \u043d\u0435 \u0431\u0435\u0437\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u043d\u043e \u0443\u0434\u0430\u043b\u044f\u044e, \u043f\u043e\u0442\u043e\u043c\u0443 \u0447\u0442\u043e \u043a\u043e\u0433\u0434\u0430 \u0438\u0437 \u043c\u043e\u0434\u0435\u043b\u0438 \u0432\u044b\u0436\u0430\u043b \u043c\u0430\u043a\u0441\u0438\u043c\u0443\u043c, \u0438\u043d\u0436\u0438\u043d\u0438\u0440\u0438\u043d\u0433 \u043f\u043e \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u043c \u0438\u0437 \u043e\u0442\u043b\u043e\u0436\u0435\u043d\u043d\u044b\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 \u0434\u0430\u0435\u0442 \u0442\u0430\u043a\u0438 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0451\u043d\u043d\u044b\u0439 \u043f\u0440\u043e\u0446\u0435\u043d\u0442 \u043f\u0440\u0438\u0440\u043e\u0441\u0442\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0430 \u043c\u043e\u0434\u0435\u043b\u0438).<br \/>  \u041c\u0435\u0442\u0440\u0438\u043a\u043e\u0439 \u043e\u0446\u0435\u043d\u043a\u0438 \u00ab\u043f\u043e\u043b\u0435\u0437\u043d\u043e\u0441\u0442\u0438\u00bb \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u044f\u0432\u043b\u044f\u044e\u0442\u0441\u044f freqRatio (\u0441\u043e\u043e\u0442\u043d\u043e\u0448\u0435\u043d\u0438\u0435 \u0447\u0430\u0441\u0442\u043e\u0442 \u0441\u0430\u043c\u043e\u0433\u043e \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u043e\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0432\u0442\u043e\u0440\u043e\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e \u0447\u0430\u0441\u0442\u043e\u0442\u043d\u043e\u0441\u0442\u0438) \u0438 percentUnique (\u043c\u043e\u0449\u043d\u043e\u0441\u0442\u044c \u0438\u043b\u0438 cardinality \u2014 \u0434\u043e\u043b\u044f \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043e\u0442 \u043e\u0431\u0449\u0435\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439)<br \/>  \u0414\u0435\u0442\u0430\u043b\u044c\u043d\u0443\u044e \u0441\u043f\u0440\u0430\u0432\u043a\u0443 \u043c\u043e\u0436\u043d\u043e \u0443\u0432\u0438\u0434\u0435\u0442\u044c \u0438\u0437 \u043f\u0430\u043a\u0435\u0442\u0430 caret<br \/>  <code>?caret::nearZeroVar<\/code><\/p>\n<p>  <code>(feat.scan &lt;- caret::nearZeroVar(x = d,saveMetrics = T) %&gt;% rownames_to_column(\"featName\") %&gt;% as_tibble)<\/code><\/p>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/8q\/hs\/ji\/8qhsji8_xsdpbtizf6bqvghdk3a.jpeg\" alt=\"image\"><\/p>\n<p>  \u041c\u043d\u0435 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0443\u0434\u043e\u0431\u043d\u043e \u043c\u043e\u043d\u0438\u0442\u043e\u0440\u0438\u0442\u044c \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u0432 \u0434\u0432\u0443\u043c\u0435\u0440\u043d\u043e\u0439 \u043f\u043b\u043e\u0441\u043a\u043e\u0441\u0442\u0438 (\u043f\u0440\u043e\u043b\u043e\u0433\u0430\u0440\u0438\u0444\u043c\u0438\u0440\u043e\u0432\u0430\u0432 \u043e\u0431\u0435 \u043e\u0441\u0438 \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u0441\u043b\u0443\u0447\u0438\u043b\u0441\u044f overplotting \u0442\u043e\u0447\u0435\u043a \u0432 \u043e\u0434\u043d\u0443 \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0443\u044e \u043a\u0443\u0447\u0443 \u0438\u0437-\u0437\u0430 \u0442\u043e\u0447\u0435\u043a-\u0432\u044b\u0431\u0440\u043e\u0441\u043e\u0432).<br \/>  \u041d\u0438\u043a\u043e\u0433\u0434\u0430 \u043d\u0435 \u0437\u0430\u0434\u0430\u0432\u0430\u043b\u0441\u044f \u0432\u043e\u043f\u0440\u043e\u0441\u043e\u043c \u2014 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043b\u0438 \u044d\u0442\u043e\u0442 \u0448\u0430\u0433 EDA, \u043d\u043e \u043f\u043e\u043a\u0430 \u043f\u0438\u0441\u0430\u043b \u044d\u0442\u0443 \u0441\u0442\u0430\u0442\u044c\u044e \u0437\u0430\u0434\u0443\u043c\u0430\u043b\u0441\u044f: \u043c\u044b \u0436\u0435 \u0441\u0435\u0439\u0447\u0430\u0441 \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u043c \u0440\u0430\u0437\u0432\u0435\u0434\u043e\u0447\u043d\u044b\u0439 \u0430\u043d\u0430\u043b\u0438\u0437 \u043d\u0435\u043a\u043e\u0439 \u043f\u043e\u043b\u0435\u0437\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432, \u0438\u0445 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u0443\u044e \u043e\u0446\u0435\u043d\u043a\u0443, \u0442\u0430\u043a \u043f\u043e\u0447\u0435\u043c\u0443 \u0436 \u044d\u0442\u043e \u043d\u0435 EDA? <\/p>\n<pre><code class=\"plaintext\"># install.packages(\"ggrepel\") library(ggrepel) ggplot(feat.scan,aes(x=percentUnique,y=freqRatio,label=featName,col=featName))+ geom_point(size=2)+   geom_text_repel(data = feat.scan,size=5)+scale_x_log10()+scale_y_log10()+theme_bw() <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/7v\/fc\/ec\/7vfcecjnvcaog5hh93sbziy8ouc.jpeg\" alt=\"image\"><\/p>\n<p>  \u041c\u0430\u043b\u043e\u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u044b\u043c\u0438 \u0441\u0447\u0438\u0442\u0430\u0435\u043c \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u044b-\u0432\u044b\u0431\u0440\u043e\u0441\u044b \u043b\u0438\u0431\u043e \u043f\u043e \u043c\u043e\u0449\u043d\u043e\u0441\u0442\u0438 (\u043e\u0441\u044c \u0425) \u043b\u0438\u0431\u043e \u043f\u043e \u0441\u043e\u043e\u0442\u043d\u043e\u0448\u0435\u043d\u0438\u044e \u0447\u0430\u0441\u0442\u043e\u0442 (\u043e\u0441\u044c Y) \u0438 \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043e\u0442\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0435\u043c \u0432 \u0441\u0442\u043e\u0440\u043e\u043d\u0443:<br \/>  PassengerId; Name; Ticket; Cabin<\/p>\n<pre><code class=\"plaintext\">useless.feature &lt;- c(\"PassengerId\",\"Name\",\"Ticket\",\"Cabin\") d &lt;- d %&gt;% select_at(vars(-useless.feature)) <\/code><\/pre>\n<h1><a name=\"discret\"><\/a>\u042d\u0442\u0430 \u0432\u0441\u0435\u043b\u0435\u043d\u043d\u0430\u044f \u0434\u0438\u0441\u043a\u0440\u0435\u0442\u043d\u0430<\/h1>\n<p>  \u0414\u043b\u044f \u0442\u043e\u0433\u043e \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u043d\u0438\u043c\u0430\u0442\u044c \u043a\u0430\u043a \u043d\u0438\u0436\u0435\u043f\u0435\u0440\u0435\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u0435 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 \u043f\u043e\u0434\u0433\u043e\u0442\u043e\u0430\u0432\u043b\u0438\u0432\u0430\u044e\u0442 \u0434\u0430\u043d\u043d\u044b\u0435 \u2014 \u0432 \u044d\u0442\u043e\u043c \u0440\u0430\u0437\u0434\u0435\u043b\u0435 \u043f\u043e\u043a\u0430\u0436\u0435\u043c \u043d\u0430 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u043f\u0440\u0438\u043c\u0435\u0440\u0430\u0445 \u0447\u0442\u043e \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u0432 \u044d\u0442\u0438\u0445 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430\u0445 \u043d\u0430 \u044d\u0442\u0430\u043f\u0435 \u043f\u043e\u0434\u0433\u043e\u0442\u043e\u0432\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445.<br \/>  \u041d\u0430 \u043f\u0435\u0440\u0432\u043e\u043c \u0448\u0430\u0433\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043f\u0440\u0438\u0432\u0435\u0441\u0442\u0438 \u0432\u0441\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u043a \u0435\u0434\u0438\u043d\u043e\u043c\u0443 \u0442\u0438\u043f\u0443 \u2014 \u0447\u0430\u0441\u0442\u043e \u0434\u0430\u043d\u043d\u044b\u0435 \u0432 \u043e\u0434\u043d\u043e\u043c \u043d\u0430\u0431\u043e\u0440\u0435 \u043c\u043e\u0433\u0443\u0442 \u0431\u044b\u0442\u044c \u0438 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0430\u043b\u044c\u043d\u044b\u043c\u0438 \u0438 \u0447\u0438\u0441\u043b\u043e\u0432\u044b\u043c\u0438, \u043f\u0440\u0438\u0447\u0435\u043c \u0447\u0438\u0441\u043b\u0430 \u043c\u043e\u0433\u0443\u0442 \u0438\u043c\u0435\u0442\u044c \u0432\u044b\u0431\u0440\u043e\u0441\u044b \u0430 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0430\u043b\u044c\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u2014 \u0440\u0435\u0434\u043a\u0438\u0435 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0438. <br \/>  \u0414\u043b\u044f \u043a\u043e\u043d\u0432\u0435\u0440\u0442\u0430\u0446\u0438\u0438 \u043d\u0435\u043f\u0440\u0435\u0440\u044b\u0432\u043d\u044b\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 \u0432 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0430\u043b\u044c\u043d\u044b\u0435 \u043c\u043e\u0436\u043d\u043e \u0440\u0430\u0437\u043b\u043e\u0436\u0438\u0442\u044c \u043d\u0430\u0448\u0438 \u0447\u0438\u0441\u043b\u0430 \u043f\u043e \u0431\u0438\u043d\u0430\u043c \u0441 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0451\u043d\u043d\u044b\u043c \u043f\u0435\u0440\u0438\u043e\u0434\u043e\u043c \u0434\u0438\u0441\u043a\u0440\u0435\u0442\u0438\u0437\u0430\u0446\u0438\u0438.<br \/>  \u041f\u0440\u043e\u0441\u0442\u0435\u0439\u0448\u0438\u0439 \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0437\u043b\u043e\u0436\u0435\u043d\u0438\u044f \u043d\u0430 5 \u0431\u0438\u043d\u043e\u0432:  <\/p>\n<pre><code class=\"plaintext\">iris %&gt;% as_tibble %&gt;% mutate_if(is.numeric,.funs = ggplot2::cut_number,n=5) <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/mz\/bf\/wb\/mzbfwb5-xy8iddrjy7gvh_4mfvk.jpeg\" alt=\"image\"><br \/>  \u0414\u043b\u044f \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0438\u044f \u0441\u0438\u043b\u044b \u0438 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u043d\u043e\u0441\u0442\u0438 \u0432\u0437\u0430\u0438\u043c\u043e\u0441\u0432\u044f\u0437\u0435\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043e\u0432 \u0441\u0440\u0435\u0434\u0438 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0432\u0442\u043e\u0440\u043e\u0439 \u043f\u0440\u0438\u0435\u043c &#8212;<a href=\"https:\/\/hackernoon.com\/what-is-one-hot-encoding-why-and-when-do-you-have-to-use-it-e3c6186d008f\" rel=\"nofollow\"> one hot encoding<\/a><\/p>\n<pre><code class=\"plaintext\">library(recipes) iris %&gt;% as_tibble %&gt;% mutate_if(is.numeric,cut_number,n=5) %&gt;%    recipe(x = .) %&gt;% step_dummy(all_nominal(),one_hot = T) %&gt;%  prep %&gt;% juice %&gt;% glimpse <\/code><\/pre>\n<p>  \u0412\u043c\u0435\u0441\u0442\u043e 5 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u0443 \u043d\u0430\u0441 \u0438\u0445 \u0442\u0435\u043f\u0435\u0440\u044c 23, \u0437\u0430\u0442\u043e \u0431\u0438\u043d\u0430\u0440\u043d\u044b\u0445<br \/>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/tv\/qw\/c4\/tvqwc4gibltq3lghux0zhjgzwhc.jpeg\" alt=\"image\"><br \/>  \u0412 \u043e\u0431\u0449\u0435\u043c \u0442\u043e \u043d\u0430 \u044d\u0442\u043e\u043c \u0442\u0440\u044e\u043a\u0438 \u043f\u043e \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044e \u0437\u0430\u043a\u0430\u043d\u0447\u0438\u0432\u0430\u044e\u0442\u0441\u044f, \u043d\u043e \u0441 \u044d\u0442\u0438\u0445 \u044d\u0442\u0430\u043f\u043e\u0432 \u043a\u0430\u043a \u0440\u0430\u0437 \u043d\u0430\u0447\u0438\u043d\u0430\u0435\u0442\u0441\u044f \u0440\u0430\u0431\u043e\u0442\u0430 2-\u0445 \u0438\u0437 3-\u0445 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a \u0434\u043b\u044f \u043d\u0430\u0448\u0435\u0433\u043e \u00ab\u043d\u0435\u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u043e\u0433\u043e\u00bb EDA.<\/p>\n<p>  \u0414\u0430\u043b\u0435\u0435 \u044f \u0437\u043d\u0430\u043a\u043e\u043c\u043b\u044e \u0441 \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u044c\u044e 3-\u0445 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438:  <\/p>\n<ol>\n<li><b>Correlationfunnel<\/b> \u2014 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u0435 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u043d\u0430 \u0442\u0430\u0440\u0433\u0435\u0442 (\u0442.\u0435. \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0437\u0432\u0430\u0442\u044c \u044d\u0442\u043e EDA supervized learning)<\/li>\n<li><b>Lares<\/b> \u2014 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0432\u043b\u0438\u044f\u043d\u0438\u0435 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u043d\u0430 \u0434\u0440\u0443\u0433\u0438\u0435 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0434\u0440\u0443\u0433\u0438\u0445 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 (\u0442.\u0435. \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0437\u0432\u0430\u0442\u044c \u044d\u0442\u043e EDA unsupervized learning)<\/li>\n<li><b>easyalluvial<\/b> \u2014 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0441\u043e\u0432\u043e\u043a\u0443\u043f\u043d\u0443\u044e \u0432\u0437\u0430\u0438\u043c\u043e\u0441\u0432\u044f\u0437\u044c \u0441\u0433\u0440\u0443\u043f\u043f\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u0442\u043e\u043f \u00abX\u00bb \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u043d\u0430 \u0442\u0430\u0440\u0433\u0435\u0442 (\u0442.\u0435. \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0437\u0432\u0430\u0442\u044c \u044d\u0442\u043e EDA supervized learning)<\/li>\n<\/ol>\n<p>  \u0412\u0438\u0434\u043d\u043e \u0447\u0442\u043e \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u0443 \u043d\u0438\u0445 \u0440\u0430\u0437\u043d\u0430\u044f, \u043f\u043e\u044d\u0442\u043e\u043c\u0443, \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u044f \u044d\u0442\u0438 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438, \u044f \u0431\u0443\u0434\u0443 \u0446\u0438\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432\u044b\u0432\u043e\u0434\u044b \u0430\u0432\u0442\u043e\u0440\u0430 \u0438\u0437 <a href=\"https:\/\/habr.com\/ru\/company\/mlclass\/blog\/270973\/\">\u0441\u0442\u0430\u0442\u044c\u0438 <\/a> \u043d\u0430\u0448\u0435\u0433\u043e \u00abBaseline_EDA\u00bb \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0432\u044b\u0448\u0435\u043e\u043f\u0438\u0441\u0430\u043d\u043d\u043e\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u044d\u0442\u043e\u0433\u043e \u043f\u0430\u043a\u0435\u0442\u0430. (\u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440 \u0435\u0441\u043b\u0438 \u0430\u0432\u0442\u043e\u0440 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u044c \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u0430 \u043d\u0430 \u0432\u044b\u0436\u0438\u0432\u0430\u0435\u043c\u043e\u0441\u0442\u044c \u0442\u043e \u0432\u0441\u0442\u0430\u0432\u043b\u044e \u0442\u0430\u043a\u0443\u044e \u0446\u0438\u0442\u0430\u0442\u0443 \u0432 Correlationfunnel, \u0435\u0441\u043b\u0438 \u0432\u043e\u0437\u0440\u0430\u0441\u0442 \u043e\u0442 \u043a\u043b\u0430\u0441\u0441\u0430 \u2014 \u0442\u043e \u0432 Lares \u0438 \u0442.\u0434.)<\/p>\n<p>  \u041d\u0430 \u0441\u0446\u0435\u043d\u0435 \u043f\u0435\u0440\u0432\u0430\u044f \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430.<\/p>\n<h1><a name=\"corfun\"><\/a>correlationfunnel<\/h1>\n<p>  <a href=\"https:\/\/business-science.github.io\/correlationfunnel\/\" rel=\"nofollow\">correlationfunnel is to speed up Exploratory Data Analysis (EDA)<\/a><br \/>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/j3\/9t\/zb\/j39tzbul1cekgctjk7znwkdszhu.jpeg\" alt=\"image\"><\/p>\n<p>  \u0412 <a href=\"https:\/\/cran.r-project.org\/web\/packages\/correlationfunnel\/vignettes\/key_considerations.html\" rel=\"nofollow\">\u0432\u0438\u043d\u044c\u0435\u0442\u043a\u0435 <\/a> \u043a \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0435 \u043d\u0435\u043f\u043b\u043e\u0445\u043e \u043e\u043f\u0438\u0441\u0430\u043d\u0430 \u043c\u0435\u0442\u043e\u0434\u043e\u043b\u043e\u0433\u0438\u044f, \u043f\u0440\u0438\u0432\u0435\u0434\u0443 \u0444\u0440\u0430\u0433\u043c\u0435\u043d\u0442 \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043f\u043e \u0431\u0438\u043d\u0430\u0440\u043d\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c<br \/>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/hd\/7d\/li\/hd7dliqgmjdcsufitigzylb7hvy.jpeg\" alt=\"image\"><\/p>\n<p>  \u0411\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 \u043f\u0440\u0435\u0434\u043f\u043e\u043b\u0430\u0433\u0430\u0435\u0442 \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u0442\u0430\u0440\u0433\u0435\u0442\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439) \u0432 \u043d\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u0441\u0440\u0430\u0437\u0443 \u043d\u0430 \u043e\u0434\u043d\u043e\u0439 \u043a\u0430\u0440\u0442\u0438\u043d\u043a\u0435 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0441\u0438\u043b\u0443 \u0438 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u0432\u0437\u0430\u0438\u043c\u043e\u0441\u0432\u044f\u0437\u0438 \u0430 \u0442\u0430\u043a \u0436\u0435 \u0440\u0430\u043d\u0436\u0438\u0440\u0443\u0435\u0442 \u043f\u043e \u0443\u0431\u044b\u0432\u0430\u043d\u0438\u044e \u044d\u0442\u043e\u0439 \u0441\u0438\u043b\u044b \u043e\u0431\u0440\u0430\u0437\u0443\u044f \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u0443\u044e \u0432\u043e\u0440\u043e\u043d\u043a\u0443 (\u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043e\u0442\u0441\u044e\u0434\u0430 \u0438 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435)<br \/>  \u0412\u0441\u0442\u0440\u043e\u0435\u043d\u043d\u044b\u0435 \u0432 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0443 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u0430\u0446\u0438\u0438 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0442 \u0442\u0430\u043a \u0436\u0435 \u0441\u0432\u043e\u0434\u0438\u0442\u044c \u0432 Others \u043c\u0430\u043b\u043e\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u0435 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0438.<br \/>  \u0422\u0430\u043a \u043a\u0430\u043a \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 \u043d\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0441 \u0446\u0435\u043b\u043e\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u043c\u0438 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 \u2014 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u0443\u0435\u043c \u0438\u0445 \u0432 numeric \u0438 \u0432\u0435\u0440\u043d\u0435\u043c\u0441\u044f \u043a \u043d\u0430\u0448\u0435\u043c\u0443 \u0422\u0438\u0442\u0430\u043d\u0438\u043a\u0443.<\/p>\n<pre><code class=\"plaintext\">#install.packages(\"correlationfunnel\") library(correlationfunnel) d &lt;- d %&gt;% mutate_if(is.integer,as.numeric) d %&gt;% binarize(n_bins = 5,thresh_infreq = .02,one_hot = T) %&gt;% # \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0442\u0440\u043e\u0435\u043d\u043d\u043e\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u0435\u0439   correlate(target = Survived__yes) %&gt;% plot_correlation_funnel() # \"interactive = T\" - plotly! <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/-t\/wj\/l-\/-twjl-woesnakv9rnym9ndugn5i.jpeg\" alt=\"image\"><\/p>\n<p>  \u041f\u043e \u043e\u0441\u0438 \u0425 \u0443 \u043d\u0430\u0441 \u0441\u0438\u043b\u0430 \u0438 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438, \u043f\u043e \u043e\u0441\u0438 Y \u043d\u0430\u0448\u0438 \u043f\u0440\u0435\u0434\u043a\u0442\u043e\u0440\u044b, \u043e\u0442\u0440\u0430\u043d\u0436\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u043f\u043e \u0443\u0431\u044b\u0432\u0430\u043d\u0438\u044e. \u041f\u0435\u0440\u0432\u044b\u043c \u0441\u0432\u0435\u0440\u0445\u0443 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0442\u0440\u0430\u0436\u0430\u0435\u0442\u0441\u044f \u0442\u0430\u0440\u0433\u0435\u0442 \u0442.\u043a. \u0443 \u043d\u0435\u0433\u043e \u0441\u0430\u043c\u0430\u044f \u0441\u0438\u043b\u044c\u043d\u0430\u044f \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f \u0441 \u0441\u0430\u043c\u0438\u043c \u0441\u043e\u0431\u043e\u0439 (-1;1)<br \/>  \u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043c \u043a\u0430\u043a \u0432\u044b\u0432\u043e\u0434\u044b \u043f\u043e \u044d\u0442\u043e\u043c\u0443 \u0433\u0440\u0430\u0444\u0438\u043a\u0443 \u043f\u0435\u0440\u0435\u0441\u0435\u043a\u0430\u044e\u0442\u0441\u044f \u0441 \u0432\u044b\u0432\u043e\u0434\u0430\u043c\u0438 \u0430\u0432\u0442\u043e\u0440\u0430 \u043d\u0430\u0448\u0435\u0433\u043e \u00abBaseline_EDA\u00bb<\/p>\n<blockquote><p>\u0421\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u0433\u0440\u0430\u0444\u0438\u043a \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442 \u0442\u0435\u043e\u0440\u0438\u044e, \u0447\u0442\u043e \u0447\u0435\u043c \u0432\u044b\u0448\u0435 \u043a\u043b\u0430\u0441\u0441 \u043a\u0430\u044e\u0442\u044b \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u0430 \u2014 \u0442\u0435\u043c \u0431\u043e\u043b\u044c\u0448\u0435 \u0448\u0430\u043d\u0441\u044b \u0432\u044b\u0436\u0438\u0442\u044c. (\u041f\u043e\u0434 \u00ab\u0432\u044b\u0448\u0435\u00bb&#187; \u044f \u0438\u043c\u0435\u044e \u0432\u0432\u0438\u0434\u0443 \u043e\u0431\u0440\u0430\u0442\u043d\u044b\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a, \u0442.\u043a. \u043f\u0435\u0440\u0432\u044b\u0439 \u043a\u043b\u0430\u0441\u0441 \u0432\u044b\u0448\u0435 \u0447\u0435\u043c \u0432\u0442\u043e\u0440\u043e\u0439 \u0438, \u0442\u0435\u043c \u0431\u043e\u043b\u0435\u0435, \u0442\u0440\u0435\u0442\u0438\u0439.)<\/p><\/blockquote>\n<p>  \u0412\u043e\u0440\u043e\u043d\u043a\u0430 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0447\u0442\u043e \u043a\u043b\u0430\u0441\u0441 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0442\u0440\u0435\u0442\u044c\u0438\u043c \u043f\u043e \u0441\u0438\u043b\u0435 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u043c \u0438 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0443 3 \u043a\u043b\u0430\u0441\u0441\u0430 \u043e\u0431\u0440\u0430\u0442\u043d\u0430\u044f \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f, \u0443 1\u0433\u043e \u2014 \u0441\u0438\u043b\u044c\u043d\u0430\u044f \u043f\u043e\u043b\u043e\u0436\u0438\u0442\u0435\u043b\u044c\u043d\u0430\u044f.<\/p>\n<blockquote><p>\u0421\u0440\u0430\u0432\u043d\u0438\u043c \u0448\u0430\u043d\u0441\u044b \u0432\u044b\u0436\u0438\u0442\u044c \u0443 \u043c\u0443\u0436\u0447\u0438\u043d \u0438 \u0436\u0435\u043d\u0449\u0438\u043d. \u0414\u0430\u043d\u043d\u044b\u0435 \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u044e\u0442 \u0442\u0435\u043e\u0440\u0438\u044e, \u0432\u044b\u0441\u043a\u0430\u0437\u0430\u043d\u043d\u0443\u044e \u0440\u0430\u043d\u0435\u0435.<br \/>  (\u0412 \u0446\u0435\u043b\u043e\u043c, \u0443\u0436\u0435 \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0437\u0430\u0442\u044c, \u0447\u0442\u043e \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u043c\u0438 \u0444\u0430\u043a\u0442\u043e\u0440\u0430\u043c\u0438 \u043c\u043e\u0434\u0435\u043b\u0438 \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u043b \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u0430)<\/p><\/blockquote>\n<p>  \u0412\u043e\u0440\u043e\u043d\u043a\u0430 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0447\u0442\u043e \u043f\u043e\u043b \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u0430 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f 2\u043c \u043f\u043e \u0441\u0442\u0435\u043f\u0435\u043d\u0438 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438, \u0436\u0435\u043d\u0441\u043a\u0438\u0439 \u043f\u043e\u043b \u043a\u043e\u0440\u0440\u0435\u043b\u0438\u0440\u043e\u0432\u0430\u043d \u0441 \u0432\u044b\u0436\u0438\u0432\u0430\u043d\u0438\u0435\u043c, \u043c\u0443\u0436\u0441\u043a\u043e\u0439 \u2014 \u0441\u043e \u0441\u043c\u0435\u0440\u044c\u044e.<\/p>\n<blockquote><p>\u0422\u0430\u043a\u0436\u0435 \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u0442\u044c \u0433\u0438\u043f\u043e\u0442\u0435\u0437\u0443, \u0447\u0442\u043e \u0432\u044b\u0436\u0438\u0432\u0430\u044e\u0442 \u0431\u043e\u043b\u0435\u0435 \u043c\u043e\u043b\u043e\u0434\u044b\u0435, \u0442.\u043a. \u043e\u043d\u0438 \u0431\u044b\u0441\u0442\u0440\u0435\u0435 \u0434\u0432\u0438\u0433\u0430\u044e\u0442\u0441\u044f, \u043b\u0443\u0447\u0448\u0435 \u043f\u043b\u0430\u0432\u0430\u044e\u0442 \u0438 \u0442.\u0434.<br \/>  \u041a\u0430\u043a \u0432\u0438\u0434\u043d\u043e, \u044f\u0432\u043d\u0430\u044f \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u044c \u0437\u0434\u0435\u0441\u044c \u043d\u0435 \u043f\u0440\u043e\u0441\u043c\u0430\u0442\u0440\u0438\u0432\u0430\u0435\u0442\u0441\u044f.<\/p><\/blockquote>\n<p>  \u0412\u043e\u0440\u043e\u043d\u043a\u0430 \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0433\u043e\u0432\u043e\u0440\u0438\u0442 \u043e \u0441\u043b\u0430\u0431\u043e\u0439 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438 \u044d\u0442\u043e\u0433\u043e \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u0430 (\u043d\u0430\u043f\u043e\u043c\u043d\u044e \u0447\u0442\u043e \u0433\u043e\u043d\u043e\u0440\u0430\u0442\u0438\u0432\/\u0442\u0438\u0442\u0443\u043b \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u0442 \u0432 \u0441\u0435\u0431\u0435 \u0432\u043e\u0437\u0440\u0430\u0441\u0442 \u0438\u043c\u0435\u043d\u043d\u043e \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u0432\u043e\u0437\u0440\u0430\u0441\u0442 \u043d\u0435 \u0441\u0442\u043e\u043b\u044c \u0437\u043d\u0430\u0447\u0438\u043c), \u043d\u043e \u0434\u0430\u0436\u0435 \u0442\u0443\u0442 \u0432\u043e\u0440\u043e\u043d\u043a\u0430 \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0447\u0442\u043e \u0431\u043e\u043b\u044c\u0448\u0435 \u0448\u0430\u043d\u0441\u043e\u0432 \u0432\u044b\u0436\u0438\u0442\u044c \u0443 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0439 \u00ab\u043c\u0438\u043d\u0443\u0441 \u0431\u0435\u0441\u043a\u043e\u043d\u0435\u0447\u043d\u043e\u0441\u0442\u044c \u2014 20 \u043b\u0435\u0442\u00bb (\u0442.\u0435. \u0434\u0435\u0442\u0438) \u0438 30-38 (\u0441\u043e\u0441\u0442\u043e\u044f\u0442\u0435\u043b\u044c\u043d\u044b\u0435 \u043b\u044e\u0434\u0438, \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e 1 \u043a\u043b\u0430\u0441\u0441)<\/p>\n<blockquote><p>\u0414\u0430\u0432\u0430\u0439\u0442\u0435 \u0432\u0432\u0435\u0434\u0451\u043c \u0442\u0430\u043a\u043e\u0439 \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044c \u043a\u0430\u043a \u041f\u0440\u043e\u0446\u0435\u043d\u0442 \u0432\u044b\u0436\u0438\u0432\u0430\u0435\u043c\u043e\u0441\u0442\u0438 \u0438 \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 \u0435\u0433\u043e \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u044c \u043e\u0442 \u0433\u0440\u0443\u043f\u043f, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438\u0441\u044c \u043d\u0430 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0435\u043c \u044d\u0442\u0430\u043f\u0435<\/p><\/blockquote>\n<p>  (\u0433\u0440\u0443\u043f\u043f\u044b \u0443 \u0430\u0432\u0442\u043e\u0440\u0430 \u2014 \u0438\u043c\u0435\u0435\u0442\u0441\u044f \u0432 \u0432\u0438\u0434\u0443 \u0442\u0438\u0442\u0443\u043b).<br \/>  \u0412\u043e\u0440\u043e\u043d\u043a\u0430 \u043f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442 \u043d\u0430\u0439\u0434\u0435\u043d\u043d\u044b\u0435 \u0432\u044b\u0432\u043e\u0434\u044b \u0430\u0432\u0442\u043e\u0440\u0430<\/p>\n<blockquote><p>\u0422\u0435\u043f\u0435\u0440\u044c \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e, \u043a\u043e\u0442\u043e\u0440\u0443\u044e \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0438\u0437 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u0440\u043e\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u0438\u043a\u043e\u0432 \u043d\u0430 \u043a\u043e\u0440\u0430\u0431\u043b\u0435.<br \/>  \u041e\u0447\u0435\u043d\u044c \u043f\u043e\u0445\u043e\u0436\u0435, \u0447\u0442\u043e \u043d\u0430 \u0432\u044b\u0436\u0438\u0432\u0430\u0435\u043c\u043e\u0441\u0442\u044c \u043e\u0442\u0440\u0438\u0446\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0432\u043b\u0438\u044f\u0435\u0442 \u043a\u0430\u043a \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0438\u0435 \u0440\u043e\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u0438\u043a\u043e\u0432, \u0442\u0430\u043a \u0438 \u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u0438\u0437 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e.<\/p><\/blockquote>\n<p>  SibSP \u0432 \u0432\u043e\u0440\u043e\u043d\u043a\u0435 \u044f\u0432\u043d\u043e \u0433\u043e\u0432\u043e\u0440\u0438\u0442 \u043e \u0442\u043e\u043c \u0436\u0435.<\/p>\n<p>  \u041d\u0443 \u0438 \u043a\u043e\u043d\u0435\u0447\u043d\u043e \u043f\u043e\u043c\u0438\u043c\u043e \u0432\u044b\u0432\u043e\u0434\u043e\u0432 \u0430\u0432\u0442\u043e\u0440\u0430 \u0437\u0434\u0435\u0441\u044c \u043c\u043e\u0436\u043d\u043e \u0443\u0432\u0438\u0434\u0435\u0442\u044c \u0438 \u0434\u0440\u0443\u0433\u0438\u0435 \u0437\u0430\u043a\u043e\u043d\u043e\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438, \u0443\u0434\u043e\u0432\u043e\u043b\u044c\u0441\u0442\u0432\u0438\u0435 \u043e\u0442 \u0441\u043e\u0437\u0435\u0440\u0446\u0430\u043d\u0438\u044f \u043e\u0441\u0442\u0430\u0432\u043b\u044e \u0447\u0438\u0442\u0430\u0442\u0435\u043b\u044e<\/p>\n<h1><a name=\"lrs\"><\/a>Lares<\/h1>\n<p>  <a href=\"https:\/\/datascienceplus.com\/find-insights-with-ranked-cross-correlations\/\" rel=\"nofollow\">Find Insights with Ranked Cross-Correlations<\/a><br \/>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/sd\/yh\/6g\/sdyh6ghnnhtnjid9ay2k5s3d9we.png\" alt=\"image\"><\/p>\n<p>  \u0410\u0432\u0442\u043e\u0440 \u0434\u0430\u043d\u043d\u043e\u0439 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 \u043f\u043e\u0448\u0435\u043b \u0435\u0449\u0435 \u0434\u0430\u043b\u044c\u0448\u0435 \u2014 \u043e\u043d \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430 \u0442\u0430\u0440\u0433\u0435\u0442, \u043d\u043e \u0438 \u0432\u0441\u0435\u0445 \u043d\u0430 \u0432\u0441\u0435. <\/p>\n<blockquote><p>Ranked Cross-Correlations <u>not only explains relationships of a specific target feature with the rest but the relationship of all values in your data<\/u> in an easy to use and understand tabular format. <br \/>  It automatically converts categorical columns into numerical with one hot encoding (1s and 0s) and other smart groupings such as \u201cothers\u201d labels for not very frequent values and new features out of date features.<\/p><\/blockquote>\n<p>  \u041f\u043e \u0441\u0441\u044b\u043b\u043a\u0435 \u0432\u044b\u0448\u0435 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u043f\u0440\u0438\u043c\u0435\u0440 \u0433\u0434\u0435 \u0430\u0432\u0442\u043e\u0440 \u0441\u043a\u0430\u0440\u043c\u043b\u0438\u0432\u0430\u0435\u0442 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0437\u0432\u0435\u0437\u0434\u043d\u044b\u0445 \u0432\u043e\u0439\u043d \u0441\u0432\u043e\u0435\u043c\u0443 \u043f\u0430\u043a\u0435\u0442\u0443 \u0438 \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u0435\u0442 \u043d\u0430\u0439\u0434\u0435\u043d\u043d\u044b\u0435 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438, \u044f \u043d\u0430 \u0435\u0433\u043e \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u0435 \u0437\u0430\u043b\u0438\u043f, \u043e\u0447.\u043f\u043e\u043d\u0440\u0430\u0432\u0438\u043b\u043e\u0441\u044c.<br \/>  \u041f\u043e\u043f\u0440\u043e\u0431\u0443\u0435\u043c \u043d\u0430 \u043d\u0430\u0448\u0435\u043c \u043f\u0440\u0438\u043c\u0435\u0440\u0435.<\/p>\n<pre><code class=\"plaintext\"># \u041e\u0441\u0442\u043e\u0440\u043e\u0436\u043d\u043e, \u0442\u044f\u043d\u0435\u0442 \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u043c\u043d\u043e\u0433\u043e \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u044b\u0445 \u043f\u0430\u043a\u0435\u0442\u043e\u0432: # devtools::install_github(\"laresbernardo\/lares\") library(lares) corr_cross(df = d,top = 30) <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/wd\/mu\/pv\/wdmupvkf00yjchynm1mmsj_nxog.jpeg\" alt=\"image\"><\/p>\n<p>  \u041f\u043e\u043c\u0438\u043c\u043e \u043f\u0435\u0440\u0435\u0441\u0435\u0447\u0435\u043d\u0438\u044f \u0441 \u0432\u044b\u0432\u043e\u0434\u0430\u043c\u0438 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0446\u0438\u0442\u0430\u0442 \u0432 Correlationfunnell \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043c \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0435 \u0446\u0438\u0442\u0430\u0442\u044b \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0437\u0434\u0435\u0441\u044c \u043c\u043e\u0436\u0435\u043c \u0443\u0432\u0438\u0434\u0435\u0442\u044c \u0431\u0435\u0437\u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0442\u0430\u0440\u0433\u0435\u0442\u0430: <\/p>\n<blockquote><p>\u0422\u0430\u043a\u0436\u0435 \u043c\u043e\u0436\u043d\u043e \u043e\u0431\u043d\u0430\u0440\u0443\u0436\u0438\u0442\u044c \u0438 \u0434\u0440\u0443\u0433\u0438\u0435 \u0437\u0430\u043a\u043e\u043d\u043e\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438. \u041c\u0435\u0436\u0434\u0443 \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u043e\u043c \u0438 \u043a\u043b\u0430\u0441\u0441\u043e\u043c \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442 \u043e\u0442\u0440\u0438\u0446\u0430\u0442\u0435\u043b\u044c\u043d\u0430\u044f \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f, \u0447\u0442\u043e, \u0441\u043a\u043e\u0440\u0435\u0435 \u0432\u0441\u0435\u0433\u043e, \u0441\u0432\u044f\u0437\u0430\u043d\u043e \u0441 \u0431\u043e\u043b\u0435\u0435 \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u043d\u044b\u0435 \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u044b \u0447\u0430\u0449\u0435 \u043c\u043e\u0433\u043b\u0438 \u0441\u0435\u0431\u0435 \u043f\u043e\u0437\u0432\u043e\u043b\u0438\u0442\u044c \u0431\u043e\u043b\u0435\u0435 \u0434\u043e\u0440\u043e\u0433\u0443\u044e \u043a\u0430\u044e\u0442\u0443. <\/p><\/blockquote>\n<p>  \u0412 \u0446\u0438\u0442\u0430\u0442\u0435 \u0432\u044b\u0448\u0435 \u0430\u0432\u0442\u043e\u0440 \u0434\u0435\u043b\u0430\u0435\u0442 \u0442\u0430\u043a\u043e\u0439 \u0432\u044b\u0432\u043e\u0434 \u043f\u043e \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u043e\u043c\u0443 \u0430\u043d\u0430\u043b\u0438\u0437\u0443 2-\u0445 \u043f\u043e\u043b\u0435\u0439 \u0432 \u0441\u043e\u0432\u043e\u043a\u0443\u043f\u043d\u043e\u0441\u0442\u0438, <br \/>  \u0443 \u043d\u0430\u0441 \u0436\u0435 \u0441 \u0443\u0447\u0435\u0442\u043e\u043c One-Hot-Encoding \u044d\u0442\u043e \u0432\u0438\u0434\u043d\u043e \u043f\u043e \u0441\u0438\u043b\u044c\u043d\u043e\u0439 \u043f\u043e\u043b\u043e\u0436\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0439 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 Age+P_Class_1<\/p>\n<blockquote><p>\u041a\u0440\u043e\u043c\u0435 \u0442\u043e\u0433\u043e, \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c \u0431\u0438\u043b\u0435\u0442\u0430 \u0438 \u043a\u043b\u0430\u0441\u0441 \u0442\u0435\u0441\u043d\u043e \u0441\u0432\u044f\u0437\u0430\u043d\u044b (\u0432\u044b\u0441\u043e\u043a\u0438\u0439 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438), \u0447\u0442\u043e \u0432\u043f\u043e\u043b\u043d\u0435 \u043e\u0436\u0438\u0434\u0430\u0435\u043c\u043e.<\/p><\/blockquote>\n<p>  \u0422\u0440\u0435\u0442\u044c\u044f \u0441\u0442\u0440\u043e\u043a\u0430 \u0441\u0432\u0435\u0440\u0445\u0443: Fare+P_Class_1<\/p>\n<p>  \u041f\u043e\u043c\u0438\u043c\u043e \u043f\u0435\u0440\u0435\u0441\u0435\u0447\u0435\u043d\u0438\u044f \u0441 \u0432\u044b\u0432\u043e\u0434\u0430\u043c\u0438 \u0430\u0432\u0442\u043e\u0440\u0430 \u0442\u0443\u0442 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0434\u0447\u0435\u0440\u043a\u043d\u0443\u0442\u044c \u0442\u0430\u043a \u0436\u0435 \u043c\u043d\u043e\u0433\u043e \u0447\u0435\u0433\u043e \u0435\u0449\u0435 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0433\u043e, \u0442\u0430\u043a \u0436\u0435 \u043e\u0441\u0442\u0430\u0432\u043b\u044e \u0443\u0434\u043e\u0432\u043e\u043b\u044c\u0441\u0442\u0432\u0438\u0435 \u043e\u0442 \u0441\u043e\u0437\u0435\u0440\u0446\u0430\u043d\u0438\u044f \u0434\u043b\u044f \u0447\u0438\u0442\u0430\u0442\u0435\u043b\u044f.<\/p>\n<p>  \u041f\u043e\u043c\u0438\u043c\u043e \u043e\u043f\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0432\u044b\u0431\u043e\u0440\u0430 \u0442\u043e\u043f \u0425 \u0441\u0430\u043c\u044b\u0445 \u0441\u0438\u043b\u044c\u043d\u044b\u0445 \u0438\u043d\u0441\u0430\u0439\u0442\u043e\u0432 \u043c\u043e\u0436\u043d\u043e \u0442\u0430\u043a \u0436\u0435 \u043e\u0442\u0440\u0430\u0437\u0438\u0442\u044c \u0432\u0441\u044e \u043a\u0430\u0440\u0442\u0438\u043d\u0443 \u0438 \u043c\u0435\u0441\u0442\u043e \u044d\u0442\u0438\u0445 \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0445 \u0442\u043e\u0447\u0435\u043a \u0432 \u043e\u0431\u0449\u0435\u0439 \u043c\u0430\u0441\u0441\u0435<\/p>\n<pre><code class=\"plaintext\">corr_cross(df = d,type=2) <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/us\/pa\/ud\/uspaudtooaflobmfge5tgdi6h6q.jpeg\" alt=\"image\"><\/p>\n<h1><a name=\"alluv\"><\/a>easyalluvial<\/h1>\n<p>  <a href=\"https:\/\/www.datisticsblog.com\/2018\/10\/intro_easyalluvial\/#features\" rel=\"nofollow\">Data exploration with alluvial plots<\/a><br \/>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/gm\/xg\/fp\/gmxgfpjhfzpqgqiulecylpd6fge.gif\" alt=\"image\"><\/p>\n<p>  \u0417\u0434\u0435\u0441\u044c \u0430\u0432\u0442\u043e\u0440 \u0442\u0430\u043a \u0436\u0435 \u043a\u0430\u043a \u0438 \u0432 2-\u0445 \u043f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0438\u0445 \u043f\u0430\u043a\u0435\u0442\u0430\u0445 \u0432\u044b\u043f\u043e\u043b\u043d\u044f\u0435\u0442 \u043d\u0430 \u0441\u0442\u0430\u0440\u0442\u0435 \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u0430\u0446\u0438\u044e \u0447\u0438\u0441\u043b\u043e\u0432\u044b\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u043e\u0434\u043d\u0430\u043a\u043e \u0434\u0430\u043b\u044c\u0448\u0435 \u0435\u0433\u043e \u043f\u0443\u0442\u0438 \u0441 \u0442\u0435\u043c\u0438 \u0431\u0438\u0431\u043b\u043e\u0442\u0435\u043a\u0430\u043c\u0438 \u0440\u0430\u0441\u0445\u043e\u0434\u044f\u0442\u0441\u044f: \u0432\u043c\u0435\u0441\u0442\u043e {One-HotEncoding + \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u044f} \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 \u0440\u0430\u0441\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0435\u0442 \u0442\u043e\u043f \u0425 \u0441\u0430\u043c\u044b\u0445 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u044b\u0445 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 (\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u044c \u0440\u0435\u0448\u0430\u0435\u0442 \u0441\u0430\u043c \u2014 \u043a\u0430\u043a\u0438\u0435 \u043f\u0435\u0440\u0435\u0434\u0430\u0442\u044c) \u043f\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c, \u0444\u043e\u0440\u043c\u0438\u0440\u0443\u044f \u043f\u043e\u0442\u043e\u043a\u0438, \u0446\u0432\u0435\u0442 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0437\u0430\u0432\u0438\u0441\u0438\u043c \u043e\u0442 \u0442\u0430\u0440\u0433\u0435\u0442\u0430, \u0430 \u0448\u0438\u0440\u0438\u043d\u0430 \u043f\u043e\u0442\u043e\u043a\u0430 \u043e\u0442 \u0447\u0438\u0441\u043b\u0430 \u043d\u0430\u0431\u043b\u044e\u0434\u0435\u043d\u0438\u0439 \u0432 \u044d\u0442\u043e\u043c \u043f\u043e\u0442\u043e\u043a\u0435.<\/p>\n<p>  \u0427\u0438\u0441\u043b\u043e\u0432\u044b\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u0440\u0430\u0441\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u044e\u0442\u0441\u044f \u043d\u0430 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0438 HH (High High), MH(Medium High), M (Medium), ML (Medium Low), LL (Low Low)<\/p>\n<p>  \u0414\u043b\u044f \u043d\u0430\u0447\u0430\u043b\u0430 \u0432\u043e\u0437\u044c\u043c\u0451\u043c \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u044b \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0433\u0440\u0430\u0444\u0438\u043a\u0430 \u0438\u0437 correlationfunnel:<\/p>\n<pre><code class=\"plaintext\">cor.feat &lt;- c(\"title\",\"Sex\",\"Pclass\",\"Fare\") <\/code><\/pre>\n<p>  \u0414\u0430\u043b\u0435\u0435 \u0434\u0435\u043b\u0430\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a  <\/p>\n<pre><code class=\"plaintext\"># install.packages(\"easyalluvial\") library(easyalluvial)  al &lt;- d %&gt;% select(Survived,cor.feat) %&gt;%    alluvial_wide(fill_by = \"first_variable\") add_marginal_histograms(p = al,data_input = d,keep_labels = F) <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/p5\/rd\/xd\/p5rdxduvi-21s-xhwhvzxh5og88.jpeg\" alt=\"image\"><\/p>\n<p>  \u0414\u043b\u044f \u0446\u0438\u0442\u0430\u0442 \u0430\u0432\u0442\u043e\u0440\u0430 \u043f\u0435\u0440\u0435\u0440\u0438\u0441\u0443\u0435\u043c \u0433\u0440\u0430\u0444\u0438\u043a \u0441 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432  <\/p>\n<pre><code class=\"plaintext\">cor.feat &lt;- c(\"Sex\",\"Pclass\",\"Age\") al &lt;- d %&gt;% select(Survived,cor.feat) %&gt;%    alluvial_wide(fill_by = \"first_variable\") add_marginal_histograms(p = al,data_input = d,keep_labels = F) <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/yz\/pb\/o-\/yzpbo-6q9x0relwi6ewtpyqwlke.jpeg\" alt=\"image\"><\/p>\n<blockquote><p> \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u043f\u043e \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u043c\u0443 \u0433\u0440\u0430\u0444\u0438\u043a\u0443 \u043f\u0440\u0435\u043a\u0440\u0430\u0441\u043d\u043e \u0432\u0438\u0434\u043d\u043e, \u0447\u0442\u043e \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0433\u0440\u0443\u043f\u043f\u044b \u0432\u044b\u0436\u0438\u0432\u0448\u0438\u0445 \u2014 \u044d\u0442\u043e \u0436\u0435\u043d\u0449\u0438\u043d\u044b \u043f\u0435\u0440\u0432\u043e\u0433\u043e \u0438 \u0432\u0442\u043e\u0440\u043e\u0433\u043e \u043a\u043b\u0430\u0441\u0441\u0430 \u0432\u0441\u0435\u0445 \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u043e\u0432.<\/p><\/blockquote>\n<p>  \u0413\u0440\u0430\u0444\u0438\u043a \u043f\u043e\u043c\u0438\u043c\u043e \u044d\u0442\u043e\u0433\u043e \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 \u0447\u0442\u043e \u0432\u044b\u0436\u0438\u0432\u0448\u0438\u0435 \u0436\u0435\u043d\u0449\u0438\u043d\u044b 3 \u043a\u043b\u0430\u0441\u0441\u0430 \u0442\u0430\u043a \u0436\u0435 \u043d\u0435 \u043c\u0430\u043b\u043e\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u0430\u044f \u0433\u0440\u0443\u043f\u043f\u0430<\/p>\n<blockquote><p> \u0410 \u0441\u0440\u0435\u0434\u0438 \u043c\u0443\u0436\u0447\u0438\u043d \u0432\u044b\u0436\u0438\u043b\u0438 \u0432\u0441\u0435 \u043c\u0430\u043b\u044c\u0447\u0438\u043a\u0438 \u043c\u043e\u043b\u043e\u0436\u0435 15 \u043b\u0435\u0442 \u043a\u0440\u043e\u043c\u0435 \u0442\u0440\u0435\u0442\u044c\u0435\u0433\u043e \u043a\u043b\u0430\u0441\u0441\u0430 \u043e\u0431\u0441\u043b\u0443\u0436\u0438\u0432\u0430\u043d\u0438\u044f \u0438 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u0430\u044f \u0434\u043e\u043b\u044f \u043c\u0443\u0436\u0447\u0438\u043d \u0431\u043e\u043b\u0435\u0435 \u0441\u0442\u0430\u0440\u0448\u0435\u0433\u043e \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u0430 \u0438 \u0432 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u043c \u0438\u0437 \u043f\u0435\u0440\u0432\u043e\u0433\u043e \u043a\u043b\u0430\u0441\u0441\u0430.<\/p><\/blockquote>\n<p>  \u0421\u043a\u0430\u0437\u0430\u043d\u043d\u043e\u0435 \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442\u0441\u044f, \u043d\u043e \u043e\u043f\u044f\u0442\u044c \u0442\u0430\u043a\u0438 \u0432\u0438\u0434\u0438\u043c \u043f\u043e\u0442\u043e\u043a\u0438 \u0432\u044b\u0436\u0438\u0432\u0448\u0438\u0445 \u043c\u0443\u0436\u0447\u0438\u043d 3 \u043a\u043b\u0430\u0441\u0441\u0430 \u0432 \u043a\u0430\u0442\u0435\u0433\u043e\u0440\u0438\u0438 \u0432\u043e\u0437\u0440\u0430\u0441\u0442\u0430 LL, ML.<\/p>\n<p>  \u0412\u0441\u0435 \u0432\u044b\u0448\u0435 \u0431\u044b\u043b\u043e \u043f\u0440\u043e \u043f\u0430\u043a\u0435\u0442 \u00abeasyalluvial\u00bb, \u043e\u0434\u043d\u0430\u043a\u043e \u0430\u0432\u0442\u043e\u0440 \u043d\u0430\u043f\u0438\u0441\u0430\u043b \u0432\u0442\u043e\u0440\u043e\u0439 \u043f\u0430\u043a\u0435\u0442 \u00abparcats\u00bb \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u0432\u0435\u0440\u0445 plotly \u0434\u0435\u043b\u0430\u0435\u0442 \u0432\u044b\u0448\u0435\u043f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u043d\u044b\u0439 \u0433\u0440\u0430\u0444\u0438\u043a \u0438\u043d\u0442\u0435\u0440\u0430\u043a\u0442\u0438\u0432\u043d\u044b\u043c (\u043a\u0430\u043a \u0432 \u0437\u0430\u0433\u043e\u043b\u043e\u0432\u043a\u0435 \u044d\u0442\u043e\u0433\u043e \u0440\u0430\u0437\u0434\u0435\u043b\u0430).<br \/>  \u042d\u0442\u043e \u0434\u0430\u0435\u0442 \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0432\u0438\u0434\u0435\u0442\u044c tooltip-\u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442, \u043d\u043e \u0438 \u043f\u0435\u0440\u0435\u043e\u0440\u0438\u0435\u043d\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043f\u043e\u0442\u043e\u043a\u0438 \u0434\u043b\u044f \u043b\u0443\u0447\u0448\u0435\u0433\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u043e\u0433\u043e \u0432\u043e\u0441\u043f\u0440\u0438\u044f\u0442\u0438\u044f. (\u043a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e \u043f\u043e\u043a\u0430 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 \u043d\u0435 \u043e\u0447\u0435\u043d\u044c \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u043d\u0430 \u0438 \u043d\u0430 \u0442\u0438\u0442\u0430\u043d\u0438\u043a\u0435 \u0443 \u043c\u0435\u043d\u044f \u043f\u043e\u0434\u0442\u043e\u0440\u043c\u0430\u0436\u0438\u0432\u0430\u0435\u0442)<\/p>\n<pre><code class=\"plaintext\"># install.packages(\"parcats\") library(parcats) cor.feat &lt;- c(\"title\",\"Sex\",\"Pclass\",\"Fare\") a &lt;- d %&gt;% select(Survived,cor.feat) %&gt;%    alluvial_wide(fill_by = \"first_variable\") parcats(p = a,marginal_histograms = T,data_input = d) <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/bt\/bc\/c4\/btbcc4rkdkc6b6jwh9it_mk1y0a.jpeg\" alt=\"image\"><\/p>\n<h2>\u0411\u043e\u043d\u0443\u0441<\/h2>\n<p>  \u0411\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 easyalluvial \u043f\u043e\u043c\u0438\u043c\u043e \u0440\u0430\u0437\u0432\u0435\u0434\u043e\u0447\u043d\u043e\u0433\u043e \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0442\u0430\u043a\u0436\u0435 \u043c\u043e\u0436\u0435\u0442 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u043a\u0430\u043a \u0438\u043d\u0442\u0435\u0440\u043f\u0440\u0435\u0442\u0430\u0442\u043e\u0440 \u043c\u043e\u0434\u0435\u043b\u0435\u0439-\u0447\u0435\u0440\u043d\u044b\u0445 \u044f\u0449\u0438\u043a\u043e\u0432 (\u043c\u043e\u0434\u0435\u043b\u0438, \u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u044f \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u044b \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043d\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e \u043f\u043e\u043d\u044f\u0442\u044c \u2014 \u043f\u043e \u043a\u0430\u043a\u043e\u0439 \u043b\u043e\u0433\u0438\u043a\u0435 \u043c\u043e\u0434\u0435\u043b\u044c \u0434\u0430\u0435\u0442 \u043e\u0442\u0432\u0435\u0442 \u043d\u0430 \u043e\u0441\u043d\u043e\u0432\u0435 \u0442\u0435\u0445 \u0438\u043b\u0438 \u0438\u043d\u044b\u0445 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432).<br \/>  \u0421\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u0441\u0442\u0430\u0442\u044c\u044e \u0430\u0432\u0442\u043e\u0440\u0430: <a href=\"https:\/\/www.datisticsblog.com\/2019\/04\/visualising-model-response-with-easyalluvial\/\" rel=\"nofollow\">Visualise model response with alluvial plots<\/a><br \/>  \u041f\u0440\u0438\u0447\u0435\u043c \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u044c \u0432 \u0442\u043e\u043c \u0447\u0442\u043e \u0438\u0437 \u0432\u0441\u0435\u0445 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u044f \u0432\u0438\u0434\u0435\u043b, \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e\u0435 \u043d\u0430 \u043e\u0434\u043d\u043e\u043c \u0433\u0440\u0430\u0444\u0438\u043a\u0435 \u043e\u0431\u044a\u044f\u0441\u043d\u044f\u043b\u0441\u044f \u043e\u0442\u043a\u043b\u0438\u043a \u0447\u0435\u0440\u043d\u043e\u0433\u043e \u044f\u0449\u0438\u043a\u0430 \u043d\u0435 \u0431\u043e\u043b\u0435\u0435 \u0447\u0435\u043c \u0432 2 \u043c\u0435\u0440\u043d\u043e\u0439 \u0441\u0438\u0441\u0442\u0435\u043c\u0435 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442 (\u043f\u043e \u043e\u0434\u043d\u043e\u0439 \u043d\u0430 \u043a\u0430\u0436\u0434\u044b\u0439 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440), \u0446\u0432\u0435\u0442\u043e\u043c \u043e\u0431\u044a\u044f\u0441\u043d\u044f\u043b\u0441\u044f \u043e\u0442\u043a\u043b\u0438\u043a. <br \/>  \u0411\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 easyalluvial \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0434\u0435\u043b\u0430\u0442\u044c \u0442\u0430\u043a\u043e\u0435 \u0431\u043e\u043b\u0435\u0435 \u0447\u0435\u043c \u043f\u043e 2-\u043c \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u0430\u043c \u043e\u0434\u043d\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e (\u043b\u0443\u0447\u0448\u0435 \u043a\u043e\u043d\u0435\u0447\u043d\u043e \u043d\u0435 \u0443\u0432\u043b\u0435\u043a\u0430\u0442\u044c\u0441\u044f)<\/p>\n<p>  \u0414\u043b\u044f \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u043e\u0431\u0443\u0447\u0438\u043c \u043d\u0430 \u043d\u0430\u0448\u0435\u043c \u043c\u0430\u0441\u0441\u0438\u0432\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u0438 \u043e\u0442\u0440\u0430\u0437\u0438\u043c \u043e\u0431\u044a\u044f\u0441\u043d\u0435\u043d\u0438\u0435 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u043f\u043e 3\u043c \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u0430\u043c.  <\/p>\n<pre><code class=\"plaintext\">library(ranger) m &lt;- ranger(formula = Survived~.,data = d,mtry = 6,min.node.size = 5, num.trees = 600,             importance = \"permutation\") library(easyalluvial) (imp &lt;- importance(m) %&gt;% as.data.frame %&gt;% easyalluvial::tidy_imp(imp = .,df=d)) # \u0444\u0440\u0435\u0439\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u0438\u0437 \u043c\u043e\u0434\u0435\u043b\u0438 # \u0433\u0435\u043d\u0435\u0440\u0438\u043c N-\u043c\u0435\u0440\u043d\u043e\u0435 \u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u043e \u043f\u0440\u0435\u0434\u0438\u043a\u0442\u043e\u0440\u043e\u0432 \u0441 \u043a\u043e\u043c\u0431\u0438\u043d\u0430\u0446\u0438\u044f\u043c\u0438 (\u043a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e \u0432 \u0442\u043e\u043c.\u0447\u0438\u0441\u043b\u0435 \u0438 \u043d\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u044b\u043c\u0438!) \u0438\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 dspace &lt;- get_data_space(df = d,imp,degree = 3)  # \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u043c \u043e\u0442\u043a\u043b\u0438\u043a \u043f\u043e \u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u0443 pred = predict(m, data = dspace) alluvial_model_response(pred$predictions, dspace, imp, degree = 3) <\/code><\/pre>\n<p>  \u0422\u0430\u043a \u0436\u0435 \u0443 \u0430\u0432\u0442\u043e\u0440\u0430 \u0435\u0441\u0442\u044c \u043a\u043e\u043d\u043d\u0435\u043a\u0442\u043e\u0440 \u043a CARET-\u043c\u043e\u0434\u0435\u043b\u044f\u043c (\u043d\u0435 \u0437\u043d\u0430\u044e \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u044d\u0442\u043e \u0430\u043a\u0442\u0443\u0430\u043b\u044c\u043d\u043e \u0441\u0435\u0439\u0447\u0430\u0441 \u0443\u0447\u0438\u0442\u044b\u0432\u0430\u044f tidymodels)<\/p>\n<pre><code class=\"plaintext\">library(caret) trc &lt;- trainControl(method = \"none\") m &lt;- train(Survived~.,data = d,method=\"rf\",trControl=trc,importance=T) alluvial_model_response_caret(train = m,degree = 4,bins=5,stratum_label_size = 2.8)  <\/code><\/pre>\n<p>  <img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/qq\/qf\/iv\/qqqfivwgoucmfoikmwhp9mdwelw.jpeg\" alt=\"image\"><\/p>\n<h1>\u0417\u0430\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u0435<\/h1>\n<p>  \u0415\u0449\u0435 \u0440\u0430\u0437 \u043f\u043e\u0432\u0442\u043e\u0440\u044e\u0441\u044c \u0447\u0442\u043e \u043d\u0435 \u043f\u0440\u0438\u0437\u044b\u0432\u0430\u044e \u043a \u0437\u0430\u043c\u0435\u043d\u0435 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u043e\u0433\u043e EDA, \u043d\u043e \u0441\u043e\u0433\u043b\u0430\u0441\u0438\u0442\u0435\u0441\u044c \u2014 \u043f\u0440\u0438\u044f\u0442\u043d\u043e \u043a\u043e\u0433\u0434\u0430 \u0435\u0441\u0442\u044c \u0430\u043b\u044c\u0442\u0435\u0440\u043d\u0430\u0442\u0438\u0432\u0430, \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0449\u0430\u044f \u0441\u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0442\u044c \u043a\u0443\u0447\u0443 \u0432\u0440\u0435\u043c\u0435\u043d\u0438, \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0443\u0447\u0438\u0442\u044b\u0432\u0430\u044f \u0447\u0442\u043e \u0447\u0435\u043b\u043e\u0432\u0435\u043a\u0438 \u043e\u0442 \u043f\u0440\u0438\u0440\u043e\u0434\u044b \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u043b\u0435\u043d\u0438\u0432\u044b, \u0430 \u044d\u0442\u043e, \u043a\u0430\u043a \u0438\u0437\u0432\u0435\u0441\u0442\u043d\u043e, \u0434\u0432\u0438\u0433\u0430\u0442\u0435\u043b\u044c \u043f\u0440\u043e\u0433\u0440\u0435\u0441\u0441\u0430:)<\/div>\n<p>               <script class=\"js-mediator-script\">!function(e){function t(t,n){if(!(n in e)){for(var r,a=e.document,i=a.scripts,o=i.length;o--;)if(-1!==i[o].src.indexOf(t)){r=i[o];break}if(!r){r=a.createElement(\"script\"),r.type=\"text\/javascript\",r.async=!0,r.defer=!0,r.src=t,r.charset=\"UTF-8\";var d=function(){var e=a.getElementsByTagName(\"script\")[0];e.parentNode.insertBefore(r,e)};\"[object Opera]\"==e.opera?a.addEventListener?a.addEventListener(\"DOMContentLoaded\",d,!1):e.attachEvent(\"onload\",d):d() } } }t(\"\/\/mediator.mail.ru\/script\/2820404\/\",\"_mediator\")}(window);<\/script>      <br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/480532\/\"> https:\/\/habr.com\/ru\/post\/480532\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"\n<div class=\"post__text post__text-html js-mediator-article\" id=\"post-content-body\" data-io-article-url=\"https:\/\/habr.com\/ru\/post\/480532\/\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/webt\/zr\/g9\/ed\/zrg9ed_nsynok9a9aa2st6s0vjo.jpeg\" alt=\"image\"><\/p>\n<p>  \u041f\u043e\u0433\u043e\u0432\u043e\u0440\u0438\u043c \u043d\u0435 \u043f\u0440\u043e \u0435\u0434\u0443, \u0430 \u043f\u0440\u043e \u0440\u0430\u0437\u0432\u0435\u0434\u043e\u0447\u043d\u044b\u0439 \u0430\u043d\u0430\u043b\u0438\u0437 \u0434\u0430\u043d\u043d\u044b\u0445 (<a href=\"https:\/\/en.wikipedia.org\/wiki\/Exploratory_data_analysis\" rel=\"nofollow\">exploratory data analysis, EDA<\/a>) \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e\u0439 \u043f\u0440\u0435\u043b\u044e\u0434\u0438\u0435\u0439 \u043f\u0435\u0440\u0435\u0434 \u043b\u044e\u0431\u044b\u043c \u0441\u0443\u0440\u043e\u0432\u044b\u043c ML.<br \/>  \u0411\u0443\u0434\u0435\u043c \u0447\u0435\u0441\u0442\u043d\u044b, \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0437\u0430\u043d\u0443\u0434\u043d\u044b\u0439, \u0438 \u0447\u0442\u043e\u0431\u044b \u0432\u044b\u0446\u0435\u043f\u0438\u0442\u044c \u0445\u043e\u0442\u044c \u043a\u0430\u043a\u0438\u0435-\u0442\u043e \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u0438\u043d\u0441\u0430\u0439\u0442\u044b \u043f\u0440\u043e \u043d\u0430\u0448\u0438 \u0434\u0430\u043d\u043d\u044b\u0435 \u2014 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043f\u043e\u0442\u0440\u0430\u0442\u0438\u0442\u044c \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 \u0430\u043a\u0442\u0438\u0432\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044f \u043b\u044e\u0431\u0438\u043c\u0443\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0443 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438.<br \/>  \u0410 \u0442\u0435\u043f\u0435\u0440\u044c \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u0438\u043c \u0447\u0442\u043e \u043c\u044b \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u043b\u0435\u043d\u0438\u0432\u044b (\u043d\u043e \u043b\u044e\u0431\u043e\u043f\u044b\u0442\u043d\u044b) \u0438 \u0431\u0443\u0434\u0435\u043c \u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u044c \u044d\u0442\u043e\u043c\u0443 \u043f\u043e\u0441\u0442\u0443\u043b\u0430\u0442\u0443 \u0432\u0441\u044e \u044d\u0442\u0443 \u0441\u0442\u0430\u0442\u044c\u044e.  <\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-296141","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/296141","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=296141"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/296141\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=296141"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=296141"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=296141"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}