{"id":217963,"date":"2014-04-02T23:09:02","date_gmt":"2014-04-02T19:09:02","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=217963"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=217963","title":{"rendered":"<span class=\"post_title\">\u0410\u043d\u0430\u043b\u0438\u0437 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0445 \u0442\u0430\u0431\u043b\u0438\u0447\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0432 R<\/span>"},"content":{"rendered":"<div class=\"content html_format\"> \t\t\t\u041c\u0430\u0442\u0435\u0440\u0438\u0430\u043b \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u043b\u0435\u0437\u0435\u043d \u0442\u0435\u043c, \u043a\u0442\u043e \u043e\u0441\u0432\u0430\u0438\u0432\u0430\u0435\u0442 \u044f\u0437\u044b\u043a R \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442\u0430 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0442\u0430\u0431\u043b\u0438\u0447\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u0445\u043e\u0447\u0435\u0442 \u0443\u0432\u0438\u0434\u0435\u0442\u044c \u0441\u043a\u0432\u043e\u0437\u043d\u043e\u0439 \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0445 \u0448\u0430\u0433\u043e\u0432 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438.<br \/>  \u041d\u0438\u0436\u0435 \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u0435\u0442\u0441\u044f \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 csv-\u0444\u0430\u0439\u043b\u043e\u0432, \u0440\u0430\u0437\u0431\u043e\u0440 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u0441\u0442\u0440\u043e\u043a \u0441 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u0430\u043c\u0438 \u043e\u0447\u0438\u0441\u0442\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445, \u0430\u0433\u0440\u0435\u0433\u0430\u0446\u0438\u044f \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u043e \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f\u043c \u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0435 \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c.<br \/>  \u0412 \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0430\u043a\u0442\u0438\u0432\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u043f\u0430\u043a\u0435\u0442\u043e\u0432 data.table, reshape2, stringdist \u0438 ggplot2.<\/p>\n<p>  \u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u00ab\u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445\u00bb \u0432\u0437\u044f\u0442\u0430 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044f \u043e \u0432\u044b\u0434\u0430\u043d\u043d\u044b\u0445 \u0440\u0430\u0437\u0440\u0435\u0448\u0435\u043d\u0438\u044f\u0445 \u043d\u0430 \u043e\u0441\u0443\u0449\u0435\u0441\u0442\u0432\u043b\u0435\u043d\u0438\u0435 \u0434\u0435\u044f\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u043f\u043e \u043f\u0435\u0440\u0435\u0432\u043e\u0437\u043a\u0435 \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u043e\u0432 \u0438 \u0431\u0430\u0433\u0430\u0436\u0430 \u043b\u0435\u0433\u043a\u043e\u0432\u044b\u043c \u0442\u0430\u043a\u0441\u0438 \u0432 \u041c\u043e\u0441\u043a\u0432\u0435. \u0414\u0430\u043d\u043d\u044b\u0435 \u043f\u0440\u0435\u0434\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0432 \u043e\u0431\u0449\u0435\u0435 \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u0414\u0435\u043f\u0430\u0440\u0442\u0430\u043c\u0435\u043d\u0442\u043e\u043c \u0442\u0440\u0430\u043d\u0441\u043f\u043e\u0440\u0442\u0430 \u0438 \u0440\u0430\u0437\u0432\u0438\u0442\u0438\u044f \u0434\u043e\u0440\u043e\u0436\u043d\u043e-\u0442\u0440\u0430\u043d\u0441\u043f\u043e\u0440\u0442\u043d\u043e\u0439 \u0438\u043d\u0444\u0440\u0430\u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u044b \u0433\u043e\u0440\u043e\u0434\u0430 \u041c\u043e\u0441\u043a\u0432\u044b. \u0421\u0442\u0440\u0430\u043d\u0438\u0446\u0430 \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 <a href=\"http:\/\/data.mos.ru\/datasets\/655\">data.mos.ru\/datasets\/655<\/a><br \/>  \u0418\u0441\u0445\u043e\u0434\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0438\u043c\u0435\u044e\u0442 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u0444\u043e\u0440\u043c\u0430\u0442:  <\/p>\n<pre><code class=\"markdown\">ROWNUM;VEHICLE_NUM;FULL_NAME;BLANK_NUM;VEHICLE_BRAND_MODEL;INN;OGRN 1;&quot;\u0410248\u0423\u0415197&quot;;&quot;\u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-\u0410\u0412\u0422\u041e\u041b\u0410\u0419\u041d\u00bb&quot;;&quot;017263&quot;;&quot;FORD FOCUS&quot;;&quot;7734653292&quot;;&quot;1117746207578&quot; 2;&quot;\u0410249\u0423\u0415197&quot;;&quot;\u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-\u0410\u0412\u0422\u041e\u041b\u0410\u0419\u041d\u00bb&quot;;&quot;017264&quot;;&quot;FORD FOCUS&quot;;&quot;7734653292&quot;;&quot;1117746207578&quot; 3;&quot;\u0410245\u0423\u0415197&quot;;&quot;\u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-\u0410\u0412\u0422\u041e\u041b\u0410\u0419\u041d\u00bb&quot;;&quot;017265&quot;;&quot;FORD FOCUS&quot;;&quot;7734653292&quot;;&quot;1117746207578&quot; ``` <\/code><\/pre>\n<p>  <\/p>\n<h5>1. \u0417\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u043f\u0435\u0440\u0432\u0438\u0447\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445<\/h5>\n<p>\u0414\u0430\u043d\u043d\u044b\u0435 \u043c\u043e\u0436\u043d\u043e \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u043d\u0435\u043f\u043e\u0441\u0440\u0435\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0441 \u0441\u0430\u0439\u0442\u0430. \u0412 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u0441\u0440\u0430\u0437\u0443 \u043f\u0435\u0440\u0435\u0438\u043c\u0435\u043d\u0443\u0435\u043c \u043a\u043e\u043b\u043e\u043d\u043a\u0438 \u0443\u0434\u043e\u0431\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c.  <\/p>\n<pre><code class=\"python\">url &lt;- &quot;http:\/\/data.mos.ru\/datasets\/download\/655&quot; colnames = c(&quot;RowNumber&quot;, &quot;RegPlate&quot;, &quot;LegalName&quot;, &quot;DocNum&quot;, &quot;Car&quot;, &quot;INN&quot;, &quot;OGRN&quot;, &quot;Void&quot;) rawdata &lt;- read.table(url, header = TRUE, sep = &quot;;&quot;,              colClasses = c(&quot;numeric&quot;, rep(&quot;character&quot;,6), NA),              col.names = colnames,              strip.white = TRUE,              blank.lines.skip = TRUE,              stringsAsFactors = FALSE,              encoding = &quot;UTF-8&quot;)<\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0438\u0441\u0442\u0443\u043f\u0430\u0442\u044c \u043a \u0430\u043d\u0430\u043b\u0438\u0437\u0443 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438\u2026<br \/>  <a name=\"habracut\"><\/a>  <\/p>\n<h5>2. \u041f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u0434\u0430\u043d\u043d\u044b\u0445<\/h5>\n<p>\u041f\u0440\u0435\u0434\u043f\u043e\u043b\u043e\u0436\u0438\u043c, \u0447\u0442\u043e \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043f\u0440\u043e\u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u0437\u0430\u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0445 \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0442\u0430\u043a\u0441\u0438 \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u0435\u0439, \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u043e\u043d\u043d\u043e\u0439 \u0444\u043e\u0440\u043c\u044b \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0430\u0442\u0430 \u0438 \u043e\u0442 \u043c\u0430\u0440\u043a\u0438 \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u044f. \u0421\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u043d\u0435 \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u044b \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e, \u043d\u043e \u0432\u0441\u044f \u043d\u0443\u0436\u043d\u0430\u044f \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044f \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u0442\u0441\u044f \u0432 \u043f\u043e\u043b\u044f\u0445 FULL_NAME (\u043f\u0435\u0440\u0435\u0438\u043c\u0435\u043d\u043e\u0432\u0430\u043d\u043e \u0432 LegalName) \u0438 VEHICLE_BRAND_MODEL (Car).<br \/>  \u0412 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0438\u0441\u0445\u043e\u0434\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e  <\/p>\n<ul>\n<li>\u0438\u0437 \u043f\u043e\u043b\u044f LegalName \u0432\u044b\u0434\u0435\u043b\u0438\u0442\u044c \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u043e\u043d\u043d\u043e-\u043f\u0440\u0430\u0432\u043e\u0432\u0443\u044e \u0444\u043e\u0440\u043c\u0443 \u0432 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0435 \u043f\u043e\u043b\u0435 OrgType;<\/li>\n<li>\u0438\u0437 \u043f\u043e\u043b\u044f Car \u0432\u044b\u0434\u0435\u043b\u0438\u0442\u044c \u043c\u0430\u0440\u043a\u0443 \u043c\u0430\u0448\u0438\u043d\u044b \u0432 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0435 \u043f\u043e\u043b\u0435 CarBrand;<\/li>\n<li>\u043e\u0442\u0431\u0440\u043e\u0441\u0438\u0442\u044c \u043d\u0435\u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c\u044b\u0435 \u043f\u043e\u043b\u044f.<\/li>\n<\/ul>\n<p>\u0414\u043b\u044f \u043f\u0440\u043e\u0441\u0442\u043e\u0442\u044b \u0441\u0447\u0438\u0442\u0430\u0435\u043c, \u0447\u0442\u043e \u043f\u0435\u0440\u0432\u044b\u0435 \u0441\u043b\u043e\u0432\u0430 \u043f\u043e\u043b\u0435\u0439 LegalName \u0438 Car \u0441\u043e\u0441\u0442\u0430\u0432\u043b\u044f\u044e\u0442, \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0435\u043d\u043d\u043e, \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u043e\u043d\u043d\u043e-\u043f\u0440\u0430\u0432\u043e\u0432\u0443\u044e \u0444\u043e\u0440\u043c\u0443 \u0438 \u043c\u0430\u0440\u043a\u0443 \u043c\u0430\u0448\u0438\u043d\u044b (\u043d\u0438\u0436\u0435 \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u043d\u044f\u0442\u043d\u043e, \u0447\u0442\u043e \u0434\u0435\u043b\u0430\u0442\u044c \u0441 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f\u043c\u0438). \u041d\u0435\u043d\u0443\u0436\u043d\u044b\u0435 \u043f\u043e\u043b\u044f \u0431\u0443\u0434\u0443\u0442 \u043e\u0442\u0431\u0440\u043e\u0448\u0435\u043d\u044b \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u0432 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f data.frame \u0432 data.table \u0441 \u044f\u0432\u043d\u044b\u043c \u0443\u043a\u0430\u0437\u0430\u043d\u0438\u0435\u043c \u0441\u043f\u0438\u0441\u043a\u0430 \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0438\u043c\u044b\u0445 \u043f\u043e\u043b\u0435\u0439.  <\/p>\n<pre><code class=\"python\">ptn &lt;- &quot;^(.+?) (.+)$&quot; # regexp pattern to match first word dt &lt;- data.table(rawdata)[,              list(RegPlate, LegalName, Car, OGRN,                  OrgType  = gsub(ptn, &quot;\\\\1&quot; , toupper( LegalName )),                  CarBrand = gsub(ptn, &quot;\\\\1&quot;,  toupper( Car       )))                                       ] rm(rawdata) # Clear some memory <\/code><\/pre>\n<p>  <\/p>\n<h5>3. \u041f\u0435\u0440\u0432\u044b\u0435 \u0438\u0442\u043e\u0433\u0438<\/h5>\n<p>\u041f\u0440\u043e\u0432\u0435\u0440\u0438\u043c, \u043a\u0430\u043a\u0438\u0435 \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u043e\u043d\u043d\u044b\u0435 \u0444\u043e\u0440\u043c\u044b \u0431\u044b\u043b\u0438 \u0432\u044b\u0434\u0435\u043b\u0435\u043d\u044b \u0438\u0437 \u0434\u0430\u043d\u043d\u044b\u0445.  <\/p>\n<pre><code class=\"python\">sort( table(dt$OrgType) )<\/code><\/pre>\n<pre><code class=\"markdown\">##    \u041d\u041f   \u041e\u0410\u041e   \u0417\u0410\u041e   \u041e\u041e\u041e    \u0418\u041f  ##     1   392   649 17118 17680 <\/code><\/pre>\n<p>\u0414\u0430\u043d\u043d\u044b\u0435 \u0441\u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u044b \u0432\u043f\u043e\u043b\u043d\u0435 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u043e: \u043f\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0443 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u043d\u044b\u0445 \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0439 \u043b\u0438\u0434\u0438\u0440\u0443\u044e\u0442 \u0438\u043d\u0434\u0438\u0432\u0438\u0434\u0443\u0430\u043b\u044c\u043d\u044b\u0435 \u043f\u0440\u0435\u0434\u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0442\u0435\u043b\u0438 (\u0441\u043d\u0438\u0436\u0435\u043d\u0438\u0435 \u043d\u0430\u043b\u043e\u0433\u043e\u0432\u043e\u0439 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u0438?), \u0435\u0441\u0442\u044c \u043e\u0431\u0449\u0435\u0441\u0442\u0432\u0430 \u0441 \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u043d\u043e\u0439 \u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0441\u0442\u044c\u044e, \u043e\u0442\u043a\u0440\u044b\u0442\u044b\u0435 \u0438 \u0437\u0430\u043a\u0440\u044b\u0442\u044b\u0435 \u0430\u043a\u0446\u0438\u043e\u043d\u0435\u0440\u043d\u044b\u0435 \u043e\u0431\u0449\u0435\u0441\u0442\u0432\u0430 \u0438 \u0434\u0430\u0436\u0435 \u043e\u0434\u043d\u043e \u043d\u0435\u043a\u043e\u043c\u043c\u0435\u0440\u0447\u0435\u0441\u043a\u043e\u0435 \u043f\u0430\u0440\u0442\u043d\u0435\u0440\u0441\u0442\u0432\u043e.<br \/>  \u0414\u043b\u044f \u0442\u043e\u0433\u043e, \u0447\u0442\u043e\u0431\u044b \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u0442\u044c, \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u044b\u0445 <i>\u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0430\u0442\u043e\u0432<\/i> (\u0430 \u043d\u0435 \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u0435\u0439) \u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u044e, \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u043e\u043d\u043d\u043e-\u043f\u0440\u0430\u0432\u043e\u0432\u043e\u0439 \u0444\u043e\u0440\u043c\u044b, \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043f\u0440\u043e\u0432\u0435\u0441\u0442\u0438 \u0441\u0443\u043c\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435 \u043f\u043e \u043f\u043e\u043b\u044e, \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u043e \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0437\u0443\u044e\u0449\u0435\u043c\u0443 \u044e\u0440\u0438\u0434\u0438\u0447\u0435\u0441\u043a\u043e\u0435 \u043b\u0438\u0446\u043e (\u041e\u0413\u0420\u041d).  <\/p>\n<pre><code class=\"python\">dt[, list( N = length( unique(OGRN) ) ), by = OrgType][order(N, decreasing = TRUE)] <\/code><\/pre>\n<pre><code class=\"markdown\">##    OrgType     N ## 1:      \u0418\u041f 12352 ## 2:     \u041e\u041e\u041e   563 ## 3:     \u0417\u0410\u041e    14 ## 4:     \u041e\u0410\u041e     6 ## 5:      \u041d\u041f     1 <\/code><\/pre>\n<p>  <\/p>\n<h4>\u041e\u0447\u0438\u0441\u0442\u043a\u0430 \u0434\u0430\u043d\u043d\u044b\u0445<\/h4>\n<p>\u0410\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u0438 \u043a\u0430\u043a\u0438\u0445 \u043c\u0430\u0440\u043e\u043a \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0442\u0430\u043a\u0441\u0438 \u0432 \u041c\u043e\u0441\u043a\u0432\u0435? <br \/>  \u0412 \u043d\u0430\u0431\u043e\u0440\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u043e \u043d\u0435\u043c\u0430\u043b\u043e \u043c\u0430\u0440\u043e\u043a \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u0435\u0439: 115, \u043d\u043e \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043b\u0438 \u043e\u043d\u0438 \u0432\u0441\u0435 \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0435? \u0414\u043b\u044f \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0432\u044b\u0432\u0435\u0434\u0435\u043c \u0432\u0441\u0435 \u043c\u0430\u0440\u043a\u0438, \u043d\u0430\u0447\u0438\u043d\u0430\u044e\u0449\u0438\u0435\u0441\u044f \u043d\u0430 \u0431\u0443\u043a\u0432\u0443 \u00abM\u00bb.  <\/p>\n<pre><code class=\"python\">sort( unique( dt[grep(&quot;^M.*&quot;, CarBrand), CarBrand]))<\/code><\/pre>\n<pre><code class=\"markdown\">##  [1] &quot;M214&quot;                 &quot;MASERATI&quot;             &quot;MAZDA&quot;                ##  [4] &quot;MAZDA-&quot;               &quot;MERCEDES&quot;             &quot;MERCEDES-BENZ&quot;        ##  [7] &quot;MERCEDES-BENZ-&quot;       &quot;MERCEDES-BENZ-S500&quot;   &quot;MERCEDES-BENZC&quot;       ## [10] &quot;MERCEDES-BENZE200K&quot;   &quot;MERCEDES-BENZE220CDI&quot; &quot;MERCEDES-B\u0415NZ&quot;        ## [13] &quot;MERCERDES-BENZ&quot;       &quot;MERCRDES&quot;             &quot;MERCRDES-BENZ&quot;        ## [16] &quot;MERSEDES-&quot;            &quot;MERSEDES-BENZ&quot;        &quot;METROCAB&quot;             ## [19] &quot;MG&quot;                   &quot;MINI&quot;                 &quot;MITSUBISHI&quot; <\/code><\/pre>\n<p>\u041a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e, \u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u0447\u0438\u0441\u043b\u043e \u043c\u0430\u0440\u043e\u043a \u043c\u0430\u0448\u0438\u043d \u0432\u043e \u043c\u043d\u043e\u0433\u043e\u043c \u043e\u0431\u0443\u0441\u043b\u043e\u0432\u043b\u0435\u043d\u043e \u043e\u0448\u0438\u0431\u043a\u0430\u043c\u0438 \u0432 \u0434\u0430\u043d\u043d\u044b\u0445. \u041a \u043f\u0440\u0438\u043c\u0435\u0440\u0443, \u043e\u0434\u043d\u0430 \u0438 \u0442\u0430 \u0436\u0435 \u043c\u0430\u0440\u043a\u0430 \u2014 MERCEDES-BENZ \u2014 \u0432\u0441\u0442\u0440\u0435\u0447\u0430\u0435\u0442\u0441\u044f \u043f\u043e\u0434 \u0440\u0430\u0437\u043b\u0438\u0447\u043d\u044b\u043c\u0438 \u0438\u043c\u0435\u043d\u0430\u043c\u0438. \u041f\u0435\u0440\u0435\u0434 \u0430\u043d\u0430\u043b\u0438\u0437\u043e\u043c \u0434\u0430\u043d\u043d\u044b\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043e\u0447\u0438\u0441\u0442\u0438\u0442\u044c.<br \/>  \u041f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u043d\u0430\u044f \u043e\u0441\u043d\u043e\u0432\u0430 \u0434\u043b\u044f \u043e\u0447\u0438\u0441\u0442\u043a\u0438 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0439 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u0438 \u2014 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u043f\u043e\u0438\u0441\u043a\u0430 \u00ab\u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u044f \u043c\u0435\u0436\u0434\u0443 \u0441\u0442\u0440\u043e\u043a\u0430\u043c\u0438\u00bb. \u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0439 \u043f\u0430\u0440\u044b \u0441\u0442\u0440\u043e\u043a \u043e\u043d\u0438 \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u044e\u0442 \u043c\u0435\u0442\u0440\u0438\u043a\u0443, \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0437\u0443\u044e\u0449\u0443\u044e \u0442\u0440\u0443\u0434\u043e\u0435\u043c\u043a\u043e\u0441\u0442\u044c \u043f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u043e\u0434\u043d\u043e\u0439 \u0441\u0442\u0440\u043e\u043a\u0438 \u0432 \u0434\u0440\u0443\u0433\u0443\u044e \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0439 \u043d\u0430\u0434 \u0431\u0443\u043a\u0432\u0430\u043c\u0438. \u0427\u0435\u043c \u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u0445\u043e\u0436\u0438 \u0441\u0442\u0440\u043e\u043a\u0438, \u0442\u0435\u043c \u043c\u0435\u043d\u044c\u0448\u0435 \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0439. \u0412 \u0438\u0434\u0435\u0430\u043b\u0435 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u0435 \u0441\u0442\u0440\u043e\u043a\u0438 \u0434\u043e\u043b\u0436\u043d\u044b \u0438\u043c\u0435\u0442\u044c \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u0435, \u0440\u0430\u0432\u043d\u043e\u0435 \u043d\u0443\u043b\u044e, \u0430 \u043c\u0430\u043a\u0441\u0438\u043c\u0430\u043b\u044c\u043d\u043e \u043d\u0435\u043f\u043e\u0445\u043e\u0436\u0438\u0435 \u2014 \u0435\u0434\u0438\u043d\u0438\u0446\u0435. \u0418\u043c\u0435\u043d\u043d\u043e \u0442\u0430\u043a \u0438 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c Jaro-Winkler \u0444\u0443\u043d\u043a\u0446\u0438\u0438 stringdist \u043e\u0434\u043d\u043e\u0438\u043c\u0435\u043d\u043d\u043e\u0433\u043e \u043f\u0430\u043a\u0435\u0442\u0430. <br \/>  \u0421\u0440\u0430\u0432\u043d\u0438\u043c \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0442\u0440\u043e\u043a, \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u0435\u043c \u043d\u0435 \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u0435, \u0430 \u043f\u043e\u0445\u043e\u0436\u0435\u0441\u0442\u044c, 1-stringdist.  <\/p>\n<pre><code class=\"python\">1 - stringdist( c(&quot;MERCEDES&quot;,&quot;MERSEDES&quot;,&quot;MAZDA&quot;,&quot;RENAULT&quot;,&quot;SAAB&quot;), &quot;MERCEDES&quot;, method = &quot;jw&quot;, p = 0.1)<\/code><\/pre>\n<pre><code class=\"markdown\">## [1] 1.0000 0.9417 0.5950 0.3452 0.0000 <\/code><\/pre>\n<p>\u041d\u0430 \u043f\u0435\u0440\u0432\u044b\u0439 \u0432\u0437\u0433\u043b\u044f\u0434 \u0437\u0430\u0434\u0430\u0447\u0430 \u043e\u0447\u0438\u0441\u0442\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u0440\u0435\u0448\u0430\u0435\u0442\u0441\u044f \u043f\u0440\u043e\u0441\u0442\u043e: \u0434\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0439 \u0437\u0430\u043f\u0438\u0441\u0438 \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0432\u044b\u0431\u0440\u0430\u0442\u044c \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u0445\u043e\u0436\u0435\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u0438\u0437 \u0441\u043f\u0440\u0430\u0432\u043e\u0447\u043d\u0438\u043a\u0430. \u041a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e, \u0442\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043d\u0435 \u0432\u0441\u0435\u0433\u0434\u0430 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442. \u0412\u043e-\u043f\u0435\u0440\u0432\u044b\u0445, \u0441\u043f\u0440\u0430\u0432\u043e\u0447\u043d\u0438\u043a\u0430 \u043c\u043e\u0436\u0435\u0442 \u043d\u0435 \u0431\u044b\u0442\u044c (\u043a\u0430\u043a \u0432 \u0442\u0435\u043a\u0443\u0449\u0435\u043c \u0441\u043b\u0443\u0447\u0430\u0435). \u0412\u043e-\u0432\u0442\u043e\u0440\u044b\u0445, \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u0438 \u0442\u0440\u0435\u0431\u0443\u044e\u0442 \u0440\u0443\u0447\u043d\u043e\u0439 \u043a\u043e\u0440\u0440\u0435\u043a\u0446\u0438\u0438 \u0434\u0430\u043d\u043d\u044b\u0445, \u0434\u0430\u0436\u0435 \u043f\u0440\u0438 \u043d\u0430\u043b\u0438\u0447\u0438\u0438 \u0442\u043e\u0447\u043d\u043e\u0433\u043e \u0441\u043f\u0440\u0430\u0432\u043e\u0447\u043d\u0438\u043a\u0430. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0441 \u0442\u043e\u0447\u043a\u0438 \u0437\u0440\u0435\u043d\u0438\u044f \u043c\u0435\u0442\u043e\u0434\u0430 \u0442\u0440\u0438 \u043c\u0430\u0440\u043a\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u043f\u043e\u0434\u0445\u043e\u0434\u044f\u0442 \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0430\u043b\u044c\u0442\u0435\u0440\u043d\u0430\u0442\u0438\u0432\u044b \u043d\u0435\u0432\u0435\u0440\u043d\u043e\u043c\u0443 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044e \u00abBAZ\u00bb:  <\/p>\n<pre><code class=\"python\">1 - stringdist(&quot;BAZ&quot;, c(&quot;VAZ&quot;, &quot;UAZ&quot;, &quot;ZAZ&quot;), method = &quot;jw&quot;, p = 0.1)<\/code><\/pre>\n<pre><code class=\"markdown\">## [1] 0.7778 0.7778 0.7778 <\/code><\/pre>\n<p>\u041d\u0438\u0436\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d \u043f\u043e\u043b\u0443\u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u043c\u0435\u0442\u043e\u0434 \u043a\u043e\u0440\u0440\u0435\u043a\u0446\u0438\u0438, \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0449\u0438\u0439 \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u043e\u0431\u043b\u0435\u0433\u0447\u0438\u0442\u044c \u0442\u0440\u0443\u0434 \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u0438\u0441\u0442\u0430 \u043f\u043e \u043e\u0447\u0438\u0441\u0442\u043a\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u0437\u0430 \u0441\u0447\u0435\u0442 \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u043d\u043e\u0439 \u0433\u0435\u043d\u0435\u0440\u0430\u0446\u0438\u0438 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432 \u0438\u0441\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0439, \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c\u0438 \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u043c\u043e\u0436\u0435\u0442 \u043b\u0438\u0431\u043e \u0441\u043e\u0433\u043b\u0430\u0441\u0438\u0442\u044c\u0441\u044f, \u043b\u0438\u0431\u043e \u0432\u0440\u0443\u0447\u043d\u0443\u044e \u043f\u043e\u043f\u0440\u0430\u0432\u0438\u0442\u044c. <br \/>  \u041f\u0440\u0435\u0434\u043f\u043e\u043b\u0430\u0433\u0430\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u0432 \u0431\u043e\u043b\u044c\u0448\u043e\u043c \u043e\u0431\u044a\u0435\u043c\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u0441 \u043c\u0430\u043b\u044b\u043c \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u043e\u0448\u0438\u0431\u043e\u043a \u0447\u0430\u0441\u0442\u043e \u0432\u0441\u0442\u0440\u0435\u0447\u0430\u044e\u0449\u0438\u0435\u0441\u044f \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u2014 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u0435, \u0430 \u0440\u0435\u0434\u043a\u043e \u0432\u0441\u0442\u0440\u0435\u0447\u0430\u044e\u0449\u0438\u0435\u0441\u044f \u2014 \u043e\u0448\u0438\u0431\u043a\u0438. \u0427\u0430\u0441\u0442\u043e\u0442\u044b \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442\u0441\u044f \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0432\u0435\u0441\u043e\u0432\u043e\u0433\u043e \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u0430, \u043f\u0440\u043e\u043f\u043e\u0440\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u044f \u043c\u0435\u0442\u0440\u0438\u043a\u0443 \u0431\u043b\u0438\u0437\u043e\u0441\u0442\u0438 \u0441\u0442\u0440\u043e\u043a. \u0427\u0442\u043e\u0431\u044b \u0447\u0430\u0441\u0442\u043e \u0432\u0441\u0442\u0440\u0435\u0447\u0430\u044e\u0449\u0438\u0435\u0441\u044f \u043c\u0430\u0440\u043a\u0438 \u043c\u0430\u0448\u0438\u043d \u043d\u0435 \u0432\u044b\u0445\u043e\u0434\u0438\u043b\u0438 \u0432\u043f\u0435\u0440\u0435\u0434 \u0437\u0430 \u0441\u0447\u0435\u0442 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430, \u0430 \u043d\u0435 \u043f\u043e\u0445\u043e\u0436\u0435\u0441\u0442\u0438, \u0443\u0447\u0438\u0442\u044b\u0432\u0430\u044e\u0442\u0441\u044f \u0442\u043e\u043b\u044c\u043a\u043e \u043c\u0435\u0442\u0440\u0438\u043a\u0438 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u0441\u043e \u0441\u0442\u0435\u043f\u0435\u043d\u044c\u044e \u043f\u043e\u0445\u043e\u0436\u0435\u0441\u0442\u0438 \u0432\u044b\u0448\u0435 \u043f\u043e\u0440\u043e\u0433\u043e\u0432\u043e\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f <code>t<\/code> (\u043e \u0432\u044b\u0431\u043e\u0440\u0435 <code>t<\/code> \u043f\u043e\u0437\u0436\u0435). \u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043c\u0430\u0440\u043a\u0438 \u043c\u0430\u0448\u0438\u043d\u044b, \u0442\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c, \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u044f\u0435\u0442\u0441\u044f \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u043e\u0432\u0430\u043d\u043d\u043e\u0435 \u00ab\u0441\u043f\u0440\u0430\u0432\u043e\u0447\u043d\u043e\u0435\u00bb \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u0438\u0437 \u0442\u043e\u0433\u043e \u0436\u0435 \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u041f\u0430\u0440\u044b \u00ab\u043c\u0430\u0440\u043a\u0430 \u2014 \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u043d\u043e\u0435 \u0438\u0441\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0435\u00bb \u0432\u044b\u0432\u043e\u0434\u044f\u0442\u0441\u044f \u0432 csv-\u0444\u0430\u0439\u043b. \u041f\u043e\u0441\u043b\u0435 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0438 \u0432\u043d\u0435\u0441\u0435\u043d\u0438\u044f \u0438\u0441\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u0439 \u0441\u043a\u043e\u0440\u0440\u0435\u043a\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0439 csv-\u0444\u0430\u0439\u043b \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0435\u0442\u0441\u044f \u0438 \u0441\u043b\u0443\u0436\u0438\u0442 \u0441\u043b\u043e\u0432\u0430\u0440\u0435\u043c.<br \/>  \u041d\u0430\u0447\u043d\u0435\u043c \u0441 \u043a\u043e\u043d\u0441\u0442\u0440\u0443\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u0438, \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u044e\u0449\u0435\u0439 \u043d\u0430\u0438\u043b\u0443\u0447\u0448\u0435\u0435 \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0438\u0435 \u043d\u0430 \u0438\u043c\u0435\u044e\u0449\u0435\u043c\u0441\u044f \u043d\u0430\u0431\u043e\u0440\u0435 \u0434\u0430\u043d\u043d\u044b\u0445.  <\/p>\n<pre><code class=\"python\">bestmatch.gen &lt;- function(wc, t = 0){   # wc = counts of all base text words   # t = threshold: only the words with similarity above threshold count              bestmatch &lt;- function(a){     sim &lt;- 1 - stringdist( toupper(a), toupper( names(wc) ) , method = &quot;jw&quot;, p = 0.1 )     # Compute weights and implicitly cut off everything below threshold     weights &lt;- sim * wc * (sim &gt; t)     # Return the one with maximum combined weight     names( sort(weights, decr = TRUE)[1] )   }   bestmatch } <\/code><\/pre>\n<p> \u041f\u043e\u0440\u043e\u0433\u043e\u0432\u043e\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 <code>t<\/code> \u043f\u043e\u0434\u0431\u0438\u0440\u0430\u0435\u0442\u0441\u044f \u043e\u043f\u044b\u0442\u043d\u044b\u043c \u043f\u0443\u0442\u0435\u043c. \u0412\u043e\u0442 \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0430\u0431\u043e\u0442\u044b \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0434\u043b\u044f \u043f\u043e\u0440\u043e\u0433\u043e\u0432\u043e\u0433\u043e \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430 t = 0.7.  <\/p>\n<pre><code class=\"python\">  bm07 &lt;- bestmatch.gen( table( dt$CarBrand), t = 0.7 )   s &lt;- c(&quot;FORD&quot;,&quot;RENO&quot;,&quot;MERS&quot;,&quot;PEGO&quot;)   sapply(s, bm07) <\/code><\/pre>\n<pre><code class=\"markdown\">##            FORD            RENO            MERS            PEGO  ##          &quot;FORD&quot;       &quot;RENAULT&quot; &quot;MERCEDES-BENZ&quot;       &quot;PEUGEOT&quot; <\/code><\/pre>\n<p>\u041d\u0430 \u043f\u0435\u0440\u0432\u044b\u0439 \u0432\u0437\u0433\u043b\u044f\u0434, \u0432\u0441\u0435 \u0441\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e \u0447\u0443\u0434\u0435\u0441\u043d\u043e. \u041e\u0434\u043d\u0430\u043a\u043e \u0440\u0430\u0434\u043e\u0432\u0430\u0442\u044c\u0441\u044f \u0440\u0430\u043d\u043e. \u0425\u043e\u0440\u043e\u0448\u043e \u043f\u0440\u0435\u0434\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u043d\u044b\u0435 \u0432 \u043d\u0430\u0431\u043e\u0440\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u043c\u0430\u0440\u043a\u0438 \u043c\u0430\u0448\u0438\u043d \u0441 \u043f\u043e\u0445\u043e\u0436\u0438\u043c\u0438 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f\u043c\u0438 \u043c\u043e\u0433\u0443\u0442 \u00ab\u043f\u0435\u0440\u0435\u0442\u044f\u0433\u0438\u0432\u0430\u0442\u044c \u043d\u0430 \u0441\u0435\u0431\u044f\u00bb \u0434\u0440\u0443\u0433\u0438\u0435 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u0435 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f.  <\/p>\n<pre><code class=\"python\">s &lt;- c(&quot;HONDA&quot;, &quot;CHRYSLER&quot;, &quot;VOLVO&quot;) sapply(s, bm07) <\/code><\/pre>\n<pre><code class=\"markdown\">##        HONDA     CHRYSLER        VOLVO  ##    &quot;HYUNDAI&quot;  &quot;CHEVROLET&quot; &quot;VOLKSWAGEN&quot; <\/code><\/pre>\n<p>\u041f\u043e\u043f\u0440\u043e\u0431\u0443\u0435\u043c \u043f\u043e\u0432\u044b\u0441\u0438\u0442\u044c \u043f\u043e\u0440\u043e\u0433\u043e\u0432\u043e\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 t.  <\/p>\n<pre><code class=\"python\">bm09 &lt;- bestmatch.gen( table( dt$CarBrand), t = 0.9 )   s &lt;- c(&quot;HONDA&quot;,&quot;CHRYSLER&quot;,&quot;VOLVO&quot;)   sapply(s, bm09) <\/code><\/pre>\n<pre><code class=\"markdown\">##      HONDA   CHRYSLER      VOLVO  ##    &quot;HONDA&quot; &quot;CHRYSLER&quot;    &quot;VOLVO&quot; <\/code><\/pre>\n<p>\u0412\u0441\u0435 \u0432 \u043f\u043e\u0440\u044f\u0434\u043a\u0435? \u041f\u043e\u0447\u0442\u0438. \u0421\u043b\u0438\u0448\u043a\u043e\u043c \u0436\u0435\u0441\u0442\u043a\u043e\u0435 \u043e\u0442\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u043d\u0435\u043f\u043e\u0445\u043e\u0436\u0438\u0445 \u0441\u0442\u0440\u043e\u043a \u043f\u0440\u0438\u0432\u043e\u0434\u0438\u0442 \u043a \u0442\u043e\u043c\u0443, \u0447\u0442\u043e \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c \u0441\u0447\u0438\u0442\u0430\u0435\u0442 \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043e\u0448\u0438\u0431\u043e\u0447\u043d\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u043c\u0438. \u041f\u043e\u0434\u043e\u0431\u043d\u044b\u0435 \u043e\u0448\u0438\u0431\u043a\u0438 \u043f\u0440\u0438\u0434\u0435\u0442\u0441\u044f \u0438\u0441\u043f\u0440\u0430\u0432\u0438\u0442\u044c \u0432\u0440\u0443\u0447\u043d\u0443\u044e.  <\/p>\n<pre><code class=\"python\">s &lt;- c(&quot;CEAT&quot;, &quot;CVEVROLET&quot;) sapply(s, bm09) <\/code><\/pre>\n<pre><code class=\"markdown\">##        CEAT   CVEVROLET  ##      &quot;CEAT&quot; &quot;CVEVROLET&quot; <\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c \u0432\u0441\u0435 \u0433\u043e\u0442\u043e\u0432\u043e \u0434\u043b\u044f \u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f \u0444\u0430\u0439\u043b\u0430 \u0441\u043b\u043e\u0432\u0430\u0440\u044f \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043c\u0430\u0440\u043e\u043a \u043c\u0430\u0448\u0438\u043d. \u0422\u0430\u043a \u043a\u0430\u043a \u0444\u0430\u0439\u043b \u043d\u0443\u0436\u043d\u043e \u0431\u0443\u0434\u0435\u0442 \u043f\u0440\u0430\u0432\u0438\u0442\u044c \u0440\u0443\u043a\u0430\u043c\u0438, \u0443\u0434\u043e\u0431\u043d\u043e, \u0435\u0441\u043b\u0438 \u0432 \u043d\u0435\u043c \u0431\u0443\u0434\u0443\u0442 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0435 \u043f\u043e\u043b\u044f, \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0449\u0438\u0435, \u043e\u0442\u043b\u0438\u0447\u0430\u0435\u0442\u0441\u044f \u043b\u0438 \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u043d\u0430\u044f \u0437\u0430\u043c\u0435\u043d\u0430 \u043e\u0442 \u0438\u0441\u0445\u043e\u0434\u043d\u043e\u0433\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f (\u044d\u0442\u043e \u043d\u0435 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u043e), \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0447\u0430\u0441\u0442\u043e \u0432\u0441\u0442\u0440\u0435\u0447\u0430\u0435\u0442\u0441\u044f \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435 \u043c\u0430\u0440\u043a\u0438, \u0430 \u0442\u0430\u043a\u0436\u0435 \u043c\u0435\u0442\u043a\u0430, \u043f\u0440\u0438\u0432\u043b\u0435\u043a\u0430\u044e\u0449\u0430\u044f \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u0435 \u043a \u0437\u0430\u043f\u0438\u0441\u0438 \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u043a\u0430\u043a\u0438\u0445-\u0442\u043e \u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0445 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043d\u0430\u0431\u043e\u0440\u0430. \u0412 \u0434\u0430\u043d\u043d\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u043c\u044b \u0445\u043e\u0442\u0438\u043c \u0432\u044b\u043b\u043e\u0432\u0438\u0442\u044c \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u0438, \u0432 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c \u043f\u0440\u0435\u0434\u043b\u0430\u0433\u0430\u0435\u0442 \u0440\u0435\u0434\u043a\u043e \u0432\u0441\u0442\u0440\u0435\u0447\u0430\u044e\u0449\u0438\u0435\u0441\u044f (\u043f\u0440\u0435\u0434\u043f\u043e\u043b\u043e\u0436\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043e\u0448\u0438\u0431\u043e\u0447\u043d\u044b\u0435) \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u0445.  <\/p>\n<pre><code class=\"python\">ncb &lt;- table(dt$CarBrand) scb &lt;- names(ncb) # Source Car Brands acb &lt;- sapply(scb, bm09) # Auto-generated replacement cbdict_out &lt;- data.table(ncb)[,list(                 SourceName = scb,                 AutoName = acb,                 SourceFreq = as.numeric(ncb),                 AutoFreq = as.numeric( ncb[acb] ),                 Action = ordered( scb == acb, labels = c(&quot;CHANGE&quot;,&quot;KEEP&quot;)),                 DictName = acb               )] # Add alert flag # Alert when suggested is a low-frequency dictionary word cbdict_out &lt;- cbdict_out[,                 Alert := ordered( AutoFreq &lt;= quantile(AutoFreq, probs = 0.05, na.rm = TRUE),                                    labels = c(&quot;GOOD&quot;,&quot;ALERT&quot;))                 ] write.table( cbdict_out[ order(SourceName),                           list( Alert, Action, SourceName, AutoName, SourceFreq, AutoFreq, DictName) ],        &quot;cbdict_out.txt&quot;, sep = &quot;;&quot;, quote = TRUE,        col.names = TRUE, row.name = FALSE, fileEncoding = &quot;UTF-8&quot;) <\/code><\/pre>\n<p>\u041d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u0442\u044c \u0438 \u043e\u0442\u0440\u0435\u0434\u0430\u043a\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043f\u043e\u043b\u044f DictName \u0438 \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u0442\u044c \u0444\u0430\u0439\u043b \u043f\u043e\u0434 \u0438\u043c\u0435\u043d\u0435\u043c \u00abcbdict_in.txt\u00bb \u0434\u043b\u044f \u043f\u043e\u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0439 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438.<br \/>  \u0410\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c\u044b\u0439 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u043c\u0435\u0435\u0442 \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0438, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0441\u0442\u043e\u0438\u0442 \u043e\u0431\u0440\u0430\u0442\u0438\u0442\u044c \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u0435:  <\/p>\n<ul>\n<li>\u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0441\u0442\u0440\u043e\u043a\u0438 \u043d\u0435 \u0441\u043e\u0434\u0435\u0440\u0436\u0430\u0442 \u043c\u0430\u0440\u043a\u0438 \u043c\u0430\u0448\u0438\u043d\u044b \u2014 \u043f\u0443\u0441\u0442\u043e \u0438\u043b\u0438 \u00ab\u041d\u0415\u0422\u00bb, \u0430 \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441\u043b\u043e\u0436\u043d\u043e \u043e\u0434\u043d\u043e\u0437\u043d\u0432\u0447\u043d\u043e \u0438\u0434\u0435\u043d\u0442\u0438\u0446\u0438\u0444\u0438\u0440\u043e\u0432\u0430\u0442\u044c: L1H1, M214; \u0432\u0440\u0443\u0447\u043d\u0443\u044e \u043c\u0435\u043d\u044f\u0435\u043c \u043d\u0430 UNKNOWN \u0438\u043b\u0438 \u0430\u043d\u0430\u043b\u043e\u0433\u0438\u0447\u043d\u043e\u0435 \u043f\u0441\u0435\u0432\u0434\u043e-\u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435;<\/li>\n<li>\u0440\u0430\u0432\u043d\u043e\u043f\u0440\u0430\u0432\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u0435\u0442\u0441\u044f \u0434\u0432\u0430 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u0430 \u043d\u0430\u043f\u0438\u0441\u0430\u043d\u0438\u044f: MERCEDES \u0438 MERCEDES-BENZ, \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u043c \u043e\u0434\u043d\u043e, MERCEDES-BENZ;<\/li>\n<li>\u0435\u0441\u0442\u044c \u0434\u0432\u0430 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u043e \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u0445 \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u044b\u0445 \u043d\u0430\u043f\u0438\u0441\u0430\u043d\u0438\u044f ZAZ (\u0432 \u0432\u044b\u0432\u043e\u0434\u0435 \u0434\u0432\u0435 \u0441\u0442\u0440\u043e\u043a\u0438, \u0438 \u043e\u0431\u0435 \u043b\u043b\u0433\u043e\u0440\u0438\u0442\u043c \u043f\u0440\u0435\u0434\u043b\u0430\u0433\u0430\u0435\u0442 \u0441\u043e\u0445\u0440\u0430\u043d\u0438\u0442\u044c \u043a\u0430\u043a \u0432\u0435\u0440\u043d\u044b\u0435, Action = KEEP); \u0432\u0438\u0434\u0438\u043c\u043e, \u0433\u0434\u0435-\u0442\u043e \u0432\u043a\u0440\u0430\u043b\u0430\u0441\u044c \u0431\u0443\u043a\u0432\u0430 \u0441 \u0434\u0440\u0443\u0433\u0438\u043c \u043a\u043e\u0434\u043e\u043c UTF-8;<\/li>\n<li>\u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f \u043c\u0430\u0448\u0438\u043d \u043d\u0435 \u0441\u043e\u0434\u0435\u0440\u0436\u0430\u0442 \u043c\u0430\u0440\u043a\u0438, \u0430 \u0442\u043e\u043b\u044c\u043c\u043a\u043e \u043c\u043e\u0434\u0435\u043b\u044c: SAMAND (IRAN KHODRO)<\/li>\n<li>\u043d\u0435\u0440\u0430\u0437\u0431\u0435\u0440\u0438\u0445\u0430 \u0441 \u043c\u0430\u0440\u043a\u0430\u043c\u0438 TAGAZ \u2014 VORTEX \u0438 JAC; \u043f\u0440\u0435\u0434\u043b\u0430\u0433\u0430\u0435\u0442\u0441\u044f \u0434\u043b\u044f \u043f\u0440\u043e\u0441\u0442\u043e\u0442\u044b \u043f\u0440\u0438\u0441\u0432\u043e\u0438\u0442\u044c (\u043f\u0443\u0441\u0442\u044c \u043d\u0435 \u0441\u043e\u0432\u0441\u0435\u043c \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u043e) \u043e\u0431\u0449\u0435\u0435 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435 TAGAZ \u043c\u0430\u0448\u0438\u043d\u0430\u043c, \u0447\u044c\u0438 \u043c\u0430\u0440\u043a\u0438 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043b\u0438\u0441\u044c \u043a\u0430\u043a TAGAZ, A21, SUV, SUVT11, VORTEX, JAC.<\/li>\n<\/ul>\n<p> \u041f\u043e\u043c\u0438\u043c\u043e \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e\u0441\u0442\u0435\u0439 \u0434\u0430\u043d\u043d\u044b\u0445 \u0435\u0441\u0442\u044c \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u0438\u044f \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c\u0430, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0443\u0436\u043d\u043e \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432\u0440\u0443\u0447\u043d\u0443\u044e. <\/p>\n<ul>\n<li>\u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c \u043f\u0440\u0435\u0434\u043b\u0430\u0433\u0430\u0435\u0442 \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043e\u0448\u0438\u0431\u043e\u0447\u043d\u044b\u0435 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044f \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u0445 \u0430\u043b\u044c\u0442\u0435\u0440\u043d\u0430\u0442\u0438\u0432: CEAT, CVEVROLET;<\/li>\n<li>\u043c\u0430\u0440\u043a\u0438 \u0441\u043e\u0441\u0442\u043e\u044f\u0449\u0438\u0435 \u0438\u0437 \u0434\u0432\u0443\u0445 \u0441\u043b\u043e\u0432, \u0441\u043e\u043a\u0440\u0430\u0448\u0430\u044e\u0442\u0441\u044f \u0434\u043e \u043e\u0434\u043d\u043e\u0433\u043e: ALFA (ALFA ROMEO), GREAT (GREAT WALL), IRAN (IRAN KHODRO), LAND (LAND ROVER).<\/li>\n<\/ul>\n<p>\u041e\u0442\u0440\u0435\u0434\u0430\u043a\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0435\u043c \u0438\u0437 \u0444\u0430\u0439\u043b\u0430 <a href=\"https:\/\/raw.githubusercontent.com\/avidclam\/mostaxiR\/master\/cbdict_in.txt\">cbdict_in.txt<\/a>.  <\/p>\n<pre><code class=\"python\">if ( file.exists(&quot;cbdict_in.txt&quot;)) url &lt;- &quot;cbdict_in.txt&quot; else url &lt;- &quot;cbdict_out.txt&quot;  cbdict_in &lt;- read.table( url, header = TRUE, sep = &quot;;&quot;,                          colClasses = c( rep(&quot;character&quot;,4), &quot;numeric&quot;, &quot;numeric&quot;, &quot;character&quot;),                          encoding = &quot;UTF-8&quot;)  cbdict &lt;- cbdict_in$DictName names(cbdict) &lt;- cbdict_in$SourceName                    <\/code><\/pre>\n<p> \u0418 \u0438\u0441\u043f\u0440\u0430\u0432\u043b\u044f\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043c\u0430\u0440\u043e\u043a \u043c\u0430\u0448\u0438\u043d \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 \u0434\u0430\u043d\u043d\u044b\u0445.  <\/p>\n<pre><code class=\"python\">dt[, CarBrand := cbdict[CarBrand]] dt[is.na(CarBrand), CarBrand := &quot;UNKNOWN&quot;] <\/code><\/pre>\n<p>\u041f\u043e\u0441\u043b\u0435 \u043e\u0447\u0438\u0441\u0442\u043a\u0438 \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439 \u043c\u0430\u0440\u043e\u043a \u043c\u0430\u0448\u0438\u043d \u0441\u0442\u0430\u043b\u043e \u043c\u0435\u043d\u044c\u0448\u0435 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u0432 \u0434\u0432\u0430 \u0440\u0430\u0437\u0430  <\/p>\n<pre><code class=\"python\">length( unique(dt$CarBrand) )<\/code><\/pre>\n<pre><code class=\"markdown\">## [1] 72 <\/code><\/pre>\n<p>  <\/p>\n<h4>\u041e\u0442\u0432\u0435\u0442\u044b \u043d\u0430 \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0432\u043e\u043f\u0440\u043e\u0441\u044b<\/h4>\n<h5>1. Top 10 \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u0439<\/h5>\n<p>\u041e\u043f\u0440\u0435\u0434\u0435\u043b\u0438\u043c 10 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043a\u0440\u0443\u043f\u043d\u044b\u0445 \u0442\u0430\u043a\u0441\u043e\u043f\u0430\u0440\u043a\u043e\u0432. \u0412 \u0434\u0430\u043d\u043d\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043f\u043e\u0441\u0442\u0440\u043e\u0438\u0442\u044c \u0440\u0435\u0439\u0442\u0438\u043d\u0433 \u043f\u043e \u043e\u0434\u043d\u043e\u043c\u0443 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044e \u2014 \u041e\u0413\u0420\u041d.  <\/p>\n<pre><code class=\"python\">st &lt;- dt[, list( NumCars = length(RegPlate)), by = list(OGRN, LegalName) ] head( st[order( NumCars, decreasing = TRUE)], 10) <\/code><\/pre>\n<pre><code class=\"markdown\">##              OGRN             LegalName NumCars ##  1: 1137746197104            \u041e\u041e\u041e \u00ab\u0421\u041e\u041b\u0422\u00bb     866 ##  2: 1037727000893    \u041e\u041e\u041e \u00ab\u0421\u0422\u0418\u041b\u042c-\u041c\u041e\u0422\u041e\u0420\u0421\u00bb     751 ##  3: 1067746273198      \u041e\u041e\u041e \u00ab\u0420\u0418\u0422\u041c \u0416\u0418\u0417\u041d\u0418\u00bb     547 ##  4: 1037789018849           \u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418\u00bb     541 ##  5: 1127746010700      \u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-24 \u041c\u00bb     406 ##  6: 1057748223653 \u041e\u041e\u041e \u00ab\u0415\u0412\u0420\u041e\u0422\u0420\u0410\u041d\u0421\u0421\u0415\u0420\u0412\u0418\u0421\u00bb     349 ##  7: 5067746596297        \u041e\u041e\u041e \u00ab\u0410\u0412\u0422\u041e\u0420\u0415\u0419\u0421\u00bb     288 ##  8: 1027739272175          \u041e\u0410\u041e \u00ab14 \u0422\u041c\u041f\u00bb     267 ##  9: 1137746133250     \u041e\u041e\u041e \u00ab\u0421\u0418\u0422\u0418 \u0421\u0415\u0420\u0412\u0418\u0421\u00bb     255 ## 10: 5077746757688             \u041e\u041e\u041e \u00ab\u0426\u041f\u041a\u00bb     238 <\/code><\/pre>\n<p>\u041a \u0441\u043e\u0436\u0430\u043b\u0435\u043d\u0438\u044e, \u0432 \u0440\u0430\u0441\u0441\u043c\u0430\u0442\u0440\u0438\u0432\u0430\u0435\u043c\u043e\u043c \u043d\u0430\u0431\u043e\u0440\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u0445\u0440\u0430\u043d\u0438\u0442\u0441\u044f \u0442\u043e\u043b\u044c\u043a\u043e \u044e\u0440\u0438\u0434\u0438\u0447\u0435\u0441\u043a\u0430\u044f \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044f \u043e \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0430\u0442\u0430\u0445, \u0430 \u043d\u0435 \u0442\u043e\u0440\u0433\u043e\u0432\u0430\u044f \u043c\u0430\u0440\u043a\u0430. \u0412 \u0418\u043d\u0442\u0435\u0440\u043d\u0435\u0442\u0435 \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e \u043f\u043e \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u044e \u043e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u0438 \u0438 \u041e\u0413\u0420\u041d \u043d\u0430\u0439\u0442\u0438, \u043f\u043e\u0434 \u043a\u0430\u043a\u0438\u043c \u0431\u0440\u0435\u043d\u0434\u043e\u043c \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0442\u0430\u043a\u0441\u043e\u043f\u0430\u0440\u043a, \u043d\u043e \u044d\u0442\u043e \u043f\u0440\u043e\u0446\u0435\u0441\u0441 \u043d\u0435 \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u0438 \u0434\u043e\u0432\u043e\u043b\u044c\u043d\u043e \u0442\u0440\u0443\u0434\u043e\u0435\u043c\u043a\u0438\u0439. \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0438\u0441\u043a\u0430 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043a\u0440\u0443\u043f\u043d\u044b\u0445 \u0442\u0430\u043a\u0441\u043e\u043f\u0430\u0440\u043a\u043e\u0432 \u0441\u043e\u0431\u0440\u0430\u043d\u044b \u0432 \u0444\u0430\u0439\u043b\u0435 &quot;<a href=\"https:\/\/raw.githubusercontent.com\/avidclam\/mostaxiR\/master\/top10orgs.csv\">top10orgs.csv<\/a>&quot;.<br \/>  top10orgs &lt; \u2014 data.table( read.table( \u00abtop10orgs.csv\u00bb, <br \/>   header = TRUE, sep = &quot;;&quot;, colClasses = \u00abcharacter\u00bb, encoding = \u00abUTF-8\u00bb))<br \/>  \u0412\u043e\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c\u0441\u044f \u0432\u0441\u0442\u0440\u043e\u0435\u043d\u043d\u044b\u043c\u0438 \u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044f\u043c\u0438 data.table \u043f\u043e \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d\u0438\u044e \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0438 JOIN \u0434\u0432\u0443\u0445 \u0442\u0430\u0431\u043b\u0438\u0446.  <\/p>\n<pre><code class=\"python\">setkey(top10orgs,OGRN) setkey(st,OGRN) st[top10orgs][order(NumCars, decreasing = TRUE), list(OrgBrand, EasyPhone, NumCars)] <\/code><\/pre>\n<pre><code class=\"markdown\">##               OrgBrand EasyPhone NumCars ##  1:               \u0421\u041e\u041b\u0422 781 81 82     866 ##  2:           \u0422\u0430\u043a\u0441\u0438956 956 8 956     751 ##  3:         \u0422\u0430\u043a\u0441\u0438-\u0420\u0438\u0442\u043c 641 11 11     547 ##  4:    \u0413\u043e\u0440\u043e\u0434\u0441\u043a\u043e\u0435 \u0422\u0430\u043a\u0441\u0438 500 0 500     541 ##  5:            \u0422\u0430\u043a\u0441\u043824 777 66 24     406 ##  6:      \u0424\u043e\u0440\u043c\u0443\u043b\u0430 \u0442\u0430\u043a\u0441\u0438 777 5 777     349 ##  7: \u041d\u043e\u0432\u043e\u0435 \u0436\u0435\u043b\u0442\u043e\u0435 \u0442\u0430\u043a\u0441\u0438 940 88 88     288 ##  8:       14 \u0422\u0430\u043a\u0441\u043e\u043f\u0430\u0440\u043a 707 2 707     267 ##  9:              Cabby 21 21 989     255 ## 10:     \u0413\u043b\u0430\u0432\u0430\u0432\u0442\u043e\u043f\u0440\u043e\u043a\u0430\u0442 927 11 11     238 <\/code><\/pre>\n<p>  <\/p>\n<h5> 2. \u0422\u0440\u0438 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u044b\u0435 \u0430\u0432\u0442\u043e\u043c\u0430\u0440\u043a\u0438, \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0444\u043e\u0440\u043c\u044b \u044e\u0440\u0438\u0434\u0438\u0447\u0435\u0441\u043a\u043e\u0433\u043e \u043b\u0438\u0446\u0430<\/h5>\n<p>\u041a\u0430\u043a\u0438\u0435 \u043c\u0430\u0440\u043a\u0438 \u043c\u0430\u0448\u0438\u043d \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u044b, \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u044e\u0440\u0438\u0434\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0444\u043e\u0440\u043c\u044b \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0430\u0442\u0430? \u0414\u043b\u044f \u043e\u0442\u0432\u0435\u0442\u0430 \u043d\u0430 \u044d\u0442\u043e\u0442 \u0432\u043e\u043f\u0440\u043e\u0441 \u043d\u0443\u0436\u043d\u043e \u043f\u0440\u043e\u0432\u0435\u0441\u0442\u0438 \u0430\u0433\u0440\u0435\u0433\u0430\u0446\u0438\u044e \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u043e \u0434\u0432\u0443\u043c \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f\u043c \u2014 \u043c\u0430\u0440\u043a\u0430 \u043c\u0430\u0448\u0438\u043d\u044b \u0438 \u043e\u0440\u0433\u0444\u043e\u0440\u043c\u0430.<br \/>  \u041f\u0440\u043e\u0446\u0435\u0441\u0441 \u0438\u0434\u0435\u0442 \u0432 \u0442\u0440\u0438 \u044d\u0442\u0430\u043f\u0430:  <\/p>\n<ol>\n<li>\u0412\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0435 \u0430\u0433\u0440\u0435\u0433\u0438\u0440\u043e\u0432\u0430\u043d\u043d\u043e\u0433\u043e \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044f (\u0432 \u0434\u0430\u043d\u043d\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u0447\u0438\u0441\u043b\u043e \u043c\u0430\u0448\u0438\u043d \u043f\u043e \u041e\u0413\u0420\u041d).<\/li>\n<li>\u0412\u044b\u0447\u0438\u0441\u043b\u0435\u043d\u0438\u0435 \u0440\u0430\u043d\u0433\u0430.<\/li>\n<li>\u041e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u0438\u0435 \u0440\u0430\u043d\u0433\u0430 (top 3), \u0441\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u043a\u0430, \u043f\u0435\u0440\u0435\u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u043a\u043e\u043b\u043e\u043d\u043e\u043a \u0438 \u0432\u044b\u0432\u043e\u0434 \u0434\u0430\u043d\u043d\u044b\u0445.<\/li>\n<\/ol>\n<p>  <\/p>\n<pre><code class=\"python\">st &lt;- dt[, list(AGGR = length(RegPlate)), by = list(OrgType, CarBrand) ] st.r &lt;- st[, list(CarBrand, AGGR,                    r = ( 1 + length(AGGR) - rank(AGGR, ties.method=&quot;first&quot;))),             by = list(OrgType)] # ranking by one dimension st.out &lt;- st.r[ r &lt;= 3 ][, list(r, OrgType, cval = paste0(CarBrand,&quot; (&quot;,AGGR,&quot;)&quot;))] dcast(st.out, r ~ OrgType, value.var = &quot;cval&quot;)[-1] # reshape data and hide r <\/code><\/pre>\n<pre><code class=\"markdown\">##             \u0417\u0410\u041e               \u0418\u041f        \u041d\u041f             \u041e\u0410\u041e            \u041e\u041e\u041e ## 1    FORD (212) CHEVROLET (2465) VOLVO (1)       KIA (192)    FORD (3297) ## 2 RENAULT (175)      FORD (2238)      &lt;NA&gt; CHEVROLET (115) RENAULT (2922) ## 3 HYUNDAI (122)   RENAULT (1996)      &lt;NA&gt;       FORD (53) HYUNDAI (2812) <\/code><\/pre>\n<p>  <\/p>\n<h4>\u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f<\/h4>\n<h5>1. \u041e\u0442\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u0432 \u0432\u0438\u0434\u0435 \u043a\u0440\u0443\u0433\u043e\u0432\u043e\u0439 \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u044b<\/h5>\n<p>\u041a\u0440\u0443\u0433\u043e\u0432\u0430\u044f (\u0441\u0435\u043a\u0442\u043e\u0440\u043d\u0430\u044f) \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430, Pie Chart, \u0432\u0435\u0441\u044c\u043c\u0430 \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u0430 \u0432 \u0431\u0438\u0437\u043d\u0435\u0441-\u0441\u0440\u0435\u0434\u0435, \u043d\u043e \u043f\u043e\u0434\u0432\u0435\u0440\u0433\u0430\u0435\u0442\u0441\u044f \u043e\u0431\u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u043e\u0439 \u043a\u0440\u0438\u0442\u0438\u043a\u0435 \u043f\u0440\u043e\u0444\u0435\u0441\u0441\u0438\u043e\u043d\u0430\u043b\u0430\u043c\u0438 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u0422\u0435\u043c \u043d\u0435 \u043c\u0435\u043d\u0435\u0435, \u0435\u0435 \u043d\u0443\u0436\u043d\u043e \u0443\u043c\u0435\u0442\u044c \u00ab\u0433\u043e\u0442\u043e\u0432\u0438\u0442\u044c\u00bb.<br \/>  \u041f\u0443\u0441\u0442\u044c \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043e\u0442\u043e\u0431\u0440\u0430\u0437\u0438\u0442\u044c \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0435 \u0447\u0438\u0441\u043b\u0430 \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0439 \u0442\u0430\u043a\u0441\u0438, \u043f\u043e \u0430\u0432\u0442\u043e\u043c\u0430\u0440\u043a\u0430\u043c. \u0427\u0442\u043e\u0431\u044b \u043d\u0435 \u043f\u0435\u0440\u0435\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0443 \u043f\u043e\u043a\u0430\u0436\u0435\u043c \u0442\u043e\u043b\u044c\u043a\u043e \u043c\u0430\u0440\u043a\u0438 \u0441 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e\u043c \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0439 \u043d\u0435 \u043c\u0435\u043d\u044c\u0448\u0435 1000.  <\/p>\n<pre><code class=\"python\">st &lt;- dt[, list(N = length(RegPlate)), by = CarBrand ] # Summary table st &lt;- st[, CarBrand := reorder(CarBrand, N) ] piedata &lt;- rbind(   st[ N &gt;= 1000 ][ order(N, decreasing=T) ],   data.table( CarBrand = &quot;\u0414\u0440\u0443\u0433\u0438\u0435 \u043c\u0430\u0440\u043a\u0438&quot;, N = sum( st[N &lt; 1000]$N) )   ) piedata <\/code><\/pre>\n<pre><code class=\"markdown\">##          CarBrand    N ##  1:          FORD 5800 ##  2:       RENAULT 5093 ##  3:       HYUNDAI 4727 ##  4:     CHEVROLET 4660 ##  5:           KIA 2220 ##  6:         SKODA 2073 ##  7:        NISSAN 1321 ##  8:    VOLKSWAGEN 1298 ##  9:        TOYOTA 1075 ## 10: MERCEDES-BENZ 1039 ## 11:  \u0414\u0440\u0443\u0433\u0438\u0435 \u043c\u0430\u0440\u043a\u0438 6534 <\/code><\/pre>\n<p>\u0414\u043b\u044f \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u0433\u0440\u0430\u0444\u0438\u043a\u0430 \u0445\u043e\u0442\u0435\u043b\u043e\u0441\u044c \u0431\u044b \u0437\u0430\u0444\u0438\u043a\u0441\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0438\u043c\u0435\u043d\u043d\u043e \u0442\u0430\u043a\u043e\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u0441\u043b\u0435\u0434\u043e\u0432\u0430\u043d\u0438\u044f \u043c\u0430\u0440\u043e\u043a. \u0415\u0441\u043b\u0438 \u044d\u0442\u043e\u0433\u043e \u043d\u0435 \u0441\u0434\u0435\u043b\u0430\u0442\u044c, \u0442\u043e \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0430\u044f \u0441\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u043a\u0430 \u0432\u044b\u0432\u0435\u0434\u0435\u0442 \u00ab\u0414\u0440\u0443\u0433\u0438\u0435 \u043c\u0430\u0440\u043a\u0438\u00bb \u0441 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0435\u0433\u043e \u043c\u0435\u0441\u0442\u0430 \u043d\u0430 \u043f\u0435\u0440\u0432\u043e\u0435.  <\/p>\n<pre><code class=\"python\">piedata &lt;- piedata[, CarBrand := factor(CarBrand, levels = CarBrand, ordered = TRUE)]<\/code><\/pre>\n<p>\u0414\u043b\u044f \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u044b \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u043c ggplot2.  <\/p>\n<pre><code class=\"python\">pie &lt;-  ggplot(piedata, aes( x = &quot;&quot;, y = N, fill = CarBrand)) +          geom_bar(stat = &quot;identity&quot;) +         coord_polar(theta = &quot;y&quot;) pie <\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/raw.githubusercontent.com\/avidclam\/mostaxiR\/master\/figure\/pie_1.png\" title=\"plot of chunk pie_1\" alt=\"plot of chunk pie_1\"\/><br \/>  \u0412\u044b\u0432\u043e\u0434 \u0443\u0436\u0435 \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u0435\u043d. \u041e\u0434\u043d\u0430\u043a\u043e \u0445\u043e\u0442\u0435\u043b\u043e\u0441\u044c \u0431\u044b \u0432\u043d\u0435\u0441\u0442\u0438 \u0440\u044f\u0434 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0445 \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u0438\u0439:  <\/p>\n<ul>\n<li>\u0443\u0431\u0440\u0430\u0442\u044c \u0441\u0435\u0440\u044b\u0439 \u0444\u043e\u043d, \u0433\u0440\u0430\u043d\u0438\u0446\u044b, \u043a\u0440\u0443\u0433\u043e\u0432\u0443\u044e \u043e\u0441\u044c, \u043f\u043e\u0434\u043f\u0438\u0441\u0438 \u0438 \u043e\u0442\u043c\u0435\u0442\u043a\u0438;<\/li>\n<li>\u0432\u044b\u0431\u0440\u0430\u0442\u044c \u0431\u043e\u043b\u0435\u0435 \u0440\u0430\u0437\u043b\u0438\u0447\u0438\u043c\u0443\u044e \u0446\u0432\u0435\u0442\u043e\u0432\u0443\u044e \u0448\u043a\u0430\u043b\u0443 \u0438 \u043e\u0431\u0432\u0435\u0441\u0442\u0438 \u043a\u0430\u0436\u0434\u044b\u0439 \u00ab\u043a\u0443\u0441\u043e\u043a \u043f\u0438\u0440\u043e\u0433\u0430\u00bb;<\/li>\n<li>\u0440\u044f\u0434\u043e\u043c \u0441 \u043a\u0430\u0436\u0434\u044b\u043c \u0441\u0435\u043a\u0442\u043e\u0440\u043e\u043c \u043f\u0440\u043e\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u0447\u0438\u0441\u043b\u043e \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0439, \u0441\u043e\u043e\u0442\u0432\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0435\u0435 \u043c\u0430\u0440\u043a\u0435;<\/li>\n<li>\u0434\u0430\u0442\u044c \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u043e\u0435 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435 \u043b\u0435\u0433\u0435\u043d\u0434\u0435.<\/li>\n<\/ul>\n<p>\u041a\u043e\u0434 \u043d\u0438\u0436\u0435 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u0441\u0435 \u043f\u0435\u0440\u0435\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u043e\u0435. \u0414\u043b\u044f \u043e\u0442\u043e\u0431\u0440\u0430\u0436\u0435\u043d\u0438\u044f \u043d\u0430\u0434\u043f\u0438\u0441\u0435\u0439 \u0440\u044f\u0434\u043e\u043c \u0441 \u0441\u0435\u043a\u0442\u043e\u0440\u0430\u043c\u0438 \u043f\u0440\u0438\u0448\u043b\u043e\u0441\u044c \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u043f\u043e\u043b\u0435 \u0441 \u0440\u0430\u0441\u0447\u0435\u0442\u043e\u043c \u0442\u043e\u0447\u043a\u0438 \u0446\u0435\u043d\u0442\u0440\u0430 \u0441\u0435\u043a\u0442\u043e\u0440\u0430 (\u043f\u043e\u0434\u0441\u043c\u043e\u0442\u0440\u0435\u043d\u043e \u0443 <a href=\"http:\/\/artelstatistikov.ru\/r\/krugovaya-diagramma-v-r-c-pomoshh-yu-ggplot-krasny-e-zelyony-e-zolotopogonny-e.html\">artelstatistikov.ru<\/a>).  <\/p>\n<pre><code class=\"python\">piedata &lt;- piedata[, pos := cumsum(N) - 0.5*N ] pie &lt;-  ggplot(piedata, aes( x = &quot;&quot;, y = N, fill = CarBrand)) +         geom_bar( color = &quot;black&quot;, stat = &quot;identity&quot;, width = 0.5) +         geom_text( aes(label = N, y = pos), x = 1.4, color = &quot;black&quot;, size = 5) +         scale_fill_brewer(palette = &quot;Paired&quot;, name = &quot;\u041c\u0430\u0440\u043a\u0438 \u0430\u0432\u0442\u043e&quot;) +         coord_polar(theta = &quot;y&quot;) +         theme_bw() +         theme ( panel.border = element_blank()               , panel.grid.major = element_blank()               , axis.ticks = element_blank()               , axis.title.x = element_blank()               , axis.title.y = element_blank()               , axis.text.x = element_blank()               , legend.title = element_text(face=&quot;plain&quot;, size=16)               ) pie <\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/raw.githubusercontent.com\/avidclam\/mostaxiR\/master\/figure\/pie_2.png\" title=\"plot of chunk pie_2\" alt=\"plot of chunk pie_2\"\/><\/p>\n<h5>2. \u0421\u0442\u043e\u043b\u0431\u0447\u0430\u0442\u0430\u044f \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430<\/h5>\n<p>\u0411\u043e\u043b\u0435\u0435 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0442\u0438\u0432\u043d\u0430\u044f \u0430\u043b\u044c\u0442\u0435\u0440\u043d\u0430\u0442\u0438\u0432\u0430 \u043a\u0440\u0443\u0433\u0443 \u2014 \u0441\u0442\u043e\u043b\u0431\u0447\u0430\u0442\u0430\u044f \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430, Bar Chart. \u041f\u043e\u043c\u0438\u043c\u043e \u0442\u043e\u0433\u043e, \u0447\u0442\u043e \u0434\u043b\u0438\u043d\u044b \u0441\u0442\u043e\u043b\u0431\u0438\u043a\u043e\u0432 \u0443\u0434\u043e\u0431\u043d\u0435\u0435 \u0441\u0440\u0430\u0432\u043d\u0438\u0432\u0430\u0442\u044c, \u0447\u0435\u043c \u0434\u043b\u0438\u043d\u044b \u0434\u0443\u0433 \u0438\u043b\u0438 \u043f\u043b\u043e\u0449\u0430\u0434\u0438 \u0441\u0435\u043a\u0442\u043e\u0440\u043e\u0432 \u043a\u0440\u0443\u0433\u0430, \u0441\u0442\u043e\u043b\u0431\u0447\u0430\u0442\u0430\u044f \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430 \u043c\u043e\u0436\u0435\u0442 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043e\u0442\u043e\u0431\u0440\u0430\u0437\u0438\u0442\u044c, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0440\u0430\u0441\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u0438 \u0447\u0438\u0441\u043b\u0430 \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0439 \u043f\u043e \u043e\u0440\u0433\u0444\u043e\u0440\u043c\u0430\u043c.  <\/p>\n<pre><code class=\"python\">st &lt;- dt[, list(N = length(RegPlate)), by = list(OrgType, CarBrand) ] # Summary table cbsort &lt;- st[, list( S = sum(N) ), keyby = CarBrand ] # Order by total number setkey(st, CarBrand) st &lt;- st[cbsort] # Join  topcb &lt;- st[ S &gt;= 1000 ][ order(S) ] bottomcb &lt;- st[S &lt; 1000, list(CarBrand = &quot;\u0414\u0440\u0443\u0433\u0438\u0435 \u043c\u0430\u0440\u043a\u0438&quot;, OrgType, N = sum(N)), by = OrgType] bottomcb &lt;- bottomcb[, list(CarBrand, OrgType, N, S = sum(N))]  bardata &lt;- rbind( bottomcb, topcb)   bardata &lt;- bardata[, CarBrand := factor(CarBrand, levels = unique(CarBrand), ordered=T)] # bar &lt;-  ggplot(bardata, aes(x = CarBrand, weight = N, fill = OrgType)) +         geom_bar() + coord_flip() +         scale_fill_brewer(palette = &quot;Spectral&quot;, name = &quot;\u041e\u0440\u0433\u0444\u043e\u0440\u043c\u0430&quot;) +         labs(list(y = &quot;\u041a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043b\u0438\u0446\u0435\u043d\u0437\u0438\u0439&quot;, x = &quot;\u041c\u0430\u0440\u043a\u0438 \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u0435\u0439&quot;)) +         theme_bw() bar <\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/raw.githubusercontent.com\/avidclam\/mostaxiR\/master\/figure\/bar.png\" title=\"plot of chunk bar\" alt=\"plot of chunk bar\"\/>  <\/p>\n<h5>3. \u0414\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430 Heat Map (\u0422\u0435\u043f\u043b\u043e\u043a\u0430\u0440\u0442\u0430)<\/h5>\n<p>\u041f\u0440\u0435\u0434\u043f\u043e\u043b\u043e\u0436\u0438\u043c, \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u043e\u0442\u0432\u0435\u0442 \u043d\u0430 \u0432\u043e\u043f\u0440\u043e\u0441: \u00ab\u0425\u043e\u0437\u044f\u0435\u0432\u0430 \u043a\u0430\u043a\u0438\u0445 \u043c\u0430\u0440\u043e\u043a \u043c\u0430\u0448\u0438\u043d (\u0441\u0440\u0435\u0434\u0438 \u0442\u0430\u043a\u0441\u0438\u0441\u0442\u043e\u0432) \u0431\u043e\u043b\u044c\u0448\u0435 \u0432\u0441\u0435\u0433\u043e \u043f\u043e\u0434\u0432\u0435\u0440\u0436\u0435\u043d\u044b \u043c\u043e\u0434\u0435 \u043d\u0430 \u00ab\u043a\u0440\u0430\u0441\u0438\u0432\u044b\u0435\u00bb \u043d\u043e\u043c\u0435\u0440\u0430?\u00bb. \u041a\u0440\u0430\u0441\u0438\u0432\u044b\u043c\u0438 \u0432 \u0434\u0430\u043d\u043d\u043e\u043c \u0441\u043b\u0443\u0447\u0430\u0435 \u0431\u0443\u0434\u0435\u043c \u0441\u0447\u0438\u0442\u0430\u0442\u044c \u043d\u043e\u043c\u0435\u0440\u0430 \u0441 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u043c\u0438 \u0446\u0438\u0444\u0440\u0430\u043c\u0438 \u0432 \u0442\u0440\u043e\u0439\u043a\u0430\u0445: 111, 222 \u0438 \u0442.\u0434.<br \/>  \u0410\u043d\u0430\u043b\u0438\u0437 \u0432\u0435\u0434\u0435\u0442\u0441\u044f \u043f\u043e \u0434\u0432\u0443\u043c \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f\u043c \u2014 \u043c\u0430\u0440\u043a\u0430 \u043c\u0430\u0448\u0438\u043d\u044b \u0438 \u0442\u0440\u043e\u0439\u043a\u0430. \u041f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044c \u2014 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043c\u0430\u0448\u0438\u043d \u0441 \u0437\u0430\u0434\u0430\u043d\u043d\u044b\u043c \u0441\u043e\u0447\u0435\u0442\u0430\u043d\u0438\u0435\u043c \u043c\u0430\u0440\u043a\u0438 \u0438 \u0442\u0440\u043e\u0439\u043a\u0438. \u0414\u043b\u044f \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u0442\u0430\u043a\u043e\u0433\u043e \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0445\u043e\u0440\u043e\u0448\u043e \u043f\u043e\u0434\u0445\u043e\u0434\u0438\u0442 \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u044b\u0439 \u0430\u043d\u0430\u043b\u043e\u0433 \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u2014 \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430 heat map. \u0427\u0435\u043c \u0431\u043e\u043b\u0435\u0435 \u043f\u043e\u043f\u0443\u043b\u044f\u0440\u043d\u0430 \u0442\u0440\u043e\u0439\u043a\u0430, \u0442\u0435\u043c \u0431\u043e\u043b\u0435\u0435 \u0438\u043d\u0442\u0435\u043d\u0441\u0438\u0432\u043d\u044b\u0439 \u0446\u0432\u0435\u0442 \u043a\u043e\u0434\u0438\u0440\u0443\u0435\u0442 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u044f\u0447\u0435\u0439\u043a\u0438.  <\/p>\n<pre><code class=\"python\">ln &lt;- dt[grep( &quot;^[^0-9]([0-9])\\\\1{2}.+$&quot; , RegPlate),          list(CarBrand, LuckyNum = gsub(&quot;^[^0-9]([0-9]{3}).+$&quot;,&quot;\\\\1&quot;, RegPlate))] ln &lt;- ln[, list( N = .N),  by = list(CarBrand, LuckyNum) ] ln &lt;- ln[, Luck := sum(N), by = list(CarBrand) ] # Total number of lucky regplates per car brand ln &lt;- ln[, CarBrand := reorder(CarBrand, Luck) ] # heatmap &lt;-  ggplot(ln, aes(x = CarBrand, y = LuckyNum)) +               geom_tile( aes(fill = as.character(N)), color = &quot;black&quot;) +              scale_fill_brewer(palette = &quot;YlOrRd&quot;, name = &quot;\u0427\u0438\u0441\u043b\u043e \u00ab\u043a\u0440\u0430\u0441\u0438\u0432\u044b\u0445\u00bb \u043d\u043e\u043c\u0435\u0440\u043e\u0432:&quot;) +             labs(list(x = &quot;\u041c\u0430\u0440\u043a\u0438 \u0430\u0432\u0442\u043e\u043c\u043e\u0431\u0438\u043b\u0435\u0439&quot;, y = &quot;\u041d\u043e\u043c\u0435\u0440\u043d\u044b\u0435 \u0442\u0440\u043e\u0439\u043a\u0438&quot;)) +             theme_bw() +             theme ( panel.grid.major = element_blank()                     , axis.text.x = element_text(angle = 45, hjust = 1)                     , axis.title.y = element_text(vjust = 0.3)                     , legend.position = &quot;top&quot;                     , legend.title.align = 1             ) heatmap <\/code><\/pre>\n<p><img decoding=\"async\" src=\"https:\/\/raw.githubusercontent.com\/avidclam\/mostaxiR\/master\/figure\/lucky_numbers.png\" title=\"plot of chunk lucky_numbers\" alt=\"plot of chunk lucky_numbers\"\/><br \/>  \u0412\u043e \u0432\u0441\u0435\u0445 \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c\u0430\u0445 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u044b \u043d\u0430\u0443\u0447\u043d\u043e \u043e\u0431\u043e\u0441\u043d\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u0446\u0432\u0435\u0442\u043e\u0432\u044b\u0435 \u043f\u0430\u043b\u0438\u0442\u0440\u044b \u043f\u0440\u043e\u0435\u043a\u0442\u0430 <a href=\"http:\/\/colorbrewer2.org\">Color Brewer 2.0<\/a>. \t\t\t<\/p>\n<div class=\"clear\"><\/div>\n<\/p><\/div>\n<p> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"http:\/\/habrahabr.ru\/post\/217963\/\"> http:\/\/habrahabr.ru\/post\/217963\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div class=\"content html_format\"> \t\t\t\u041c\u0430\u0442\u0435\u0440\u0438\u0430\u043b \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u043b\u0435\u0437\u0435\u043d \u0442\u0435\u043c, \u043a\u0442\u043e \u043e\u0441\u0432\u0430\u0438\u0432\u0430\u0435\u0442 \u044f\u0437\u044b\u043a R \u0432 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442\u0430 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0442\u0430\u0431\u043b\u0438\u0447\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438 \u0445\u043e\u0447\u0435\u0442 \u0443\u0432\u0438\u0434\u0435\u0442\u044c \u0441\u043a\u0432\u043e\u0437\u043d\u043e\u0439 \u043f\u0440\u0438\u043c\u0435\u0440 \u0440\u0435\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0445 \u0448\u0430\u0433\u043e\u0432 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438.<br \/>  \u041d\u0438\u0436\u0435 \u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u0435\u0442\u0441\u044f \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0438\u0437 csv-\u0444\u0430\u0439\u043b\u043e\u0432, \u0440\u0430\u0437\u0431\u043e\u0440 \u0442\u0435\u043a\u0441\u0442\u043e\u0432\u044b\u0445 \u0441\u0442\u0440\u043e\u043a \u0441 \u044d\u043b\u0435\u043c\u0435\u043d\u0442\u0430\u043c\u0438 \u043e\u0447\u0438\u0441\u0442\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445, \u0430\u0433\u0440\u0435\u0433\u0430\u0446\u0438\u044f \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u043e \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u043c \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f\u043c \u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0435 \u0434\u0438\u0430\u0433\u0440\u0430\u043c\u043c.<br \/>  \u0412 \u043f\u0440\u0438\u043c\u0435\u0440\u0435 \u0430\u043a\u0442\u0438\u0432\u043d\u043e \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0435\u0442\u0441\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0441\u0442\u044c \u043f\u0430\u043a\u0435\u0442\u043e\u0432 data.table, reshape2, stringdist \u0438 ggplot2.<\/p>\n<p>  \u0412 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0435 \u00ab\u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445\u00bb \u0432\u0437\u044f\u0442\u0430 \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044f \u043e \u0432\u044b\u0434\u0430\u043d\u043d\u044b\u0445 \u0440\u0430\u0437\u0440\u0435\u0448\u0435\u043d\u0438\u044f\u0445 \u043d\u0430 \u043e\u0441\u0443\u0449\u0435\u0441\u0442\u0432\u043b\u0435\u043d\u0438\u0435 \u0434\u0435\u044f\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u0438 \u043f\u043e \u043f\u0435\u0440\u0435\u0432\u043e\u0437\u043a\u0435 \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u043e\u0432 \u0438 \u0431\u0430\u0433\u0430\u0436\u0430 \u043b\u0435\u0433\u043a\u043e\u0432\u044b\u043c \u0442\u0430\u043a\u0441\u0438 \u0432 \u041c\u043e\u0441\u043a\u0432\u0435. \u0414\u0430\u043d\u043d\u044b\u0435 \u043f\u0440\u0435\u0434\u043e\u0441\u0442\u0430\u0432\u043b\u0435\u043d\u044b \u0432 \u043e\u0431\u0449\u0435\u0435 \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u0414\u0435\u043f\u0430\u0440\u0442\u0430\u043c\u0435\u043d\u0442\u043e\u043c \u0442\u0440\u0430\u043d\u0441\u043f\u043e\u0440\u0442\u0430 \u0438 \u0440\u0430\u0437\u0432\u0438\u0442\u0438\u044f \u0434\u043e\u0440\u043e\u0436\u043d\u043e-\u0442\u0440\u0430\u043d\u0441\u043f\u043e\u0440\u0442\u043d\u043e\u0439 \u0438\u043d\u0444\u0440\u0430\u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u044b \u0433\u043e\u0440\u043e\u0434\u0430 \u041c\u043e\u0441\u043a\u0432\u044b. \u0421\u0442\u0440\u0430\u043d\u0438\u0446\u0430 \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 <a href=\"http:\/\/data.mos.ru\/datasets\/655\">data.mos.ru\/datasets\/655<\/a><br \/>  \u0418\u0441\u0445\u043e\u0434\u043d\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0438\u043c\u0435\u044e\u0442 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u0444\u043e\u0440\u043c\u0430\u0442:  <\/p>\n<pre><code class=\"markdown\">ROWNUM;VEHICLE_NUM;FULL_NAME;BLANK_NUM;VEHICLE_BRAND_MODEL;INN;OGRN 1;&quot;\u0410248\u0423\u0415197&quot;;&quot;\u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-\u0410\u0412\u0422\u041e\u041b\u0410\u0419\u041d\u00bb&quot;;&quot;017263&quot;;&quot;FORD FOCUS&quot;;&quot;7734653292&quot;;&quot;1117746207578&quot; 2;&quot;\u0410249\u0423\u0415197&quot;;&quot;\u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-\u0410\u0412\u0422\u041e\u041b\u0410\u0419\u041d\u00bb&quot;;&quot;017264&quot;;&quot;FORD FOCUS&quot;;&quot;7734653292&quot;;&quot;1117746207578&quot; 3;&quot;\u0410245\u0423\u0415197&quot;;&quot;\u041e\u041e\u041e \u00ab\u0422\u0410\u041a\u0421\u0418-\u0410\u0412\u0422\u041e\u041b\u0410\u0419\u041d\u00bb&quot;;&quot;017265&quot;;&quot;FORD FOCUS&quot;;&quot;7734653292&quot;;&quot;1117746207578&quot; ``` <\/code><\/pre>\n<p>  <\/p>\n<h5>1. \u0417\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u043f\u0435\u0440\u0432\u0438\u0447\u043d\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0445<\/h5>\n<p>\u0414\u0430\u043d\u043d\u044b\u0435 \u043c\u043e\u0436\u043d\u043e \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u043d\u0435\u043f\u043e\u0441\u0440\u0435\u0434\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0441 \u0441\u0430\u0439\u0442\u0430. \u0412 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0435 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u0441\u0440\u0430\u0437\u0443 \u043f\u0435\u0440\u0435\u0438\u043c\u0435\u043d\u0443\u0435\u043c \u043a\u043e\u043b\u043e\u043d\u043a\u0438 \u0443\u0434\u043e\u0431\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c.  <\/p>\n<pre><code class=\"python\">url &lt;- &quot;http:\/\/data.mos.ru\/datasets\/download\/655&quot; colnames = c(&quot;RowNumber&quot;, &quot;RegPlate&quot;, &quot;LegalName&quot;, &quot;DocNum&quot;, &quot;Car&quot;, &quot;INN&quot;, &quot;OGRN&quot;, &quot;Void&quot;) rawdata &lt;- read.table(url, header = TRUE, sep = &quot;;&quot;,              colClasses = c(&quot;numeric&quot;, rep(&quot;character&quot;,6), NA),              col.names = colnames,              strip.white = TRUE,              blank.lines.skip = TRUE,              stringsAsFactors = FALSE,              encoding = &quot;UTF-8&quot;)<\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c \u043c\u043e\u0436\u043d\u043e \u043f\u0440\u0438\u0441\u0442\u0443\u043f\u0430\u0442\u044c \u043a \u0430\u043d\u0430\u043b\u0438\u0437\u0443 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438\u2026  <\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-217963","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/217963","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=217963"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/217963\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=217963"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=217963"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=217963"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}