{"id":337190,"date":"2022-08-17T21:00:14","date_gmt":"2022-08-17T21:00:14","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=337190"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=337190","title":{"rendered":"<span>\u0427\u0435\u0442\u044b\u0440\u0435 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0434\u043b\u044f \u0431\u044b\u0441\u0442\u0440\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u044b \u0441 Big Data<\/span>"},"content":{"rendered":"<div><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u042f \u0447\u0430\u0441\u0442\u043e \u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0441\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044f\u043c\u0438 \u0434\u043b\u044f \u0440\u0430\u0431\u043e\u0442\u044b \u0441 \u0431\u043e\u043b\u044c\u0448\u0438\u043c\u0438 \u0434\u0430\u043d\u043d\u044b\u043c\u0438. \u041e\u043d\u0438 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0442 \u0443\u043f\u0440\u043e\u0441\u0438\u0442\u044c \u0438 \u0443\u0441\u043a\u043e\u0440\u0438\u0442\u044c \u0440\u0430\u0431\u043e\u0442\u0443. \u041d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u044f \u043d\u0430\u0448\u0435\u043b \u043d\u0430 \u043f\u0440\u043e\u0441\u0442\u043e\u0440\u0430\u0445 \u0438\u043d\u0442\u0435\u0440\u043d\u0435\u0442\u0430, \u0434\u0440\u0443\u0433\u0438\u0435 \u043d\u0430\u043f\u0438\u0441\u0430\u043b \u0441\u0430\u043c. \u0421\u0435\u0433\u043e\u0434\u043d\u044f \u0445\u043e\u0447\u0443 \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u0447\u0435\u0442\u044b\u0440\u044c\u043c\u044f \u0438\u0437 \u043d\u0438\u0445, \u043c\u043e\u0436\u0435\u0442 \u043a\u043e\u043c\u0443-\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u043b\u0435\u0437\u043d\u043e.<\/p>\n<h2>\u0411\u044b\u0441\u0442\u0440\u043e\u0435 \u0447\u0442\u0435\u043d\u0438\u0435 \u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u0444\u0430\u0439\u043b\u043e\u0432<\/h2>\n<p>\u041e\u0434\u0438\u043d \u0438\u0437 \u043f\u0435\u0440\u0432\u044b\u0445 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442\u043e\u0432, \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c \u0441\u0442\u0430\u043b\u043a\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u043b\u0438\u0431\u043e Data Scientist \u2014 \u044d\u0442\u043e Pandas, \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 Python \u0434\u043b\u044f \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0438 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u0421 \u0435\u0451 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u043c\u044b \u0438\u043c\u043f\u043e\u0440\u0442\u0438\u0440\u0443\u0435\u043c \u0438 \u0441\u043e\u0440\u0442\u0438\u0440\u0443\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435, \u0434\u0435\u043b\u0430\u0435\u043c \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u0438 \u043d\u0430\u0445\u043e\u0434\u0438\u043c \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0447\u0442\u043e\u0431\u044b \u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0442\u044c \u0444\u0430\u0439\u043b \u0441\u0440\u0435\u0434\u0441\u0442\u0432\u0430\u043c\u0438 Pandas \u0432 Python \u043c\u044b \u043f\u0438\u0448\u0435\u043c:<\/p>\n<pre><code class=\"python\">import pandas as pd data = pd.read_csv('data_file.csv')<\/code><\/pre>\n<p>\u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u0440\u043e\u0441\u0442\u043e\u0439 \u0438 \u043f\u043e\u043d\u044f\u0442\u043d\u044b\u0439. \u041a\u0430\u0436\u0434\u044b\u0439 Data Scientist \u0438\u043b\u0438 \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u0437\u043d\u0430\u0435\u0442 \u044d\u0442\u043e. \u041d\u043e \u0435\u0441\u043b\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u043c\u043d\u043e\u0433\u043e? \u0421\u043a\u0430\u0436\u0435\u043c 100 000 000 \u0441\u0442\u0440\u043e\u043a, \u043e\u043d\u0438 \u043f\u043e\u0441\u0442\u043e\u044f\u043d\u043d\u043e \u043c\u0435\u043d\u044f\u044e\u0442\u0441\u044f, \u0441\u0440\u043e\u043a\u0438 \u0433\u043e\u0440\u044f\u0442, \u0438 \u0434\u043e \u043e\u0431\u0435\u0434\u0430 \u043d\u0430\u0434\u043e \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u0442\u044c \u0435\u0449\u0435 100 \u0433\u0438\u043f\u043e\u0442\u0435\u0437?<\/p>\n<p>\u0412\u043e\u0437\u044c\u043c\u0435\u043c <a href=\"https:\/\/www.kaggle.com\/datasets\/mathchi\/diabetes-data-set\" rel=\"noopener noreferrer nofollow\">\u0438\u0441\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u0441\u043a\u0438\u0439 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u043e \u0434\u0438\u0430\u0431\u0435\u0442\u0435<\/a> \u0441 \u0441\u0430\u0439\u0442\u0430 Kaggle \u0438 \u043f\u0440\u043e\u0434\u0443\u0431\u043b\u0438\u0440\u0443\u0435\u043c \u043a\u0430\u0436\u0434\u0443\u044e \u0441\u0442\u0440\u043e\u043a\u0443 100 000 \u0434\u043b\u044f \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u044f \u043d\u0430\u0448\u0435\u0433\u043e \u0442\u0435\u0441\u0442\u043e\u0432\u043e\u0433\u043e \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f 76 800 000 \u0441\u0442\u0440\u043e\u043a. <\/p>\n<p>\u0418\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u044b\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0442\u0430\u043a:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<th>\n<\/th>\n<th>\n<p>Pregnancies<\/p>\n<\/th>\n<th>\n<p>Glucose<\/p>\n<\/th>\n<th>\n<p>BloodPressure<\/p>\n<\/th>\n<th>\n<p>SkinThickness<\/p>\n<\/th>\n<th>\n<p>Insulin<\/p>\n<\/th>\n<th>\n<p>BMI<\/p>\n<\/th>\n<th>\n<p>DiabetesPedigreeFunction<\/p>\n<\/th>\n<th>\n<p>Age<\/p>\n<\/th>\n<th>\n<p>Outcome<\/p>\n<\/th>\n<\/tr>\n<tr>\n<th>\n<p>0<\/p>\n<\/th>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>1<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">85<\/p>\n<\/td>\n<td>\n<p align=\"left\">66<\/p>\n<\/td>\n<td>\n<p align=\"left\">29<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.351<\/p>\n<\/td>\n<td>\n<p align=\"left\">31<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>2<\/p>\n<\/th>\n<td>\n<p align=\"left\">8<\/p>\n<\/td>\n<td>\n<p align=\"left\">183<\/p>\n<\/td>\n<td>\n<p align=\"left\">64<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">23.3<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.672<\/p>\n<\/td>\n<td>\n<p align=\"left\">32<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>3<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">89<\/p>\n<\/td>\n<td>\n<p align=\"left\">66<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">94<\/p>\n<\/td>\n<td>\n<p align=\"left\">28.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.167<\/p>\n<\/td>\n<td>\n<p align=\"left\">21<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>4<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">137<\/p>\n<\/td>\n<td>\n<p align=\"left\">40<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">168<\/p>\n<\/td>\n<td>\n<p align=\"left\">43.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">2.288<\/p>\n<\/td>\n<td>\n<p align=\"left\">33<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>&#8230;<\/p>\n<\/th>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>763<\/p>\n<\/th>\n<td>\n<p align=\"left\">10<\/p>\n<\/td>\n<td>\n<p align=\"left\">101<\/p>\n<\/td>\n<td>\n<p align=\"left\">76<\/p>\n<\/td>\n<td>\n<p align=\"left\">48<\/p>\n<\/td>\n<td>\n<p align=\"left\">180<\/p>\n<\/td>\n<td>\n<p align=\"left\">32.9<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.171<\/p>\n<\/td>\n<td>\n<p align=\"left\">63<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>764<\/p>\n<\/th>\n<td>\n<p align=\"left\">2<\/p>\n<\/td>\n<td>\n<p align=\"left\">122<\/p>\n<\/td>\n<td>\n<p align=\"left\">70<\/p>\n<\/td>\n<td>\n<p align=\"left\">27<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">36.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.340<\/p>\n<\/td>\n<td>\n<p align=\"left\">27<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>765<\/p>\n<\/th>\n<td>\n<p align=\"left\">5<\/p>\n<\/td>\n<td>\n<p align=\"left\">121<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">112<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.245<\/p>\n<\/td>\n<td>\n<p align=\"left\">30<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>766<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">126<\/p>\n<\/td>\n<td>\n<p align=\"left\">60<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">30.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.349<\/p>\n<\/td>\n<td>\n<p align=\"left\">47<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>767<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">93<\/p>\n<\/td>\n<td>\n<p align=\"left\">70<\/p>\n<\/td>\n<td>\n<p align=\"left\">31<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">30.4<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.315<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u044b\u0432\u0430\u0435\u043c \u0435\u0433\u043e \u0434\u043b\u044f \u043d\u0430\u0448\u0438\u0445 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447:<\/p>\n<pre><code class=\"python\"># \u0427\u0442\u0435\u043d\u0438\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438\u0437 \u0444\u0430\u0439\u043b\u0430 df = pd.read_csv('diabetes.csv')  # \u0421\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u0442\u0435\u0441\u0442\u043e\u0432\u043e\u0433\u043e \u0444\u0430\u0439\u043b\u0430 df = df.loc[df.index.repeat(100000)]  # \u0421\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0435 \u0432 \u0444\u0430\u0439\u043b \u0434\u043b\u044f \u044d\u043a\u0441\u043f\u0438\u0440\u0435\u043c\u0435\u043d\u0442\u043e\u0432 df.to_csv('benchmark.csv')  print(len(df), '\u0441\u0442\u0440\u043e\u043a')<\/code><\/pre>\n<pre><code>76 800 000 \u0441\u0442\u0440\u043e\u043a<\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0440\u0435\u043c\u044f \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f<\/summary>\n<div class=\"spoiler__content\">\n<p>4 \u043c\u0438\u043d 26.6 \u0441\u0435\u043a<\/p>\n<\/div>\n<\/details>\n<p>\u041f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u0431\u044b\u043b\u043e \u0434\u043e\u043b\u0433\u0438\u043c, \u043d\u043e \u0431\u0443\u0434\u0435\u043c \u043d\u0430\u0434\u0435\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u0432\u0440\u0435\u043c\u044f \u043f\u043e\u0442\u0440\u0430\u0447\u0435\u043d\u043e \u043d\u0435 \u0437\u0440\u044f. \u0421\u043a\u043e\u043b\u044c\u043a\u043e \u0436\u0435 \u0437\u0430\u0439\u043c\u0435\u0442 \u0447\u0442\u0435\u043d\u0438\u0435 \u0442\u0430\u043a\u043e\u0433\u043e \u0444\u0430\u0439\u043b\u0430?<\/p>\n<pre><code class=\"python\">df = pd.read_csv('benchmark.csv')<\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0440\u0435\u043c\u044f \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f:<\/summary>\n<div class=\"spoiler__content\">\n<p>7 \u043c\u0438\u043d 57.4 \u0441\u0435\u043a<\/p>\n<\/div>\n<\/details>\n<p>\u0415\u0441\u043b\u0438 \u043a\u0430\u0436\u0434\u044b\u0439 \u0440\u0430\u0437 \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u0438\u0437\u043c\u0435\u043d\u0438\u0432\u0448\u0438\u0439\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0437\u0430\u043d\u043e\u0432\u043e, \u043d\u0430 \u043d\u0430\u0448\u0438 100 \u0433\u0438\u043f\u043e\u0442\u0435\u0437 \u0443\u0439\u0434\u0435\u0442 13 \u0447\u0430\u0441\u043e\u0432. \u0421\u0434\u0435\u043b\u0430\u0442\u044c \u0434\u043e \u043e\u0431\u0435\u0434\u0430 \u043d\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u0441\u044f.<\/p>\n<p>\u041c\u044b \u0445\u043e\u0442\u0438\u043c \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u0434\u0430\u043d\u043d\u044b\u0435 \u0431\u044b\u0441\u0442\u0440\u0435\u0435, \u043d\u043e \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435 \u0442\u0435\u0440\u044f\u0442\u044c \u0432\u0441\u0435\u0445 \u043f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0434\u0430\u0451\u0442 Pandas. \u041f\u0440\u043e\u0441\u0442\u0430\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0449\u0430\u044f datatable \u043f\u043e\u043c\u043e\u0436\u0435\u0442 \u043d\u0430\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u044d\u0442\u043e:<\/p>\n<pre><code class=\"python\">import datatable as dt import pandas as pd def read_fast_csv(f):     frame = dt.fread(f)     ds = frame.to_pandas()     return ds<\/code><\/pre>\n<p>\u041f\u043e\u043f\u0440\u043e\u0431\u0443\u0435\u043c \u0442\u0435\u043f\u0435\u0440\u044c \u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0442\u044c \u043d\u0430\u0448 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442:<\/p>\n<pre><code class=\"python\">ds = read_fast_csv('benchmark.csv')<\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0440\u0435\u043c\u044f \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f<\/summary>\n<div class=\"spoiler__content\">\n<p>1 \u043c\u0438\u043d 21.5 \u0441\u0435\u043a<\/p>\n<\/div>\n<\/details>\n<p>\u042d\u0442\u043e \u0436\u0435 \u0432 6 \u0440\u0430\u0437 \u0431\u044b\u0441\u0442\u0440\u0435\u0435! \u0417\u043d\u0430\u0447\u0438\u0442 \u0434\u043e \u043e\u0431\u0435\u0434\u0430 \u0443\u0441\u043f\u0435\u0432\u0430\u0435\u043c!<\/p>\n<h3>\u0411\u044b\u0441\u0442\u0440\u043e\u0435 \u0437\u043d\u0430\u043a\u043e\u043c\u0441\u0442\u0432\u043e \u0441 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c<\/h3>\n<p>\u0414\u0430\u043d\u043d\u0430\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0432\u044b\u0432\u043e\u0434\u0438\u0442 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0441 \u0446\u0435\u043b\u044c\u044e \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u043b\u0435\u043d\u0438\u044f \u0441 \u0435\u0433\u043e \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u043c\u044b\u043c, \u0432 \u0447\u0430\u0441\u0442\u043d\u043e\u0441\u0442\u0438:<\/p>\n<ul>\n<li>\n<p>\u0420\u0430\u0437\u043c\u0435\u0440 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430<\/p>\n<\/li>\n<li>\n<p>\u0418\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043e \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u0430\u0445<\/p>\n<\/li>\n<li>\n<p>\u041f\u0440\u043e\u0446\u0435\u043d\u0442 \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439<\/p>\n<\/li>\n<li>\n<p>\u041a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439<\/p>\n<\/li>\n<li>\n<p>\u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u0447\u0435\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430<\/p>\n<\/li>\n<\/ul>\n<pre><code class=\"python\">def brief_df (df):   # \u041f\u043e\u0434\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u043f\u0443\u0441\u0442\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0438 \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435   rows_na =df.isna().sum().reset_index().rename(columns={0: \"valuesNa\"})   rows_notna = df.notna().sum().reset_index().rename(columns={0: \"valuesNotNa\"})   rows_analysis = pd.merge(rows_na, rows_notna, on=\"index\", how= \"outer\")   rows_analysis[\"completeRatio\"] = round((rows_analysis[\"valuesNotNa\"]) \/ (rows_analysis[\"valuesNotNa\"]+rows_analysis[\"valuesNa\"])*100,2)    cardinality = df.nunique().reset_index().rename(columns={0: \"cardinality\"})   rows_analysis = pd.merge(rows_analysis, cardinality)    # \u0420\u0430\u0437\u043c\u0435\u0440 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438 \u043a\u043e\u043b-\u0432\u043e \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u043e\u0432   print(\"\u0420\u0430\u0437\u043c\u0435\u0440:\", df.shape)   dup_raw = df.duplicated ().sum()   dup_per = round((dup_raw*100)\/df.shape[0],2)   print (\"\u0414\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u044b:\", dup_raw, \"-&amp;gt;\", dup_per, \"%\")    # \u0421\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430 \u043f\u043e \u043f\u0443\u0441\u0442\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c   print(\"\u041f\u0440\u043e\u0432\u0435\u0440\u043a\u0430 \u043d\u0430 \u043e\u0442\u0441\u0443\u0442\u0441\u0432\u0443\u044e\u0449\u0438\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0438\u044f\")   display(rows_analysis)    # \u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u043a   print(\"\u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u043a\")   display(df.head())  <\/code><\/pre>\n<p>\u041f\u043e\u043f\u0440\u043e\u0431\u0443\u0435\u043c \u043f\u0440\u043e\u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043d\u0430\u0448 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043c\u044b \u0441\u043e\u0437\u0434\u0430\u043b\u0438 \u0432 \u043f\u0435\u0440\u0432\u043e\u043c \u0440\u0430\u0437\u0434\u0435\u043b\u0435:<\/p>\n<pre><code class=\"python\">brief_df(df)<\/code><\/pre>\n<p><em>\u0420\u0430\u0437\u043c\u0435\u0440: (76800000, 10) <br \/>\u0414\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u044b: 76799232 -> 100.0 % <br \/>\u041e\u0431\u0437\u043e\u0440 \u043f\u0443\u0441\u0442\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439<\/em>:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<th>\n<\/th>\n<th>\n<p>index<\/p>\n<\/th>\n<th>\n<p>valuesNa<\/p>\n<\/th>\n<th>\n<p>valuesNotNa<\/p>\n<\/th>\n<th>\n<p>completeRatio<\/p>\n<\/th>\n<th>\n<p>cardinality<\/p>\n<\/th>\n<\/tr>\n<tr>\n<th>\n<p>0<\/p>\n<\/th>\n<td>\n<p align=\"left\">C0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">768<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>1<\/p>\n<\/th>\n<td>\n<p align=\"left\">Pregnancies<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">17<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>2<\/p>\n<\/th>\n<td>\n<p align=\"left\">Glucose<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">136<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>3<\/p>\n<\/th>\n<td>\n<p align=\"left\">BloodPressure<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">47<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>4<\/p>\n<\/th>\n<td>\n<p align=\"left\">SkinThickness<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">51<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>5<\/p>\n<\/th>\n<td>\n<p align=\"left\">Insulin<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">186<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>6<\/p>\n<\/th>\n<td>\n<p align=\"left\">BMI<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">248<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>7<\/p>\n<\/th>\n<td>\n<p align=\"left\">DiabetesPedigreeFunction<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">517<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>8<\/p>\n<\/th>\n<td>\n<p align=\"left\">Age<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">52<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>9<\/p>\n<\/th>\n<td>\n<p align=\"left\">Outcome<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">2<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p><em>\u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u043a<\/em> <\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<th>\n<\/th>\n<th>\n<p>C0<\/p>\n<\/th>\n<th>\n<p>Pregnancies<\/p>\n<\/th>\n<th>\n<p>Glucose<\/p>\n<\/th>\n<th>\n<p>BloodPressure<\/p>\n<\/th>\n<th>\n<p>SkinThickness<\/p>\n<\/th>\n<th>\n<p>Insulin<\/p>\n<\/th>\n<th>\n<p>BMI<\/p>\n<\/th>\n<th>\n<p>DiabetesPedigreeFunction<\/p>\n<\/th>\n<th>\n<p>Age<\/p>\n<\/th>\n<th>\n<p>Outcome<\/p>\n<\/th>\n<\/tr>\n<tr>\n<th>\n<p>0<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>1<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>2<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>3<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>4<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u0414\u0430, \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u043e\u0432 \u0443 \u043d\u0430\u0441 \u0438 \u043f\u0440\u0430\u0432\u0434\u0430 100%, \u0432\u0435\u0434\u044c \u043c\u044b \u043f\u0440\u043e\u0434\u0443\u0431\u043b\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043a\u0430\u0436\u0434\u0443\u044e \u0441\u0442\u0440\u043e\u043a\u0443 100 000 \u0440\u0430\u0437. \u0422\u0430\u043a \u0447\u0442\u043e \u0432\u0441\u0435 \u0441\u0445\u043e\u0434\u0438\u0442\u0441\u044f.<\/p>\n<h2>\u0421\u0442\u043e\u043b\u0431\u0446\u044b \u0441 \u0434\u0430\u0442\u0430\u043c\u0438 \u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0444\u043e\u0440\u043c\u0430\u0442\u0430\u0445<\/h2>\n<p>\u0414\u043b\u044f \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u0447\u0430\u0441\u0442\u043e \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 \u0434\u0430\u0442\u0430\u043c\u0438 \u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0444\u043e\u0440\u043c\u0430\u0442\u0430\u0445, \u043a\u043e\u0433\u0434\u0430 \u0434\u0430\u0442\u0430 \u0434\u0430\u043d\u0430 \u0442\u043e\u043b\u044c\u043a\u043e \u043e\u0434\u043d\u0430. \u0410 \u0435\u0449\u0435 \u0445\u0443\u0436\u0435, \u0435\u0441\u043b\u0438 \u0432\u0441\u0435 \u0434\u0430\u0442\u044b \u043f\u0440\u043e\u043f\u0438\u0441\u0430\u043d\u044b \u043a\u0430\u043a \u043f\u043e\u043f\u0430\u043b\u043e. \u041f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u043f\u0440\u0438\u0432\u043e\u0434\u0438\u0442\u044c \u0432\u0441\u0435 \u0434\u0430\u0442\u044b \u043a \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u043c\u0443 \u0432\u0438\u0434\u0443, \u0430 \u043f\u043e\u0442\u043e\u043c \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u043d\u044b\u043c \u043f\u0443\u0442\u0435\u043c \u0434\u043e\u0431\u044b\u0432\u0430\u0442\u044c \u0438\u0437 \u043a\u0430\u0436\u0434\u043e\u0439 \u0434\u0430\u0442\u044b \u0440\u0430\u0437\u043d\u0443\u044e \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e. \u042f \u043d\u0430\u043f\u0438\u0441\u0430\u043b \u0444\u0443\u043d\u043a\u0446\u0438\u044e, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0441\u0438\u043b\u044c\u043d\u043e \u0443\u043f\u0440\u043e\u0449\u0430\u0435\u0442 \u044d\u0442\u043e\u0442 \u043f\u0440\u043e\u0446\u0435\u0441\u0441.<\/p>\n<p>\u0421\u043d\u0430\u0447\u0430\u043b\u0430 \u0441\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u0435\u043c \u043d\u0430\u0448\u0443 \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u044e, \u0438 \u043a \u043d\u0430\u0448\u0435\u043c\u0443 \u0438\u0441\u0445\u043e\u0434\u043d\u043e\u043c\u0443 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0434\u043e\u0431\u0430\u0432\u0438\u043c \u043a\u043e\u043b\u043e\u043d\u043a\u0443 \u0441\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c\u0438 \u0434\u0430\u0442\u0430\u043c\u0438 \u0432 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d\u0435 \u0434\u0432\u0443\u0445 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0445 \u043b\u0435\u0442:<\/p>\n<pre><code class=\"python\">import numpy as np  # \u0427\u0442\u0435\u043d\u0438\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438\u0437 \u0444\u0430\u0439\u043b\u0430 df = pd.read_csv('diabetes.csv')  df['date'] = np.random.choice(pd.date_range('2020-01-01', '2022-12-31'), 768)  df.to_csv('diabetes_dates.csv')<\/code><\/pre>\n<p>\u041d\u0438\u0436\u0435 \u043a\u043e\u0434 \u0444\u0443\u043d\u043a\u0446\u0438\u0438, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043a \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0435\u043c\u0443 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u043a\u043e\u043b\u043e\u043d\u043a\u0438 \u0441 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0447\u0430\u0441\u0442\u044b\u043c\u0438 \u0442\u0440\u0435\u0431\u0443\u0435\u043c\u044b\u043c\u0438 \u0444\u043e\u0440\u043c\u0430\u0442\u0430\u043c\u0438, \u0447\u0442\u043e\u0431\u044b \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u043f\u043e \u0433\u043e\u0434\u0430\u043c, \u043f\u043e \u043a\u0432\u0430\u0440\u0442\u0430\u043b\u0430\u043c, \u043c\u0435\u0441\u044f\u0446\u0430\u043c \u0438\u043b\u0438 \u043d\u0435\u0434\u0435\u043b\u044f\u043c, \u043b\u0438\u0431\u043e \u0432\u0437\u044f\u0442\u044c \u043f\u043e\u043b\u043d\u0443\u044e \u0434\u0430\u0442\u0443 \u0434\u043b\u044f \u0446\u0435\u043b\u0435\u0439 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438. <\/p>\n<pre><code class=\"python\">import datetime from datetime import timedelta  def granular_dates(df, col):     df['ts_date'] = pd.to_datetime(df[col]).dt.normalize() # \u041f\u043e\u043b\u043d\u0430\u044f \u0434\u0430\u0442\u0430 \u0441 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435\u043c \u043c\u0435\u0441\u044f\u0446\u0430     df['ts_date_str'] = df[\"ts_date\"].dt.strftime(\"%d %B %Y\") # \u041a\u0440\u0430\u0442\u043a\u0430\u044f \u0434\u0430\u0442\u0430 \u0441 \u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u0435\u043c \u043c\u0435\u0441\u044f\u0446\u0430     df['ts_date_str_short'] = df[\"ts_date\"].dt.strftime(\"%d %b %Y\")     # \u0422\u043e\u043b\u044c\u043a\u043e \u0433\u043e\u0434     df['ts_year'] = df.ts_date.dt.year     # \u0422\u043e\u043b\u044c\u043a\u043e \u043d\u043e\u043c\u0435\u0440 \u043c\u0435\u0441\u044f\u0446\u0430     df['ts_month'] = df.ts_date.dt.month     # \u0422\u043e\u043b\u044c\u043a\u043e \u0447\u0438\u0441\u043b\u043e     df['ts_day'] = df.ts_date.dt.day      # \u0413\u043e\u0434 \u0438 \u043a\u0432\u0430\u0440\u0442\u0430\u043b     df['ts_quarter'] = pd.PeriodIndex(df.ts_date, freq=\"Q\").astype(str)     # \u041d\u043e\u043c\u0435\u0440 \u043d\u0435\u0434\u0435\u043b\u0438     df['ts_dayweek'] = df.ts_date.dt.dayofweek     # \u0414\u0435\u043d\u044c \u043d\u0435\u0434\u0435\u043b\u0438     df['ts_dayweektext'] = df.ts_date.dt.strftime(\"%a\")      # \u0414\u0430\u0442\u0430 \u043a\u043e\u043d\u0446\u0430 \u043d\u0435\u0434\u0435\u043b\u0438 (\u0432\u043e\u0441\u043a\u0440\u0435\u0441\u0435\u043d\u044c\u044f)     df['ts_week_start'] = df.ts_date.apply(lambda x: x - timedelta(days=x.weekday())).dt.strftime(\"%b-%d\")      # \u0414\u0430\u0442\u0430 \u043a\u043e\u043d\u0446\u0430 \u043d\u0435\u0434\u0435\u043b\u0438 (\u0432\u043e\u0441\u043a\u0440\u0435\u0441\u0435\u043d\u044c\u044f)         df['ts_week_end'] = df.ts_date.apply(lambda x: x - timedelta(days=x.weekday()) + timedelta(days=6)).dt.strftime(\"%b-%d\")  <\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c \u0432\u0441\u0435\u0433\u043e \u043e\u0434\u043d\u0430 \u0441\u0442\u0440\u043e\u0447\u043a\u0430 \u043a\u043e\u0434\u0430 (\u043d\u0435 \u0441\u0447\u0438\u0442\u0430\u044f \u0447\u0442\u0435\u043d\u0438\u0435 \u0444\u0430\u0439\u043b\u0430):<\/p>\n<pre><code class=\"python\"># \u0427\u0442\u0435\u043d\u0438\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 df = pd.read_csv('diabetes_dates.csv')  # \u0414\u043e\u0431\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u043a\u043e\u043b\u043e\u043d\u043e\u043a \u0441 \u0434\u0430\u0442\u0430\u043c\u0438 \u0440\u0430\u0437\u043d\u043e\u0433\u043e \u0444\u043e\u0440\u043c\u0430\u0442\u0430 granular_dates(df, 'date')<\/code><\/pre>\n<p>\u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u0442\u0430\u043a\u0438\u0435 \u043a\u043e\u043b\u043e\u043d\u043a\u0438:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\">ts_date<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_date_str<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_date_str_short<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_year<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_month<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_day<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_quarter<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_dayweek<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_dayweektext<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_week_start<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_week_end<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2022-06-13<\/p>\n<\/td>\n<td>\n<p align=\"left\">13 June 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">13 Jun 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">13<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022Q2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mon<\/p>\n<\/td>\n<td>\n<p align=\"left\">Jun-13<\/p>\n<\/td>\n<td>\n<p align=\"left\">Jun-19<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2022-03-10<\/p>\n<\/td>\n<td>\n<p align=\"left\">10 March 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">10 Mar 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">3<\/p>\n<\/td>\n<td>\n<p align=\"left\">10<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022Q1<\/p>\n<\/td>\n<td>\n<p align=\"left\">3<\/p>\n<\/td>\n<td>\n<p align=\"left\">Thu<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mar-07<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mar-13<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2022-05-23<\/p>\n<\/td>\n<td>\n<p align=\"left\">23 May 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">23 May 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">5<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022Q2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mon<\/p>\n<\/td>\n<td>\n<p align=\"left\">May-23<\/p>\n<\/td>\n<td>\n<p align=\"left\">May-29<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2020-11-22<\/p>\n<\/td>\n<td>\n<p align=\"left\">22 November 2020<\/p>\n<\/td>\n<td>\n<p align=\"left\">22 Nov 2020<\/p>\n<\/td>\n<td>\n<p align=\"left\">2020<\/p>\n<\/td>\n<td>\n<p align=\"left\">11<\/p>\n<\/td>\n<td>\n<p align=\"left\">22<\/p>\n<\/td>\n<td>\n<p align=\"left\">2020Q4<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">Sun<\/p>\n<\/td>\n<td>\n<p align=\"left\">Nov-16<\/p>\n<\/td>\n<td>\n<p align=\"left\">Nov-22<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2021-10-27<\/p>\n<\/td>\n<td>\n<p align=\"left\">27 October 2021<\/p>\n<\/td>\n<td>\n<p align=\"left\">27 Oct 2021<\/p>\n<\/td>\n<td>\n<p align=\"left\">2021<\/p>\n<\/td>\n<td>\n<p align=\"left\">10<\/p>\n<\/td>\n<td>\n<p align=\"left\">27<\/p>\n<\/td>\n<td>\n<p align=\"left\">2021Q4<\/p>\n<\/td>\n<td>\n<p align=\"left\">2<\/p>\n<\/td>\n<td>\n<p align=\"left\">Wed<\/p>\n<\/td>\n<td>\n<p align=\"left\">Oct-25<\/p>\n<\/td>\n<td>\n<p align=\"left\">Oct-31<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<h2>\u042d\u043a\u0441\u043f\u043e\u0440\u0442 \u0432 Google \u0442\u0430\u0431\u043b\u0438\u0446\u044b<\/h2>\n<p>\u0418\u0442\u0430\u043a, \u043c\u044b \u0442\u0435\u043f\u0435\u0440\u044c \u043c\u043e\u0436\u0435\u043c \u0431\u044b\u0441\u0442\u0440\u043e \u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0442\u044c \u043e\u0433\u0440\u043e\u043c\u043d\u044b\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u044b, \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u0441 \u0438\u0445 \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u043c\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438 \u0438 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u043f\u043e \u0432\u0441\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u044b\u043c \u043a\u043e\u043c\u0431\u0438\u043d\u0430\u0446\u0438\u044f\u043c \u0434\u0430\u0442. \u0422\u0435\u043f\u0435\u0440\u044c \u043f\u043e\u0440\u0430 \u043f\u0440\u0435\u0434\u043e\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0440\u0443\u0433\u0438\u043c \u0447\u043b\u0435\u043d\u0430\u043c \u043a\u043e\u043c\u0430\u043d\u0434\u044b. \u0418\u043d\u043e\u0433\u0434\u0430 \u044d\u0442\u043e \u0443\u0434\u043e\u0431\u043d\u0435\u0435 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0447\u0435\u0440\u0435\u0437 \u043e\u0431\u043b\u0430\u0447\u043d\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441. \u0427\u0430\u0441\u0442\u043e \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0442\u0430\u0431\u043b\u0438\u0446\u044b Google. <\/p>\n<p>\u0412 Python \u0435\u0441\u0442\u044c \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043f\u0430\u043a\u0435\u0442 Gspread, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u043c\u043e\u0436\u0435\u0442 \u0432\u0430\u043c \u044d\u043a\u0441\u043f\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432\u0430\u0448\u0438 \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u043f\u0440\u044f\u043c\u043e \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0443 Google, \u043e\u0442\u043a\u0443\u0434\u0430 \u0435\u0439 \u043c\u043e\u0436\u043d\u043e \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u0441 \u0434\u0440\u0443\u0433\u0438\u043c\u0438 \u0434\u043b\u044f \u0441\u043e\u0432\u043c\u0435\u0441\u0442\u043d\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u044b \u0438\u0437 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0447\u043a\u0438 \u043c\u0438\u0440\u0430.<\/p>\n<p>\u041f\u043e\u0441\u043b\u0435 \u0442\u043e\u0433\u043e, \u043a\u0430\u043a \u0432\u044b \u0443\u0441\u0442\u0430\u043d\u043e\u0432\u0438\u043b\u0438 \u043f\u0430\u043a\u0435\u0442 \u0438 <a href=\"https:\/\/docs.gspread.org\/en\/latest\/oauth2.html\" rel=\"noopener noreferrer nofollow\">\u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u043e\u0442 Google \u043a\u043b\u044e\u0447 API<\/a> \u0434\u043b\u044f \u0441\u0432\u043e\u0435\u0433\u043e \u0430\u043a\u043a\u0430\u0443\u043d\u0442\u0430, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0439\u0442\u0435 \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u043d\u0438\u0436\u0435, \u0447\u0442\u043e\u0431\u044b \u0441\u043e\u0437\u0434\u0430\u0442\u044c \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0438\u0437 \u0432\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445:<\/p>\n<pre><code class=\"python\">def writedf (df, gc, wsheetname, colstart, rowstart, colend, boolheader):     wsheet=gc.worksheet(wsheetname)     en_update = str(df.shape[0]+1)     range_update = colstart + rowstart + ':' + colend          cols_list = df.columns.to_list()     header = pd.DataFrame(cols_list).T     header.columns = cols_list          if boolheader == True:         df = pd.concat([header, df])      data = df.values.tolist()     wsheet.update(range_update, data)<\/code><\/pre>\n<p>\u041e\u0434\u043d\u043e \u0438\u0437 \u043f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u044d\u0442\u043e\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0437\u0430\u043a\u043b\u044e\u0447\u0430\u0435\u0442\u0441\u044f \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e \u0434\u0430\u043d\u043d\u044b\u0435 \u0437\u0430\u043f\u0438\u0441\u044b\u0432\u0430\u044e\u0442\u0441\u044f \u043e\u0434\u043d\u0438\u043c \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u043c, \u0432\u043c\u0435\u0441\u0442\u043e \u0437\u0430\u043f\u0438\u0441\u0438 \u043a\u0430\u0436\u0434\u043e\u0439 \u044f\u0447\u0435\u0439\u043a\u0438 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e, \u0447\u0442\u043e \u0441\u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0442 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043e\u0431\u0440\u0430\u0449\u0435\u043d\u0438\u0439 \u043a API \u044d\u043b\u0435\u043a\u0442\u0440\u043e\u043d\u043d\u044b\u0445 \u0442\u0430\u0431\u043b\u0438\u0446 Google, \u0430 \u0437\u043d\u0430\u0447\u0438\u0442 \u043c\u0435\u043d\u044c\u0448\u0435 \u0448\u0430\u043d\u0441 \u043d\u0430\u0440\u0432\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u0438\u044f.<\/p>\n<pre><code class=\"python\">import gspread  # \u0423\u0442\u0441\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0441\u043e\u0435\u0434\u0438\u043d\u0435\u043d\u0438\u0435 gc = gspread.service_account()  # \u0417\u0430\u043f\u043e\u043b\u043d\u044f\u0435\u043c \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0432 Google writedf (df, gc, 'mySheet', 0, 0, 100, True)<\/code><\/pre>\n<p>\u041f\u043e\u0434\u043e\u0431\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043c\u043e\u0436\u043d\u043e \u0442\u0430\u043a \u0436\u0435 \u043f\u043e\u0434\u0440\u0443\u0436\u0438\u0442\u044c \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0441 <a href=\"https:\/\/www.notion.so\/\" rel=\"noopener noreferrer nofollow\">Notion<\/a> \u2014 \u0441\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u0437\u0430\u043c\u0435\u043d\u0435 Evernote, \u043d\u043e \u044d\u0442\u043e \u0431\u044b\u043b \u0431\u044b \u043c\u0430\u0442\u0435\u0440\u0438\u0430\u043b \u0434\u043b\u044f \u0446\u0435\u043b\u043e\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0438.<\/p>\n<p>\u0411\u044b\u043b\u043e \u0431\u044b \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e \u0443\u0437\u043d\u0430\u0442\u044c, \u043a\u0430\u043a\u0438\u0435 \u043d\u0430\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0444\u0443\u043d\u043a\u0446\u0438\u0439 Python \u0435\u0441\u0442\u044c \u0443 \u0432\u0430\u0441, \u0447\u0435\u043c \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u0447\u0430\u0441\u0442\u043e \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f?<\/p>\n<\/p>\n<\/div>\n<\/div>\n<\/div>\n<div class=\"v-portal\" style=\"display:none;\"><\/div>\n<\/div>\n<p> <!----> <!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/682694\/\"> https:\/\/habr.com\/ru\/post\/682694\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u042f \u0447\u0430\u0441\u0442\u043e \u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0441\u044c \u0444\u0443\u043d\u043a\u0446\u0438\u044f\u043c\u0438 \u0434\u043b\u044f \u0440\u0430\u0431\u043e\u0442\u044b \u0441 \u0431\u043e\u043b\u044c\u0448\u0438\u043c\u0438 \u0434\u0430\u043d\u043d\u044b\u043c\u0438. \u041e\u043d\u0438 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u044e\u0442 \u0443\u043f\u0440\u043e\u0441\u0438\u0442\u044c \u0438 \u0443\u0441\u043a\u043e\u0440\u0438\u0442\u044c \u0440\u0430\u0431\u043e\u0442\u0443. \u041d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u044f \u043d\u0430\u0448\u0435\u043b \u043d\u0430 \u043f\u0440\u043e\u0441\u0442\u043e\u0440\u0430\u0445 \u0438\u043d\u0442\u0435\u0440\u043d\u0435\u0442\u0430, \u0434\u0440\u0443\u0433\u0438\u0435 \u043d\u0430\u043f\u0438\u0441\u0430\u043b \u0441\u0430\u043c. \u0421\u0435\u0433\u043e\u0434\u043d\u044f \u0445\u043e\u0447\u0443 \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u0447\u0435\u0442\u044b\u0440\u044c\u043c\u044f \u0438\u0437 \u043d\u0438\u0445, \u043c\u043e\u0436\u0435\u0442 \u043a\u043e\u043c\u0443-\u0442\u043e \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u043b\u0435\u0437\u043d\u043e.<\/p>\n<h2>\u0411\u044b\u0441\u0442\u0440\u043e\u0435 \u0447\u0442\u0435\u043d\u0438\u0435 \u0431\u043e\u043b\u044c\u0448\u0438\u0445 \u0444\u0430\u0439\u043b\u043e\u0432<\/h2>\n<p>\u041e\u0434\u0438\u043d \u0438\u0437 \u043f\u0435\u0440\u0432\u044b\u0445 \u0438\u043d\u0441\u0442\u0440\u0443\u043c\u0435\u043d\u0442\u043e\u0432, \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c \u0441\u0442\u0430\u043b\u043a\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u043b\u0438\u0431\u043e Data Scientist \u2014 \u044d\u0442\u043e Pandas, \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 Python \u0434\u043b\u044f \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0438 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u0421 \u0435\u0451 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u043c\u044b \u0438\u043c\u043f\u043e\u0440\u0442\u0438\u0440\u0443\u0435\u043c \u0438 \u0441\u043e\u0440\u0442\u0438\u0440\u0443\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435, \u0434\u0435\u043b\u0430\u0435\u043c \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u0438 \u043d\u0430\u0445\u043e\u0434\u0438\u043c \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438. \u041d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u0447\u0442\u043e\u0431\u044b \u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0442\u044c \u0444\u0430\u0439\u043b \u0441\u0440\u0435\u0434\u0441\u0442\u0432\u0430\u043c\u0438 Pandas \u0432 Python \u043c\u044b \u043f\u0438\u0448\u0435\u043c:<\/p>\n<pre><code class=\"python\">import pandas as pd data = pd.read_csv('data_file.csv')<\/code><\/pre>\n<p>\u0422\u0430\u043a\u043e\u0439 \u043f\u043e\u0434\u0445\u043e\u0434 \u043f\u0440\u043e\u0441\u0442\u043e\u0439 \u0438 \u043f\u043e\u043d\u044f\u0442\u043d\u044b\u0439. \u041a\u0430\u0436\u0434\u044b\u0439 Data Scientist \u0438\u043b\u0438 \u0430\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u0437\u043d\u0430\u0435\u0442 \u044d\u0442\u043e. \u041d\u043e \u0435\u0441\u043b\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u043c\u043d\u043e\u0433\u043e? \u0421\u043a\u0430\u0436\u0435\u043c 100 000 000 \u0441\u0442\u0440\u043e\u043a, \u043e\u043d\u0438 \u043f\u043e\u0441\u0442\u043e\u044f\u043d\u043d\u043e \u043c\u0435\u043d\u044f\u044e\u0442\u0441\u044f, \u0441\u0440\u043e\u043a\u0438 \u0433\u043e\u0440\u044f\u0442, \u0438 \u0434\u043e \u043e\u0431\u0435\u0434\u0430 \u043d\u0430\u0434\u043e \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u0442\u044c \u0435\u0449\u0435 100 \u0433\u0438\u043f\u043e\u0442\u0435\u0437?<\/p>\n<p>\u0412\u043e\u0437\u044c\u043c\u0435\u043c <a href=\"https:\/\/www.kaggle.com\/datasets\/mathchi\/diabetes-data-set\" rel=\"noopener noreferrer nofollow\">\u0438\u0441\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u0441\u043a\u0438\u0439 \u043d\u0430\u0431\u043e\u0440 \u0434\u0430\u043d\u043d\u044b\u0445 \u043e \u0434\u0438\u0430\u0431\u0435\u0442\u0435<\/a> \u0441 \u0441\u0430\u0439\u0442\u0430 Kaggle \u0438 \u043f\u0440\u043e\u0434\u0443\u0431\u043b\u0438\u0440\u0443\u0435\u043c \u043a\u0430\u0436\u0434\u0443\u044e \u0441\u0442\u0440\u043e\u043a\u0443 100 000 \u0434\u043b\u044f \u0441\u043e\u0437\u0434\u0430\u043d\u0438\u044f \u043d\u0430\u0448\u0435\u0433\u043e \u0442\u0435\u0441\u0442\u043e\u0432\u043e\u0433\u043e \u043d\u0430\u0431\u043e\u0440\u0430 \u0434\u0430\u043d\u043d\u044b\u0445. \u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f 76 800 000 \u0441\u0442\u0440\u043e\u043a. <\/p>\n<p>\u0418\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u044b\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0442\u0430\u043a:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<th>\n<\/th>\n<th>\n<p>Pregnancies<\/p>\n<\/th>\n<th>\n<p>Glucose<\/p>\n<\/th>\n<th>\n<p>BloodPressure<\/p>\n<\/th>\n<th>\n<p>SkinThickness<\/p>\n<\/th>\n<th>\n<p>Insulin<\/p>\n<\/th>\n<th>\n<p>BMI<\/p>\n<\/th>\n<th>\n<p>DiabetesPedigreeFunction<\/p>\n<\/th>\n<th>\n<p>Age<\/p>\n<\/th>\n<th>\n<p>Outcome<\/p>\n<\/th>\n<\/tr>\n<tr>\n<th>\n<p>0<\/p>\n<\/th>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>1<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">85<\/p>\n<\/td>\n<td>\n<p align=\"left\">66<\/p>\n<\/td>\n<td>\n<p align=\"left\">29<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.351<\/p>\n<\/td>\n<td>\n<p align=\"left\">31<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>2<\/p>\n<\/th>\n<td>\n<p align=\"left\">8<\/p>\n<\/td>\n<td>\n<p align=\"left\">183<\/p>\n<\/td>\n<td>\n<p align=\"left\">64<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">23.3<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.672<\/p>\n<\/td>\n<td>\n<p align=\"left\">32<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>3<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">89<\/p>\n<\/td>\n<td>\n<p align=\"left\">66<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">94<\/p>\n<\/td>\n<td>\n<p align=\"left\">28.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.167<\/p>\n<\/td>\n<td>\n<p align=\"left\">21<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>4<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">137<\/p>\n<\/td>\n<td>\n<p align=\"left\">40<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">168<\/p>\n<\/td>\n<td>\n<p align=\"left\">43.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">2.288<\/p>\n<\/td>\n<td>\n<p align=\"left\">33<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>&#8230;<\/p>\n<\/th>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<td>\n<p align=\"left\">&#8230;<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>763<\/p>\n<\/th>\n<td>\n<p align=\"left\">10<\/p>\n<\/td>\n<td>\n<p align=\"left\">101<\/p>\n<\/td>\n<td>\n<p align=\"left\">76<\/p>\n<\/td>\n<td>\n<p align=\"left\">48<\/p>\n<\/td>\n<td>\n<p align=\"left\">180<\/p>\n<\/td>\n<td>\n<p align=\"left\">32.9<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.171<\/p>\n<\/td>\n<td>\n<p align=\"left\">63<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>764<\/p>\n<\/th>\n<td>\n<p align=\"left\">2<\/p>\n<\/td>\n<td>\n<p align=\"left\">122<\/p>\n<\/td>\n<td>\n<p align=\"left\">70<\/p>\n<\/td>\n<td>\n<p align=\"left\">27<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">36.8<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.340<\/p>\n<\/td>\n<td>\n<p align=\"left\">27<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>765<\/p>\n<\/th>\n<td>\n<p align=\"left\">5<\/p>\n<\/td>\n<td>\n<p align=\"left\">121<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">112<\/p>\n<\/td>\n<td>\n<p align=\"left\">26.2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.245<\/p>\n<\/td>\n<td>\n<p align=\"left\">30<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>766<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">126<\/p>\n<\/td>\n<td>\n<p align=\"left\">60<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">30.1<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.349<\/p>\n<\/td>\n<td>\n<p align=\"left\">47<\/p>\n<\/td>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>767<\/p>\n<\/th>\n<td>\n<p align=\"left\">1<\/p>\n<\/td>\n<td>\n<p align=\"left\">93<\/p>\n<\/td>\n<td>\n<p align=\"left\">70<\/p>\n<\/td>\n<td>\n<p align=\"left\">31<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">30.4<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.315<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u041f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u044b\u0432\u0430\u0435\u043c \u0435\u0433\u043e \u0434\u043b\u044f \u043d\u0430\u0448\u0438\u0445 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u0430\u0434\u0430\u0447:<\/p>\n<pre><code class=\"python\"># \u0427\u0442\u0435\u043d\u0438\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438\u0437 \u0444\u0430\u0439\u043b\u0430 df = pd.read_csv('diabetes.csv')  # \u0421\u043e\u0437\u0434\u0430\u043d\u0438\u0435 \u0442\u0435\u0441\u0442\u043e\u0432\u043e\u0433\u043e \u0444\u0430\u0439\u043b\u0430 df = df.loc[df.index.repeat(100000)]  # \u0421\u043e\u0445\u0440\u0430\u043d\u0435\u043d\u0438\u0435 \u0432 \u0444\u0430\u0439\u043b \u0434\u043b\u044f \u044d\u043a\u0441\u043f\u0438\u0440\u0435\u043c\u0435\u043d\u0442\u043e\u0432 df.to_csv('benchmark.csv')  print(len(df), '\u0441\u0442\u0440\u043e\u043a')<\/code><\/pre>\n<pre><code>76 800 000 \u0441\u0442\u0440\u043e\u043a<\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0440\u0435\u043c\u044f \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f<\/summary>\n<div class=\"spoiler__content\">\n<p>4 \u043c\u0438\u043d 26.6 \u0441\u0435\u043a<\/p>\n<\/div>\n<\/details>\n<p>\u041f\u0440\u0435\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u0431\u044b\u043b\u043e \u0434\u043e\u043b\u0433\u0438\u043c, \u043d\u043e \u0431\u0443\u0434\u0435\u043c \u043d\u0430\u0434\u0435\u0435\u0442\u0441\u044f, \u0447\u0442\u043e \u0432\u0440\u0435\u043c\u044f \u043f\u043e\u0442\u0440\u0430\u0447\u0435\u043d\u043e \u043d\u0435 \u0437\u0440\u044f. \u0421\u043a\u043e\u043b\u044c\u043a\u043e \u0436\u0435 \u0437\u0430\u0439\u043c\u0435\u0442 \u0447\u0442\u0435\u043d\u0438\u0435 \u0442\u0430\u043a\u043e\u0433\u043e \u0444\u0430\u0439\u043b\u0430?<\/p>\n<pre><code class=\"python\">df = pd.read_csv('benchmark.csv')<\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0440\u0435\u043c\u044f \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f:<\/summary>\n<div class=\"spoiler__content\">\n<p>7 \u043c\u0438\u043d 57.4 \u0441\u0435\u043a<\/p>\n<\/div>\n<\/details>\n<p>\u0415\u0441\u043b\u0438 \u043a\u0430\u0436\u0434\u044b\u0439 \u0440\u0430\u0437 \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u0438\u0437\u043c\u0435\u043d\u0438\u0432\u0448\u0438\u0439\u0441\u044f \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0437\u0430\u043d\u043e\u0432\u043e, \u043d\u0430 \u043d\u0430\u0448\u0438 100 \u0433\u0438\u043f\u043e\u0442\u0435\u0437 \u0443\u0439\u0434\u0435\u0442 13 \u0447\u0430\u0441\u043e\u0432. \u0421\u0434\u0435\u043b\u0430\u0442\u044c \u0434\u043e \u043e\u0431\u0435\u0434\u0430 \u043d\u0435 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u0441\u044f.<\/p>\n<p>\u041c\u044b \u0445\u043e\u0442\u0438\u043c \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0442\u044c \u0434\u0430\u043d\u043d\u044b\u0435 \u0431\u044b\u0441\u0442\u0440\u0435\u0435, \u043d\u043e \u043f\u0440\u0438 \u044d\u0442\u043e\u043c \u043d\u0435 \u0442\u0435\u0440\u044f\u0442\u044c \u0432\u0441\u0435\u0445 \u043f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0434\u0430\u0451\u0442 Pandas. \u041f\u0440\u043e\u0441\u0442\u0430\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0449\u0430\u044f datatable \u043f\u043e\u043c\u043e\u0436\u0435\u0442 \u043d\u0430\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u044d\u0442\u043e:<\/p>\n<pre><code class=\"python\">import datatable as dt import pandas as pd def read_fast_csv(f):     frame = dt.fread(f)     ds = frame.to_pandas()     return ds<\/code><\/pre>\n<p>\u041f\u043e\u043f\u0440\u043e\u0431\u0443\u0435\u043c \u0442\u0435\u043f\u0435\u0440\u044c \u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0442\u044c \u043d\u0430\u0448 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442:<\/p>\n<pre><code class=\"python\">ds = read_fast_csv('benchmark.csv')<\/code><\/pre>\n<details class=\"spoiler\">\n<summary>\u0412\u0440\u0435\u043c\u044f \u0432\u044b\u043f\u043e\u043b\u043d\u0435\u043d\u0438\u044f<\/summary>\n<div class=\"spoiler__content\">\n<p>1 \u043c\u0438\u043d 21.5 \u0441\u0435\u043a<\/p>\n<\/div>\n<\/details>\n<p>\u042d\u0442\u043e \u0436\u0435 \u0432 6 \u0440\u0430\u0437 \u0431\u044b\u0441\u0442\u0440\u0435\u0435! \u0417\u043d\u0430\u0447\u0438\u0442 \u0434\u043e \u043e\u0431\u0435\u0434\u0430 \u0443\u0441\u043f\u0435\u0432\u0430\u0435\u043c!<\/p>\n<h3>\u0411\u044b\u0441\u0442\u0440\u043e\u0435 \u0437\u043d\u0430\u043a\u043e\u043c\u0441\u0442\u0432\u043e \u0441 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u043e\u043c<\/h3>\n<p>\u0414\u0430\u043d\u043d\u0430\u044f \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0432\u044b\u0432\u043e\u0434\u0438\u0442 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u043e\u0432 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0441 \u0446\u0435\u043b\u044c\u044e \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u043b\u0435\u043d\u0438\u044f \u0441 \u0435\u0433\u043e \u0441\u043e\u0434\u0435\u0440\u0436\u0438\u043c\u044b\u043c, \u0432 \u0447\u0430\u0441\u0442\u043d\u043e\u0441\u0442\u0438:<\/p>\n<ul>\n<li>\n<p>\u0420\u0430\u0437\u043c\u0435\u0440 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430<\/p>\n<\/li>\n<li>\n<p>\u0418\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e \u043e \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u0430\u0445<\/p>\n<\/li>\n<li>\n<p>\u041f\u0440\u043e\u0446\u0435\u043d\u0442 \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439<\/p>\n<\/li>\n<li>\n<p>\u041a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439<\/p>\n<\/li>\n<li>\n<p>\u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u0447\u0435\u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430<\/p>\n<\/li>\n<\/ul>\n<pre><code class=\"python\">def brief_df (df):   # \u041f\u043e\u0434\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c \u043f\u0443\u0441\u0442\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0438 \u0443\u043d\u0438\u043a\u0430\u043b\u044c\u043d\u044b\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435   rows_na =df.isna().sum().reset_index().rename(columns={0: \"valuesNa\"})   rows_notna = df.notna().sum().reset_index().rename(columns={0: \"valuesNotNa\"})   rows_analysis = pd.merge(rows_na, rows_notna, on=\"index\", how= \"outer\")   rows_analysis[\"completeRatio\"] = round((rows_analysis[\"valuesNotNa\"]) \/ (rows_analysis[\"valuesNotNa\"]+rows_analysis[\"valuesNa\"])*100,2)    cardinality = df.nunique().reset_index().rename(columns={0: \"cardinality\"})   rows_analysis = pd.merge(rows_analysis, cardinality)    # \u0420\u0430\u0437\u043c\u0435\u0440 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438 \u043a\u043e\u043b-\u0432\u043e \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u043e\u0432   print(\"\u0420\u0430\u0437\u043c\u0435\u0440:\", df.shape)   dup_raw = df.duplicated ().sum()   dup_per = round((dup_raw*100)\/df.shape[0],2)   print (\"\u0414\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u044b:\", dup_raw, \"-&amp;gt;\", dup_per, \"%\")    # \u0421\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430 \u043f\u043e \u043f\u0443\u0441\u0442\u044b\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f\u043c   print(\"\u041f\u0440\u043e\u0432\u0435\u0440\u043a\u0430 \u043d\u0430 \u043e\u0442\u0441\u0443\u0442\u0441\u0432\u0443\u044e\u0449\u0438\u0435 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0438\u044f\")   display(rows_analysis)    # \u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u043a   print(\"\u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u043a\")   display(df.head())  <\/code><\/pre>\n<p>\u041f\u043e\u043f\u0440\u043e\u0431\u0443\u0435\u043c \u043f\u0440\u043e\u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u043d\u0430\u0448 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043c\u044b \u0441\u043e\u0437\u0434\u0430\u043b\u0438 \u0432 \u043f\u0435\u0440\u0432\u043e\u043c \u0440\u0430\u0437\u0434\u0435\u043b\u0435:<\/p>\n<pre><code class=\"python\">brief_df(df)<\/code><\/pre>\n<p><em>\u0420\u0430\u0437\u043c\u0435\u0440: (76800000, 10) <br \/>\u0414\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u044b: 76799232 -> 100.0 % <br \/>\u041e\u0431\u0437\u043e\u0440 \u043f\u0443\u0441\u0442\u044b\u0445 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0439<\/em>:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<th>\n<\/th>\n<th>\n<p>index<\/p>\n<\/th>\n<th>\n<p>valuesNa<\/p>\n<\/th>\n<th>\n<p>valuesNotNa<\/p>\n<\/th>\n<th>\n<p>completeRatio<\/p>\n<\/th>\n<th>\n<p>cardinality<\/p>\n<\/th>\n<\/tr>\n<tr>\n<th>\n<p>0<\/p>\n<\/th>\n<td>\n<p align=\"left\">C0<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">768<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>1<\/p>\n<\/th>\n<td>\n<p align=\"left\">Pregnancies<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">17<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>2<\/p>\n<\/th>\n<td>\n<p align=\"left\">Glucose<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">136<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>3<\/p>\n<\/th>\n<td>\n<p align=\"left\">BloodPressure<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">47<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>4<\/p>\n<\/th>\n<td>\n<p align=\"left\">SkinThickness<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">51<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>5<\/p>\n<\/th>\n<td>\n<p align=\"left\">Insulin<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">186<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>6<\/p>\n<\/th>\n<td>\n<p align=\"left\">BMI<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">248<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>7<\/p>\n<\/th>\n<td>\n<p align=\"left\">DiabetesPedigreeFunction<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">517<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>8<\/p>\n<\/th>\n<td>\n<p align=\"left\">Age<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">52<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>9<\/p>\n<\/th>\n<td>\n<p align=\"left\">Outcome<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">76800000<\/p>\n<\/td>\n<td>\n<p align=\"left\">100.0<\/p>\n<\/td>\n<td>\n<p align=\"left\">2<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p><em>\u041f\u0435\u0440\u0432\u044b\u0435 \u043f\u044f\u0442\u044c \u0441\u0442\u0440\u043e\u043a<\/em> <\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<th>\n<\/th>\n<th>\n<p>C0<\/p>\n<\/th>\n<th>\n<p>Pregnancies<\/p>\n<\/th>\n<th>\n<p>Glucose<\/p>\n<\/th>\n<th>\n<p>BloodPressure<\/p>\n<\/th>\n<th>\n<p>SkinThickness<\/p>\n<\/th>\n<th>\n<p>Insulin<\/p>\n<\/th>\n<th>\n<p>BMI<\/p>\n<\/th>\n<th>\n<p>DiabetesPedigreeFunction<\/p>\n<\/th>\n<th>\n<p>Age<\/p>\n<\/th>\n<th>\n<p>Outcome<\/p>\n<\/th>\n<\/tr>\n<tr>\n<th>\n<p>0<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>1<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>2<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>3<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<tr>\n<th>\n<p>4<\/p>\n<\/th>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">148<\/p>\n<\/td>\n<td>\n<p align=\"left\">72<\/p>\n<\/td>\n<td>\n<p align=\"left\">35<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">33.6<\/p>\n<\/td>\n<td>\n<p align=\"left\">0.627<\/p>\n<\/td>\n<td>\n<p align=\"left\">50<\/p>\n<\/td>\n<td>\n<p align=\"left\">True<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>\u0414\u0430, \u0434\u0443\u0431\u043b\u0438\u043a\u0430\u0442\u043e\u0432 \u0443 \u043d\u0430\u0441 \u0438 \u043f\u0440\u0430\u0432\u0434\u0430 100%, \u0432\u0435\u0434\u044c \u043c\u044b \u043f\u0440\u043e\u0434\u0443\u0431\u043b\u0438\u0440\u043e\u0432\u0430\u043b\u0438 \u043a\u0430\u0436\u0434\u0443\u044e \u0441\u0442\u0440\u043e\u043a\u0443 100 000 \u0440\u0430\u0437. \u0422\u0430\u043a \u0447\u0442\u043e \u0432\u0441\u0435 \u0441\u0445\u043e\u0434\u0438\u0442\u0441\u044f.<\/p>\n<h2>\u0421\u0442\u043e\u043b\u0431\u0446\u044b \u0441 \u0434\u0430\u0442\u0430\u043c\u0438 \u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0444\u043e\u0440\u043c\u0430\u0442\u0430\u0445<\/h2>\n<p>\u0414\u043b\u044f \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0438 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u0447\u0430\u0441\u0442\u043e \u0442\u0440\u0435\u0431\u0443\u0435\u0442\u0441\u044f \u0440\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 \u0434\u0430\u0442\u0430\u043c\u0438 \u0432 \u0440\u0430\u0437\u043d\u044b\u0445 \u0444\u043e\u0440\u043c\u0430\u0442\u0430\u0445, \u043a\u043e\u0433\u0434\u0430 \u0434\u0430\u0442\u0430 \u0434\u0430\u043d\u0430 \u0442\u043e\u043b\u044c\u043a\u043e \u043e\u0434\u043d\u0430. \u0410 \u0435\u0449\u0435 \u0445\u0443\u0436\u0435, \u0435\u0441\u043b\u0438 \u0432\u0441\u0435 \u0434\u0430\u0442\u044b \u043f\u0440\u043e\u043f\u0438\u0441\u0430\u043d\u044b \u043a\u0430\u043a \u043f\u043e\u043f\u0430\u043b\u043e. \u041f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u043f\u0440\u0438\u0432\u043e\u0434\u0438\u0442\u044c \u0432\u0441\u0435 \u0434\u0430\u0442\u044b \u043a \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u043e\u043c\u0443 \u0432\u0438\u0434\u0443, \u0430 \u043f\u043e\u0442\u043e\u043c \u043f\u0440\u043e\u0433\u0440\u0430\u043c\u043c\u043d\u044b\u043c \u043f\u0443\u0442\u0435\u043c \u0434\u043e\u0431\u044b\u0432\u0430\u0442\u044c \u0438\u0437 \u043a\u0430\u0436\u0434\u043e\u0439 \u0434\u0430\u0442\u044b \u0440\u0430\u0437\u043d\u0443\u044e \u0438\u043d\u0444\u043e\u0440\u043c\u0430\u0446\u0438\u044e. \u042f \u043d\u0430\u043f\u0438\u0441\u0430\u043b \u0444\u0443\u043d\u043a\u0446\u0438\u044e, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0441\u0438\u043b\u044c\u043d\u043e \u0443\u043f\u0440\u043e\u0449\u0430\u0435\u0442 \u044d\u0442\u043e\u0442 \u043f\u0440\u043e\u0446\u0435\u0441\u0441.<\/p>\n<p>\u0421\u043d\u0430\u0447\u0430\u043b\u0430 \u0441\u043c\u043e\u0434\u0435\u043b\u0438\u0440\u0443\u0435\u043c \u043d\u0430\u0448\u0443 \u0441\u0438\u0442\u0443\u0430\u0446\u0438\u044e, \u0438 \u043a \u043d\u0430\u0448\u0435\u043c\u0443 \u0438\u0441\u0445\u043e\u0434\u043d\u043e\u043c\u0443 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0434\u043e\u0431\u0430\u0432\u0438\u043c \u043a\u043e\u043b\u043e\u043d\u043a\u0443 \u0441\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u043c\u0438 \u0434\u0430\u0442\u0430\u043c\u0438 \u0432 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d\u0435 \u0434\u0432\u0443\u0445 \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0438\u0445 \u043b\u0435\u0442:<\/p>\n<pre><code class=\"python\">import numpy as np  # \u0427\u0442\u0435\u043d\u0438\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438\u0437 \u0444\u0430\u0439\u043b\u0430 df = pd.read_csv('diabetes.csv')  df['date'] = np.random.choice(pd.date_range('2020-01-01', '2022-12-31'), 768)  df.to_csv('diabetes_dates.csv')<\/code><\/pre>\n<p>\u041d\u0438\u0436\u0435 \u043a\u043e\u0434 \u0444\u0443\u043d\u043a\u0446\u0438\u0438, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043a \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0435\u043c\u0443 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u043a\u043e\u043b\u043e\u043d\u043a\u0438 \u0441 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0447\u0430\u0441\u0442\u044b\u043c\u0438 \u0442\u0440\u0435\u0431\u0443\u0435\u043c\u044b\u043c\u0438 \u0444\u043e\u0440\u043c\u0430\u0442\u0430\u043c\u0438, \u0447\u0442\u043e\u0431\u044b \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u043f\u043e \u0433\u043e\u0434\u0430\u043c, \u043f\u043e \u043a\u0432\u0430\u0440\u0442\u0430\u043b\u0430\u043c, \u043c\u0435\u0441\u044f\u0446\u0430\u043c \u0438\u043b\u0438 \u043d\u0435\u0434\u0435\u043b\u044f\u043c, \u043b\u0438\u0431\u043e \u0432\u0437\u044f\u0442\u044c \u043f\u043e\u043b\u043d\u0443\u044e \u0434\u0430\u0442\u0443 \u0434\u043b\u044f \u0446\u0435\u043b\u0435\u0439 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u0438. <\/p>\n<pre><code class=\"python\">import datetime from datetime import timedelta  def granular_dates(df, col):     df['ts_date'] = pd.to_datetime(df[col]).dt.normalize() # \u041f\u043e\u043b\u043d\u0430\u044f \u0434\u0430\u0442\u0430 \u0441 \u043d\u0430\u0437\u0432\u0430\u043d\u0438\u0435\u043c \u043c\u0435\u0441\u044f\u0446\u0430     df['ts_date_str'] = df[\"ts_date\"].dt.strftime(\"%d %B %Y\") # \u041a\u0440\u0430\u0442\u043a\u0430\u044f \u0434\u0430\u0442\u0430 \u0441 \u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u0435\u043c \u043c\u0435\u0441\u044f\u0446\u0430     df['ts_date_str_short'] = df[\"ts_date\"].dt.strftime(\"%d %b %Y\")     # \u0422\u043e\u043b\u044c\u043a\u043e \u0433\u043e\u0434     df['ts_year'] = df.ts_date.dt.year     # \u0422\u043e\u043b\u044c\u043a\u043e \u043d\u043e\u043c\u0435\u0440 \u043c\u0435\u0441\u044f\u0446\u0430     df['ts_month'] = df.ts_date.dt.month     # \u0422\u043e\u043b\u044c\u043a\u043e \u0447\u0438\u0441\u043b\u043e     df['ts_day'] = df.ts_date.dt.day      # \u0413\u043e\u0434 \u0438 \u043a\u0432\u0430\u0440\u0442\u0430\u043b     df['ts_quarter'] = pd.PeriodIndex(df.ts_date, freq=\"Q\").astype(str)     # \u041d\u043e\u043c\u0435\u0440 \u043d\u0435\u0434\u0435\u043b\u0438     df['ts_dayweek'] = df.ts_date.dt.dayofweek     # \u0414\u0435\u043d\u044c \u043d\u0435\u0434\u0435\u043b\u0438     df['ts_dayweektext'] = df.ts_date.dt.strftime(\"%a\")      # \u0414\u0430\u0442\u0430 \u043a\u043e\u043d\u0446\u0430 \u043d\u0435\u0434\u0435\u043b\u0438 (\u0432\u043e\u0441\u043a\u0440\u0435\u0441\u0435\u043d\u044c\u044f)     df['ts_week_start'] = df.ts_date.apply(lambda x: x - timedelta(days=x.weekday())).dt.strftime(\"%b-%d\")      # \u0414\u0430\u0442\u0430 \u043a\u043e\u043d\u0446\u0430 \u043d\u0435\u0434\u0435\u043b\u0438 (\u0432\u043e\u0441\u043a\u0440\u0435\u0441\u0435\u043d\u044c\u044f)         df['ts_week_end'] = df.ts_date.apply(lambda x: x - timedelta(days=x.weekday()) + timedelta(days=6)).dt.strftime(\"%b-%d\")  <\/code><\/pre>\n<p>\u0422\u0435\u043f\u0435\u0440\u044c \u0432\u0441\u0435\u0433\u043e \u043e\u0434\u043d\u0430 \u0441\u0442\u0440\u043e\u0447\u043a\u0430 \u043a\u043e\u0434\u0430 (\u043d\u0435 \u0441\u0447\u0438\u0442\u0430\u044f \u0447\u0442\u0435\u043d\u0438\u0435 \u0444\u0430\u0439\u043b\u0430):<\/p>\n<pre><code class=\"python\"># \u0427\u0442\u0435\u043d\u0438\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 df = pd.read_csv('diabetes_dates.csv')  # \u0414\u043e\u0431\u0430\u0432\u043b\u0435\u043d\u0438\u0435 \u043a\u043e\u043b\u043e\u043d\u043e\u043a \u0441 \u0434\u0430\u0442\u0430\u043c\u0438 \u0440\u0430\u0437\u043d\u043e\u0433\u043e \u0444\u043e\u0440\u043c\u0430\u0442\u0430 granular_dates(df, 'date')<\/code><\/pre>\n<p>\u0412 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u0435 \u043a \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0443 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u0442\u0430\u043a\u0438\u0435 \u043a\u043e\u043b\u043e\u043d\u043a\u0438:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"left\">ts_date<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_date_str<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_date_str_short<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_year<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_month<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_day<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_quarter<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_dayweek<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_dayweektext<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_week_start<\/p>\n<\/td>\n<td>\n<p align=\"left\">ts_week_end<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2022-06-13<\/p>\n<\/td>\n<td>\n<p align=\"left\">13 June 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">13 Jun 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">13<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022Q2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mon<\/p>\n<\/td>\n<td>\n<p align=\"left\">Jun-13<\/p>\n<\/td>\n<td>\n<p align=\"left\">Jun-19<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2022-03-10<\/p>\n<\/td>\n<td>\n<p align=\"left\">10 March 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">10 Mar 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">3<\/p>\n<\/td>\n<td>\n<p align=\"left\">10<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022Q1<\/p>\n<\/td>\n<td>\n<p align=\"left\">3<\/p>\n<\/td>\n<td>\n<p align=\"left\">Thu<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mar-07<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mar-13<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2022-05-23<\/p>\n<\/td>\n<td>\n<p align=\"left\">23 May 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">23 May 2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022<\/p>\n<\/td>\n<td>\n<p align=\"left\">5<\/p>\n<\/td>\n<td>\n<p align=\"left\">23<\/p>\n<\/td>\n<td>\n<p align=\"left\">2022Q2<\/p>\n<\/td>\n<td>\n<p align=\"left\">0<\/p>\n<\/td>\n<td>\n<p align=\"left\">Mon<\/p>\n<\/td>\n<td>\n<p align=\"left\">May-23<\/p>\n<\/td>\n<td>\n<p align=\"left\">May-29<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2020-11-22<\/p>\n<\/td>\n<td>\n<p align=\"left\">22 November 2020<\/p>\n<\/td>\n<td>\n<p align=\"left\">22 Nov 2020<\/p>\n<\/td>\n<td>\n<p align=\"left\">2020<\/p>\n<\/td>\n<td>\n<p align=\"left\">11<\/p>\n<\/td>\n<td>\n<p align=\"left\">22<\/p>\n<\/td>\n<td>\n<p align=\"left\">2020Q4<\/p>\n<\/td>\n<td>\n<p align=\"left\">6<\/p>\n<\/td>\n<td>\n<p align=\"left\">Sun<\/p>\n<\/td>\n<td>\n<p align=\"left\">Nov-16<\/p>\n<\/td>\n<td>\n<p align=\"left\">Nov-22<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"left\">2021-10-27<\/p>\n<\/td>\n<td>\n<p align=\"left\">27 October 2021<\/p>\n<\/td>\n<td>\n<p align=\"left\">27 Oct 2021<\/p>\n<\/td>\n<td>\n<p align=\"left\">2021<\/p>\n<\/td>\n<td>\n<p align=\"left\">10<\/p>\n<\/td>\n<td>\n<p align=\"left\">27<\/p>\n<\/td>\n<td>\n<p align=\"left\">2021Q4<\/p>\n<\/td>\n<td>\n<p align=\"left\">2<\/p>\n<\/td>\n<td>\n<p align=\"left\">Wed<\/p>\n<\/td>\n<td>\n<p align=\"left\">Oct-25<\/p>\n<\/td>\n<td>\n<p align=\"left\">Oct-31<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<h2>\u042d\u043a\u0441\u043f\u043e\u0440\u0442 \u0432 Google \u0442\u0430\u0431\u043b\u0438\u0446\u044b<\/h2>\n<p>\u0418\u0442\u0430\u043a, \u043c\u044b \u0442\u0435\u043f\u0435\u0440\u044c \u043c\u043e\u0436\u0435\u043c \u0431\u044b\u0441\u0442\u0440\u043e \u043f\u0440\u043e\u0447\u0438\u0442\u0430\u0442\u044c \u043e\u0433\u0440\u043e\u043c\u043d\u044b\u0435 \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u044b, \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u0438\u0442\u044c\u0441\u044f \u0441 \u0438\u0445 \u043a\u043b\u044e\u0447\u0435\u0432\u044b\u043c\u0438 \u043f\u0430\u0440\u0430\u043c\u0435\u0442\u0440\u0430\u043c\u0438 \u0438 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u043f\u043e \u0432\u0441\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u044b\u043c \u043a\u043e\u043c\u0431\u0438\u043d\u0430\u0446\u0438\u044f\u043c \u0434\u0430\u0442. \u0422\u0435\u043f\u0435\u0440\u044c \u043f\u043e\u0440\u0430 \u043f\u0440\u0435\u0434\u043e\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0434\u0440\u0443\u0433\u0438\u043c \u0447\u043b\u0435\u043d\u0430\u043c \u043a\u043e\u043c\u0430\u043d\u0434\u044b. \u0418\u043d\u043e\u0433\u0434\u0430 \u044d\u0442\u043e \u0443\u0434\u043e\u0431\u043d\u0435\u0435 \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0447\u0435\u0440\u0435\u0437 \u043e\u0431\u043b\u0430\u0447\u043d\u044b\u0439 \u0441\u0435\u0440\u0432\u0438\u0441. \u0427\u0430\u0441\u0442\u043e \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c \u0442\u0430\u0431\u043b\u0438\u0446\u044b Google. <\/p>\n<p>\u0412 Python \u0435\u0441\u0442\u044c \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u043f\u0430\u043a\u0435\u0442 Gspread, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u043e\u043c\u043e\u0436\u0435\u0442 \u0432\u0430\u043c \u044d\u043a\u0441\u043f\u043e\u0440\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0432\u0430\u0448\u0438 \u0432\u044b\u0431\u043e\u0440\u043a\u0438 \u043f\u0440\u044f\u043c\u043e \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0443 Google, \u043e\u0442\u043a\u0443\u0434\u0430 \u0435\u0439 \u043c\u043e\u0436\u043d\u043e \u0431\u0443\u0434\u0435\u0442 \u043f\u043e\u0434\u0435\u043b\u0438\u0442\u044c\u0441\u044f \u0441 \u0434\u0440\u0443\u0433\u0438\u043c\u0438 \u0434\u043b\u044f \u0441\u043e\u0432\u043c\u0435\u0441\u0442\u043d\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u044b \u0438\u0437 \u043b\u044e\u0431\u043e\u0439 \u0442\u043e\u0447\u043a\u0438 \u043c\u0438\u0440\u0430.<\/p>\n<p>\u041f\u043e\u0441\u043b\u0435 \u0442\u043e\u0433\u043e, \u043a\u0430\u043a \u0432\u044b \u0443\u0441\u0442\u0430\u043d\u043e\u0432\u0438\u043b\u0438 \u043f\u0430\u043a\u0435\u0442 \u0438 <a href=\"https:\/\/docs.gspread.org\/en\/latest\/oauth2.html\" rel=\"noopener noreferrer nofollow\">\u043f\u043e\u043b\u0443\u0447\u0438\u043b\u0438 \u043e\u0442 Google \u043a\u043b\u044e\u0447 API<\/a> \u0434\u043b\u044f \u0441\u0432\u043e\u0435\u0433\u043e \u0430\u043a\u043a\u0430\u0443\u043d\u0442\u0430, \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u0439\u0442\u0435 \u0444\u0443\u043d\u043a\u0446\u0438\u044e \u043d\u0438\u0436\u0435, \u0447\u0442\u043e\u0431\u044b \u0441\u043e\u0437\u0434\u0430\u0442\u044c \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0438\u0437 \u0432\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445:<\/p>\n<pre><code class=\"python\">def writedf (df, gc, wsheetname, colstart, rowstart, colend, boolheader):     wsheet=gc.worksheet(wsheetname)     en_update = str(df.shape[0]+1)     range_update = colstart + rowstart + ':' + colend          cols_list = df.columns.to_list()     header = pd.DataFrame(cols_list).T     header.columns = cols_list          if boolheader == True:         df = pd.concat([header, df])      data = df.values.tolist()     wsheet.update(range_update, data)<\/code><\/pre>\n<p>\u041e\u0434\u043d\u043e \u0438\u0437 \u043f\u0440\u0435\u0438\u043c\u0443\u0449\u0435\u0441\u0442\u0432 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u044d\u0442\u043e\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u0437\u0430\u043a\u043b\u044e\u0447\u0430\u0435\u0442\u0441\u044f \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e \u0434\u0430\u043d\u043d\u044b\u0435 \u0437\u0430\u043f\u0438\u0441\u044b\u0432\u0430\u044e\u0442\u0441\u044f \u043e\u0434\u043d\u0438\u043c \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u043c, \u0432\u043c\u0435\u0441\u0442\u043e \u0437\u0430\u043f\u0438\u0441\u0438 \u043a\u0430\u0436\u0434\u043e\u0439 \u044f\u0447\u0435\u0439\u043a\u0438 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e, \u0447\u0442\u043e \u0441\u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0442 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043e\u0431\u0440\u0430\u0449\u0435\u043d\u0438\u0439 \u043a API \u044d\u043b\u0435\u043a\u0442\u0440\u043e\u043d\u043d\u044b\u0445 \u0442\u0430\u0431\u043b\u0438\u0446 Google, \u0430 \u0437\u043d\u0430\u0447\u0438\u0442 \u043c\u0435\u043d\u044c\u0448\u0435 \u0448\u0430\u043d\u0441 \u043d\u0430\u0440\u0432\u0430\u0442\u044c\u0441\u044f \u043d\u0430 \u043e\u0433\u0440\u0430\u043d\u0438\u0447\u0435\u043d\u0438\u044f.<\/p>\n<pre><code class=\"python\">import gspread  # \u0423\u0442\u0441\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0435\u043c \u0441\u043e\u0435\u0434\u0438\u043d\u0435\u043d\u0438\u0435 gc = gspread.service_account()  # \u0417\u0430\u043f\u043e\u043b\u043d\u044f\u0435\u043c \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0432 Google writedf (df, gc, 'mySheet', 0, 0, 100, True)<\/code><\/pre>\n<p>\u041f\u043e\u0434\u043e\u0431\u043d\u044b\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c \u043c\u043e\u0436\u043d\u043e \u0442\u0430\u043a \u0436\u0435 \u043f\u043e\u0434\u0440\u0443\u0436\u0438\u0442\u044c \u043d\u0430\u0448 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0441 <a href=\"https:\/\/www.notion.so\/\" rel=\"noopener noreferrer nofollow\">Notion<\/a> \u2014 \u0441\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u0437\u0430\u043c\u0435\u043d\u0435 Evernote, \u043d\u043e \u044d\u0442\u043e \u0431\u044b\u043b \u0431\u044b \u043c\u0430\u0442\u0435\u0440\u0438\u0430\u043b \u0434\u043b\u044f \u0446\u0435\u043b\u043e\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0438.<\/p>\n<p>\u0411\u044b\u043b\u043e \u0431\u044b \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e \u0443\u0437\u043d\u0430\u0442\u044c, \u043a\u0430\u043a\u0438\u0435 \u043d\u0430\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0444\u0443\u043d\u043a\u0446\u0438\u0439 Python \u0435\u0441\u0442\u044c \u0443 \u0432\u0430\u0441, \u0447\u0435\u043c \u043f\u0440\u0438\u0445\u043e\u0434\u0438\u0442\u0441\u044f \u0447\u0430\u0441\u0442\u043e \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u044c\u0441\u044f?<\/p>\n<\/p>\n<\/div>\n<\/div>\n<\/div>\n<div class=\"v-portal\" style=\"display:none;\"><\/div>\n<\/div>\n<p> <!----> <!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/682694\/\"> https:\/\/habr.com\/ru\/post\/682694\/<\/a><br \/><\/br><\/br><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-337190","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/337190","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=337190"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/337190\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=337190"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=337190"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=337190"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}