{"id":343444,"date":"2023-01-02T09:00:28","date_gmt":"2023-01-02T09:00:28","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=343444"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=343444","title":{"rendered":"<span>\u0418\u0441\u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u043d\u0438\u0435 \u043c\u0435\u0442\u043e\u0434\u043e\u0432 \u0410\/\u0411 \u0442\u0435\u0441\u0442\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f. \u0420\u0435\u0448\u0435\u043d\u0438\u0435 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0433\u043e \u043a\u0435\u0439\u0441\u0430 \u0432 Python<\/span>"},"content":{"rendered":"<div><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u041f\u0440\u0438\u0432\u0435\u0442, \u0425\u0430\u0431\u0440! \u0412 \u0434\u0430\u043d\u043d\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435 \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0441\u0441\u043c\u043e\u0442\u0440\u0435\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438, \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (Causal Random Forest), \u043c\u0435\u0442\u043e\u0434\u0430 CUPED \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0446\u0435\u043b\u0435\u0432\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u0432 Python \u043f\u0440\u0438 \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d\u0438\u0438 \u0410\/\u0411 \u0442\u0435\u0441\u0442\u043e\u0432. \u041e\u0441\u043d\u043e\u0432\u043d\u043e\u0435 \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u0435 \u0431\u0443\u0434\u0435\u0442 \u0443\u0434\u0435\u043b\u0435\u043d\u043e \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435, \u0442\u0435\u043e\u0440\u0435\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0430\u0441\u043f\u0435\u043a\u0442\u044b \u043c\u0435\u0442\u043e\u0434\u043e\u0432 \u0431\u0443\u0434\u0443\u0442 \u0443\u043f\u043e\u043c\u044f\u043d\u0443\u0442\u044b \u0432\u0441\u043a\u043e\u043b\u044c\u0437\u044c.<\/p>\n<p><u>\u0423\u0441\u043b\u043e\u0432\u0438\u0435:<\/u> \u0435\u0441\u0442\u044c \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u043e\u0434\u0430\u0435\u0442 \u043d\u0430 \u0441\u0432\u043e\u0435\u043c \u0441\u0430\u0439\u0442\u0435 \u0431\u0438\u043b\u0435\u0442\u044b \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u043f\u043e\u0440\u0442 \u0438 \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0435\u0442 \u043d\u0430 \u043d\u0430\u0446\u0435\u043d\u043a\u0435. \u0410\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442 \u0410\u0411-\u0442\u0435\u0441\u0442: \u0410 \u0438 \u0411 &#8212; \u0440\u0430\u0437\u043d\u044b\u0435 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u044b \u043d\u043e\u0432\u043e\u0439 \u0446\u0435\u043d\u043e\u0432\u043e\u0439 \u043f\u043e\u043b\u0438\u0442\u0438\u043a\u0438 &#8212; \u043d\u0430\u0446\u0435\u043d\u043a\u0430 4% \u0438\u043b\u0438 9%.<\/p>\n<p><u>\u0412\u043e\u043f\u0440\u043e\u0441:<\/u> \u043a\u0430\u043a\u0443\u044e \u0438\u0437 \u0434\u0432\u0443\u0445 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0443\u0436\u043d\u043e \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0442\u044c \u0438 \u043f\u043e\u0447\u0435\u043c\u0443.<\/p>\n<p>\u0414\u0430\u0442\u0430\u0441\u0435\u0442 \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0447\u0430\u0442\u044c <a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/data_ab_test.xlsx\" rel=\"noopener noreferrer nofollow\"><u>\u0437\u0434\u0435\u0441\u044c<\/u><\/a>. \u041f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u043b\u0435\u0436\u0438\u0442 <a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/README.md\" rel=\"noopener noreferrer nofollow\"><u>\u0437\u0434\u0435\u0441\u044c<\/u><\/a>.\u00a0<\/p>\n<p>\u0414\u043b\u044f \u043f\u043e\u043d\u0438\u043c\u0430\u043d\u0438\u044f \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0437\u043d\u0430\u0442\u044c, \u0447\u0442\u043e \u0435\u0441\u0442\u044c \u0434\u0432\u0435 \u0446\u0435\u043b\u0435\u0432\u044b\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u201cbuy\u201d (\u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438), \u201ctotal profit\u201d (\u043f\u0440\u0438\u0431\u044b\u043b\u044c) \u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u044b:<\/p>\n<ol>\n<li>\n<p>T &#8212; \u0442\u0440\u0438\u0442\u043c\u0435\u043d\u0442 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f (0 \u0438\u043b\u0438 1), \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0449\u0430\u044f \u0432\u0430\u0440\u0438\u0430\u043d\u0442 \u0446\u0435\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0410 \u0438\u043b\u0438 \u0412;<\/p>\n<\/li>\n<li>\n<p>bus_offers_count &#8212; \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u0438\u0439 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435;<\/p>\n<\/li>\n<li>\n<p>price_mean, price_min, price_max, price_std &#8212; \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0446\u0435\u043d\u044b \u0432 \u0432\u044b\u0434\u0430\u0447\u0435;<\/p>\n<\/li>\n<li>\n<p>final_rating_mean, final_rating_min, final_rating_max, final_rating_std &#8212; \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0440\u0435\u0439\u0442\u0438\u043d\u0433\u0430 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435;<\/p>\n<\/li>\n<li>\n<p>dist &#8212; \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u0435, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u0441\u0443\u0449\u0435\u0441\u0442\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043f\u0435\u0440\u0435\u0432\u043e\u0437\u043a\u0430 (\u043a\u043c)\u00a0<\/p>\n<\/li>\n<\/ol>\n<p>\u0420\u0430\u0441\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u0432\u043b\u0438\u044f\u043d\u0438\u0435 \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u044f \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0430 \u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438 (\u201cbuy\u201d) \u0438 \u043d\u0430 \u043f\u0440\u0438\u0431\u044b\u043b\u044c (\u201ctotal_profit\u201d).<\/p>\n<p>\u0417\u0430\u0433\u0440\u0443\u0436\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435.<\/p>\n<pre><code class=\"python\">```  import pandas as pd  df = pd.read_excel('data.xlsx')  df.head(5)  ```<\/code><\/pre>\n<p>\u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u043d\u0430 \u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438 (\u201cbuy\u201d) \u043f\u043e\u0441\u0442\u0440\u043e\u0438\u043c \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e. \u041f\u0435\u0440\u0435\u0434 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0435\u043c \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043c, \u0441\u043e\u0431\u043b\u044e\u0434\u0430\u0435\u0442\u0441\u044f \u043b\u0438 \u0431\u0430\u043b\u0430\u043d\u0441 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442, \u0430 \u0442\u0430\u043a\u0436\u0435 \u0435\u0441\u0442\u044c \u043b\u0438 \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u044c.\u00a0<\/p>\n<p>\u0415\u0441\u043b\u0438 \u0431\u0430\u043b\u0430\u043d\u0441 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u0441\u043e\u0431\u043b\u044e\u0434\u0430\u0435\u0442\u0441\u044f, \u0442\u043e \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u044b\u0432\u043e\u0434, \u0447\u0442\u043e \u0433\u0440\u0443\u043f\u043f\u044b \u043f\u043e\u0445\u043e\u0436\u0438 \u043f\u043e \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u0430\u043c \u0438 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442 \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d \u201c\u0447\u0435\u0441\u0442\u043d\u043e\u201d.\u00a0<\/p>\n<pre><code class=\"python\">```      def balance_covariate(df):  \u00a0\u00a0\u00a0\u00a0    number_of_treated=len(df.query('T==1'))  \u00a0\u00a0\u00a0\u00a0    number_of_control=len(df.query('T==0'))  \u00a0\u00a0\u00a0\u00a0    covariate_table_mean=pd.DataFrame(df.groupby([\"T\"],     as_index=True).mean()).drop(columns=[\"buy\", \"total_profit\"]).T.rename(columns={0:   'mean_control', 1: 'mean_treat'}).T  \u00a0\u00a0\u00a0\u00a0    covariate_table_var=pd.DataFrame(df.groupby([\"T\"], as_index=True).var()).drop(columns=[\"buy\", \"total_profit\"]).T.rename(columns={0: 'var_control', 1: 'var_treat'}).T  \u00a0\u00a0\u00a0\u00a0    frames=[covariate_table_mean, covariate_table_var]  \u00a0\u00a0\u00a0\u00a0    result = pd.concat(frames).T  \u00a0\u00a0\u00a0    \u00a0t_stat=[]  \u00a0\u00a0\u00a0\u00a0    for i in range(0, len(result)):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    numerator=result['mean_control'][i]-result['mean_treat'][i]  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    denominator=((result['var_control'][i]\/number_of_control) + (result['var_treat'][i]\/number_of_treated))(1\/2)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    t_stat.append(numerator\/denominator)  \u00a0\u00a0\u00a0\u00a0    result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430']=t_stat  \u00a0\u00a0\u00a0\u00a0    p_value=[]  \u00a0\u00a0\u00a0\u00a0    for i in range(0, len(result)):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    if abs(result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430'][i]) &lt;= 1.645 :  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append('')  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    elif abs(result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430'][i]) &lt;= 1.96:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append('')  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    elif abs(result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430'][i]) &lt;= 2.58:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append('')  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    else:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append(' ')  \u00a0\u00a0\u00a0\u00a0    result['\u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u044c']=p_value  \u00a0\u00a0\u00a0\u00a0    return(result.round(3))      balance_covariate(df)  ```<\/code><\/pre>\n<p><em>\u0414\u043b\u044f \u0432\u0441\u0435\u0445 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043d\u0435 \u043e\u0442\u0432\u0435\u0440\u0433\u0430\u0435\u043c \u0433\u0438\u043f\u043e\u0442\u0435\u0437\u0443 \u043e \u0440\u0430\u0432\u0435\u043d\u0441\u0442\u0432\u0435 \u0441\u0440\u0435\u0434\u043d\u0438\u0445 \u043d\u0430 1%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438, \u043a\u0440\u043e\u043c\u0435 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u044b \u043d\u0430 5% \u0438 10%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438. \u041f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0432 <\/em><a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/methods_of_a:b_testing.ipynb\" rel=\"noopener noreferrer nofollow\"><em><u>\u043d\u043e\u0443\u0442\u0431\u0443\u043a\u0435<\/u><\/em><\/a><em>.<\/em><\/p>\n<p><em>\u0421\u0442\u0440\u043e\u0438\u043c \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u0443\u044e \u043c\u0430\u0442\u0440\u0438\u0446\u0443. \u0414\u043b\u044f \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u0430 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0432\u044b\u0432\u0435\u0434\u0435\u043c \u0432\u0441\u0435 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043f\u043e \u043c\u043e\u0434\u0443\u043b\u044e \u0431\u043e\u043b\u044c\u0448\u0435 0,5.<\/em><\/p>\n<pre><code class=\"python\">```      import matplotlib.pyplot as plt      import seaborn as sns      dfCorr = df.drop(['ID'], axis=1).corr()      filteredDf = dfCorr[((dfCorr >= .5) | (dfCorr &lt;= -.5)) &amp; (dfCorr !=1.000)]      for column in filteredDf.columns:  \u00a0\u00a0\u00a0\u00a0    if filteredDf[column].isna().sum() == len(filteredDf):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    filteredDf=filteredDf.drop(column, axis=1)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    filteredDf=filteredDf.drop(column)      sns.heatmap(filteredDf, annot=True, vmin=-1, vmax=1, center= 0, cmap= 'coolwarm')      plt.show()  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/a06\/0df\/2bc\/a060df2bc865a199da17a083213ac37e.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1: \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u0430\u044f \u043c\u0430\u0442\u0440\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u0430\u043c\u0438, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438, \u0431\u043e\u043b\u044c\u0448\u0435 0.5.\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1: \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u0430\u044f \u043c\u0430\u0442\u0440\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u0430\u043c\u0438, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438, \u0431\u043e\u043b\u044c\u0448\u0435 0.5.\" width=\"886\" height=\"399\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/a06\/0df\/2bc\/a060df2bc865a199da17a083213ac37e.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1: \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u0430\u044f \u043c\u0430\u0442\u0440\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u0430\u043c\u0438, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438, \u0431\u043e\u043b\u044c\u0448\u0435 0.5.<\/figcaption><\/figure>\n<p><em>\u0412 \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0438\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u044e\u0442 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u044b, \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u043c\u0438 \u0431\u043e\u043b\u044c\u0448\u0435 0,9, \u0447\u0442\u043e \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442 \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u0432\u044b\u0441\u043e\u043a\u043e\u0439 \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0435\u043d\u0438\u0430\u0440\u043d\u043e\u0441\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 (\u041a\u0430\u0440\u0442\u0430\u0435\u0432, 2019).\u00a0<\/em><\/p>\n<p><em>\u0420\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u0435\u043c VIF. \u0414\u043b\u044f \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u0430 \u0438\u043d\u0442\u0435\u0440\u043f\u0440\u0435\u0442\u0430\u0446\u0438\u0438 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u0432\u044b\u0432\u0435\u0434\u0435\u043c VIF, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u043e\u043b\u044c\u0448\u0435 10, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0433\u043e\u0432\u043e\u0440\u0438\u0442 \u043e \u043d\u0430\u043b\u0438\u0447\u0438\u0438 \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0435\u043d\u0438\u0430\u0440\u043d\u043e\u0441\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 (\u041a\u0430\u0440\u0442\u0430\u0435\u0432, 2019).<\/em><\/p>\n<pre><code class=\"python\">```      from statsmodels.stats.outliers_influence import variance_inflation_factor      def vif(data):  \u00a0\u00a0\u00a0\u00a0    vif_data = pd.DataFrame()  \u00a0\u00a0\u00a0\u00a0    vif_data[\"feature\"] = data.columns  \u00a0\u00a0\u00a0\u00a0    vif_data[\"VIF\"] = [variance_inflation_factor(data.values, i)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    for i in range(len(data.columns))]  \u00a0\u00a0\u00a0\u00a0    return(vif_data)      vif_df=vif(df)      vif_df[vif_df[\"VIF\"]>=10]  ```<\/code><\/pre>\n<figure class=\"bordered full-width\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/131\/329\/c0d\/131329c0d8f1a3b2fca9994574aa6f12.png\" alt=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10.&#187; title=&#187;\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10.&#187; width=&#187;525&#8243; height=&#187;573&#8243; data-src=&#187;https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/131\/329\/c0d\/131329c0d8f1a3b2fca9994574aa6f12.png&#187;\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10.<\/figcaption><\/figure>\n<p><em>\u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u0438 VIF \u0441\u043e\u0432\u043f\u0430\u0434\u0430\u044e\u0442: \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442 \u0432\u044b\u0441\u043e\u043a\u0430\u044f \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u044c \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 price_mean, price_min, price_max; final_rating_mean, final_rating_min, final_rating_max, final_rating_std; dist. \u041d\u0435\u0443\u0434\u0438\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e, \u0442\u0430\u043a \u043a\u0430\u043a \u044d\u0442\u0438 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 &#8212; \u0440\u0430\u0437\u043d\u044b\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u043e\u0434\u043d\u043e\u0439 \u0438 \u0442\u043e\u0439 \u0436\u0435 \u0432\u0435\u043b\u0438\u0447\u0438\u043d\u044b. \u0427\u0442\u043e\u0431\u044b \u0438\u0437\u0431\u0435\u0436\u0430\u0442\u044c \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u0438, \u0438\u0437 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u043f\u0435\u0440\u0435\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u0445 \u0432\u044b\u0448\u0435, \u043e\u0441\u0442\u0430\u0432\u0438\u043c \u0442\u043e\u043b\u044c\u043a\u043e price_mean, final_rating_mean, final_rating_std, dist.\u00a0<\/em><\/p>\n<pre><code class=\"python\">```      df=df.drop(columns=['price_min', 'price_max', 'final_rating_min', 'final_rating_max'])      vif_df=vif(df)      vif_df[vif_df[\"VIF\"]>=10]  ```<\/code><\/pre>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/d98\/9d0\/c5d\/d989d0c5d17d501f5e52300b2f23cb92.png\" alt=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10 \u043f\u043e\u0441\u043b\u0435 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442.&#187; title=&#187;\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10 \u043f\u043e\u0441\u043b\u0435 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442.&#187; width=&#187;392&#8243; height=&#187;235&#8243; data-src=&#187;https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/d98\/9d0\/c5d\/d989d0c5d17d501f5e52300b2f23cb92.png&#187;\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10 \u043f\u043e\u0441\u043b\u0435 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442.<\/figcaption><\/figure>\n<p><em>\u041f\u043e\u0441\u043b\u0435 \u044d\u0442\u043e\u0433\u043e \u0432 \u043d\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0432\u0441\u0435 \u0440\u0430\u0432\u043d\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442\u0441\u044f \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u044c. \u041d\u043e \u043a\u0430\u043a\u0443\u044e-\u0442\u043e \u0438\u0437 \u044d\u0442\u0438\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 \u044f \u043d\u0435 \u0431\u0443\u0434\u0443 \u0432\u044b\u0431\u0440\u0430\u0441\u044b\u0432\u0430\u0442\u044c, \u0442\u0430\u043a \u043a\u0430\u043a \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c \u0432\u044b\u043a\u0438\u043d\u0443\u0442\u044c \u0437\u043d\u0430\u0447\u0438\u043c\u0443\u044e \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0443\u044e, \u0447\u0442\u043e \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u0442 \u043a \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044e \u043e\u0446\u0435\u043d\u043e\u043a \u0438 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0438\u044e \u043d\u0435\u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u0445 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432.\u00a0<\/em><\/p>\n<p><em>\u041f\u0435\u0440\u0435\u0439\u0434\u0435\u043c \u043e\u0442 \u043f\u0440\u0435\u0434\u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u043a \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044e \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438. \u041d\u043e \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0431\u043e\u043b\u044c\u0448\u043e\u0433\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043e\u0441\u0442\u0430\u043b\u0430\u0441\u044c (\u0443 \u043d\u0430\u0441 \u0438\u0445 34). \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u043c\u044b \u0431\u0443\u0434\u0435\u043c \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u043d\u0435 \u043f\u0440\u043e\u0441\u0442\u0443\u044e \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e, \u0430 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L1, L2 \u0438 elastic net \u0438 \u0441\u0440\u0430\u0432\u043d\u0438\u043c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b.\u00a0<\/em><\/p>\n<p><em>\u0421\u0443\u0442\u0435\u0439\u043d\u043e: \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f &#8212; \u043c\u0435\u0442\u043e\u0434, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0448\u0442\u0440\u0430\u0444 \u0437\u0430 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u0438 \u043a \u043c\u0438\u043d\u0438\u043c\u0438\u0437\u0438\u0440\u0443\u0435\u043c\u043e\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u043f\u043e\u0442\u0435\u0440\u044c, \u0442\u043e \u0435\u0441\u0442\u044c \u043c\u0435\u043d\u0435\u0435 \u0432\u0430\u0436\u043d\u044b\u043c \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0430\u043c \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f \u043f\u0440\u0438\u0434\u0430\u0435\u0442 \u043c\u0435\u043d\u044c\u0448\u0438\u0439 \u0432\u0435\u0441. \u0420\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f L1 (Lasso) \u043c\u043e\u0436\u0435\u0442 \u043a\u0430\u043a \u043e\u0431\u043d\u0443\u043b\u0438\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u043e\u0432, \u0442\u0430\u043a \u0438 \u043f\u0440\u0438\u0434\u0430\u0442\u044c \u0438\u043c \u043c\u0435\u043d\u044c\u0448\u0438\u0439 \u0432\u0435\u0441.<\/em><\/p>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/990\/4a8\/9ea\/9904a89ea8508ba442cec859533767fa.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L1\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L1\" width=\"278\" height=\"26\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/990\/4a8\/9ea\/9904a89ea8508ba442cec859533767fa.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L1<\/figcaption><\/figure>\n<p><em>\u0412 \u0442\u043e \u0432\u0440\u0435\u043c\u044f \u043a\u0430\u043a \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f L2 (Ridge\/\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f \u0422\u0438\u0445\u043e\u043d\u043e\u0432\u0430) \u043d\u0435 \u043c\u043e\u0436\u0435\u0442 \u043e\u0431\u043d\u0443\u043b\u0438\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u043e\u0432, \u043d\u043e \u043c\u043e\u0436\u0435\u0442 \u043f\u0440\u0438\u0434\u0430\u0442\u044c \u0438\u043c \u043c\u0435\u043d\u044c\u0448\u0438\u0439 \u0432\u0435\u0441.\u00a0<\/em><\/p>\n<figure class=\"\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/60c\/e3f\/bc4\/60ce3fbc45d8e96b8ccada328fb526ab.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L2\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L2\" width=\"281\" height=\"26\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/60c\/e3f\/bc4\/60ce3fbc45d8e96b8ccada328fb526ab.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L2<\/figcaption><\/figure>\n<p><em>Elastic net &#8212; \u043e\u0431\u044a\u0435\u0434\u0438\u043d\u0435\u043d\u0438\u0435 \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432 L1 \u0438 L2 &#8212; \u0442\u0435 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u044b\u043b\u0438 \u0437\u0430\u043d\u0443\u043b\u0435\u043d\u044b \u043f\u0440\u0438 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0438 L1, \u0432 elastic net \u0431\u0443\u0434\u0443\u0442 \u0438\u043c\u0435\u0442\u044c \u043c\u0435\u043d\u044c\u0448\u0438\u0435 \u0432\u0435\u0441\u0430, \u0447\u0435\u043c \u043f\u0440\u0438 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0438 L2.\u00a0<\/em><\/p>\n<p><em>\u0414\u043b\u044f \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u0430 \u0438\u043d\u0442\u0435\u0440\u043f\u0440\u0435\u0442\u0430\u0446\u0438\u0438 \u0432\u044b\u0432\u0435\u0434\u0435\u043c \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0441\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435\u043c \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u043e\u0432.\u00a0<\/em><\/p>\n<pre><code class=\"python\">```      import numpy as np      from sklearn.metrics import accuracy_score      from sklearn.model_selection import train_test_split      from sklearn.linear_model import LogisticRegression      from scipy.stats import norm      def building_logistic_regression(df):  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    def logreg_coef(logreg):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef=[]  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef_list=logreg.coef_.tolist()[0]  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef.append(logreg.intercept_)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    for i in range(0, len(coef_list)):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef.append(coef_list[i])  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    return(coef)  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    def logit_p1value(model, x):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    \u00a0p1 = model.predict_proba(x)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    n1 = len(p1)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    m1 = len(model.coef_[0]) + 1  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coefs = np.concatenate([model.intercept_, model.coef_[0]])  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    x_full = np.matrix(np.insert(np.array(x), 0, 1, axis = 1))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    answ = np.zeros((m1, m1))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    for i in range(n1):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    answ = answ + np.dot(np.transpose(x_full[i, :].astype(float)), x_full[i, :].astype(float)) * float(p1[i,1]) * float(p1[i, 0])  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    vcov = np.linalg.inv(np.matrix(answ))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    se = np.sqrt(np.diag(vcov))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    t1 =\u00a0 coefs\/se\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p1 = (1 - norm.cdf(abs(t1))) * 2  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    return p1  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    def confidence(x):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    return ('' if x &lt;= 0.01 else ('**' if x &lt;= 0.05 else ('*' if x&lt;= 0.1 else ' ')))  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    covariates=(df.columns.drop(['total_profit', 'buy']).to_list())  \u00a0\u00a0\u00a0\u00a0    X=df[covariates]  \u00a0\u00a0\u00a0\u00a0    y=np.ravel(df['buy'])  \u00a0\u00a0\u00a0\u00a0    result_logistic_dict={'covariates': ['intercept'] + covariates}  \u00a0\u00a0\u00a0\u00a0    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=21)  \u00a0\u00a0\u00a0\u00a0    methods=['l1', 'l2', 'elasticnet']  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    conf=np.vectorize(confidence)  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    for method in methods:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    if method== 'elasticnet':  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    logreg = LogisticRegression(penalty=method, solver='saga', n_jobs=-1, multi_class='ovr', max_iter=10000, l1_ratio=0.5)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    else:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    logreg = LogisticRegression(penalty=method, solver='saga', n_jobs=-1, multi_class='ovr', max_iter=10000)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    logreg.fit(X_train, y_train)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    result_logistic_dict[method]=logreg_coef(logreg)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    result_logistic_dict[method + str('_confidence')]=conf(logit_p1value(logreg_l1, X))  \u00a0\u00a0\u00a0\u00a0    res=pd.DataFrame(result_logistic_dict)  \u00a0\u00a0\u00a0\u00a0    return(res)      results = building_logistic_regression(df)      results[results[\"l1_confidence\"] != ' ']  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/4de\/c3c\/532\/4dec3c532b7a20d91cf4bb65609a27d9.png\" alt=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u041a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b, \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u043d\u0430 1%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435, \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 l1, l2 \u0438 elastic net.\" title=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u041a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b, \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u043d\u0430 1%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435, \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 l1, l2 \u0438 elastic net.\" width=\"1540\" height=\"707\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/4de\/c3c\/532\/4dec3c532b7a20d91cf4bb65609a27d9.png\"\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u041a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b, \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u043d\u0430 1%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435, \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 l1, l2 \u0438 elastic net.<\/figcaption><\/figure>\n<p>\u041a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043f\u0440\u0438 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 treatment \u043d\u0435\u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0439, \u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u043e, \u0441\u043e\u0433\u043b\u0430\u0441\u043d\u043e \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u043c\u044b \u043d\u0435 \u043c\u043e\u0436\u0435\u043c \u0443\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0442\u044c, \u0447\u0442\u043e \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u0435 9%-\u043d\u043e\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u0432\u043b\u0438\u044f\u0435\u0442 \u043d\u0430 \u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u0431\u0438\u043b\u0435\u0442\u0430.\u00a0<\/p>\n<p>\u041b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0430\u044f \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044f \u043d\u0435 \u0443\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u0442 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u043d\u044e\u0430\u043d\u0441: \u043f\u0440\u0438 \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d\u0438\u0438 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430 \u043d\u0430 \u0446\u0435\u043b\u0435\u0432\u043e\u0439 \u043f\u0440\u0438\u0437\u043d\u0430\u043a \u043c\u043e\u0436\u0435\u0442 \u0432\u043b\u0438\u044f\u0442\u044c \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u043a\u0430\u043a\u043e\u0433\u043e-\u043b\u0438\u0431\u043e treatment, \u043d\u043e \u0438 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u044b \u2013 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u043d\u0430\u0431\u043b\u044e\u0434\u0435\u043d\u0438\u044f (\u0441\u043c. \u0420\u0438\u0441\u0443\u043d\u043e\u043a 2).\u00a0<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/709\/7fe\/0ae\/7097fe0aed713d3a27e367945a259bac.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0412\u043b\u0438\u044f\u043d\u0438\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0430 \u0432\u043e\u0437\u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u0438 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043d\u0430 \u0438\u0441\u0445\u043e\u0434. \u0418\u0441\u0442\u043e\u0447\u043d\u0438\u043a: (Jacob et al., 2021)\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0412\u043b\u0438\u044f\u043d\u0438\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0430 \u0432\u043e\u0437\u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u0438 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043d\u0430 \u0438\u0441\u0445\u043e\u0434. \u0418\u0441\u0442\u043e\u0447\u043d\u0438\u043a: (Jacob et al., 2021)\" width=\"696\" height=\"178\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/709\/7fe\/0ae\/7097fe0aed713d3a27e367945a259bac.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0412\u043b\u0438\u044f\u043d\u0438\u0435 \u044d\u0444\u0444\u0435\u043a\u0442\u0430 \u0432\u043e\u0437\u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u0438 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043d\u0430 \u0438\u0441\u0445\u043e\u0434. \u0418\u0441\u0442\u043e\u0447\u043d\u0438\u043a: (Jacob et al., 2021)<\/figcaption><\/figure>\n<p>\u0418\u0437 \u044d\u0442\u043e\u0433\u043e \u0441\u043b\u0435\u0434\u0443\u0435\u0442, \u0447\u0442\u043e \u0432\u043d\u0443\u0442\u0440\u0438 \u043a\u0430\u0436\u0434\u043e\u0439 \u0433\u0440\u0443\u043f\u043f\u044b \u044d\u0444\u0444\u0435\u043a\u0442 \u0432\u043e\u0437\u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0437\u043d\u044b\u0439. \u041e\u0434\u043d\u0438\u043c \u0438\u0437 \u043c\u0435\u0442\u043e\u0434\u043e\u0432 \u043e\u043f\u0440\u0435\u0434\u0435\u043b\u0435\u043d\u0438\u044f \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0432\u0430\u0436\u043d\u044b\u0445 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u0432 \u0447\u0430\u0441\u0442\u0438 \u00ab\u0432\u043b\u043e\u0436\u0435\u043d\u0438\u044f\u00bb \u0432 \u044d\u0444\u0444\u0435\u043a\u0442 \u0432\u043e\u0437\u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u044f\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u044b\u0439 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 (causal random forest). \u041f\u0440\u0438\u0447\u0438\u043d\u043d\u044b\u0439 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u043f\u043e\u0445\u043e\u0436 \u043d\u0430 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441. \u0412 \u0442\u043e \u0432\u0440\u0435\u043c\u044f \u043a\u0430\u043a \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u0434\u0435\u043b\u0430\u0435\u0442 \u0441\u043f\u043b\u0438\u0442, \u043e\u0441\u043d\u043e\u0432\u044b\u0432\u0430\u044f\u0441\u044c \u043d\u0430 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0445 \u043a\u0440\u0438\u0442\u0435\u0440\u0438\u044f\u0445: \u043e\u0448\u0438\u0431\u043a\u0435 \u043a\u043b\u0430\u0441\u0441\u0438\u0444\u0438\u043a\u0430\u0446\u0438\u0438, \u044d\u043d\u0442\u0440\u043e\u043f\u0438\u0438 \u0438\u043b\u0438 \u0438\u043d\u0434\u0435\u043a\u0441\u0443 \u0414\u0436\u0438\u043d\u0438, \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u044b\u0439 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u0434\u0435\u043b\u0430\u0435\u0442 \u0441\u043f\u043b\u0438\u0442 \u0442\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c, \u0447\u0442\u043e\u0431\u044b \u043c\u0430\u043a\u0441\u0438\u043c\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0440\u0430\u0437\u043d\u0438\u0446\u0443 \u044d\u0444\u0444\u0435\u043a\u0442\u0430 \u0432\u043e\u0437\u0434\u0435\u0439\u0441\u0442\u0432\u0438\u044f \u043c\u0435\u0436\u0434\u0443 \u0432\u0435\u0442\u043a\u0430\u043c\u0438 \u0434\u0435\u0440\u0435\u0432\u0430(Athey and Imbens (2016)). <\/p>\n<p>\u041f\u043e\u0441\u0442\u0440\u043e\u0438\u043c \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u044b\u0439 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u0434\u043b\u044f \u043d\u0430\u0448\u0435\u0433\u043e \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0438 \u0432\u044b\u0432\u0435\u0434\u0435\u043c \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043f\u0440\u0438 \u0422. \u0412\u0430\u0436\u043d\u043e \u0443\u0447\u0435\u0441\u0442\u044c, \u0447\u0442\u043e \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0432\u044b\u0434\u0435\u043b\u0438\u0442\u044c \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0432\u0430\u0436\u043d\u044b\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438, \u0442\u043e \u0435\u0441\u0442\u044c \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u043e\u043b\u044c\u0448\u0435 \u0432\u0441\u0435\u0433\u043e \u0432\u043b\u0438\u044f\u044e\u0442 \u043d\u0430 \u0446\u0435\u043b\u0435\u0432\u0443\u044e \u043c\u0435\u0442\u0440\u0438\u043a\u0443 \u043f\u0440\u0438 \u043f\u043e\u043f\u0430\u0434\u0430\u043d\u0438\u0438 \u0432 \u0442\u0440\u0438\u0442\u043c\u0435\u043d\u0442, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0432\u0441\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0432 \u043c\u043e\u0434\u0435\u043b\u044c, \u043d\u0435 \u043f\u0435\u0440\u0435\u0436\u0438\u0432\u0430\u044f \u043e \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u0438 &#8212; \u0430\u043b\u0433\u043e\u0440\u0438\u0442\u043c \u0440\u0435\u0448\u0438\u0442 \u0432\u0441\u0435 \u0437\u0430 \u043d\u0430\u0441.<\/p>\n<pre><code class=\"python\">```      from econml.dml import CausalForestDML      from sklearn.linear_model import LogisticRegressionCV      import numpy as np      def CATE(df, y, X, model_t, model_y):  \u00a0\u00a0\u00a0\u00a0    X=df[X]  \u00a0\u00a0\u00a0\u00a0    Y=np.ravel(df[y])  \u00a0\u00a0\u00a0\u00a0    T = df['T']  \u00a0\u00a0\u00a0\u00a0    W=None  \u00a0\u00a0\u00a0\u00a0    causal_forest_buy = CausalForestDML(model_t= model_t,  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    model_y= model_y,  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    criterion='het', n_estimators=100,\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    min_samples_leaf=30,\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    max_depth=5, max_samples=0.5,  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    discrete_treatment=True, cv=12, min_samples_split=50, random_state=23)\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    causal_forest_buy.fit(Y, T, X=X, W=W)\u00a0  \u00a0\u00a0\u00a0\u00a0    return(causal_forest_buy)      CATE_buy=CATE(df, 'buy' ,df.columns.drop(['total_profit', 'buy', 'T']).to_list(),  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    model_t= LogisticRegressionCV(solver='sag', max_iter=1000, tol=0.01, multi_class='ovr', random_state=23),  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    model_y= LogisticRegressionCV(solver='sag', max_iter=1000, tol=0.01, multi_class='ovr', random_state=23))      CATE_buy.const_marginal_ate_inference(df[df.columns.drop(['total_profit', 'buy', 'T']).to_list()])  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/4b8\/af3\/6ac\/4b8af36ac7810711b112d778fa6b92a7.png\" alt=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 - \u201cbuy\u201d.\" title=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 - \u201cbuy\u201d.\" width=\"1090\" height=\"811\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/4b8\/af3\/6ac\/4b8af36ac7810711b112d778fa6b92a7.png\"\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 &#8212; \u201cbuy\u201d.<\/figcaption><\/figure>\n<p>\u041c\u044b \u043d\u0435 \u043c\u043e\u0436\u0435\u043c \u0438\u043d\u0442\u0435\u0440\u043f\u0440\u0435\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b, \u0442\u0430\u043a \u043a\u0430\u043a p-value \u043e\u0447\u0435\u043d\u044c \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0438 \u044d\u0444\u0444\u0435\u043a\u0442 \u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c \u0434\u0430\u0436\u0435 \u043d\u0430 15%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438. \u041d\u043e \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0435 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0438 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0430 SHAP \u0432 Python \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0432\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c, \u043a\u0430\u043a\u0438\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u043f\u0440\u0438 \u0440\u0430\u0437\u0434\u0435\u043b\u0435\u043d\u0438\u0438 \u0434\u0435\u0440\u0435\u0432\u044c\u0435\u0432 \u043e\u043a\u0430\u0437\u0430\u043b\u0438\u0441\u044c \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0432\u0430\u0436\u043d\u044b\u043c\u0438 \u0438 \u043a\u0430\u043a \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0432\u043b\u0438\u044f\u0435\u0442 \u043d\u0430 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u043f\u0440\u0438 \u043f\u043e\u043f\u0430\u0434\u0430\u043d\u0438\u0438 \u0432 \u0442\u0440\u0438\u0442\u043c\u0435\u043d\u0442 \u0433\u0440\u0443\u043f\u043f\u0443. \u0412 \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0435 SHAP \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u044e\u0442 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0428\u0435\u043f\u043b\u0438. \u041f\u043e\u043d\u044f\u0442\u0438\u0439\u043d\u043e \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u043e\u0446\u0435\u043d\u043a\u0430 \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0438 \u0431\u0435\u0437 \u0434\u0430\u043d\u043d\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438. \u0424\u043e\u0440\u043c\u0430\u043b\u044c\u043d\u043e (\u0441\u043c. \u0420\u0438\u0441\u0443\u043d\u043e\u043a 3):<\/p>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/e3d\/d4e\/270\/e3dd4e27077b0555884483de705e840e.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0424\u043e\u0440\u043c\u0443\u043b\u0430 \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0428\u0435\u043f\u043b\u0438 \u0434\u043b\u044f i-\u0442\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 (Lundeberg, et al. (2021))\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0424\u043e\u0440\u043c\u0443\u043b\u0430 \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0428\u0435\u043f\u043b\u0438 \u0434\u043b\u044f i-\u0442\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 (Lundeberg, et al. (2021))\" width=\"858\" height=\"190\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/e3d\/d4e\/270\/e3dd4e27077b0555884483de705e840e.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0424\u043e\u0440\u043c\u0443\u043b\u0430 \u0434\u043b\u044f \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u0428\u0435\u043f\u043b\u0438 \u0434\u043b\u044f i-\u0442\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 (Lundeberg, et al. (2021))<\/figcaption><\/figure>\n<p>P (S U {i})\u2014 \u044d\u0442\u043e \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 i-\u0442\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u043e\u0439,<\/p>\n<p>p(S) \u2014 \u044d\u0442\u043e \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u0430\u043d\u0438\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u0431\u0435\u0437 i-\u0442\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438,<\/p>\n<p>n \u2014 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a,<\/p>\n<p>S \u2014 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u043b\u044c\u043d\u044b\u0439 \u043d\u0430\u0431\u043e\u0440 \u0444\u0438\u0447\u0435\u0439 \u0431\u0435\u0437 i-\u0442\u043e\u0439 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438.<\/p>\n<p>\u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0438\u0440\u0443\u0435\u043c \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u044c \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.<\/p>\n<pre><code class=\"python\">```      shap_values = causal_forest_buy.shap_values(X)  shap.summary_plot(shap_values['Y0']['T'])  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/656\/55f\/f46\/65655ff464b138f2b6f12b4fa1796307.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4: \u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f - \u201cbuy\u201d)\u00a0 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4: \u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f - \u201cbuy\u201d)\u00a0 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.\" width=\"622\" height=\"564\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/656\/55f\/f46\/65655ff464b138f2b6f12b4fa1796307.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 4: \u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f &#8212; \u201cbuy\u201d)\u00a0 \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.<\/figcaption><\/figure>\n<p>\u0412 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a, \u0432\u043b\u0438\u044f\u043d\u0438\u0435 \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u044f \u0431\u041e\u043b\u044c\u0448\u0435\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0430 \u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u043c\u043e\u0436\u0435\u0442 \u0431\u044b\u0442\u044c \u043a\u0430\u043a \u043f\u043e\u043b\u043e\u0436\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u043c, \u0442\u0430\u043a \u0438 \u043e\u0442\u0440\u0438\u0446\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u043c. \u0418\u0437 \u0440\u0438\u0441\u0443\u043d\u043a\u0430 4 \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0432\u044b\u0432\u043e\u0434\u044b (\u0431\u043e\u043b\u0435\u0435 \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0438\u0440\u043e\u0432\u0430\u043d\u043e &#8212; \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 4). \u0412 \u0442\u0440\u0438\u0442\u043c\u0435\u043d\u0442 \u0433\u0440\u0443\u043f\u043f\u0435 (\u0432 \u0433\u0440\u0443\u043f\u043f\u0435 \u0441 \u043d\u0430\u0438\u0431\u043e\u043b\u044c\u0448\u0435\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u043e\u0439):<\/p>\n<ol>\n<li>\n<p>\u0447\u0435\u043c \u0431\u043e\u043b\u044c\u0448\u0435 \u0433\u043b\u0443\u0431\u0438\u043d\u0430 \u043f\u043e\u0438\u0441\u043a\u0430, \u0442\u0435\u043c \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u0431\u0438\u043b\u0435\u0442\u0430 \u043c\u0435\u043d\u044c\u0448\u0435 (\u0443 \u0447\u0435\u043b\u043e\u0432\u0435\u043a\u0430 \u0435\u0441\u0442\u044c \u0432\u0440\u0435\u043c\u044f \u043f\u043e\u0438\u0441\u043a\u0430\u0442\u044c \u0431\u0438\u043b\u0435\u0442\u044b \u0431\u0435\u0437 \u043d\u0430\u0446\u0435\u043d\u043a\u0438);<\/p>\n<\/li>\n<li>\n<p>\u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u0438\u0439 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435 \u0441\u043d\u0438\u0436\u0430\u0435\u0442 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u0431\u0438\u043b\u0435\u0442\u0430 (\u0441\u043a\u043e\u0440\u0435\u0435 \u0432\u0441\u0435\u0433\u043e \u043b\u044e\u0434\u0438, \u0432\u0438\u0434\u044f \u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u0438\u0439 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435, \u043d\u0435 \u0431\u043e\u044f\u0442\u0441\u044f \u043e\u0441\u0442\u0430\u0442\u044c\u0441\u044f \u0431\u0435\u0437 \u0431\u0438\u043b\u0435\u0442\u0430 \u0432 \u043d\u0443\u0436\u043d\u044b\u0439 \u043c\u043e\u043c\u0435\u043d\u0442, \u043f\u043e\u044d\u0442\u043e\u043c\u0443, \u0432\u0438\u0434\u044f \u0434\u043e\u0440\u043e\u0433\u043e\u0432\u0438\u0437\u043d\u0443 \u0431\u0438\u043b\u0435\u0442\u043e\u0432, \u0443\u0445\u043e\u0434\u044f\u0442 \u0441 \u0441\u0430\u0439\u0442\u0430);<\/p>\n<\/li>\n<li>\n<p>\u0435\u0441\u043b\u0438 \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u044c \u043f\u0440\u0438\u0448\u0435\u043b \u0432 \u0441\u0435\u0440\u0432\u0438\u0441 \u0447\u0435\u0440\u0435\u0437 \u043f\u043e\u0438\u0441\u043a\u043e\u0432\u0438\u043a (\u0430 \u043d\u0435, \u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440,\u00a0 \u0441 \u043f\u0440\u0438\u043b\u043e\u0436\u0435\u043d\u0438\u044f), \u0442\u043e \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c, \u0447\u0442\u043e \u043e\u043d \u043a\u0443\u043f\u0438\u0442 \u0431\u0438\u043b\u0435\u0442, \u043c\u0435\u043d\u044c\u0448\u0435 (\u043f\u043e\u0441\u0442\u043e\u044f\u043d\u043d\u044b\u0435 \u043a\u043b\u0438\u0435\u043d\u0442\u044b \u0438\u043c\u0435\u044e\u0442 \u043f\u0440\u0438\u0432\u044b\u0447\u043a\u0443 \u043f\u043e\u043a\u0443\u043f\u0430\u0442\u044c \u0432 \u043e\u0434\u043d\u043e\u043c \u0438 \u0442\u043e\u043c \u0436\u0435 \u0441\u0435\u0440\u0432\u0438\u0441\u0435, \u043d\u0435\u0441\u043c\u043e\u0442\u0440\u044f \u043d\u0430 \u043f\u043e\u0434\u043e\u0440\u043e\u0436\u0430\u043d\u0438\u0435);<\/p>\n<\/li>\n<li>\n<p>\u0447\u0435\u043c \u0432\u044b\u0448\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0441\u0435\u0449\u0435\u043d\u0438\u0439 \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u044b \u0441 \u0431\u0438\u043b\u0435\u0442\u0430\u043c\u0438 \u043d\u0430 \u0430\u0432\u0442\u043e\u0431\u0443\u0441\/\u043f\u043e\u0435\u0437\u0434, \u0442\u0435\u043c \u0432\u044b\u0448\u0435 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u0431\u0438\u043b\u0435\u0442\u0430 \u0441 \u043d\u0430\u0446\u0435\u043d\u043a\u043e\u0439 (\u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e, \u0447\u0435\u043b\u043e\u0432\u0435\u043a \u0431\u043e\u0438\u0442\u0441\u044f \u0435\u0449\u0435 \u0431\u041e\u043b\u044c\u0448\u0435\u0433\u043e \u043f\u043e\u0434\u043e\u0440\u043e\u0436\u0430\u043d\u0438\u044f \u0432 \u0431\u0443\u0434\u0443\u0449\u0435\u043c \u0438 \u0440\u0435\u0448\u0430\u0435\u0442 \u043d\u0435 \u043e\u0442\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0442\u044c \u043f\u043e\u043a\u0443\u043f\u043a\u0443).<\/p>\n<\/li>\n<\/ol>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"196\" width=\"196\">\n<p align=\"left\">\u041d\u0430\u0437\u0432\u0430\u043d\u0438\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u0421\u043c\u044b\u0441\u043b \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u0421\u0432\u044f\u0437\u044c<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"196\" width=\"196\">\n<p align=\"left\">depth<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u0433\u043b\u0443\u0431\u0438\u043d\u0430 \u043f\u043e\u0438\u0441\u043a\u0430 (\u0447\u0435\u0440\u0435\u0437 \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0434\u043d\u0435\u0439 \u043f\u043b\u0430\u043d\u0438\u0440\u0443\u0435\u0442\u0441\u044f \u043f\u043e\u0435\u0437\u0434\u043a\u0430)<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u0431\u0440\u0430\u0442\u043d\u0430\u044f<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"196\" width=\"196\">\n<p align=\"left\">bus_offers_count<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u0438\u0439 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u0431\u0440\u0430\u0442\u043d\u0430\u044f<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"196\" width=\"196\">\n<p align=\"left\">global_source_direct<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u0431\u0438\u043d\u0430\u0440\u043d\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f, \u0440\u0430\u0432\u043d\u0430 1, \u0435\u0441\u043b\u0438 \u043f\u043e\u043b\u044c\u0437\u043e\u0432\u0430\u0442\u0435\u043b\u044c \u043f\u0440\u0438\u0448\u0435\u043b \u0432 \u0438\u043d\u0442\u0435\u0440\u043d\u0435\u0442 \u043c\u0430\u0433\u0430\u0437\u0438\u043d \u0447\u0435\u0440\u0435\u0437 \u043f\u043e\u0438\u0441\u043a\u043e\u0432\u0438\u043a, 0 &#8212; \u0438\u043d\u0430\u0447\u0435<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041e\u0431\u0440\u0430\u0442\u043d\u0430\u044f<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"196\" width=\"196\">\n<p align=\"left\">bus_pages<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0441\u0435\u0449\u0435\u043d\u0438\u0439 \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u044b \u0441 \u0431\u0438\u043b\u0435\u0442\u0430\u043c\u0438 \u043d\u0430 \u0430\u0432\u0442\u043e\u0431\u0443\u0441 \u0437\u0430 \u043f\u0440\u0435\u0434\u0448\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0439 \u043f\u0440\u043e\u043c\u0435\u0436\u0443\u0442\u043e\u043a \u0432\u0440\u0435\u043c\u0435\u043d\u0438<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041f\u0440\u044f\u043c\u0430\u044f<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"196\" width=\"196\">\n<p align=\"left\">train<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0441\u0435\u0449\u0435\u043d\u0438\u0439 \u0441\u0442\u0440\u0430\u043d\u0438\u0446\u044b \u0441 \u0431\u0438\u043b\u0435\u0442\u0430\u043c\u0438 \u043d\u0430 \u043f\u043e\u0435\u0437\u0434 \u0437\u0430 \u043f\u0440\u0435\u0434\u0448\u0435\u0441\u0442\u0432\u0443\u044e\u0449\u0438\u0439 \u043f\u0440\u043e\u043c\u0435\u0436\u0443\u0442\u043e\u043a \u0432\u0440\u0435\u043c\u0435\u043d\u0438<\/p>\n<\/td>\n<td>\n<p align=\"left\">\u041f\u0440\u044f\u043c\u0430\u044f<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p><em>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 4: \u0412\u043b\u0438\u044f\u043d\u0438\u0435 \u0431\u043e\u043b\u0435\u0435 \u0432\u044b\u0441\u043e\u043a\u043e\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0430 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u043f\u043e\u043a\u0430\u0437\u0430\u0442\u0435\u043b\u044f \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0432 \u0440\u0430\u0437\u0440\u0435\u0437\u0435 \u0433\u0440\u0443\u043f\u043f \u043e\u0442 \u043d\u0430\u0438\u0431\u043e\u043b\u0435\u0435 \u0432\u0430\u0436\u043d\u043e\u0439 \u043a \u043d\u0430\u0438\u043c\u0435\u043d\u0435\u0435 \u0432\u0430\u0436\u043d\u043e\u0439<\/em><\/p>\n<p>\u0410 \u0442\u0435\u043f\u0435\u0440\u044c \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043a\u0430\u043a \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u0432\u043b\u0438\u044f\u0435\u0442 \u043d\u0430 \u201ctotal_profit\u201d (\u043f\u0440\u0438\u0431\u044b\u043b\u044c \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438). \u0418\u0437 \u043d\u0430\u0448\u0435\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u043e\u0441\u0442\u0430\u0432\u0438\u043c \u0442\u043e\u043b\u044c\u043a\u043e \u0442\u0435\u0445 \u043b\u044e\u0434\u0435\u0439, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0441\u043e\u0432\u0435\u0440\u0448\u0438\u043b\u0438 \u043f\u043e\u043a\u0443\u043f\u043a\u0443, \u0442\u043e \u0435\u0441\u0442\u044c \u201ctotal_profit\u201d \u043a\u043e\u0442\u043e\u0440\u044b\u0445 > 0.<\/p>\n<pre><code class=\"python\">```  df_not_null_profit=df[df['total_profit'] > 0]  ```<\/code><\/pre>\n<p>\u0411\u0430\u043b\u0430\u043d\u0441 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u0441\u043e\u0431\u043b\u044e\u0434\u0430\u0435\u0442\u0441\u044f. \u041f\u043e\u043b\u043d\u0443\u044e \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0441 \u0432\u044b\u0432\u043e\u0434\u043e\u043c \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c <a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/methods_of_a:b_testing.ipynb\" rel=\"noopener noreferrer nofollow\"><u>\u0437\u0434\u0435\u0441\u044c<\/u><\/a>.<\/p>\n<pre><code class=\"python\">```  balance_covariate(df_not_null_profit)  ```<\/code><\/pre>\n<p>\u041f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u0443\u0441\u0440\u0435\u0434\u043d\u0435\u043d\u043d\u0443\u044e \u043e\u0446\u0435\u043d\u043a\u0443 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u043d\u0430 \u043f\u0440\u0438\u0431\u044b\u043b\u044c \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u043c\u0435\u0442\u043e\u0434\u0430 CUPED. \u0412 \u0440\u0430\u043c\u043a\u0430\u0445 \u043c\u0435\u0442\u043e\u0434\u0430 CUPED \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u0431\u0440\u0430\u0442\u044c \u0442\u043e\u043b\u044c\u043a\u043e \u0442\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0435 \u0438\u0437\u043c\u0435\u043d\u0438\u043b\u0438\u0441\u044c \u0432\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u0438 (X const), \u0442\u043e \u0435\u0441\u0442\u044c \u0431\u044b\u043b\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u043c\u0438 \u0434\u043b\u044f \u043d\u0430\u0431\u043b\u044e\u0434\u0435\u043d\u0438\u044f \u0434\u043e \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442\u0430 \u0438 \u043f\u043e\u0441\u043b\u0435 \u043d\u0435\u0433\u043e (Xie, Aurisset, 2016). \u042d\u0442\u043e \u043f\u043e\u0437\u0432\u043e\u043b\u044f\u0435\u0442 \u0441\u043d\u0438\u0437\u0438\u0442\u044c \u0434\u0438\u0441\u043f\u0435\u0440\u0441\u0438\u044e \u043e\u0446\u0435\u043d\u043a\u0438. \u042d\u0444\u0444\u0435\u043a\u0442 \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u043c \u0441\u043f\u043e\u0441\u043e\u0431\u043e\u043c:<\/p>\n<ol>\n<li>\n<p>\u0421\u0442\u0440\u043e\u0438\u043c \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e Y ~ X const => e(Y)<\/p>\n<\/li>\n<li>\n<p>\u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u043d\u0430\u0431\u043b\u044e\u0434\u0435\u043d\u0438\u044f \u0440\u0430\u0441\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u043c: Y_tilde = e(Y) + Y<\/p>\n<\/li>\n<li>\n<p>Y ~ T => \u043d\u0430\u0445\u043e\u0434\u0438\u043c \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043f\u0440\u0438 \u0422<\/p>\n<\/li>\n<\/ol>\n<pre><code class=\"python\">```  import statsmodels.formula.api as smf  import numpy as np  X_pred='avia_pages + train + etrain + bus_pages + tours + avia_orders + bus_orders + zhd'  df_not_null_profit['total_profit_tilde']=smf.ols('total_profit ~' + str(X_pred), data=df_not_null_profit).fit(cov_type=\"HC3\").resid + np.mean(df['total_profit'])  smf.ols('total_profit_tilde ~ T',     data=df_not_null_profit).fit(cov_type=\"HC3\").summary().tables[1]  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/79d\/d6c\/2b3\/79dd6c2b31dac4e1a4bb8a6e77aa773c.png\" alt=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 5:\u00a0 CUPED-\u043e\u0446\u0435\u043d\u043a\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u201ctotal_profit\u201d\" title=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 5:\u00a0 CUPED-\u043e\u0446\u0435\u043d\u043a\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u201ctotal_profit\u201d\" width=\"818\" height=\"195\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/79d\/d6c\/2b3\/79dd6c2b31dac4e1a4bb8a6e77aa773c.png\"\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 5:\u00a0 CUPED-\u043e\u0446\u0435\u043d\u043a\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u201ctotal_profit\u201d<\/figcaption><\/figure>\n<p>\u0412\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u0431\u041e\u043b\u044c\u0448\u0435\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0435\u0442 \u043f\u0440\u0438\u0431\u044b\u043b\u044c \u043d\u0430 5,7 \u0443\u0441\u043b\u043e\u0432\u043d\u044b\u0445 \u0435\u0434\u0438\u043d\u0438\u0446 \u0441 \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u043d\u0430 5%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438 \u043f\u0440\u0438 \u043f\u0440\u043e\u0447\u0438\u0445 \u0440\u0430\u0432\u043d\u044b\u0445 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445. \u041c\u0438\u043d\u0443\u0441 \u043c\u0435\u0442\u043e\u0434\u0430 CUPED &#8212; \u043d\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0433\u0435\u0442\u0435\u0440\u043e\u0433\u0435\u043d\u043d\u044b\u0439 \u044d\u0444\u0444\u0435\u043a\u0442 \u0432 \u0440\u0430\u0437\u0440\u0435\u0437\u0435 \u0440\u0430\u0437\u043d\u044b\u0445 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a. \u041f\u043e\u0441\u0442\u0440\u043e\u0438\u043c \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u044b\u0439 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u0438 \u043f\u0440\u043e\u0434\u0435\u043c\u043e\u043d\u0441\u0442\u0440\u0438\u0440\u0443\u0435\u043c \u0433\u0435\u0442\u0435\u0440\u043e\u0433\u0435\u043d\u043d\u044b\u0439 \u044d\u0444\u0444\u0435\u043a\u0442 \u0432 \u0440\u0430\u0437\u0440\u0435\u0437\u0435 \u0440\u0430\u0437\u043d\u044b\u0445 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a.<\/p>\n<pre><code class=\"python\">```  CATE_total_profit=CATE(df_not_null_profit,\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0'total_profit',\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0df_not_null_profit.columns.drop(['total_profit', 'buy', 'T', 'total_profit_tilde']).to_list(),  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0model_t=LogisticRegressionCV(solver='saga', max_iter=2000, tol=0.001, multi_class='ovr', random_state=22),\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0model_y='auto')      CATE_total_profit.const_marginal_ate_inference(df_not_null_profit[df_not_null_profit.columns.drop(['total_profit', 'buy', 'T', 'total_profit_tilde']).to_list()])  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/24d\/e5f\/d7c\/24de5fd7c7e313f6e4f97e9c6e9ab858.png\" alt=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 6: \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 - \u201ctotal_profit\u201d\" title=\"\u0422\u0430\u0431\u043b\u0438\u0446\u0430 6: \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 - \u201ctotal_profit\u201d\" width=\"1079\" height=\"809\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/24d\/e5f\/d7c\/24de5fd7c7e313f6e4f97e9c6e9ab858.png\"\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 6: \u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044f \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 \u0434\u043b\u044f \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 &#8212; \u201ctotal_profit\u201d<\/figcaption><\/figure>\n<p>\u041f\u0440\u0438\u0447\u0438\u043d\u043d\u044b\u0439 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043b\u0435\u0441 \u043f\u043e\u043a\u0430\u0437\u0430\u043b \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0439 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442: \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u0431\u041e\u043b\u044c\u0448\u0435\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0435\u0442 \u043f\u0440\u0438\u0431\u044b\u043b\u044c \u043d\u0430 6,7 \u0443\u0441\u043b\u043e\u0432\u043d\u044b\u0445 \u0435\u0434\u0438\u043d\u0438\u0446 \u0441 \u043f\u043e\u043a\u0443\u043f\u043a\u0438 \u043d\u0430 15%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438 \u043f\u0440\u0438 \u043f\u0440\u043e\u0447\u0438\u0445 \u0440\u0430\u0432\u043d\u044b\u0445 \u0443\u0441\u043b\u043e\u0432\u0438\u044f\u0445.<\/p>\n<pre><code class=\"python\">```  shap_values = CATE_total_profit.shap_values(df_not_null_profit[df_not_null_profit.columns.drop(['total_profit', 'buy', 'T', 'total_profit_tilde']).to_list()])  shap.plots.beeswarm(shap_values['Y0']['T_1'])  ```<\/code><\/pre>\n<figure class=\"full-width\"><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/c42\/ff5\/bf2\/c42ff5bf24ea45645fa22d93f3f8a965.png\" alt=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5: \u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f - \u201ctotal_profit\u201d) \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.\" title=\"\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5: \u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f - \u201ctotal_profit\u201d) \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.\" width=\"623\" height=\"347\" data-src=\"https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/c42\/ff5\/bf2\/c42ff5bf24ea45645fa22d93f3f8a965.png\"\/><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 5: \u0412\u0438\u0437\u0443\u0430\u043b\u0438\u0437\u0430\u0446\u0438\u044f \u0432\u0430\u0436\u043d\u043e\u0441\u0442\u0438 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u0430\u044f \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f &#8212; \u201ctotal_profit\u201d) \u0441 \u043f\u043e\u043c\u043e\u0449\u044c\u044e \u0431\u0438\u0431\u043b\u0438\u043e\u0442\u0435\u043a\u0438 SHAP.<\/figcaption><\/figure>\n<p>\u0418\u0437 \u0440\u0438\u0441\u0443\u043d\u043a\u0430 5 \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u044b\u0435 \u0432\u044b\u0432\u043e\u0434\u044b: \u043f\u0440\u0438 \u0431\u043e\u043b\u0435\u0435 \u0432\u044b\u0441\u043e\u043a\u043e\u043c \u0440\u0435\u0439\u0442\u0438\u043d\u0433\u0435, \u0446\u0435\u043d\u0435, \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0443 \u043f\u0430\u0441\u0441\u0430\u0436\u0438\u0440\u043e\u0432 \u043f\u0440\u0438\u0431\u044b\u043b\u044c \u0432\u043e \u0432\u0440\u0435\u043c\u044f \u043f\u0440\u043e\u0434\u0430\u0436\u0438 \u0431\u0438\u043b\u0435\u0442\u043e\u0432 \u0441 9%-\u043d\u043e\u0439 \u043d\u0430\u0446\u0435\u043d\u043a\u043e\u0439 (\u0430 \u043d\u0435 5%-\u043d\u043e\u0439) \u0443\u0432\u0435\u043b\u0438\u0447\u0438\u0432\u0430\u0435\u0442\u0441\u044f.<\/p>\n<p>\u0412\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u044f\u0441\u044c \u043a \u0441\u0442\u0440\u0430\u0442\u0435\u0433\u0438\u0438 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438, \u0442\u043e \u0440\u0435\u0448\u0435\u043d\u0438\u0435 \u043e \u043f\u0440\u043e\u0446\u0435\u043d\u0442\u0435 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0442\u044c \u0432 \u0437\u0430\u0432\u0438\u0441\u0438\u043c\u043e\u0441\u0442\u0438 \u043e\u0442 \u0446\u0435\u043b\u0435\u0439. \u0415\u0441\u043b\u0438 \u0446\u0435\u043b\u044c \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438 &#8212; \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u043d\u0430\u0438\u0431\u043e\u043b\u044c\u0448\u0443\u044e \u043f\u0440\u0438\u0431\u044b\u043b\u044c, \u0442\u043e \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e \u0432\u0432\u043e\u0434\u0438\u0442\u044c \u043d\u0430\u0446\u0435\u043d\u043a\u0443: \u0432\u0441\u0435\u0433\u0434\u0430 \u0431\u0443\u0434\u0443\u0442 \u043d\u0430\u0445\u043e\u0434\u0438\u0442\u044c\u0441\u044f \u0431\u043e\u0433\u0430\u0442\u044b\u0435 \u043b\u044e\u0434\u0438, \u0434\u043b\u044f \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u0432\u0440\u0435\u043c\u044f \u0441\u043b\u0438\u0448\u043a\u043e\u043c \u0446\u0435\u043d\u043d\u043e\u0435, \u0447\u0442\u043e\u0431\u044b \u0438\u0441\u043a\u0430\u0442\u044c \u0434\u0440\u0443\u0433\u0438\u0435 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u044b \u0438\u043b\u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0430\u0441\u0442\u043e\u043b\u044c\u043a\u043e \u0431\u043e\u0433\u0430\u0442\u044b\u0435, \u0447\u0442\u043e \u043d\u0435 \u0431\u0443\u0434\u0443\u0442 \u0437\u0430\u043c\u0435\u0447\u0430\u0442\u044c \u043d\u0430\u0446\u0435\u043d\u043a\u0443 \u043d\u0430 \u043f\u043e\u0435\u0437\u0434\u043a\u0443.<\/p>\n<p>\u041d\u043e \u0435\u0441\u043b\u0438 \u0446\u0435\u043b\u0435\u0432\u0430\u044f \u043c\u0435\u0442\u0440\u0438\u043a\u0430 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438 &#8212; \u0443\u0432\u0435\u043b\u0438\u0447\u0435\u043d\u0438\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u043a\u043b\u0438\u0435\u043d\u0442\u043e\u0432, \u0442\u043e \u043d\u0430\u0446\u0435\u043d\u043a\u0443 \u043d\u0443\u0436\u043d\u043e \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0442\u044c \u043d\u0438\u0437\u043a\u043e\u0439.<\/p>\n<p>\u041a\u043e\u043c\u043f\u0430\u043d\u0438\u0438 \u0442\u0430\u043a\u0436\u0435 \u043c\u043e\u0436\u0435\u0442 \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u043c\u0438\u043a\u0441\u043e\u0432\u0430\u0442\u044c \u0441\u0442\u0440\u0430\u0442\u0435\u0433\u0438\u0438: \u0441 \u043e\u0434\u043d\u043e\u0439 \u0441\u0442\u043e\u0440\u043e\u043d\u044b, \u043e\u0441\u0442\u0430\u0432\u0438\u0442\u044c \u043c\u0435\u043d\u044c\u0448\u0443\u044e \u043e\u0446\u0435\u043d\u043a\u0443, \u0441 \u0434\u0440\u0443\u0433\u043e\u0439, \u0432\u0432\u0435\u0441\u0442\u0438 \u0431\u041e\u043b\u044c\u0448\u0443\u044e \u043d\u0430\u0446\u0435\u043d\u043a\u0443 \u043d\u0430 \u0441\u0430\u043c\u044b\u0435 \u0434\u043e\u0440\u043e\u0433\u0438\u0435 \u043d\u0430\u043f\u0440\u0430\u0432\u043b\u0435\u043d\u0438\u044f (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, \u043d\u0430 \u0432\u0435\u0440\u0445\u043d\u0438\u0439 10%-\u043d\u044b\u0439 \u043f\u0435\u0440\u0446\u0435\u043d\u0442\u0438\u043b\u044c) \u0438 \u043d\u0430 \u043f\u043e\u0435\u0437\u0434\u043a\u0438 \u043d\u0430 \u0441\u0435\u0433\u043e\u0434\u043d\u044f\u0448\u043d\u0438\u0439\/\u0437\u0430\u0432\u0442\u0440\u0430\u0448\u043d\u0438\u0439 \u0434\u043d\u0438.<\/p>\n<p><u>\u0421\u043f\u0438\u0441\u043e\u043a \u043b\u0438\u0442\u0435\u0440\u0430\u0442\u0443\u0440\u044b:<\/u><\/p>\n<p>[1] \u0424\u0438\u043b\u0438\u043f\u043f \u041a\u0430\u0440\u0442\u0430\u0435\u0432 \u201c\u0412\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u0432 \u044d\u043a\u043e\u043d\u043e\u043c\u0435\u0442\u0440\u0438\u043a\u0443\u201d: \u0443\u0447\u0435\u0431\u043d\u0438\u043a. \u2013 \u041c.: \u042d\u043a\u043e\u043d\u043e\u043c\u0438\u0447\u0435\u0441\u043a\u0438\u0439 \u0444\u0430- \u043a\u0443\u043b\u044c\u0442\u0435\u0442 \u041c\u0413\u0423 \u0438\u043c\u0435\u043d\u0438 \u041c.\u0412. \u041b\u043e\u043c\u043e\u043d\u043e\u0441\u043e\u0432\u0430, 2019. \u2013 472 \u0441. ISBN 978-5-906932-22-8<\/p>\n<p>[2] Jacob, Daniel, CATE meets ML &#8212; Conditional Average Treatment Effect and Machine Learning (March 30, 2021). Available at SSRN:\u00a0<a href=\"https:\/\/ssrn.com\/abstract=3816558\" rel=\"noopener noreferrer nofollow\"><u>https:\/\/ssrn.com\/abstract=3816558<\/u><\/a>\u00a0or\u00a0<a href=\"https:\/\/dx.doi.org\/10.2139\/ssrn.3816558\" rel=\"noopener noreferrer nofollow\"><u>http:\/\/dx.doi.org\/10.2139\/ssrn.3816558<\/u><\/a><\/p>\n<p>[3] Scott M. Lundberg, Gabriel G. Erion, and Su-In Lee &#8212; Consistent Individualized Feature Attribution for Tree Ensembles (March 7, 2019) Available: <a href=\"https:\/\/arxiv.org\/pdf\/1802.03888.pdf\" rel=\"noopener noreferrer nofollow\"><u>https:\/\/arxiv.org\/pdf\/1802.03888.pdf<\/u><\/a>\u00a0<\/p>\n<p>[4] Xie, Huizhi and Juliette Aurisset. \u201cImproving the Sensitivity of Online Controlled Experiments: Case Studies at Netflix.\u201d <em>Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining<\/em> (2016): n. pag.<\/p>\n<\/p>\n<\/div>\n<\/div>\n<\/div>\n<p> <!----> <!----><\/div>\n<p> <!----> <!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/post\/708872\/\"> https:\/\/habr.com\/ru\/post\/708872\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u041f\u0440\u0438\u0432\u0435\u0442, \u0425\u0430\u0431\u0440! \u0412 \u0434\u0430\u043d\u043d\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435 \u0431\u0443\u0434\u0435\u0442 \u0440\u0430\u0441\u0441\u043c\u043e\u0442\u0440\u0435\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438, \u043f\u0440\u0438\u0447\u0438\u043d\u043d\u043e\u0433\u043e \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043b\u0435\u0441\u0430 (Causal Random Forest), \u043c\u0435\u0442\u043e\u0434\u0430 CUPED \u0434\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u044f \u0446\u0435\u043b\u0435\u0432\u043e\u0439 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u0432 Python \u043f\u0440\u0438 \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d\u0438\u0438 \u0410\/\u0411 \u0442\u0435\u0441\u0442\u043e\u0432. \u041e\u0441\u043d\u043e\u0432\u043d\u043e\u0435 \u0432\u043d\u0438\u043c\u0430\u043d\u0438\u0435 \u0431\u0443\u0434\u0435\u0442 \u0443\u0434\u0435\u043b\u0435\u043d\u043e \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0435, \u0442\u0435\u043e\u0440\u0435\u0442\u0438\u0447\u0435\u0441\u043a\u0438\u0435 \u0430\u0441\u043f\u0435\u043a\u0442\u044b \u043c\u0435\u0442\u043e\u0434\u043e\u0432 \u0431\u0443\u0434\u0443\u0442 \u0443\u043f\u043e\u043c\u044f\u043d\u0443\u0442\u044b \u0432\u0441\u043a\u043e\u043b\u044c\u0437\u044c.<\/p>\n<p><u>\u0423\u0441\u043b\u043e\u0432\u0438\u0435:<\/u> \u0435\u0441\u0442\u044c \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438, \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u043f\u0440\u043e\u0434\u0430\u0435\u0442 \u043d\u0430 \u0441\u0432\u043e\u0435\u043c \u0441\u0430\u0439\u0442\u0435 \u0431\u0438\u043b\u0435\u0442\u044b \u043d\u0430 \u0442\u0440\u0430\u043d\u0441\u043f\u043e\u0440\u0442 \u0438 \u043a\u043e\u0442\u043e\u0440\u0430\u044f \u0437\u0430\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0435\u0442 \u043d\u0430 \u043d\u0430\u0446\u0435\u043d\u043a\u0435. \u0410\u043d\u0430\u043b\u0438\u0442\u0438\u043a \u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442 \u0410\u0411-\u0442\u0435\u0441\u0442: \u0410 \u0438 \u0411 &#8212; \u0440\u0430\u0437\u043d\u044b\u0435 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u044b \u043d\u043e\u0432\u043e\u0439 \u0446\u0435\u043d\u043e\u0432\u043e\u0439 \u043f\u043e\u043b\u0438\u0442\u0438\u043a\u0438 &#8212; \u043d\u0430\u0446\u0435\u043d\u043a\u0430 4% \u0438\u043b\u0438 9%.<\/p>\n<p><u>\u0412\u043e\u043f\u0440\u043e\u0441:<\/u> \u043a\u0430\u043a\u0443\u044e \u0438\u0437 \u0434\u0432\u0443\u0445 \u0432\u0430\u0440\u0438\u0430\u043d\u0442\u043e\u0432 \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0443\u0436\u043d\u043e \u0443\u0441\u0442\u0430\u043d\u0430\u0432\u043b\u0438\u0432\u0430\u0442\u044c \u0438 \u043f\u043e\u0447\u0435\u043c\u0443.<\/p>\n<p>\u0414\u0430\u0442\u0430\u0441\u0435\u0442 \u043c\u043e\u0436\u043d\u043e \u0441\u043a\u0430\u0447\u0430\u0442\u044c <a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/data_ab_test.xlsx\" rel=\"noopener noreferrer nofollow\"><u>\u0437\u0434\u0435\u0441\u044c<\/u><\/a>. \u041f\u043e\u0434\u0440\u043e\u0431\u043d\u043e\u0435 \u043e\u043f\u0438\u0441\u0430\u043d\u0438\u0435 \u0434\u0430\u043d\u043d\u044b\u0445 \u043b\u0435\u0436\u0438\u0442 <a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/README.md\" rel=\"noopener noreferrer nofollow\"><u>\u0437\u0434\u0435\u0441\u044c<\/u><\/a>.\u00a0<\/p>\n<p>\u0414\u043b\u044f \u043f\u043e\u043d\u0438\u043c\u0430\u043d\u0438\u044f \u0434\u043e\u0441\u0442\u0430\u0442\u043e\u0447\u043d\u043e \u0437\u043d\u0430\u0442\u044c, \u0447\u0442\u043e \u0435\u0441\u0442\u044c \u0434\u0432\u0435 \u0446\u0435\u043b\u0435\u0432\u044b\u0435 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 \u201cbuy\u201d (\u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438), \u201ctotal profit\u201d (\u043f\u0440\u0438\u0431\u044b\u043b\u044c) \u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u044b:<\/p>\n<ol>\n<li>\n<p>T &#8212; \u0442\u0440\u0438\u0442\u043c\u0435\u043d\u0442 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0430\u044f (0 \u0438\u043b\u0438 1), \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0449\u0430\u044f \u0432\u0430\u0440\u0438\u0430\u043d\u0442 \u0446\u0435\u043d\u043e\u043e\u0431\u0440\u0430\u0437\u043e\u0432\u0430\u043d\u0438\u044f \u0410 \u0438\u043b\u0438 \u0412;<\/p>\n<\/li>\n<li>\n<p>bus_offers_count &#8212; \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u0440\u0435\u0434\u043b\u043e\u0436\u0435\u043d\u0438\u0439 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435;<\/p>\n<\/li>\n<li>\n<p>price_mean, price_min, price_max, price_std &#8212; \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0446\u0435\u043d\u044b \u0432 \u0432\u044b\u0434\u0430\u0447\u0435;<\/p>\n<\/li>\n<li>\n<p>final_rating_mean, final_rating_min, final_rating_max, final_rating_std &#8212; \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u0440\u0435\u0439\u0442\u0438\u043d\u0433\u0430 \u0432 \u0432\u044b\u0434\u0430\u0447\u0435;<\/p>\n<\/li>\n<li>\n<p>dist &#8212; \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u0435, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u0441\u0443\u0449\u0435\u0441\u0442\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u043f\u0435\u0440\u0435\u0432\u043e\u0437\u043a\u0430 (\u043a\u043c)\u00a0<\/p>\n<\/li>\n<\/ol>\n<p>\u0420\u0430\u0441\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u0432\u043b\u0438\u044f\u043d\u0438\u0435 \u0432\u0432\u0435\u0434\u0435\u043d\u0438\u044f \u043d\u0430\u0446\u0435\u043d\u043a\u0438 \u043d\u0430 \u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438 (\u201cbuy\u201d) \u0438 \u043d\u0430 \u043f\u0440\u0438\u0431\u044b\u043b\u044c (\u201ctotal_profit\u201d).<\/p>\n<p>\u0417\u0430\u0433\u0440\u0443\u0436\u0430\u0435\u043c \u0434\u0430\u043d\u043d\u044b\u0435.<\/p>\n<pre><code class=\"python\">```  import pandas as pd  df = pd.read_excel('data.xlsx')  df.head(5)  ```<\/code><\/pre>\n<p>\u0414\u043b\u044f \u043e\u0446\u0435\u043d\u043a\u0438 \u0432\u043b\u0438\u044f\u043d\u0438\u044f \u043d\u0430 \u0444\u0430\u043a\u0442 \u0441\u043e\u0432\u0435\u0440\u0448\u0435\u043d\u0438\u044f \u043f\u043e\u043a\u0443\u043f\u043a\u0438 (\u201cbuy\u201d) \u043f\u043e\u0441\u0442\u0440\u043e\u0438\u043c \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e. \u041f\u0435\u0440\u0435\u0434 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0435\u043c \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u043c, \u0441\u043e\u0431\u043b\u044e\u0434\u0430\u0435\u0442\u0441\u044f \u043b\u0438 \u0431\u0430\u043b\u0430\u043d\u0441 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442, \u0430 \u0442\u0430\u043a\u0436\u0435 \u0435\u0441\u0442\u044c \u043b\u0438 \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u044c.\u00a0<\/p>\n<p>\u0415\u0441\u043b\u0438 \u0431\u0430\u043b\u0430\u043d\u0441 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u0441\u043e\u0431\u043b\u044e\u0434\u0430\u0435\u0442\u0441\u044f, \u0442\u043e \u043c\u044b \u043c\u043e\u0436\u0435\u043c \u0441\u0434\u0435\u043b\u0430\u0442\u044c \u0432\u044b\u0432\u043e\u0434, \u0447\u0442\u043e \u0433\u0440\u0443\u043f\u043f\u044b \u043f\u043e\u0445\u043e\u0436\u0438 \u043f\u043e \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u0430\u043c \u0438 \u044d\u043a\u0441\u043f\u0435\u0440\u0438\u043c\u0435\u043d\u0442 \u043f\u0440\u043e\u0432\u0435\u0434\u0435\u043d \u201c\u0447\u0435\u0441\u0442\u043d\u043e\u201d.\u00a0<\/p>\n<pre><code class=\"python\">```      def balance_covariate(df):  \u00a0\u00a0\u00a0\u00a0    number_of_treated=len(df.query('T==1'))  \u00a0\u00a0\u00a0\u00a0    number_of_control=len(df.query('T==0'))  \u00a0\u00a0\u00a0\u00a0    covariate_table_mean=pd.DataFrame(df.groupby([\"T\"],     as_index=True).mean()).drop(columns=[\"buy\", \"total_profit\"]).T.rename(columns={0:   'mean_control', 1: 'mean_treat'}).T  \u00a0\u00a0\u00a0\u00a0    covariate_table_var=pd.DataFrame(df.groupby([\"T\"], as_index=True).var()).drop(columns=[\"buy\", \"total_profit\"]).T.rename(columns={0: 'var_control', 1: 'var_treat'}).T  \u00a0\u00a0\u00a0\u00a0    frames=[covariate_table_mean, covariate_table_var]  \u00a0\u00a0\u00a0\u00a0    result = pd.concat(frames).T  \u00a0\u00a0\u00a0    \u00a0t_stat=[]  \u00a0\u00a0\u00a0\u00a0    for i in range(0, len(result)):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    numerator=result['mean_control'][i]-result['mean_treat'][i]  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    denominator=((result['var_control'][i]\/number_of_control) + (result['var_treat'][i]\/number_of_treated))(1\/2)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    t_stat.append(numerator\/denominator)  \u00a0\u00a0\u00a0\u00a0    result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430']=t_stat  \u00a0\u00a0\u00a0\u00a0    p_value=[]  \u00a0\u00a0\u00a0\u00a0    for i in range(0, len(result)):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    if abs(result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430'][i]) &lt;= 1.645 :  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append('')  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    elif abs(result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430'][i]) &lt;= 1.96:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append('')  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    elif abs(result['t_\u0441\u0442\u0430\u0442\u0438\u0441\u0442\u0438\u043a\u0430'][i]) &lt;= 2.58:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append('')  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    else:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p_value.append(' ')  \u00a0\u00a0\u00a0\u00a0    result['\u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u044c']=p_value  \u00a0\u00a0\u00a0\u00a0    return(result.round(3))      balance_covariate(df)  ```<\/code><\/pre>\n<p><em>\u0414\u043b\u044f \u0432\u0441\u0435\u0445 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043d\u0435 \u043e\u0442\u0432\u0435\u0440\u0433\u0430\u0435\u043c \u0433\u0438\u043f\u043e\u0442\u0435\u0437\u0443 \u043e \u0440\u0430\u0432\u0435\u043d\u0441\u0442\u0432\u0435 \u0441\u0440\u0435\u0434\u043d\u0438\u0445 \u043d\u0430 1%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438, \u043a\u0440\u043e\u043c\u0435 \u043d\u0435\u0441\u043a\u043e\u043b\u044c\u043a\u0438\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u044b \u043d\u0430 5% \u0438 10%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435 \u0437\u043d\u0430\u0447\u0438\u043c\u043e\u0441\u0442\u0438. \u041f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0435\u0442\u044c \u0432 <\/em><a href=\"https:\/\/github.com\/oluscha\/methods-of-A-B-test\/blob\/main\/methods_of_a:b_testing.ipynb\" rel=\"noopener noreferrer nofollow\"><em><u>\u043d\u043e\u0443\u0442\u0431\u0443\u043a\u0435<\/u><\/em><\/a><em>.<\/em><\/p>\n<p><em>\u0421\u0442\u0440\u043e\u0438\u043c \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u0443\u044e \u043c\u0430\u0442\u0440\u0438\u0446\u0443. \u0414\u043b\u044f \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u0430 \u0430\u043d\u0430\u043b\u0438\u0437\u0430 \u0432\u044b\u0432\u0435\u0434\u0435\u043c \u0432\u0441\u0435 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043f\u043e \u043c\u043e\u0434\u0443\u043b\u044e \u0431\u043e\u043b\u044c\u0448\u0435 0,5.<\/em><\/p>\n<pre><code class=\"python\">```      import matplotlib.pyplot as plt      import seaborn as sns      dfCorr = df.drop(['ID'], axis=1).corr()      filteredDf = dfCorr[((dfCorr >= .5) | (dfCorr &lt;= -.5)) &amp; (dfCorr !=1.000)]      for column in filteredDf.columns:  \u00a0\u00a0\u00a0\u00a0    if filteredDf[column].isna().sum() == len(filteredDf):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    filteredDf=filteredDf.drop(column, axis=1)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    filteredDf=filteredDf.drop(column)      sns.heatmap(filteredDf, annot=True, vmin=-1, vmax=1, center= 0, cmap= 'coolwarm')      plt.show()  ```<\/code><\/pre>\n<figure class=\"full-width\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 1: \u041a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u043e\u043d\u043d\u0430\u044f \u043c\u0430\u0442\u0440\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u0430\u043c\u0438, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438, \u0431\u043e\u043b\u044c\u0448\u0435 0.5.<\/figcaption><\/figure>\n<p><em>\u0412 \u0434\u0430\u043d\u043d\u044b\u0445 \u043f\u0440\u0438\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u044e\u0442 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442\u044b, \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442 \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u043c\u0435\u0436\u0434\u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u043c\u0438 \u0431\u043e\u043b\u044c\u0448\u0435 0,9, \u0447\u0442\u043e \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442 \u043d\u0430\u043b\u0438\u0447\u0438\u0435 \u0432\u044b\u0441\u043e\u043a\u043e\u0439 \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0435\u043d\u0438\u0430\u0440\u043d\u043e\u0441\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 (\u041a\u0430\u0440\u0442\u0430\u0435\u0432, 2019).\u00a0<\/em><\/p>\n<p><em>\u0420\u0430\u0441\u0441\u0447\u0438\u0442\u0430\u0435\u043c VIF. \u0414\u043b\u044f \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u0430 \u0438\u043d\u0442\u0435\u0440\u043f\u0440\u0435\u0442\u0430\u0446\u0438\u0438 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u0432\u044b\u0432\u0435\u0434\u0435\u043c VIF, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u043e\u043b\u044c\u0448\u0435 10, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0433\u043e\u0432\u043e\u0440\u0438\u0442 \u043e \u043d\u0430\u043b\u0438\u0447\u0438\u0438 \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0435\u043d\u0438\u0430\u0440\u043d\u043e\u0441\u0442\u0438 \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 (\u041a\u0430\u0440\u0442\u0430\u0435\u0432, 2019).<\/em><\/p>\n<pre><code class=\"python\">```      from statsmodels.stats.outliers_influence import variance_inflation_factor      def vif(data):  \u00a0\u00a0\u00a0\u00a0    vif_data = pd.DataFrame()  \u00a0\u00a0\u00a0\u00a0    vif_data[\"feature\"] = data.columns  \u00a0\u00a0\u00a0\u00a0    vif_data[\"VIF\"] = [variance_inflation_factor(data.values, i)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    for i in range(len(data.columns))]  \u00a0\u00a0\u00a0\u00a0    return(vif_data)      vif_df=vif(df)      vif_df[vif_df[\"VIF\"]>=10]  ```<\/code><\/pre>\n<figure class=\"bordered full-width\"> 10.&#187; title=&#187;\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10.&#187; width=&#187;525&#8243; height=&#187;573&#8243; data-src=&#187;https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/131\/329\/c0d\/131329c0d8f1a3b2fca9994574aa6f12.png&#187;\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 1: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10.<\/figcaption><\/figure>\n<p><em>\u0420\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b \u0440\u0430\u0441\u0447\u0435\u0442\u0430 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u043a\u043e\u0440\u0440\u0435\u043b\u044f\u0446\u0438\u0438 \u0438 VIF \u0441\u043e\u0432\u043f\u0430\u0434\u0430\u044e\u0442: \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442 \u0432\u044b\u0441\u043e\u043a\u0430\u044f \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u044c \u043c\u0435\u0436\u0434\u0443 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u043c\u0438 price_mean, price_min, price_max; final_rating_mean, final_rating_min, final_rating_max, final_rating_std; dist. \u041d\u0435\u0443\u0434\u0438\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e, \u0442\u0430\u043a \u043a\u0430\u043a \u044d\u0442\u0438 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0435 &#8212; \u0440\u0430\u0437\u043d\u044b\u0435 \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0438 \u043e\u0434\u043d\u043e\u0439 \u0438 \u0442\u043e\u0439 \u0436\u0435 \u0432\u0435\u043b\u0438\u0447\u0438\u043d\u044b. \u0427\u0442\u043e\u0431\u044b \u0438\u0437\u0431\u0435\u0436\u0430\u0442\u044c \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u0438, \u0438\u0437 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u043f\u0435\u0440\u0435\u0447\u0438\u0441\u043b\u0435\u043d\u043d\u044b\u0445 \u0432\u044b\u0448\u0435, \u043e\u0441\u0442\u0430\u0432\u0438\u043c \u0442\u043e\u043b\u044c\u043a\u043e price_mean, final_rating_mean, final_rating_std, dist.\u00a0<\/em><\/p>\n<pre><code class=\"python\">```      df=df.drop(columns=['price_min', 'price_max', 'final_rating_min', 'final_rating_max'])      vif_df=vif(df)      vif_df[vif_df[\"VIF\"]>=10]  ```<\/code><\/pre>\n<figure class=\"\"> 10 \u043f\u043e\u0441\u043b\u0435 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442.&#187; title=&#187;\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10 \u043f\u043e\u0441\u043b\u0435 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442.&#187; width=&#187;392&#8243; height=&#187;235&#8243; data-src=&#187;https:\/\/habrastorage.org\/getpro\/habr\/upload_files\/d98\/9d0\/c5d\/d989d0c5d17d501f5e52300b2f23cb92.png&#187;\/><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 2: \u0421\u043f\u0438\u0441\u043e\u043a \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445, \u0443 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 VIF > 10 \u043f\u043e\u0441\u043b\u0435 \u0438\u0441\u043a\u043b\u044e\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442.<\/figcaption><\/figure>\n<p><em>\u041f\u043e\u0441\u043b\u0435 \u044d\u0442\u043e\u0433\u043e \u0432 \u043d\u0430\u0448\u0438\u0445 \u0434\u0430\u043d\u043d\u044b\u0445 \u0432\u0441\u0435 \u0440\u0430\u0432\u043d\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442\u0441\u044f \u043c\u0443\u043b\u044c\u0442\u0438\u043a\u043e\u043b\u043b\u0438\u043d\u0435\u0430\u0440\u043d\u043e\u0441\u0442\u044c. \u041d\u043e \u043a\u0430\u043a\u0443\u044e-\u0442\u043e \u0438\u0437 \u044d\u0442\u0438\u0445 \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u044b\u0445 \u044f \u043d\u0435 \u0431\u0443\u0434\u0443 \u0432\u044b\u0431\u0440\u0430\u0441\u044b\u0432\u0430\u0442\u044c, \u0442\u0430\u043a \u043a\u0430\u043a \u0441\u0443\u0449\u0435\u0441\u0442\u0432\u0443\u0435\u0442 \u0432\u0435\u0440\u043e\u044f\u0442\u043d\u043e\u0441\u0442\u044c \u0432\u044b\u043a\u0438\u043d\u0443\u0442\u044c \u0437\u043d\u0430\u0447\u0438\u043c\u0443\u044e \u043f\u0435\u0440\u0435\u043c\u0435\u043d\u043d\u0443\u044e, \u0447\u0442\u043e \u043f\u0440\u0438\u0432\u0435\u0434\u0435\u0442 \u043a \u0441\u043c\u0435\u0449\u0435\u043d\u0438\u044e \u043e\u0446\u0435\u043d\u043e\u043a \u0438 \u043f\u043e\u043b\u0443\u0447\u0435\u043d\u0438\u044e \u043d\u0435\u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u0445 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432.\u00a0<\/em><\/p>\n<p><em>\u041f\u0435\u0440\u0435\u0439\u0434\u0435\u043c \u043e\u0442 \u043f\u0440\u0435\u0434\u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0434\u0430\u043d\u043d\u044b\u0445 \u043a \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u044e \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438. \u041d\u043e \u043f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u0431\u043e\u043b\u044c\u0448\u043e\u0433\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0430 \u043a\u043e\u0432\u0430\u0440\u0438\u0430\u0442 \u043e\u0441\u0442\u0430\u043b\u0430\u0441\u044c (\u0443 \u043d\u0430\u0441 \u0438\u0445 34). \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u043c\u044b \u0431\u0443\u0434\u0435\u043c \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u043d\u0435 \u043f\u0440\u043e\u0441\u0442\u0443\u044e \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e, \u0430 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u0443\u044e \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u044e \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L1, L2 \u0438 elastic net \u0438 \u0441\u0440\u0430\u0432\u043d\u0438\u043c \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u044b.\u00a0<\/em><\/p>\n<p><em>\u0421\u0443\u0442\u0435\u0439\u043d\u043e: \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f &#8212; \u043c\u0435\u0442\u043e\u0434, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u0434\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u0448\u0442\u0440\u0430\u0444 \u0437\u0430 \u0441\u043b\u043e\u0436\u043d\u043e\u0441\u0442\u044c \u043c\u043e\u0434\u0435\u043b\u0438 \u043a \u043c\u0438\u043d\u0438\u043c\u0438\u0437\u0438\u0440\u0443\u0435\u043c\u043e\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u0438 \u043f\u043e\u0442\u0435\u0440\u044c, \u0442\u043e \u0435\u0441\u0442\u044c \u043c\u0435\u043d\u0435\u0435 \u0432\u0430\u0436\u043d\u044b\u043c \u0445\u0430\u0440\u0430\u043a\u0442\u0435\u0440\u0438\u0441\u0442\u0438\u043a\u0430\u043c \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f \u043f\u0440\u0438\u0434\u0430\u0435\u0442 \u043c\u0435\u043d\u044c\u0448\u0438\u0439 \u0432\u0435\u0441. \u0420\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f L1 (Lasso) \u043c\u043e\u0436\u0435\u0442 \u043a\u0430\u043a \u043e\u0431\u043d\u0443\u043b\u0438\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043d\u0435\u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u043e\u0432, \u0442\u0430\u043a \u0438 \u043f\u0440\u0438\u0434\u0430\u0442\u044c \u0438\u043c \u043c\u0435\u043d\u044c\u0448\u0438\u0439 \u0432\u0435\u0441.<\/em><\/p>\n<figure class=\"\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 2: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L1<\/figcaption><\/figure>\n<p><em>\u0412 \u0442\u043e \u0432\u0440\u0435\u043c\u044f \u043a\u0430\u043a \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f L2 (Ridge\/\u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u044f \u0422\u0438\u0445\u043e\u043d\u043e\u0432\u0430) \u043d\u0435 \u043c\u043e\u0436\u0435\u0442 \u043e\u0431\u043d\u0443\u043b\u0438\u0442\u044c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u044f \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u043e\u0432, \u043d\u043e \u043c\u043e\u0436\u0435\u0442 \u043f\u0440\u0438\u0434\u0430\u0442\u044c \u0438\u043c \u043c\u0435\u043d\u044c\u0448\u0438\u0439 \u0432\u0435\u0441.\u00a0<\/em><\/p>\n<figure class=\"\"><figcaption>\u0420\u0438\u0441\u0443\u043d\u043e\u043a 3: \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043f\u043e\u0442\u0435\u0440\u044c \u0432 \u043c\u043e\u0434\u0435\u043b\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 L2<\/figcaption><\/figure>\n<p><em>Elastic net &#8212; \u043e\u0431\u044a\u0435\u0434\u0438\u043d\u0435\u043d\u0438\u0435 \u043f\u043e\u0434\u0445\u043e\u0434\u043e\u0432 L1 \u0438 L2 &#8212; \u0442\u0435 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u044b\u043b\u0438 \u0437\u0430\u043d\u0443\u043b\u0435\u043d\u044b \u043f\u0440\u0438 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0438 L1, \u0432 elastic net \u0431\u0443\u0434\u0443\u0442 \u0438\u043c\u0435\u0442\u044c \u043c\u0435\u043d\u044c\u0448\u0438\u0435 \u0432\u0435\u0441\u0430, \u0447\u0435\u043c \u043f\u0440\u0438 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0438 L2.\u00a0<\/em><\/p>\n<p><em>\u0414\u043b\u044f \u0443\u0434\u043e\u0431\u0441\u0442\u0432\u0430 \u0438\u043d\u0442\u0435\u0440\u043f\u0440\u0435\u0442\u0430\u0446\u0438\u0438 \u0432\u044b\u0432\u0435\u0434\u0435\u043c \u0442\u0430\u0431\u043b\u0438\u0446\u0443 \u0441\u043e \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435\u043c \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0445 \u043a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u043e\u0432.\u00a0<\/em><\/p>\n<pre><code class=\"python\">```      import numpy as np      from sklearn.metrics import accuracy_score      from sklearn.model_selection import train_test_split      from sklearn.linear_model import LogisticRegression      from scipy.stats import norm      def building_logistic_regression(df):  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    def logreg_coef(logreg):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef=[]  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef_list=logreg.coef_.tolist()[0]  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef.append(logreg.intercept_)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    for i in range(0, len(coef_list)):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coef.append(coef_list[i])  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    return(coef)  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    def logit_p1value(model, x):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    \u00a0p1 = model.predict_proba(x)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    n1 = len(p1)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    m1 = len(model.coef_[0]) + 1  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    coefs = np.concatenate([model.intercept_, model.coef_[0]])  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    x_full = np.matrix(np.insert(np.array(x), 0, 1, axis = 1))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    answ = np.zeros((m1, m1))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    for i in range(n1):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    answ = answ + np.dot(np.transpose(x_full[i, :].astype(float)), x_full[i, :].astype(float)) * float(p1[i,1]) * float(p1[i, 0])  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    vcov = np.linalg.inv(np.matrix(answ))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    se = np.sqrt(np.diag(vcov))  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    t1 =\u00a0 coefs\/se\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    p1 = (1 - norm.cdf(abs(t1))) * 2  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    return p1  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    def confidence(x):  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    return ('' if x &lt;= 0.01 else ('**' if x &lt;= 0.05 else ('*' if x&lt;= 0.1 else ' ')))  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    covariates=(df.columns.drop(['total_profit', 'buy']).to_list())  \u00a0\u00a0\u00a0\u00a0    X=df[covariates]  \u00a0\u00a0\u00a0\u00a0    y=np.ravel(df['buy'])  \u00a0\u00a0\u00a0\u00a0    result_logistic_dict={'covariates': ['intercept'] + covariates}  \u00a0\u00a0\u00a0\u00a0    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=21)  \u00a0\u00a0\u00a0\u00a0    methods=['l1', 'l2', 'elasticnet']  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    conf=np.vectorize(confidence)  \u00a0\u00a0\u00a0\u00a0  \u00a0\u00a0\u00a0\u00a0    for method in methods:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    if method== 'elasticnet':  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    logreg = LogisticRegression(penalty=method, solver='saga', n_jobs=-1, multi_class='ovr', max_iter=10000, l1_ratio=0.5)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    else:  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    logreg = LogisticRegression(penalty=method, solver='saga', n_jobs=-1, multi_class='ovr', max_iter=10000)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    logreg.fit(X_train, y_train)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    result_logistic_dict[method]=logreg_coef(logreg)  \u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0\u00a0    result_logistic_dict[method + str('_confidence')]=conf(logit_p1value(logreg_l1, X))  \u00a0\u00a0\u00a0\u00a0    res=pd.DataFrame(result_logistic_dict)  \u00a0\u00a0\u00a0\u00a0    return(res)      results = building_logistic_regression(df)      results[results[\"l1_confidence\"] != ' ']  ```<\/code><\/pre>\n<figure class=\"full-width\"><figcaption>\u0422\u0430\u0431\u043b\u0438\u0446\u0430 3: \u041a\u043e\u044d\u0444\u0444\u0438\u0446\u0438\u0435\u043d\u0442\u044b, \u0437\u043d\u0430\u0447\u0438\u043c\u044b\u0435 \u043d\u0430 1%-\u043d\u043e\u043c \u0443\u0440\u043e\u0432\u043d\u0435, \u043f\u0440\u0438 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d\u0438\u0438 \u043b\u043e\u0433\u0438\u0441\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0439 \u0440\u0435\u0433\u0440\u0435\u0441\u0441\u0438\u0438 \u0441 \u0440\u0435\u0433\u0443\u043b\u044f\u0440\u0438\u0437\u0430\u0446\u0438\u0435\u0439 l1, l2 \u0438 elastic net.<\/figcaption><\/figure>\n<p>\u041a\u043e\u044d\u0444\u0444\u0438\u0446<\/p>\n<\/div>\n<\/div>\n<\/div>\n<\/div>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-343444","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/343444","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=343444"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/343444\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=343444"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=343444"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=343444"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}