{"id":468876,"date":"2025-07-28T15:01:35","date_gmt":"2025-07-28T15:01:35","guid":{"rendered":"http:\/\/savepearlharbor.com\/?p=468876"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=468876","title":{"rendered":"<span>\u0418\u0437 Excel \u0432 SQL. \u0418\u043c\u0435\u0435\u0442 \u043c\u0435\u0441\u0442\u043e \u0431\u044b\u0442\u044c?<\/span>"},"content":{"rendered":"<div><!--[--><!--]--><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u042d\u0442\u0430 \u0441\u0442\u0430\u0442\u044c\u044f, \u0441\u043a\u043e\u0440\u0435\u0435 \u0434\u043b\u044f \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u043b\u0435\u043d\u0438\u044f \u0438 \u0445\u043e\u0442\u0435\u043b\u043e\u0441\u044c \u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0441\u043e\u0432\u0435\u0442\u044b \u043f\u043e \u0434\u0430\u043d\u043d\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u0435.<br \/>\u0418\u0442\u0430\u043a,  Excel-\u0444\u0430\u0439\u043b \u0432\u0435\u0441\u0438\u0442 500+ \u043c\u0435\u0433\u0430\u0431\u0430\u0439\u0442, \u0441\u043e\u0441\u0442\u043e\u0438\u0442 \u0438\u0437 \u0441\u043e\u0442\u0435\u043d \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a, \u0434\u0435\u0441\u044f\u0442\u043a\u043e\u0432 \u043b\u0438\u0441\u0442\u043e\u0432 \u0438 \u0444\u043e\u0440\u043c\u0443\u043b, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u00ab\u043f\u0440\u043e\u0442\u044f\u0433\u0438\u0432\u0430\u044e\u0442\u0441\u044f\u00bb \u043f\u043e 30+ \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u043c \u2014 \u044d\u0442\u043e \u043d\u0435 \u0440\u0430\u0431\u043e\u0442\u0430, \u0430 \u0441\u0442\u0440\u0430\u0434\u0430\u043d\u0438\u0435. \u0418\u043c\u0435\u043d\u043d\u043e \u0441 \u0442\u0430\u043a\u0438\u043c \u00ab\u043c\u043e\u043d\u0441\u0442\u0440\u043e\u043c\u00bb \u044f \u0441\u0442\u043e\u043b\u043a\u043d\u0443\u043b\u0441\u044f, \u043a\u043e\u0433\u0434\u0430 \u0432 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438 \u0441\u043e\u0431\u0440\u0430\u043b\u0438\u0441\u044c \u0434\u0430\u043d\u043d\u044b\u0435 \u0438\u0437 \u0440\u0430\u0437\u043d\u044b\u0445 \u043e\u0442\u0434\u0435\u043b\u043e\u0432 \u0432 \u043e\u0434\u0438\u043d \u0444\u0430\u0439\u043b. <\/p>\n<p>\u0412\u043a\u0440\u0430\u0442\u0446\u0435 \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0444\u0430\u0439\u043b\u0430 &#8212; \u041b\u0438\u0441\u0442 &#171;\u041c\u0430\u0441\u0441\u0438\u0432&#187; (Data_Lake &#8212; \u0432 \u043b\u0435\u0432\u043e\u0439 \u0447\u0430\u0441\u0442\u0438 34 \u0441\u0442\u043e\u043b\u0431\u0446\u0430 \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u0438\u0441\u0442\u044b \u0438 \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u0442\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0444\u043e\u0440\u043c\u0443\u043b\u044b \u0438 \u043f\u0440\u0430\u0432\u0430\u044f \u0447\u0430\u0441\u0442\u044c \u0441 46 \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u043c\u0438, \u043a\u0443\u0434\u0430 \u043f\u043e\u0434\u0442\u044f\u0433\u0438\u0432\u0430\u044e\u0442\u0441\u044f \u0441\u044b\u0440\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435, \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c\u0438 \u0431\u0443\u0434\u0435\u0442 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u044c\u0441\u044f \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0430). \u0418 \u043c\u043d\u043e\u0436\u0435\u0441\u0442\u0432\u043e\u043c \u043b\u0438\u0441\u0442\u043e\u0432 \u0441\u043e \u0441\u043f\u0440\u0430\u0432\u043e\u0447\u043d\u0438\u043a\u0430\u043c\u0438, \u043f\u0440\u0430\u0432\u043a\u0430\u043c\u0438. <\/p>\n<p>\u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u044d\u0442\u043e\u0433\u043e Excel-\u0444\u0430\u0439\u043b\u0430 \u0437\u0430\u043d\u0438\u043c\u0430\u0435\u0442 10 \u043c\u0438\u043d\u0443\u0442, \u0430 \u0435\u0441\u043b\u0438 \u043e\u0431\u043d\u043e\u0432\u0438\u0442\u044c \u0445\u043e\u0442\u044f \u0431\u044b \u0447\u0430\u0441\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b \u2014 \u043c\u043e\u0436\u043d\u043e \u0438\u0434\u0442\u0438 \u043f\u0438\u0442\u044c \u0447\u0430\u0439. \u0420\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 \u0442\u0430\u043a\u0438\u043c\u0438 \u0434\u0430\u043d\u043d\u044b\u043c\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u043d\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e, \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0435\u0441\u043b\u0438 \u0442\u0435\u0431\u0435 \u043d\u0443\u0436\u043d\u043e \u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0438\u0445, \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u043e\u0442\u0447\u0451\u0442\u044b \u0438\u043b\u0438 \u0433\u043e\u0442\u043e\u0432\u0438\u0442\u044c \u0432\u044b\u0433\u0440\u0443\u0437\u043a\u0438.  \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u0440\u0435\u0448\u0438\u043b \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u0432\u0441\u0435 \u043f\u0435\u0440\u0435\u0432\u0435\u0441\u0442\u0438 \u043d\u0430 PostgreSQL. <br \/>\u0414\u043b\u044f \u044d\u0442\u043e\u0433\u043e \u0432\u0441\u0435\u0433\u043e \u043b\u0438\u0448\u044c \u0442\u0440\u0435\u0431\u043e\u0432\u0430\u043b\u043e\u0441\u044c \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u0430\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b\u044b \u0441 Excel \u043d\u0430 SQL. \u0425\u043e\u0440\u043e\u0448\u043e, \u0447\u0442\u043e \u0431\u043e\u043b\u044c\u0448\u0438\u043d\u0441\u0442\u0432\u043e \u0444\u043e\u0440\u043c\u0443\u043b \u044d\u0442\u043e \u0443\u0441\u043b\u043e\u0432\u0438\u044f \u0415\u0421\u041b\u0418, \u0418\u041b\u0418.    <\/p>\n<p>\u0412\u043e\u0442 \u0441\u0430\u043c\u0430\u044f \u043f\u0440\u043e\u0441\u0442\u0430\u044f \u0444\u043e\u0440\u043c\u0443\u043b\u0430:    <\/p>\n<pre><code>\u00ab=\u0412\u041f\u0420(AN228087&amp;\"-\"&amp;AX228087;'\u041c\u044d\u043f\u043f\u0438\u043d\u0433'!A:E;4;\u041b\u041e\u0416\u042c)\u00bb<\/code><\/pre>\n<p>\u0418 \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0430\u044f \u0435\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043d\u0430 SQL:    <\/p>\n<pre><code class=\"sql\">CREATE OR REPLACE FUNCTION statia_po_shety() RETURNS void AS $$ BEGIN   WITH data AS (     SELECT       m.\"id\",       ms.\"\u0421\u0442\u0430\u0442\u044c\u044f\" AS \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\"     FROM \"\u041c\u0430\u0441\u0441\u0438\u0432\" m     LEFT JOIN \"cvi\" cvi ON m.\"id\" = cvi.\"id\"     LEFT JOIN \"\u041c\u044d\u043f\u043f\u0438\u043d\u0433 \u0441\u0447\u0435\u0442\u043e\u0432\" ms       ON ms.\"\u041e\u0411\u042a\u0415\u0414\" = COALESCE(cvi.\"\u0421\u0447\u0435\u0442 \u0414\u0442\", '') || '-' || COALESCE(cvi.\"\u0421\u0447\u0435\u0442 \u041a\u0442\", '')   )   UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" m   SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\" = d.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\"   FROM data d   WHERE m.\"id\" = d.\"id\"; END; $$ LANGUAGE plpgsql; <\/code><\/pre>\n<p> \u042d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u0435\u0442\u0441\u044f \u043f\u043e \u0442\u0440\u0438\u0433\u0433\u0435\u0440\u0443, \u043a\u043e\u0433\u0434\u0430 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u0432\u0441\u0442\u0430\u0432\u043a\u0430 \u0438\u043b\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043e\u0434\u043d\u043e\u0439 \u0441\u0442\u0440\u043e\u043a\u0438, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0442\u044c \u0432\u0435\u0441\u044c \u043c\u0430\u0441\u0441\u0438\u0432 \u0434\u0430\u043d\u043d\u044b\u0445.  <\/p>\n<h4>\u0410 \u0432\u043e\u0442 \u0438 \u00ab\u043c\u043e\u043d\u0441\u0442\u0440\u00bb \u0438\u0437 Excel<\/h4>\n<p>\u042d\u0442\u043e \u043b\u0438\u0448\u044c \u0447\u0430\u0441\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b\u044b, \u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u0432\u044b \u043f\u043e\u043d\u0438\u043c\u0430\u043b\u0438 \u043c\u0430\u0441\u0448\u0442\u0430\u0431:<\/p>\n<pre><code>=\u0415\u0421\u041b\u0418(\u0415\u0421\u041d\u0414(\u0412\u041f\u0420(AL228133;'\u041c\u044d\u043f\u043f\u0438\u043d\u0433 \u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0442\u043e\u0440'!$A:$C;2;\u041b\u041e\u0416\u042c); \u0415\u0421\u041d\u0414(\u0412\u041f\u0420($A228133;'\u041f\u0440\u0430\u0432\u043a\u0438 \u0411\u0423'!A:Q;\u041f\u041e\u0418\u0421\u041a\u041f\u041e\u0417(K$1;'\u041f\u0440\u0430\u0432\u043a\u0438 \u0411\u0423'!$A$1:$Q$1;0);\u041b\u041e\u0416\u042c); \u0415\u0421\u041b\u0418(\u0418\u041b\u0418(\u0415\u0421\u041d\u0414(M228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(N228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(O228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(R228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(S228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\");\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0438 \u0442.\u0434.<\/code><\/pre>\n<p> \u041f\u043e\u043b\u043d\u0430\u044f \u0444\u043e\u0440\u043c\u0443\u043b\u0430 \u0437\u0430\u043d\u0438\u043c\u0430\u0435\u0442 \u0434\u0435\u0441\u044f\u0442\u043a\u0438 \u0441\u0442\u0440\u043e\u043a \u0438 \u043a\u043e\u043c\u0431\u0438\u043d\u0438\u0440\u0443\u0435\u0442 <code>\u0415\u0421\u041b\u0418<\/code>, <code>\u0412\u041f\u0420<\/code>, <code>\u0418\u041b\u0418<\/code>, <code>\u041f\u0421\u0422\u0420<\/code>, <code>\u0415\u041f\u0423\u0421\u0422\u041e<\/code> \u0438 \u043f\u0440\u043e\u0447\u0438\u0435 \u00ab\u043f\u0440\u0435\u043b\u0435\u0441\u0442\u0438\u00bb Excel. \u041f\u0440\u043e\u0442\u044f\u0436\u043a\u0430 \u043f\u043e 300 000 \u0441\u0442\u0440\u043e\u043a \u0434\u0435\u043b\u0430\u0435\u0442 \u0442\u0430\u043a\u043e\u0439 \u0440\u0430\u0441\u0447\u0451\u0442 \u0430\u0431\u0441\u043e\u043b\u044e\u0442\u043d\u043e \u043d\u0435\u0440\u0430\u0431\u043e\u0447\u0438\u043c.  <\/p>\n<p><strong>\u041a\u0430\u043a  \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u0430\u043b \u044d\u0442\u043e \u0432 PostgreSQL  <\/strong><\/p>\n<p>\u0421\u043e\u0437\u0434\u0430\u043d\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f <code>update_statya_uu()<\/code>, \u043a\u043e\u0442\u043e\u0440\u0430\u044f:<\/p>\n<ul>\n<li>\n<p>\u041e\u0431\u044a\u0435\u0434\u0438\u043d\u044f\u0435\u0442 \u0432\u0441\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0432\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u043d\u0443\u044e \u0442\u0430\u0431\u043b\u0438\u0446\u0443 <code>temp_agg<\/code><\/p>\n<\/li>\n<li>\n<p>\u041f\u043e\u043e\u0447\u0435\u0440\u0451\u0434\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u0435\u0442 \u043b\u043e\u0433\u0438\u043a\u0443 <code>IF...THEN<\/code>, \u0430\u043d\u0430\u043b\u043e\u0433\u0438\u0447\u043d\u0443\u044e <code>\u0415\u0421\u041b\u0418<\/code> \u0438 <code>\u0412\u041f\u0420<\/code> \u0432 Excel<\/p>\n<\/li>\n<li>\n<p>\u0412\u044b\u043f\u043e\u043b\u043d\u044f\u0435\u0442 \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u0438 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438<\/p>\n<p>\u041f\u0440\u0438\u043c\u0435\u0440 \u0444\u0440\u0430\u0433\u043c\u0435\u043d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u0438:<\/p>\n<\/li>\n<\/ul>\n<pre><code class=\"sql\">CREATE OR REPLACE FUNCTION update_statya_uu() RETURNS void AS $$ DECLARE     rec RECORD;     result_text TEXT; BEGIN          CREATE TEMP TABLE temp_agg AS SELECT     m.*,     c.\"\u0414\u043e\u043a\u0443\u043c\u0435\u043d\u0442\" AS cvi_document,     c.\"\u041e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u044f\" AS cvi_organization,     c.\"\u0422\u0438\u043f \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430.1\" AS cvi_tip_dok_1,     m.\"\u0422\u0438\u043f \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\" AS m_tip_dok,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e \u041a\u0442\" AS cvi_subkonto_kt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e2 \u041a\u0442\" AS cvi_subkonto2_kt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e3 \u041a\u0442\" AS cvi_subkonto3_kt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e1 \u0414\u0442\" AS cvi_subkonto1_dt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e2 \u0414\u0442\" AS cvi_subkonto2_dt,     c.\"\u0421\u0447\u0435\u0442 \u041a\u0442\" AS cvi_schet_kt,     c.\"\u0421\u0447\u0435\u0442 \u0414\u0442\" AS cvi_schet_dt FROM \"\u041c\u0430\u0441\u0441\u0438\u0432\" m LEFT JOIN \"cvi\" c ON m.id = c.id;       -- \u041f\u0440\u043e\u0445\u043e\u0434\u0438\u043c \u043f\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 \u043f\u043e \u043e\u0434\u043d\u043e\u0439 \u0437\u0430\u043f\u0438\u0441\u0438 \u0438 \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u0434\u043b\u044f \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\"     FOR rec IN SELECT * FROM temp_agg LOOP         \u0440         SELECT \"\u0421\u0442\u0430\u0442\u044c\u0438 \u0437\u0430\u0442\u0440\u0430\u0442 \u0423\u0423\" INTO result_text         FROM \"\u041c\u044d\u043f\u043f\u0438\u043d\u0433 \u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0442\u043e\u0440\"         WHERE \"\u0420\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0442\u043e\u0440\" = rec.cvi_document         LIMIT 1;          IF FOUND THEN                          UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" = result_text WHERE id = rec.id;             CONTINUE;         END IF;                  SELECT \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" INTO result_text         FROM \"\u041f\u0440\u0430\u0432\u043a\u0438 \u0411\u0423\"         WHERE \"\u0414\u043e\u043a\u0443\u043c\u0435\u043d\u0442 \u0411\u0423 \u041a\u043b\u044e\u0447\" = rec.\"Key\"         LIMIT 1;          IF FOUND THEN             UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" = result_text WHERE id = rec.id;             CONTINUE;         END IF;                   IF rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0437\u0430\u0442\u0440\u0430\u0442\u0435\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0437\u0430\u043f\u0447\u0430\u0441\u0442\u044f\u043c\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u041d\u0413\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u043f\u043e \u0422\u0438\u043f \u0434\u043e\u043a.\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' THEN             UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' WHERE id = rec.id;             CONTINUE;         END IF;<\/code><\/pre>\n<p>\u041b\u043e\u0433\u0438\u043a\u0430 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u0430\u044f: \u043e\u0442 \u043f\u0440\u0438\u043e\u0440\u0438\u0442\u0435\u0442\u043d\u044b\u0445 \u043f\u0440\u0430\u0432\u0438\u043b \u043a \u0431\u043e\u043b\u0435\u0435 \u043e\u0431\u0449\u0438\u043c, \u0441 \u043f\u0440\u043e\u0432\u0435\u0440\u043a\u043e\u0439 \u0443\u0441\u043b\u043e\u0432\u0438\u0439, \u043f\u043e\u0445\u043e\u0436\u0438\u0445 \u043d\u0430 Excel-\u0444\u043e\u0440\u043c\u0443\u043b\u044b.<\/p>\n<h4>\u041f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c<\/h4>\n<ul>\n<li>\n<p>\ud83d\udd04 \u041e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0430 300 000 \u0441\u0442\u0440\u043e\u043a: <strong>~2 \u043c\u0438\u043d\u0443\u0442\u044b<\/strong><\/p>\n<\/li>\n<li>\n<p>\ud83d\udcc9 \u0412\u0440\u0435\u043c\u044f \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f \u0441\u043e\u043a\u0440\u0430\u0442\u0438\u043b\u043e\u0441\u044c <strong>\u0432 10 \u0440\u0430\u0437<\/strong><\/p>\n<\/li>\n<li>\n<p>\u26d3 \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043f\u043e <strong>\u0442\u0440\u0438\u0433\u0433\u0435\u0440\u0443<\/strong> \u0434\u043b\u044f \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u0441\u0442\u0440\u043e\u043a<\/p>\n<\/li>\n<\/ul>\n<p>\u0412 \u043a\u043e\u043d\u0435\u0447\u043d\u043e \u0438\u0442\u043e\u0433\u0435, \u0440\u0430\u0431\u043e\u0442\u0430 \u043f\u043e \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0443 \u0437\u0430\u043d\u044f\u043b\u0430 \u043f\u0430\u0440\u0443 \u043d\u0435\u0434\u0435\u043b\u044c \u0438 \u0432\u043e\u0442 \u0447\u0430\u0441\u0442\u044c \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u044b:<\/p>\n<figure class=\"full-width\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/637\/7b1\/850\/6377b1850016c292ff3975508a811056.png\" alt=\"\u0434\u0430, \u043c\u0430\u0441\u0448\u0442\u0430\u0431 \u0436\u0435\u043b\u0430\u0435\u0442 \u0431\u044b\u0442\u044c \u043b\u0443\u0447\u0448\u0435, \u043d\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u043e \u0432\u0438\u0434\u043d\u043e \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0442\u0430\u0431\u043b\u0438\u0446. (\u0412\u0441\u0435 \u0438\u043c\u0435\u044e\u0442 \u0441\u0432\u044f\u0437\u044c 1 \u043a 1)\" title=\"\u0434\u0430, \u043c\u0430\u0441\u0448\u0442\u0430\u0431 \u0436\u0435\u043b\u0430\u0435\u0442 \u0431\u044b\u0442\u044c \u043b\u0443\u0447\u0448\u0435, \u043d\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u043e \u0432\u0438\u0434\u043d\u043e \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0442\u0430\u0431\u043b\u0438\u0446. (\u0412\u0441\u0435 \u0438\u043c\u0435\u044e\u0442 \u0441\u0432\u044f\u0437\u044c 1 \u043a 1)\" width=\"2618\" height=\"1575\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/637\/7b1\/850\/6377b1850016c292ff3975508a811056.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/637\/7b1\/850\/6377b1850016c292ff3975508a811056.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0434\u0430, \u043c\u0430\u0441\u0448\u0442\u0430\u0431 \u0436\u0435\u043b\u0430\u0435\u0442 \u0431\u044b\u0442\u044c \u043b\u0443\u0447\u0448\u0435, \u043d\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u043e \u0432\u0438\u0434\u043d\u043e \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0442\u0430\u0431\u043b\u0438\u0446. (\u0412\u0441\u0435 \u0438\u043c\u0435\u044e\u0442 \u0441\u0432\u044f\u0437\u044c 1 \u043a 1)<\/figcaption><\/div>\n<\/figure>\n<p>\u0418 \u043d\u0430 \u0432\u0441\u0435 \u0441\u0442\u043e\u043b\u0431\u0446\u044b, \u0432\u0441\u0435\u0445 \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u0443 \u043d\u0430\u0441 57 \u0442\u0440\u0438\u0433\u0433\u0435\u0440\u043e\u0432<\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/3b9\/422\/733\/3b94227339b9dbdac5f4c40386ec73c9.png\" width=\"223\" height=\"43\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/3b9\/422\/733\/3b94227339b9dbdac5f4c40386ec73c9.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/3b9\/422\/733\/3b94227339b9dbdac5f4c40386ec73c9.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/figure>\n<p>\u041d\u043e \u043f\u0435\u0440\u0435\u043d\u0435\u0441\u0442\u0438 \u044d\u0442\u043e\u0442 \u043c\u0430\u0441\u0441\u0438\u0432 \u0431\u044b\u043b\u043e \u043f\u043e\u043b\u0431\u0435\u0434\u044b. \u0418\u0437-\u0437\u0430 \u0441\u043f\u0435\u0446\u0438\u0444\u0438\u043a\u0438, \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u0438\u0441\u0442\u0430\u043c \u043d\u0430\u0434\u043e \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0442\u044c 300 \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a \u043a\u0430\u0436\u0434\u044b\u0439 \u0434\u0435\u043d\u044c. \u0418 \u0442\u0443\u0442 \u0432\u0441\u0442\u0443\u043f\u0438\u043b \u0432 \u0434\u0435\u043b\u043e Python. <\/p>\n<p> <strong>\u041e\u0431\u0449\u0430\u044f \u0441\u0445\u0435\u043c\u0430 ETL-\u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430:<\/strong><\/p>\n<blockquote>\n<p>Excel (.xlsx) \u2192 DataFrame \u2192 Pickle \u2192 PostgreSQL (\u0442\u0430\u0431\u043b\u0438\u0446\u044b cvi, \u041c\u0430\u0441\u0441\u0438\u0432) \u2192 JOIN \u2192 Data_Lake \u2192 \u041f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u0442\u0438\u043f\u043e\u0432<\/p>\n<\/blockquote>\n<h4>1. \u041f\u0440\u0435\u0434\u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0430: \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0435\u043c Excel \u2192 DataFrame<\/h4>\n<pre><code class=\"python\">df = pd.read_excel(excel_file_path) df.to_pickle(pickle_file_path)<\/code><\/pre>\n<p>    \u041a\u0430\u043a \u043f\u043e\u043a\u0430\u0437\u0430\u043b\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0430 .pkl \u0447\u0438\u0442\u0430\u0435\u0442\u0441\u044f \u0431\u044b\u0441\u0442\u0440\u0435\u0435<\/p>\n<p>\u041e\u0431\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0435\u043c \u0441\u0442\u043e\u043b\u0431\u0435\u0446 <code>\"\u0414\u0430\u0442\u0430\"<\/code> \u2014 Excel \u0447\u0430\u0441\u0442\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442 \u0434\u0430\u0442\u044b \u0432 \u0432\u0438\u0434\u0435 \u0447\u0438\u0441\u0435\u043b, \u0438 \u044d\u0442\u043e \u043d\u0430\u0434\u043e \u0438\u0441\u043f\u0440\u0430\u0432\u0438\u0442\u044c:  <\/p>\n<pre><code class=\"python\">df['\u0414\u0430\u0442\u0430'] = pd.to_datetime('1899-12-30') + pd.to_timedelta(df['\u0414\u0430\u0442\u0430'], unit='D')<\/code><\/pre>\n<p> <strong>2. \u041f\u043e\u0434\u0433\u043e\u0442\u043e\u0432\u043a\u0430 \u0431\u0430\u0437\u044b: \u0441\u043e\u0437\u0434\u0430\u0451\u043c \u0441\u0445\u0435\u043c\u0443 \u0438 \u0442\u0430\u0431\u043b\u0438\u0446\u0443  <\/strong><\/p>\n<pre><code>CREATE SCHEMA IF NOT EXISTS \"public\"; CREATE TABLE IF NOT EXISTS \"cvi\" (...);<\/code><\/pre>\n<p>*cvi &#8212; \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u043a\u0443\u0434\u0430 \u043f\u043e\u0441\u0442\u0443\u043f\u0430\u044e\u0442 \u0441\u044b\u0440\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435  (\u043f\u0440\u0430\u0432\u0430\u044f \u0447\u0430\u0441\u0442\u044c Data_Lake)<\/p>\n<p>\u041f\u043e\u043b\u044f \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043f\u0440\u0438\u0432\u043e\u0434\u044f\u0442\u0441\u044f \u043a <code>varchar(255)<\/code>, \u0430 \u0434\u0430\u0442\u044b \u2014 \u043a <code>date<\/code>. \u0415\u0441\u043b\u0438 \u043d\u0443\u0436\u0435\u043d \u0431\u043e\u043b\u0435\u0435 \u0442\u043e\u0447\u043d\u044b\u0439 \u0442\u0438\u043f \u2014 \u043c\u043e\u0436\u043d\u043e \u043b\u0435\u0433\u043a\u043e \u0430\u0434\u0430\u043f\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c.<\/p>\n<p> <strong>3. \u041e\u0447\u0438\u0441\u0442\u043a\u0430 \u0442\u0430\u0431\u043b\u0438\u0446 \u043f\u0435\u0440\u0435\u0434 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u043e\u0439  <\/strong><\/p>\n<pre><code>TRUNCATE TABLE \"\u041c\u0430\u0441\u0441\u0438\u0432\" RESTART IDENTITY CASCADE; TRUNCATE TABLE \"cvi\" RESTART IDENTITY CASCADE;<\/code><\/pre>\n<p>*\u041c\u0430\u0441\u0441\u0438\u0432 &#8212; \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0441 cvi (\u043b\u0435\u0432\u0430\u044f \u0447\u0430\u0441\u0442\u044c Data_Lake)<\/p>\n<p> \u042d\u0442\u043e \u043d\u0443\u0436\u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u0438\u0437\u0431\u0435\u0436\u0430\u0442\u044c \u0434\u0443\u0431\u043b\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f, \u0442.\u043a. \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0432\u0441\u0451.  <\/p>\n<p><strong> 4. \u041f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u0430\u044f \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0432 PostgreSQL<\/strong>  <\/p>\n<p>CSV \u0438\u043b\u0438 bulk-\u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u043f\u043e\u0434\u043e\u0448\u043b\u0438 \u0431\u044b, \u043d\u043e \u043c\u044b \u0432\u044b\u0431\u0440\u0430\u043b\u0438 <code>psycopg2 + executemany<\/code> \u0441 \u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u043e\u0439 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u043e\u0439 \u0447\u0430\u043d\u043a\u043e\u0432:  <\/p>\n<pre><code class=\"python\">chunk_size = 6000 max_workers = 8<\/code><\/pre>\n<p> \u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0447\u0430\u043d\u043a\u0430 \u2014 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0439 \u043f\u043e\u0442\u043e\u043a:  <\/p>\n<pre><code class=\"python\">with ThreadPoolExecutor(max_workers=max_workers) as executor:     futures = [executor.submit(load_chunk, chunk) for chunk in chunks]<\/code><\/pre>\n<p>\u0414\u0430\u043b\u044c\u0448\u0435 \u0441\u043e\u0437\u0434\u0430\u0435\u0442\u0441\u044f \u0432\u0438\u0442\u0440\u0438\u043d\u0430 Data_Lake (\u0432\u0438\u0442\u0440\u0438\u043d\u0430):<\/p>\n<pre><code class=\"sql\">CREATE TABLE \"Data_Lake\" AS SELECT m.*, c.* FROM \"\u041c\u0430\u0441\u0441\u0438\u0432\" m JOIN \"cvi\" c ON m.id = c.id;<\/code><\/pre>\n<p>\u0418 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0441\u044f \u043f\u0435\u0440\u0435\u0432\u043e\u0434 \u0432 \u043d\u0443\u0436\u043d\u044b\u0439 \u0444\u043e\u0440\u043c\u0430\u0442 \u0434\u0430\u043d\u043d\u044b\u0445 (\u0438\u0437 text \u0432  numeric(12,2)), \u0435\u0441\u043b\u0438 \u043d\u0430\u0434\u043e.<br \/>\u0412 \u043a\u043e\u043d\u0435\u0447\u043d\u043e \u0438\u0442\u043e\u0433\u0435 \u0441 \u043c\u043e\u043c\u0435\u043d\u0442\u0430 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u0441\u044b\u0440\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0435 (300 \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a, \u0432 46 \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u0445) \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0443 cvi, \u0441\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u043d\u0438\u0435\u043c \u0442\u0440\u0438\u0433\u0433\u0435\u0440\u043e\u0432 \u0438 \u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0432\u0438\u0442\u0440\u0438\u043d\u044b \u0434\u0430\u043d\u043d\u044b\u0445 (Data_Lake \u0441 78 \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u043c\u0438 \u0432 300 \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a) \u0437\u0430\u043d\u044f\u043b\u043e \u0443 \u043c\u0435\u043d\u044f:<\/p>\n<figure class=\"\"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/280\/395\/559\/280395559684f78672b2924ad60429a5.png\" alt=\"\u0447\u0442\u043e \u0440\u0430\u0432\u043d\u044f\u0435\u0442\u0441\u044f 7,49 \u0441\u0435\u043a\u0443\u043d\u0434\" title=\"\u0447\u0442\u043e \u0440\u0430\u0432\u043d\u044f\u0435\u0442\u0441\u044f 7,49 \u0441\u0435\u043a\u0443\u043d\u0434\" width=\"291\" height=\"36\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/280\/395\/559\/280395559684f78672b2924ad60429a5.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/280\/395\/559\/280395559684f78672b2924ad60429a5.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0447\u0442\u043e \u0440\u0430\u0432\u043d\u044f\u0435\u0442\u0441\u044f 7,49 \u0441\u0435\u043a\u0443\u043d\u0434<\/figcaption><\/div>\n<\/figure>\n<p>\u0414\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e:<\/p>\n<ul>\n<li>\n<p>\u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u0435\u0449\u0435 \u0441\u0432\u044f\u0437\u0438<\/p>\n<\/li>\n<li>\n<p>ETL \u0440\u0435\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u0442\u044c \u0432  Apache Airflow  <\/p>\n<\/li>\n<li>\n<p>\u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0432\u0435\u0431-\u0438\u043d\u0442\u0435\u0440\u0444\u0435\u0439\u0441 \u0434\u043b\u044f \u0434\u0430\u0448\u0431\u043e\u0440\u0434\u0430<\/p>\n<\/li>\n<\/ul>\n<p>\u0412\u0440\u043e\u0434\u0435 \u043d\u0430 \u044d\u0442\u043e\u043c \u0432\u0441\u0435. \u0415\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0431\u0443\u0434\u0443 \u0431\u043b\u0430\u0433\u043e\u0434\u0430\u0440\u0435\u043d \u0437\u0430 \u0441\u043e\u0432\u0435\u0442\u044b \u043f\u043e \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u0438\u044e \u0438 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438 \u0440\u0430\u0431\u043e\u0442\u044b.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<p><!----><!----><\/div>\n<p><!----><!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/articles\/931758\/\"> https:\/\/habr.com\/ru\/articles\/931758\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<div><!--[--><!--]--><\/div>\n<div id=\"post-content-body\">\n<div>\n<div class=\"article-formatted-body article-formatted-body article-formatted-body_version-2\">\n<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u042d\u0442\u0430 \u0441\u0442\u0430\u0442\u044c\u044f, \u0441\u043a\u043e\u0440\u0435\u0435 \u0434\u043b\u044f \u043e\u0437\u043d\u0430\u043a\u043e\u043c\u043b\u0435\u043d\u0438\u044f \u0438 \u0445\u043e\u0442\u0435\u043b\u043e\u0441\u044c \u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0441\u043e\u0432\u0435\u0442\u044b \u043f\u043e \u0434\u0430\u043d\u043d\u043e\u0439 \u0440\u0430\u0431\u043e\u0442\u0435.<br \/>\u0418\u0442\u0430\u043a,  Excel-\u0444\u0430\u0439\u043b \u0432\u0435\u0441\u0438\u0442 500+ \u043c\u0435\u0433\u0430\u0431\u0430\u0439\u0442, \u0441\u043e\u0441\u0442\u043e\u0438\u0442 \u0438\u0437 \u0441\u043e\u0442\u0435\u043d \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a, \u0434\u0435\u0441\u044f\u0442\u043a\u043e\u0432 \u043b\u0438\u0441\u0442\u043e\u0432 \u0438 \u0444\u043e\u0440\u043c\u0443\u043b, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u00ab\u043f\u0440\u043e\u0442\u044f\u0433\u0438\u0432\u0430\u044e\u0442\u0441\u044f\u00bb \u043f\u043e 30+ \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u043c \u2014 \u044d\u0442\u043e \u043d\u0435 \u0440\u0430\u0431\u043e\u0442\u0430, \u0430 \u0441\u0442\u0440\u0430\u0434\u0430\u043d\u0438\u0435. \u0418\u043c\u0435\u043d\u043d\u043e \u0441 \u0442\u0430\u043a\u0438\u043c \u00ab\u043c\u043e\u043d\u0441\u0442\u0440\u043e\u043c\u00bb \u044f \u0441\u0442\u043e\u043b\u043a\u043d\u0443\u043b\u0441\u044f, \u043a\u043e\u0433\u0434\u0430 \u0432 \u043a\u043e\u043c\u043f\u0430\u043d\u0438\u0438 \u0441\u043e\u0431\u0440\u0430\u043b\u0438\u0441\u044c \u0434\u0430\u043d\u043d\u044b\u0435 \u0438\u0437 \u0440\u0430\u0437\u043d\u044b\u0445 \u043e\u0442\u0434\u0435\u043b\u043e\u0432 \u0432 \u043e\u0434\u0438\u043d \u0444\u0430\u0439\u043b. <\/p>\n<p>\u0412\u043a\u0440\u0430\u0442\u0446\u0435 \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u0430 \u0444\u0430\u0439\u043b\u0430 &#8212; \u041b\u0438\u0441\u0442 &#171;\u041c\u0430\u0441\u0441\u0438\u0432&#187; (Data_Lake &#8212; \u0432 \u043b\u0435\u0432\u043e\u0439 \u0447\u0430\u0441\u0442\u0438 34 \u0441\u0442\u043e\u043b\u0431\u0446\u0430 \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u0438\u0441\u0442\u044b \u0438 \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u0442\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u044e\u0442 \u043e\u0441\u043d\u043e\u0432\u043d\u044b\u0435 \u0444\u043e\u0440\u043c\u0443\u043b\u044b \u0438 \u043f\u0440\u0430\u0432\u0430\u044f \u0447\u0430\u0441\u0442\u044c \u0441 46 \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u043c\u0438, \u043a\u0443\u0434\u0430 \u043f\u043e\u0434\u0442\u044f\u0433\u0438\u0432\u0430\u044e\u0442\u0441\u044f \u0441\u044b\u0440\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435, \u0441 \u043a\u043e\u0442\u043e\u0440\u044b\u043c\u0438 \u0431\u0443\u0434\u0435\u0442 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u044c\u0441\u044f \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0430). \u0418 \u043c\u043d\u043e\u0436\u0435\u0441\u0442\u0432\u043e\u043c \u043b\u0438\u0441\u0442\u043e\u0432 \u0441\u043e \u0441\u043f\u0440\u0430\u0432\u043e\u0447\u043d\u0438\u043a\u0430\u043c\u0438, \u043f\u0440\u0430\u0432\u043a\u0430\u043c\u0438. <\/p>\n<p>\u041e\u0442\u043a\u0440\u044b\u0442\u0438\u0435 \u044d\u0442\u043e\u0433\u043e Excel-\u0444\u0430\u0439\u043b\u0430 \u0437\u0430\u043d\u0438\u043c\u0430\u0435\u0442 10 \u043c\u0438\u043d\u0443\u0442, \u0430 \u0435\u0441\u043b\u0438 \u043e\u0431\u043d\u043e\u0432\u0438\u0442\u044c \u0445\u043e\u0442\u044f \u0431\u044b \u0447\u0430\u0441\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b \u2014 \u043c\u043e\u0436\u043d\u043e \u0438\u0434\u0442\u0438 \u043f\u0438\u0442\u044c \u0447\u0430\u0439. \u0420\u0430\u0431\u043e\u0442\u0430\u0442\u044c \u0441 \u0442\u0430\u043a\u0438\u043c\u0438 \u0434\u0430\u043d\u043d\u044b\u043c\u0438 \u043f\u0440\u043e\u0441\u0442\u043e \u043d\u0435\u0432\u043e\u0437\u043c\u043e\u0436\u043d\u043e, \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0435\u0441\u043b\u0438 \u0442\u0435\u0431\u0435 \u043d\u0443\u0436\u043d\u043e \u0430\u043d\u0430\u043b\u0438\u0437\u0438\u0440\u043e\u0432\u0430\u0442\u044c \u0438\u0445, \u0441\u0442\u0440\u043e\u0438\u0442\u044c \u043e\u0442\u0447\u0451\u0442\u044b \u0438\u043b\u0438 \u0433\u043e\u0442\u043e\u0432\u0438\u0442\u044c \u0432\u044b\u0433\u0440\u0443\u0437\u043a\u0438.  \u041f\u043e\u044d\u0442\u043e\u043c\u0443 \u0440\u0435\u0448\u0438\u043b \u043f\u043e\u043f\u0440\u043e\u0431\u043e\u0432\u0430\u0442\u044c \u0432\u0441\u0435 \u043f\u0435\u0440\u0435\u0432\u0435\u0441\u0442\u0438 \u043d\u0430 PostgreSQL. <br \/>\u0414\u043b\u044f \u044d\u0442\u043e\u0433\u043e \u0432\u0441\u0435\u0433\u043e \u043b\u0438\u0448\u044c \u0442\u0440\u0435\u0431\u043e\u0432\u0430\u043b\u043e\u0441\u044c \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u0430\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b\u044b \u0441 Excel \u043d\u0430 SQL. \u0425\u043e\u0440\u043e\u0448\u043e, \u0447\u0442\u043e \u0431\u043e\u043b\u044c\u0448\u0438\u043d\u0441\u0442\u0432\u043e \u0444\u043e\u0440\u043c\u0443\u043b \u044d\u0442\u043e \u0443\u0441\u043b\u043e\u0432\u0438\u044f \u0415\u0421\u041b\u0418, \u0418\u041b\u0418.    <\/p>\n<p>\u0412\u043e\u0442 \u0441\u0430\u043c\u0430\u044f \u043f\u0440\u043e\u0441\u0442\u0430\u044f \u0444\u043e\u0440\u043c\u0443\u043b\u0430:    <\/p>\n<pre><code>\u00ab=\u0412\u041f\u0420(AN228087&amp;\"-\"&amp;AX228087;'\u041c\u044d\u043f\u043f\u0438\u043d\u0433'!A:E;4;\u041b\u041e\u0416\u042c)\u00bb<\/code><\/pre>\n<p>\u0418 \u0441\u043e\u043e\u0442\u0432\u0435\u0442\u0441\u0442\u0432\u0443\u044e\u0449\u0430\u044f \u0435\u0439 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u043d\u0430 SQL:    <\/p>\n<pre><code class=\"sql\">CREATE OR REPLACE FUNCTION statia_po_shety() RETURNS void AS $$ BEGIN   WITH data AS (     SELECT       m.\"id\",       ms.\"\u0421\u0442\u0430\u0442\u044c\u044f\" AS \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\"     FROM \"\u041c\u0430\u0441\u0441\u0438\u0432\" m     LEFT JOIN \"cvi\" cvi ON m.\"id\" = cvi.\"id\"     LEFT JOIN \"\u041c\u044d\u043f\u043f\u0438\u043d\u0433 \u0441\u0447\u0435\u0442\u043e\u0432\" ms       ON ms.\"\u041e\u0411\u042a\u0415\u0414\" = COALESCE(cvi.\"\u0421\u0447\u0435\u0442 \u0414\u0442\", '') || '-' || COALESCE(cvi.\"\u0421\u0447\u0435\u0442 \u041a\u0442\", '')   )   UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" m   SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\" = d.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\"   FROM data d   WHERE m.\"id\" = d.\"id\"; END; $$ LANGUAGE plpgsql; <\/code><\/pre>\n<p> \u042d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f \u0437\u0430\u043f\u0443\u0441\u043a\u0430\u0435\u0442\u0441\u044f \u043f\u043e \u0442\u0440\u0438\u0433\u0433\u0435\u0440\u0443, \u043a\u043e\u0433\u0434\u0430 \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u0432\u0441\u0442\u0430\u0432\u043a\u0430 \u0438\u043b\u0438 \u0438\u0437\u043c\u0435\u043d\u0435\u043d\u0438\u0435 \u043e\u0434\u043d\u043e\u0439 \u0441\u0442\u0440\u043e\u043a\u0438, \u0447\u0442\u043e\u0431\u044b \u043d\u0435 \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0442\u044c \u0432\u0435\u0441\u044c \u043c\u0430\u0441\u0441\u0438\u0432 \u0434\u0430\u043d\u043d\u044b\u0445.  <\/p>\n<h4>\u0410 \u0432\u043e\u0442 \u0438 \u00ab\u043c\u043e\u043d\u0441\u0442\u0440\u00bb \u0438\u0437 Excel<\/h4>\n<p>\u042d\u0442\u043e \u043b\u0438\u0448\u044c \u0447\u0430\u0441\u0442\u044c \u0444\u043e\u0440\u043c\u0443\u043b\u044b, \u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u0432\u044b \u043f\u043e\u043d\u0438\u043c\u0430\u043b\u0438 \u043c\u0430\u0441\u0448\u0442\u0430\u0431:<\/p>\n<pre><code>=\u0415\u0421\u041b\u0418(\u0415\u0421\u041d\u0414(\u0412\u041f\u0420(AL228133;'\u041c\u044d\u043f\u043f\u0438\u043d\u0433 \u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0442\u043e\u0440'!$A:$C;2;\u041b\u041e\u0416\u042c); \u0415\u0421\u041d\u0414(\u0412\u041f\u0420($A228133;'\u041f\u0440\u0430\u0432\u043a\u0438 \u0411\u0423'!A:Q;\u041f\u041e\u0418\u0421\u041a\u041f\u041e\u0417(K$1;'\u041f\u0440\u0430\u0432\u043a\u0438 \u0411\u0423'!$A$1:$Q$1;0);\u041b\u041e\u0416\u042c); \u0415\u0421\u041b\u0418(\u0418\u041b\u0418(\u0415\u0421\u041d\u0414(M228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(N228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(O228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(R228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0415\u0421\u041d\u0414(S228133;0)=\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\");\"!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c\"; \u0438 \u0442.\u0434.<\/code><\/pre>\n<p> \u041f\u043e\u043b\u043d\u0430\u044f \u0444\u043e\u0440\u043c\u0443\u043b\u0430 \u0437\u0430\u043d\u0438\u043c\u0430\u0435\u0442 \u0434\u0435\u0441\u044f\u0442\u043a\u0438 \u0441\u0442\u0440\u043e\u043a \u0438 \u043a\u043e\u043c\u0431\u0438\u043d\u0438\u0440\u0443\u0435\u0442 <code>\u0415\u0421\u041b\u0418<\/code>, <code>\u0412\u041f\u0420<\/code>, <code>\u0418\u041b\u0418<\/code>, <code>\u041f\u0421\u0422\u0420<\/code>, <code>\u0415\u041f\u0423\u0421\u0422\u041e<\/code> \u0438 \u043f\u0440\u043e\u0447\u0438\u0435 \u00ab\u043f\u0440\u0435\u043b\u0435\u0441\u0442\u0438\u00bb Excel. \u041f\u0440\u043e\u0442\u044f\u0436\u043a\u0430 \u043f\u043e 300 000 \u0441\u0442\u0440\u043e\u043a \u0434\u0435\u043b\u0430\u0435\u0442 \u0442\u0430\u043a\u043e\u0439 \u0440\u0430\u0441\u0447\u0451\u0442 \u0430\u0431\u0441\u043e\u043b\u044e\u0442\u043d\u043e \u043d\u0435\u0440\u0430\u0431\u043e\u0447\u0438\u043c.  <\/p>\n<p><strong>\u041a\u0430\u043a  \u043f\u0435\u0440\u0435\u043f\u0438\u0441\u0430\u043b \u044d\u0442\u043e \u0432 PostgreSQL  <\/strong><\/p>\n<p>\u0421\u043e\u0437\u0434\u0430\u043d\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u044f <code>update_statya_uu()<\/code>, \u043a\u043e\u0442\u043e\u0440\u0430\u044f:<\/p>\n<ul>\n<li>\n<p>\u041e\u0431\u044a\u0435\u0434\u0438\u043d\u044f\u0435\u0442 \u0432\u0441\u0435 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435 \u0432\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u043d\u0443\u044e \u0442\u0430\u0431\u043b\u0438\u0446\u0443 <code>temp_agg<\/code><\/p>\n<\/li>\n<li>\n<p>\u041f\u043e\u043e\u0447\u0435\u0440\u0451\u0434\u043d\u043e \u043f\u0440\u0438\u043c\u0435\u043d\u044f\u0435\u0442 \u043b\u043e\u0433\u0438\u043a\u0443 <code>IF...THEN<\/code>, \u0430\u043d\u0430\u043b\u043e\u0433\u0438\u0447\u043d\u0443\u044e <code>\u0415\u0421\u041b\u0418<\/code> \u0438 <code>\u0412\u041f\u0420<\/code> \u0432 Excel<\/p>\n<\/li>\n<li>\n<p>\u0412\u044b\u043f\u043e\u043b\u043d\u044f\u0435\u0442 \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u0440\u0438 \u043d\u0435\u043e\u0431\u0445\u043e\u0434\u0438\u043c\u043e\u0441\u0442\u0438<\/p>\n<p>\u041f\u0440\u0438\u043c\u0435\u0440 \u0444\u0440\u0430\u0433\u043c\u0435\u043d\u0442\u0430 \u0444\u0443\u043d\u043a\u0446\u0438\u0438:<\/p>\n<\/li>\n<\/ul>\n<pre><code class=\"sql\">CREATE OR REPLACE FUNCTION update_statya_uu() RETURNS void AS $$ DECLARE     rec RECORD;     result_text TEXT; BEGIN          CREATE TEMP TABLE temp_agg AS SELECT     m.*,     c.\"\u0414\u043e\u043a\u0443\u043c\u0435\u043d\u0442\" AS cvi_document,     c.\"\u041e\u0440\u0433\u0430\u043d\u0438\u0437\u0430\u0446\u0438\u044f\" AS cvi_organization,     c.\"\u0422\u0438\u043f \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430.1\" AS cvi_tip_dok_1,     m.\"\u0422\u0438\u043f \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u0430\" AS m_tip_dok,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e \u041a\u0442\" AS cvi_subkonto_kt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e2 \u041a\u0442\" AS cvi_subkonto2_kt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e3 \u041a\u0442\" AS cvi_subkonto3_kt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e1 \u0414\u0442\" AS cvi_subkonto1_dt,     c.\"\u0421\u0443\u0431\u043a\u043e\u043d\u0442\u043e2 \u0414\u0442\" AS cvi_subkonto2_dt,     c.\"\u0421\u0447\u0435\u0442 \u041a\u0442\" AS cvi_schet_kt,     c.\"\u0421\u0447\u0435\u0442 \u0414\u0442\" AS cvi_schet_dt FROM \"\u041c\u0430\u0441\u0441\u0438\u0432\" m LEFT JOIN \"cvi\" c ON m.id = c.id;       -- \u041f\u0440\u043e\u0445\u043e\u0434\u0438\u043c \u043f\u043e \u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e\u0439 \u0442\u0430\u0431\u043b\u0438\u0446\u0435 \u043f\u043e \u043e\u0434\u043d\u043e\u0439 \u0437\u0430\u043f\u0438\u0441\u0438 \u0438 \u0432\u044b\u0447\u0438\u0441\u043b\u044f\u0435\u043c \u0437\u043d\u0430\u0447\u0435\u043d\u0438\u0435 \u0434\u043b\u044f \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\"     FOR rec IN SELECT * FROM temp_agg LOOP         \u0440         SELECT \"\u0421\u0442\u0430\u0442\u044c\u0438 \u0437\u0430\u0442\u0440\u0430\u0442 \u0423\u0423\" INTO result_text         FROM \"\u041c\u044d\u043f\u043f\u0438\u043d\u0433 \u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0442\u043e\u0440\"         WHERE \"\u0420\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0442\u043e\u0440\" = rec.cvi_document         LIMIT 1;          IF FOUND THEN                          UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" = result_text WHERE id = rec.id;             CONTINUE;         END IF;                  SELECT \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" INTO result_text         FROM \"\u041f\u0440\u0430\u0432\u043a\u0438 \u0411\u0423\"         WHERE \"\u0414\u043e\u043a\u0443\u043c\u0435\u043d\u0442 \u0411\u0423 \u041a\u043b\u044e\u0447\" = rec.\"Key\"         LIMIT 1;          IF FOUND THEN             UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" = result_text WHERE id = rec.id;             CONTINUE;         END IF;                   IF rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0437\u0430\u0442\u0440\u0430\u0442\u0435\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0437\u0430\u043f\u0447\u0430\u0441\u0442\u044f\u043c\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u041d\u0413\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423 \u043f\u043e \u0421\u0447\u0435\u0442\u0443\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' OR            rec.\"\u0421\u0442\u0430\u0442\u044c\u044f \u043f\u043e \u0422\u0438\u043f \u0434\u043e\u043a.\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' THEN             UPDATE \"\u041c\u0430\u0441\u0441\u0438\u0432\" SET \"\u0421\u0442\u0430\u0442\u044c\u044f \u0423\u0423\" = '!\u041d\u0435 \u0431\u0440\u0430\u0442\u044c' WHERE id = rec.id;             CONTINUE;         END IF;<\/code><\/pre>\n<p>\u041b\u043e\u0433\u0438\u043a\u0430 \u043f\u043e\u0441\u043b\u0435\u0434\u043e\u0432\u0430\u0442\u0435\u043b\u044c\u043d\u0430\u044f: \u043e\u0442 \u043f\u0440\u0438\u043e\u0440\u0438\u0442\u0435\u0442\u043d\u044b\u0445 \u043f\u0440\u0430\u0432\u0438\u043b \u043a \u0431\u043e\u043b\u0435\u0435 \u043e\u0431\u0449\u0438\u043c, \u0441 \u043f\u0440\u043e\u0432\u0435\u0440\u043a\u043e\u0439 \u0443\u0441\u043b\u043e\u0432\u0438\u0439, \u043f\u043e\u0445\u043e\u0436\u0438\u0445 \u043d\u0430 Excel-\u0444\u043e\u0440\u043c\u0443\u043b\u044b.<\/p>\n<h4>\u041f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0435\u043b\u044c\u043d\u043e\u0441\u0442\u044c<\/h4>\n<ul>\n<li>\n<p>\ud83d\udd04 \u041e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0430 300 000 \u0441\u0442\u0440\u043e\u043a: <strong>~2 \u043c\u0438\u043d\u0443\u0442\u044b<\/strong><\/p>\n<\/li>\n<li>\n<p>\ud83d\udcc9 \u0412\u0440\u0435\u043c\u044f \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u044f \u0441\u043e\u043a\u0440\u0430\u0442\u0438\u043b\u043e\u0441\u044c <strong>\u0432 10 \u0440\u0430\u0437<\/strong><\/p>\n<\/li>\n<li>\n<p>\u26d3 \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043f\u043e <strong>\u0442\u0440\u0438\u0433\u0433\u0435\u0440\u0443<\/strong> \u0434\u043b\u044f \u043e\u0431\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u0441\u0442\u0440\u043e\u043a<\/p>\n<\/li>\n<\/ul>\n<p>\u0412 \u043a\u043e\u043d\u0435\u0447\u043d\u043e \u0438\u0442\u043e\u0433\u0435, \u0440\u0430\u0431\u043e\u0442\u0430 \u043f\u043e \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0443 \u0437\u0430\u043d\u044f\u043b\u0430 \u043f\u0430\u0440\u0443 \u043d\u0435\u0434\u0435\u043b\u044c \u0438 \u0432\u043e\u0442 \u0447\u0430\u0441\u0442\u044c \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u044b:<\/p>\n<figure class=\"full-width\">\n<div><figcaption>\u0434\u0430, \u043c\u0430\u0441\u0448\u0442\u0430\u0431 \u0436\u0435\u043b\u0430\u0435\u0442 \u0431\u044b\u0442\u044c \u043b\u0443\u0447\u0448\u0435, \u043d\u043e \u0432\u0438\u0437\u0443\u0430\u043b\u044c\u043d\u043e \u0432\u0438\u0434\u043d\u043e \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u043e\u0435 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u0442\u0430\u0431\u043b\u0438\u0446. (\u0412\u0441\u0435 \u0438\u043c\u0435\u044e\u0442 \u0441\u0432\u044f\u0437\u044c 1 \u043a 1)<\/figcaption><\/div>\n<\/figure>\n<p>\u0418 \u043d\u0430 \u0432\u0441\u0435 \u0441\u0442\u043e\u043b\u0431\u0446\u044b, \u0432\u0441\u0435\u0445 \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u0443 \u043d\u0430\u0441 57 \u0442\u0440\u0438\u0433\u0433\u0435\u0440\u043e\u0432<\/p>\n<figure class=\"\"><\/figure>\n<p>\u041d\u043e \u043f\u0435\u0440\u0435\u043d\u0435\u0441\u0442\u0438 \u044d\u0442\u043e\u0442 \u043c\u0430\u0441\u0441\u0438\u0432 \u0431\u044b\u043b\u043e \u043f\u043e\u043b\u0431\u0435\u0434\u044b. \u0418\u0437-\u0437\u0430 \u0441\u043f\u0435\u0446\u0438\u0444\u0438\u043a\u0438, \u0441\u043f\u0435\u0446\u0438\u0430\u043b\u0438\u0441\u0442\u0430\u043c \u043d\u0430\u0434\u043e \u043f\u0440\u043e\u0433\u043e\u043d\u044f\u0442\u044c 300 \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a \u043a\u0430\u0436\u0434\u044b\u0439 \u0434\u0435\u043d\u044c. \u0418 \u0442\u0443\u0442 \u0432\u0441\u0442\u0443\u043f\u0438\u043b \u0432 \u0434\u0435\u043b\u043e Python. <\/p>\n<p> <strong>\u041e\u0431\u0449\u0430\u044f \u0441\u0445\u0435\u043c\u0430 ETL-\u043f\u0440\u043e\u0446\u0435\u0441\u0441\u0430:<\/strong><\/p>\n<blockquote>\n<p>Excel (.xlsx) \u2192 DataFrame \u2192 Pickle \u2192 PostgreSQL (\u0442\u0430\u0431\u043b\u0438\u0446\u044b cvi, \u041c\u0430\u0441\u0441\u0438\u0432) \u2192 JOIN \u2192 Data_Lake \u2192 \u041f\u0440\u0438\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u0442\u0438\u043f\u043e\u0432<\/p>\n<\/blockquote>\n<h4>1. \u041f\u0440\u0435\u0434\u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0430: \u0437\u0430\u0433\u0440\u0443\u0436\u0430\u0435\u043c Excel \u2192 DataFrame<\/h4>\n<pre><code class=\"python\">df = pd.read_excel(excel_file_path) df.to_pickle(pickle_file_path)<\/code><\/pre>\n<p>    \u041a\u0430\u043a \u043f\u043e\u043a\u0430\u0437\u0430\u043b\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0430 .pkl \u0447\u0438\u0442\u0430\u0435\u0442\u0441\u044f \u0431\u044b\u0441\u0442\u0440\u0435\u0435<\/p>\n<p>\u041e\u0431\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u0435\u043c \u0441\u0442\u043e\u043b\u0431\u0435\u0446 <code>\"\u0414\u0430\u0442\u0430\"<\/code> \u2014 Excel \u0447\u0430\u0441\u0442\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442 \u0434\u0430\u0442\u044b \u0432 \u0432\u0438\u0434\u0435 \u0447\u0438\u0441\u0435\u043b, \u0438 \u044d\u0442\u043e \u043d\u0430\u0434\u043e \u0438\u0441\u043f\u0440\u0430\u0432\u0438\u0442\u044c:  <\/p>\n<pre><code class=\"python\">df['\u0414\u0430\u0442\u0430'] = pd.to_datetime('1899-12-30') + pd.to_timedelta(df['\u0414\u0430\u0442\u0430'], unit='D')<\/code><\/pre>\n<p> <strong>2. \u041f\u043e\u0434\u0433\u043e\u0442\u043e\u0432\u043a\u0430 \u0431\u0430\u0437\u044b: \u0441\u043e\u0437\u0434\u0430\u0451\u043c \u0441\u0445\u0435\u043c\u0443 \u0438 \u0442\u0430\u0431\u043b\u0438\u0446\u0443  <\/strong><\/p>\n<pre><code>CREATE SCHEMA IF NOT EXISTS \"public\"; CREATE TABLE IF NOT EXISTS \"cvi\" (...);<\/code><\/pre>\n<p>*cvi &#8212; \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u043a\u0443\u0434\u0430 \u043f\u043e\u0441\u0442\u0443\u043f\u0430\u044e\u0442 \u0441\u044b\u0440\u044b\u0435 \u0434\u0430\u043d\u043d\u044b\u0435  (\u043f\u0440\u0430\u0432\u0430\u044f \u0447\u0430\u0441\u0442\u044c Data_Lake)<\/p>\n<p>\u041f\u043e\u043b\u044f \u0430\u0432\u0442\u043e\u043c\u0430\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043f\u0440\u0438\u0432\u043e\u0434\u044f\u0442\u0441\u044f \u043a <code>varchar(255)<\/code>, \u0430 \u0434\u0430\u0442\u044b \u2014 \u043a <code>date<\/code>. \u0415\u0441\u043b\u0438 \u043d\u0443\u0436\u0435\u043d \u0431\u043e\u043b\u0435\u0435 \u0442\u043e\u0447\u043d\u044b\u0439 \u0442\u0438\u043f \u2014 \u043c\u043e\u0436\u043d\u043e \u043b\u0435\u0433\u043a\u043e \u0430\u0434\u0430\u043f\u0442\u0438\u0440\u043e\u0432\u0430\u0442\u044c.<\/p>\n<p> <strong>3. \u041e\u0447\u0438\u0441\u0442\u043a\u0430 \u0442\u0430\u0431\u043b\u0438\u0446 \u043f\u0435\u0440\u0435\u0434 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u043e\u0439  <\/strong><\/p>\n<pre><code>TRUNCATE TABLE \"\u041c\u0430\u0441\u0441\u0438\u0432\" RESTART IDENTITY CASCADE; TRUNCATE TABLE \"cvi\" RESTART IDENTITY CASCADE;<\/code><\/pre>\n<p>*\u041c\u0430\u0441\u0441\u0438\u0432 &#8212; \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u0438 \u0441 cvi (\u043b\u0435\u0432\u0430\u044f \u0447\u0430\u0441\u0442\u044c Data_Lake)<\/p>\n<p> \u042d\u0442\u043e \u043d\u0443\u0436\u043d\u043e, \u0447\u0442\u043e\u0431\u044b \u0438\u0437\u0431\u0435\u0436\u0430\u0442\u044c \u0434\u0443\u0431\u043b\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u044f, \u0442.\u043a. \u043e\u0431\u043d\u043e\u0432\u043b\u044f\u0435\u0442\u0441\u044f \u0432\u0441\u0451.  <\/p>\n<p><strong> 4. \u041f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u0430\u044f \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u0434\u0430\u043d\u043d\u044b\u0445 \u0432 PostgreSQL<\/strong>  <\/p>\n<p>CSV \u0438\u043b\u0438 bulk-\u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0430 \u043f\u043e\u0434\u043e\u0448\u043b\u0438 \u0431\u044b, \u043d\u043e \u043c\u044b \u0432\u044b\u0431\u0440\u0430\u043b\u0438 <code>psycopg2 + executemany<\/code> \u0441 \u043f\u0430\u0440\u0430\u043b\u043b\u0435\u043b\u044c\u043d\u043e\u0439 \u043e\u0431\u0440\u0430\u0431\u043e\u0442\u043a\u043e\u0439 \u0447\u0430\u043d\u043a\u043e\u0432:  <\/p>\n<pre><code class=\"python\">chunk_size = 6000 max_workers = 8<\/code><\/pre>\n<p> \u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0447\u0430\u043d\u043a\u0430 \u2014 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0439 \u043f\u043e\u0442\u043e\u043a:  <\/p>\n<pre><code class=\"python\">with ThreadPoolExecutor(max_workers=max_workers) as executor:     futures = [executor.submit(load_chunk, chunk) for chunk in chunks]<\/code><\/pre>\n<p>\u0414\u0430\u043b\u044c\u0448\u0435 \u0441\u043e\u0437\u0434\u0430\u0435\u0442\u0441\u044f \u0432\u0438\u0442\u0440\u0438\u043d\u0430 Data_Lake (\u0432\u0438\u0442\u0440\u0438\u043d\u0430):<\/p>\n<pre><code class=\"sql\">CREATE TABLE \"Data_Lake\" AS SELECT m.*, c.* FROM \"\u041c\u0430\u0441\u0441\u0438\u0432\" m JOIN \"cvi\" c ON m.id = c.id;<\/code><\/pre>\n<p>\u0418 \u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u0441\u044f \u043f\u0435\u0440\u0435\u0432\u043e\u0434 \u0432 \u043d\u0443\u0436\u043d\u044b\u0439 \u0444\u043e\u0440\u043c\u0430\u0442 \u0434\u0430\u043d\u043d\u044b\u0445 (\u0438\u0437 text \u0432  numeric(12,2)), \u0435\u0441\u043b\u0438 \u043d\u0430\u0434\u043e.<br \/>\u0412 \u043a\u043e\u043d\u0435\u0447\u043d\u043e \u0438\u0442\u043e\u0433\u0435 \u0441 \u043c\u043e\u043c\u0435\u043d\u0442\u0430 \u0437\u0430\u0433\u0440\u0443\u0437\u043a\u0438 \u0441\u044b\u0440\u044b\u0445 \u0434\u0430\u043d\u043d\u044b\u0435 (300 \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a, \u0432 46 \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u0445) \u0432 \u0442\u0430\u0431\u043b\u0438\u0446\u0443 cvi, \u0441\u0440\u0430\u0431\u0430\u0442\u044b\u0432\u0430\u043d\u0438\u0435\u043c \u0442\u0440\u0438\u0433\u0433\u0435\u0440\u043e\u0432 \u0438 \u0444\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435\u043c \u0432\u0438\u0442\u0440\u0438\u043d\u044b \u0434\u0430\u043d\u043d\u044b\u0445 (Data_Lake \u0441 78 \u0441\u0442\u043e\u043b\u0431\u0446\u0430\u043c\u0438 \u0432 300 \u0442\u044b\u0441\u044f\u0447 \u0441\u0442\u0440\u043e\u043a) \u0437\u0430\u043d\u044f\u043b\u043e \u0443 \u043c\u0435\u043d\u044f:<\/p>\n<figure class=\"\">\n<div><figcaption>\u0447\u0442\u043e \u0440\u0430\u0432\u043d\u044f\u0435\u0442\u0441\u044f 7,49 \u0441\u0435\u043a\u0443\u043d\u0434<\/figcaption><\/div>\n<\/figure>\n<p>\u0414\u043e\u043f\u043e\u043b\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e:<\/p>\n<ul>\n<li>\n<p>\u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u0435\u0449\u0435 \u0441\u0432\u044f\u0437\u0438<\/p>\n<\/li>\n<li>\n<p>ETL \u0440\u0435\u0430\u043b\u0438\u0437\u043e\u0432\u0430\u0442\u044c \u0432  Apache Airflow  <\/p>\n<\/li>\n<li>\n<p>\u0434\u043e\u0431\u0430\u0432\u0438\u0442\u044c \u0432\u0435\u0431-\u0438\u043d\u0442\u0435\u0440\u0444\u0435\u0439\u0441 \u0434\u043b\u044f \u0434\u0430\u0448\u0431\u043e\u0440\u0434\u0430<\/p>\n<\/li>\n<\/ul>\n<p>\u0412\u0440\u043e\u0434\u0435 \u043d\u0430 \u044d\u0442\u043e\u043c \u0432\u0441\u0435. \u0415\u0441\u0442\u0435\u0441\u0442\u0432\u0435\u043d\u043d\u043e \u0431\u0443\u0434\u0443 \u0431\u043b\u0430\u0433\u043e\u0434\u0430\u0440\u0435\u043d \u0437\u0430 \u0441\u043e\u0432\u0435\u0442\u044b \u043f\u043e \u0443\u043b\u0443\u0447\u0448\u0435\u043d\u0438\u044e \u0438 \u043e\u043f\u0442\u0438\u043c\u0438\u0437\u0430\u0446\u0438\u0438 \u0440\u0430\u0431\u043e\u0442\u044b.<\/p>\n<\/div>\n<\/div>\n<\/div>\n<p><!----><!----><\/div>\n<p><!----><!----><br \/> \u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/articles\/931758\/\"> https:\/\/habr.com\/ru\/articles\/931758\/<\/a><br \/><\/br><\/br><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-468876","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/468876","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=468876"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/468876\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=468876"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=468876"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=468876"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}