{"id":485971,"date":"2026-07-02T15:48:48","date_gmt":"2026-07-02T15:48:48","guid":{"rendered":"https:\/\/savepearlharbor.com\/?p=485971"},"modified":"-0001-11-30T00:00:00","modified_gmt":"-0001-11-29T21:00:00","slug":"","status":"publish","type":"post","link":"https:\/\/savepearlharbor.com\/?p=485971","title":{"rendered":"\u0421\u0436\u0430\u0442\u0438\u0435 \u0434\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u044b\u0445 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u043e\u0432: \u043a\u0430\u043a \u0443\u0436\u0430\u0442\u044c 8B \u0434\u043e \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u0430 \u0431\u0435\u0437 \u043f\u043e\u0442\u0435\u0440\u0438 recall"},"content":{"rendered":"<div xmlns=\"http:\/\/www.w3.org\/1999\/xhtml\">\n<p>\u0412 <a href=\"https:\/\/habr.com\/ru\/articles\/1049872\/\" rel=\"noopener noreferrer nofollow\">\u043f\u0440\u043e\u0448\u043b\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435<\/a> \u043c\u044b \u0440\u0430\u0437\u0431\u0438\u0440\u0430\u043b\u0438, \u043f\u043e\u0447\u0435\u043c\u0443 <code>retrieval<\/code> \u0432 2026 \u043f\u0435\u0440\u0435\u0435\u0445\u0430\u043b \u0441 \u044d\u043d\u043a\u043e\u0434\u0435\u0440\u043e\u0432 \u043d\u0430 \u0434\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u044b\u0435 LLM: <code>Qwen3-Embedding<\/code>, <code>NV-Embed<\/code>, <code>E5-Mistral<\/code> \u044d\u043c\u0431\u0435\u0434\u0434\u044f\u0442 \u043b\u0443\u0447\u0448\u0435 <code>BGE<\/code>, \u0434\u0435\u0440\u0436\u0430\u0442 32k \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442\u0430 \u0438 \u043f\u043e\u043d\u0438\u043c\u0430\u044e\u0442 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0438 \u0432 \u043f\u0440\u043e\u043c\u043f\u0442\u0435.<\/p>\n<p>\u041f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u043f\u0440\u043e\u0441\u0442\u0430\u044f. \u0414\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u044b\u0439 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440 7\u20138B \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0434\u0430\u0435\u0442 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e. \u041d\u043e \u0437\u0430 \u044d\u0442\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0432\u044b \u043f\u043b\u0430\u0442\u0438\u0442\u0435 \u0442\u0440\u0438\u0436\u0434\u044b: <strong>\u043f\u0430\u043c\u044f\u0442\u044c<\/strong> (8B \u0432 fp16 &#8212; \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0432\u0435\u0441\u0430 \u043c\u043e\u0434\u0435\u043b\u0438, \u043d\u043e \u0438 \u0436\u0438\u0440\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b \u0432 \u0438\u043d\u0434\u0435\u043a\u0441\u0435), <strong>latency<\/strong> (forward-pass \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438) \u0438 <strong>\u0434\u0435\u043d\u044c\u0433\u0438<\/strong> (GPU \u043f\u043e\u0434 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u043e\u0439 \u0438\u043b\u0438 \u0441\u0447\u0435\u0442 \u0437\u0430 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433-API). \u0418 \u0435\u0441\u043b\u0438 latency \u043b\u0435\u0447\u0438\u0442\u0441\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441-\u0441\u0442\u0435\u043a\u043e\u043c (SGLang, \u0431\u0430\u0442\u0447\u0438\u043d\u0433 &#8212; \u0442\u0435\u043c\u0430 \u0431\u0443\u0434\u0443\u0449\u0435\u0439 \u0441\u0442\u0430\u0442\u044c\u0438 \u0441\u0435\u0440\u0438\u0438), \u0442\u043e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c <strong>\u0438\u043d\u0434\u0435\u043a\u0441\u0430<\/strong> \u0440\u0430\u0441\u0442\u0435\u0442 \u043b\u0438\u043d\u0435\u0439\u043d\u043e \u0441 \u0447\u0438\u0441\u043b\u043e\u043c \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432 \u0438 \u043d\u0435 \u043b\u0435\u0447\u0438\u0442\u0441\u044f \u043d\u0438\u0447\u0435\u043c, \u043a\u0440\u043e\u043c\u0435 \u0441\u0436\u0430\u0442\u0438\u044f \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432<\/p>\n<p>\u041f\u0440\u0438\u043c\u0435\u0440, \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u0447\u0443\u0432\u0441\u0442\u0432\u043e\u0432\u0430\u0442\u044c \u043c\u0430\u0441\u0448\u0442\u0430\u0431. <code>Qwen3-Embedding<\/code> \u043e\u0442\u0434\u0430\u0451\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 \u043d\u0430 1024 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f (\u0443 8B \u2014 \u0434\u043e 4096). \u0412\u043e\u0437\u044c\u043c\u0451\u043c \u0442\u0438\u043f\u0438\u0447\u043d\u044b\u0439 \u043a\u043e\u0440\u043f\u0443\u0441 \u043d\u0430 100\u041c \u0447\u0430\u043d\u043a\u043e\u0432 \u0438 \u0432\u0435\u043a\u0442\u043e\u0440 1024-dim \u0432 fp32:<\/p>\n<pre><code>100_000_000 \u00d7 1024 \u00d7 4 \u0431\u0430\u0439\u0442\u0430 = 409 \u0413\u0411<\/code><div class=\"code-explainer\"><a href=\"https:\/\/sourcecraft.dev\/\" class=\"tm-button code-explainer__link\" style=\"visibility: hidden;\"><img style=\"width:87px;height:14px;object-fit:cover;object-position:left;\"\/><\/a><\/div><\/pre>\n<p>409 \u0433\u0438\u0433\u0430\u0431\u0430\u0439\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u0434 \u0441\u044b\u0440\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b, \u0431\u0435\u0437 HNSW-\u0433\u0440\u0430\u0444\u0430 \u0441\u0432\u0435\u0440\u0445\u0443 (\u0430 \u043e\u043d \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u0435\u0449\u0435 30-50%). \u042d\u0442\u043e \u0443\u0436\u0435 \u043d\u0435 \u0432\u043b\u0435\u0437\u0430\u0435\u0442 \u0432 \u043e\u0434\u0438\u043d \u0443\u0437\u0435\u043b \u0438 \u0441\u0442\u043e\u0438\u0442 \u043e\u0449\u0443\u0442\u0438\u043c\u044b\u0445 \u0434\u0435\u043d\u0435\u0433 \u0432 \u0447\u0430\u0441. \u0422\u043e\u0442 \u0436\u0435 \u0438\u043d\u0434\u0435\u043a\u0441 \u043f\u043e\u0441\u043b\u0435 \u0430\u0433\u0440\u0435\u0441\u0441\u0438\u0432\u043d\u043e\u0433\u043e \u0441\u0436\u0430\u0442\u0438\u044f &#8212; \u0435\u0434\u0438\u043d\u0438\u0446\u044b \u0433\u0438\u0433\u0430\u0431\u0430\u0439\u0442. \u0412\u043e\u043f\u0440\u043e\u0441 \u043d\u0435 \u0432 \u0442\u043e\u043c, \u0441\u0436\u0438\u043c\u0430\u0442\u044c \u043b\u0438. \u0412\u043e\u043f\u0440\u043e\u0441 &#8212; <strong>\u0433\u0434\u0435 \u0442\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall<\/strong><\/p>\n<p>\u0412 \u044d\u0442\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435 \u0440\u0430\u0437\u0431\u0435\u0440\u0435\u043c \u0432\u0441\u0435 \u043e\u0441\u0438 \u0441\u0436\u0430\u0442\u0438\u044f, \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 \u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0435 \u0437\u0430\u043c\u0435\u0440\u044b, \u0433\u0434\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0434\u0435\u0433\u0440\u0430\u0434\u0438\u0440\u0443\u0435\u0442 \u043c\u044f\u0433\u043a\u043e, \u0430 \u0433\u0434\u0435 \u043e\u0431\u0440\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u0432 \u043f\u0440\u043e\u043f\u0430\u0441\u0442\u044c, \u0438 \u0432\u0430\u0441 \u0436\u0434\u0435\u0442 \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043c\u044b\u0439 \u0441\u043a\u0440\u0438\u043f\u0442 + Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a, \u0447\u0442\u043e\u0431\u044b \u0432\u044b \u043f\u0440\u043e\u0433\u043d\u0430\u043b\u0438 \u0442\u043e \u0436\u0435 \u0441\u0430\u043c\u043e\u0435 \u043d\u0430 \u0441\u0432\u043e\u0438\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445, \u0435\u0441\u043b\u0438 \u0431\u0443\u0434\u0435\u0442 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e.<\/p>\n<p>&gt;<em> \u0412\u0435\u0441\u044c \u043a\u043e\u0434 \u0438 \u0434\u0430\u043d\u043d\u044b\u0435 \u0434\u043b\u044f \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u044f &#8212; \u0432 \u043a\u043e\u043d\u0446\u0435 \u0441\u0442\u0430\u0442\u044c\u0438. \u0421\u043a\u0440\u0438\u043f\u0442 <\/em><code><em>compress_experiment.py<\/em><\/code><em> \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u0432\u0430\u0448\u0443 \u043c\u0430\u0442\u0440\u0438\u0446\u0443 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u043e\u0432 \u0438 \u0438\u0437\u043c\u0435\u0440\u044f\u0435\u0442 \u0432\u0441\u0435, \u0447\u0442\u043e \u043d\u0438\u0436\u0435, \u043d\u0430 CPU. Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a \u0434\u0435\u043b\u0430\u0435\u0442 \u0442\u043e \u0436\u0435 \u0441\u0430\u043c\u043e\u0435 \u043d\u0430 \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u0439 <\/em><code><em>Qwen3-Embedding-0.6B<\/em><\/code><em> &#8212; free-\u0432\u0435\u0440\u0441\u0438\u0438 T4 \u0445\u0432\u0430\u0442\u0430\u0435\u0442<\/em><\/p>\n<p><strong>\u0422\u0440\u0438 \u043e\u0441\u0438 \u0441\u0436\u0430\u0442\u0438\u044f (\u0438 \u043f\u043e\u0447\u0435\u043c\u0443 \u0438\u0445 \u043f\u0443\u0442\u0430\u044e\u0442)<\/strong><\/p>\n<p>\u041a\u043e\u0433\u0434\u0430 \u0433\u043e\u0432\u043e\u0440\u044f\u0442 \u00ab\u0441\u0436\u0430\u0442\u044c \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u00bb, \u043e\u0431\u044b\u0447\u043d\u043e \u0441\u043c\u0435\u0448\u0438\u0432\u0430\u044e\u0442 \u0442\u0440\u0438 \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u044b\u0435 \u0432\u0435\u0449\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043d\u0430 \u0440\u0430\u0437\u043d\u044b\u0445 \u0443\u0440\u043e\u0432\u043d\u044f\u0445:<\/p>\n<p><strong>1. \u0414\u0438\u0441\u0442\u0438\u043b\u043b\u044f\u0446\u0438\u044f &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0441\u0430\u043c\u0443 \u043c\u043e\u0434\u0435\u043b\u044c.<\/strong> \u0423\u0447\u0438\u043c \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c (0.6B) \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u044c \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 (8B). \u0423\u043c\u0435\u043d\u044c\u0448\u0430\u0435\u0442\u0441\u044f \u0432\u0435\u0441 \u043c\u043e\u0434\u0435\u043b\u0438, latency \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0438, \u043a\u043e\u0441\u0432\u0435\u043d\u043d\u043e, \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u0432\u0435\u043a\u0442\u043e\u0440\u0430. \u042d\u0442\u043e \u0441\u0430\u043c\u044b\u0439 \u0434\u043e\u0440\u043e\u0433\u043e\u0439 \u043f\u0443\u0442\u044c: \u043d\u0443\u0436\u0435\u043d \u0441\u0432\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435. \u0414\u0438\u0441\u0442\u0438\u043b\u043b\u044f\u0446\u0438\u044e \u044f \u043e\u0441\u0442\u0430\u0432\u043b\u044e \u0437\u0430 \u0441\u043a\u043e\u0431\u043a\u0430\u043c\u0438 &#8212; \u043e\u043d\u0430 \u0441\u043c\u044b\u043a\u0430\u0435\u0442\u0441\u044f \u0441 \u0444\u0430\u0439\u043d\u0442\u044e\u043d\u043e\u043c \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u0430, \u0430 \u044d\u0442\u043e \u0434\u043e\u0441\u0442\u043e\u0439\u043d\u043e \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u0441\u0442\u0430\u0442\u0435\u0439<\/p>\n<p><strong>2. \u041a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u0447\u0438\u0441\u0435\u043b \u0432 \u0432\u0435\u043a\u0442\u043e\u0440\u0435.<\/strong> \u0412\u0435\u043a\u0442\u043e\u0440 \u043e\u0441\u0442\u0430\u0435\u0442\u0441\u044f \u0442\u043e\u0439 \u0436\u0435 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438, \u043d\u043e \u043a\u0430\u0436\u0434\u043e\u0435 \u0447\u0438\u0441\u043b\u043e \u0445\u0440\u0430\u043d\u0438\u0442\u0441\u044f \u043d\u0435 \u0432 fp32 (4 \u0431\u0430\u0439\u0442\u0430), \u0430 \u0432 int8 (1 \u0431\u0430\u0439\u0442), int4 (\u043f\u043e\u043b\u0431\u0430\u0439\u0442\u0430) \u0438\u043b\u0438 \u0432\u043e\u043e\u0431\u0449\u0435 \u0432 1 \u0431\u0438\u0442\u0435. \u041c\u043e\u0434\u0435\u043b\u044c \u043d\u0435 \u0442\u0440\u043e\u0433\u0430\u0435\u043c &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0443\u0436\u0435 \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b. \u0414\u0435\u0448\u0435\u0432\u043e, \u043e\u0431\u0440\u0430\u0442\u0438\u043c\u043e, \u0434\u0430\u0435\u0442 4\u201332x<\/p>\n<p><strong>3. MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u0432\u0435\u043a\u0442\u043e\u0440\u0430.<\/strong> \u041c\u0430\u0442\u0440\u0435\u0448\u043a\u0430 (Matryoshka Representation Learning): \u0440\u0435\u0436\u0435\u043c 1024-\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0434\u043e 512\/256\/128, \u0435\u0441\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0430 \u0442\u0430\u043a, \u0447\u0442\u043e \u0432\u0430\u0436\u043d\u043e\u0435 \u043b\u0435\u0436\u0438\u0442 \u0432 \u043f\u0435\u0440\u0432\u044b\u0445 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u0430\u0445<\/p>\n<p>\u041a\u043b\u044e\u0447\u0435\u0432\u043e\u0439 \u0444\u0430\u043a\u0442, \u0440\u0430\u0434\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e \u0441\u0442\u043e\u0438\u0442 \u0434\u0435\u0440\u0436\u0430\u0442\u044c \u044d\u0442\u0443 \u0442\u0440\u043e\u0439\u043a\u0443 \u0432 \u0433\u043e\u043b\u043e\u0432\u0435: <strong>\u043e\u0441\u0438 2 \u0438 3 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043d\u0435 \u0442\u0440\u0435\u0431\u0443\u044e\u0442 GPU \u0438 \u043d\u0435 \u0442\u0440\u043e\u0433\u0430\u044e\u0442 \u043c\u043e\u0434\u0435\u043b\u044c<\/strong>. \u041e\u043d\u0438 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043f\u043e\u0432\u0435\u0440\u0445 \u0433\u043e\u0442\u043e\u0432\u043e\u0439 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432. GPU \u043d\u0443\u0436\u0435\u043d \u0440\u043e\u0432\u043d\u043e \u043e\u0434\u0438\u043d \u0440\u0430\u0437 &#8212; \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0441\u0430\u043c\u0438 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438. \u0412\u0441\u0435 \u043e\u0441\u0442\u0430\u043b\u044c\u043d\u043e\u0435 &#8212; \u0430\u0440\u0438\u0444\u043c\u0435\u0442\u0438\u043a\u0430 \u043d\u0430 CPU<\/p>\n<p>\u041e\u0442\u0434\u0435\u043b\u044c\u043d\u043e \u0441\u0442\u043e\u0438\u0442 <strong>Product Quantization (PQ)<\/strong> &#8212; \u0442\u043e\u0436\u0435 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f, \u043d\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u0430\u044f: \u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u043e \u0431\u044c\u0435\u0442\u0441\u044f \u043d\u0430 \u043f\u043e\u0434\u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u0430, \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u0442\u0440\u043e\u0438\u0442\u0441\u044f \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0438\u0439 \u043a\u043e\u0434\u0431\u0443\u043a. PQ \u0436\u0438\u0432\u0435\u0442 \u043d\u0430 \u0441\u0442\u043e\u0440\u043e\u043d\u0435 \u0445\u0440\u0430\u043d\u0438\u043b\u0438\u0449\u0430 (Qdrant, FAISS), \u0430 \u043d\u0435 \u043c\u043e\u0434\u0435\u043b\u0438. \u0420\u0430\u0437\u0431\u0435\u0440\u0435\u043c \u0435\u0433\u043e \u0432\u043c\u0435\u0441\u0442\u0435 \u0441 \u043e\u0441\u0442\u0430\u043b\u044c\u043d\u044b\u043c\u0438<\/p>\n<p><strong>\u041a\u0430\u043a \u0447\u0435\u0441\u0442\u043d\u043e \u043c\u0435\u0440\u0438\u0442\u044c \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u044e \u043e\u0442 \u0441\u0436\u0430\u0442\u0438\u044f<\/strong><\/p>\n<p>\u0414\u043b\u044f \u043d\u0430\u0447\u0430\u043b\u0430 \u0440\u0430\u0437\u0431\u0435\u0440\u0435\u043c \u043c\u0435\u0442\u043e\u0434\u043e\u043b\u043e\u0433\u0438\u044e<\/p>\n<p>\u0421\u0436\u0430\u0442\u0438\u0435 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0431\u043c\u0435\u043d\u0438\u0432\u0430\u0435\u0442 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u043d\u0430 \u043f\u0430\u043c\u044f\u0442\u044c. \u0427\u0442\u043e\u0431\u044b \u0438\u0437\u043c\u0435\u0440\u0438\u0442\u044c \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e, \u043d\u0443\u0436\u0435\u043d \u044d\u0442\u0430\u043b\u043e\u043d. \u0421\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0439 \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u044b\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a \u0441 \u0440\u0443\u0447\u043d\u043e\u0439 \u0440\u0430\u0437\u043c\u0435\u0442\u043a\u043e\u0439 \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u043e\u0441\u0442\u0438 \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u0435\u043d <span class=\"habrahidden\">(\u043d\u043e \u044d\u0442\u0430 \u0442\u0435\u043c\u0430 \u0442\u043e\u0436\u0435 \u0434\u043e\u0441\u0442\u043e\u0439\u043d\u0430 \u0431\u044b\u0442\u044c \u0440\u0430\u0437\u043e\u0431\u0440\u0430\u043d\u043d\u043e\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e)<\/span> \u0438 \u043e\u0442\u0432\u0435\u0447\u0430\u0435\u0442 \u043e\u043d \u043d\u0430 \u0434\u0440\u0443\u0433\u043e\u0439 \u0432\u043e\u043f\u0440\u043e\u0441 &#8212; \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0445\u043e\u0440\u043e\u0448 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440 \u0432\u043e\u043e\u0431\u0449\u0435. \u0417\u0434\u0435\u0441\u044c \u0432\u043e\u043f\u0440\u043e\u0441 \u0434\u0440\u0443\u0433\u043e\u0439: \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0436\u0430\u0442\u0438\u0435 \u0438\u0441\u043f\u043e\u0440\u0442\u0438\u043b\u043e \u0442\u043e, \u0447\u0442\u043e \u0443\u0436\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u0418 \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u044b\u0439 \u044d\u0442\u0430\u043b\u043e\u043d \u0434\u043b\u044f \u043d\u0435\u0433\u043e &#8212; <strong>\u0441\u0430\u043c \u043d\u0435\u0441\u0436\u0430\u0442\u044b\u0439 \u043f\u043e\u0438\u0441\u043a<\/strong>.<\/p>\n<p>\u041c\u0435\u0442\u043e\u0434\u043e\u043b\u043e\u0433\u0438\u044f \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u0430\u044f, \u0435\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442 ann-benchmarks \u0438 \u0441\u0430\u043c Qdrant \u043f\u0440\u0438 \u0437\u0430\u043c\u0435\u0440\u0435 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438:<\/p>\n<ol>\n<li>\n<p>\u0411\u0435\u0440\u0435\u043c \u043d\u0435\u0441\u0436\u0430\u0442\u044b\u0435 fp32-\u0432\u0435\u043a\u0442\u043e\u0440\u044b. \u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0437\u0430\u043f\u0440\u043e\u0441\u0430 \u0442\u043e\u0447\u043d\u044b\u043c \u043f\u0435\u0440\u0435\u0431\u043e\u0440\u043e\u043c \u043d\u0430\u0445\u043e\u0434\u0438\u043c top-10 \u0431\u043b\u0438\u0436\u0430\u0439\u0448\u0438\u0445. \u042d\u0442\u043e <strong>golden<\/strong><\/p>\n<\/li>\n<li>\n<p>\u0421\u0436\u0438\u043c\u0430\u0435\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u044b \u043b\u044e\u0431\u044b\u043c \u043c\u0435\u0442\u043e\u0434\u043e\u043c. \u0414\u043b\u044f \u0442\u0435\u0445 \u0436\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u0438\u0449\u0435\u043c top-10 \u0443\u0436\u0435 \u043f\u043e \u0441\u0436\u0430\u0442\u044b\u043c<\/p>\n<\/li>\n<li>\n<p><code>recall@10 = |top10_\u0441\u0436\u0430\u0442\u044b\u0439 \u2229 top10_fp32| \/ 10<\/code>, \u0443\u0441\u0440\u0435\u0434\u043d\u044f\u0435\u043c \u043f\u043e \u0437\u0430\u043f\u0440\u043e\u0441\u0430\u043c<\/p>\n<\/li>\n<\/ol>\n<p>recall@10 = 1.0 \u043e\u0437\u043d\u0430\u0447\u0430\u0435\u0442, \u0447\u0442\u043e \u0441\u0436\u0430\u0442\u0438\u0435 \u043d\u0438\u0447\u0435\u0433\u043e \u043d\u0435 \u0438\u0437\u043c\u0435\u043d\u0438\u043b\u043e \u0432 \u0432\u044b\u0434\u0430\u0447\u0435. <\/p>\n<p>recall@10 = 0.7 \u2014 \u0432 \u0441\u0440\u0435\u0434\u043d\u0435\u043c 3 \u0438\u0437 10 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u0441\u0436\u0430\u0442\u0438\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u043e. <\/p>\n<p>\u0420\u0443\u0447\u043d\u0430\u044f \u0440\u0430\u0437\u043c\u0435\u0442\u043a\u0430 \u0442\u0443\u0442 \u043d\u0435 \u043d\u0443\u0436\u043d\u0430: \u043c\u044b \u0438\u0437\u043c\u0435\u0440\u044f\u0435\u043c <strong>\u043f\u043e\u0442\u0435\u0440\u044e \u043e\u0442 \u0441\u0436\u0430\u0442\u0438\u044f<\/strong>, \u0438 fp32-\u0432\u044b\u0434\u0430\u0447\u0430 \u0441\u043b\u0443\u0436\u0438\u0442 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u043c \u043d\u0443\u043b\u0435\u043c \u043e\u0442\u0441\u0447\u0435\u0442\u0430.<\/p>\n<pre><code class=\"python\">def recall_at_k(pred, gold, k=10):    hits = sum(len(set(p[:k]) &amp; set(g[:k])) for p, g in zip(pred, gold))    return hits \/ (len(gold) * k)<\/code><div class=\"code-explainer\"><a href=\"https:\/\/sourcecraft.dev\/\" class=\"tm-button code-explainer__link\" style=\"visibility: hidden;\"><img style=\"width:14px;height:14px;object-fit:cover;object-position:left;\"\/><\/a><\/div><\/pre>\n<p>\u0412\u0441\u0435 \u0446\u0438\u0444\u0440\u044b \u043d\u0438\u0436\u0435 &#8212; \u043f\u0440\u043e\u0433\u043e\u043d <code>Qwen3-Embedding-0.6B<\/code> (1024-dim) \u043d\u0430 \u043a\u043e\u0440\u043f\u0443\u0441\u0435 \u0438\u0437 5500 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432, 500 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432. \u042d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438 \u0441\u0447\u0438\u0442\u0430\u0435\u0442 Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a (\u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0439 GPU-\u0448\u0430\u0433), \u0434\u0430\u043b\u044c\u0448\u0435 <code>compress_experiment.py<\/code>\u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442 \u0437\u0430\u043c\u0435\u0440\u044b \u043d\u0430 CPU. Golden &#8212; \u0442\u043e\u0447\u043d\u044b\u0439 fp32-\u043f\u043e\u0438\u0441\u043a \u043f\u043e \u043f\u043e\u043b\u043d\u044b\u043c 1024-\u043c\u0435\u0440\u043d\u044b\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c.<\/p>\n<p><strong>\u041a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f: int8 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d, binary \u2014 \u043e\u0431\u0440\u044b\u0432<\/strong><\/p>\n<p>\u041d\u0430\u0447\u043d\u0435\u043c \u0441 \u043f\u043e\u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043d\u043e\u0439 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438. \u0418\u0434\u0435\u044f: \u0443 \u043a\u0430\u0436\u0434\u043e\u0439 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u044b \u0432\u0435\u043a\u0442\u043e\u0440\u0430 \u0435\u0441\u0442\u044c \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d <code>[min, max]<\/code> \u043f\u043e \u043a\u043e\u0440\u043f\u0443\u0441\u0443. \u0420\u0430\u0437\u0431\u0438\u0432\u0430\u0435\u043c \u0435\u0433\u043e \u043d\u0430 <code>2^bits<\/code> \u0443\u0440\u043e\u0432\u043d\u0435\u0439 \u0438 \u0445\u0440\u0430\u043d\u0438\u043c \u043d\u043e\u043c\u0435\u0440 \u0443\u0440\u043e\u0432\u043d\u044f \u0432\u043c\u0435\u0441\u0442\u043e float.<\/p>\n<pre><code class=\"python\">def q_scalar(C, bits):    levels = (1 &lt;&lt; bits) - 1    lo, hi = C.min(0), C.max(0)          # \u043f\u043e \u043a\u0430\u0436\u0434\u043e\u0439 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e    scale = (hi - lo) \/ levels    codes = np.clip(np.round((C - lo) \/ scale), 0, levels)    return codes * scale + lo            # \u0434\u0435\u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440<\/code><div class=\"code-explainer\"><a href=\"https:\/\/sourcecraft.dev\/\" class=\"tm-button code-explainer__link\" style=\"visibility: hidden;\"><img style=\"width:14px;height:14px;object-fit:cover;object-position:left;\"\/><\/a><\/div><\/pre>\n<p>\u0412\u043e\u0442 \u0447\u0442\u043e \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u0441 recall@10 \u0438 \u043f\u0430\u043c\u044f\u0442\u044c\u044e \u043f\u043e \u0448\u0430\u0433\u0430\u043c \u0441\u0436\u0430\u0442\u0438\u044f:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"182\" width=\"182\">\n<p align=\"center\"><strong>\u041c\u0435\u0442\u043e\u0434<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"120\" width=\"120\">\n<p align=\"center\"><strong>recall@10<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"126\" width=\"126\">\n<p align=\"center\"><strong>\u0411\u0430\u0439\u0442\/\u0432\u0435\u043a\u0442\u043e\u0440<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"115\" width=\"115\">\n<p align=\"center\"><strong>\u0421\u0436\u0430\u0442\u0438\u0435<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\"><strong>\u0413\u0411 \u043d\u0430 1\u041c \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"182\" width=\"182\">\n<p align=\"center\">fp32 (baseline)<\/p>\n<\/td>\n<td data-colwidth=\"120\" width=\"120\">\n<p align=\"center\">1.0000<\/p>\n<\/td>\n<td data-colwidth=\"126\" width=\"126\">\n<p align=\"center\">4096<\/p>\n<\/td>\n<td data-colwidth=\"115\" width=\"115\">\n<p align=\"center\">1x<\/p>\n<\/td>\n<td>\n<p align=\"center\">4.096<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"182\" width=\"182\">\n<p align=\"center\">fp16<\/p>\n<\/td>\n<td data-colwidth=\"120\" width=\"120\">\n<p align=\"center\">0.9984<\/p>\n<\/td>\n<td data-colwidth=\"126\" width=\"126\">\n<p align=\"center\">2048<\/p>\n<\/td>\n<td data-colwidth=\"115\" width=\"115\">\n<p align=\"center\">2x<\/p>\n<\/td>\n<td>\n<p align=\"center\">2.048<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"182\" width=\"182\">\n<p align=\"center\"><strong>int8<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"120\" width=\"120\">\n<p align=\"center\"><strong>0.9964<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"126\" width=\"126\">\n<p align=\"center\"><strong>1024<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"115\" width=\"115\">\n<p align=\"center\"><strong>4x<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\"><strong>1.024<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"182\" width=\"182\">\n<p align=\"center\">int4<\/p>\n<\/td>\n<td data-colwidth=\"120\" width=\"120\">\n<p align=\"center\">0.9478<\/p>\n<\/td>\n<td data-colwidth=\"126\" width=\"126\">\n<p align=\"center\">512<\/p>\n<\/td>\n<td data-colwidth=\"115\" width=\"115\">\n<p align=\"center\">8x<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.512<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"182\" width=\"182\">\n<p align=\"center\">binary (\u0431\u0435\u0437 rescore)<\/p>\n<\/td>\n<td data-colwidth=\"120\" width=\"120\">\n<p align=\"center\">0.6696<\/p>\n<\/td>\n<td data-colwidth=\"126\" width=\"126\">\n<p align=\"center\">128<\/p>\n<\/td>\n<td data-colwidth=\"115\" width=\"115\">\n<p align=\"center\">32x<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.128<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<figure class=\"full-width \"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/177\/f5d\/ef4\/177f5def4e5b08d8a2776d750c59d980.png\" alt=\"\u0421\u043a\u0430\u043b\u044f\u0440\u043d\u043e\u0435 \u0441\u0436\u0430\u0442\u0438\u0435: \u0442\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall\" title=\"\u0421\u043a\u0430\u043b\u044f\u0440\u043d\u043e\u0435 \u0441\u0436\u0430\u0442\u0438\u0435: \u0442\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall\" width=\"1040\" height=\"650\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/177\/f5d\/ef4\/177f5def4e5b08d8a2776d750c59d980.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/177\/f5d\/ef4\/177f5def4e5b08d8a2776d750c59d980.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0421\u043a\u0430\u043b\u044f\u0440\u043d\u043e\u0435 \u0441\u0436\u0430\u0442\u0438\u0435: \u0442\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall<\/figcaption><\/div>\n<\/figure>\n<p><strong>fp16 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d.<\/strong> \u0412\u0434\u0432\u043e\u0435 \u043c\u0435\u043d\u044c\u0448\u0435 \u043f\u0430\u043c\u044f\u0442\u0438, recall \u043d\u0435 \u043e\u0442\u043b\u0438\u0447\u0438\u0442\u044c \u043e\u0442 fp32 (0.9984). \u0415\u0441\u043b\u0438 \u0432\u044b \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u0445\u0440\u0430\u043d\u0438\u0442\u0435 \u0438\u043d\u0434\u0435\u043a\u0441 \u0432 fp32 &#8212; \u0432\u044b \u043f\u0440\u043e\u0441\u0442\u043e \u043f\u043b\u0430\u0442\u0438\u0442\u0435 \u0432\u0434\u0432\u043e\u0435 \u043d\u0438 \u0437\u0430 \u0447\u0442\u043e. fp16 \u0441\u0442\u043e\u0438\u0442 \u0432\u043a\u043b\u044e\u0447\u0430\u0442\u044c \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e, \u043a\u0430\u043a \u0431\u0430\u0437\u043e\u0432\u0443\u044e \u0433\u0438\u0433\u0438\u0435\u043d\u0443 \u0438\u043d\u0434\u0435\u043a\u0441\u0430.<\/p>\n<p><strong>int8 &#8212; \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d \u0438 \u044d\u0442\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u0430\u044f \u0442\u043e\u0447\u043a\u0430 \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e.<\/strong> 4x \u0441\u0436\u0430\u0442\u0438\u044f, recall 0.9964 &#8212; \u043f\u0430\u0434\u0435\u043d\u0438\u0435 \u0432 \u0442\u0440\u0435\u0442\u044c \u043f\u0440\u043e\u0446\u0435\u043d\u0442\u0430. \u0421\u043e\u0433\u043b\u0430\u0441\u0443\u0435\u0442\u0441\u044f \u0441 \u0442\u0435\u043c, \u0447\u0442\u043e \u0437\u0430\u044f\u0432\u043b\u044f\u0435\u0442 Qwen: int8-\u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442 retrieval-\u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0441 \u043f\u0440\u0435\u043d\u0435\u0431\u0440\u0435\u0436\u0438\u043c\u043e\u0439 \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0435\u0439. 409 \u0413\u0411 \u0438\u0437 \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0432\u043e \u0432\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0438 \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u044e\u0442\u0441\u044f \u0432 ~102 \u0413\u0411, \u0438 \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0437 \u043f\u043e\u0441\u043b\u0435\u0434\u0441\u0442\u0432\u0438\u0439.<\/p>\n<p><strong>int4 &#8212; \u043e\u0441\u043e\u0437\u043d\u0430\u043d\u043d\u044b\u0439, \u043d\u043e \u0449\u0430\u0434\u044f\u0449\u0438\u0439 \u0440\u0430\u0437\u043c\u0435\u043d.<\/strong> 8x \u0441\u0436\u0430\u0442\u0438\u044f, recall 0.948 \u2014 \u043c\u0438\u043d\u0443\u0441 ~5 \u043f\u0443\u043d\u043a\u0442\u043e\u0432. \u0414\u043b\u044f \u043c\u043d\u043e\u0433\u0438\u0445 \u043f\u0440\u043e\u0434\u043e\u0432\u044b\u0445 \u0441\u0446\u0435\u043d\u0430\u0440\u0438\u0435\u0432 \u044d\u0442\u043e \u0442\u0435\u0440\u043f\u0438\u043c\u043e (\u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0435\u0441\u043b\u0438 \u0441\u0432\u0435\u0440\u0445\u0443 \u0441\u0442\u043e\u0438\u0442 reranker, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u0435\u0440\u0435\u0440\u0430\u043d\u0436\u0438\u0440\u0443\u0435\u0442 \u0442\u043e\u043f), \u043d\u043e \u0432\u043a\u043b\u044e\u0447\u0430\u0442\u044c int4 \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u0443\u0436\u0435 \u043d\u0435\u043b\u044c\u0437\u044f &#8212; \u0441\u0432\u0435\u0440\u044f\u0439\u0442\u0435\u0441\u044c \u0441 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u043c.<\/p>\n<p><strong>binary \u0432 \u043e\u0434\u0438\u043d\u043e\u0447\u043a\u0443 &#8212; \u043a\u0430\u0442\u0430\u0441\u0442\u0440\u043e\u0444\u0430.<\/strong> 32x \u0441\u0436\u0430\u0442\u0438\u044f \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0441\u043e\u0431\u043b\u0430\u0437\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e, \u043d\u043e recall \u0440\u0443\u0445\u043d\u0443\u043b \u0434\u043e 0.67. \u0422\u0440\u0435\u0442\u044c \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u044b\u0445 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u043f\u0440\u043e\u0441\u0442\u043e \u0442\u0435\u0440\u044f\u0435\u0442\u0441\u044f. \u0415\u0441\u043b\u0438 \u0432\u044b \u0432\u043a\u043b\u044e\u0447\u0438\u043b\u0438 binary quantization \u0438 \u043d\u0435 \u0441\u0434\u0435\u043b\u0430\u043b\u0438 \u043d\u0438\u0447\u0435\u0433\u043e \u0431\u043e\u043b\u044c\u0448\u0435 &#8212; \u0432\u044b \u0441\u043b\u043e\u043c\u0430\u043b\u0438 \u043f\u043e\u0438\u0441\u043a. \u0418 \u0432\u043e\u0442 \u0442\u0443\u0442 \u043d\u0430\u0447\u0438\u043d\u0430\u0435\u0442\u0441\u044f \u0441\u0430\u043c\u043e\u0435 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0435.<\/p>\n<p><strong>Binary + rescoring: \u043a\u0430\u043a \u0432\u0435\u0440\u043d\u0443\u0442\u044c recall \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e<\/strong><\/p>\n<p>Binary quantization \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u043e\u0442 \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u043e\u0434\u0438\u043d \u0431\u0438\u0442 &#8212; \u0437\u043d\u0430\u043a. \u0412\u0435\u043a\u0442\u043e\u0440 \u043d\u0430 1024 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f \u0441\u0436\u0438\u043c\u0430\u0435\u0442\u0441\u044f \u0441 4096 \u0431\u0430\u0439\u0442 \u0434\u043e 128 \u0431\u0430\u0439\u0442, \u0438 \u043f\u043e\u0438\u0441\u043a \u0438\u0434\u0435\u0442 \u043f\u043e \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u044e \u0425\u044d\u043c\u043c\u0438\u043d\u0433\u0430 (XOR + popcount) &#8212; \u044d\u0442\u043e \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0438 \u043d\u0430 \u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0445 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u043e\u0440\u0430, \u0434\u0438\u043a\u043e \u0431\u044b\u0441\u0442\u0440\u044b\u0435. \u041f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u043e\u0434\u043d\u0430: \u043e\u0434\u043d\u043e\u0433\u043e \u0431\u0438\u0442\u0430 \u043d\u0430 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 \u043c\u0430\u043b\u043e, \u0433\u0440\u0443\u0431\u044b\u0439 \u043f\u043e\u0438\u0441\u043a \u043f\u0443\u0442\u0430\u0435\u0442\u0441\u044f.<\/p>\n<p>\u0420\u0435\u0448\u0435\u043d\u0438\u0435 &#8212; <strong>oversampling + rescoring<\/strong>. \u041d\u0435 \u0431\u0435\u0440\u0435\u043c top-10 \u043f\u043e \u0431\u0438\u043d\u0430\u0440\u043d\u044b\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c. \u0411\u0435\u0440\u0435\u043c top-30 \u0438\u043b\u0438 top-50 (\u044d\u0442\u043e \u0438 \u0435\u0441\u0442\u044c oversampling), \u0430 \u043f\u043e\u0442\u043e\u043c <strong>\u043f\u0435\u0440\u0435\u0440\u0430\u043d\u0436\u0438\u0440\u0443\u0435\u043c \u044d\u0442\u0438\u0445 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u043e\u0432 \u043f\u043e \u043f\u043e\u043b\u043d\u044b\u043c fp32-\u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c<\/strong> \u0438 \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u043c \u043d\u0430\u0441\u0442\u043e\u044f\u0449\u0438\u0435 top-10.<\/p>\n<pre><code class=\"python\">def binary_rescore(Qb, Cb, Qf, Cf, k, oversample):    cand = binary_search(Qb, Cb, k * oversample)     # \u0433\u0440\u0443\u0431\u043e, \u043d\u043e \u0431\u044b\u0441\u0442\u0440\u043e: \u043f\u043e \u0431\u0438\u0442\u0430\u043c    out = []    for i in range(len(Qf)):        c = cand[i]        scores = Cf[c] @ Qf[i]                        # \u0442\u043e\u0447\u043d\u043e, \u043d\u043e \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u0430\u043c        out.append(c[np.argsort(-scores)[:k]])    return out<\/code><div class=\"code-explainer\"><a href=\"https:\/\/sourcecraft.dev\/\" class=\"tm-button code-explainer__link\" style=\"visibility: hidden;\"><img style=\"width:14px;height:14px;object-fit:cover;object-position:left;\"\/><\/a><\/div><\/pre>\n<p>\u0424\u043e\u043a\u0443\u0441 \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e rescoring \u0434\u0435\u0448\u0435\u0432\u044b\u0439: \u043c\u044b \u0441\u0447\u0438\u0442\u0430\u0435\u043c \u0442\u043e\u0447\u043d\u043e\u0435 \u0441\u043a\u0430\u043b\u044f\u0440\u043d\u043e\u0435 \u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u043d\u0435 \u043f\u043e \u0432\u0441\u0435\u0439 \u0431\u0430\u0437\u0435, \u0430 \u043f\u043e 30\u201350 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u0430\u043c \u043d\u0430 \u0437\u0430\u043f\u0440\u043e\u0441. \u0421\u043c\u043e\u0442\u0440\u0438\u043c, \u043a\u0430\u043a oversampling \u0432\u044b\u0442\u0430\u0441\u043a\u0438\u0432\u0430\u0435\u0442 recall:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td>\n<p align=\"center\"><strong>\u041a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u044f<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\"><strong>recall@10<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"center\">binary \u0431\u0435\u0437 rescore<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.6696<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"center\">binary + rescore \u00d72<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.8598<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"center\">binary + rescore \u00d73<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.9248<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"center\">binary + rescore \u00d75<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.9666<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td>\n<p align=\"center\">binary + rescore \u00d710<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.9912<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<figure class=\"full-width \"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/20d\/5df\/9e2\/20d5df9e24d7fd039b7c3da82ddf368a.png\" alt=\"Binary + rescoring: \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e\u0435 \u0432\u043e\u0441\u0441\u0442\u0430\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u0435 recall\" title=\"Binary + rescoring: \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e\u0435 \u0432\u043e\u0441\u0441\u0442\u0430\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u0435 recall\" width=\"1040\" height=\"650\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/20d\/5df\/9e2\/20d5df9e24d7fd039b7c3da82ddf368a.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/20d\/5df\/9e2\/20d5df9e24d7fd039b7c3da82ddf368a.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>Binary + rescoring: \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e\u0435 \u0432\u043e\u0441\u0441\u0442\u0430\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u0435 recall<\/figcaption><\/div>\n<\/figure>\n<p>\u0418\u0437 recall 0.67 \u043f\u0440\u0438 \u00d73 oversampling \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f 0.925, \u043f\u0440\u0438 \u00d75 &#8212; 0.967, \u043f\u0440\u0438 \u00d710 &#8212; \u043f\u043e\u0447\u0442\u0438 fp32 (0.991). \u0414\u043b\u044f \u0442\u0440\u0435\u0445-\u043f\u044f\u0442\u0438\u043a\u0440\u0430\u0442\u043d\u043e\u0439 \u00ab\u043f\u0435\u0440\u0435\u0431\u043e\u0440\u043a\u0438\u00bb \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u043e\u0432 \u043f\u0440\u0438 32\u00d7 \u0441\u0436\u0430\u0442\u0438\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0433\u043e \u0438\u043d\u0434\u0435\u043a\u0441\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0447\u0442\u0438 \u043f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0435\u0442\u0441\u044f. \u042d\u0442\u043e \u0440\u043e\u0432\u043d\u043e \u0442\u043e\u0442 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442, \u0440\u0430\u0434\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e binary quantization \u0432\u043e\u043e\u0431\u0449\u0435 \u0438\u043c\u0435\u0435\u0442 \u0441\u043c\u044b\u0441\u043b: <strong>\u0433\u0440\u0443\u0431\u044b\u0439 \u043f\u043e\u0438\u0441\u043a \u043f\u043e \u0431\u0438\u0442\u0430\u043c + \u0442\u043e\u0447\u043d\u044b\u0439 rerank \u043f\u043e \u043f\u043e\u043b\u043d\u044b\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c<\/strong>.<\/p>\n<p>\u041f\u0440\u0430\u043a\u0442\u0438\u043a\u0430 Qdrant \u044d\u0442\u043e \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442: \u043e\u043d\u0438 \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u044e\u0442 oversampling \u0432 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d\u0435 1.5\u20133x \u043a\u0430\u043a sweet spot \u0438 \u0441\u043e\u043e\u0431\u0449\u0430\u044e\u0442, \u0447\u0442\u043e \u043d\u0430 \u0432\u044b\u0441\u043e\u043a\u043e\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445 (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, Cohere 4096-dim) binary + rescoring \u0434\u0430\u0435\u0442 recall@50 \u043e\u043a\u043e\u043b\u043e 0.98 \u043f\u0440\u0438 2x oversampling, \u0443\u0441\u043a\u043e\u0440\u044f\u044f \u043f\u043e\u0438\u0441\u043a \u0434\u043e 40x. \u041b\u043e\u0433\u0438\u043a\u0430 \u0442\u0430 \u0436\u0435, \u0447\u0442\u043e \u0443 reranker&#8217;\u0430 \u0432 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u043e\u043c RAG: \u0434\u0435\u0448\u0435\u0432\u044b\u0439 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u043d\u044b\u0439 \u043e\u0442\u0431\u043e\u0440, \u0434\u043e\u0440\u043e\u0433\u043e\u0439 \u0442\u043e\u0447\u043d\u044b\u0439 \u0442\u043e\u043f.<\/p>\n<p>\u0417\u0434\u0435\u0441\u044c \u0436\u0435 &#8212; \u043f\u0435\u0440\u0432\u044b\u0439 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0430\u043d\u0442\u0438\u043f\u0430\u0442\u0442\u0435\u0440\u043d.<\/p>\n<p>&gt; <strong><em>Binary quantization \u0431\u0435\u0437 rescoring \u0443\u0431\u0438\u0432\u0430\u0435\u0442 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e; \u0441 rescoring &#8212; \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u0430.<\/em><\/strong><em> \u0420\u0430\u0437\u043d\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u00ab\u0441\u043b\u043e\u043c\u0430\u043d\u043d\u044b\u043c \u043f\u043e\u0438\u0441\u043a\u043e\u043c\u00bb (0.67) \u0438 \u00ab\u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u043e\u043c\u00bb (0.93\u20130.97) &#8212; \u044d\u0442\u043e \u043e\u0434\u043d\u0430 \u043e\u043f\u0446\u0438\u044f <\/em><code><em>rescore=True<\/em><\/code><em> \u0438 oversampling. \u0415\u0441\u043b\u0438 \u0432\u044b \u0432\u0438\u0434\u0438\u0442\u0435 \u0432 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0435, \u0447\u0442\u043e binary \u00ab\u043d\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442\u00bb, \u0432 9 \u0441\u043b\u0443\u0447\u0430\u044f\u0445 \u0438\u0437 10 \u043f\u0440\u043e\u0441\u0442\u043e \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u0435\u0442 rescoring.<\/em><\/p>\n<p>\u0418 \u0432\u0442\u043e\u0440\u043e\u0435, \u043c\u0435\u043d\u0435\u0435 \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u043e\u0435: <strong>binary \u043b\u044e\u0431\u0438\u0442 \u0432\u044b\u0441\u043e\u043a\u0443\u044e \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c.<\/strong> \u041e\u0434\u0438\u043d \u0431\u0438\u0442 \u043d\u0430 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 &#8212; \u0437\u043d\u0430\u0447\u0438\u0442, \u0432\u0435\u0441\u044c \u0441\u0438\u0433\u043d\u0430\u043b \u0434\u0435\u0440\u0436\u0438\u0442\u0441\u044f \u043d\u0430 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0435 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439. \u0427\u0435\u043c \u0432\u044b\u0448\u0435 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c, \u0442\u0435\u043c \u043b\u0435\u0433\u0447\u0435 \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0438\u0442\u0441\u044f \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u0430\u0446\u0438\u044f: \u043d\u0430 4096-dim \u043e\u043d\u0430 \u043e\u0442\u044a\u0435\u0434\u0430\u0435\u0442 \u0437\u0430\u043c\u0435\u0442\u043d\u043e \u043c\u0435\u043d\u044c\u0448\u0435, \u0447\u0435\u043c \u043d\u0430 1024 (\u0445\u043e\u0442\u044f rescoring \u043f\u043e\u043b\u0435\u0437\u0435\u043d \u0438 \u0442\u0430\u043c). \u0410 \u0432\u043e\u0442 \u0435\u0441\u043b\u0438 \u0432\u044b \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u0430\u0433\u0440\u0435\u0441\u0441\u0438\u0432\u043d\u043e \u0443\u0441\u0435\u043a\u043b\u0438 \u0432\u0435\u043a\u0442\u043e\u0440 \u043f\u043e MRL, \u0430 \u043f\u043e\u0442\u043e\u043c \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u043e\u0432\u0430\u043b\u0438 &#8212; \u0432\u044b \u0437\u0430\u0431\u0440\u0430\u043b\u0438 \u0443 binary \u0440\u043e\u0432\u043d\u043e \u0442\u043e\u0442 \u0431\u044e\u0434\u0436\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u043d \u0434\u0435\u0440\u0436\u0438\u0442\u0441\u044f.<\/p>\n<p><strong>MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435: \u043a\u043e\u0433\u0434\u0430 \u043c\u0430\u0442\u0440\u0435\u0448\u043a\u0430 \u043e\u043a\u0443\u043f\u0430\u0435\u0442\u0441\u044f \u0438 \u043f\u043e\u0447\u0435\u043c\u0443 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u043d\u0435 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e<\/strong><\/p>\n<p>Matryoshka Representation Learning &#8212; \u043f\u0440\u0438\u0435\u043c, \u043f\u0440\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043c\u043e\u0434\u0435\u043b\u044c \u043e\u0431\u0443\u0447\u0430\u044e\u0442 \u0442\u0430\u043a, \u0447\u0442\u043e\u0431\u044b \u0432\u0435\u043a\u0442\u043e\u0440 \u043e\u0441\u0442\u0430\u0432\u0430\u043b\u0441\u044f \u043e\u0441\u043c\u044b\u0441\u043b\u0435\u043d\u043d\u044b\u043c \u043f\u0440\u0438 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0438. \u041e\u0431\u0440\u0435\u0437\u0430\u043b\u0438 1024-\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0434\u043e \u043f\u0435\u0440\u0432\u044b\u0445 256 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442, \u043f\u0435\u0440\u0435\u043d\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043b\u0438 &#8212; \u0438 \u043e\u043d \u0432\u0441\u0435 \u0435\u0449\u0435 \u0438\u0449\u0435\u0442. Qwen3-Embedding \u043e\u0431\u0443\u0447\u0435\u043d\u0430 \u0441 MRL \u0438 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043e\u0442 32 \u0434\u043e 1024 \u0438\u0437 \u043a\u043e\u0440\u043e\u0431\u043a\u0438.<\/p>\n<p>\u0421\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u044b\u0439 \u0442\u0435\u0437\u0438\u0441 \u0437\u0432\u0443\u0447\u0438\u0442 \u0442\u0430\u043a: \u00abMRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043c\u044f\u0433\u043a\u043e \u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430 MRL-\u043c\u043e\u0434\u0435\u043b\u044f\u0445, \u043d\u0430 \u043e\u0431\u044b\u0447\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0432\u0441\u0435 \u043b\u043e\u043c\u0430\u0435\u0442\u00bb. \u042d\u0442\u043e <strong>\u043f\u043e\u0447\u0442\u0438<\/strong> \u043f\u0440\u0430\u0432\u0434\u0430, \u0438 \u0441\u0432\u0435\u0436\u0430\u044f \u0440\u0430\u0431\u043e\u0442\u0430 2026 \u0433\u043e\u0434\u0430 (\u00abTo MRL or not to MRL\u00bb, arXiv:2605.16608) \u0443\u0442\u043e\u0447\u043d\u044f\u0435\u0442, \u0433\u0434\u0435 \u0438\u043c\u0435\u043d\u043d\u043e.<\/p>\n<p>\u041e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f, \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438 \u0443\u0441\u0442\u043e\u0439\u0447\u0438\u0432\u044b \u043a \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044e <strong>\u0441\u0430\u043c\u0438 \u043f\u043e \u0441\u0435\u0431\u0435<\/strong>, \u0431\u0435\u0437 \u0432\u0441\u044f\u043a\u043e\u0433\u043e MRL &#8212; \u043d\u043e \u0442\u043e\u043b\u044c\u043a\u043e \u0434\u043e \u0443\u043c\u0435\u0440\u0435\u043d\u043d\u043e\u0433\u043e \u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u044f (\u043f\u0440\u0438\u043c\u0435\u0440\u043d\u043e \u0434\u043e \u221270\u202680% \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438). \u0410 \u0432\u043e\u0442 \u0432 \u0437\u043e\u043d\u0435 \u0442\u044f\u0436\u0435\u043b\u043e\u0433\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f (\u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u0435 \u043d\u0430 80%+, \u0442\u043e \u0435\u0441\u0442\u044c 1024 \u2192 128 \u0438 \u043d\u0438\u0436\u0435) \u043d\u0435\u043c\u0430\u0442\u00ad\u0440\u0435\u0448\u0435\u0447\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u043e\u0431\u0432\u0430\u043b\u0438\u0432\u0430\u044e\u0442\u0441\u044f, \u0438 \u0432\u043e\u0442 \u0442\u0430\u043c MRL \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0440\u0435\u0448\u0430\u0435\u0442. \u0422\u043e \u0435\u0441\u0442\u044c MRL \u043e\u0442\u0432\u0435\u0447\u0430\u0435\u0442 \u0437\u0430 \u0432\u044b\u0436\u0438\u0432\u0430\u043d\u0438\u0435 \u0432 \u0437\u043e\u043d\u0435 \u0430\u0433\u0440\u0435\u0441\u0441\u0438\u0432\u043d\u043e\u0433\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f; \u0443\u043c\u0435\u0440\u0435\u043d\u043d\u043e\u0435 \u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0438 \u0431\u0435\u0437 \u043d\u0435\u0433\u043e.<\/p>\n<p>\u041f\u0440\u043e\u0432\u0435\u0440\u0438\u043c \u043d\u0430 \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u043c Qwen3. \u041c\u044b \u0443\u0441\u0435\u043a\u0430\u043b\u0438 1024-\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0434\u0432\u0443\u043c\u044f \u0441\u043f\u043e\u0441\u043e\u0431\u0430\u043c\u0438: \u043d\u0430\u0442\u0438\u0432\u043d\u044b\u043c MRL (\u043f\u0435\u0440\u0432\u044b\u0435 k \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442 &#8212; \u0442\u0430\u043a \u043c\u043e\u0434\u0435\u043b\u044c \u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0430) \u0438 \u043f\u043e\u0441\u043b\u0435 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0439 \u043f\u0435\u0440\u0435\u0441\u0442\u0430\u043d\u043e\u0432\u043a\u0438 \u043e\u0441\u0435\u0439 (\u043b\u043e\u043c\u0430\u0435\u043c MRL-\u043f\u043e\u0440\u044f\u0434\u043e\u043a, \u044d\u043c\u0443\u043b\u0438\u0440\u0443\u044f \u00ab\u043e\u0431\u044b\u0447\u043d\u0443\u044e\u00bb \u043c\u043e\u0434\u0435\u043b\u044c). recall \u0438\u0437\u043c\u0435\u0440\u044f\u0435\u0442\u0441\u044f \u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043f\u043e\u043b\u043d\u043e\u0433\u043e 1024-\u043c\u0435\u0440\u043d\u043e\u0433\u043e \u043f\u043e\u0438\u0441\u043a\u0430:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"134\" width=\"134\">\n<p align=\"center\"><strong>\u0420\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"136\" width=\"136\">\n<p align=\"center\"><strong>\u0421\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u0435<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"216\" width=\"216\">\n<p align=\"center\"><strong>\u043d\u0430\u0442\u0438\u0432\u043d\u044b\u0439 MRL Qwen3<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\"><strong>\u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u043e\u0441\u0435\u0439<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"134\" width=\"134\">\n<p align=\"center\">512<\/p>\n<\/td>\n<td data-colwidth=\"136\" width=\"136\">\n<p align=\"center\">\u221250%<\/p>\n<\/td>\n<td data-colwidth=\"216\" width=\"216\">\n<p align=\"center\">0.7962<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.7612<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"134\" width=\"134\">\n<p align=\"center\">256<\/p>\n<\/td>\n<td data-colwidth=\"136\" width=\"136\">\n<p align=\"center\">\u221275%<\/p>\n<\/td>\n<td data-colwidth=\"216\" width=\"216\">\n<p align=\"center\">0.6662<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.6250<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"134\" width=\"134\">\n<p align=\"center\">128<\/p>\n<\/td>\n<td data-colwidth=\"136\" width=\"136\">\n<p align=\"center\">\u221288%<\/p>\n<\/td>\n<td data-colwidth=\"216\" width=\"216\">\n<p align=\"center\">0.5610<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.4730<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"134\" width=\"134\">\n<p align=\"center\">64<\/p>\n<\/td>\n<td data-colwidth=\"136\" width=\"136\">\n<p align=\"center\">\u221294%<\/p>\n<\/td>\n<td data-colwidth=\"216\" width=\"216\">\n<p align=\"center\">0.4354<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.3038<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"134\" width=\"134\">\n<p align=\"center\">32<\/p>\n<\/td>\n<td data-colwidth=\"136\" width=\"136\">\n<p align=\"center\">\u221297%<\/p>\n<\/td>\n<td data-colwidth=\"216\" width=\"216\">\n<p align=\"center\">0.3016<\/p>\n<\/td>\n<td>\n<p align=\"center\">0.1588<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<figure class=\"full-width \"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/4c1\/d1f\/5f4\/4c1d1f5f44aad463a95904b6b2439166.png\" alt=\"MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 Qwen3: \u043d\u0430\u0442\u0438\u0432\u043d\u044b\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u043f\u0440\u043e\u0442\u0438\u0432 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e\" title=\"MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 Qwen3: \u043d\u0430\u0442\u0438\u0432\u043d\u044b\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u043f\u0440\u043e\u0442\u0438\u0432 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e\" width=\"1040\" height=\"650\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/4c1\/d1f\/5f4\/4c1d1f5f44aad463a95904b6b2439166.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/4c1\/d1f\/5f4\/4c1d1f5f44aad463a95904b6b2439166.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 Qwen3: \u043d\u0430\u0442\u0438\u0432\u043d\u044b\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u043f\u0440\u043e\u0442\u0438\u0432 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e<\/figcaption><\/div>\n<\/figure>\n<p>\u0422\u0443\u0442 \u0441\u0440\u0430\u0437\u0443 \u0434\u0432\u0435 \u0432\u0435\u0449\u0438, \u0438 \u043e\u0431\u0435 \u0432\u0430\u0436\u043d\u044b\u0435:<\/p>\n<p><strong>\u041d\u0430\u0442\u0438\u0432\u043d\u044b\u0439 MRL \u0441\u0442\u0430\u0431\u0438\u043b\u044c\u043d\u043e \u0431\u044c\u0435\u0442 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u044b\u0439 \u043f\u043e\u0440\u044f\u0434\u043e\u043a, \u0438 \u0440\u0430\u0437\u0440\u044b\u0432 \u0440\u0430\u0441\u0442\u0435\u0442 \u0441 \u0433\u043b\u0443\u0431\u0438\u043d\u043e\u0439 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f.<\/strong> \u041d\u0430 \u221250% \u044d\u0442\u043e 0.80 \u043f\u0440\u043e\u0442\u0438\u0432 0.76 (\u0440\u0430\u0437\u043d\u0438\u0446\u0430 \u043d\u0435\u0431\u043e\u043b\u044c\u0448\u0430\u044f), \u0430 \u043d\u0430 \u221294% \u0443\u0436\u0435 0.44 \u043f\u0440\u043e\u0442\u0438\u0432 0.30, \u043d\u0430 \u221297% \u2014 0.30 \u043f\u0440\u043e\u0442\u0438\u0432 0.16, \u043f\u043e\u0447\u0442\u0438 \u0432\u0434\u0432\u043e\u0435. \u042d\u0442\u043e \u0440\u043e\u0432\u043d\u043e \u0442\u043e, \u0447\u0442\u043e \u043f\u0440\u0435\u0434\u0441\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442 arXiv:2605.16608: MRL-\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043e\u043a\u0443\u043f\u0430\u0435\u0442\u0441\u044f \u0438\u043c\u0435\u043d\u043d\u043e \u0432 \u0437\u043e\u043d\u0435 \u0442\u044f\u0436\u0435\u043b\u043e\u0433\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f. \u0417\u0430 \u044d\u0442\u043e \u0438 \u043f\u043b\u0430\u0442\u044f\u0442 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435\u043c \u0441 \u043c\u0430\u0442\u0440\u0435\u0448\u043a\u043e\u0439.<\/p>\n<p><strong>\u041d\u043e \u0441\u0430\u043c\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 &#8212; \u0441\u043e\u0432\u0441\u0435\u043c \u043d\u0435 \u00ab\u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e\u00bb.<\/strong> \u0414\u0430\u0436\u0435 \u043d\u0430\u0442\u0438\u0432\u043d\u044b\u0439 MRL \u043d\u0430 \u221250% \u0434\u0430\u0435\u0442 recall 0.80 \u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043f\u043e\u043b\u043d\u043e\u0433\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u0430: \u043a\u0430\u0436\u0434\u044b\u0439 \u043f\u044f\u0442\u044b\u0439 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442 \u0432 top-10 \u043f\u0435\u0440\u0435\u0442\u0430\u0441\u043e\u0432\u0430\u043b\u0441\u044f. \u042d\u0442\u043e \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0436\u0435\u0441\u0442\u0447\u0435, \u0447\u0435\u043c \u0440\u0430\u0441\u0445\u043e\u0436\u0438\u0435 \u00ab1\u20132% \u043f\u0440\u043e\u0441\u0430\u0434\u043a\u0438 \u043f\u0440\u0438 1024\u2192512\u00bb, \u0438 \u0437\u0434\u0435\u0441\u044c \u0432\u0430\u0436\u043d\u043e \u043f\u043e\u043d\u0438\u043c\u0430\u0442\u044c \u0440\u0430\u0437\u043d\u0438\u0446\u0443 \u0432 \u043c\u0435\u0442\u0440\u0438\u043a\u0435. \u0420\u0430\u0441\u0445\u043e\u0436\u0430\u044f \u0446\u0438\u0444\u0440\u0430 &#8212; \u044d\u0442\u043e nDCG <strong>\u043f\u0440\u043e\u0442\u0438\u0432 \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u043e\u0439 \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u043e\u0441\u0442\u0438<\/strong>: \u0443\u0441\u0435\u0447\u0435\u043d\u043d\u0430\u044f \u043c\u043e\u0434\u0435\u043b\u044c \u043c\u043e\u0436\u0435\u0442 \u0434\u043e\u0441\u0442\u0430\u0442\u044c \u0441\u0442\u043e\u043b\u044c \u0436\u0435 \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u044b\u0439 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442, \u043f\u0440\u043e\u0441\u0442\u043e \u0432 \u0434\u0440\u0443\u0433\u043e\u043c \u043f\u043e\u0440\u044f\u0434\u043a\u0435, \u0438 nDCG \u043f\u043e\u0447\u0442\u0438 \u043d\u0435 \u043f\u0430\u0434\u0430\u0435\u0442. \u041d\u0430\u0448\u0430 \u043c\u0435\u0442\u0440\u0438\u043a\u0430 \u0441\u0442\u0440\u043e\u0436\u0435 &#8212; \u044d\u0442\u043e \u043f\u0435\u0440\u0435\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0441 \u0432\u044b\u0434\u0430\u0447\u0435\u0439 \u043f\u043e\u043b\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438, \u0438 \u043e\u043d\u0430 \u0447\u0435\u0441\u0442\u043d\u043e \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442, <strong>\u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u043c\u0435\u043d\u044f\u0435\u0442 \u0432\u0430\u0448\u0443 \u0442\u0435\u043a\u0443\u0449\u0443\u044e \u0432\u044b\u0434\u0430\u0447\u0443<\/strong>. \u041f\u043b\u044e\u0441 \u043a\u043e\u0440\u043f\u0443\u0441 \u0437\u0434\u0435\u0441\u044c &#8212; \u043e\u0431\u044b\u0447\u043d\u044b\u0439 \u0442\u0435\u043a\u0441\u0442, \u0430 \u043d\u0435 \u0437\u0430\u0442\u043e\u0447\u0435\u043d\u043d\u044b\u0439 retrieval-\u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a, \u0447\u0442\u043e \u0442\u043e\u0436\u0435 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u0441\u0442\u0440\u043e\u0433\u043e\u0441\u0442\u0438.<\/p>\n<p>\u0422\u0430\u043a\u0438\u043c \u043e\u0431\u0440\u0430\u0437\u043e\u043c, MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 &#8212; \u0440\u0430\u0431\u043e\u0447\u0430\u044f \u043e\u0441\u044c \u0441\u0436\u0430\u0442\u0438\u044f, \u043d\u043e, \u0432 \u043e\u0442\u043b\u0438\u0447\u0438\u0435 \u043e\u0442 int8, \u043e\u043d\u043e \u0437\u0430\u043c\u0435\u0442\u043d\u043e \u0434\u0432\u0438\u0433\u0430\u0435\u0442 \u0432\u044b\u0434\u0430\u0447\u0443 \u0443\u0436\u0435 \u043d\u0430 \u221250%. \u0420\u0435\u0437\u0430\u0442\u044c \u0441\u0442\u043e\u0438\u0442, \u043d\u043e <strong>\u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0441\u0432\u0435\u0440\u044f\u044f\u0441\u044c \u0441\u043e \u0441\u0432\u043e\u0438\u043c \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u044b\u043c \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u043c<\/strong>: \u0438\u043c\u0435\u043d\u043d\u043e \u043e\u043d \u043f\u043e\u043a\u0430\u0436\u0435\u0442, \u0443\u0448\u043b\u0438 \u043b\u0438 \u043f\u0435\u0440\u0435\u0442\u0430\u0441\u043e\u0432\u0430\u043d\u043d\u044b\u0435 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u044b \u0432 \u043d\u0435\u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u044b\u0435 \u0438\u043b\u0438 \u043e\u0441\u0442\u0430\u043b\u0438\u0441\u044c \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u043e \u0445\u043e\u0440\u043e\u0448\u0438\u043c\u0438.<\/p>\n<p>&gt;<em> <\/em><strong><em>MRL-\u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043e\u043a\u0443\u043f\u0430\u0435\u0442\u0441\u044f \u0442\u0435\u043c \u0441\u0438\u043b\u044c\u043d\u0435\u0435, \u0447\u0435\u043c \u0433\u043b\u0443\u0431\u0436\u0435 \u0432\u044b \u0440\u0435\u0436\u0435\u0442\u0435.<\/em><\/strong><em> \u041d\u0430 \u0443\u043c\u0435\u0440\u0435\u043d\u043d\u043e\u043c \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0438 \u0440\u0430\u0437\u043d\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u043c\u0430\u0442\u0440\u0435\u0448\u043a\u043e\u0439 \u0438 \u043e\u0431\u044b\u0447\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u044c\u044e \u043d\u0435\u0432\u0435\u043b\u0438\u043a\u0430; \u0432 \u0437\u043e\u043d\u0435 \u0442\u044f\u0436\u0435\u043b\u043e\u0433\u043e \u0441\u0436\u0430\u0442\u0438\u044f \u043e\u043d\u0430 \u0432\u044b\u0440\u0430\u0441\u0442\u0430\u0435\u0442 \u043f\u043e\u0447\u0442\u0438 \u0432\u0434\u0432\u043e\u0435. \u041d\u043e \u043d\u0435 \u043f\u0443\u0442\u0430\u0439\u0442\u0435 \u00abMRL \u043b\u0443\u0447\u0448\u0435 \u0441\u043b\u0443\u0447\u0430\u0439\u043d\u043e\u0433\u043e \u043f\u043e\u0440\u044f\u0434\u043a\u0430\u00bb \u0441 \u00ab\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e\u00bb &#8212; \u0441\u0430\u043c\u043e \u043f\u043e \u0441\u0435\u0431\u0435 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0434\u0432\u0438\u0433\u0430\u0435\u0442 \u0432\u044b\u0434\u0430\u0447\u0443, \u0438 \u0446\u0435\u043d\u0443 \u044d\u0442\u043e\u0433\u043e \u0441\u0434\u0432\u0438\u0433\u0430 \u043f\u043e\u043a\u0430\u0436\u0435\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u0432\u0430\u0448 \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u044b\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a. \u0413\u0440\u0430\u0444\u0438\u043a \u0432\u044b\u0448\u0435 \u043f\u043e\u0441\u0442\u0440\u043e\u0435\u043d \u044f\u0447\u0435\u0439\u043a\u043e\u0439 6 Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a\u0430 \u043d\u0430 \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u043c \u043d\u0430\u0442\u0438\u0432\u043d\u043e\u043c MRL Qwen3<\/em><\/p>\n<p><strong>\u0425\u0440\u0430\u043d\u0438\u043b\u0438\u0449\u0435: PQ, scalar \u0438 binary \u043d\u0430 \u0441\u0442\u043e\u0440\u043e\u043d\u0435 Qdrant<\/strong><\/p>\n<p>\u0414\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u043c\u044b \u0441\u0436\u0438\u043c\u0430\u043b\u0438 \u0432\u0435\u043a\u0442\u043e\u0440\u044b \u0440\u0443\u043a\u0430\u043c\u0438. \u0412 \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u0435 \u0437\u0430 \u044d\u0442\u043e \u043e\u0442\u0432\u0435\u0447\u0430\u0435\u0442 \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u0430\u044f \u0431\u0430\u0437\u0430. Qdrant \u0443\u043c\u0435\u0435\u0442 \u0442\u0440\u0438 \u0432\u0438\u0434\u0430 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438 \u043f\u0440\u044f\u043c\u043e \u043d\u0430 \u0443\u0440\u043e\u0432\u043d\u0435 \u0445\u0440\u0430\u043d\u0438\u043b\u0438\u0449\u0430, \u0438 \u0438\u0445 \u043f\u043e\u043b\u0435\u0437\u043d\u043e \u0440\u0430\u0437\u043b\u0438\u0447\u0430\u0442\u044c:<\/p>\n<p><strong>Scalar quantization (int8).<\/strong> \u0422\u043e\u0442 \u0441\u0430\u043c\u044b\u0439 int8 \u0438\u0437 \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u0432\u044b\u0448\u0435. Qdrant \u0445\u0440\u0430\u043d\u0438\u0442 \u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u043d\u044b\u0439 \u0438\u043d\u0434\u0435\u043a\u0441 \u0432 \u043f\u0430\u043c\u044f\u0442\u0438, \u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044b fp32 &#8212; \u043d\u0430 \u0434\u0438\u0441\u043a\u0435 \u0434\u043b\u044f \u043e\u043f\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e\u0433\u043e rescoring. 4x \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0438, recall ~0.99, \u0434\u0435\u0444\u043e\u043b\u0442\u043d\u0430\u044f \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0430\u0446\u0438\u044f \u0434\u043b\u044f \u0431\u043e\u043b\u044c\u0448\u0438\u043d\u0441\u0442\u0432\u0430 \u0437\u0430\u0434\u0430\u0447.<\/p>\n<p><strong>Binary quantization.<\/strong> 32x \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0438, \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u043e \u0441 <code>oversampling<\/code> \u0438 <code>rescore=True<\/code> (\u0441\u043c. \u0440\u0430\u0437\u0434\u0435\u043b \u0432\u044b\u0448\u0435). Qdrant \u043f\u0440\u044f\u043c\u043e \u043f\u0440\u0435\u0434\u0443\u043f\u0440\u0435\u0436\u0434\u0430\u0435\u0442, \u0447\u0442\u043e binary \u0438\u043c\u0435\u0435\u0442 \u0441\u043c\u044b\u0441\u043b \u043d\u0430 \u0432\u044b\u0441\u043e\u043a\u043e\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445.<\/p>\n<p><strong>Product Quantization.<\/strong> \u041f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u043e \u0431\u044c\u0435\u0442\u0441\u044f \u043d\u0430 <code>m<\/code> \u043f\u043e\u0434\u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432, \u0432 \u043a\u0430\u0436\u0434\u043e\u043c &#8212; \u043a\u043e\u0434\u0431\u0443\u043a \u043d\u0430 256 \u0446\u0435\u043d\u0442\u0440\u043e\u0438\u0434\u043e\u0432, \u0432\u0435\u043a\u0442\u043e\u0440 \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u0435\u0442\u0441\u044f \u0432 <code>m<\/code> \u0431\u0430\u0439\u0442. \u0421\u0436\u0430\u0442\u0438\u0435 \u043d\u0430\u0441\u0442\u0440\u0430\u0438\u0432\u0430\u0435\u0442\u0441\u044f \u0447\u0438\u0441\u043b\u043e\u043c \u043f\u043e\u0434\u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432. \u0417\u0430\u043c\u0435\u0440\u0438\u043b\u0438 PQ \u043d\u0430 \u0442\u0435\u0445 \u0436\u0435 \u0434\u0430\u043d\u043d\u044b\u0445:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"160\" width=\"160\">\n<p align=\"center\"><strong>\u041c\u0435\u0442\u043e\u0434<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"108\" width=\"108\">\n<p align=\"center\"><strong>recall@10<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"199\" width=\"199\">\n<p align=\"center\"><strong>\u0411\u0430\u0439\u0442\/\u0432\u0435\u043a\u0442\u043e\u0440<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"92\" width=\"92\">\n<p align=\"center\"><strong>\u0421\u0436\u0430\u0442\u0438\u0435<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\"><strong>\u041f\u043e\u0438\u0441\u043a, \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432\/\u0441<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"160\" width=\"160\">\n<p align=\"center\">PQ, m=128<\/p>\n<\/td>\n<td data-colwidth=\"108\" width=\"108\">\n<p align=\"center\">0.8100<\/p>\n<\/td>\n<td data-colwidth=\"199\" width=\"199\">\n<p align=\"center\">128<\/p>\n<\/td>\n<td data-colwidth=\"92\" width=\"92\">\n<p align=\"center\">32x<\/p>\n<\/td>\n<td>\n<p align=\"center\">323<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"160\" width=\"160\">\n<p align=\"center\">PQ, m=64<\/p>\n<\/td>\n<td data-colwidth=\"108\" width=\"108\">\n<p align=\"center\">0.6926<\/p>\n<\/td>\n<td data-colwidth=\"199\" width=\"199\">\n<p align=\"center\">64<\/p>\n<\/td>\n<td data-colwidth=\"92\" width=\"92\">\n<p align=\"center\">64x<\/p>\n<\/td>\n<td>\n<p align=\"center\">726<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"160\" width=\"160\">\n<p align=\"center\">binary + rescore \u00d73<\/p>\n<\/td>\n<td data-colwidth=\"108\" width=\"108\">\n<p align=\"center\">0.9248<\/p>\n<\/td>\n<td data-colwidth=\"199\" width=\"199\">\n<p align=\"center\">128 (+fp32 \u0434\u043b\u044f rescore)<\/p>\n<\/td>\n<td data-colwidth=\"92\" width=\"92\">\n<p align=\"center\">32x*<\/p>\n<\/td>\n<td>\n<p align=\"center\">11589<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p>* \u0421\u0430\u043c \u0431\u0438\u043d\u0430\u0440\u043d\u044b\u0439 \u0438\u043d\u0434\u0435\u043a\u0441 &#8212; \u044d\u0442\u043e 128 \u0431\u0430\u0439\u0442\/\u0432\u0435\u043a\u0442\u043e\u0440 (32x). \u041d\u043e \u0434\u043b\u044f rescoring \u043d\u0443\u0436\u043d\u044b \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044b: \u0432 \u0437\u0430\u043c\u0435\u0440\u0435 \u043e\u043d\u0438 \u0434\u0435\u0440\u0436\u0430\u043b\u0438\u0441\u044c \u0440\u044f\u0434\u043e\u043c \u0432 int8 (\u0435\u0449\u0451 1024 \u0431\u0430\u0439\u0442), \u043e\u0442\u0441\u044e\u0434\u0430 128 + 1024. \u0412 Qdrant \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044b \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u043b\u0435\u0436\u0430\u0442 \u0432 fp32 \u043d\u0430 \u0434\u0438\u0441\u043a\u0435 &#8212; \u0442\u043e\u0433\u0434\u0430 RAM-\u0438\u043d\u0434\u0435\u043a\u0441 \u043e\u0441\u0442\u0430\u0435\u0442\u0441\u044f 128 \u0431\u0430\u0439\u0442, \u0430 \u043f\u043e\u043b\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b \u0447\u0438\u0442\u0430\u044e\u0442\u0441\u044f \u0441 \u0434\u0438\u0441\u043a\u0430 \u043f\u0440\u0438 \u043f\u0435\u0440\u0435\u0440\u0430\u043d\u0436\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0438<\/p>\n<p>\u0422\u0443\u0442 \u0432\u044b\u043b\u0435\u0437\u0430\u0435\u0442 \u043d\u0435\u0438\u043d\u0442\u0443\u0438\u0442\u0438\u0432\u043d\u0430\u044f \u0432\u0435\u0449\u044c. <\/p>\n<p>\u0413\u043e\u043b\u044b\u0439 PQ \u043d\u0430 32x (0.81) \u0441\u0430\u043c \u043f\u043e \u0441\u0435\u0431\u0435 \u043f\u0440\u0438\u043b\u0438\u0447\u043d\u0435\u0435 \u0433\u043e\u043b\u043e\u0433\u043e binary (0.67) &#8212; \u043e\u043d \u0431\u044c\u0435\u0442\u0441\u044f \u043d\u0435 \u043f\u043e \u0437\u043d\u0430\u043a\u0443, \u0430 \u043f\u043e \u043a\u043b\u0430\u0441\u0442\u0435\u0440\u0430\u043c, \u0438 \u0434\u0435\u0440\u0436\u0438\u0442 \u0431\u043e\u043b\u044c\u0448\u0435 \u0441\u0442\u0440\u0443\u043a\u0442\u0443\u0440\u044b. \u041d\u043e <strong>\u043f\u0440\u0438 \u043e\u0434\u0438\u043d\u0430\u043a\u043e\u0432\u044b\u0445 32x binary + rescoring \u0431\u044c\u0435\u0442 PQ \u0438 \u043f\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u0443 (0.92 \u043f\u0440\u043e\u0442\u0438\u0432 0.81), \u0438 \u043f\u043e \u0441\u043a\u043e\u0440\u043e\u0441\u0442\u0438<\/strong> &#8212; \u0432 \u043c\u043e\u0435\u043c \u0431\u0440\u0443\u0442\u0444\u043e\u0440\u0441-\u0437\u0430\u043c\u0435\u0440\u0435 PQ \u043d\u0430 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u043c\u0435\u0434\u043b\u0435\u043d\u043d\u0435\u0435 \u0438\u0437-\u0437\u0430 \u0442\u0430\u0431\u043b\u0438\u0446 \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u0439, \u0442\u043e\u0433\u0434\u0430 \u043a\u0430\u043a \u0425\u044d\u043c\u043c\u0438\u043d\u0433 \u043d\u0430 \u0431\u0438\u0442\u0430\u0445 \u043b\u0435\u0442\u0430\u0435\u0442. \u041e\u0442\u0441\u044e\u0434\u0430 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u0435 \u043f\u0440\u0430\u0432\u0438\u043b\u043e: PQ \u0445\u043e\u0440\u043e\u0448, \u043a\u043e\u0433\u0434\u0430 \u043f\u0430\u043c\u044f\u0442\u044c \u043a\u0440\u0438\u0442\u0438\u0447\u043d\u0430 \u0434\u043e \u043f\u043e\u0441\u043b\u0435\u0434\u043d\u0435\u0433\u043e \u0431\u0430\u0439\u0442\u0430 \u0438 \u0432\u044b \u0433\u043e\u0442\u043e\u0432\u044b \u0432\u043b\u043e\u0436\u0438\u0442\u044c\u0441\u044f \u0432 \u0442\u043e\u043d\u043a\u0443\u044e \u043d\u0430\u0441\u0442\u0440\u043e\u0439\u043a\u0443 (\u0447\u0438\u0441\u043b\u043e \u043f\u043e\u0434\u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432, \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435 \u043a\u043e\u0434\u0431\u0443\u043a\u043e\u0432, \u0441\u0432\u043e\u0439 rescoring). \u0415\u0441\u043b\u0438 \u0436\u0435 \u043d\u0443\u0436\u0435\u043d \u043f\u0440\u043e\u0441\u0442\u043e \u00ab\u0441\u0436\u0430\u0442\u044c \u0432 32 \u0440\u0430\u0437\u0430 \u0438 \u043d\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u0442\u044c recall\u00bb &#8212; binary + rescoring \u043f\u0440\u043e\u0449\u0435 \u0438 \u043e\u0431\u044b\u0447\u043d\u043e \u0432\u044b\u0438\u0433\u0440\u044b\u0432\u0430\u0435\u0442.<\/p>\n<p>\u041f\u043e\u043b\u043d\u0430\u044f \u043a\u0430\u0440\u0442\u0438\u043d\u0430 \u043f\u043e \u043f\u0430\u043c\u044f\u0442\u0438 (\u0413\u0411 \u043d\u0430 1\u041c \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432, \u043f\u043e\u0434\u043f\u0438\u0441\u0430\u043d recall):<\/p>\n<figure class=\"full-width \"><img decoding=\"async\" src=\"https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/295\/b6a\/18d\/295b6a18d5ee5036ca76c0e71a27da0f.png\" alt=\"\u0421\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c \u0438\u043d\u0434\u0435\u043a\u0441\u0430 \u0432 \u043f\u0430\u043c\u044f\u0442\u0438 \u043f\u043e \u043c\u0435\u0442\u043e\u0434\u0430\u043c\" title=\"\u0421\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c \u0438\u043d\u0434\u0435\u043a\u0441\u0430 \u0432 \u043f\u0430\u043c\u044f\u0442\u0438 \u043f\u043e \u043c\u0435\u0442\u043e\u0434\u0430\u043c\" width=\"1170\" height=\"650\" sizes=\"auto, (max-width: 780px) 100vw, 50vw\" srcset=\"https:\/\/habrastorage.org\/r\/w780\/getpro\/habr\/upload_files\/295\/b6a\/18d\/295b6a18d5ee5036ca76c0e71a27da0f.png 780w,&#10;       https:\/\/habrastorage.org\/r\/w1560\/getpro\/habr\/upload_files\/295\/b6a\/18d\/295b6a18d5ee5036ca76c0e71a27da0f.png 781w\" loading=\"lazy\" decode=\"async\"\/><\/p>\n<div><figcaption>\u0421\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c \u0438\u043d\u0434\u0435\u043a\u0441\u0430 \u0432 \u043f\u0430\u043c\u044f\u0442\u0438 \u043f\u043e \u043c\u0435\u0442\u043e\u0434\u0430\u043c<\/figcaption><\/div>\n<\/figure>\n<p>\u0418 \u0442\u0440\u0438 \u0432\u0435\u0449\u0438 \u043f\u0440\u043e Qdrant, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0431\u044c\u044e\u0442 \u043d\u0430 \u043f\u0440\u043e\u0434\u0435 \u0438 \u043a\u043e\u0442\u043e\u0440\u044b\u0445 \u043d\u0435\u0442 \u0432 \u0442\u0443\u0442\u043e\u0440\u0438\u0430\u043b\u0430\u0445:<\/p>\n<ul>\n<li>\n<p><strong>\u0418\u043d\u0434\u0435\u043a\u0441 \u043d\u0435 \u043f\u0435\u0440\u0435\u0441\u043e\u0431\u0438\u0440\u0430\u0435\u0442\u0441\u044f \u0441 \u043d\u0443\u043b\u044f &#8212; \u043d\u0438\u043a\u043e\u0433\u0434\u0430.<\/strong> Qdrant \u0434\u0435\u043b\u0430\u0435\u0442 \u0438\u043d\u043a\u0440\u0435\u043c\u0435\u043d\u0442\u0430\u043b\u044c\u043d\u044b\u0435 \u0430\u043f\u0434\u0435\u0439\u0442\u044b. \u041a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044e \u0432\u043a\u043b\u044e\u0447\u0430\u044e\u0442 \u043d\u0430 \u043a\u043e\u043b\u043b\u0435\u043a\u0446\u0438\u0438, \u0434\u0430\u043b\u044c\u0448\u0435 \u0442\u043e\u0447\u043a\u0438 \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u044e\u0442\u0441\u044f \u043f\u043e \u043c\u0435\u0440\u0435 \u043f\u043e\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u044f. \u041f\u043e\u043b\u043d\u0430\u044f \u043f\u0435\u0440\u0435\u0438\u043d\u0434\u0435\u043a\u0441\u0430\u0446\u0438\u044f &#8212; \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e \u0440\u0430\u0441\u043f\u0438\u0441\u0430\u043d\u0438\u044e, \u0435\u0441\u043b\u0438 \u0441\u043e\u0432\u0441\u0435\u043c \u043d\u0430\u0434\u043e<\/p>\n<\/li>\n<li>\n<p><strong>\u041e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044b \u0434\u043b\u044f rescoring \u0436\u0438\u0432\u0443\u0442 \u043d\u0430 \u0434\u0438\u0441\u043a\u0435.<\/strong> Binary\/scalar \u044d\u043a\u043e\u043d\u043e\u043c\u044f\u0442 RAM, \u043d\u043e rescoring \u0447\u0438\u0442\u0430\u0435\u0442 \u043f\u043e\u043b\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b. \u0415\u0441\u043b\u0438 \u0434\u0438\u0441\u043a \u043c\u0435\u0434\u043b\u0435\u043d\u043d\u044b\u0439, \u0432\u044b \u0441\u044a\u0435\u0434\u0438\u0442\u0435 \u0432\u044b\u0438\u0433\u0440\u044b\u0448 \u043e\u0442 \u0441\u0436\u0430\u0442\u0438\u044f \u043e\u0431\u0440\u0430\u0442\u043d\u043e \u043d\u0430 latency. \u0414\u0435\u0440\u0436\u0438\u0442\u0435 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044b \u043d\u0430 NVMe<\/p>\n<\/li>\n<li>\n<p><strong>Oversampling &#8212; \u043d\u0430\u0441\u0442\u0440\u0430\u0438\u0432\u0430\u0435\u043c\u044b\u0439 \u043a\u043e\u043c\u043f\u0440\u043e\u043c\u0438\u0441\u0441.<\/strong> \u00d73 \u043f\u043e\u0447\u0442\u0438 \u0432\u0441\u0435\u0433\u0434\u0430 \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0435\u0442 recall, \u043d\u043e \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u0447\u0442\u0435\u043d\u0438\u0439 \u043d\u0430 rescoring. \u041f\u043e\u0434 \u0436\u0435\u0441\u0442\u043a\u0438\u0439 latency-\u0431\u044e\u0434\u0436\u0435\u0442 \u043f\u043e\u0434\u0431\u0438\u0440\u0430\u0439\u0442\u0435 \u0435\u0433\u043e \u043f\u043e \u0441\u0432\u043e\u0435\u043c\u0443 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0443, \u0430 \u043d\u0435 \u043f\u043e \u0434\u0435\u0444\u043e\u043b\u0442\u0443<\/p>\n<\/li>\n<\/ul>\n<p><strong>\u041a\u043e\u043c\u0431\u0438\u043d\u0438\u0440\u043e\u0432\u0430\u043d\u0438\u0435: \u0447\u0442\u043e \u0441\u0442\u0435\u043a\u0430\u0435\u0442\u0441\u044f, \u0430 \u0447\u0442\u043e \u043a\u043e\u043d\u0444\u043b\u0438\u043a\u0442\u0443\u0435\u0442<\/strong><\/p>\n<p>\u041e\u0441\u0438 \u0441\u0436\u0430\u0442\u0438\u044f \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u044b, \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u0438\u0445 \u0445\u043e\u0447\u0435\u0442\u0441\u044f \u0441\u0442\u0435\u043a\u0430\u0442\u044c: \u0441\u043d\u0430\u0447\u0430\u043b\u0430 MRL-\u0443\u0441\u0435\u0447\u044c, \u043f\u043e\u0442\u043e\u043c \u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u0442\u044c. \u0417\u0434\u0435\u0441\u044c \u0432\u0430\u0436\u043d\u043e \u0437\u043d\u0430\u0442\u044c, \u0447\u0442\u043e \u0441\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u0447\u0438\u0441\u0442\u043e, \u0430 \u0447\u0442\u043e &#8212; \u043a\u043e\u043d\u0444\u043b\u0438\u043a\u0442\u0443\u0435\u0442. \u0417\u0430\u043c\u0435\u0440\u0438\u043c \u0441\u0442\u0435\u043a \u00abMRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u2192 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f\u00bb \u043d\u0430 \u0442\u0435\u0445 \u0436\u0435 \u0434\u0430\u043d\u043d\u044b\u0445:<\/p>\n<p>\u041a\u043e\u043b\u043e\u043d\u043a\u0430 <strong>recall@10<\/strong> &#8212; \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0432\u0441\u0435\u0433\u043e \u0441\u0442\u0435\u043a\u0430 (\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 + \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f), \u043a\u043e\u043b\u043e\u043d\u043a\u0430 <strong>\u0411\u0430\u0437\u0430 (\u0442\u043e\u043b\u044c\u043a\u043e MRL)<\/strong> &#8212; recall \u043e\u0434\u043d\u043e\u0433\u043e \u043b\u0438\u0448\u044c \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f, \u0431\u0435\u0437 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438 \u0441\u0432\u0435\u0440\u0445\u0443. \u0420\u0430\u0437\u043d\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u043d\u0438\u043c\u0438 \u0438 \u0435\u0441\u0442\u044c \u0447\u0438\u0441\u0442\u044b\u0439 \u0432\u043a\u043b\u0430\u0434 \u0432\u0442\u043e\u0440\u043e\u0439 \u043e\u0441\u0438 &#8212; \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043e\u0442\u043d\u0438\u043c\u0430\u0435\u0442 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f \u043f\u043e\u0432\u0435\u0440\u0445 \u0443\u0436\u0435 \u0443\u0441\u0435\u0447\u0451\u043d\u043d\u043e\u0433\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u0430:<\/p>\n<div>\n<div class=\"table\">\n<table>\n<tbody>\n<tr>\n<td data-colwidth=\"205\" width=\"205\">\n<p align=\"center\"><strong>\u0421\u0442\u0435\u043a<\/strong><\/p>\n<\/td>\n<td data-colwidth=\"156\" width=\"156\">\n<p align=\"center\"><strong>recall@10 <\/strong><\/p>\n<\/td>\n<td data-colwidth=\"201\" width=\"201\">\n<p align=\"center\"><strong>\u0411\u0430\u0437\u0430 (\u0442\u043e\u043b\u044c\u043a\u043e MRL)<\/strong><\/p>\n<\/td>\n<td>\n<p align=\"center\"><strong>\u0418\u0442\u043e\u0433\u043e\u0432\u043e\u0435 \u0441\u0436\u0430\u0442\u0438\u0435<\/strong><\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"205\" width=\"205\">\n<p align=\"center\">MRL-512 + int8<\/p>\n<\/td>\n<td data-colwidth=\"156\" width=\"156\">\n<p align=\"center\">0.7946<\/p>\n<\/td>\n<td data-colwidth=\"201\" width=\"201\">\n<p align=\"center\">0.7962<\/p>\n<\/td>\n<td>\n<p align=\"center\">~8x<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"205\" width=\"205\">\n<p align=\"center\">MRL-256 + int8<\/p>\n<\/td>\n<td data-colwidth=\"156\" width=\"156\">\n<p align=\"center\">0.6662<\/p>\n<\/td>\n<td data-colwidth=\"201\" width=\"201\">\n<p align=\"center\">0.6662<\/p>\n<\/td>\n<td>\n<p align=\"center\">~16x<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"205\" width=\"205\">\n<p align=\"center\">MRL-512 + binary + rescore \u00d73<\/p>\n<\/td>\n<td data-colwidth=\"156\" width=\"156\">\n<p align=\"center\">0.7444<\/p>\n<\/td>\n<td data-colwidth=\"201\" width=\"201\">\n<p align=\"center\">0.7444<\/p>\n<\/td>\n<td>\n<p align=\"center\">~8x<\/p>\n<\/td>\n<\/tr>\n<tr>\n<td data-colwidth=\"205\" width=\"205\">\n<p align=\"center\">MRL-256 + binary + rescore \u00d73<\/p>\n<\/td>\n<td data-colwidth=\"156\" width=\"156\">\n<p align=\"center\">0.5830<\/p>\n<\/td>\n<td data-colwidth=\"201\" width=\"201\">\n<p align=\"center\">0.6662<\/p>\n<\/td>\n<td>\n<p align=\"center\">~16x<\/p>\n<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div>\n<p><strong>MRL + int8 \u0441\u0442\u0435\u043a\u0430\u0435\u0442\u0441\u044f \u0438\u0434\u0435\u0430\u043b\u044c\u043d\u043e.<\/strong> \u0421\u0440\u0430\u0432\u043d\u0438\u0442\u0435 \u043a\u043e\u043b\u043e\u043d\u043a\u0438: int8 \u043f\u043e\u0432\u0435\u0440\u0445 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f \u043d\u0435 \u043e\u0442\u043d\u0438\u043c\u0430\u0435\u0442 \u043f\u043e\u0447\u0442\u0438 \u043d\u0438\u0447\u0435\u0433\u043e (0.7962 \u2192 0.7946, 0.6662 \u2192 0.6656). \u0414\u0432\u0435 \u043e\u0441\u0438 \u0431\u044c\u044e\u0442 \u043f\u043e \u0440\u0430\u0437\u043d\u044b\u043c \u0438\u0437\u0431\u044b\u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044f\u043c &#8212; MRL \u0443\u0431\u0438\u0440\u0430\u0435\u0442 \u043b\u0438\u0448\u043d\u0438\u0435 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f, int8 \u0443\u0431\u0438\u0440\u0430\u0435\u0442 \u043b\u0438\u0448\u043d\u044e\u044e \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u0432 \u043e\u0441\u0442\u0430\u0432\u0448\u0438\u0445\u0441\u044f, &#8212; \u0438 \u0441\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u044e\u0442\u0441\u044f \u0431\u0435\u0437 \u0438\u043d\u0442\u0435\u0440\u0444\u0435\u0440\u0435\u043d\u0446\u0438\u0438. \u0412\u0441\u044f \u043f\u0440\u043e\u0441\u0430\u0434\u043a\u0430 \u0442\u0443\u0442 \u043e\u0442 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f, \u043d\u0435 \u043e\u0442 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438.<\/p>\n<p><strong>MRL + binary \u043c\u0435\u0448\u0430\u044e\u0442 \u0434\u0440\u0443\u0433 \u0434\u0440\u0443\u0433\u0443.<\/strong> binary \u0434\u0435\u0440\u0436\u0438\u0442\u0441\u044f \u043d\u0430 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0435 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439, \u0430 MRL \u044d\u0442\u043e \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u043e \u043a\u0430\u043a \u0440\u0430\u0437 \u0438 \u0443\u0440\u0435\u0437\u0430\u0435\u0442. \u041f\u043e\u044d\u0442\u043e\u043c\u0443 binary+rescore \u043f\u043e\u0432\u0435\u0440\u0445 \u0443\u0441\u0435\u0447\u0435\u043d\u043d\u043e\u0433\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u0430 \u043e\u0442\u043d\u0438\u043c\u0430\u0435\u0442 \u0437\u0430\u043c\u0435\u0442\u043d\u043e \u0431\u043e\u043b\u044c\u0448\u0435, \u0447\u0435\u043c int8: 0.7962 \u2192 0.7444 \u043d\u0430 512, 0.6662 \u2192 0.5830 \u043d\u0430 256. \u0427\u0435\u043c \u0430\u0433\u0440\u0435\u0441\u0441\u0438\u0432\u043d\u0435\u0435 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435, \u0442\u0435\u043c \u0441\u0438\u043b\u044c\u043d\u0435\u0435 \u043a\u043e\u043d\u0444\u043b\u0438\u043a\u0442. \u0415\u0441\u043b\u0438 \u043d\u0443\u0436\u043d\u0430 \u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u043f\u043e\u043c\u0435\u043d\u044c\u0448\u0435, \u0438 \u0431\u0438\u0442\u044b &#8212; \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u0443\u0439\u0442\u0435 \u043d\u0430 \u043f\u043e\u043b\u043d\u043e\u0439 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438, \u0430 \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u044e \u0431\u0435\u0440\u0438\u0442\u0435 oversampling&#8217;\u043e\u043c, \u043d\u0435 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435\u043c.<\/p>\n<p>\u0421\u043e\u0432\u0435\u0442 \u043f\u043e \u0441\u0442\u0435\u043a\u0443: <strong>MRL (\u0434\u043e \u0440\u0430\u0437\u0443\u043c\u043d\u043e\u0433\u043e) \u2192 int8 \u2192 (\u043e\u043f\u0446\u0438\u043e\u043d\u0430\u043b\u044c\u043d\u043e) binary + rescoring \u043d\u0430 \u043f\u043e\u043b\u043d\u043e\u0439 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043a\u0430\u043a \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0439 \u0438\u043d\u0434\u0435\u043a\u0441<\/strong>. \u041d\u0435 \u043f\u044b\u0442\u0430\u0439\u0442\u0435\u0441\u044c \u0443\u0441\u0435\u0447\u044c \u0438 \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u043e\u0432\u0430\u0442\u044c \u043e\u0434\u043d\u043e\u0432\u0440\u0435\u043c\u0435\u043d\u043d\u043e<\/p>\n<p><strong>\u041c\u0438\u043d\u0438\u043c\u0430\u043b\u044c\u043d\u044b\u0439 \u0440\u0435\u0446\u0435\u043f\u0442 \u0441\u0436\u0430\u0442\u0438\u044f \u043d\u0430 \u0441\u0435\u0433\u043e\u0434\u043d\u044f<\/strong><\/p>\n<p>\u0415\u0441\u043b\u0438 \u0441\u043e\u0431\u0438\u0440\u0430\u0442\u044c \u0438\u043d\u0434\u0435\u043a\u0441 \u043f\u043e\u0434 \u0434\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u044b\u0439 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440 \u0441\u0435\u0439\u0447\u0430\u0441, \u043c\u043e\u0436\u043d\u043e \u043f\u043e\u0439\u0442\u0438 \u0442\u0430\u043a:<\/p>\n<p><strong>\u0414\u0435\u0444\u043e\u043b\u0442 \u0434\u043b\u044f 90% \u0437\u0430\u0434\u0430\u0447: int8 (scalar quantization) \u0432 Qdrant.<\/strong> 4x \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0438, recall ~0.99, \u0432\u043a\u043b\u044e\u0447\u0430\u0435\u0442\u0441\u044f \u043e\u0434\u043d\u043e\u0439 \u043d\u0430\u0441\u0442\u0440\u043e\u0439\u043a\u043e\u0439 &#8212; \u0431\u0430\u0437\u043e\u0432\u0430\u044f \u0433\u0438\u0433\u0438\u0435\u043d\u0430 \u0438\u043d\u0434\u0435\u043a\u0441\u0430, \u043a\u0430\u043a fp16 \u0432\u043c\u0435\u0441\u0442\u043e fp32.<\/p>\n<p><strong>\u041f\u0430\u043c\u044f\u0442\u044c \u043a\u0440\u0438\u0442\u0438\u0447\u043d\u0430 (\u0434\u0435\u0441\u044f\u0442\u043a\u0438-\u0441\u043e\u0442\u043d\u0438 \u043c\u0438\u043b\u043b\u0438\u043e\u043d\u043e\u0432 \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432): binary + rescoring, oversampling \u00d73\u2013\u00d75.<\/strong> 32x \u044d\u043a\u043e\u043d\u043e\u043c\u0438\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0433\u043e \u0438\u043d\u0434\u0435\u043a\u0441\u0430, recall ~0.92\u20130.97, \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b\u044b \u043d\u0430 NVMe \u043f\u043e\u0434 rescoring. \u0420\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0442\u0435\u043c \u043b\u0443\u0447\u0448\u0435, \u0447\u0435\u043c \u0432\u044b\u0448\u0435 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c &#8212; \u043d\u0430 <code>Qwen3-Embedding-8B<\/code> (\u0434\u043e 4096-dim) \u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e.<\/p>\n<p><strong>\u041d\u0443\u0436\u043d\u0430 \u0435\u0449\u0451 \u0438 \u043c\u0435\u043d\u044c\u0448\u0430\u044f \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c, \u043c\u043e\u0434\u0435\u043b\u044c MRL: MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0434\u043e 512 + int8.<\/strong> ~8x, int8 \u043f\u043e\u0432\u0435\u0440\u0445 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d. \u041d\u043e \u043f\u043e\u043c\u043d\u0438\u0442\u0435: \u0441\u0430\u043c\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0434\u043e 512 \u0443\u0436\u0435 \u0434\u0432\u0438\u0433\u0430\u0435\u0442 \u0432\u044b\u0434\u0430\u0447\u0443 (\u0432 \u043d\u0430\u0448\u0435\u043c \u0437\u0430\u043c\u0435\u0440\u0435 ~0.80 \u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u043f\u043e\u043b\u043d\u043e\u0433\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u0430), \u043f\u043e\u044d\u0442\u043e\u043c\u0443 \u044d\u0442\u0443 \u043e\u0441\u044c \u0432\u043a\u043b\u044e\u0447\u0430\u0439\u0442\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u0441\u043b\u0435 \u043f\u0440\u043e\u0432\u0435\u0440\u043a\u0438 \u043d\u0430 \u0441\u0432\u043e\u0435\u043c \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u043e\u043c \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0435, \u0430 \u043d\u0435 \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e.<\/p>\n<p><strong>\u0427\u0435\u0433\u043e \u043d\u0435 \u0434\u0435\u043b\u0430\u0442\u044c:<\/strong> \u043d\u0435 \u0433\u043e\u043d\u044f\u0442\u044c fp32 \u0432 \u0438\u043d\u0434\u0435\u043a\u0441\u0435 (\u043f\u043b\u0430\u0442\u0438\u0442\u0435 \u0432\u0434\u0432\u043e\u0435 \u0437\u0440\u044f); \u043d\u0435 \u0432\u043a\u043b\u044e\u0447\u0430\u0442\u044c binary \u0431\u0435\u0437 rescoring (\u0441\u043b\u043e\u043c\u0430\u0435\u0442\u0435 \u043f\u043e\u0438\u0441\u043a); \u043d\u0435 \u0443\u0441\u0435\u043a\u0430\u0442\u044c \u043d\u0435-MRL-\u043c\u043e\u0434\u0435\u043b\u044c \u043d\u0438\u0436\u0435 \u221280% (\u0443\u0435\u0434\u0435\u0442\u0435 \u0432 \u043e\u0431\u0440\u044b\u0432); \u043d\u0435 \u0441\u0442\u0435\u043a\u0430\u0442\u044c MRL + binary.<\/p>\n<p>\u0418 \u0441\u043a\u0432\u043e\u0437\u043d\u043e\u0439 \u043f\u0440\u0438\u043d\u0446\u0438\u043f, \u0432\u0430\u0436\u043d\u0435\u0435 \u043b\u044e\u0431\u043e\u0433\u043e \u0438\u0437 \u043c\u0435\u0442\u043e\u0434\u043e\u0432: <strong>\u043a\u0430\u0436\u0434\u044b\u0439 \u0448\u0430\u0433 \u0441\u0436\u0430\u0442\u0438\u044f \u0441\u0432\u0435\u0440\u044f\u0439\u0442\u0435 \u0441\u043e \u0441\u0432\u043e\u0438\u043c \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u043c.<\/strong> \u0422\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u0437\u0430\u0432\u0438\u0441\u0438\u0442 \u043e\u0442 \u0434\u043e\u043c\u0435\u043d\u0430, \u043c\u043e\u0434\u0435\u043b\u0438 \u0438 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438. \u041c\u043e\u0438 \u0446\u0438\u0444\u0440\u044b \u043f\u043e\u043a\u0430\u0437\u044b\u0432\u0430\u044e\u0442 \u0444\u043e\u0440\u043c\u0443 \u043a\u0440\u0438\u0432\u043e\u0439 \u0438 \u043f\u043e\u0440\u044f\u0434\u043e\u043a \u0432\u0435\u043b\u0438\u0447\u0438\u043d; \u0432\u0430\u0448\u0430 \u0442\u043e\u0447\u043a\u0430 \u043e\u0431\u0440\u044b\u0432\u0430 \u043c\u043e\u0436\u0435\u0442 \u043e\u0442\u043b\u0438\u0447\u0430\u0442\u044c\u0441\u044f. \u041f\u0440\u043e\u0433\u043e\u043d\u0438\u0442\u0435 <code>compress_experiment.py<\/code> \u043d\u0430 \u0441\u0432\u043e\u0438\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445 &#8212; \u044d\u0442\u043e \u0434\u0435\u0441\u044f\u0442\u044c \u043c\u0438\u043d\u0443\u0442, \u0430 \u043d\u0435 \u0441\u043e\u0433\u043b\u0430\u0441\u043e\u0432\u0430\u043d\u0438\u0435 \u0431\u044e\u0434\u0436\u0435\u0442\u0430 \u043d\u0430 GPU<\/p>\n<p><strong>\u0427\u0442\u043e \u043e\u0441\u0442\u0430\u043b\u043e\u0441\u044c \u0437\u0430 \u043a\u0430\u0434\u0440\u043e\u043c<\/strong><\/p>\n<p><strong>\u0414\u0438\u0441\u0442\u0438\u043b\u043b\u044f\u0446\u0438\u044f \u0432 \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c.<\/strong> \u0421\u0430\u043c\u0430\u044f \u043c\u043e\u0449\u043d\u0430\u044f \u043e\u0441\u044c \u0441\u0436\u0430\u0442\u0438\u044f &#8212; \u0443\u043c\u0435\u043d\u044c\u0448\u0438\u0442\u044c \u0441\u0430\u043c\u0443 \u043c\u043e\u0434\u0435\u043b\u044c &#8212; \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u0441\u0432\u043e\u0435\u0433\u043e \u0434\u0430\u0442\u0430\u0441\u0435\u0442\u0430 \u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u044f. \u042d\u0442\u043e \u0441\u043c\u044b\u043a\u0430\u0435\u0442\u0441\u044f \u0441 \u0444\u0430\u0439\u043d\u0442\u044e\u043d\u043e\u043c \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u0430, \u043a\u043e\u0442\u043e\u0440\u043e\u043c\u0443 \u0431\u0443\u0434\u0443\u0442 \u043f\u043e\u0441\u0432\u044f\u0449\u0435\u043d\u044b \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0438\u0435 \u0441\u0442\u0430\u0442\u044c\u0438<\/p>\n<p><strong>Quantization-aware training.<\/strong> Qwen3 \u0432\u043a\u043b\u044e\u0447\u0430\u0435\u0442 QAT \u0432 \u0442\u0440\u0435\u043d\u0438\u0440\u043e\u0432\u043e\u0447\u043d\u044b\u0439 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d &#8212; \u043c\u043e\u0434\u0435\u043b\u044c \u0443\u0447\u0430\u0442 \u0442\u0430\u043a, \u0447\u0442\u043e\u0431\u044b \u043e\u043d\u0430 \u0438\u0437\u043d\u0430\u0447\u0430\u043b\u044c\u043d\u043e \u0445\u043e\u0440\u043e\u0448\u043e \u043f\u0435\u0440\u0435\u0436\u0438\u0432\u0430\u043b\u0430 int8. \u0415\u0441\u043b\u0438 \u0432\u044b \u0444\u0430\u0439\u043d\u0442\u044e\u043d\u0438\u0442\u0435 \u0441\u0432\u043e\u0439 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440, QAT \u0441\u0442\u043e\u0438\u0442 \u0437\u0430\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u0442\u044c \u0441\u0440\u0430\u0437\u0443, \u0430 \u043d\u0435 \u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u0442\u044c \u043f\u043e\u0441\u0442\u0444\u0430\u043a\u0442\u0443\u043c<\/p>\n<p><strong>\u0410\u0441\u0438\u043c\u043c\u0435\u0442\u0440\u0438\u0447\u043d\u0430\u044f \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f \u0437\u0430\u043f\u0440\u043e\u0441\/\u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442.<\/strong> \u0414\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432 \u043c\u0438\u043b\u043b\u0438\u043e\u043d\u044b, \u0437\u0430\u043f\u0440\u043e\u0441 \u043e\u0434\u0438\u043d. \u041c\u043e\u0436\u043d\u043e \u0436\u0435\u0441\u0442\u043a\u043e \u0441\u0436\u0438\u043c\u0430\u0442\u044c \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u044b \u0438 \u0434\u0435\u0440\u0436\u0430\u0442\u044c \u0437\u0430\u043f\u0440\u043e\u0441 \u0432 fp32 &#8212; \u0447\u0430\u0441\u0442\u044c \u043f\u0440\u043e\u0441\u0430\u0434\u043a\u0438 recall \u043e\u0442\u044b\u0433\u0440\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e<\/p>\n<hr\/>\n<p>\u0421\u0436\u0430\u0442\u0438\u0435 \u0434\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u043e\u0433\u043e \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u0430 &#8212; \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u044c\u043d\u044b\u0439 \u044d\u0442\u0430\u043f \u043c\u0435\u0436\u0434\u0443 \u0442\u0435\u043c, \u0447\u0442\u043e \u043c\u043e\u0434\u0435\u043b\u044c \u0445\u043e\u0440\u043e\u0448\u043e \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u0442, \u0438 \u0442\u0435\u043c, \u0447\u0442\u043e \u043e\u043d\u0430 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u0432 \u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u0435 \u0437\u0430 \u0432\u043c\u0435\u043d\u044f\u0435\u043c\u044b\u0435 \u0434\u0435\u043d\u044c\u0433\u0438. \u0425\u043e\u0440\u043e\u0448\u0430\u044f \u043d\u043e\u0432\u043e\u0441\u0442\u044c: \u043f\u043e\u0447\u0442\u0438 \u0432\u0441\u0435 \u0441\u0436\u0430\u0442\u0438\u0435 &#8212; \u0430\u0440\u0438\u0444\u043c\u0435\u0442\u0438\u043a\u0430 \u043d\u0430 CPU \u043f\u043e\u0432\u0435\u0440\u0445 \u0433\u043e\u0442\u043e\u0432\u044b\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432, \u0438 \u0442\u043e\u0447\u043a\u0443 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall \u043c\u043e\u0436\u043d\u043e \u043d\u0430\u0449\u0443\u043f\u0430\u0442\u044c \u0437\u0430 \u0432\u0435\u0447\u0435\u0440 \u043d\u0430 \u0441\u0432\u043e\u0435\u043c \u0436\u0435\u043b\u0435\u0437\u0435, \u0431\u0435\u0437 GPU. int8 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d, binary \u0442\u0440\u0435\u0431\u0443\u0435\u0442 rescoring, MRL \u0442\u0440\u0435\u0431\u0443\u0435\u0442 \u043c\u0430\u0442\u0440\u0435\u0448\u043a\u0438, \u0430 \u0441\u0442\u0435\u043a\u0430\u0442\u044c \u0438\u0445 \u043d\u0430\u0434\u043e \u0441 \u0443\u043c\u043e\u043c.<\/p>\n<p>\u041d\u043e \u0443 \u0432\u0441\u0435\u0433\u043e \u044d\u0442\u043e\u0433\u043e \u0435\u0441\u0442\u044c \u0441\u043b\u0435\u043f\u043e\u0435 \u043f\u044f\u0442\u043d\u043e. \u0412\u0441\u0435 \u0446\u0438\u0444\u0440\u044b \u0432\u044b\u0448\u0435 \u043c\u0435\u0440\u044f\u044e\u0442 \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u044e <strong>\u043e\u0442\u043d\u043e\u0441\u0438\u0442\u0435\u043b\u044c\u043d\u043e fp32-\u043f\u043e\u0438\u0441\u043a\u0430 \u0442\u043e\u0439 \u0436\u0435 \u043c\u043e\u0434\u0435\u043b\u0438<\/strong>. \u0410 \u0447\u0442\u043e \u0435\u0441\u043b\u0438 \u0441\u0430\u043c\u0430 \u043c\u043e\u0434\u0435\u043b\u044c \u043d\u0430 \u0432\u0430\u0448\u0435\u043c \u0434\u043e\u043c\u0435\u043d\u0435 \u0438\u0449\u0435\u0442 \u043f\u043b\u043e\u0445\u043e? \u0422\u043e\u0433\u0434\u0430 \u0432\u044b \u0430\u043a\u043a\u0443\u0440\u0430\u0442\u043d\u043e \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442\u0435 \u043f\u0440\u0438 \u0441\u0436\u0430\u0442\u0438\u0438 \u0440\u043e\u0432\u043d\u043e \u0442\u043e\u0442 recall, \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e \u0443 \u0432\u0430\u0441 \u0438 \u0442\u0430\u043a \u043d\u0435\u0442. \u0427\u0442\u043e\u0431\u044b \u043e\u0442\u043b\u0438\u0447\u0438\u0442\u044c \u00ab\u0441\u0436\u0430\u0442\u0438\u0435 \u0441\u043b\u043e\u043c\u0430\u043b\u043e\u00bb \u043e\u0442 \u00ab\u043c\u043e\u0434\u0435\u043b\u044c \u0438 \u043d\u0435 \u0443\u043c\u0435\u043b\u0430\u00bb, \u043d\u0443\u0436\u0435\u043d \u0441\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0439 \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u044b\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a &#8212; \u0438 \u044d\u0442\u043e \u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u043e\u0435 \u043c\u0435\u0441\u0442\u043e \u0432 \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d\u0435, \u0433\u0434\u0435 \u043d\u0435\u043b\u044c\u0437\u044f \u0441\u0440\u0435\u0437\u0430\u0442\u044c \u0443\u0433\u043e\u043b.<\/p>\n<p><strong>\u0412 \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0439 \u0441\u0442\u0430\u0442\u044c\u0435<\/strong> \u0441\u043e\u0431\u0438\u0440\u0430\u0435\u043c \u0442\u0430\u043a\u043e\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a \u0434\u043b\u044f RAG \u0432 \u0443\u0437\u043a\u043e\u043c \u0434\u043e\u043c\u0435\u043d\u0435 \u0440\u0443\u043a\u0430\u043c\u0438: \u0441\u043a\u043e\u043b\u044c\u043a\u043e \u043f\u0430\u0440 \u043d\u0443\u0436\u043d\u043e, \u043e\u0442\u043a\u0443\u0434\u0430 \u0431\u0440\u0430\u0442\u044c \u0437\u0430\u043f\u0440\u043e\u0441\u044b, \u0447\u0442\u043e \u0442\u0430\u043a\u043e\u0435 \u0445\u043e\u0440\u043e\u0448\u0438\u0439 hard negative, \u0438 \u043f\u043e\u0447\u0435\u043c\u0443 \u043f\u0443\u0431\u043b\u0438\u0447\u043d\u044b\u0435 \u043c\u0435\u0442\u0440\u0438\u043a\u0438 \u0432\u0440\u043e\u0434\u0435 MTEB \u043d\u0430 \u0432\u0430\u0448\u0435\u043c \u0434\u043e\u043c\u0435\u043d\u0435 \u0432\u0440\u0443\u0442.<\/p>\n<p>\u041d\u0443 \u0430 \u0435\u0441\u043b\u0438 \u0436\u0434\u0430\u0442\u044c \u0441\u043b\u0435\u0434\u0443\u044e\u0449\u0435\u0439 \u0441\u0442\u0430\u0442\u044c\u0438 \u043d\u0435 \u0445\u043e\u0447\u0435\u0442\u0441\u044f &#8212; \u044f \u0432\u0435\u0434\u0443 \u0442\u0435\u043b\u0435\u0433\u0440\u0430\u043c-\u043a\u0430\u043d\u0430\u043b <a href=\"https:\/\/t.me\/torch_lab\" rel=\"noopener noreferrer nofollow\">@torch_lab<\/a>, \u0433\u0434\u0435 \u0432\u044b\u043a\u043b\u0430\u0434\u044b\u0432\u0430\u044e \u0442\u0430\u043a\u0438\u0435 \u0440\u0430\u0437\u0431\u043e\u0440\u044b, \u0437\u0430\u043c\u0435\u0442\u043a\u0438 \u0438\u0437 \u043f\u0440\u0430\u043a\u0442\u0438\u043a\u0438 retrieval \u0438 \u0430\u0433\u0435\u043d\u0442\u043e\u0432 \u0438 \u0446\u0438\u0444\u0440\u044b, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u043d\u0435 \u0434\u043e\u0448\u043b\u0438 \u0434\u043e \u0441\u0442\u0430\u0442\u0435\u0439: \u0447\u0442\u043e \u0441\u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e, \u0447\u0442\u043e \u0440\u0430\u0437\u0432\u0430\u043b\u0438\u043b\u043e\u0441\u044c \u043d\u0430 \u043f\u0440\u043e\u0434\u0435 \u0438 \u043f\u043e\u0447\u0435\u043c\u0443<\/p>\n<p><strong>\u0412\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u0435<\/strong><\/p>\n<p>\u0412\u0435\u0441\u044c \u043a\u043e\u0434 \u2014 \u0432 \u0440\u0435\u043f\u043e\u0437\u0438\u0442\u043e\u0440\u0438\u0438: <a href=\"https:\/\/github.com\/KuzminaSofia\/embedding-compression\" rel=\"noopener noreferrer nofollow\"><strong>github.com\/KuzminaSofia\/embedding-compression<\/strong><\/a><strong> <\/strong>(<code>compress_experiment.py<\/code> + Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a). \u0412\u0441\u0435 \u0446\u0438\u0444\u0440\u044b \u0432 \u0441\u0442\u0430\u0442\u044c\u0435 &#8212; \u043f\u0440\u043e\u0433\u043e\u043d <code>Qwen3-Embedding-0.6B<\/code>. \u0412\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0441\u0442\u0438 \u043c\u043e\u0436\u043d\u043e \u0432 \u0434\u0432\u0430 \u0448\u0430\u0433\u0430<\/p>\n<p><strong>\u0428\u0430\u0433 1 (GPU, \u043e\u0434\u0438\u043d \u0440\u0430\u0437).<\/strong> Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a <code>article1_qwen3_colab.ipynb<\/code>(<a href=\"https:\/\/colab.research.google.com\/github\/KuzminaSofia\/embedding-compression\/blob\/main\/article1_qwen3_colab.ipynb\" rel=\"noopener noreferrer nofollow\">\u043e\u0442\u043a\u0440\u044b\u0442\u044c \u0432 Colab<\/a>): \u0433\u0440\u0443\u0437\u0438\u0442 \u043c\u043e\u0434\u0435\u043b\u044c, \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u0442 \u043f\u0443\u0431\u043b\u0438\u0447\u043d\u044b\u0439 \u043a\u043e\u0440\u043f\u0443\u0441 (+ \u0441\u043b\u043e\u0442 \u043f\u043e\u0434 \u0432\u0430\u0448\u0443 \u0434\u043e\u043c\u0435\u043d\u043d\u0443\u044e \u0441\u0438\u043d\u0442\u0435\u0442\u0438\u043a\u0443), \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442 <code>qwen3_emb.npy<\/code> \u0438 \u0441\u0442\u0440\u043e\u0438\u0442 \u0433\u0440\u0430\u0444\u0438\u043a\u0438. <\/p>\n<p>Runtime \u2192 T4 GPU \u2192 Run all, ~10\u201315 \u043c\u0438\u043d\u0443\u0442 \u043d\u0430 free-\u0432\u0435\u0440\u0441\u0438\u0438<\/p>\n<p><strong>\u0428\u0430\u0433 2 (CPU, \u0433\u0434\u0435 \u0443\u0433\u043e\u0434\u043d\u043e).<\/strong> <code>compress_experiment.py<\/code>\u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u0433\u043e\u0442\u043e\u0432\u0443\u044e \u043c\u0430\u0442\u0440\u0438\u0446\u0443 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u043e\u0432 \u0438 \u043f\u0435\u0440\u0435\u0441\u0447\u0438\u0442\u044b\u0432\u0430\u0435\u0442 \u0432\u0441\u0435 \u0442\u0430\u0431\u043b\u0438\u0446\u044b \u0438 \u0433\u0440\u0430\u0444\u0438\u043a\u0438:<\/p>\n<pre><code class=\"python\"># \u043d\u0430 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445 \u0438\u0437 Colab (\u0438\u043b\u0438 \u043d\u0430 \u0441\u0432\u043e\u0438\u0445 \u0434\u043e\u043c\u0435\u043d\u043d\u044b\u0445):python compress_experiment.py --emb qwen3_emb.npy --outdir results# \u0431\u0435\u0437 \u0444\u0430\u0439\u043b\u0430 \u2014 \u043d\u0430 \u0441\u0438\u043d\u0442\u0435\u0442\u0438\u0447\u0435\u0441\u043a\u043e\u043c \u043a\u043e\u0440\u043f\u0443\u0441\u0435, \u0447\u0442\u043e\u0431\u044b \u043f\u0440\u043e\u0441\u0442\u043e \u043f\u0440\u043e\u0432\u0435\u0440\u0438\u0442\u044c \u043f\u0430\u0439\u043f\u043b\u0430\u0439\u043d:python compress_experiment.py --outdir results<\/code><div class=\"code-explainer\"><a href=\"https:\/\/sourcecraft.dev\/\" class=\"tm-button code-explainer__link\" style=\"visibility: hidden;\"><img style=\"width:14px;height:14px;object-fit:cover;object-position:left;\"\/><\/a><\/div><\/pre>\n<p>\u041f\u043e\u0434\u0441\u0442\u0430\u0432\u044c\u0442\u0435 \u0441\u0432\u043e\u0438 \u0432\u0435\u043a\u0442\u043e\u0440\u044b &#8212; \u0438 \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u0435 \u0441\u0432\u043e\u044e \u0442\u043e\u0447\u043a\u0443 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall \u043d\u0430 \u0441\u0432\u043e\u0435\u043c \u0434\u043e\u043c\u0435\u043d\u0435<\/p>\n<p><strong>\u0418\u0441\u0442\u043e\u0447\u043d\u0438\u043a\u0438<\/strong><\/p>\n<ul>\n<li>\n<p>Matryoshka Representation Learning \u2014 <a href=\"https:\/\/arxiv.org\/abs\/2205.13147\" rel=\"noopener noreferrer nofollow\">arxiv.org\/abs\/2205.13147<\/a><\/p>\n<\/li>\n<li>\n<p>To MRL or not to MRL: Text Embeddings are Robust to Truncation Without Matryoshka Embeddings, Except In Heavy Truncation Scenarios (2026) \u2014 <a href=\"https:\/\/arxiv.org\/abs\/2605.16608\" rel=\"noopener noreferrer nofollow\">arxiv.org\/abs\/2605.16608<\/a><\/p>\n<\/li>\n<li>\n<p>Qdrant \u2014 Quantization guide \u2014 <a href=\"https:\/\/qdrant.tech\/documentation\/guides\/quantization\/\" rel=\"noopener noreferrer nofollow\">qdrant.tech\/documentation\/guides\/quantization<\/a><\/p>\n<\/li>\n<li>\n<p>Qdrant \u2014 Binary Quantization \u2014 <a href=\"https:\/\/qdrant.tech\/articles\/binary-quantization\/\" rel=\"noopener noreferrer nofollow\">qdrant.tech\/articles\/binary-quantization<\/a><\/p>\n<\/li>\n<li>\n<p>Qdrant \u2014 Accuracy Recovery with Rescoring \u2014 <a href=\"https:\/\/qdrant.tech\/documentation\/guides\/quantization\/\" rel=\"noopener noreferrer nofollow\">qdrant.tech\/documentation\/guides\/quantization<\/a><\/p>\n<\/li>\n<li>\n<p>Qwen3-Embedding (blog + \u043c\u043e\u0434\u0435\u043b\u0438) \u2014 <a href=\"https:\/\/qwenlm.github.io\/blog\/qwen3-embedding\/\" rel=\"noopener noreferrer nofollow\">qwenlm.github.io\/blog\/qwen3-embedding<\/a><\/p>\n<\/li>\n<li>\n<p>Qwen3-Embedding-0.6B \u043d\u0430 HuggingFace \u2014 <a href=\"https:\/\/huggingface.co\/Qwen\/Qwen3-Embedding-0.6B\" rel=\"noopener noreferrer nofollow\">huggingface.co\/Qwen\/Qwen3-Embedding-0.6B<\/a><\/p>\n<\/li>\n<li>\n<p>\u041f\u0440\u0435\u0434\u044b\u0434\u0443\u0449\u0430\u044f \u0441\u0442\u0430\u0442\u044c\u044f \u0441\u0435\u0440\u0438\u0438: Retrieval \u0432 2026 \u2014 <a href=\"https:\/\/habr.com\/ru\/articles\/1049872\/\" rel=\"noopener noreferrer nofollow\">habr.com\/ru\/articles\/1049872<\/a><\/p>\n<\/li>\n<\/ul>\n<\/div>\n<p>\u0441\u0441\u044b\u043b\u043a\u0430 \u043d\u0430 \u043e\u0440\u0438\u0433\u0438\u043d\u0430\u043b \u0441\u0442\u0430\u0442\u044c\u0438 <a href=\"https:\/\/habr.com\/ru\/articles\/1054930\/\">https:\/\/habr.com\/ru\/articles\/1054930\/<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u0412 \u043f\u0440\u043e\u0448\u043b\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435 \u043c\u044b \u0440\u0430\u0437\u0431\u0438\u0440\u0430\u043b\u0438, \u043f\u043e\u0447\u0435\u043c\u0443 retrieval \u0432 2026 \u043f\u0435\u0440\u0435\u0435\u0445\u0430\u043b \u0441 \u044d\u043d\u043a\u043e\u0434\u0435\u0440\u043e\u0432 \u043d\u0430 \u0434\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u044b\u0435 LLM: Qwen3-Embedding, NV-Embed, E5-Mistral \u044d\u043c\u0431\u0435\u0434\u0434\u044f\u0442 \u043b\u0443\u0447\u0448\u0435 BGE, \u0434\u0435\u0440\u0436\u0430\u0442 32k \u043a\u043e\u043d\u0442\u0435\u043a\u0441\u0442\u0430 \u0438 \u043f\u043e\u043d\u0438\u043c\u0430\u044e\u0442 \u0438\u043d\u0441\u0442\u0440\u0443\u043a\u0446\u0438\u0438 \u0432 \u043f\u0440\u043e\u043c\u043f\u0442\u0435.\u041f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u043f\u0440\u043e\u0441\u0442\u0430\u044f. \u0414\u0435\u043a\u043e\u0434\u0435\u0440\u043d\u044b\u0439 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440 7\u20138B \u0434\u0435\u0439\u0441\u0442\u0432\u0438\u0442\u0435\u043b\u044c\u043d\u043e \u0434\u0430\u0435\u0442 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e. \u041d\u043e \u0437\u0430 \u044d\u0442\u043e \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0432\u044b \u043f\u043b\u0430\u0442\u0438\u0442\u0435 \u0442\u0440\u0438\u0436\u0434\u044b: \u043f\u0430\u043c\u044f\u0442\u044c (8B \u0432 fp16 &#8212; \u043d\u0435 \u0442\u043e\u043b\u044c\u043a\u043e \u0432\u0435\u0441\u0430 \u043c\u043e\u0434\u0435\u043b\u0438, \u043d\u043e \u0438 \u0436\u0438\u0440\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b \u0432 \u0438\u043d\u0434\u0435\u043a\u0441\u0435), latency (forward-pass \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438) \u0438 \u0434\u0435\u043d\u044c\u0433\u0438 (GPU \u043f\u043e\u0434 \u043d\u0430\u0433\u0440\u0443\u0437\u043a\u043e\u0439 \u0438\u043b\u0438 \u0441\u0447\u0435\u0442 \u0437\u0430 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433-API). \u0418 \u0435\u0441\u043b\u0438 latency \u043b\u0435\u0447\u0438\u0442\u0441\u044f \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441-\u0441\u0442\u0435\u043a\u043e\u043c (SGLang, \u0431\u0430\u0442\u0447\u0438\u043d\u0433 &#8212; \u0442\u0435\u043c\u0430 \u0431\u0443\u0434\u0443\u0449\u0435\u0439 \u0441\u0442\u0430\u0442\u044c\u0438 \u0441\u0435\u0440\u0438\u0438), \u0442\u043e \u0441\u0442\u043e\u0438\u043c\u043e\u0441\u0442\u044c \u0438\u043d\u0434\u0435\u043a\u0441\u0430 \u0440\u0430\u0441\u0442\u0435\u0442 \u043b\u0438\u043d\u0435\u0439\u043d\u043e \u0441 \u0447\u0438\u0441\u043b\u043e\u043c \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432 \u0438 \u043d\u0435 \u043b\u0435\u0447\u0438\u0442\u0441\u044f \u043d\u0438\u0447\u0435\u043c, \u043a\u0440\u043e\u043c\u0435 \u0441\u0436\u0430\u0442\u0438\u044f \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432\u041f\u0440\u0438\u043c\u0435\u0440, \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u0447\u0443\u0432\u0441\u0442\u0432\u043e\u0432\u0430\u0442\u044c \u043c\u0430\u0441\u0448\u0442\u0430\u0431. Qwen3-Embedding \u043e\u0442\u0434\u0430\u0451\u0442 \u0432\u0435\u043a\u0442\u043e\u0440 \u043d\u0430 1024 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f (\u0443 8B \u2014 \u0434\u043e 4096). \u0412\u043e\u0437\u044c\u043c\u0451\u043c \u0442\u0438\u043f\u0438\u0447\u043d\u044b\u0439 \u043a\u043e\u0440\u043f\u0443\u0441 \u043d\u0430 100\u041c \u0447\u0430\u043d\u043a\u043e\u0432 \u0438 \u0432\u0435\u043a\u0442\u043e\u0440 1024-dim \u0432 fp32:100_000_000 \u00d7 1024 \u00d7 4 \u0431\u0430\u0439\u0442\u0430 = 409 \u0413\u0411409 \u0433\u0438\u0433\u0430\u0431\u0430\u0439\u0442 \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e\u0434 \u0441\u044b\u0440\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b, \u0431\u0435\u0437 HNSW-\u0433\u0440\u0430\u0444\u0430 \u0441\u0432\u0435\u0440\u0445\u0443 (\u0430 \u043e\u043d \u0434\u043e\u0431\u0430\u0432\u043b\u044f\u0435\u0442 \u0435\u0449\u0435 30-50%). \u042d\u0442\u043e \u0443\u0436\u0435 \u043d\u0435 \u0432\u043b\u0435\u0437\u0430\u0435\u0442 \u0432 \u043e\u0434\u0438\u043d \u0443\u0437\u0435\u043b \u0438 \u0441\u0442\u043e\u0438\u0442 \u043e\u0449\u0443\u0442\u0438\u043c\u044b\u0445 \u0434\u0435\u043d\u0435\u0433 \u0432 \u0447\u0430\u0441. \u0422\u043e\u0442 \u0436\u0435 \u0438\u043d\u0434\u0435\u043a\u0441 \u043f\u043e\u0441\u043b\u0435 \u0430\u0433\u0440\u0435\u0441\u0441\u0438\u0432\u043d\u043e\u0433\u043e \u0441\u0436\u0430\u0442\u0438\u044f &#8212; \u0435\u0434\u0438\u043d\u0438\u0446\u044b \u0433\u0438\u0433\u0430\u0431\u0430\u0439\u0442. \u0412\u043e\u043f\u0440\u043e\u0441 \u043d\u0435 \u0432 \u0442\u043e\u043c, \u0441\u0436\u0438\u043c\u0430\u0442\u044c \u043b\u0438. \u0412\u043e\u043f\u0440\u043e\u0441 &#8212; \u0433\u0434\u0435 \u0442\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recall\u0412 \u044d\u0442\u043e\u0439 \u0441\u0442\u0430\u0442\u044c\u0435 \u0440\u0430\u0437\u0431\u0435\u0440\u0435\u043c \u0432\u0441\u0435 \u043e\u0441\u0438 \u0441\u0436\u0430\u0442\u0438\u044f, \u043f\u043e\u0441\u043c\u043e\u0442\u0440\u0438\u043c \u043d\u0430 \u0440\u0435\u0430\u043b\u044c\u043d\u044b\u0435 \u0437\u0430\u043c\u0435\u0440\u044b, \u0433\u0434\u0435 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0434\u0435\u0433\u0440\u0430\u0434\u0438\u0440\u0443\u0435\u0442 \u043c\u044f\u0433\u043a\u043e, \u0430 \u0433\u0434\u0435 \u043e\u0431\u0440\u044b\u0432\u0430\u0435\u0442\u0441\u044f \u0432 \u043f\u0440\u043e\u043f\u0430\u0441\u0442\u044c, \u0438 \u0432\u0430\u0441 \u0436\u0434\u0435\u0442 \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u043c\u044b\u0439 \u0441\u043a\u0440\u0438\u043f\u0442 + Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a, \u0447\u0442\u043e\u0431\u044b \u0432\u044b \u043f\u0440\u043e\u0433\u043d\u0430\u043b\u0438 \u0442\u043e \u0436\u0435 \u0441\u0430\u043c\u043e\u0435 \u043d\u0430 \u0441\u0432\u043e\u0438\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445, \u0435\u0441\u043b\u0438 \u0431\u0443\u0434\u0435\u0442 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e.&gt; \u0412\u0435\u0441\u044c \u043a\u043e\u0434 \u0438 \u0434\u0430\u043d\u043d\u044b\u0435 \u0434\u043b\u044f \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u044f &#8212; \u0432 \u043a\u043e\u043d\u0446\u0435 \u0441\u0442\u0430\u0442\u044c\u0438. \u0421\u043a\u0440\u0438\u043f\u0442 compress_experiment.py \u043f\u0440\u0438\u043d\u0438\u043c\u0430\u0435\u0442 \u0432\u0430\u0448\u0443 \u043c\u0430\u0442\u0440\u0438\u0446\u0443 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u043e\u0432 \u0438 \u0438\u0437\u043c\u0435\u0440\u044f\u0435\u0442 \u0432\u0441\u0435, \u0447\u0442\u043e \u043d\u0438\u0436\u0435, \u043d\u0430 CPU. Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a \u0434\u0435\u043b\u0430\u0435\u0442 \u0442\u043e \u0436\u0435 \u0441\u0430\u043c\u043e\u0435 \u043d\u0430 \u0440\u0435\u0430\u043b\u044c\u043d\u043e\u0439 Qwen3-Embedding-0.6B &#8212; free-\u0432\u0435\u0440\u0441\u0438\u0438 T4 \u0445\u0432\u0430\u0442\u0430\u0435\u0442\u0422\u0440\u0438 \u043e\u0441\u0438 \u0441\u0436\u0430\u0442\u0438\u044f (\u0438 \u043f\u043e\u0447\u0435\u043c\u0443 \u0438\u0445 \u043f\u0443\u0442\u0430\u044e\u0442)\u041a\u043e\u0433\u0434\u0430 \u0433\u043e\u0432\u043e\u0440\u044f\u0442 \u00ab\u0441\u0436\u0430\u0442\u044c \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u00bb, \u043e\u0431\u044b\u0447\u043d\u043e \u0441\u043c\u0435\u0448\u0438\u0432\u0430\u044e\u0442 \u0442\u0440\u0438 \u043d\u0435\u0437\u0430\u0432\u0438\u0441\u0438\u043c\u044b\u0435 \u0432\u0435\u0449\u0438, \u043a\u043e\u0442\u043e\u0440\u044b\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043d\u0430 \u0440\u0430\u0437\u043d\u044b\u0445 \u0443\u0440\u043e\u0432\u043d\u044f\u0445:1. \u0414\u0438\u0441\u0442\u0438\u043b\u043b\u044f\u0446\u0438\u044f &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0441\u0430\u043c\u0443 \u043c\u043e\u0434\u0435\u043b\u044c. \u0423\u0447\u0438\u043c \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0443\u044e \u043c\u043e\u0434\u0435\u043b\u044c (0.6B) \u0432\u043e\u0441\u043f\u0440\u043e\u0438\u0437\u0432\u043e\u0434\u0438\u0442\u044c \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 (8B). \u0423\u043c\u0435\u043d\u044c\u0448\u0430\u0435\u0442\u0441\u044f \u0432\u0435\u0441 \u043c\u043e\u0434\u0435\u043b\u0438, latency \u0438\u043d\u0444\u0435\u0440\u0435\u043d\u0441\u0430 \u0438, \u043a\u043e\u0441\u0432\u0435\u043d\u043d\u043e, \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u0432\u0435\u043a\u0442\u043e\u0440\u0430. \u042d\u0442\u043e \u0441\u0430\u043c\u044b\u0439 \u0434\u043e\u0440\u043e\u0433\u043e\u0439 \u043f\u0443\u0442\u044c: \u043d\u0443\u0436\u0435\u043d \u0441\u0432\u043e\u0439 \u0434\u0430\u0442\u0430\u0441\u0435\u0442 \u0438 \u043e\u0431\u0443\u0447\u0435\u043d\u0438\u0435. \u0414\u0438\u0441\u0442\u0438\u043b\u043b\u044f\u0446\u0438\u044e \u044f \u043e\u0441\u0442\u0430\u0432\u043b\u044e \u0437\u0430 \u0441\u043a\u043e\u0431\u043a\u0430\u043c\u0438 &#8212; \u043e\u043d\u0430 \u0441\u043c\u044b\u043a\u0430\u0435\u0442\u0441\u044f \u0441 \u0444\u0430\u0439\u043d\u0442\u044e\u043d\u043e\u043c \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440\u0430, \u0430 \u044d\u0442\u043e \u0434\u043e\u0441\u0442\u043e\u0439\u043d\u043e \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u044b\u0445 \u0441\u0442\u0430\u0442\u0435\u04392. \u041a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0442\u043e\u0447\u043d\u043e\u0441\u0442\u044c \u0447\u0438\u0441\u0435\u043b \u0432 \u0432\u0435\u043a\u0442\u043e\u0440\u0435. \u0412\u0435\u043a\u0442\u043e\u0440 \u043e\u0441\u0442\u0430\u0435\u0442\u0441\u044f \u0442\u043e\u0439 \u0436\u0435 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438, \u043d\u043e \u043a\u0430\u0436\u0434\u043e\u0435 \u0447\u0438\u0441\u043b\u043e \u0445\u0440\u0430\u043d\u0438\u0442\u0441\u044f \u043d\u0435 \u0432 fp32 (4 \u0431\u0430\u0439\u0442\u0430), \u0430 \u0432 int8 (1 \u0431\u0430\u0439\u0442), int4 (\u043f\u043e\u043b\u0431\u0430\u0439\u0442\u0430) \u0438\u043b\u0438 \u0432\u043e\u043e\u0431\u0449\u0435 \u0432 1 \u0431\u0438\u0442\u0435. \u041c\u043e\u0434\u0435\u043b\u044c \u043d\u0435 \u0442\u0440\u043e\u0433\u0430\u0435\u043c &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0443\u0436\u0435 \u043f\u043e\u0441\u0447\u0438\u0442\u0430\u043d\u043d\u044b\u0435 \u0432\u0435\u043a\u0442\u043e\u0440\u044b. \u0414\u0435\u0448\u0435\u0432\u043e, \u043e\u0431\u0440\u0430\u0442\u0438\u043c\u043e, \u0434\u0430\u0435\u0442 4\u201332&#215;3. MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 &#8212; \u0441\u0436\u0438\u043c\u0430\u0435\u043c \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c \u0432\u0435\u043a\u0442\u043e\u0440\u0430. \u041c\u0430\u0442\u0440\u0435\u0448\u043a\u0430 (Matryoshka Representation Learning): \u0440\u0435\u0436\u0435\u043c 1024-\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0434\u043e 512\/256\/128, \u0435\u0441\u043b\u0438 \u043c\u043e\u0434\u0435\u043b\u044c \u043e\u0431\u0443\u0447\u0435\u043d\u0430 \u0442\u0430\u043a, \u0447\u0442\u043e \u0432\u0430\u0436\u043d\u043e\u0435 \u043b\u0435\u0436\u0438\u0442 \u0432 \u043f\u0435\u0440\u0432\u044b\u0445 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u0430\u0445\u041a\u043b\u044e\u0447\u0435\u0432\u043e\u0439 \u0444\u0430\u043a\u0442, \u0440\u0430\u0434\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e \u0441\u0442\u043e\u0438\u0442 \u0434\u0435\u0440\u0436\u0430\u0442\u044c \u044d\u0442\u0443 \u0442\u0440\u043e\u0439\u043a\u0443 \u0432 \u0433\u043e\u043b\u043e\u0432\u0435: \u043e\u0441\u0438 2 \u0438 3 \u043f\u0440\u0430\u043a\u0442\u0438\u0447\u0435\u0441\u043a\u0438 \u043d\u0435 \u0442\u0440\u0435\u0431\u0443\u044e\u0442 GPU \u0438 \u043d\u0435 \u0442\u0440\u043e\u0433\u0430\u044e\u0442 \u043c\u043e\u0434\u0435\u043b\u044c. \u041e\u043d\u0438 \u0440\u0430\u0431\u043e\u0442\u0430\u044e\u0442 \u043f\u043e\u0432\u0435\u0440\u0445 \u0433\u043e\u0442\u043e\u0432\u043e\u0439 \u043c\u0430\u0442\u0440\u0438\u0446\u044b \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432. GPU \u043d\u0443\u0436\u0435\u043d \u0440\u043e\u0432\u043d\u043e \u043e\u0434\u0438\u043d \u0440\u0430\u0437 &#8212; \u0447\u0442\u043e\u0431\u044b \u043f\u043e\u043b\u0443\u0447\u0438\u0442\u044c \u0441\u0430\u043c\u0438 \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438. \u0412\u0441\u0435 \u043e\u0441\u0442\u0430\u043b\u044c\u043d\u043e\u0435 &#8212; \u0430\u0440\u0438\u0444\u043c\u0435\u0442\u0438\u043a\u0430 \u043d\u0430 CPU\u041e\u0442\u0434\u0435\u043b\u044c\u043d\u043e \u0441\u0442\u043e\u0438\u0442 Product Quantization (PQ) &#8212; \u0442\u043e\u0436\u0435 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f, \u043d\u043e \u0432\u0435\u043a\u0442\u043e\u0440\u043d\u0430\u044f: \u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u043e \u0431\u044c\u0435\u0442\u0441\u044f \u043d\u0430 \u043f\u043e\u0434\u043f\u0440\u043e\u0441\u0442\u0440\u0430\u043d\u0441\u0442\u0432\u0430, \u0432 \u043a\u0430\u0436\u0434\u043e\u043c \u0441\u0442\u0440\u043e\u0438\u0442\u0441\u044f \u043c\u0430\u043b\u0435\u043d\u044c\u043a\u0438\u0439 \u043a\u043e\u0434\u0431\u0443\u043a. PQ \u0436\u0438\u0432\u0435\u0442 \u043d\u0430 \u0441\u0442\u043e\u0440\u043e\u043d\u0435 \u0445\u0440\u0430\u043d\u0438\u043b\u0438\u0449\u0430 (Qdrant, FAISS), \u0430 \u043d\u0435 \u043c\u043e\u0434\u0435\u043b\u0438. \u0420\u0430\u0437\u0431\u0435\u0440\u0435\u043c \u0435\u0433\u043e \u0432\u043c\u0435\u0441\u0442\u0435 \u0441 \u043e\u0441\u0442\u0430\u043b\u044c\u043d\u044b\u043c\u0438\u041a\u0430\u043a \u0447\u0435\u0441\u0442\u043d\u043e \u043c\u0435\u0440\u0438\u0442\u044c \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u044e \u043e\u0442 \u0441\u0436\u0430\u0442\u0438\u044f\u0414\u043b\u044f \u043d\u0430\u0447\u0430\u043b\u0430 \u0440\u0430\u0437\u0431\u0435\u0440\u0435\u043c \u043c\u0435\u0442\u043e\u0434\u043e\u043b\u043e\u0433\u0438\u044e\u0421\u0436\u0430\u0442\u0438\u0435 \u0432\u0441\u0435\u0433\u0434\u0430 \u043e\u0431\u043c\u0435\u043d\u0438\u0432\u0430\u0435\u0442 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u043d\u0430 \u043f\u0430\u043c\u044f\u0442\u044c. \u0427\u0442\u043e\u0431\u044b \u0438\u0437\u043c\u0435\u0440\u0438\u0442\u044c \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e, \u043d\u0443\u0436\u0435\u043d \u044d\u0442\u0430\u043b\u043e\u043d. \u0421\u043e\u0431\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0439 \u0440\u0430\u0437\u043c\u0435\u0447\u0435\u043d\u043d\u044b\u0439 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a \u0441 \u0440\u0443\u0447\u043d\u043e\u0439 \u0440\u0430\u0437\u043c\u0435\u0442\u043a\u043e\u0439 \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u043e\u0441\u0442\u0438 \u043e\u0431\u044f\u0437\u0430\u0442\u0435\u043b\u0435\u043d (\u043d\u043e \u044d\u0442\u0430 \u0442\u0435\u043c\u0430 \u0442\u043e\u0436\u0435 \u0434\u043e\u0441\u0442\u043e\u0439\u043d\u0430 \u0431\u044b\u0442\u044c \u0440\u0430\u0437\u043e\u0431\u0440\u0430\u043d\u043d\u043e\u0439 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e) \u0438 \u043e\u0442\u0432\u0435\u0447\u0430\u0435\u0442 \u043e\u043d \u043d\u0430 \u0434\u0440\u0443\u0433\u043e\u0439 \u0432\u043e\u043f\u0440\u043e\u0441 &#8212; \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0445\u043e\u0440\u043e\u0448 \u044d\u043c\u0431\u0435\u0434\u0434\u0435\u0440 \u0432\u043e\u043e\u0431\u0449\u0435. \u0417\u0434\u0435\u0441\u044c \u0432\u043e\u043f\u0440\u043e\u0441 \u0434\u0440\u0443\u0433\u043e\u0439: \u043d\u0430\u0441\u043a\u043e\u043b\u044c\u043a\u043e \u0441\u0436\u0430\u0442\u0438\u0435 \u0438\u0441\u043f\u043e\u0440\u0442\u0438\u043b\u043e \u0442\u043e, \u0447\u0442\u043e \u0443\u0436\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u043b\u043e. \u0418 \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u044b\u0439 \u044d\u0442\u0430\u043b\u043e\u043d \u0434\u043b\u044f \u043d\u0435\u0433\u043e &#8212; \u0441\u0430\u043c \u043d\u0435\u0441\u0436\u0430\u0442\u044b\u0439 \u043f\u043e\u0438\u0441\u043a.\u041c\u0435\u0442\u043e\u0434\u043e\u043b\u043e\u0433\u0438\u044f \u0441\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u0430\u044f, \u0435\u0435 \u0438\u0441\u043f\u043e\u043b\u044c\u0437\u0443\u044e\u0442 ann-benchmarks \u0438 \u0441\u0430\u043c Qdrant \u043f\u0440\u0438 \u0437\u0430\u043c\u0435\u0440\u0435 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438:\u0411\u0435\u0440\u0435\u043c \u043d\u0435\u0441\u0436\u0430\u0442\u044b\u0435 fp32-\u0432\u0435\u043a\u0442\u043e\u0440\u044b. \u0414\u043b\u044f \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0437\u0430\u043f\u0440\u043e\u0441\u0430 \u0442\u043e\u0447\u043d\u044b\u043c \u043f\u0435\u0440\u0435\u0431\u043e\u0440\u043e\u043c \u043d\u0430\u0445\u043e\u0434\u0438\u043c top-10 \u0431\u043b\u0438\u0436\u0430\u0439\u0448\u0438\u0445. \u042d\u0442\u043e golden\u0421\u0436\u0438\u043c\u0430\u0435\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u044b \u043b\u044e\u0431\u044b\u043c \u043c\u0435\u0442\u043e\u0434\u043e\u043c. \u0414\u043b\u044f \u0442\u0435\u0445 \u0436\u0435 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432 \u0438\u0449\u0435\u043c top-10 \u0443\u0436\u0435 \u043f\u043e \u0441\u0436\u0430\u0442\u044b\u043crecall@10 = |top10_\u0441\u0436\u0430\u0442\u044b\u0439 \u2229 top10_fp32| \/ 10, \u0443\u0441\u0440\u0435\u0434\u043d\u044f\u0435\u043c \u043f\u043e \u0437\u0430\u043f\u0440\u043e\u0441\u0430\u043crecall@10 = 1.0 \u043e\u0437\u043d\u0430\u0447\u0430\u0435\u0442, \u0447\u0442\u043e \u0441\u0436\u0430\u0442\u0438\u0435 \u043d\u0438\u0447\u0435\u0433\u043e \u043d\u0435 \u0438\u0437\u043c\u0435\u043d\u0438\u043b\u043e \u0432 \u0432\u044b\u0434\u0430\u0447\u0435. recall@10 = 0.7 \u2014 \u0432 \u0441\u0440\u0435\u0434\u043d\u0435\u043c 3 \u0438\u0437 10 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u0441\u0436\u0430\u0442\u0438\u0435 \u043f\u043e\u0442\u0435\u0440\u044f\u043b\u043e. \u0420\u0443\u0447\u043d\u0430\u044f \u0440\u0430\u0437\u043c\u0435\u0442\u043a\u0430 \u0442\u0443\u0442 \u043d\u0435 \u043d\u0443\u0436\u043d\u0430: \u043c\u044b \u0438\u0437\u043c\u0435\u0440\u044f\u0435\u043c \u043f\u043e\u0442\u0435\u0440\u044e \u043e\u0442 \u0441\u0436\u0430\u0442\u0438\u044f, \u0438 fp32-\u0432\u044b\u0434\u0430\u0447\u0430 \u0441\u043b\u0443\u0436\u0438\u0442 \u043a\u043e\u0440\u0440\u0435\u043a\u0442\u043d\u044b\u043c \u043d\u0443\u043b\u0435\u043c \u043e\u0442\u0441\u0447\u0435\u0442\u0430.def recall_at_k(pred, gold, k=10):    hits = sum(len(set(p[:k]) &amp; set(g[:k])) for p, g in zip(pred, gold))    return hits \/ (len(gold) * k)\u0412\u0441\u0435 \u0446\u0438\u0444\u0440\u044b \u043d\u0438\u0436\u0435 &#8212; \u043f\u0440\u043e\u0433\u043e\u043d Qwen3-Embedding-0.6B (1024-dim) \u043d\u0430 \u043a\u043e\u0440\u043f\u0443\u0441\u0435 \u0438\u0437 5500 \u0434\u043e\u043a\u0443\u043c\u0435\u043d\u0442\u043e\u0432, 500 \u0437\u0430\u043f\u0440\u043e\u0441\u043e\u0432. \u042d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438 \u0441\u0447\u0438\u0442\u0430\u0435\u0442 Colab-\u043d\u043e\u0443\u0442\u0431\u0443\u043a (\u0435\u0434\u0438\u043d\u0441\u0442\u0432\u0435\u043d\u043d\u044b\u0439 GPU-\u0448\u0430\u0433), \u0434\u0430\u043b\u044c\u0448\u0435 compress_experiment.py\u043f\u0440\u043e\u0432\u043e\u0434\u0438\u0442 \u0437\u0430\u043c\u0435\u0440\u044b \u043d\u0430 CPU. Golden &#8212; \u0442\u043e\u0447\u043d\u044b\u0439 fp32-\u043f\u043e\u0438\u0441\u043a \u043f\u043e \u043f\u043e\u043b\u043d\u044b\u043c 1024-\u043c\u0435\u0440\u043d\u044b\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c.\u041a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f: int8 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d, binary \u2014 \u043e\u0431\u0440\u044b\u0432\u041d\u0430\u0447\u043d\u0435\u043c \u0441 \u043f\u043e\u044d\u043b\u0435\u043c\u0435\u043d\u0442\u043d\u043e\u0439 \u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u0438. \u0418\u0434\u0435\u044f: \u0443 \u043a\u0430\u0436\u0434\u043e\u0439 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442\u044b \u0432\u0435\u043a\u0442\u043e\u0440\u0430 \u0435\u0441\u0442\u044c \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d [min, max] \u043f\u043e \u043a\u043e\u0440\u043f\u0443\u0441\u0443. \u0420\u0430\u0437\u0431\u0438\u0432\u0430\u0435\u043c \u0435\u0433\u043e \u043d\u0430 2^bits \u0443\u0440\u043e\u0432\u043d\u0435\u0439 \u0438 \u0445\u0440\u0430\u043d\u0438\u043c \u043d\u043e\u043c\u0435\u0440 \u0443\u0440\u043e\u0432\u043d\u044f \u0432\u043c\u0435\u0441\u0442\u043e float.def q_scalar(C, bits):    levels = (1 &lt;&lt; bits) &#8212; 1    lo, hi = C.min(0), C.max(0)          # \u043f\u043e \u043a\u0430\u0436\u0434\u043e\u0439 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043e\u0442\u0434\u0435\u043b\u044c\u043d\u043e    scale = (hi &#8212; lo) \/ levels    codes = np.clip(np.round((C &#8212; lo) \/ scale), 0, levels)    return codes * scale + lo            # \u0434\u0435\u043a\u0432\u0430\u043d\u0442\u043e\u0432\u0430\u043d\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440\u0412\u043e\u0442 \u0447\u0442\u043e \u043f\u0440\u043e\u0438\u0441\u0445\u043e\u0434\u0438\u0442 \u0441 recall@10 \u0438 \u043f\u0430\u043c\u044f\u0442\u044c\u044e \u043f\u043e \u0448\u0430\u0433\u0430\u043c \u0441\u0436\u0430\u0442\u0438\u044f:\u041c\u0435\u0442\u043e\u0434recall@10\u0411\u0430\u0439\u0442\/\u0432\u0435\u043a\u0442\u043e\u0440\u0421\u0436\u0430\u0442\u0438\u0435\u0413\u0411 \u043d\u0430 1\u041c \u0432\u0435\u043a\u0442\u043e\u0440\u043e\u0432fp32 (baseline)1.000040961&#215;4.096fp160.998420482&#215;2.048int80.996410244&#215;1.024int40.94785128&#215;0.512binary (\u0431\u0435\u0437 rescore)0.669612832&#215;0.128\u0421\u043a\u0430\u043b\u044f\u0440\u043d\u043e\u0435 \u0441\u0436\u0430\u0442\u0438\u0435: \u0442\u043e\u0447\u043a\u0430 \u043d\u0435\u0432\u043e\u0437\u0432\u0440\u0430\u0442\u0430 \u043f\u043e recallfp16 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d. \u0412\u0434\u0432\u043e\u0435 \u043c\u0435\u043d\u044c\u0448\u0435 \u043f\u0430\u043c\u044f\u0442\u0438, recall \u043d\u0435 \u043e\u0442\u043b\u0438\u0447\u0438\u0442\u044c \u043e\u0442 fp32 (0.9984). \u0415\u0441\u043b\u0438 \u0432\u044b \u0434\u043e \u0441\u0438\u0445 \u043f\u043e\u0440 \u0445\u0440\u0430\u043d\u0438\u0442\u0435 \u0438\u043d\u0434\u0435\u043a\u0441 \u0432 fp32 &#8212; \u0432\u044b \u043f\u0440\u043e\u0441\u0442\u043e \u043f\u043b\u0430\u0442\u0438\u0442\u0435 \u0432\u0434\u0432\u043e\u0435 \u043d\u0438 \u0437\u0430 \u0447\u0442\u043e. fp16 \u0441\u0442\u043e\u0438\u0442 \u0432\u043a\u043b\u044e\u0447\u0430\u0442\u044c \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e, \u043a\u0430\u043a \u0431\u0430\u0437\u043e\u0432\u0443\u044e \u0433\u0438\u0433\u0438\u0435\u043d\u0443 \u0438\u043d\u0434\u0435\u043a\u0441\u0430.int8 &#8212; \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u0435\u043d \u0438 \u044d\u0442\u043e \u043f\u0440\u0430\u0432\u0438\u043b\u044c\u043d\u0430\u044f \u0442\u043e\u0447\u043a\u0430 \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e. 4x \u0441\u0436\u0430\u0442\u0438\u044f, recall 0.9964 &#8212; \u043f\u0430\u0434\u0435\u043d\u0438\u0435 \u0432 \u0442\u0440\u0435\u0442\u044c \u043f\u0440\u043e\u0446\u0435\u043d\u0442\u0430. \u0421\u043e\u0433\u043b\u0430\u0441\u0443\u0435\u0442\u0441\u044f \u0441 \u0442\u0435\u043c, \u0447\u0442\u043e \u0437\u0430\u044f\u0432\u043b\u044f\u0435\u0442 Qwen: int8-\u043a\u0432\u0430\u043d\u0442\u0438\u0437\u0430\u0446\u0438\u044f \u0441\u043e\u0445\u0440\u0430\u043d\u044f\u0435\u0442 retrieval-\u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u0441 \u043f\u0440\u0435\u043d\u0435\u0431\u0440\u0435\u0436\u0438\u043c\u043e\u0439 \u0434\u0435\u0433\u0440\u0430\u0434\u0430\u0446\u0438\u0435\u0439. 409 \u0413\u0411 \u0438\u0437 \u043f\u0440\u0438\u043c\u0435\u0440\u0430 \u0432\u043e \u0432\u0441\u0442\u0443\u043f\u043b\u0435\u043d\u0438\u0438 \u043f\u0440\u0435\u0432\u0440\u0430\u0449\u0430\u044e\u0442\u0441\u044f \u0432 ~102 \u0413\u0411, \u0438 \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0437 \u043f\u043e\u0441\u043b\u0435\u0434\u0441\u0442\u0432\u0438\u0439.int4 &#8212; \u043e\u0441\u043e\u0437\u043d\u0430\u043d\u043d\u044b\u0439, \u043d\u043e \u0449\u0430\u0434\u044f\u0449\u0438\u0439 \u0440\u0430\u0437\u043c\u0435\u043d. 8x \u0441\u0436\u0430\u0442\u0438\u044f, recall 0.948 \u2014 \u043c\u0438\u043d\u0443\u0441 ~5 \u043f\u0443\u043d\u043a\u0442\u043e\u0432. \u0414\u043b\u044f \u043c\u043d\u043e\u0433\u0438\u0445 \u043f\u0440\u043e\u0434\u043e\u0432\u044b\u0445 \u0441\u0446\u0435\u043d\u0430\u0440\u0438\u0435\u0432 \u044d\u0442\u043e \u0442\u0435\u0440\u043f\u0438\u043c\u043e (\u043e\u0441\u043e\u0431\u0435\u043d\u043d\u043e \u0435\u0441\u043b\u0438 \u0441\u0432\u0435\u0440\u0445\u0443 \u0441\u0442\u043e\u0438\u0442 reranker, \u043a\u043e\u0442\u043e\u0440\u044b\u0439 \u043f\u0435\u0440\u0435\u0440\u0430\u043d\u0436\u0438\u0440\u0443\u0435\u0442 \u0442\u043e\u043f), \u043d\u043e \u0432\u043a\u043b\u044e\u0447\u0430\u0442\u044c int4 \u043f\u043e \u0443\u043c\u043e\u043b\u0447\u0430\u043d\u0438\u044e \u0443\u0436\u0435 \u043d\u0435\u043b\u044c\u0437\u044f &#8212; \u0441\u0432\u0435\u0440\u044f\u0439\u0442\u0435\u0441\u044c \u0441 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u043e\u043c.binary \u0432 \u043e\u0434\u0438\u043d\u043e\u0447\u043a\u0443 &#8212; \u043a\u0430\u0442\u0430\u0441\u0442\u0440\u043e\u0444\u0430. 32x \u0441\u0436\u0430\u0442\u0438\u044f \u0432\u044b\u0433\u043b\u044f\u0434\u0438\u0442 \u0441\u043e\u0431\u043b\u0430\u0437\u043d\u0438\u0442\u0435\u043b\u044c\u043d\u043e, \u043d\u043e recall \u0440\u0443\u0445\u043d\u0443\u043b \u0434\u043e 0.67. \u0422\u0440\u0435\u0442\u044c \u0440\u0435\u043b\u0435\u0432\u0430\u043d\u0442\u043d\u044b\u0445 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442\u043e\u0432 \u043f\u0440\u043e\u0441\u0442\u043e \u0442\u0435\u0440\u044f\u0435\u0442\u0441\u044f. \u0415\u0441\u043b\u0438 \u0432\u044b \u0432\u043a\u043b\u044e\u0447\u0438\u043b\u0438 binary quantization \u0438 \u043d\u0435 \u0441\u0434\u0435\u043b\u0430\u043b\u0438 \u043d\u0438\u0447\u0435\u0433\u043e \u0431\u043e\u043b\u044c\u0448\u0435 &#8212; \u0432\u044b \u0441\u043b\u043e\u043c\u0430\u043b\u0438 \u043f\u043e\u0438\u0441\u043a. \u0418 \u0432\u043e\u0442 \u0442\u0443\u0442 \u043d\u0430\u0447\u0438\u043d\u0430\u0435\u0442\u0441\u044f \u0441\u0430\u043c\u043e\u0435 \u0438\u043d\u0442\u0435\u0440\u0435\u0441\u043d\u043e\u0435.Binary + rescoring: \u043a\u0430\u043a \u0432\u0435\u0440\u043d\u0443\u0442\u044c recall \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043eBinary quantization \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u0442 \u043e\u0442 \u043a\u0430\u0436\u0434\u043e\u0433\u043e \u0447\u0438\u0441\u043b\u0430 \u043e\u0434\u0438\u043d \u0431\u0438\u0442 &#8212; \u0437\u043d\u0430\u043a. \u0412\u0435\u043a\u0442\u043e\u0440 \u043d\u0430 1024 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u044f \u0441\u0436\u0438\u043c\u0430\u0435\u0442\u0441\u044f \u0441 4096 \u0431\u0430\u0439\u0442 \u0434\u043e 128 \u0431\u0430\u0439\u0442, \u0438 \u043f\u043e\u0438\u0441\u043a \u0438\u0434\u0435\u0442 \u043f\u043e \u0440\u0430\u0441\u0441\u0442\u043e\u044f\u043d\u0438\u044e \u0425\u044d\u043c\u043c\u0438\u043d\u0433\u0430 (XOR + popcount) &#8212; \u044d\u0442\u043e \u043e\u043f\u0435\u0440\u0430\u0446\u0438\u0438 \u043d\u0430 \u0440\u0435\u0433\u0438\u0441\u0442\u0440\u0430\u0445 \u043f\u0440\u043e\u0446\u0435\u0441\u0441\u043e\u0440\u0430, \u0434\u0438\u043a\u043e \u0431\u044b\u0441\u0442\u0440\u044b\u0435. \u041f\u0440\u043e\u0431\u043b\u0435\u043c\u0430 \u043e\u0434\u043d\u0430: \u043e\u0434\u043d\u043e\u0433\u043e \u0431\u0438\u0442\u0430 \u043d\u0430 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 \u043c\u0430\u043b\u043e, \u0433\u0440\u0443\u0431\u044b\u0439 \u043f\u043e\u0438\u0441\u043a \u043f\u0443\u0442\u0430\u0435\u0442\u0441\u044f.\u0420\u0435\u0448\u0435\u043d\u0438\u0435 &#8212; oversampling + rescoring. \u041d\u0435 \u0431\u0435\u0440\u0435\u043c top-10 \u043f\u043e \u0431\u0438\u043d\u0430\u0440\u043d\u044b\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c. \u0411\u0435\u0440\u0435\u043c top-30 \u0438\u043b\u0438 top-50 (\u044d\u0442\u043e \u0438 \u0435\u0441\u0442\u044c oversampling), \u0430 \u043f\u043e\u0442\u043e\u043c \u043f\u0435\u0440\u0435\u0440\u0430\u043d\u0436\u0438\u0440\u0443\u0435\u043c \u044d\u0442\u0438\u0445 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u043e\u0432 \u043f\u043e \u043f\u043e\u043b\u043d\u044b\u043c fp32-\u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c \u0438 \u043e\u0441\u0442\u0430\u0432\u043b\u044f\u0435\u043c \u043d\u0430\u0441\u0442\u043e\u044f\u0449\u0438\u0435 top-10.def binary_rescore(Qb, Cb, Qf, Cf, k, oversample):    cand = binary_search(Qb, Cb, k * oversample)     # \u0433\u0440\u0443\u0431\u043e, \u043d\u043e \u0431\u044b\u0441\u0442\u0440\u043e: \u043f\u043e \u0431\u0438\u0442\u0430\u043c    out = []    for i in range(len(Qf)):        c = cand[i]        scores = Cf[c] @ Qf[i]                        # \u0442\u043e\u0447\u043d\u043e, \u043d\u043e \u0442\u043e\u043b\u044c\u043a\u043e \u043f\u043e \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u0430\u043c        out.append(c[np.argsort(-scores)[:k]])    return out\u0424\u043e\u043a\u0443\u0441 \u0432 \u0442\u043e\u043c, \u0447\u0442\u043e rescoring \u0434\u0435\u0448\u0435\u0432\u044b\u0439: \u043c\u044b \u0441\u0447\u0438\u0442\u0430\u0435\u043c \u0442\u043e\u0447\u043d\u043e\u0435 \u0441\u043a\u0430\u043b\u044f\u0440\u043d\u043e\u0435 \u043f\u0440\u043e\u0438\u0437\u0432\u0435\u0434\u0435\u043d\u0438\u0435 \u043d\u0435 \u043f\u043e \u0432\u0441\u0435\u0439 \u0431\u0430\u0437\u0435, \u0430 \u043f\u043e 30\u201350 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u0430\u043c \u043d\u0430 \u0437\u0430\u043f\u0440\u043e\u0441. \u0421\u043c\u043e\u0442\u0440\u0438\u043c, \u043a\u0430\u043a oversampling \u0432\u044b\u0442\u0430\u0441\u043a\u0438\u0432\u0430\u0435\u0442 recall:\u041a\u043e\u043d\u0444\u0438\u0433\u0443\u0440\u0430\u0446\u0438\u044frecall@10binary \u0431\u0435\u0437 rescore0.6696binary + rescore \u00d720.8598binary + rescore \u00d730.9248binary + rescore \u00d750.9666binary + rescore \u00d7100.9912Binary + rescoring: \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043e\u0435 \u0432\u043e\u0441\u0441\u0442\u0430\u043d\u043e\u0432\u043b\u0435\u043d\u0438\u0435 recall\u0418\u0437 recall 0.67 \u043f\u0440\u0438 \u00d73 oversampling \u043f\u043e\u043b\u0443\u0447\u0430\u0435\u0442\u0441\u044f 0.925, \u043f\u0440\u0438 \u00d75 &#8212; 0.967, \u043f\u0440\u0438 \u00d710 &#8212; \u043f\u043e\u0447\u0442\u0438 fp32 (0.991). \u0414\u043b\u044f \u0442\u0440\u0435\u0445-\u043f\u044f\u0442\u0438\u043a\u0440\u0430\u0442\u043d\u043e\u0439 \u00ab\u043f\u0435\u0440\u0435\u0431\u043e\u0440\u043a\u0438\u00bb \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u043e\u0432 \u043f\u0440\u0438 32\u00d7 \u0441\u0436\u0430\u0442\u0438\u0438 \u043e\u0441\u043d\u043e\u0432\u043d\u043e\u0433\u043e \u0438\u043d\u0434\u0435\u043a\u0441\u0430 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e \u043f\u043e\u0447\u0442\u0438 \u043f\u043e\u043b\u043d\u043e\u0441\u0442\u044c\u044e \u0432\u043e\u0437\u0432\u0440\u0430\u0449\u0430\u0435\u0442\u0441\u044f. \u042d\u0442\u043e \u0440\u043e\u0432\u043d\u043e \u0442\u043e\u0442 \u0440\u0435\u0437\u0443\u043b\u044c\u0442\u0430\u0442, \u0440\u0430\u0434\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u0433\u043e binary quantization \u0432\u043e\u043e\u0431\u0449\u0435 \u0438\u043c\u0435\u0435\u0442 \u0441\u043c\u044b\u0441\u043b: \u0433\u0440\u0443\u0431\u044b\u0439 \u043f\u043e\u0438\u0441\u043a \u043f\u043e \u0431\u0438\u0442\u0430\u043c + \u0442\u043e\u0447\u043d\u044b\u0439 rerank \u043f\u043e \u043f\u043e\u043b\u043d\u044b\u043c \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u043c.\u041f\u0440\u0430\u043a\u0442\u0438\u043a\u0430 Qdrant \u044d\u0442\u043e \u043f\u043e\u0434\u0442\u0432\u0435\u0440\u0436\u0434\u0430\u0435\u0442: \u043e\u043d\u0438 \u0440\u0435\u043a\u043e\u043c\u0435\u043d\u0434\u0443\u044e\u0442 oversampling \u0432 \u0434\u0438\u0430\u043f\u0430\u0437\u043e\u043d\u0435 1.5\u20133x \u043a\u0430\u043a sweet spot \u0438 \u0441\u043e\u043e\u0431\u0449\u0430\u044e\u0442, \u0447\u0442\u043e \u043d\u0430 \u0432\u044b\u0441\u043e\u043a\u043e\u0440\u0430\u0437\u043c\u0435\u0440\u043d\u044b\u0445 \u0432\u0435\u043a\u0442\u043e\u0440\u0430\u0445 (\u043d\u0430\u043f\u0440\u0438\u043c\u0435\u0440, Cohere 4096-dim) binary + rescoring \u0434\u0430\u0435\u0442 recall@50 \u043e\u043a\u043e\u043b\u043e 0.98 \u043f\u0440\u0438 2x oversampling, \u0443\u0441\u043a\u043e\u0440\u044f\u044f \u043f\u043e\u0438\u0441\u043a \u0434\u043e 40x. \u041b\u043e\u0433\u0438\u043a\u0430 \u0442\u0430 \u0436\u0435, \u0447\u0442\u043e \u0443 reranker&#8217;\u0430 \u0432 \u043a\u043b\u0430\u0441\u0441\u0438\u0447\u0435\u0441\u043a\u043e\u043c RAG: \u0434\u0435\u0448\u0435\u0432\u044b\u0439 \u043a\u0430\u043d\u0434\u0438\u0434\u0430\u0442\u043d\u044b\u0439 \u043e\u0442\u0431\u043e\u0440, \u0434\u043e\u0440\u043e\u0433\u043e\u0439 \u0442\u043e\u0447\u043d\u044b\u0439 \u0442\u043e\u043f.\u0417\u0434\u0435\u0441\u044c \u0436\u0435 &#8212; \u043f\u0435\u0440\u0432\u044b\u0439 \u0431\u043e\u043b\u044c\u0448\u043e\u0439 \u0430\u043d\u0442\u0438\u043f\u0430\u0442\u0442\u0435\u0440\u043d.&gt; Binary quantization \u0431\u0435\u0437 rescoring \u0443\u0431\u0438\u0432\u0430\u0435\u0442 \u043a\u0430\u0447\u0435\u0441\u0442\u0432\u043e; \u0441 rescoring &#8212; \u043f\u043e\u0447\u0442\u0438 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u0430. \u0420\u0430\u0437\u043d\u0438\u0446\u0430 \u043c\u0435\u0436\u0434\u0443 \u00ab\u0441\u043b\u043e\u043c\u0430\u043d\u043d\u044b\u043c \u043f\u043e\u0438\u0441\u043a\u043e\u043c\u00bb (0.67) \u0438 \u00ab\u043f\u0440\u043e\u0434\u0430\u043a\u0448\u0435\u043d\u043e\u043c\u00bb (0.93\u20130.97) &#8212; \u044d\u0442\u043e \u043e\u0434\u043d\u0430 \u043e\u043f\u0446\u0438\u044f rescore=True \u0438 oversampling. \u0415\u0441\u043b\u0438 \u0432\u044b \u0432\u0438\u0434\u0438\u0442\u0435 \u0432 \u0431\u0435\u043d\u0447\u043c\u0430\u0440\u043a\u0435, \u0447\u0442\u043e binary \u00ab\u043d\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442\u00bb, \u0432 9 \u0441\u043b\u0443\u0447\u0430\u044f\u0445 \u0438\u0437 10 \u043f\u0440\u043e\u0441\u0442\u043e \u043e\u0442\u0441\u0443\u0442\u0441\u0442\u0432\u0443\u0435\u0442 rescoring.\u0418 \u0432\u0442\u043e\u0440\u043e\u0435, \u043c\u0435\u043d\u0435\u0435 \u043e\u0447\u0435\u0432\u0438\u0434\u043d\u043e\u0435: binary \u043b\u044e\u0431\u0438\u0442 \u0432\u044b\u0441\u043e\u043a\u0443\u044e \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c. \u041e\u0434\u0438\u043d \u0431\u0438\u0442 \u043d\u0430 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0435 &#8212; \u0437\u043d\u0430\u0447\u0438\u0442, \u0432\u0435\u0441\u044c \u0441\u0438\u0433\u043d\u0430\u043b \u0434\u0435\u0440\u0436\u0438\u0442\u0441\u044f \u043d\u0430 \u043a\u043e\u043b\u0438\u0447\u0435\u0441\u0442\u0432\u0435 \u0438\u0437\u043c\u0435\u0440\u0435\u043d\u0438\u0439. \u0427\u0435\u043c \u0432\u044b\u0448\u0435 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u044c, \u0442\u0435\u043c \u043b\u0435\u0433\u0447\u0435 \u043f\u0435\u0440\u0435\u043d\u043e\u0441\u0438\u0442\u0441\u044f \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u0430\u0446\u0438\u044f: \u043d\u0430 4096-dim \u043e\u043d\u0430 \u043e\u0442\u044a\u0435\u0434\u0430\u0435\u0442 \u0437\u0430\u043c\u0435\u0442\u043d\u043e \u043c\u0435\u043d\u044c\u0448\u0435, \u0447\u0435\u043c \u043d\u0430 1024 (\u0445\u043e\u0442\u044f rescoring \u043f\u043e\u043b\u0435\u0437\u0435\u043d \u0438 \u0442\u0430\u043c). \u0410 \u0432\u043e\u0442 \u0435\u0441\u043b\u0438 \u0432\u044b \u0441\u043d\u0430\u0447\u0430\u043b\u0430 \u0430\u0433\u0440\u0435\u0441\u0441\u0438\u0432\u043d\u043e \u0443\u0441\u0435\u043a\u043b\u0438 \u0432\u0435\u043a\u0442\u043e\u0440 \u043f\u043e MRL, \u0430 \u043f\u043e\u0442\u043e\u043c \u0431\u0438\u043d\u0430\u0440\u0438\u0437\u043e\u0432\u0430\u043b\u0438 &#8212; \u0432\u044b \u0437\u0430\u0431\u0440\u0430\u043b\u0438 \u0443 binary \u0440\u043e\u0432\u043d\u043e \u0442\u043e\u0442 \u0431\u044e\u0434\u0436\u0435\u0442, \u043d\u0430 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043e\u043d \u0434\u0435\u0440\u0436\u0438\u0442\u0441\u044f.MRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435: \u043a\u043e\u0433\u0434\u0430 \u043c\u0430\u0442\u0440\u0435\u0448\u043a\u0430 \u043e\u043a\u0443\u043f\u0430\u0435\u0442\u0441\u044f \u0438 \u043f\u043e\u0447\u0435\u043c\u0443 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u043d\u0435 \u0431\u0435\u0441\u043f\u043b\u0430\u0442\u043d\u043eMatryoshka Representation Learning &#8212; \u043f\u0440\u0438\u0435\u043c, \u043f\u0440\u0438 \u043a\u043e\u0442\u043e\u0440\u043e\u043c \u043c\u043e\u0434\u0435\u043b\u044c \u043e\u0431\u0443\u0447\u0430\u044e\u0442 \u0442\u0430\u043a, \u0447\u0442\u043e\u0431\u044b \u0432\u0435\u043a\u0442\u043e\u0440 \u043e\u0441\u0442\u0430\u0432\u0430\u043b\u0441\u044f \u043e\u0441\u043c\u044b\u0441\u043b\u0435\u043d\u043d\u044b\u043c \u043f\u0440\u0438 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0438. \u041e\u0431\u0440\u0435\u0437\u0430\u043b\u0438 1024-\u043c\u0435\u0440\u043d\u044b\u0439 \u0432\u0435\u043a\u0442\u043e\u0440 \u0434\u043e \u043f\u0435\u0440\u0432\u044b\u0445 256 \u043a\u043e\u043e\u0440\u0434\u0438\u043d\u0430\u0442, \u043f\u0435\u0440\u0435\u043d\u043e\u0440\u043c\u0438\u0440\u043e\u0432\u0430\u043b\u0438 &#8212; \u0438 \u043e\u043d \u0432\u0441\u0435 \u0435\u0449\u0435 \u0438\u0449\u0435\u0442. Qwen3-Embedding \u043e\u0431\u0443\u0447\u0435\u043d\u0430 \u0441 MRL \u0438 \u043f\u043e\u0434\u0434\u0435\u0440\u0436\u0438\u0432\u0430\u0435\u0442 \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438 \u043e\u0442 32 \u0434\u043e 1024 \u0438\u0437 \u043a\u043e\u0440\u043e\u0431\u043a\u0438.\u0421\u0442\u0430\u043d\u0434\u0430\u0440\u0442\u043d\u044b\u0439 \u0442\u0435\u0437\u0438\u0441 \u0437\u0432\u0443\u0447\u0438\u0442 \u0442\u0430\u043a: \u00abMRL-\u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0440\u0430\u0431\u043e\u0442\u0430\u0435\u0442 \u043c\u044f\u0433\u043a\u043e \u0442\u043e\u043b\u044c\u043a\u043e \u043d\u0430 MRL-\u043c\u043e\u0434\u0435\u043b\u044f\u0445, \u043d\u0430 \u043e\u0431\u044b\u0447\u043d\u043e\u0439 \u043c\u043e\u0434\u0435\u043b\u0438 \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u0435 \u0432\u0441\u0435 \u043b\u043e\u043c\u0430\u0435\u0442\u00bb. \u042d\u0442\u043e \u043f\u043e\u0447\u0442\u0438 \u043f\u0440\u0430\u0432\u0434\u0430, \u0438 \u0441\u0432\u0435\u0436\u0430\u044f \u0440\u0430\u0431\u043e\u0442\u0430 2026 \u0433\u043e\u0434\u0430 (\u00abTo MRL or not to MRL\u00bb, arXiv:2605.16608) \u0443\u0442\u043e\u0447\u043d\u044f\u0435\u0442, \u0433\u0434\u0435 \u0438\u043c\u0435\u043d\u043d\u043e.\u041e\u043a\u0430\u0437\u044b\u0432\u0430\u0435\u0442\u0441\u044f, \u044d\u043c\u0431\u0435\u0434\u0434\u0438\u043d\u0433\u0438 \u0443\u0441\u0442\u043e\u0439\u0447\u0438\u0432\u044b \u043a \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044e \u0441\u0430\u043c\u0438 \u043f\u043e \u0441\u0435\u0431\u0435, \u0431\u0435\u0437 \u0432\u0441\u044f\u043a\u043e\u0433\u043e MRL &#8212; \u043d\u043e \u0442\u043e\u043b\u044c\u043a\u043e \u0434\u043e \u0443\u043c\u0435\u0440\u0435\u043d\u043d\u043e\u0433\u043e \u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u044f (\u043f\u0440\u0438\u043c\u0435\u0440\u043d\u043e \u0434\u043e \u221270\u202680% \u0440\u0430\u0437\u043c\u0435\u0440\u043d\u043e\u0441\u0442\u0438). \u0410 \u0432\u043e\u0442 \u0432 \u0437\u043e\u043d\u0435 \u0442\u044f\u0436\u0435\u043b\u043e\u0433\u043e \u0443\u0441\u0435\u0447\u0435\u043d\u0438\u044f (\u0441\u043e\u043a\u0440\u0430\u0449\u0435\u043d\u0438\u0435 \u043d\u0430 80%+, \u0442\u043e \u0435\u0441\u0442\u044c 1024 \u2192 128 \u0438 \u043d\u0438\u0436\u0435) \u043d\u0435\u043c\u0430\u0442\u00ad\u0440\u0435\u0448\u0435\u0447\u043d\u044b\u0435 \u043c\u043e\u0434\u0435\u043b\u0438 \u043e\u0431\u0432\u0430\u043b\u0438\u0432\u0430\u044e\u0442\u0441\u044f, \u0438 \u0432\u043e\u0442 \u0442\u0430\u043c MRL&#8230;<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[],"tags":[],"class_list":["post-485971","post","type-post","status-publish","format-standard","hentry"],"_links":{"self":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/485971","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=485971"}],"version-history":[{"count":0,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=\/wp\/v2\/posts\/485971\/revisions"}],"wp:attachment":[{"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=485971"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=485971"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/savepearlharbor.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=485971"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}