Можно ли улучшить поиск сложных товаров в интернет-магазинах (или Яндекс Маркете)?

Возможно, те кто постарше, еще помнят price.ru. Вот и я еще помню те времена, когда Яндекс Маркета не было вообще. И даже был период, когда я пытался делать аналог price.ru для американского заказчика, и при этом amazon.com был у нас всего-лишь одним из многих сайтов — источников сведений о товарах (книгах, CD-ROM и т.п.), при том не самым крупным, и еще был живой yahoo… В общем, с тех пор многое изменилось.

Потом появился Яндекс Маркет, сильно вырос Амазон, и скажу прямо — много лет я использовал их как основной инструмент для поиска нужных мне товаров. А теперь вот подумываю, не уйти ли куда-то, на e-katalog скажем (шутка, там свои проблемы)? Или найти другое решение, получше?

Почему, спросите вы? Ну, в первую очередь потому, что поиск. Поиск категорически перестал меня устраивать.

Попробуем описать для начала, с какими проблемами я сталкивался при поиске. Яндекс Маркет тут будет как пример, но многое из описанного касается и других похожих сайтов (Амазон — первый же кто приходит на ум, и там все почти так же плохо).

Как выглядит поиск здорового человека? Ну, как-то вот так наверное 🙂

Если что, это реальный скришнот с мобильного приложения Маркета, сделанный с год назад. Сочетание страницы про IPhone и фото циркулярки от DeWalt сделало тогда мой день. Ну ок, это был баг, его исправили, так что забудем про это и вернемся к реальному поиску и его результатам.

Я буду использовать в качестве примеров поиск инструмента, как ту область, которая мне близка и понятна. В области компьютерного железа, да и пожалуй, в любой другой области, где есть технически сложные товары, мы будем видеть плюс-минус тоже самое.

Начнем с того, какие на мой взгляд, бывают интернет-магазины?

  • Узко специализированные. В нашем случае это например магазин Рубанков, инструменты и прочие товары для столярки. Его отличает от прочих то, что там знают о существовании компаний-производителей японского ручного инструмента Silky, или известнейшей канадской инструментальной компании Veritas. И продукция этих производителей не просто есть на сайте, но и, как правило, в наличии. Специализация не значит, что тут вы найдете все — скажем, инструмент элитного уровня от производителя Bridge City вы вообще в РФ скорее всего не купите. Но тем не менее, тут есть многое.

  • Просто специализированные. Это например Все Инструменты. Тут вы тоже сможете найти товары от той же Silky — но в наличии только одна пилка (из обширного ассортимента в десятки моделей).

  • Не специализированные. Ну это просто Яндекс Маркет, и большинство тех, кто продает на нем. Магазины из двух предыдущих пунктов тут тоже представлены, но структура каталога — от Маркета. Так вот, в нашем конкретном случае Маркет вообще не знает о существовании таких производителей, как Silky или Veritas, и даже если товар (скажем пилу) вы сможете найти — то не через каталог и выбор производителя. А поиск по Veritas приведет вас в лучшем случае к швейным машинкам.

В чем состоят проблемы неспециализированных магазинов при поиске товаров любого относительно узкого сегмента? Ну, наверное проблем тут больше одной, опишу их как я вижу.

Во-первых, это отсутствие специалистов именно в узком сегменте, которые бы детально разбирались в товаре. При этом слово «узкий» не следует понимать буквально, потому что узкий сегмент инструмента, к примеру, это на самом деле широчайший ассортимент, которые растет и меняется каждый год. И который производят как известные солидные фирмы, так и мелкие (в основном китайские) фирмочки. Результат — неполные и неточные описания товаров.

Во-вторых, типовая, уже скорее техническая проблема — это отсутствие уникального идентификатора у товара. Очень часто один товар продается в разных комплектациях. Компьютер в памятью 8 или 16 гигабайт из коробки, инструмент в картонной коробке или кейсе, с теми или иными дополнительными приспособлениями либо расходкой. При этом в сущности, это одна и та же модель — но стоимость дополнительной расходки, кейсов, памяти и пр. вполне может составлять значительную часть цены. Эта проблема приводит к дублированию позиций в поиске, и затрудняет выбор лучшего предложения.

Ну и наверное третья — небольшая глубина и ширина каталога в специализированных разделах. Скажем, при том что в Яндекс Маркете есть 14 (sic!) типов ручных рубанков — там все равно нет например грунтубелей. Ну т.е. даже если у продавца такой появится — в поиске он все равно будет валяться в общей куче (то, что в Яндекс Маркете при этом в основном вообще одна китайская дешевка — это отдельная история, тут я бы винил скорее покупателей, что лучше берут — то и в продаже).

Таким образом, мы имеем, с одной стороны, объяснимый недостаток специалистов, которые разбирались бы в товаре, его пользовательской ценности, комплектации, отличиях моделей друг от друга, а с другой — кучу этих самых моделей, которые отличаются непойми чем. На выходе получается тоже довольно странно. Вот например это — фрагмент моих закладок:

Что мы тут видим? Яндекс Маркет знает, что был вот такой товар, Bosch Biturbo GKT 18V-52 GC бла-бла-бла (в конце концов, я же как-то его в закладки поместил, правда?). И он раньше продавался, а теперь (в этом магазине) не продается. Но он был, и Маркет знает про него достаточно, чтобы его найти. В теории… а попробуем найти реально?

Я не буду приводить вам полный скриншот результатов поиска, они длинные.

Что мы тут видим? Мы видим, что именно этого товара в списке результатов нет. А есть куча других, которые сюда попали не иначе, как по недоразумению. Ну то есть, с одной стороны — в списке куча пил, в названии которых встречается 18V или 18В. С другой — вот на третьей позиции пилка от Bosch на 12 вольт. С третьей — есть пилы сетевые. Есть Bosch PRO и Bosch DIY (несовместимые друг с другом). Есть вообще другие производители. Но самое смешное то, что в длиннющем списке есть лишь одна сетевая погружная пила, которая реально является аналогом искомого товара — на восьмом месте в списке. Ну т.е. на 99% результаты поиска — мусор.

Если вы вдруг не заметили: оно ищет по 18V. А по слову the в английском тексте они не пробовали искать? Нашли бы намного больше 🙂 Где же ваш ИИ, в конце концов?

Решение?

Главный вопрос — что с этим можно сделать? Если бы директором был я (с), то я бы пошел по пути, который давно опробован (скажем, в картах), и пусть не идеально, но работает. Пусть у вас (а в данном случае у вас — это ни у кого) нет специалистов, которые глубоко разбирались бы в товарах, зато у вас есть сообщество. И это сообщество как раз разбирается — ну хотя бы настолько, насколько ему это нужно. Следует сделать так, чтобы каталог товаров был устроен наподобие wiki. И дать возможность пользователям самим расширять и исправлять характеристики товаров.

Сейчас некоторые карточки товаров уже отличаются от других. Вот конкретно эта — предложение магазина itUnite:

Вероятно, эти карточки заполняет продавец, а Маркет тут является платформой, позволяющей магазинам публиковать предложения. И все бы неплохо — кто публикует, тот и отвечает за качество описания. Но…

Если посмотреть внимательно, то ровно эта же пила есть и сама по себе, в виде обычной карточки. Т.е. эта часть товаров просто не занесены в каталог как следует, и поэтому они дублируют друг друга (а если предложений много — то это может быть и три карточки, и больше).

Одна из вещей, которые сообщество могло бы сделать — это как раз убрать это дублирование, т.е. отметить в каталоге, что вот эти карточки — это комплектации или предложения одного и того же товара. Вторая — это занести в каталог такие малоизвестные 🙂 фирмы, как канадская Veritas, или Lee Nielsen, научить софт различать японские пилы катаба и дозуки, и учитывать многие другие тонкости. По сути — пополнять и исправлять каталог на постоянной основе.

Вернемся еще раз к нашей Bosch Biturbo GKT 18V-52 GC. Почему сегодня результаты поиска нерелевантны? Потому что они очевидно не учитывают один из признаков этой пилы — она погружная. Т.е. мы можем нажать на рукоятку, и погрузить диск в материал. Все пилки с префиксом GKS этого не умеют, так что аналогом не являются. С другой стороны, есть ли у найденных товаров что-то общее? Да, есть — у некоторых. Буковка G в обозначении пилы показывает, что пила умеет работать по направляющей шине. Т.е. GKT 18V-52 GC умеет, и GKS 18V-57 G тоже. И как ни странно, но умеет и GKS 12V-26 — хотя в обозначении этого признака в виде буковки тут G нет. Что-то из атрибутов можно было бы извлечь, применяя методы типа машинного обучения, NLP и т.п. Но проще всего — доверить это сообществу.

Дав конечному пользователю возможность редактировать атрибуты, можно было бы позволять ему добавить к некоторым из этих товаров аттрибут «погружная», или атрибут «работа по шине». Что характерно — если попробуете сейчас эти свойства найти в описании, то вы их не найдете. На самом деле все еще чуть сложнее, потому что есть разные типы шин, и лишь некоторые из них совместимы, так что работа по шине — это на самом деле тип поддерживаемой шины, от которого мы приходим к моделям самих шин, и уже к их атрибутам).

Ну и добавив атрибуты, нужно сделать возможным потом по ним искать, естественно. Понятно, что дать редактировать описания и заголовки тоже было бы неплохо. Тогда не было бы таких карточек товаров, как вот эта:

Проблема тут в том, что это не плитка. На ней нельзя готовить, ее даже нельзя поставить так, чтобы нагреваемая поверхность была горизонтальна. При этом в отзывах (год назад) это уже было явно написано. И что вы думаете, хоть кто-то озаботился тем, чтобы поправить заголовок? Только сообщество, на мой взгляд в состоянии такое привести в нормальный вид.

Что еще можно и нужно улучшить?

Стоит заметить, что редактировать сообществу нужно позволять не только атрибуты, но и метаданные о них (тип данных, по сути), потому что сегодня органы управления поиском — это отдельная боль. Скажем, как выглядит чекбокс курильщика? А вот он:

В чем тут проблема? В том, что выбор между аккумуляторным и сетевым инструментом не сводится к «покажите мне только аккумуляторные«. На самом деле — это выбор из трех вариантов, только аккумуляторные, только сетевые, и мне все равно. Самое смешное, что зайдя в какой-нибудь соседний раздел вы имено такой набор из двух чекбоксов (или трех радио) и увидите. А почему тут иначе? А фиг его знает. Кто-то когда-то так решил — и все.

И это я еще на начал вспоминать о том, то бывают инструменты, умеющие работать как от сети, так и от аккумулятора. Скажем, из того что сразу пришло в голову — пылесос DeWALT DCV582.

Замечу так же, что если в основу разметки атрибутов положить что-то типа RDF, и некоторые атрибуты сделать URI, то можно было бы легко делать связи между товарами, скажем, принтером, и его расходниками, лобзиком и пилками для него, ну и так далее. Причем связи типизированные, не просто «см. также», а именно для этого инструмента подходят вот такие аккумуляторы.

В общем-то, такое решение это совсем не новость, его можно посмотреть, взглянув скажем на JIRA (я тут говорю не только про связи между страницами, но и про набор полей, и их вид). Ну то есть, в природе существуют продукты (правда, сделанные совсем для других целей), которые позволяют настраивать UI под себя, в зависимости от того, что именно мы показываем, и весьма гибко.

Выводы

Для начала, хочу отметить, что все что выше описано, не является проблемами, специфичными именно для Яндекс Маркета. Скажем, поиск Амазона в аналогичных ситуациях ведет себя ничуть не лучше, и знание Амазона о производителях тоже оставляет желать. Что с упомянутым e-katalog? Ну тут ситуация чуть другая, судя по всему (я вижу лишь то, что я вижу снаружи) тут за сайтом стоит именно и только пополняемый каким-то способом каталог моделей, поэтому части проблем либо нет, либо они иного сорта. Реально он меня больше устраивает в ряде специфических ситуаций, когда нужно найти не «что-то вроде вот этого», а «конкретно вот это, и если можно — подешевле». Но ассортимент, а в итоге объем и глубина каталога тут явно меньше, поэтому шансы найти что-то редкое вообще стремятся к нулю.

Понятно, что у меня нет готового решения. Это лишь предложения, основное из которых — отдать часть работы по поддержке каталога товаров сообществу, раз уж все равно поддержка того же Яндекс Маркета/Амазона с этой работой явно не справляется. Прекрасно представляю все сложности реализации такой идеи на готовом продукте. Но мне кажется, этот путь — чуть ли не единственно возможный путь реального наполнения интернет-каталога знаниями о реальных товарах.

ссылка на оригинал статьи https://habr.com/ru/post/536334/

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *