Теперь можно не только загрузить изображение, но и добавить к нему текстовое уточнение — система учитывает оба источника и точнее подбирает товары.
Функция приближает поиск к формату ассистента: пользователь может показать пример и сразу уточнить, что именно хочет изменить или найти. В основе решения лежит комбинация нейросетей, обученных разработчиками Wildberries. Благодаря этому система способна смешивать смыслы из картинки и из текста.
Архитектуру сервиса описали в статье «CLIP + LLM в проде: мультимодальный «Поиск по фото» для маркетплейса», а подробнее о новых функциях рассказал Никита Романов, Team Lead продукта «Поиск по фото» на конференции Data Fusion 2026.
ссылка на оригинал статьи https://habr.com/ru/articles/1023306/