Привет, дорогой читатель! Меня зовут Дмитрий, и я более 12 лет занимаюсь веб-разработкой. Так уж получилось, что за это время у меня набралась база клиентов, которые иногда обращаются с той или иной проблемой. Поскольку мой опыт довольно обширный, был среди них один клиент, которого я консультировал по SEO-продвижению сайта.
На днях он обратился ко мне с очень интересным вопросом: «Дмитрий, помогите, пожалуйста. Хочу, чтобы любой GPT-чат при запросе “топ-10 компаний, валяющих валенки” (реальный запрос я заменил) выдавал нашу компанию в первой пятёрке».
На всякий случай я сказал, что прямого механизма для этого, скорее всего, нет, но мне стало очень интересно: если есть задача, значит, должно быть и решение 🙂
Откуда эта информация берётся у GPT-чатов
Я начал разбираться, какие усреднённые механики используют модели, чтобы выдать нам заветный список компаний, валяющих валенки. Выяснил, что модель обучена на публичных данных. К ним относятся: Avito, сервисы с отзывами, картографические сервисы, новостные порталы, форумы, статьи и так далее. Но просто присутствовать в выдаче недостаточно. Вот основополагающие факторы, позволяющие попасть в топ выдачи LLM:
-
Тональность упоминаний. Цитирование в духе «Компания „Валяй валенки“ проиграла в суде» и «Компания „Валяй валенки“ признана лучшей компанией мира» дадут очень разный эффект, когда LLM будет составлять вашему потенциальному клиенту список. Негативные отзывы также снижают общую тональность.
-
Принцип свежести и релевантности. Если компания цитировалась часто и положительно, но в 2012 году, эффект тональности перестаёт играть роль.
-
Агрегация и кластеризация. Модель считает более значимыми те компании, которые повторяются на разных ресурсах. Например, компания А есть на порталах Б, В, Г и Д. Порталы при этом обладают в глазах модели достаточно выраженным трастом (они, короче, мощные и большие) и попадают в тематику запроса, на который нужно сгенерировать ответ. Скорее всего, приоритет будет отдан именно компаниям, присутствующим на большем количестве таких ресурсов.
-
Место в выдаче. В современных чатах есть функция поиска, которая предсказуемо берёт данные из поисковой выдачи. Не думаю, что она отдаёт предпочтение какому-то одному поисковику; скорее, агрегирует выдачу из разных систем и берёт что-то среднее, накладывая описанные выше факторы.
Какая связь с поисковиками?
Поисковик — это кладезь публичных данных и чёткий цифровой след компании. В эпоху GPT-чатов следить за репутацией в интернете стало особенно важно, если вы ведёте бизнес. Раньше пользователь мог не прочитать отзывы, не заметить новости о вашей компании, не увидеть гневный пост, а сейчас GPT становится аналитиком публичных данных и ничего не упустит из виду, будь то негативный отзыв или положительная цитируемость.
Казалось бы, все уйдут в чаты, и поисковики отойдут на второй план. Но я считаю, что поисковики — это основание для GPT-моделей, и если мы хотим влиять на их выдачу в свою пользу на локальных рынках, нам стоит уделить внимание присутствию своей компании в веб-пространстве.
P.S. Все что я описал это результаты моих наблюдений и анализа выдачи разных популярных LLM, я точно не знаю алгоритмы выдачи, но то что прослеживается я постарался описать в данной статье
ссылка на оригинал статьи https://habr.com/ru/articles/1036816/