Алгоритм ранжирования поисковых запросов через анализ нормального распределения.
Рассмотрим частоту вхождения нормального (естественного) события (новости) в каналы коммуникаций:
- Появления события (новость, рекламное сообщение, публикация статьи). X(initial) = 1
- Если событие достаточно интересно то происходит его естественное размножение (плавный рост)
- Частота цитирования достигает пика
- После пика происходит плавный спад частоты цитирования данного события.
В данном случае график частоты цитирования будет иметь вид нормального распределения (гауссианы)
Теперь рассмотрим частоту вхождения искусственного вброса информации (новости):
- Появление события (новости). Возможно появления сразу в нескольких источниках (Информационных агентствах). X(initial) > 1
- Стремительное размножение события, подогреваемое множественными вбросами.
- Частота цитирования достигает пика и продолжает держаться, благодаря искусственному и постоянному подогреву интереса к событию.
- После окончания акции (вброса, раскрутки, накрутки) происходит стремительный спад цитирования данного события.
Данный график будет отличаться от нормального распределения (гауссианы): кривая роста будет более крутая, начальные значения могут быть больше единицы (X(initial) > 1), на месте пика будет наблюдаться плато.
Таким образом, анализируя зависимость частоты вхождения события в информационное пространство, можно получить характеристику его происхождения. Тем самым реализуется ранжирование события по его происхождению.
Интересные ссылки
ссылка на оригинал статьи http://habrahabr.ru/post/168941/
Добавить комментарий