Технологии правят… информацией. Технологическая пицца

от автора

Всё лучшее, зачастую, случается внезапно. Редко когда тщательно спланированная вечеринка может сравниться с внезапным визитом друзей, а блюдо, приготовленное точно по рецепту, с импровизацией мастера. В нашей команде этот феномен тоже имеет место быть: мы не задумывались о «рецептах», когда за пару недель реализовывали Media Monitor, который, как иногда случается в разработке нишевых B2B продуктов, оказался на удивление востребованным.


MeMo (Media Monitor) оказался настолько полезным для «жертв информационного общества», что несколько коллег из команды теперь используют его в «личных корыстных» информационных целях, а все видевшие его информационщики, медийщики и (зачастую вынужденные) потребители больших информационных потоков убежденно просят дать попользоваться.

Но речь пойдёт о МеМо не как о продукте, а как о примере вечной диалектики материализма. В частности, о законе перехода количества в качество: информационная революция, взрывной рост генерируемого контента неизбежно должен был привести к изменению парадигмы управления (персональными, корпоративными) информационными потоками.
15 лет назад «интернетчикам» хватало каталога «Ау!» и «Желтых страниц Интернета», а теперь и помощь Google/Яндекс, с результатом «нашлось 10 млн документов», не всегда помощь.

Осознав востребованность для информационщиков продукта, первоначально воспринимаемого нами как «побочного», мы начали искать причины кумулятивного позитивного эффекта сложения нескольких технологий.
К какому выводу пока (все меняется в динамике, может завтра появится еще что-то) мы пришли с точки зрения потребностей «информационного потребителя»:

1. Новая информация нужна прямо сейчас;
2. Источники должны быть доверительными (авторитетными);
3. Источников должно быть много (сотни, тысячи);
4. Материалов должно быть немного (только самые релевантные/актуальные);
5. Имеются свои собственные корпоративные информационные потоки;
6. Многоязычная информация (разные страны);
7. Персональный отбор источников (все мы человеки, «на вкус и цвет…»);
8. Автоматический разбор материалов по тематическим «полочкам»;
9. Легко настраиваемый сюжетный/ситуационный/событийный набор инструментов (возможность за пару минут создать собственную инфо-полочку, например, для чтения материалов по Формуле-1 в Монако – создаем один раз необходимые настройки и читаем, пока идет событие).

Согласитесь — ничего экстраординарного, все и так давно понятно. Фактически, речь идет о персональном «ларьке с прессой» (кстати, в нашей команде есть «динозавры», которые реализовывали проекты типа «Персональная газета» еще в прошлом тысячелетии).

Итак, если бы мы делали все изначально планово, то ставили бы задачу примерно следующим образом — на входе:

• В мире очень много информации;
• Требуется небольшой набор параметров фильтрации;
• Ограниченный набор тематических рубрик (закон устойчивости любой информационной корпоративной структуры);
• Нужно иметь возможность организовать бесконечный набор сюжетов, включая новые (типа Челябинский метеорит);
• И обязательно учесть… человеческий фактор восприятия информационных потоков.

В реалиях все строилось совсем не так, и скорее было похоже на готовку пиццы для вдруг организовавшейся тусовки: бросаем на тесто все, что есть в холодильнике:

• Тестом (от слова «тесто», а не «тест») выступает наша любимая Платформа, о который мы уже писали в блоге;
• Для доверия к продуктам возьмем только крупные СМИ, агентства и сайты госструктур;
• Иностранщину нашинкуем модулем определения языков;
• Добавим домашний сыр корпоративного изготовления;
• Поперчим экспресс- и эксперт-аккаунтами соцмедиа;
• Поставим на быстрый огонь распределенной системы сбора данных;
• Разложим на тематические тарелки авто классификацией;
• А выбор масла и тертого сыра оставим на усмотрение потребителя.

Итог: все довольны — информационный голод подавлен насыщенными современными технологическими OBD-решениями.

Можно ли было приготовить «информационную пиццу» на имеющихся тогда технологических возможностях, скажем, год-два назад? — Теоретически «да», практически — это был бы совсем не тот продукт, который подошел бы в 2013 году, когда информационные потоки выросли в 1.5 раза (дальше — больше), а информационные «войны» теперь длятся всего несколько минут (вспомните, например, 3-х минутное «ранение Обамы», обрушившее фондовые рынки, или 4-х минутный военный переворот в Катаре).

Несколько ингредиентов из нашего продуктового холодильника не вошли в рецепт для МеМо (во всяком случае пока), но мы надеемся, что в Рецепт-2014 они обязательно попадут — поскольку и скоростное авто определения тональности, и NER, и геолоцирование и тренды уже успешно применяются в различных проектах.

P.S.: Мы любим наших друзей и партнеров и с удовольствием отдаем им должное: отцом-вдохновителем MeMo можно считать Павла Ч., много лет успешно работающего в крупных информационных издательствах и агентствах.
Конечно, у нас уже были заделы для выборок подписок источников для Персонального Медиа(Инфо)-Центра, мы расширили количество определяемых языков до 30, наш АК (АвтоКлассификатор текстов) уже отделял Спорт от Шоу-бизнеса, но именно Павел, вобрав в свой открытый ум множество различных составляющих, четко очертил потребность своих коллег в конкретном продукте. Дальше было дело техники (и технологии, и лингвистики, и хайлоада), а это уже наш конек.

Придумывайте новые рецепты, чтобы было не только питательно и полезно, но и приятно 🙂

ссылка на оригинал статьи http://habrahabr.ru/company/palitrumlab/blog/197554/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *