Комментарий переводчика:
В последнее время вопросы приватности данных и вторжения государства в частную жизнь не сходят со страниц газет и блогов. Поскольку для нас этот вопрос являлся ключевым с точки зрения бизнеса, регулярно как в профессиональных встречах, так и в личных беседах приходилось рассказывать и доказывать, чем же аккуратное использование данных для конкретных бизнес-целей отличается от слежки за пользователями Интернета. Поэтому статья, перевод которой приведен ниже, показалась мне очень актуальной.
Когда мы начинали разрабатывать алгоритмы для оптимизации интернет-рекламы в Maxifier, то вопрос доступности и конфиденциальности данных был одним из первых, от которых зависели и потенциальные возможности нашего продукта, и общее позиционирование компании. Для себя мы однозначно решили, что не будем использовать персонифицированные данные о пользователе, а работать только с усредненными статистическими данными. Да, это несколько обедняет алгоритмы. Да, результат для каждого конкретного человека будет чуть менее точным — т.к. мы будем использовать автоматически реконструированные шаблоны поведения, но не знания о поведении в сети этого конкретного пользователя. Создали самообучающуюся систему; со временем она становится все более «умной» — статистические знания о пользователях накапливаются, шаблоны уточняются. Такое решение позволило нам избежать всех проблем с последовавшими законами о конфиденциальности данных в Европе, например, из-за которых потом сильно пострадали все системы behavior targeting’a. А то, что мы изначально строили алгоритмы, предполагая высокий уровень шума и загрубленность данных, в дальнейшем нам даже позволило сделать это дополнительным конкурентным преимуществом — т.к. наш продукт работает в случаях недостатка информации или отсутствия доступа к ней из-за политики сайтов и рекламных сетей – в ситуациях, когда решения конкурентов- обладателей баз данных не справлялись по показателям качества.
Перевод:
«Лето Сноудена» отгремело, и все чаще попадаются на глаза статьи, в которых проводятся параллели между сбором данных для интернет-рекламы и правительственной слежкой. National Public Radio, крупнейшая государственная радиостанция США, зашла и того дальше: выпустила в эфир историю, представляющую эти две практики едва ли не взаимозаменяемыми, а New York Times как бы между делом упомянул коллекцию персональной информации, собранную Агентством национальной безопасности США (АНБ), в тексте статьи о рекламодателях, использующих данные мобильных звонков.
Путать в сознании читателей два настолько разных типа данных, по меньшей мере, безответственно. Правительство собирает информацию независимо от желания её обладателей. Оно может залезть в любой уголок нашей жизни: от мобильных звонков — до сообщений в чатах и поисковых запросов, и найдет множество предлогов обойти правила. А вот онлайн-рекламе, чтобы заполучить ваши данные, требуется разрешение хотя бы одной из сторон-участниц процесса, — либо потребителя, либо сайта издателя. К тому же в Евросоюзе должны уведомлять потребителей о том, что их данные стали доступны рекламодателям. Истории, которые отождествляют действия правительства и digital-маркетологов, будут препятствовать инновациям, чем не только сделают рекламу менее релеватной и создание контента менее прибыльным, но также отпугнут людей от участия в онлайн-сервисах здравоохранения, образования и транспорта (pdf) в случае, если те запрашивают личные данные. Эти возможности держатся на доверии пользователей новинкам, требующим обмен персональной информацией.
Чтобы понять, сколь велико различие между сбором данных для онлайн-рекламы и правительственной разведкой, обратите внимание на методы их получения и использования. Если правительство Соединенных Штатов хочет заполучить информацию о вас, оно либо применит технологию типа PRISM, либо использует закон «О наблюдении за иностранными разведслужбами» (Foreign Intelligence Surveillance Act), чтобы заставить компании передавать данные и запретить им информировать вас об утечке. В некоторых случаях информация поступает в Управление по контролю за оборотом наркотиков (DEA) и в налоговую службу (IRS), откуда она передается в местные правоохранительные органы, где использовать её могут столько, сколько нужно, чтобы придумать историю, которая станет причиной вашего ареста, и замять истинный источник данных. New York Times сообщает, что эти данные используются для борьбы с чем угодно – от пропаганды сигарет до нарушения авторских прав — хотя подобные инциденты крайне редко угрожают национальной безопасности.
Как правило, в рекламном бизнесе данные собирают с целью продать максимальное количество товара, затратив минимум ресурсов на маркетинг. Используемые данные включают перечень поисковых запросов, открытые вами веб-страницы, вещи, которые вы просматривали в интернет-магазинах, а в последнее время и информацию о том, что именно вы купили. На Западе действует строгое регулирование, которое требует отказа от персонифицированной информации и запрещает использовать какие-либо данные для принятия решения, например, о размере страховых выплат пользователю. Успех рекламы, основанной но управлении большими массивами данных, определяется сокращением расходов на её размещение, а потребитель в итоге видит более релевантную рекламу.
Говорить, что правительство может использовать информацию от рекламодателей для шпионажа, — это явное преувеличение.
АНБ собирает данные о действиях пользователей из нескольких источников, и они гораздо более персонифицированы, чем те, что используются для таргетинга рекламы – так что существование поведенческого аспекта в рекламной индустрии нисколько не облегчает сбор информации для АНБ.
Редакционный совет New York Times пытался сконструировать ситуацию, в которой возникла бы необходимость регулировать поведенческую рекламу, и придумал гипотетический сценарий того, как данные, собранные для рекламы, могут навредить: например, информация хранится в личных профилях, а доступ к ним в любой момент могут потребовать государственные структуры. Либо их могут купить работодатели или банки для оценки кандидатов при трудоустройстве и выдаче кредита.
Тем не менее, эта гипотеза является необоснованной. Закон США «О точной отчетности по кредитам» (The Fair Credit Reporting Act) требует высокой степени прозрачности любых данных, используемых для принятия решения о финансовой надежности. Правительство не нуждается в данных, собранных рекламой, потому что данные АНБ заведомо более точные, чем те, что используются для таргетинга. В недавнем отчете журнала Time сказано, что АНБ заполучают чуть менее 500 000 адресных книг в день. Очевидно, что существование индустрии поведенческой рекламы не способно еще более упростить сбор информации для АНБ.
Справедливости ради отметим, что встречаются примеры сомнительного использования маркетинговых данных. В прошлом году Wall Street Journal зафиксировал несколько случаев, когда cookie были использованы как инструмент для изменения ценообразования: клиентам были предложены различные цены в зависимости от их территориальной близости к магазинам конкурентов. Также говорили о случаях возрастания тарифов авиакомпаний после неоднократных поисковых запросов. Но даже это не самое болезненное; гораздо больше угнетает само чувство «за мной кто-то следит».
Но массовые нападки на поведенческую рекламу подрывают онлайн-модели без подтверждения ключевого предположения: действительно ли потребители обеспокоены использованием данных для рекламы, если они верно понимают, как распоряжаются их информацией? Чтобы выяснить, мы обратились к исследованию компании Enliken: по его итогам менее 10% пользователей беспокоит использование их данных в маркетинговых целях. Аналитики компании Acxiom пришли к такому же результату, когда они открыли свои базы данных для общественности пару недель назад. Исследования, проведенные в PricewaterhouseCoopers (pdf), DMA, McCann (pdf) подтверждают идею, что потребители хотят делиться информацией с брендами, которым они доверяют.
Поэтому все виды онлайн-бизнеса заинтересованы в прозрачности и регулировании процессов работы с приватными данными. Знания о предпочтениях конкретного потребителя позволяют поднять сервисы на принципиально иной уровень. Было бы обидно потерять все возможности, что открываются перед людьми, из-за банальной путаницы понятий. Давайте отделять мух от котлет.
ссылка на оригинал статьи http://habrahabr.ru/company/maxifier/blog/201076/
Добавить комментарий