“Если с этим так быстро смогли справиться несколько университетских исследователей, трудно поверить в то, что АНБ испытает какие-либо трудности с идентификацией подавляющего большинства американцев”, — пишут они.
Опыты они проводили на MetaPhone, краудсорсинговой публичной базе данных добровольно предоставленных телефонных записей.
Мы случайным образом отобрали 5 000 номеров из массива данных MetaPhone и сделали запросы по справочникам Yelp, Google Places и Facebook. Без особых усилий и используя лишь три этих (являющихся публичными) источника, мы сопоставили 1 356 (27.1%) номеров. Если точнее, было получено 378 совпадений (7.6%) в Yelp, 684 (13.7%) в Google Places и 618 (12.3%) в Facebook.
Что если какая-либо организация захочет заняться тем же самым?
Чтобы консервативно оценить насколько анонимны телефонные номера, мы случайным образом выбрали 100 номеров из нашего массива данных, а затем запустили по каждому поиск в Google. В течение часа мы смогли соотнести с частными лицами или организациями 60 из 100 номеров. Когда мы подключили три наших первых источника, эта цифра увеличилась до 73.
Наука идентификации людей по якобы анонимным базам данных стала для ученых своего рода игрой. В прошлом году группа исследователей доказала, что они могут идентифицировать людей из базы данных ДНК на основе их открытой демографической информации.
Что еще любопытнее, другие исследователи смогли определить сексуальные предпочтения пользователей Facebook на основе информации о страницах, которые они “лайкнули”.
“Даже если ты считаешь, что хранишь свою личную информацию в тайне, мы все равно можем многое о тебе узнать”, — пишет Дженнифер Гольбек, ученый из Университета Мэриленда, которая провела исследование, схожее с тем, в котором идентифицировались пользователи Facebook.
С точки зрения статистики, сделать это совсем не трудно, каждый по-своему уникален. Несмотря на то, что алгоритм, скорее всего, не может идентифицировать буквально каждого человека, возможности поиска приближаются к той точке, когда определенным людям будет совсем не сложно найти информацию об интересующем человеке.
Можно поспорить относительно того, должны ли правительственные агентства иметь доступ к нашим персональным данным, но не стоит притворяться, что они не смогут узнать все, что им нужно на основе имеющейся у них информации.
ссылка на оригинал статьи http://habrahabr.ru/company/apps4all/blog/207506/
Добавить комментарий