Реакция экспертов и IT-инсайдеров появилась незамедлительно. Многие узрели в этом меме недобрый умысел. Алисса Фут, автор The Wired, изучила вопрос и подробно объяснила, почему считает подобные мемы в соцсетях не очень хорошим явлением. Если вы пользуетесь социальными сетями, вероятно, заметили в Facebook, Instagram и Twitter тенденцию к тому, что люди публикуют свои профильные снимки, сделанные в основном 10 лет назад и в текущем году.
Почему вновь возродившийся #10yearchallenge может быть опасным для вас?
Из тех, кто критиковал доводы об опасности, многие утверждали, что фотографии все равно были доступны. Самым распространенным опровержением было: «Эти данные уже доступны. Facebook уже получил все фотографии профиля». Конечно, это так. В различных версиях мема люди были предупреждены о размещении своего первого изображения профиля рядом с текущим или изображением 10-летней давности рядом с нынешним изображением профиля. Да, эти изображения профиля существуют, у них есть отметки времени загрузки, многие их разместили довольно много, и по большей части они общедоступны.
Представьте, что вы хотите связать алгоритм распознавания лиц с возрастными характеристиками и, в частности, возрастной прогрессией (например, как люди будут выглядеть по мере взросления). В идеале вам потребуется широкий набор данных с множеством изображений людей. Было бы полезно, если бы вы знали, что они взяты за определенное количество лет, скажем, – десять.
Конечно, вы могли бы просмотреть Facebook с фотографиями профиля, обращая внимание на даты публикации или данные EXIF. Но весь этот набор профильных изображений может привести к появлению большого количества бесполезного шума. Люди ненадежно загружают изображения в хронологическом порядке, и пользователи нередко размещают изображения кого-то (чего-то) другого, вместо себя, в качестве изображения профиля. Быстрый просмотр фотографий профиля моих друзей на Facebook показывает собаку, которая только что умерла, несколько мультфильмов, изображения слов, абстрактные узоры и многое другое.
Более того, для фотографий профиля в Facebook дата публикации фотографии не обязательно совпадает с датой, когда была сделана фотография. Даже метаданные EXIF не всегда надежны для оценки этой даты.
Почему? Люди могли отсканировать нецифровые фотографии, они могли загружать те же фотографии несколько раз в течение многих лет. Некоторые люди прибегают к загрузке скриншотов картинок, найденных где-то в интернете. Некоторые платформы убирают EXIF-данные для конфиденциальности.
Посредством Facebook-мема большинство людей старательно добавляют нужную информацию («я в 2008 году и я в 2018 году»), а также дополнительную – во многих случаях о том, где и как было снято фото. Другими словами, благодаря этому мему, теперь есть очень большой набор данных, тщательно отобранных фотографий людей примерно за период от 10 лет по сегодняшний день.
Некоторые критически настроенные пользователи отметили, что было слишком много мусорных данных, чтобы их можно было использовать. Но аналитики данных и ученые знают, что с этим делать. Как и в случае с хештегами, которые становятся вирусными, вы, как правило, можете доверять достоверности данных, ранее полученных в тренде или в ходе кампании, прежде чем люди начнут относиться к ним с иронией или пытаться использовать хештег в корыстных целях.
Что касается поддельных фото, алгоритмы распознавания изображений достаточно умны, чтобы выделить человеческое лицо. Если бы вы загрузили изображение кошки 10 лет назад и сейчас, как это любил делать один из моих друзей, этот конкретный пример было бы легко выбросить из системы распознавания.
Со своей стороны Facebook отрицает причастность к хештегу #10YearChallenge. «Это созданный пользователями мем, который сам по себе стал вирусным, – утверждает представитель Facebook. – Facebook не запускал эту систему, и мем использует фотографии, которые уже существуют на Facebook. Facebook ничего не получает от этого мема (кроме напоминания нам о сомнительных тенденциях моды 2009 года). Напоминаем, что пользователи Facebook могут включить функцию распознавания лиц в любое время».
Но даже если этот конкретный мем не относится к социальной инженерии, последние несколько лет изобилуют примерами социальных игр и мемов, предназначенных для извлечения и сбора данных. Вспомните только о массовом извлечении данных более чем 70 миллионов пользователей Facebook в США, которое осуществила Cambridge Analytica.
Разве это плохо, что кто-то может использовать ваши фотографии в Facebook для тренировки алгоритма распознавания лиц? Необязательно, в некотором смысле это даже неизбежно. Тем не менее, нам нужно подходить к взаимодействию с технологиями, помня о данных, которые мы генерируем, и о том, как их можно использовать. Я приведу три вероятных варианта использования фото для распознавания лиц: один хороший, один обычный и один рискованный.
Хороший сценарий: технология распознавания лиц, особенно возрастных изменений, может помочь в поиске пропавших детей. В прошлом году полиция в Нью-Дели сообщила, что всего за четыре дня с помощью технологии распознавания лиц разыскали почти 3000 пропавших детей. Если дети находятся в розыске долгое время, они скорее всего выглядят немного иначе, чем их последняя известная фотография, поэтому надежный алгоритм возрастной прогрессии мог бы действительно быть полезным.
Потенциал распознавания лица в основном реализован: распознавание возраста, вероятно, наиболее полезно для целевой рекламы. Рекламные дисплеи, которые включают в себя камеры или датчики и могут адаптировать свои сообщения к демографическим характеристикам возрастных групп (а также другим визуально распознаваемым характеристикам), вероятно, станут обычным делом. Это приложение не очень захватывающее, но делает рекламу более актуальной. При этом, поскольку эти данные передаются и помогают определить наше местоположение, поведение в качестве покупателей и реакции, а также другую считываемую информацию, это может привести к действительно жутким последствиям.
К примеру, возрастной прогресс может повлиять на оценку перспектив страхования и услуг здравоохранения. Например, если вы визуально стареете быстрее, чем ваши современники, возможно, вы не очень хороший страховой клиент. Вам могут предложить заплатить больше или вообще отказать в страховке.
После того как в конце 2016 года Amazon представила услугу распознавания лиц в режиме реального времени, они начали продавать ее правоохранительным и государственным органам, таким как полицейские управления в Орландо и округе Вашингтон. Но технология вызывает серьезные проблемы с конфиденциальностью: полиция может использовать эту технологию не только для отслеживания людей, подозреваемых в совершении преступлений, но также и тех, кто не совершают преступлений, таких как протестующие и другие лица, которых считают проблемными.
Американский союз гражданских свобод попросил Amazon прекратить продажу данной услуги. Так же поступила часть акционеров и сотрудников Amazon, которые попросили компанию прекратить данное обслуживание, сославшись на обеспокоенность репутацией компании.
Трудно преувеличить влияние технологий на человечество. Их преимущества очевидны, но у нас есть возможность сделать их лучше, оценив возможные риски.
Так что, это действительно опасно? Может ли случиться что-то плохое, если вы разместите на своей стене несколько уже опубликованных фотографий профиля? Опасно ли тренировать алгоритмы распознавания лиц для возрастной прогрессии и распознавания возраста? Не совсем. Как только мы поймем проблему, мы должны взвесить все за и против.
Независимо от происхождения или намерений, стоящих за мемом #10yearchallenge, мы все должны научиться лучше разбираться в данных, которые генерируем и распространяем, в доступе, который предоставляем и последствиях их использования. Если вам прямо сообщают, что целью игры является сбор фотографий «тогда и сейчас» для исследования возрастной прогрессии, вы можете принять участие с осознанием того, кто будет иметь доступ к фотографиям и для какой цели.
Более широкий месседж, удаленный от специфики конкретного мема или даже от какой-либо конкретной социальной платформы, заключается в том, что люди являются самым богатым источником данных для большинства технологий в мире. Мы должны это знать и действовать с должной осмотрительностью.
Люди – связующее звено между физическим и цифровым мирами. Человеческое взаимодействие – то, что делает интернет интересным. Наши данные – это топливо, которое делает бизнес умнее и прибыльнее.
Мы имеем право требовать, чтобы бизнес относился к нашим данным с должным уважением. Но мы и сами должны уважать собственные данные.
Фото: Getty Images