Как я отказался от поиска Google в пользу DuckDuckGo.com

Denis Grafov
Tech. Or Not
10 min readApr 1, 2018

--

Недавно я сменил поиск по умолчанию в моем браузере с Google.com на DuckDuckGo.com и сейчас я объясню, почему. Сразу оговорюсь: дело тут не в качестве поисковой выдачи (на мой взгляд, у Google отличный поисковый движок) и даже не в том, что Google старается монополизировать все, чего касается (хотя отчасти и в этом).

Итак, что же меня лично начало смущать в Google:

  1. Google хранит историю большинства моих поисковых запросов;
  2. Google фильтрует результаты поиска, основываясь на истории моих запросов;
  3. Google показывает рекламу, подобранную лично для меня, на основе все тех же данных.

Теперь немного подробнее по каждому из пунктов.

История моих поисковых запросов

Google так или иначе хранит историю поисковых запросов, привязаную к конкретному пользователю. Зачем ?— чтобы на каждый мой новый запрос выдавать список результатов, “наиболее релевантный” лично для меня, и показывать мне персонализированную рекламу (не только в списке результатов поиска, но и на всех сайтах, где есть реклама, поставляемая Google — а таких сайтов большинство). Эти два момента я прокомментирую ниже, а пока остановлюсь на самом хранении моей истории поисковых запросов.

Что мне в этом не нравится? Две вещи: то, что эта информация хранится одной корпорацией, которую я мало как могу контролировать, и то, что она может утечь. Я (да и никто, наверное) не знаю, какой продукт Google придумает завтра, и как эта информация будет в нем использована. Но можно представить, что найдутся люди, которые будут использовать этот новый продукт не так, как задумывали его создатели (люди в Facebook тоже не думали, что их обвинят во влиянии на американские выборы). Я прочитал политику конфиденциальности Google и, к сожалению, не нашел там обещания, что мои личные данные будут использованы только в целях, о которых известно на данный момент, и ни в каких других. Да, там указано:

При необходимости использовать ваши данные для целей, не упомянутых в настоящей политике конфиденциальности, мы всегда запрашиваем предварительное согласие на это.

При этом существующие цели описаны весьма широко, например:

Наши системы автоматически анализируют ваш контент (в т. ч. электронные письма), чтобы предоставлять функции, полезные вам. Это могут быть отобранные для вас результаты поиска, релевантные рекламные объявления, выявление спама и вредоносных программ.

Само собой, есть пункт про предоставление данных третьим лицам:

Мы можем предоставлять обезличенные данные всем пользователям и нашим партнерам, включая издателей, рекламодателей и связанные сайты. Они могут применяться, например, для того, чтобы проиллюстрировать тенденции использования наших служб.

Упоминание обезличенных данных наводит на мысль об истории c AOL в 2006 году, когда они выложили для исследовательских целей обезличенные данные поисковых запросов 650 000 пользователей. На сами запросы можно посмотреть здесь, а вот здесь cnet.com показывает, что обезличенные данные могут быть не совсем анонимными. В конечном итоге, я не могу с достаточной степенью уверенности судить о том, что действительно Google может делать с моей историей поиска а что — нет (ниже я покажу политику конфиденциальности, которая мне понятна), а потому предпочел бы, чтобы мои поисковые запросы вообще нигде не хранились, а в особенности — не хранились бы в той же компании, которая имеет доступ к моей почте, телефону (у меня Android), истории моих передвижений и еще много чему.

Даже оставить в стороне то, что я не могу предсказать, остается другая проблема — утечки данных. В Google по-прежнему работают люди, а люди допускают ошибки. Да, процесс разработки софта там построен так, чтобы минимизировать возможность ошибки, но я убежден, что на данный момент нет техники, гарантирующей, что ошибки не случится. Быстрый поиск показывает, например,что один из багов в одном из сервисов Google, раскрывающих какую-то личную информацию, жил с середины 2013-го года до 2015-го. Баги случаются у всех.

Ну и, наконец, в Google обязаны выдавать информацию, которая у них хранится, в соответствии с американскими законами. Об этом была история со Сноуденом и программой PRISM (Google она коснулась, судя по опубликованным документам, 2009 году). Вкратце, вот как она описана в Википедии:

В документах АНБ, попавших в июне 2013 года в распоряжение журналистов The Guardian и The Washington Post, Google был в списке компаний, сотрудничавших с АНБ в рамках программы PRISM, в которой был предусмотрен негласный доступ властей США к данным пользователей, не являющихся американскими гражданами, хранящимся у американских компаний, и такой доступ мог осуществляться без решения суда. После этой утечки информации власти США официально признали существование программы PRISM. По данным раскрытых документов, АНБ имело прямой доступ к серверам этих компаний, и объём собираемых Агентством данных быстро возрастал на протяжении нескольких лет, предшествующих разоблачению. При этом компания Google отрицала существование «правительственного бэкдора».

И в Google не скрывают, что они сотрудничают с правительством — после истории с PRISM они начали публиковать ежегодный отчет на эту тему.

Нет, я не террорист, и вряд ли мной вот просто так может заинтересоваться АНБ. И я не виню Google за то, что они действуют в соответствии с законами. Просто я предпочел бы, чтобы там нечего было раскрывать. Вот даже есть TED talk о приватности вообще.

Персонализация результатов поиска

Теперь о персонализированных результатах поиска. В теории это хорошо: вы получаете не просто формально отобранные безличные результаты, а результаты, которые, как кажется поисковой машине, именно вам и были нужны. Я не говорю, что алгоритмы персонализации работают плохо, скорее, я согласен с людьми, которые указывают на недостатки самой концепции.

Термин “пузырь фильтров” (Filter bubble) был введен в 2010 году и неплохо описан в Википедии. Суть явления заключается в том, что, когда нам показывают персонализированную выборку данных, мы не получаем полной информации о том, что мы искали. Что, в свою очередь, сужает нашу картину мира, помещая нас таким образом в своебразный информационный пузырь. Надо отдать должное Google: после многочисленных жалоб, они предоставили возможность отключить фильтрацию результатов. Так что я просто упомянул это здесь, чтобы привлечь внимание и поместить ссылку на страницу с настройками, где это можно отключить. Не буду лишний раз рассуждать о том, что в какой-то момент Google может решить, что персонализированные результаты — это необходимая каждому пользователю вещь, и убрать возможность их отключить.

Персонализированная реклама

С рекламой похожая ситуация: я прекрасно понимаю, что компании надо как-то зарабатывать деньги, но становится немного не по себе, когда реклама подбирается с учетом личной информации обо мне (да, я считаю историю моих поисковых запросов и посещения сайтов личной информацией). И если с обычной рекламой приходится мириться, то от персонализированной рекламы я бы хотел избавиться как от явления целиком (особенно, когда она подбирается на основе того объема информации обо мне, который есть у Google).

К счастью, персонализированную рекламу тоже можно отключить, но, как и с предыдущим пунктом, гарантировать, что такая возможность будет всегда, никто не может.

Файлы Cookies, IP-адрес и режим Инкогнито/Приватный режим

Остановлюсь немного на том, как Google (да и любой другой сайт) понимает, что я уже сюда заходил, и что нужно посмотреть, что я делал в прошлый раз.

Многие слышали что-то про IP-адрес (например, “я тебя по айпи вычислю”). Грубо говоря, это адрес, по которому другие компьютеры в сети Интернет могут обратиться к вашему. На заре Интернета у каждого компьютера действительно был собственный публичный адрес. Проблема в том, что наиболее распостраненный сейчас протокол IPv4 позволяет создавать только 4 294 967 296 (2 в степени 32) уникальных адресов, что меньше чем количество подключенных устройств. Поэтому обычно ваш провайдер имеет один или несколько публичных IP-адресов, которые другие участники сети могу использовать, когда хотят переслать вам сообщение. Провайдер объединяет своих абонентов во внутреннюю подсеть со своей собственной адресацией и знает адрес вашего рутера в своей внутренней сети (этот адрес должен быть уникальным в этой закрытой сети и ни имеет ничего общего с публичными адресами в сети Интернет). По этому внутреннему адресу провайдер передает сообщение вашему рутеру, который, в свою очередь, делает то же самое, но уже внутри вашей домашней сети. Суть в том, что Google видит IP-адрес вашего провайдера, который делится между другими абонентами того же провайдера, поэтому по этому IP-адресу вас однозначно идентифицировать нельзя. Но его можно использовать в качестве дополнительной информации (например, так определяется страна, из которой вы делаете запрос).

Более надежный механизм идентификации пользователя — это файлы Cookies. Если по-простому: когда вы в первый раз заходите на сайт, он отправляет вашему браузеру небольшой текст, хранящий ваш идентификатор, и ваш браузер записывает его в файл. Когда в следующий раз вы зайдете на тот же сайт, браузер автоматически отправит содержимое этого файла, и Google поймет, вы заходили сюда раньше, и надо прочитать или обновить историю ваших действий в базе данных. Если вы в то же время залогинены в Google аккаунт, поисковик свяжет данные поиска с вашим аккаунтом (если это не запрещено в настройках вашего аккаунта, о чем написано в политике конфиденциальности). Можно, конечно, запретить своему браузеру сохранять эти файлы или просто удалять их каждый раз вручную. Однако об этом знают и владельцы сайтов, поэтому существует другой механизм, гораздо менее зависимый от действия пользователя: цифровой отпечаток устройства.

Принцип построения цифрового отпечатка вашего устройства заключается в том, что любой сайт получает от вашего бразуера определенное количество информации, связанной с браузером или компьютером в целом: например, тип браузера, версию, операционную систему, какие плагины и шрифты установлены в браузере, размер экрана и много чего другого. Если вы думаете, что вы тут совсем не уникальны — можете проверить, например, здесь: https://amiunique.org/fp, или здесь: https://panopticlick.eff.org/. Там же можно посмотреть набор данных, который используется для создания цифрового отпечатка. Изменить его можно, сделать уникальным — гораздо сложнее. Есть даже реализация цифрового отпечатка в открытом доступе на github. Я не знаю, использует ли Google сейчас этот механизм, но если и нет, не вижу причин, почему бы в будущем его не включить.

В общем, если стоит задача связать вас с вашей историей поисков, противостоять ей довольно сложно. You can run but you can’t hide.

И пару слов о режиме Инкогнито (как он называется в Chrome) или любом аналогичном режиме в других браузерах. Цель этого режима — не спрятать вас от сайта, к которому вы обращаетесь, а спрятать то, что вы делали в интернете, от вас же самих или от человека, который будет использовать этот компьютер после вас. Единственное, что эти режимы делают — это удаляют файлы Cookies и историю поиска, когда вы закрываете браузер. Они никак не влияют на IP адрес, который показывается сайту или на цифровой отпечаток вашего браузера. Это наглядно показано вот этой небольщой страницей— там предлагается ввести что-нибудь, а потом открыть ту же страницу в режиме инкогнито и увидеть, что же вы ввели раньше (используется именно цифровой отпечаток, я пробовал заходить с разных IP-адресов).

Ну и что с этим делать

Есть несколько способов избежать того, чтобы Google формировал историю ваших поисковых запросов. Все они так или иначе завязаны на то, чтобы попытаться замаскировать данные, по которым можно определить, что вы — это вы. Например, можно пользоваться Tor, анонимными proxy-серверами или анонимайзерами. Проблема в том, что эти способы либо существенно замедляют скорость работы в Сети, либо стоят денег, поэтому я не буду на них останавливаться.

Принципиально другой подход — это использовать альтернативный поисковик. Даже Bing или Yandex будут в чем-то лучше, потому что они, хоть и собирают всю ту же информацию о вас, по крайней мере, не владеют всей остальной информацией, которая есть у Google (зависит, конечно, от того, пользуетесь ли вы другими продуктами от этих компаний, я — нет). Но это все равно полумера, потому что информация по-прежнему может быть использована или передана третьему лицу. Я для себя нашел решение, которое мне кажется на данный момент оптимальным с точки зрения удобства и приватности — альтернативный поисковик DuckDuckGo.com.

В первую очередь, расскажу о проблемах, связанных с переходом с Google на DuckDuckGo — я таковых не заметил. Результаты поиска меня удовлетворяют (я не знаю, как еще можно оценить результаты поиска), его можно установить поиском по умолчанию в некоторых браузерах (я пользуюсь Firefox, там — можно), в других — в качестве ресширения. В итоге я, как и раньше, просто ввожу запрос в адресной строке и получаю результат. Далее — о преимуществах.

В DuckDuckGo заявляют, что не хранят историю поиска. Это решает проблемы с возможным раскрытием моей информации: да, они подчиняются тем же законом, что и Google, у них тоже могут быть баги, но если информация не хранится — то нечего и раскрывать и нечему утекать. Проблемы с персонализированными результатами поиска и рекламой в результатах решаются сами собой. Если необходимо (а зачастую так и есть), можно включить локализацию поиска — то есть результаты будут ранжироваться в зависимости от вашей страны, которая вычисляется по IP-адресу вашего провайдера. Этого, на мой взгляд, вполне достаточно, чтобы получать релевантные результаты, не замыкаясь в пузыре фильтров, о котором я писал ваше.

Как можно проверить, что они действительно не собирают вашу приватную информацию? Простым ответом будет — никак. Но есть несколько соображений, на которые можно опираться.

  • В политике конфиденциальности прописано, что информация не собирается. Если они это делают — они нарушают закон.
  • Если бы они собирали информацию, скорее всего, за 10 лет их присутствия на рынке об этом бы стало известно.
  • Они не пытаются построить инфраструктуру (как Google или Apple) и заставить меня пользоваться только их продуктами — у них просто нет на это ресурсов (в компании работает чуть больше 40 человек). Поэтому им не нужна история моих поисков “для улучшения других сервисов”.
  • Поиск (и показ рекламы в результатах) — их основной бизнес. Единственная возможность конкурировать с гигантами этого рынка — это их политика конфиденциальности. Поэтому мне кажется маловерятным, что они ее не соблюдают (иначе — смотри второй пункт).

Отдельно отмечу показ рекламы в результатх поиска. Как и любой бесплатный сервис, DuckDuckGo должен как-то зарабатывать — и они честно включают одну-две рекламные ссылки в начало списка результатов поиска. При этом подбор рекламы производится по ключевым словам самого поискового запроса, а не по тому, что обо мне знает компания (я все же склоняюсь к тому, что кроме информации, которую можно получить из моего IP-адреса — ничего).

Ну и напоследок — они не используют файлы Cookies (это можно легко проверить, например, в браузере).

Bonus

  • Вот здесь можно посмотреть, какие данные Google собирает о ваших действиях (особенно интересно, если у вас смартфон на Android).
  • Вот тут вся история ваших передвижений.
  • Какие сторонние приложения могут получать доступ к той или иной информации из вашего аккаунта.
  • История поиска Youtube.
  • А здесь можно скачать полный архив с информацией, к которой Google имеет доступ.

У меня по всем этим ссылкам, кроме полного архива, ничего нет (в архиве еще моя почта, закладки, календарь, drive и т.д — то, что я в явном виде загрузил в Google), но при этом я не вижу, что запрещает Google по-прежнему эти данные собирать и использовать для улучшения своих сервисов. Возможно, какой-нибудь юрист, дочитавший до этого места, меня поправит, я лишь вижу, что техническая возможность есть, а явного запрета в политике конфиденциальности — нет.

Напоследок

Я понимаю, что история поисков для человека со смартфоном на Android и почтой на Gmail — возможно, не самый большой массив личной информации, который хранится в Google. Но надо было с чего-то начать, и смена поисковика оказалась легким и безболезненным шагом.

Следующим шагом будет Gmail, затем — Android. Посмотрим, можно ли от них так же легко отказаться, зачем это делать и какие есть альтернативы (нет, я не буду советовать покупать IPhone или отказываться от смартфона).

--

--