Напомним , 18 июля первый громкий инцидент произошел с оператором сотовой связи Мегафон , когда в интернет были «слиты» смс сообщения абонентов Мегафон. Об этом мы писали не так
давно . Тогда остановились на мнении , что специалисты Мегафона не закрыли раздел с текстовыми сообщениями от индексации с помощью файла robots.txt .
Именно этот файл robots.txt стал камнем преткновения в истории с интернет-магазинами . Яндексу предъявили претензии в «неправильной» индексации покупок в интернет-магазинах, в результате которой стали доступны общественности более 50 тысяч покупок, сделанных в этих магазинах . Учитывая тот факт , что покупки в интернете часто носят очень личный характер , например покупки в секс-шопах , и вследствие индексации этой информации Яндексом , «рассекретившей» все данные покупателей , эта ошибка в файле robots.txt наделала не меньше шума , чем история с смс Мегафона. Справедливости ради стоит отметить , что вину за этот инцидент частично взяла на себя фирма WebAsyst. Оказалось , что практически все пострадавшие интернет-магазины работают на платформе, разработанной компанией WebAsyst, а проблема получилась из –за некорректной приложения "Shop-Script" . В ближайшие дни WebAsyst обещает «залатать» эту дыру , выпустив обновление, с помощью которого будут предотвращены подобные утечки личных данных пользователей . Кроме того , специалисты этой компании готовы оказать любую помощь технического характера тем магазинам, чьи данные покупателей просочились в интернет. Суть проблемы заключается в следующем – во всех этих магазинах возможна покупка товаров без регистрации. Оформив заказ , покупатель получает прямую ссылку с информацией о нем и его статусе, именно эти страницы и оказались проиндексированы поисковой системой Яндекс.
Череда скандалов продолжилась сегодня. Теперь Яндексом оказались проиндексированы данные покупателей железнодорожных билетов. А это уже серьезная утечка. Ибо информация такого характера может служить подспорьем в руках преступности, которая получила данные о том кто , куда и с кем поехал , об отъезде хозяев квартир и т.д. Источник утечки сайт RailwayTicket.ru, уже подтверждено, что виной попадания в Яндекс этой информации стало отсутствие соответствующей строчки запрета в файле robots.txt . На текущий момент этот файл уже скорректирован администрацией сайта. РЖД полностью отрицают какое-либо отношение к этому сайту.
Для справки - файл robots.txt – это текстовый файл, находящийся в корневой директории сайта, в котором записываются специальные инструкции для поисковых роботов. Эти инструкции могут запрещать к индексации некоторые разделы или страницы на сайте, рекомендовать поисковому роботу соблюдать определенный временной интервал между скачиванием документов с сервера и т.д. Казалось бы, за такой безобидной формулировкой скрываются такие серьезные проблемы для тех, кто неверно его создает.