В очередной статье нашего цикла публикаций, посвященного интернет-разведке, рассмотрим, как операторы продвинутого поиска Google (advanced search operators) позволяют быстро находить необходимую информацию о конкретном человеке.
В комментариях к первой нашей статье, читатели просили побольше практических примеров и скриншотов, поэтому в этой статье практики и графики будем много. Для демонстрации возможностей «продвинутого» поиска Google в качестве целей были выбраны личные аккаунты автора. Сделано это, чтобы никого не обидеть излишним интересом к его частной жизни. Хочу сразу предупредить, что никогда не задавался целью скрыть свое присутствие в интернете, поэтому описанные методы подойдут для сбора данных об обычных людях, и могут быть не очень эффективны для деанонимизации фэйковых аккаунтов, созданных для разовых акций. Интересующимся читателям предлагаю повторить приведенные примеры запросов в отношении своих аккаунтов и оценить насколько легко собирать информацию по ним.
Прежде чем заниматься сбором и анализом информации о конкретном человеке необходимо представить всю картину того, какие данные о человеке существуют.
Подобную карту нужно детализировать до уровня, необходимого для решения конкретной задачи. Любой поиск информации начинается с некоторого начального набора данных. В нашем случае это будет фамилия, имя и место работы. Остальные данные где-то есть, но связать их с имеющимися мы пока не можем. Поэтому мы формируем гипотезы и проверяем с помощью поисковых запросов.
Источниками информации о человеке могут быть:
- он сам: аккаунты в соцсетях, блог и т.п.;
- государство: базы данных налоговой, судебных приставов, судов и т.п. См. ссылки в статье
- кто-то еще (друзья, враги, СМИ, работодатель и т.п.)
В настоящей статье рассмотрим п.1. – будем вычислять аккаунты автора в социальных сетях.
Цель номер один: ники пользователя
Что такое ник и как мы его выбираем?
Ник представляет собой наше имя в интернете: мы выбираем его, создавая свой личный почтовый ящик, а потом часто используем и в различных сервисах.
Мы ничем не ограничены при выборе ников, но есть любимые алгоритмы формирования наших интернет-имен:
- Игры со своим именем: фамилия, имя+фамилия, имя+год рождения, имя+дата, инициалы;
- Игры с именами любимых персонажей (tovbender, napoleon);
- Немного о себе: профессия, психология (coolhacker, murmur);
- Демонстрация увлечений: footballer, boxer;
- “Чтобы никто не догадался”: слово наоборот, русское слово в английской раскладке, слово на латыни и т.п.
Если мы не знаем ник, но знаем кое-что о человеке, мы уже можем строить предположения и проверять их.
Хорошим способом вычислить ник пользователя является поиск и анализ его страниц в соцсетях и поиск адреса личной электронной почты.
Начать поиск информации о конкретном пользователе можно с простого запроса, подобного следующему:
джон смитт ромашка
где «ромашка» — название компании.
На текущий момент мы должны вспомнить, что некоторые особенности работы поисковика Google:
- Google читает запрос слева направо.
- Google не различает регистр: «Земля» и «земля» для него одно и то же;
- длина запроса не должна превышать 32 слов;
- * представляет одно слово в запросе;
- можно искать точную фразу, взяв ее в кавычки;
- между словами в запросе стоит невидимое логическое «И»;
- Google сам умеет склонять слова;
- Оператор «-» исключает из выдачи результаты, которые содержат выражение, помещенное сразу за данным оператором (обязательно без пробела).
- в верху выдачи находятся страницы, которые, по мнению Google, являются самыми релевантными. Тем не менее это его догадка, так как наших мыслей он читать пока не умеет;
- для уточнения параметров поиска необходимо владеть операторами продвинутого поиска (advanced search operators).
Теперь можно ввести аналогичный запрос по автору статьи и получить массу страниц, среди которых должна быть и искомые страницы в социальных сетях:
Информации в выдаче поисковика достаточно много, и чтобы найти страницы в социальных сетях нам придется пересмотреть большое количество страниц.
Примечание:
Кстати, а что делать, если мы хотим найти человека из определенной компании, но забыли его фамилию? Тут может помочь оператор звездочка:
джон * ромашка
А если мы ищем человека из ООО «Ромашка», а таких «Ромашек» — миллион: и АО «Ромашка», и АНО «Ромашка», и ФГУП «Ромашка» и т.д.
Вариант 1. Искать полную фразу «ООО Ромашка».
Вариант 2. «Минусовать» ненужные слова: -АНО – АО –ФГУП (но так можно «заминусовать» и нужные результаты, например если на странице говорится, что наша «Ромашка» подружилась с ФГУП «Апельсин».
Теперь нам необходимо сузить выдачу и найти страницу автора статьи в социальной сети «ВКонтакте». Это позволит нам определить один из ников пользователя, а затем и вычислить адрес электронной почты. Для этого будет полезно использовать такой оператор, как site. Он ограничивает поиск определенным доменом любого уровня.
Вторая ссылка уже ведет на страницу автора статьи в сети «ВКонтакте». Обратите внимание, что автор сознательно выбрал короткий ник: alexdorofeev. Не все интернет-ресурсы дают возможность самим задать ссылку на свою страницу, иногда она формируется автоматически, но может содержать в себе ник, взятый из адреса электронной почты.
Используя добытую информацию и знания, постараемся найти аналогичную страницу в сети Facebook.
Сначала на удачу в браузере введем следующий URL: https://www.facebook.com/alexdorofeev, но, к сожалению, увидим, что страница принадлежит кому-то другому. Тогда воспользуемся проверенным приемом и добавим в запрос site:facebook.com.
В результатах выдачи отсутствует прямая ссылка на профиль, который мы ищем, так как пользователь проявил в свое время бдительность и запретил «сдачу» его странички поисковикам
Здесь необходимо снова сделать небольшое отступление и вспомнить как работают поисковики и в том числе Google.
Что поисковики сделать могут, а что не могут?
Поисковики в общих чертах работают по следующему алгоритму:
- боты поисковых машин обходят сайты;
- содержимое страниц индексируется;
- по запросу пользователей извлекаются ссылки на релевантные страницы.
Поисковики не могут:
- проиндексировать информацию, доступ к которой возможен только авторизованным пользователям;
- данные, которые доступны после заполнения форм, например, результаты выгрузки из различных баз данных;
- качественно извлечь информацию из видео, фото, аудио-материалов.
Еще некоторые нюансы:
- контекст: результат выдачи зависит от запроса пользователя, от истории его предыдущих запросов и от истории просмотров страницы другими пользователями;
- поиск осуществляется только на том языке, на котором пользователь ввел свой запрос;
- имеется некоторый конфликт интересов: поисковики зарабатывают на рекламе, на которую кликают пользователи, потому что нужные им страницы оказались не в самом верху выдачи;
- действует цензура из-за нарушения чьих-либо прав (авторские, право на забвение и т.п.).
Facebook относится к той категории интернет-ресурсов, которые не очень жалуют индексацию своего сайта и о чем непосредственно сообщают в robots.txt:
Для обнаружения страницы скрытного пользователя на Facebook нам потребуется авторизоваться в данной сети и воспользоваться встроенным функционалом поиска. Ссылка на страницу пользователя может «утечь» и оказаться в выдаче поисковика, но только если пользователь сознательно опубликовал материал за своим авторством на всеобщее обозрение.
С помощью поиска страница автора легко обнаруживается:
Анализируя URL страницы, мы можем определить еще один ник пользователя: adorofeev.
Таким образом, мы уже раздобыли два ника: alexdorofeev и adorofeev. Так как пользователей на популярных ресурсах очень много, то ник может отличаться от того, что реально любит использовать человек, так его «родной» идентификатор уже кем-то занят. По этой причине у автора статьи ник на Хабре: alexdorofeeff, хотя больше нравится adorofeev.
Зная ник, мы можем поискать еще страницы, потенциально связанные с нужным человеком.
Здесь мы снова отвлечемся на Google и вспомним следующие моменты:
- По умолчанию Google ищет выражение (слово или фразу, взятую в кавычки) во всех частях страницы: в URL, в заголовке, в тексте, в тексте ссылок. В то же время специальные «продвинутые» операторы позволяют указать где именно нам нужно, что бы был искомый текст. Для этого нам необходимо использовать операторы: inurl:, intext:, intitle:, inanchor:, а также их собратьев с приставкой all.
- Google понимает логические выражения и скобки. AND – логическое «И», по умолчанию именно оно стоит между словами разделенными пробелами в строке поиска. OR или I – логическое «ИЛИ».
- Если мы применяем оператор, то после двоеточия должно быть искомое выражение без пробела.
- Операторы с приставкой all позволяют их применить к ряду выражений после двоеточия, разделенных пробелами. Для этих же задач можно использовать операторы без all, но со скобками и логическими выражениями.
Поиграемся с оператором inurl, который ищет страницы, содержащие в URL страницы нужное слово. Так как мы уже знаем несколько ников автора, то можем сделать следующий запрос:
inurl:(adorofeev | alexdorofeeff | alexdorofeev)
В результатах выдачи мы тут же обнаружим страницы соответствующих аккаунтов и часть страниц будет принадлежать автору. Таким образом, если у нас есть предположения об используемых никах, мы можем в самом начале наших изысканий получить список потенциально интересных страниц.
Закрывая тему с никами, хочу обратить ваше внимание на сервисы, позволяющие быстро узнать используется ли данный ник в ряде популярных ресурсов. Так мы можем найти дополнительные страницы конкретного человека. Пример подобного сервиса: nameсhk.com
Как узнать e-mail?
Теперь, заполучив набор любимых ников пользователя, мы можем попробовать узнать его личный e-mail. Зачем он нужен? Иногда нужно выяснить принадлежит ли конкретный e-mail данному человеку, чтобы определить авторство письма. Также е-mail будет полезен для поиска объявлений, оставленных пользователем на форумах и т.п.
Мы знаем ники, но пока не знаем домены почтовых служб. Так давайте сделаем предположения и проверим. Раз пользователь из России, то вероятнее всего что он использует один или несколько следующих сервисов:
- Mail.ru
- Яндекс.Почта
- Google Gmail
- Рамблер Почта
Соответственно мы можем сгенерировать адреса (наши гипотезы на данный момент) с никами adorofeev, alexdorofeev и alexdorofeeff.
Как мы можем проверить, а существуют ли подобные адреса на самом деле? Один из вариантов: немного «пообщаться» с почтовыми серверами каждого сервиса по протоколу SMTP:
Шаг 1. Находим почтовый сервер для конкретного домена.
nslookup -type=mx "имя домена"
Шаг 2. Подключаемся к почтовому серверу и имитируем начало отправки сообщения. Если сервер на имя получателя ответит «ОК», значит есть такая учетная запись.
Вариант 1: e-mail существует.
telnet gmail-smtp-in.l.google.com 25
Вариант 2: e-mail не существует.
Верификация e-mail
Определив существуют ли почтовые адреса, мы можем попробовать определить связан ли конкретный адрес с нужным нам человеком.
На mail.ru некоторые пользователи создают свои страницы, к которым можно обратиться следующим образом my.mail.ru/mail/nick/
«Пробиваем» один из адресов:
Также можно посмотреть страницы пользователей на всех проектах Mail.ru, воспользовавшись комбинацией уже известных нам операторов inurl: и site:
inurl:ник site:mail.ru
Если мы знаем, как выглядит человек, знаем его имя или даже уже нашли его страницу в социальной сети ВКонтакте (наш случай), то задача проверки принадлежности определенного email-адреса значительно упрощается. Мы можем воспользоваться механизмом восстановления доступа к странице. Нам потребуется удача: пользователь с таким адресом должен существовать, ну и разместить свое фото.
Давайте проверим четыре варианта адресов для ника «adorofeev» и увидим, что для двух адресов страниц не существует вовсе, для одного – другое имя:
А вот для соответствующего адреса на Gmail.com мы находим страницу автора:
Итак, мы вычислили реальный личный адрес электронной почты.
Как вычислить корпоративный адрес электронной почты?
Здесь ситуация намного проще. Все дело в том, что многие организации имеют свои правила формирования имен учетных записей электронной почты, которые не отличаются особым разнообразием: инициалы + фамилия, первая буква имени + фамилия и т.п. Нам нужно лишь понять какое правило используется в конкретной компании, чтобы по нему сформировать адрес нужного нам человека.
Отправляем в Google запрос следующего вида:
email @домен
Пролистывая результаты выдачи, находим индивидуальные адреса сотрудников и все становится очевидным.
Как вычислить пользователя instagram по гео-меткам?
Теперь попробуем вычислить аккаунт автора в Instagram. Сначала проверяем самые очевидные варианты: https://www.instagram.com/adorofeev/, https://www.instagram.com/alexdorofeeff и https://www.instagram.com/alexdorofeev/ Видим, что это не те аккаунты.
Определив, что человек работает в конкретной компании, мы можем искать фотографии с соответствующей гео-меткой. В нашем случае это будет «НПО Эшелон».
Мы видим, что публикации с данной гео-меткой в основной своей массе сделаны сотрудниками компании. Логично предположить, что среди подписчиков многих сотрудников компании «Эшелон» должен быть и аккаунт автора, который мы без труда и находим:
Как пользоваться машиной времени?
Проведя аналогичный анализ в отношении аккаунта в twitter, можно обнаружить, что автор вел сайт adorofeev.ru, который сейчас не доступен. Что делать в этой ситуации? Ведь материалы исчезнувшего сайта могут представлять реальный интерес. В практике автора была ситуация, когда подобный исчезнувший сайт содержал опубликованные материалы уголовного дела, с которым было интересно познакомиться.
Если сайт выключили совсем недавно, то нам может помочь опять таки Google, предлагающий оператор cache: с помощью которого можно извлечь закэшированные страницы, добытые поисковиком.
cache:www.adorofeev.ru/
Мы видим, что сайт 5-го февраля еще был включен, но ничего интересного из себя не представлял.
Очень хочется заглянуть в более далекое прошлое – на несколько лет назад. Для этого подошла бы машина времени и, как ни странно, она есть и доступна любому любознательному пользователю по адресу: https://archive.org/web/
«Пробивая» сайт автора, можно увидеть, что в прошлом там были какие-то материалы:
Причем, выбрав определенные даты, можно увидеть контент сайта на конкретный момент:
Вместо заключения: несколько слов об автоматизации процесса и других операторах Google
Можно ли процесс поиска интересной информации с помощью Google автоматизировать? Можно, и неплохие попытки уже есть: скрипт theHarvester.
Надо отметить, что Google это не приветствует и борется, поэтому надежность результатов применения всевозможных скриптов придется дополнительно проверять. Даже просто играясь с вполне легальными операторами, которые мы рассмотрели выше, вы постоянно будете видеть капчу и будете доказывать, что вы не робот.
Статья получилась довольно объемной и мы не стали рассматривать многие другие операторы продвинутого поиска Google , которые могут быть также полезны в интернет-разведке. Если применение операторов в подобном ключе интересно, то мы обязательно продолжим эту тему в одной из следующих статей.
Литература
- Что в имени тебе моем: как качественно «пробить» человека в сети Интернет?
- Интернет-разведка в действии: who is Mr./Ms. Habraman?
- Social Media in Identifying Threats to Ensure Safe Life in a Modern City Aleksandr Dorofeev, Alexey Markov, Valentin Tsirlov
- Google Hacking for Penetration Testers, Third Edition 3rd Edition by Johnny Long, Bill Gardner, Justin Brown.
Автор: Эшелон
Спасибо автору за познавательный контент, ещё добавляет понимание по операторам Google это blog.xbox360-live.ru/rukovodstvo-seo-po-operatoram-google.html а как быть с практикой? Есть какие то общие принципы построения цепочек операторов или всё познаётся методо проб и ошибок? Если есть, может кто поделится?