Независимый интернет-исследователь Гверн Брэнвен выложил на своём сайте всеобъемлющий архив с данными торговых площадок т.н. «даркнета», которые он тщательно собирал с 2013 года. Объём данных составляет около 50 Гб в архиве (и более 1,6 Тб в распакованном виде). Среди них – интернет-магазины, форумы, доски объявлений и другие сайты, находившиеся на «скрытых сервисах» Tor и торговавшие всякими интересными, и поэтому запрещёнными, товарами.
Всего в выборку попало 89 магазинов, 37 форумов и 5 других сайтов, которые неутомимый исследователь, рискуя своей репутацией перед правоохранительными органами, посещал и скачивал в ежедневном режиме. Архив доступен для скачивания в виде торрента.
Это исследование, по признанию автора, было вдохновлено возникновением первого масштабного магазина Silk Road, владельца которого не так давно арестовали и осудили. Когда в 2013 году магазин прекратил своё существование, в образовавшийся вакуум хлынули его конкуренты мелкого масштаба – и вот тогда-то и началось всё самое интересное. Развитие даркнета сподвигло Гверна на сбор подробной информации с целью её дальнейшего изучения.
Благодаря самоотверженности и альтруизму исследователя, теперь абсолютно любой человек, интересующийся обработкой данных, сможет изучить и перелопатить эти ценные горы. Что же можно сделать с такими интересными данными? Сам исследователь советует следующее:
- сбор информации о продавцах, и отзывов о них
- составление чартов популярности различных веществ
- расчёт денежного оборота чёрного рынка, комиссий и доходов
- корреляция движения денежных средств с транзакциями, записанными в цепочке блоков Bitcoin
- подсчёт потерь, связанных с мошенниками, притворявшимися продавцами
- разработка стратегий по своевременному выявлению подобных мошенников
- анализ популярных тем на форумах
- анализ данных, способствующих деанонимизации посетителей (GPS-метки в метаданных фотографий, повторное использование никнеймов и электронных адресов как в даркнете, так и в интернете, и т.д.)
- просто интересное времяпрепровождение
Автор: SLY_G