Поисковик DuckDuckGo разместил список веб-трекеров Tracker Radar. Он включает наименования 5326 доменов, которые 1727 компаний и организаций используют для отслеживания активности пользователей.
Данные общедоступны в соответствии с Creative Commons Attribution-NonCommercial-ShareAlike 4.0. Код, который используется для создания Tracker Radar, открыт на GitHub под лицензией Apache 2.0. Базу обещали пополнять ежемесячно.
Tracker Radar содержит подробную информацию о поведении отслеживания трекеров, в том числе о распространенности, принадлежности, действиях по снятию отпечатков пальцев, поведении файлов cookie, политике конфиденциальности, правилах для определенных ресурсов (за исключением случаев взлома сайта) и данные о производительности.
Каждый файл данных домена выглядит следующим образом:
Датасет содержит также файл для каждого родительского объекта, связывающий его с доменами.
Файл данных объекта выглядит следующим образом:
Так, исследователи нашли doubleclick.net на 29 758 сайтов (68%). Поскольку он принадлежит Google, у которого 479 доменов в собранном датасете, это означает, что doubleclick.net используется на сайтах, не принадлежащих Google, примерно 98% времени.
Согласно собранному датасету, трекеры, принадлежащие Google, находятся на более чем 85% топ-50 000 сайтов, Facebook — на 36%:
«Одна из лучших вещей, которую вы можете сделать, чтобы защитить себя, — это использовать качественный блокировщик трекеров. Хотя защита конфиденциальности сейчас важна для подавляющего большинства людей, наше исследование поведения, связанного с конфиденциальностью, показало, что только около 19% людей используют защиту от трекеров», —отметили в компании.
Изначально Tracker Radar сформировали для развития продуктов DuckDuckGo, которые необходимы для блокировки межсайтового трекинга. Он автоматически генерируется, постоянно обновляется и постоянно тестируется. По мнению компании, датасет заинтересует исследователей безопасности. Его уже используют разработчики Vivaldi.
См. также: «Firefox 75 будет автоматически удалять отслеживающие файлы cookie
Автор: maybe_elf