Рубрика «поисковые технологии» - 12

Обязанности поисковиков: как можно “редактировать” поиск в России - 1

Долгое время поиск информации в интернете напрямую законами не регулировался и никто не мог заставить поисковик показывать или скрывать определённую информацию в результатах поиска. Но с 2015 года российский законодатель успел предоставить право “редактировать” результаты поиска пользователям (физическим лицам), правообладателям и государству. У операторов поисковых систем в свою очередь появились обязанности, связанные с формированием результатов поиска не только в соответствии с собственными алгоритмами и запросами пользователей, но и с учётом новых нормативных правил. 

Право на забвение 

“Право на забвение” — это юридический продукт 21-го века, который был придуман не так давно в Европе как инструмент защиты частной жизни человека. Начало было положено, когда в 2014 году Суд справедливости Евросоюза (CJEU — Court of Justice of the European Union) в решении по делу Google Spain против AEPD и М.К. Гонсалеса решил, что люди имеют право на удаление информации о них из результатов поиска (делистинг, de-listing), если такая информация является “некорректной, нерелевантной или излишней” (inadequate, irrelevant or excessive). Это дело рассматривалось в контексте регулирования обработки персональных данных, которое в общем позволяет человеку управлять тем, как и зачем обрабатываются его персональные данные, в том числе требовать удаления или корректировки данных. Синьору Гонсалесу не понравилось, что, когда его гуглили, первым делом в поиске выскакивала статья 20-летней давности о продаже его имущества с торгов из-за долгов, и это производило плохое впечатление и мешало ему вести бизнес.  

Читать полностью »

В августе 2018 года стало известно, что Google ведёт разработку секретного проекта Dragonfly — это новая поисковая система для китайского рынка с поддержкой цензуры.

С критикой проекта выступили более 60 правозащитных групп и 22 американских законодателя. На фоне протеста правозащитников и некоторых сотрудников Google сам вице-президент Майк Пенс призвал компанию прекратить работу над Dragonfly. Он заявил, что система «усилит цензуру Коммунистической партии и поставит под угрозу конфиденциальность пользователей». В середине декабря издание The Intercept сообщило, что Google приостановила разработку Dragonfly после претензий собственного отдела конфиденциальности, который узнал о проекте из СМИ.
Читать полностью »

Picture 1

Далеко не первый год команда PVS-Studio ведет блог о проверках open-source проектов одноименным статическим анализатором кода. На сегодняшний момент проверено более 300 проектов, а в базу найденных ошибок выписано более 12000 случаев. Изначально анализатор был реализован для проверки C и C++ кода, далее появилась поддержка языка C#. Поэтому среди проверенных проектов большая часть (> 80%) приходится именно на C и C++. Совсем недавно к поддерживаемым языкам прибавился Java, а это значит, что перед PVS-Studio открываются двери в новый мир, и пора дополнять базу ошибками из Java проектов.

Java мир огромен и многообразен, поэтому глаза разбегаются при выборе проекта для испытания нового анализатора. В конечном итоге, выбор пал на движок полнотекстового поиска и аналитики Elasticsearch. Это достаточно успешный проект, а в успешных проектах находить ошибки вдвойне, а то и втройне приятнее. Так что, какие же дефекты обнаружил PVS-Studio для Java? О результате проверки и пойдет речь в статье.
Читать полностью »

TL;DR: Четыре года назад я покинул Google с идеей нового инструмента для мониторинга серверов. Идея состояла в том, чтобы объединить в одну службу обычно изолированные функции сбора и анализа логов, сбора метрик, оповещений и панели мониторинга. Один из принципов — сервис должен быть действительно быстрым, обеспечивая девопсам лёгкую, интерактивную, приятную работу. Это требует обработки наборов данных по несколько гигабайт за доли секунды, не выходя за рамки бюджета. Существующие инструменты для работы с логами часто медленные и неуклюжие, поэтому мы столкнулись с хорошей задачей: грамотно разработать инструмент, чтобы дать пользователям новые ощущения от работы.

В этой статье описывается, как мы в Scalyr решили эту проблему, применив методы старой школы, подход грубой силы, устранив лишние слои и избегая сложных структур данных. Эти уроки вы можете применить к собственным инженерным задачам.
Читать полностью »

В далёком 2009 году Еврокомиссия признала, что Microsoft злоупотребляет монопольным положением на рынке операционных систем, поставляя свой браузер Internet Explorer в комплекте с Windows. Американскую корпорацию заставили демонстрировать специальное окошко с выбором браузера. Так оно выглядело в 2010 году:

Android будет предлагать европейским пользователям браузер и поисковую систему на выбор - 1

Прошло почти 10 лет — и теперь история повторяется, но уже с операционной системой Android. По «рекомендации» ЕС компания Google тоже приняла решение предлагать новым европейским пользователям Android браузер и поисковую систему на выбор.
Читать полностью »

В нескольких недавних постах обсуждался многообещающий и достаточно простой способ оценки качества поиска по продуктам с использованием намерений. Спешим представить открытый автоматизированный инструмент для такого рода тестирования — Intent-based Search Quality. Идея сводится к использованию заранее подготовленных «фокусированных» запросов, ценность которых заключается в их прямолинейности и однозначной интерпретации.

Первый релиз открытого инструмента для тестирования поиска по продуктам - 1

Если вас заинтересовал подход, обязательно обратите внимание на пост “Я намереваюсь купить” или самый простой способ оценить качество продуктового поиска. Переход от стандартного A/B тестирования к тестированию с использованием намерений может показаться не совсем очевидным.
Читать полностью »

Google перестала «душить гуся»: DuckDuckGo включен в список стандартных поисковиков Chrome для 60 стран - 1

У нас есть определенно хорошие новости: поисковой гигант Google, по всей видимости, пересмотрел свою стратегию касательно конкурента DuckDuckGo. Компания включила «утку» в список поисковых систем по умолчанию Chrome для 60 различных регионов. Обновление поставляется с версией 73 Chromium.

При этом сами инженеры Google утверждают, что никакого «подвоха» в их действиях нет — они лишь обновили списки согласно собранным ранее данным о пользовательских предпочтениях. таким образом компания признает, что популярность DuckDuckGo выросла и стала заметной для внесения подобных корректировок. Список стран, получивших DuckDuckGo «из коробки» весьма разнообразен: от Коста-Рико и Гондураса, до Канады, Великобритании и даже Индии. Кстати говоря, для РФ список остался прежним: Google, Bing, Yandex, Mail.ru.

С актуальным перечнем поисковых систем, доступных по умолчанию в Chromium и, соответственно, в Chrome, можно ознакомиться на этой странице GitHub.
Читать полностью »

Привет! Предлагаю вашему вниманию перевод статьи "The Dangers of Overpersonalization" авторов Kim Flaherty и Kate Moran.

Итог: Излишняя персонализация контента приводит к однородному и безразличному восприятию пользователем информации и может вызывать усталость от вашего продукта в целом.

image

Читать полностью »

Some time ago among security researchers, it was very “fashionable” to find improperly configured AWS cloud storages with various kinds of confidential information. At that time, I even published a small note about how Amazon S3 open cloud storage is discovered.

However, time passes and the focus in research has shifted to the search for unsecured and exposed public domain databases. More than half of the known cases of large data leaks over the past year are leaks from open databases.

How to Discover MongoDB and Elasticsearch Open Databases - 1

Today we will try to figure out how such databases are discovered by security researchers...

Читать полностью »

«Яндекс» запустил поисковик по базе российских патентов за последние 95 лет - 1На днях компания «Яндекс» представила новый сервис «Яндекс.патенты», открывающий пользователям бесплатный доступ к более чем 2,5 млн различным российским патентным документам. Найти их можно не только через сам сервис, но и при помощи поисковика «Яндекса».

Сообщается, что новый сервис включает патентные документы с 1924 года по сегодняшний день. Среди них можно найти авторские свидетельства СССР, российские патенты и патентные заявки. Данные в базу загружаются из реестра Федерального института промышленной собственности (ФИПС).
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js