Рубрика «Поисковые машины и технологии» - 5

Принятое в мае постановление Европейского суда о «праве быть забытыми» — right to be forgotten — праве пользователей требовать удаления информации из поисковых систем о себе — продолжает вызывать оживлённые дискуссии. На сей раз на сторону защитников свободы информации встали английские лорды: Комитет внутренних дел, здоровья и образования палаты пэров, верхней палаты британского парламента, раскритиковала это решение, пишет газета Guardian.

Британский парламент выступил против «права быть забытым»

Лорды считают, что поисковые системы не должны нести ответственность за содержимое результатов поиска. Они отмечают, что Директива о защите данных Европейского союза от 1995 года, на которую опирался Европейский суд в своём решении, была разработана за три года до появления Гугла — и спустя почти 20 лет уже не отражает произошедших с тех пор изменений.
Читать полностью »

У большинства крупных поисковиков и сервисов есть механизм похожих поисковых запросов, когда пользователю предлагаются варианты, тематически близкие к тому, что он искал. Так делают в google, yandex, bing, amazon, несколько дней назад это появилось и у нас на hh.ru!

Похожие поисковые запросы в hh.ru

В этой статье я расскажу о том, как мы добывали похожие поисковые запросы из логов сайта hh.ru.
Читать полностью »

Рынок авиабилетов набирает обороты. Задумывались о том, как начать их продавать на вашем проекте? У Google есть простое решение для выхода на этот рынок: QPX Express API, позволяющий подключаться к одной из самых мощных глобальных систем поиска авиабилетов QPX. Это один из самых доступных способов начать свой собственный бизнес по продаже авиабилетов, дополнить функциональность туристического блога или заменить систему покупки билетов на сайте авиакомпании на более эффективную.

QPX Express API: бизнес по продаже авиабилетов не вставая с дивана

Немножко истории

Система поиска авиабилетов QPX была разработана командой ITA Software в 1999 году. В настоящее время она используется такими компаниями, как Kayak.com, CheapTickets, авиакомпаниями United Airlines, Virgin Atlantic, Alitalia, S7 и другими. Потестировать систему можно и непосредственно на сайте: matrix.itasoftware.com.

QPX Express API: бизнес по продаже авиабилетов не вставая с дивана

В 2011 году ITA Software получила приставку by Google к названию. Позднее мы представили API для свободного доступа к этой поисковой системе QPX Express API, о котором и пойдёт речь в этом посте.Читать полностью »

Личные данные: продать нельзя отдать?

Привет. Сегодня мы хотим предложить вашему вниманию перевод одной очень интересной статьи, в которой поднимается весьма неоднозначная тема. Ни для кого не секрет, что всевозможные корпорации и социальные сети постоянно собирают различную информацию о своих пользователях и посетителях, включая логи их поведения в сети.

Неустанно протоколируется каждое наше действие, как онлайн, так и, зачастую, оффлайн. Впоследствии эти данные анализируются и используются всеми заинтересованными лицами, в том числе с получением прибыли. На нас зарабатывают социальные сети и рекламные агентства, но мы не имеем ни малейшей выгоды от этого.
Читать полностью »

Эта возможность доступна только резидентам ЕС, т.к. является следствием решения Европейского суда, постановившего, что пользователи имеют «право быть забытыми» — right to be forgotten, так это называется. Постановление было принято пару месяцев назад и касалось конкретно Гугла, но, видимо, Microsoft решил не ждать, пока придёт их очередь.

Bing стал следующим поисковиком, в котором можно запросить удаление поисковых результатов

Пользователям, желающим стереть себя из памяти всемирной паутины, предлагается заполнить подробную форму, на основании которой и будет принято решение об удалении запрашиваемой информации из поиска.
Читать полностью »

Прогноз ЧМ 2014 на языке Вольфрама

На ЧМ по футболу закончилась групповая стадия, количество команд-участниц сократилось вдвое, стали известны пары участников плей-офф. В связи с этим, разработчики из компании Wolfram Research обновили расчёт статистической вероятности для оставшихся матчей.
Читать полностью »

Searchcode 2.0

Недавно запущена новая версия поисковика по исходному коду Searchcode. В его индексе — проекты с Github, Bitbucket, Google Code, Codeplex, Sourceforge, Fedora Project и других. Всего в базе более 18 млрд строк кода из более чем 200 000 проектов.

У Searchcode открыты API без лимита (пока) на количество запросов, даже ключ API не требуется.
Читать полностью »

Постоянно думайте о том, будет ли ваша страница загружаться медленнее на смартфоне, чем на ПК. И если это так, то мы, скорее всего, понизим ее в выдаче. Мэтт КаттсНа фоне огромного количества материалов на тему «Google учитывает скорость» и «Яндекс учитывает поведенческие факторы» мне захотелось навести порядок и разобраться с вопросом: как на самом деле скорость и доступность сайта влияет на эффективность (поискового) продвижения. Тема нигде толком не затрагивалась, и по отрасли ходят скорее слухи, чем конкретные факты.

Проведенное исследование включает как подборку соответствующих количественных исследований, так и опрос экспертов рынка на предмет связи показателей скорости сайта с количественными показателями продвижения.
Читать полностью »

Введение

В computer science из года в год все более популярной становится тема обработки естественного языка. Из-за огромного количества задач, где требуется подобный анализ, сложно переоценить необходимость автоматической обработки текстовых документов.

В этой статье мы максимально просто постараемся описать наиболее популярные современные подходы к представлению текстовых документов для компьютерной обработки. А на одном из них, который в настоящее время еще не получил широкого распространения, однако имеет на это все шансы, остановимся более подробно, поскольку этот метод мы используем в SlickJump при разработке алгоритмов, например, контекстного таргетинга рекламы.

Отметим, что приводимые подходы применимы не только к текстам, а вообще к любым объектам, которые можно представить в виде символьных последовательностей, например, какие-нибудь макромолекулы (ДНК, РНК, протеины) из генетики. Всего мы рассмотрим 4 метода:

  1. Признаковое описание.
  2. Попарное наложение (выравнивание) текстов.
  3. Формирование профиля и скрытой марковской модели.
  4. Представление фрагментами.

Итак, приступим.
Читать полностью »

ElasticSearch — агрегация данных
В статье мы рассмотрим, как правильно реализовывать агрегацию данных, зачем это может понадобиться, и сдобрим это кучей рабочих примеров.

Для всех, кому интересно как сделать свои запросы в ES интереснее и посмотреть на обычной поиск с другой стороны, прошу под кат.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js