Рубрика «Поисковые машины и технологии» - 8

Google будет показывать в результатах поиска рекламу конкурентов: результаты антимонопольного расследования ЕС

Каждая крупная технологическая (да и не только технологическая) корпорация рано или поздно становится объектом наблюдения со стороны антимонопольных комитетов и органов. Это происходит во многих странах и регионах, включая ЕС, США, Азию.

Что касается Европы, то здесь европейские регулирующие органы начали антимонопольное расследование относительно «Корпорации добра» еще в 2010 году. С тех пор европейские законодатели нашли много нарушений со стороны Google, включая демонстрацию рекламы корпорацией на странице поисковой выдачи.

Читать полностью »

Некий Дэвид Пек получил вчера очень много почты с тысяч различных ящиков Gmail. Произошло это из-за очень странного бага в поисковой выдаче Google.

Из за глюка Google тысячи писем ушли на один почтовый ящик Hotmail

По какой-то причине в выдачу по ключевому слову [gmail] попал почтовый адрес Дэвида Пека. Если пользователь переходил по ссылке “Email” (указана на скриншоте), то появлялась форма отправки почтового сообщения на адрес dsp559@hotmail.сom. Оставалось только нажать кнопку «Отправить».
Читать полностью »

Дополнение от 23.01.14. Эта статья была написана 30-го декабря минувшего года. Выдача с тех пор изменилась, однако по большому счету приведенная информация актуальна. За прошедшее время появились еще кое-какие данные, однако их, с одной стороны, слишком много для того, чтобы расширить эту статью — и слишком мало для новой с другой. Если пост вызовет интерес сообщества, вполне вероятно, что после накопления информации будет продолжение, связанное с характерными особенностями не упомянутых тут факторов.

Введение

Предупреждение. Нижеследующее не следует воспринимать как точную информацию — это только догадка, подтвержденная эмпирически.
Предупреждение 2. Возможно, эта информация — новость только в моем «болоте», но поиск по сети не дал результатов, сколько-нибудь похожих на эти выводы.

Все, более-менее имеющие отношение к интернету, знают, какой хай поднялся, когда Яндекс заявил, что отказывается от ссылочного в НГ.

С одной стороны, жить станет легче — без поискового мусора мир будет немного чище, с другой — непонятно, как это реализуют и по кому это ударит (ну, кроме копирайтеров-оптимизаторов и прочей братии, конечно, но и фиг бы с ними).

Поскольку я занимаюсь, помимо прочего, и рекламой в Сети, я начал с напряжением поглядывать на позиции сайтов моих клиентов, а заодно и конкурентов. Результаты выдачи к праздникам становились все страньше и страньше. Очевидно, нессылочные факторы потихоньку усиливались — и потому выдача по некоторым запросам стала довольно необычной.

Я попытался понять логику алгоритма и, похоже, это частично удалось. Хотя, если мои предположения верны, многих, зависящих от продаж через сеть, прямо скажем, ждут тяжелые времена.

Да и пользователям будет не легче.

Тем, кто торопится: краткое резюме есть в конце статьи.

Остальным же предлагаю полностью проследить ход мысли и поправить ошибки, которые я, возможно, допустил.
Читать полностью »

Яндекс зарабатывает сотни миллионов долларов в год, хотя наш поиск — бесплатный. Основной доход мы получаем от рекламы, соединяя продавцов с покупателями. Чтобы делать это хорошо, мы используем сложные алгоритмы, созданные на основе математической статистики, теории вероятностей, машинного обучения, теории игр и теории аукционов. Улучшение алгоритмов всего на несколько процентов — это дополнительные десятки миллионов долларов в год. Из этой лекции вы узнаете, как математика может работать в рекламе.

Видео лекции
Читать полностью »

Google упростил поиск картинок по типу лицензии

Наверное, для многих будет новостью тот факт, кто поиск по картинкам Google позволяет использовать фильтр изображений по типу лицензии. Этот инструмент был добавлен компанией еще в 2009 году, но добраться до него было не так просто: для включения фильтра нужно было использовать продвинутые настройки меню, куда мало кто заглядывает.

Читать полностью »

Сегодня Яндекс объявлявил о начале нового сотрудничества с Facebook, в рамках которого он будет получать данные обо всех новых постах российских пользователей Facebook.

Благодаря этому с помощью Поиска по блогам впервые можно искать по записям русских пользователей с учётом морфологии и полноценным языком запросов. В будущем в поиске появятся также их комментарии.
Например: blogs.yandex.ru/search.xml?text=Яндекс&holdres=mark&server=facebook.com

Яндекс научился искать по Фейсбуку

Записи будут попадать в поиск в реальном времени. В Поиске по блогам можно будет найти записи пользователей FB из России, Украины, Беларуси и Казахстана. Также Яндекс в рамках этого соглашения получил поток с записями Турецких пользователей.
Читать полностью »

По разным оценкам сейчас в мире существует от трех до семи тысяч языков. Между языками могут быть очень значительные различия в графематике, фонетике, грамматике, лексике. Но если посмотреть шире, станет ясно, что все языки очень похожи и подвержены описанию при помощи универсальных категорий.

В этой лекции Елена Грунтова раскрывает студентам Малого ШАДа понятие грамматической категории и подробно рассказывает падежах, их природе, типах, а также способах выражения.

Лекция рассчитана на старшеклассников, но выходит за рамки школьной программы, поэтому может быть интересна и взрослым.
Читать полностью »

Сегодня мы запускаем эксперимент, в рамках которого у 2% пользователей, переходящих по ссылкам из результатов поиска, заголовок Referer не будет содержать текста поискового запроса (точнее, будет, но в зашифрованном виде). В дальнейшем эта практика распространится на всех пользователей Яндекса.

В этом посте мы хотим рассказать, почему приняли такое решение, и обсудить с вами, какие инструменты могут прийти на замену открытым данным о поисковых запросах.

image

Когда-то никому и в голову не приходило скрывать данные о том, с какой страницы был совершен переход, и по какому запросу была сформирована поисковая выдача, с которой тот или иной пользователь пришел к вам на сайт. Но мир меняется. С каждым днем пользователи становятся все менее безликими для владельцев сайтов, которые при желании могут отслеживать их действия на своей территории, сохранять, обрабатывать и использовать эти данные.
Читать полностью »

Мы живем во времена, когда кажется, что все просто и все есть. Нужно сделать масштабируемый проект — используем MongoDB, нужна очередь — вот RabbitMQ, нужно поднять функционал поиска — раз плюнуть: ставим Sphinx, Solr, ElasticSearch (нужное подчеркнуть).

Но здесь лишь доля правды: — при определенном везении можно поставить нужный сервер и все зашевелится. Загвоздка с поиском состоит в том, что пользователи уже порядком привыкли к высокой планке, которую задают «большие ребята», а тот поиск, что поднимется у вас «из коробки», будет явно недотягивать. И если очередь или базу данных вы можете добить железом прежде, чем будете оптимизировать, то поиск железом не добьешь.

Существую толстые книжки про настройки полнотекстового поиска, однако их мало кто читает. Сегодня я хотел бы на пальцах поговорить о том, что нужно учесть, когда вы делаете префиксный поиск с выводом результатов по мере набора слова или фразы.

Мы посмотрим, как с помощью нашего проекта http://indexisto.com сделан поиск на сайте http://maximonline.ru и сравним его с тем, что есть на других сайтах.

Для начала несколько примеров. Возьмем запрос «Битва за Лос Анджелес» и представим, что его напишут неправильно «Лос Анжелес биттва». Как видно, пользователь не знает точно, как пишется имя города, и забыл, как звучит название фильма, а также у него дрогнула рука в конце на слове «битва».

Выберем достойные проекты рунета, в которых есть префиксный поиск, и попробуем поискать там наш запрос:

Проект Правильный запрос Неправильный запрос
afisha.ru Как это сделано: префиксный поиск
все ОК
Как это сделано: префиксный поиск
Не найдено
ivi.ru Как это сделано: префиксный поиск
все ОК
Как это сделано: префиксный поиск
Не найдено
vk.com Как это сделано: префиксный поиск
все ОК
Как это сделано: префиксный поиск
Не найдено
maximonline.ru Как это сделано: префиксный поиск
все ОК
Как это сделано: префиксный поиск
все ОК

Читать полностью »

В этой лекции на примере Яндекса будут рассмотрены базовые компоненты, необходимые для организации интернет-поисковика. Мы поговорим о том, как эти компоненты взаимодействуют и какими особенностями обладают. Вы узнаете также, что такое ранжирование документов и как измеряется качество поиска.

Лекция рассчитана на старшеклассников – студентов Малого ШАДа, но и взрослые могут узнать из нее много нового об устройстве поисковых машин.

Первый компонент нашей поисковой машины – это Паук. Он ходит по интернету и пытается выкачать как можно больше информации. Робот обрабатывает документы таким образом, чтобы по ним было проще искать. По простым html-файлам искать не очень удобно. Они очень большие, там много лишнего. Робот отсекает все лишнее и делает так, чтобы по документам было удобно искать. Ну и непосредственно поиск, который получает запросы и выдает ответы.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js