Рубрика «Поисковые машины и технологии» - 13

Поиск Яндекса сможет адаптироваться к вашим интересам за несколько секунд

2013-05-30 в 9:23, admin, рубрики: data mining, MapReduce, Блог компании Яндекс, персонализация, Поисковые машины и технологии, яндекс, метки: MapReduce, персонализация, яндекс

Поиск Яндекса сможет адаптироваться к вашим интересам за несколько секунд С сегодняшнего дня поиск Яндекса персонализирует ответ не только на основе истории ваших интересов — он будет учитывать и то, что вы делаете на поиске прямо сейчас. Это важное изменение для пользователей: от того, чем мы занимаемся сейчас, зависит то, что мы ожидаем получить в ответ. Поиск Яндекса становится адаптивным. Чтобы это стало возможным, нам пришлось реализовать новую технологию доставки данных в реальном времени.

Чтобы понять, что хочет пользователь, нужен контекст. Когда-то всем контекстом, который был доступен Яндексу, был текст поискового запроса. Со временем мы научились учитывать, из какого региона его задают.

Важным этапом стала персонализация ответа для разных пользователей — мы стали использовать знания о конкретном человеке, чтобы дать ему более точный ответ. Для этого мы использовали данные, посчитанные на истории запросов и кликов пользователя. Причём они были посчитаны как по истории за длинный период, так и по недавней. Мы рассказывали на Хабре об этом этапе.

Каждый раз дополнение пользовательского контекста влечёт за собой изменение качества работы системы, а иногда и пользовательского поведения.Читать полностью »

Я.Метрика: теперь можно узнать, чем интересуются целевые посетители

2013-05-23 в 18:40, admin, рубрики: аналитика, метрика, Поисковые машины и технологии, яндекс, метки: аналитика, метрика

В посте "Крипта: пользователь глазами Яндекса" я писал о технологии, которая определяет характеристики пользователя по анализу истории поиска и другим источникам.

По сообщению команды Яндекс.Метрики в системе аналитики появился новый отчет «коммерческие интересы». Статистика позволяет определить или дополнить портрет целевого посетителя.

Выглядит это таким образом:

Читать полностью »

Euclideon «вернулись» с новым видео

2013-05-23 в 13:20, admin, рубрики: Анимация и 3D графика, Поисковые машины и технологии

Вероятно, все помнят историю с Unlimited detail 2 года назад. После этого было еще одно официальное видео-интервью, и на этом наступила тишина.

Теперь euclideon (сайт Читать полностью »

Крипта: пользователь «глазами» Яндекса

2013-05-17 в 4:39, admin, рубрики: Поисковые машины и технологии, яндекс, метки: яндекс

Осенью 2011 года Яндекс запустил технологию «Крипта» (на основе самообучающегося алгоритма Матрикснет), которая отслеживает поведения пользователя и по собранным данным относит его к той или иной целевой группе.

К конференции YaC/m 2013 был выпущен сервис, который позволяет узнать, как вас «видит Яндекс». А точнее, как вопспринимает Яндекс устройство, с которого работает пользователь.

Вот такой портрет я получил на своем домашнем ПК:
Крипта: пользователь «глазами» Яндекса

Читать полностью »

RuSSIR 2013: VII летняя школа по информационному поиску

2013-05-16 в 11:52, admin, рубрики: russir, информационный поиск, Поисковые машины и технологии, Работа со звуком, Учебный процесс в IT, метки: russir, информационный поиск

16–20 сентября 2013 года в Казани пройдёт VII Российская летняя школа по информационному поиску (RuSSIR 2013).

Её организуют Казанский Федеральный Университет (КФУ) и Российский семинар по Оценке Методов Информационного Поиска (РОМИП) при участии Яндекса, Mail.ru и Google.

Главной темой школы в этом году будет поиск и обработка аудиоинформации. Рабочий язык — английский.

Основная программа состоит из 7 курсов:

Voice and Music Information Retrieval:

Spoken Content Retrieval: Challenges, Techniques and Applications — Gareth Jones (Dublin City University)
Content- and Context-based Music Similarity and Retrieval — Markus Schedl & Peter Knees (University of Linz)
Query by Singing/Humming and Audio Fingerprinting as Two Successful Paradigms of Music Information Retrieval — Jyh-Shing Roger Jang (Taiwan University)
Adaptivity in Audio and Music Retrieval — Andreas Nürnberger & Sebastian Stober (OVG University Magdeburg)

General Information retrieval:

Introduction to Information Retrieval Models — Massimo Melucci (University of Padua)
Techniques for Large Scale Information Retrieval — Paolo Boldi (University of Milan)
Novel representations and methods in text classification — Manuel Montes-y-Gómez & Hugo Jair Escalante (INAOE, Mexico)

Участие в школе бесплатное, но количество мест ограничено.
Читать полностью »

Яндекс обновился. Яндекс острова

2013-05-16 в 6:53, admin, рубрики: острова, Поисковые машины и технологии, яндекс, Яндекс API, метки: острова, яндекс

На конфренеции Yac/m представили обноволенную версию поисковой выдачи.

Читать полностью »

Обработка и классификация запросов. Часть третья: Исправление опечаток

2013-05-06 в 8:57, admin, рубрики: c++, mail.ru, Блог компании Mail.Ru Group, поиск, Поисковые машины и технологии, поисковые системы, поисковые технологии, метки: c++, mail.ru, поиск, поисковые системы, поисковые технологии

Опечатки бывают иногда полезны тем, что веселят читателя. Поисковые системы оценить юмора пока не в состоянии, и слова, набранные с ошибками, приводят их в замешательство, что в результате огорчает пользователя. Для предотвращения этих явлений существуют автоматические «исправляторы» опечаток, они же спеллчекеры.

О различных подходах к исправлению опечаток написано уже более чем достаточно, поэтому в этой статье я не буду повторять уже известное, а покажу, как написать спеллчекер с нуля — простой, но вполне дееспособный. Всё, что для этого нужно — это список правильных слов и немного С++.

Обработка и классификация запросов. Часть третья: Исправление опечаток

Читать полностью »

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных историй болезней?

2013-04-30 в 9:47, admin, рубрики: алгоритмы поиска, алгоритмы сортировки, аутизм, биоинформатика, будущее здесь, Поисковые машины и технологии, метки: алгоритмы поиска, алгоритмы сортировки, аутизм, биоинформатика

Существует ли связь между астмой и шизофренией?
Диабет и биполярное расстройство личности — могут ли они иметь что-то общее?
Сможет ли выявить столь нетривиальные связи анализ базы данных по 1500000 пациентов США?
На какие вопросы можно ответить, проанализировав 1 500 000 уникальных историй болезней?
_{предупреждение: под катом очень много текста}
Читать полностью »

Разбираемся с построением мультирегиональных сайтов

2013-04-18 в 7:11, admin, рубрики: usability, ит-инфраструктура, Поисковые машины и технологии

Проблема создания сайтов с разными версиями языков и стран отнюдь не нова, практически все крупные сайты уже давно с ней столкнулись. Каждая компания выбирает свое решение, мы кратко остановимся на основных вариантах и посмотрим, как решить эту задачу лучшим образом.

Варианты построения URL-ов

Конечно, в жизни существует больше групп, например, часть сайтов хранят региональные настройки в cookie-файлах, другие передают параметром ?lang=ru, однако это непопулярные решения и основными являются:

1. Версия сайта на другом домене:

example.com, example.ru

Самый кардинальный способ. Этот вариант может быть удобен компаниям, имеющим локальные представительства в разных странах и работающих относительно независимо от главного офиса, например, на другом движке сайта.

2. Версия сайта на поддомене:

ru.example.com, ua.example.com

Очень похож на предыдущий вариант, но легче в администрировании. Эти два варианта легко реализуются на физически разных хостах, поэтому могут быть размещены в разных странах.

Читать полностью »

Mathlingvo — блог о компьютерной лингвистике

2013-04-16 в 8:01, admin, рубрики: data mining, natural language processing, искусственный интеллект, Компьютерная лингвистика, обработка естественного языка, Поисковые машины и технологии, метки: natural language processing, Компьютерная лингвистика, обработка естественного языка

Natural Language Processing — область, которая становится все популярнее и популярнее в Росссии. Но отдельных ресурсов, посвященных этой теме, в рунете практически нет. Полгода назад на Хабре представляли NLPub, каталог ресурсов по компьютерной лингвистике. Но что делать, если хочешь читать новости? Можно попробовать начать с блога mathlingvo.ru

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «Поисковые машины и технологии» - 13

Поиск Яндекса сможет адаптироваться к вашим интересам за несколько секунд

Я.Метрика: теперь можно узнать, чем интересуются целевые посетители

Euclideon «вернулись» с новым видео

Крипта: пользователь «глазами» Яндекса

RuSSIR 2013: VII летняя школа по информационному поиску

Яндекс обновился. Яндекс острова

Обработка и классификация запросов. Часть третья: Исправление опечаток

На какие вопросы можно ответить, проанализировав 1 500 000 уникальных историй болезней?

Разбираемся с построением мультирегиональных сайтов

Варианты построения URL-ов

Mathlingvo — блог о компьютерной лингвистике

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «Поисковые машины и технологии» - 13

Варианты построения URL-ов

Новости

Актуальные темы

Архив