Рубрика «Поисковые машины и технологии» - 19

Яндекс попробует научить пользователей правописанию

Сейчас в Сети ну очень много неграмотных людей. И ладно бы, если бы ошибки были бы только в сложных словах и предложениях. Но ведь через раз встречаются «спОсибо», «пажалусто», «дешего» и тому подобные словеса. О пунктуации во многих случаях и речи не идет, недостаток знаков препинания в предложении стараются исправить огромным количеством скобочек, вопросительных и восклицательных знаков в конце предложения. В общем, все печально. Сейчас «Яндекс» сообщил о сервисе, который поможет тем пользователям, которые хотели бы узнать, как правильно писать некоторые слова.

Читать полностью »

Прекратил своё существование старейший поисковик рунета — Апорт

Сегодня, наверное, слово Aport ничего не скажет молодому поколению пользователей интернета, но тогда, в конце 90-х и начале нулевых, фраза «поищу реферат на апорте» звучала намного чаще, чем современное «загуглить».

Aport.ru отказался от своей поисковой машины ещё 22 августа 2011 года, целиком перейдя на поиск Яндекса.
Читать полностью »

Обзор архитектур подготовки данных больших поисковых систем

В прошлый раз мы с вами вспомнили, как стартовал в 2010 году Go.Mail.Ru, и каким Поиск был до этого. В этом посте мы попробуем нарисовать общую картину — остановимся на том, как работают другие, но сначала расскажем о поисковой дистрибуции.Читать полностью »

Ежедневно, выполняя свои должностные и прочие функции, современный человек сталкивается с задачей анализа большого объема информации и поиска необходимых ему данных. Со временем происходит накопление пользовательских данных в виде документов. Эти документы в сумме составляют некоторое информационное пространство пользователя. С каждым новым документом все острее встает вопрос организации этого пространства: с течением времени из пары – тройки папок с иерархически – расположенными в них файлами получается огромная кипа документов, которую достаточно сложно привести к иерархической форме с линейными связями. Перед нами встает задача конкретизации, категоризации и визуализации информационного пространства пользователя.
Читать полностью »

«У нас есть свой поиск!»

Два года подряд все свои выступления на конференциях я начинал этой фразой, ведь даже не все специалисты по поиску знали о том, что их запросы, заданные в поисковой строке Mail.Ru с большой долей вероятности обрабатывались не лицензированным сторонним движком, а внутренней разработкой компании.

Сейчас я вижу, что ситуация изменилась: многие знают и принимают наш поисковик. Однако вопросы или сомнения всё равно остаются – ну как так, Mail.Ru Group и пишет свой поиск? Mail.Ru Group — это почта, это социальные сети, развлечения… Что за поисковик они могут написать? Вот чтобы развеять эти сомнения, я и хочу рассказать о нашем поиске, о том, как мы его делаем, какие технологии используем, что хотим получить в итоге. Я надеюсь, что предлагаемая статья будет познавательной и интересной; более того, мы собираемся продолжить рассказ о наших технологиях уже более детально, и в следующих постах поговорить о машинном обучении, спайдере, антиспаме и т.п.
GoGo.RuЧитать полностью »

Google собирается понижать «пиратские» ресурсы в поисковом рейтинге

Корпорации Google каждый день приходит много сотен заявок на исключение «пиратских» ресурсов (или какого-то индивидуального url) из поисковой выдачи. В некоторых случаях корпорация идет на встречу правообладателям, удаляя такие ссылки, в некоторых — нет. Но множество «варезников» и прочих подобных ресурсов находится в топе выдачи по множеству запросов, что раздражает борцов с пиратством. И корпорация приняла решение применить еще один метод для борьбы с подобными сайтами — понижать их в выдаче при появлении жалоб от правообладателей.

Читать полностью »

Дорвеи без регистрации и смс
Я не сеошник. Мне всегда нравилось наблюдать за развитием методов поисковой оптимизации. Особенно интересны были методы «серой» оптимизации, до сих пор не перестаю удивляться изобретательности оптимизаторов. Сей топик представляет собой разбор нескольких способов обхода правил ПС, которые, с моей точки зрения, показались интересными.

Читать полностью »

Bitly анонсировал поисковый сервис Realtime

Известный ресурс сокращения ссылок Bitly анонсировал интересный сервис поиска наиболее популярных материалов среди контента, размещаемого собственными пользователями. Само собой, поиск ведется как по ссылкам, размещаемым «вручную», так и по ссылкам, которые оставляют разного рода сервисы, работающие с Bitly. В настоящее время Realtime находится в стадии закрытой беты, позволяя пользователям фильтровать поиск по ключам, теме, социальным ресурсам и прочему. Анонсная картинка показывает возможности Realtime.

Читать полностью »

Инженерный калькулятор в выдаче Google

Поисковый гигант добавил к возможностям своей страницы поиска ещё одну особенность, ради которой теперь не надо закрывать браузер и искать приложение «Калькулятор».

Новая функция работает на английском языке (WNeZRoS) — 2+2.

Читать полностью »

Два года назад директор по коммуникациям Библиотеки Конгресса США объявил о плане сделать архив всего Твиттера, начиная с марта 2006 года. Уже в то время (март 2010-го) это был очень большой объём: тогда в твиттере публиковалось 55 миллионов сообщений в день, а общий размер базы с момента основания сайта измерялся в терабайтах.

Но то были лишь цветочки. К лету 2012-го года трафик в Твиттере вырос до 400 млн сообщений в сутки, а Библиотека Конгресса так и не запустила обещанный архив с полнотекстовым поиском. В связи с этим кое-кто начал сомневаться, что задача по силам библиотекарям. На прошлой неделе появились слухи, что они втихую отказались от амбициозного проекта. На самом деле это не так.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js