Метка «поиск» - 25

Латентно семантический анализ и поиск на python

Недавно Google объявил, что он переходит от поиска по ключевым словам к полностью семантическому поиску. Не знаю, насколько круты алгоритмы поиска у мировых гигантов, но поиск в маленькой песочнице получается довольно семантическим. Конечно, с поиском по более менее крупным объёмам данных уже не всё так радужно, готовить слова надо очень тщательно, но тем не менее.

Сразу оговорюсь: кому интересна только голая теория, то отсылаю к очень хорошей статье на хабре, кому не особо интересно знать как все работает, а интересует только продакшн, то он может попробовать неплохую библиотеку для семантического поиска на питоне.

Читать полностью »

Яндексу ежедневно приходится отвечать на десятки миллионов запросов. Поисковая система должна уметь быстро и точно их обрабатывать. Без применения лингвистики поисковая система сможет найти только точные совпадения в проиндексированных документах. Чтобы найти релевантные документы, системе необходимо правильно определить язык запроса, исправить опечатки, произвести морфологический разбор каждого слова, расширить запрос синонимами или вообще его переформулировать. В этой лекции Алексей Зобнин постарался дать студентам Малого ШАДа ответы на следующие вопросы:

• Зачем нужно учитывать морфологию?
• Как и зачем мы определяем язык запроса и документа?
• Что такое корпус Языка?
• Что такое языковые модели, и как они применяются в поиске?
• Как производится морфологический анализ несловарных слов?
• Как определить правильное значение и морфологическую парадигму омонимов?
• Какие бывают опечатки, и как мы их исправляем?
• Что такое расширения запроса и чем они могут быть полезны?

Читать полностью »

От создателей Indexisto — «Поиск для Хабра II»

Хмурым осенним утром в качестве эксперимента мы запили свой поиск для Хабра со структурой и скоростью. На все работы ушло минут 10. Тем кому лень читать тык для просмотра нового поиска (поисковый инпут прямо в теле записи в блоге)

Для получения такого поиска мы не просили доступа к базе, или заливки статей через наше API. Все делается очень просто, через обычный краулер. Для примера мы скраулили порядка 5000 статей.
Читать полностью »

Сегодня мы расскажем вам о нашей технологии под названием Блендер. Она обеспечивает ранжирование и встраивание блоков с вертикальными поисками в страницу поисковой выдачи Яндекса.

image

Начать, пожалуй, стоит с того, зачем вообще мы применяем вертикальные поиски. В некоторых случаях поиск по вертикалям бывает гораздо эффективнее стандартного веб-поиска. Например, когда пользователю требуется найти информацию определенного типа (картинки, видео). Некоторые запросы подразумевают другие критерии ранжирования: при поиске по товарам важно иметь возможность производить ранжирование по цене, а в поиске по людям необходимо учитывать дополнительные фильтры. Вертикальные поиски также могут предполагать совершенно иные способы взаимодействия с пользователем, как в случае с навигацией по результатам, отмеченным на карте, при поиске ближайшего магазина, кинотеатра или заправки.

Читать полностью »

В середине сентября я публиковал пост своего концентрированного недовольства новшествами, которые были реализованы в интерфейсе YouTube. Судя по реакции хабрахабровчан, перипетия оптЕмизации подконтрольных Google сервисов – явление более чем наболевшее не только для меня. Увы, на днях был выявлен новый повод для приложения ладони ко лбу в тщетных попытках осмыслить логическую подоплеку очередного «улучшения». Что еще интереснее, пока нововведение замечено только на google.ru – американская и, в частности, белорусская версии сервиса работают со «старым» обликом.

Интерфейс российского поиска Google подвергся «оптимизации»Читать полностью »

image

В школе для слепых в Японии интернет больше не просто визуальный инструмент. Японский Yahoo сделали поиск в интернете возможным даже для слепых детей. Совместно с креативным агентством Hakuhodo Kettle, Yahoo разработали аппарат, называемый Hands On Search, который является наполовину 3д-принтером, а наполовину компьютером — он построит все, о чем вы его попросите.Читать полностью »

За последние полтора года студия интернет-маркетинга FreshIT проанализировала 177 сайтов на качество SEO. В частности, проверили 71 интернет-магазин, 69 сайтов компаний, 37 контент-проектов. Результаты оказались плачевными: при создании и продвижении сайтов в интернете часто не обращают внимание даже на такие элементарные требования, как рекомендации поисковых систем для вебмастеров.

В статье речь пойдет о вытекающих из вышесказанного проблемах — о поиске информации в интернете и ее качестве.

6 глобальных проблем современной поисковой выдачи

Вы замечали такой факт — вы, человек с большим опытом в IT сфере, порой не можете найти нужную вам информацию. Казалось бы, есть гугл и яндекс, бери и ищи, но тут появляются такие проблемы и трудности, что шансы найти хоть что-то полезное приравниваются к нулю, либо время на поиск занимает безумное количество времени.
Читать полностью »

image

AlterWiki — новый полезный сайт для любителей викисреды. AlterWiki позволяет произвести поиск по всем российским вики-проектам, посмотреть, в каких именно проектах есть необходимая страница. Также смотрите описание на самом сайте.

Например, необходимой статьи нет в Википедии, а разнообразных вики-проектов различного профиля стало столь много, что искать вручную в каждом займет довольно большое время. В таком случае при помощи AlterWiki можно быстро глянуть, есть ли хоть в одном из российских вики-проектов статья, сравнить вики-проекты, в которых она есть (полноценная ли статья, или перенос/перенаправление/неоднозначность, автора, размер), при необходимости прочитать все эти статьи.
Читать полностью »

Поиск на Drupal 7 с помощью Apache Solr ч.6 — настраиваем apache solr + tomcat
После долгого перерыва, я решил написать очередную статью об apache solr и drupal. В этот раз речь пойдёт о настройке tomcat для того, чтобы apache solr мог работать, как демон. В интернете уже есть много разных мануалов по настройке tomcat, но не всегда они подходят для работы с drupal. В частности я настраивал tomcat и apache solr работал прекрасно. Но после того, как я подменил стандартные конфиги солра на конфиги друпала, солр перестал работать (начали вылетать java эксепшены).
Читать полностью »

Динамический поиск строки в iOS

Недавно появилась задача — встроить в приложение динамический поиск информации, то есть выдача должна генерироваться параллельно вводу пользователем символов. Вся информация хранится в SQLite базе данных. Все бы ничего, но в каждом слове выдачи искомые символы должны подсвечиваться.
Было принято волевое решение не использовать внешние библиотеки, а попробовать обойтись своими силами.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js