Рубрика «Поисковые машины и технологии» - 16

image

Поисковые системы Google & Яндекс недавно поменяли дизайн своих сервисов поиска по картинкам. Для пользователя, наверное, действительно стало удобнее — теперь он точно может сказать что реферат из гугла картинку с гуглДекса скачал.
Читать полностью »

Исторически в Почте Mail.Ru использовался механизм от «большого» Поиска (go.mail.ru); однако для задач поиска по почтовым ящикам такой вариант не был оптимальным ввиду большого потребления ресурсов и относительной сложности в обслуживании. Поиском по почте пользуются около 3% владельцев почтовых ящиков; однако, хотя эта цифра кажется относительно небольшой, ящики этих людей обычно достаточно объемны, и поиск им действительно необходим. Поэтому мы приняли решение написать специализированный поисковый демон, который будет заниматься именно поиском по почте. Основными требованиями к нему стали ограничения по потребляемым ресурсам (размер индекса — не более 3% от размера почтового ящика, среднее потребление оперативной памяти — не более 100 Мб, средняя утилизация CPU — не более 3%) и скорости исполнения запросов (среднее время — не более 200 мс). О том, как он был организован, я расскажу ниже.Читать полностью »

Новая социальная сеть — напечатай мне письмо
Новое развлечение для любителей поисковых систем — специальным образом составленный запрос в гугле выдаёт более 86000 сетевых принтеров, доступ к которым был открыт в момент обхода гуглом.
Читать полностью »

Яндекс выпустил социально-поисковое приложение под названием Wonder, в котором объединил для платформы iOS собственные алгоритмы поиска с данными из таких социальных сетей, как Facebook, Twitter, Instagram и Foursquare, а также с распознаванием голоса от Nuance, пишет TechCrunch.

Приложение выпущено только для американского рынка и в качестве «чистого эксперимента». Ожидается, что некоторые ключевые технологии Wonder в будущем также будут использованы в других приложениях. Само приложение Wonder может появиться и на других рынках, в том числе в России — всё зависит от его успеха в США.
Читать полностью »

image

Основным устройством для доступа к информации становится мобильный коммуниктор. Каждый день выходят новые мобильные приложения в основе которых лежит поиск. Пользователи таких приложений ищут не только информацию с сайтов; приложения транслируют данные многочисленных веб-сервисов.

Команда Suggest.io запускает open-source библиотеку для быстрого внедрения поисковых решений в приложения для iOS. Используя библиотеку Suggest.io (с элементарными доработками) можно быстро и без особых усилий создавать живой поиск (непосредственно из приложений для iOS) по сайтам, на которых установлен поиск Suggest.io.
Проект открытый.Сторонние разработчики могут присоединяться и предлагать свои идеи и решения.
Читать полностью »

Всех приветствую! Думаю очень-очень многие знают что такое TaoBao или по крайней мере слышали.

Для тех кто не знает: TaoBao — гигантская китайская торговая площадка, количество товаров на которой измеряется числом, близким к миллиарду. Там можно найти практически любой каприз вашей фантазии, причем довольно дешево. Но есть две проблемы: найти товар (весь сайт TaoBao и все описания на китайском) и доставить его (доставка на TaoBao только по Китаю)

Если вторую проблему легко решают множество посредников, то с первой все несколько сложнее. Если вы хотите найти что-то интересное, необычное или выходящее за рамки «обыденных товаров», то перед вами встанет трудность в виде языкового барьера

Примерно два месяца назад я пытался запустить свой интернет-магазин, ассортимент которого довольно уникален для России. Товары планировалось закупать на TaoBao. Задача поиска товаров и некоторые идеи упрощения этого утомительного процесса воплотились в идею сервиса-помощника. Некоторые рутинные действия можно было автоматизировать, что и было сделано. Что из этого получилось смотрите под катом.Читать полностью »

В кругу моих знакомых довольно популярны разговоры и холивары о том, какой поисковик в рунете ищет лучше. Ясно, что серьёзных претендентов на это звание всего два, но какой из них лучше? У каждого на тот счёт своё мнение, для детального исследования нужна хорошая теоретическая база, много материала, корректная функция проверки, в общем, куча времени. А для того, чтобы просто have fun достаточно нескольких запросов, на которых можно провести соревнование.
Я дважды для себя и своих знакомых проводил эти мини-турниры. Читать полностью »

Google открыл регистрацию на второй курс продвинутого поиска

Если вы хотели бы уметь находить ответы на вопросы типа «Какое историческое кафе вдохновило стихотворение лауреата Нобелевской премии?» или «Какие из победителей последних трёх чемпионатов мира среди бариста не использовали бобы из своей страны?», то Google приготовил для вас онлайн-курс продвинутого поиска. (Причём это уже второй.)

При поиске ответов на вопросы, которые нельзя найти с помощью одного запроса, поиск может быстро превратиться в целое исследование. Как пишет Дэн Рассел, занимающий в Google прекрасную должность технического убер-руководителя по качеству поиска и счастью пользователей, новый курс продвинутого поиска поможет получить более глубокое понимание того, как стать лучшим исследователем.
Читать полностью »

Какая часть веба заархивирована

Машина времени Internet Archive — самый большой и известный архив, который сохраняет веб-страницы с 1995 года. Кроме него существует с десяток других сервисов, которые тоже архивируют веб: это индексы поисковых систем и узкоспециализированные архивы вроде Archive-It, UK Web Archive, Web Cite, ArchiefWeb, Diigo и др. Интересно узнать, как много веб-страниц попадает в эти архивы, относительно общего числа документов в интернете?

Известно, что база Internet Archive за 2011 год содержит более 2,7 миллиарда URI, многие из них в нескольких копиях, сделанный в разные моменты времени. Например, главную страницу Хабра «сфотографировали» уже 518 раз, начиная с 3 июля 2006 года.

Известно также и то, что база ссылок Google пять лет назад перешагнула отметку в триллион уникальных URL, хотя многие документы там дублируются. Компания Google не в силах проанализировать все URL, так что компания решила считать количество документов в интернете бесконечным.
Читать полностью »

image

Привет хабр.
Пару месяцев назад мне поступил заказ на разработку сайта. Сайт представлял собой сборник статей добавляемых пользователем. Одним из пунктов технического задания было создание поиска. Т.к. я большой любитель изобретать велосипеды, было решено не использовать поиск от Яндекса или гугла.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js