Yacy — Распределённый не цензурируемый поисковик: Три годя спустя

в 18:03, , рубрики: Без рубрики
Yacy — Распределённый не цензурируемый поисковик: Три годя спустя

Yacy — это децентрализованная поисковая машина, которая позволяет осуществлять поиск информации в интернете без локальной или глобальной цензуры или любых других ограничений.

Первое и единственное упоминание о нем на хабре было 29 ноября 2011.

Но с того времени многое изменилось, давайте посмотрим на него еще раз.

Основные возможности и преимущества Yacy:

— Децентрализованный поиск и хранение индекса — в сети DHT
— Три режима работы 1) Глобальный поисковой индекс 2) Групповой индекс 3) Локальный индекс
— Отсутствие рекламы
— Отсутствие какой-либо цензуры (государственной, копирайтной)
— Огромное количество настроек

Основные недостатки:

— Время поиска (из-за децентрализованной природы, поиск не популярного контента может занимать значительное время)
— Релевантность (алгоритм релевантности был переработан за эти три года, но все равно он отстает от поисковых гигантов)

Что изменилось за три года ?

— Поддержка русскоязычных поисковых запросов
— Появились подсказки в во время ввода поискового запроса
— Опережающий поиск — пока вы печатаете yacy уже ищет пиров с данным контентом
— Улучшились алгоритмы поиска и выдачи — более релевантный результат
и миллионы других мелких изменений под капотом.

Как работает Yacy?

Индексирование

Индексирование может быть инициировано следующими путями:
1) Принудительное указание начала сканирования
2) Удаленный запрос от другого пира
3) Настройка проксирования всех запросов от браузера к Yacy с последующий индексацией того, что вы читаете

После составление базы индекса, она сохраняется локально рассылая в сеть информацию о том, что она у вас есть и распределяется по DHT на соседних пиров

Поиск

Во время процесса поиска, Yacy сначала ищет результаты в локальном индексе, а затем — в глобальном, связываясь по DHT c пирами у которых есть сведения об индексе того или иного запроса/сайта

Результаты поиска от Yacy:
Yacy — Распределённый не цензурируемый поисковик: Три годя спустя
Yacy — Распределённый не цензурируемый поисковик: Три годя спустя
Yacy — Распределённый не цензурируемый поисковик: Три годя спустя
Yacy — Распределённый не цензурируемый поисковик: Три годя спустя

Официальный сайт проекта yacy.net/en/
Windows yacy.net/release/yacy_v1.68_20140209_9000.exe
Linux yacy.net/release/yacy_v1.68_20140209_9000.tar.gz
OS X yacy.net/release/yacy_v1.68_20140209_9000.dmg

Тестовая поисковая страницы search.yacy.net (которая может упасть от большого трафика)

PS Последняя статья была три года назад, если хабар пользователям будет интересна тема децентрализованных поисковых систем, я готов сделать обзор всего функционала Yacy и рассмотреть подробно как она работает

Автор: shifttstas

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js