Во френдфиде на днях кипели нешуточные страсти вокруг качества поиска. Роман Иванов (Кукуц) и его оппоненты потратили не один час на эксперименты и переписку, чтобы получить ответ на вечный вопрос: кто лучше ищет - Google или Яндекс? К выводу, кстати, тоже пришли к классическому: Google практически не отстает от Яндекса в русскоязычном поиске, а в "большом Интернете" бьет отечественный поисковик на голову.
Началось все с поста screamager, который "не разгону флейма для, а дружеского фидбэка ради" привел пачку запросов, которые давали в Яндексе результат сомнительного качества.
1. "ихтиандр автор". Первая ссылка -- на stihi.ru, пользователя ihtiandr. Вторая на pdf'ку "Александр Климай ИХТИАНДР НАУЧНО-ФАНТАСТИЧЕСКИЙ РОМАН". Ссылка на википедия- статью "Человек-амфибия" Александра Беляева -- на 6-м месте. (у гугла -- на первом).
2. "Олег Кашин". Первые два хита OK. Третий - на лентапедию, проект, закрытый больше года назад и не обновляемый (что неправда - проект закрылы в декабре 2012. Roem.ru). Четвёртый -- на спаммерский сайт olegkashin.ru, "Новости России и всего мира. | Оперативно. Ежедневно". Сравните выдачу с гуглом.
3. "Дом на набережной". Текст романа, сайт музея, ссылка на вики, OK. Но четвёртым хитом "DOMNA.RU :: домен продаётся :: domain name for sale" -- это правда нужно?
4. "библиография платонова". _Первый_ хит -- на библиографию некоего Олега Платонова, автора таких важных книг, как Загадка Сионских протоколов, Криминальная история масонства и Еврейский вопрос в России.
5. "владимир путин". Второй хит на бессмысленную сайто-заглушку "Сайт Владимира Путина - президента РФ 2012-2018. План Путина....", ну это ладно, тут хоть кейворды. Но следующий за ним третий хит -- "Сайт Председателя Правительства РФ Д.А.Медведева" -- это вообще как?Опять-таки, я не для раздувания флейма и троллинга, но вы имейте всё-таки в виду, что для 2013 года такая выдача как-то обескураживает. Совершенно объективно.
Роман Иванов в ответ провел сравнение результатов для 49 запросов. Вскрытие показало, что "в 16 случаях лучше ответил Яндекс, в 13 лучше ответил Гугл и в 20 случаях ответ одинаково плохой или одинаково хороший". Дотошные участники дискуссии тут же обратили внимание на то, что результаты Яндекса сильно хуже в англоязычном поиске, а в 20-25% случаев он не выдает вообще никакой релевантной информации. Так, в 4 из 5 англоязычных запросов, встреченных у Иванова, Google был лучше. Аналогичная картина и в отдельной подборке 20 англоязычных запросов: 5 ничьих, в 15 случаях лучше отработал гугл, в том числе в 5 случаях Яндекс не смог показать вообще ничего релевантного на первой странице.
"Яндекс" оказывается лучше в русскоязычной части Интернета. Это происходит прежде всего за счет локальных сервисов, которых у Google нет, и колдунщиков. Яндекс.Афиша, Яндекс.Такси, Поиск по стихам, поиск по цветам, калькулятор валют и так далее - инструменты, милые сердцу многих пользователей Яндекса, данные которых тот отдает в своей поисковой выдаче.
Зато Google может неплохо оценивать качество данных на чужих сайтах. Именно это оказывается важным для пользователей 21 века, которые хотят в результатах поиска видеть "панель управления", с которой они могут сразу перейти на ресурсы, содержащие разные категории информации по запросу. Google стремится к тому, чтобы на первой странице выдачи находились ресурсы, которые считаются в мировом интернет-сообществе доверенными.
Вот очень показательный пример -- пишем "Raymond Chandler" в гугл. Справа -- сразу фотографии, годы жизни, краткая биографическая справка, чтобы не бегать на википедию за простейшими фактами. Теперь смотрим собственно выдачу. Сначала -- линк на википедию, ok, вдруг справки не хватило. Второй -- на фанатский сайт Чандлера, со всякой trivia и прочими делами. ok. Третий -- IMDB, чтобы узнать про фильмы по книгам Чандлера, ok. Четвёртый -- на goodreads.com, 74 тысячи оценок, наверняка тысячи рецензий на романы на расстоянии одного клика -- ok. Потом на архив NYT -- не ок, но терпимо (кстати оказывается ok, там действительно прорва статей по теме). И совсем внизу первой страницы выдачи -- амазоновский линк и ютьюб-видео с аудиозаписью голоса Чандлера, а под этим -- последние упоминания Ч. в новостях (какой-то современный автор вставил цитату из Ч. в свой роман в знак уважения). Вот это -- стандарт потребления информации в 21 веке, старина. Я имею дашборд, с которого одним кликом могу пойти по любому направлению -- рецензии, фильмы, детали биографии, всё что может потребоваться. Я точно знаю, что нет какой-то важной точки интернета, где чандлер релевантен, и куда я не могу попасть кликом с этой страницы. Потому что "люди работали".
Там, где Google выдает ссылки на авторитетов и каталоги более-менее беспристрастной информации, крупные коммерческие порталы, дискуссионные площадки и новостные ресурсы, Яндекс ссылается на сайты, качество информации на которых вызывает сомнения у пользователей. "Если там написано что чел помер -- я могу это расшарить в френдфид как надёжный факт? Кто обновляет там базы, с какой скоростью? Кто оплачивает сайт?". Отдельные вопросы к Яндексу вызывают дубли в выдаче, когда даже на одной странице может присутствовать несколько ссылок на один ресурс.
С другой стороны, насколько выдача удобна, во многом зависит от пользователя. Ряду пользователей, условной "40-летней тёте из одноклассников" на самом деле может быть совершенно без разницы, куда ее ведет выдача - на IMDB или на themoviedb.org. И про любимого певца она вполне спокойно прочитает на peoples.ru. И не страшно, если иногда на таких непонятных сайтах, встречающихся на первой странице выдачи, появляется материалы вроде "Кобзон умер". То, что это ошибка - тетя рано или поздно все равно узнает, а пока - такая тема для разговоров. Если у человека нет внутреннего запроса на достоверную информацию, то ему не критично, что за ресурсы у него в выдаче.
Конечно, с особо умными, под которых подстраивается Google, сложнее. Им и информация нужна достоверная, и "панель управления" вместо результата выдачи, и вообще, у них синдром дефицита внимания, и они сами не знают, чего хотят. "Вы мне дайте выдачу, где я одним кликом могу все три варианта реализовать, а уж там я решу". Учитывая, что у Яндекса больше половины российского рынка поиска, можно понять, почему на "особо требовательных" пока не обращают внимания.
Возникают, правда, вопросы из разряда вечных: что было первым - выдача для "теть из одноклассников" или пользователи, которым не критичны источники информации? И должен ли поисковик заниматься воспитанием собственных пользователей, показывая им ссылки на IMDB вместо themoviedb.org и на Википедию вместо peoples.ru? Но это уже лирика, а "физика" остается неизменной - Яндекс по-прежнему плохо ищет на английском, а Google все также достойно справляется с русским.