Рубрика «поисковые системы» - 11

А есть ли альтернатива поисковым системам

2013-04-04 в 10:00, admin, рубрики: Google, Поисковые машины и технологии, поисковые системы, метки: Google, поисковые системы

Помню первый день, когда подключился к интернету. Это был модем, постоянно занятая телефонная линия, почасовая оплата и растерянность – куда пойти и как искать. Попадая на интересную страницу не читал, а тут же сохранял ее, чтобы потом спокойно почитать. Отключившись в первый день от сети понял, что есть оптимизационная задача: как денег потратить мало, а информации найти много? Решение пришло почти сразу – купил «Желтые страницы Интернета» и перед выходом в сеть готовился, внимательно читая и выписывая адреса интересных сайтов. Так было.

Сейчас все по другому. Интернет стал давно безлимитным и дешевым. Зато поисковые системы узурпировали наше право выбора, а мы к этому привыкли и безропотно этому подчиняемся. Поисковые системы думают за нас, заботятся о нас и без всяких там угрызений совести формируют наше представление о структуре и содержании сети. Поисковики незаметно начинают перебирать на себя все новые функции. Читать полностью »

Обработка и классификация запросов. Часть первая: парсер запросов

2013-03-27 в 9:18, admin, рубрики: Блог компании Mail.Ru Group, запросы, поиск, поиск mail.ru, Поисковые машины и технологии, поисковые системы, метки: запросы, поиск, поиск mail.ru, поисковые системы

Чем занят отдел обработки запросов в Поиске Mail.Ru? Если одним предложением, мы пытаемся «понять» запрос, то есть осуществляем подготовку запроса к поиску, приводим его в вид, пригодный для взаимодействия с нашим индексом, ранжированием, подмесами и прочими компонентами. Если же вы хотите узнать о нашей работе подробнее — добро пожаловать под кат. В этом посте я расскажу об одной из областей нашей работы — парсере запросов.
Читать полностью »

Иконочные шрифты для мобильных устройств

2013-03-22 в 12:18, admin, рубрики: Блог компании Mail.Ru Group, мобильная разработка, мобильный интерфейс, поиск, поисковые системы, метки: мобильная разработка, мобильный интерфейс, поиск, поисковые системы

Уже достаточно долгое время мы ведем поддержку двух мобильных версий Поиска Mail.Ru. Этим постом хотелось бы раскрыть немного технической информации о графических интерфейсах.

Первая из версий ориентирована на простые телефоны, которые медленно, но верно покидают современный рынок мобильных устройств, но еще не полностью забыты. К этой категории мы относим телефоны без полноценной операционной системы, браузеры в которых устарели, не понимают полноценного JavaScript-кода и не могут в силу своих ограничений поддержать быстро развивающиеся интернет-технологии. Для этой группы пришлось применять проверенный старый способ — .png- и .gif-графику.

Вторая версия, которую мы поддерживаем и развиваем, предназначена для смартфонов. О ней сегодня и пойдет речь.
Читать полностью »

Чья морфология лучше? Яндекс vs Google

2013-03-19 в 2:10, admin, рубрики: Google, морфология, Поисковые машины и технологии, поисковые системы, русский язык, яндекс, метки: Google, морфология, поисковые системы, русский язык, яндекс

Бытует мнение, что русская морфология у Яндекса реализована лучше чем у Google. В этой статье я покажу, что дело обстоит ровным счетом наоборот.

Читать полностью »

Поведенческие факторы ранжирования

2013-03-18 в 10:04, admin, рубрики: Google, seo, Блог компании SeoPult, поисковые системы, яндекс, метки: Google, seo, поисковые системы, яндекс

Пока компьютер не начнет думать как человек, он не сможет отличить плохой сайт от хорошего… так, как это сделал бы человек. На самом деле поисковые системы имеют в своих арсеналах методики сбора и анализа данных, с помощью которых кремниевые мозги легко затыкают за пояс знатоков из мяса.

Сразу оговоримся — под «хорошим» сайтом мы имеем в виду «достойный занять место в поисковой выдаче по конкретному ключевому запросу», не будем погружаться в дебри эстетики сайтостроения.

Итак, если не вдаваться в детали, сейчас в поисковых системах комплексно применяется три подхода: ранжирование страниц по авторитетности (пример — принесший Google популярность алгоритм PageRank), поведенческие факторы (анализ действий реальных посетителей реальных сайтов) и машинное обучение (пример — «Матрикснет» Яндекса, который обучает алгоритмы оценками выборок специалистами-асессорами, ну и по сути увязывает и уравновешивает первые два подхода).

Ранжирование по авторитетности на ранних этапах развития интернета работало очень хорошо, но в дальнейшем «слишком математическая» природа такого подхода позволила оптимизаторам применять фокусы, использующие найденные в ходе экспериментов слабости системы. Качество выдачи страдало, поисковики вводили поправки, дополнительные формулы и коэффициенты, фильтры и санкции, но по-настоящему крупный прорыв был сделан, когда появилась возможность ранжировать сайты на основе предпочтений их реальных живых посетителей. Анализ поведенческих факторов объективнее любых личных пристрастий (как экспертных, так и профанных), поскольку работает с предпочтениями большой выборки целевой аудитории.
Читать полностью »

Поведенческие факторы и с чем их едят

2013-03-11 в 8:06, admin, рубрики: Песочница, поисковые системы, метки: seo, seo оптимизация, поисковые системы

Поведенческие факторы и с чем их едят
Доброго времени суток!
Более подробно остановимся на:

Поведенческие факторы? Курим или реальность? А как пощупать?
Нужно ~~построить зиккурат~~ больше информации. Откуда поисковые системы узнают о поведении пользователей?
Чего ПС ценят в поведении людей? Основные факторы
Как заставить людей вести себя хорошо! Плетка? Пряник?
Ну и на последок…

Читать полностью »

GSA: Препарируем Google Search Appliance в виртуальной машине

2013-02-26 в 15:05, admin, рубрики: diy или сделай сам, Google, поисковая оптимизация, Поисковые машины и технологии, поисковые системы, метки: diy или сделай сам, Google, поисковые системы

Последние годы, с интересом почитывая о персональных поисковых системах в веселых желтых коробках имени Google, я периодически гуглил по словам GSA, Google Search Appliance, reverse engineering и, чего греха таить, hack, DIY, disk dump и т.п. Но ничего, кроме официальных пресс-релизов и переписки счастливых (?) обладателей с группой поддержки, я не встречал.

Иногда звучали на форумах робкие вопросы вроде «а как бы рута мне получить» или «попасть в GSA по ssh», но на все подобные вопросы ответ был один — только группа поддержки Google знает пароли. И никому не скажет. Удивительно, но я не встречал в интернете никаких попыток собрать «хакинтош» на движке Гугла, или по живому коду разобраться в алгоритме ранжирования страниц.

Ситуация слегка изменилась в 2008 году, когда на волне эйфории от виртуализации, Google выкатил VGSA – бесплатную виртуальную машину для Vmware с ограниченной до 50 тысяч документов лицензией. Впрочем, особого энтузиазма это в интернете не вызвало, в 2009 году проект был свернут и большинство ссылок в Гугле на VGSA стали возвращать 404 (заметьте – самим же Гуглом). Ссылку на релиз от 2008 года можно найти довольно легко. Ссылка на версию 2009 сохранилась лишь на паре китайских сайтов.

О том, как я поставил vgsa_20090210 на ESX 5.1, зашел рутом, снял ограничение на размер индекса и увидел много чего интересного с точки зрения СЕО, можно Читать полностью »

Анализ генома бактерий. Продолжение

2013-02-15 в 1:27, admin, рубрики: Алгоритмы, биоинформатика, генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция, метки: генетика, геномика, геномы, поисковые системы, происхождение видов, эволюция

В предыдущей статье, обсуждение получилось слишком крикливым. Но мы открыли свой сайт и там я переписал более взвешенно. Написанное там рекомендую прочитать, чтобы потом не жаловаться на сложность изложения. На самом деле нужен минимум информации для понимания. Я обещал написать продолжение о своем эксперименте, поэтому те кто заинтересовался проблематикой построения эволюционных деревьев — прошу под кат. Читать полностью »

Повышение эффективности работы в Google Chrome

2013-02-12 в 12:58, admin, рубрики: chromium, Google Chrome, адресная строка, браузеры, поиск, Поисковые машины и технологии, поисковые системы, эффективность, метки: chromium, Google Chrome, адресная строка, браузеры, поиск, поисковые системы, эффективность

Приветствую! Надеюсь, эта статья будет кому-нибудь полезна.

Многие знают о возможностях адресной строки Chrome, запоминающей поисковые системы различных сайтов. Однако эффективно ее использовать, думаю, умеют далеко не все.
Я сижу в интернете исключительно через этот браузер (дело вкуса и привычки, конечно) и использую кастомизированный поиск в Chrome по несколько десятков раз в день. Большое количество действий, ежедневно выполняемых через браузер, можно оптимизировать, добавив в список определенные поисковые системы.

Итак, кончаю муть, перехожу к «технической» и практической стороне дела.
Читать полностью »

Алгоритм определения естественности информационного всплеска

2013-02-10 в 17:44, admin, рубрики: Поисковые машины и технологии, поисковые системы, метки: поисковые системы

Прототип алгоритма определения происхождения информационного всплеска.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «поисковые системы» - 11

А есть ли альтернатива поисковым системам

Обработка и классификация запросов. Часть первая: парсер запросов

Иконочные шрифты для мобильных устройств

Чья морфология лучше? Яндекс vs Google

Поведенческие факторы ранжирования

Поведенческие факторы и с чем их едят

GSA: Препарируем Google Search Appliance в виртуальной машине

Анализ генома бактерий. Продолжение

Повышение эффективности работы в Google Chrome

Алгоритм определения естественности информационного всплеска

Прототип алгоритма определения происхождения информационного всплеска.

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «поисковые системы» - 11

Прототип алгоритма определения происхождения информационного всплеска.

Новости

Актуальные темы

Архив