В процессе подготовки задачи для вступительного испытания на летнюю школу GoTo, мы обнаружили, что на русском языке практически отсутствует качественное описание основных метрик ранжирования (задача касалась частного случая задачи ранжирования — построения рекомендательного алгоритма). Мы в E-Contenta активно используем различные метрики ранжирования, поэтому решили исправить это недоразуменее, написав эту статью.
Рубрика «ранжирование» - 2
Метрики качества ранжирования
2016-06-16 в 15:25, admin, рубрики: Алгоритмы, Блог компании E-Contenta, введение, математика, машинное обучение, оценка качества, поисковые технологии, ранжированиеПуть лапласиана. Часть 2
2016-04-29 в 14:56, admin, рубрики: Алгоритмы, математика, матрица лапласиана, площадь четырехугольника, поиск пути в графе, потенциалы, ранжированиеА не замахнуться ли нам на Эдсгера нашего Дейкстру?
В первой части мы описали способ ранжирования симметрично связанных объектов (узлов неориентированного графа) относительно заданного направления. Для каждого объекта (узла) вычисляется потенциал (лапласиана), который определяет его положение относительно заданных источника и цели. В данной статье мы покажем, как потенциалы узлов упрощают задачу поиска кратчайших путей (оптимальных маршрутов). А также как меняются сами потенциалы при изменении внешних условий.
В общем случае минимизируемая величина — это необязательно расстояние, — весами ребер графа могут быть стоимости, штрафы, убытки, времена, — любые величины, которые можно складывать. Задача является классической, наиболее простой алгоритм поиска кратчайшего пути дал Э. Дейкстра аж в 1959 году.
Читать полностью »
Как получать естественные обратные ссылки?
2016-04-28 в 18:31, admin, рубрики: content management, Google, linkbuilding, Yandex, веб-аналитика, интернет-маркетинг, контент-маркетинг, линкбилдинг, Медиа, обратные ссылки, ранжирование, управление проектами, метки: content management, content marketing, linkbuilding, линкбилдингКогда у вас есть продукт, проект, сервис или приложение, вы хотите, чтобы люди о вас узнали. У вас много способов этого добиться, в том числе – заинтересовать других рассказать о вас. Если вам повезёт, на вас появятся естественные ссылки – не только самый логичный вариант, но и, с относительно недавних пор, он является требованием Google, который научился отличать естественные ссылки от покупных. Яндекс, по крайней мере на словах, хотел бы от нас того же. В этой связи интересно: как выглядит цивилизованная практика получения естественных обратных ссылок?
В поисках пути — царь Салтан осваивает лапласиан
2016-04-22 в 14:04, admin, рубрики: Алгоритмы, марковские сети, математика, матрица лапласиана, поиск пути в графе, потенциалы, ранжирование… Молвит он: «Коль жив я буду, чудный остров навещу, у Гвидона погощу».
В царстве Салтана не без изьяна. Принят закон — не лезть за кордон, да тут князь Гвидон.
Опять прислал поклон, да приглашение на угощение,- надо принимать политическое решение.
Дворцовые интриганки, похожие на поганки, встали стеной — «мол, скажи, что больной». Но прослышал Салтан про Гвидонов кальян, про изумрудную белку, да богатырскую стрелку. А главная новинка — молодая жинка. В общем, ехать решено — «Я не был за морем давно».
Было однако одна проблема,- нужен был маршрут или схема. Поскольку никто (кроме Врангеля барона) не знал, как добраться до острова Гвидона. Корабельщики дали карту,- пришлось сесть за парту. Над картой склонился Салтан, — где тут остров Буян? Задача была как будто знакома — проложить путь к острову Гвидона. Но как найти дорогу, когда путей слишком много?
До ночи решал Салтан задачку, в итоге свалился в спячку. Снились ему матрицы и точки, да на болоте кочки. На кочку прыгнул Нео с острова Борнео.
— Если хочешь добраться ко сроку — плыви по максимальному потоку.
— Чего? — Салтан почти проснулся. Но Нео уже в зайца обернулся.
Читать полностью »
Сказ царя Салтана о потенциале лапласиана
2016-04-01 в 15:09, admin, рубрики: Алгоритмы, баланс, математика, матрица лапласиана, потенциалы, ранжирование, рейтинги, уравнение непрерывности«Три девицы под окном пряли поздно вечерком.»
Ну как пряли. Не пряли, конечно, а лайкали друг на друга. По условиям конкурса «мисс Салтан» девицы должны были выбрать меж собой лучшую.
«Какой-то странный конкурс», — беспокоились девицы. И это было правдой. По правилам конкурса вес лайка участника зависел от того, сколько лайков он получает от других. Что это значит, — никто из девиц до конца не понимал.
«Как все сложно», — тосковали девушки и подбадривали себя песней «Кабы я была царицей».
Вскоре «в светлицу вошел царь — стороны той государь» (показан на рисунке). «Во все время разговора...», — ну понятно в общем.
«Собираем лайки нежности — формируем матрицу смежности», — бодро срифмовал он.
Девицы-красавицы с именами Алена, Варвара и Софья засмущались, но лайки (из балалайки) передали.
Вот что там было:
- Алена получила 1 лайк от Софьи и 2 лайка от Варвары.
- Варвара получила по лайку от Алены и Софьи.
- А Софья получила 2 лайка от Алены и 1 от Варвары.
Царь взял лайки, покрутил гайки, постучал по колесам, пошмыгал носом, причмокнул губами, поскрипел зубами, сгонял в палаты и объявил результаты.
Наибольший вес лайков (7 баллов) получила Софья, но титул «мисс Салтан» достался Алене (15 баллов).
вектор потенциалов равен (5, 4, 7), а вектор потоков — (15, 12, 14).
После объявления результатов девицы бросились обратились к царю с просьбой рассказать,- откуда взялись эти странные цифры?
Читать полностью »
Революция машинного обучения: общие принципы и влияние на SEO
2016-02-12 в 8:05, admin, рубрики: Google, machine learning, seo, машинное обучение, поисковая оптимизация, поисковые системы, поисковые технологии, ранжирование, спамПредлагаю вашему вниманию перевод статьи "Революция машинного обучения" за авторством Эрика Энжа (Eric Enge).
Машинное обучение уже само по себе является серьезной дисциплиной. Оно активно используется вокруг нас, причем в гораздо более серьезных масштабах, чем вы можете себе представить. Несколько месяцев назад я решил углубиться в эту тему, чтобы узнать о ней больше. В этой статье я расскажу о некоторых базовых принципах машинного обучения, а также поделюсь своими рассуждениями по поводу его влияния на SEO и digital-маркетинг.
Для справки, рекомендую посмотреть презентацию Рэнда Фишкина «SEO in a Two Algorithm World», где Рэнд подробно рассматривает влияние машинного обучения на поиск и SEO. К этой теме я еще вернусь.
Я также упомяну сервис, который позволяет спрогнозировать шансы ретвита вашего поста на основании следующих параметров: показатель Followerwonk Social Authority, наличие изображений, хэштегов и некоторых других факторов. Я назвал этот сервис Twitter Engagement Predictor (TEP). Чтобы разработать такую систему мне понадобилось создать и обучить нейронную сеть. Вы указываете исходные параметры твита, сервис обрабатывает их и прогнозирует шансы ретвита.
Читать полностью »
Как отличить сайт с копипастами от сайта-интегратора?
2016-01-29 в 11:20, admin, рубрики: веб-аналитика, поисковая выдача, поисковая оптимизация, ранжированиеПрочитал намедни статью про сайты-копипасты и их выдачу Яндексом, и задумался… Где же должна проходить грань между оригинальными страницами и «копипастами»? Как говорится, с точки зрения теории, теория и практика — одно и то же, да вот на практике это далеко не так. Поэтому я и решил поделиться своим скромным опытом реализации проекта сайта, не содержавшего ни единого «кусочка отсебятины». Читать полностью »
Десять популярных SEO – мифов о продвижении в Google
2016-01-27 в 10:48, admin, рубрики: panda, seo, Веб-разработка, индексирование сайта, Мобильный веб, ошибка 404, ранжирование, сниппетыПривет!
При продвижении сайтов в Google в среде веб-мастеров возникли и утвердились несколько SEO – мифов и заблуждений.
Причины — отсутствие информации или подтверждений от первоисточника (Google); невнимательное прочтение или неправильное понимание справочной информации.
Читать полностью »
Яндекс поощряет копипаст. Или почему упал Яндекс?
2016-01-21 в 12:41, admin, рубрики: веб-аналитика, первая публикация, пессимизация, поисковая выдача, поисковая оптимизация, поисковый рынок, поисковый трафик, приоритет публикации, ранжирование, яндекс
Можно, конечно, было написать иначе. Яндекс поощряет воров. Или Яндекс поощряет сайты-помойки. Но будем корректны.
По факту, сейчас в поисковой выдаче Яндекса найти первоисточник, первую публикацию фактически невозможно. Вместо первой публикации, в выдаче Яндекса копии.
Происходит это вопреки утверждению Яндекса, что он наказывает сайты «Исключение из поиска страниц сайта, понижение в результатах поиска, аннулирование тИЦ», сайты «которые содержат неоригинальный, вторичный… контент»
В реальности, в поисковой выдаче более 60% — станицы с неоригинальным и вторичным контентом.
Читать полностью »
Топ 4 фактора ранжирования мобильных сайтов поисковой системы Google
2015-11-16 в 16:32, admin, рубрики: Аналитика мобильных приложений, Блог компании BYYD, веб-аналитика, гугл, интернет-маркетинг, оптимизация сайтов, поисковая оптимизация, поисковые системы, ранжированиеМаркетологи, задумайтесь, насколько мобильная версия вашего сайта легка для восприятия пользователем? И адаптивен ли он вообще?
Сейчас ни для кого уже не секрет что Гугл контролирует онлайн-мир. Проникновение глобального поиска в нашу обыденную жизнь на текущий момент составляет более 60%. Поэтому вполне объяснимо, когда поисковой гигант сообщает о новшествах и апдейтах для маркетологов, вторые слушают, открыв рты и внимания каждому слову лучших из лучших. Начиная с 21 апреля текущего года Гугл стал активно изменять политику своего ранжирования для мобильных пользователей в пользу сайтов с дружественным и адаптивным мобильным контентом.Читать полностью »