Рубрика «поисковые системы» - 3

image

В 1998 году Лоуренс Пейдж, Сергей Брин, Раджив Мотвани и Терри Виноград опубликовали статью «The PageRank Citation Ranking: Bringing Order to the Web», в которой описали знаменитый теперь алгоритм PageRank, ставший фундаментом Google. Спустя чуть менее два десятка лет Google стал гигантом, и даже несмотря на то, что его алгоритм сильно эволюционировал, PageRank по-прежнему является «символом» алгоритмов ранжирования Google (хотя только немногие люди могут действительно сказать, какой вес он сегодня занимает в алгоритме).

С теоретической точки зрения интересно заметить, что одна из стандартных интерпретаций алгоритма PageRank основывается на простом, но фундаментальном понятии цепей Маркова. Из статьи мы увидим, что цепи Маркова — это мощные инструменты стохастического моделирования, которые могут быть полезны любому эксперту по аналитическим данным (data scientist). В частности, мы ответим на такие базовые вопросы: что такое цепи Маркова, какими хорошими свойствами они обладают, и что с их помощью можно делать?
Читать полностью »

Триллион маленьких шинглов - 1

Источник изображения:www.nikonsmallworld.com

Антиплагиат – это специализированный поисковик, о чем уже писали ранее. А любому поисковику, как ни крути, чтобы работать быстро, нужен свой индекс, который учитывает все особенности области поиска. В своей первой статье на Хабре я расскажу о текущей реализации нашего поискового индекса, истории его развития и причинах выбора того или иного решения. Эффективные алгоритмы на .NET — это не миф, а жесткая и продуктивная реальность. Мы погрузимся в мир хеширования, побитового сжатия и многоуровневых кешей с приоритетами. Что делать, если нужен поиск быстрее, чем за O(1)?

Если кто-то еще не знает, где на этой картинке шинглы, добро пожаловать…

Читать полностью »

В нескольких недавних постах обсуждался многообещающий и достаточно простой способ оценки качества поиска по продуктам с использованием намерений. Спешим представить открытый автоматизированный инструмент для такого рода тестирования — Intent-based Search Quality. Идея сводится к использованию заранее подготовленных «фокусированных» запросов, ценность которых заключается в их прямолинейности и однозначной интерпретации.

Первый релиз открытого инструмента для тестирования поиска по продуктам - 1

Если вас заинтересовал подход, обязательно обратите внимание на пост “Я намереваюсь купить” или самый простой способ оценить качество продуктового поиска. Переход от стандартного A/B тестирования к тестированию с использованием намерений может показаться не совсем очевидным.
Читать полностью »

Как маркетологи, работающие с Google, монетизируют наш дискомфорт - 1

Первая часть статьи

Сегодня три из четверых владельцев смартфона, когда у них возникает какая-нибудь потребность, требующая немедленного удовлетворения, первым делом обращаются к Google. Соответственно, работающие с Google маркетологи (в том числе и я) выживают за счет своего умения играть на вашем нетерпении и импульсивности, которые проявляются при использовании мобильного устройства. Мы должны быть тут как тут и подсунуть вам рекламное объявление точно в «микромомент» — то есть в ту секунду, когда вы решили прибегнуть к смартфону, чтобы устранить дискомфорт от невозможности что-то получить. Этим чем-то может быть что угодно — горящая распродажа, маршрут до магазина, который вот-вот закроется, информация о курсах, где количество места быстро расхватывают.

Как в простых выражениях объясняют представители Google: «Микромоменты — это мгновения, насыщенные намерением, когда принимаются решения и формируются предпочтения». Но такая формулировка не стыкуется с тем фактом, который они открыто высказать не могут: настрой «хочу прямо сейчас!» обычно порождает в нас неприятные чувства страха и тревоги. Когда вы что-нибудь присматриваете в подобном расположении духа (тут речь необязательно идет о товарах), эти эмоции подтачивают ваше самообладание. Ваша острая потребность — в информации, навигации, транзакции, неважно — начинает смешиваться с желанием как-то избавиться от тяжелого чувства.
Читать полностью »

Когда какого-нибудь ленивого журналиста осаждают мрачные предчувствия по поводу Алексы от Amazon или Google Home, он пишет что-то в духе: «Даже Оруэлл не мог предвидеть, что мы сами пригласим Большого Брата к себе домой». При этом он упускает один важный момент: виртуальные ассистенты — это не первый случай, когда мы оказались готовы променять приватность на удобство. Началось все еще в начале 2000-х, когда люди в обмен на доступ к продуктам Google и более таргетированную рекламу выложили компании всю информацию о себе.

Тёмная сторона поискового маркетинга: как и зачем Google собирает нашу личную информацию - 1

Сегодня Google поставляет маркетологам (например, мне) ваши личные данные в таких объемах, что мы можем извлечь из них больше, чем из записей с любой камеры или микрофона. Никогда еще у маркетологов вроде меня не было таких широких возможностей получить выгоду от информации о пользователях.

На текущий момент каждую секунду в Google поступает 40 000 поисковых запросов, то есть 3.5 миллиарда в день и 1.2 триллиона в год. Когда вы вбиваете что-то в Google, ваш запрос отправляется в центр данных, где тысяча компьютеров производят отбор результатов и отсылают вам обратно итоговую выдачу. Вся процедура обычно занимает меньше чем пятую долю секунды. Но вот о чем не подозревает большинство людей: параллельно с этим «за кулисами» происходит другой, еще более молниеносный и загадочный процесс — там разворачивается аукцион.
Читать полностью »

Вы знаете, сколько данных вы качаете из сети каждый раз, чтобы увидеть вот эту страничку?

Custom Google Search View - 1

Если без браузерного кэша, то 600 килобайт (в gzip-e) и 38 запросов. Если с кэшем, то 70 килобайт и 7-8 запросов.Читать полностью »

Микрофильм будет существовать половину тысячелетия - 1

Миллионы публикаций, не говоря уже о шпионских документах, можно прочитать на микрофильмах. Но люди по-прежнему считают эти устройства устаревшими и непривлекательными.
Читать полностью »

Каким был Интернет 1.0 до социальных сетей, пока не набежали широкие массы, дерущиеся за деньги и власть?

Сейчас другой Интернет. Время от времени появляются нововведения, решающие старые проблемы и добавляющие новые…
Одно из таких введений — GDPR, вступающий в действие в мае 2018-го.
Читать полностью »

Во всём мире несколько десятков миллионов наименований электронных компонентов. Для эффективной работы с таким количеством информации невозможно обойтись без специальных инструментов поиска. Поэтому, для того чтобы упростить связь между покупателем, продавцом и производителем, существуют так называемые «Поисковики электронных компонентов». В данный момент можно насчитать около двадцати подобных платформ как российских, так и иностранных.

В силу рода своей деятельности часто использую данные платформы для поиска и заказа компонентов. Сначала через параметрический поиск на digikey ищем нужный компонент, после через chipfind находим российского поставщика. Узнали себя? Если да, то эта статья для Вас.
Любители в основном пользуются платформами, которые хорошо разрекламированы, просто не зная о существовании возможности выбора. Специалисты же пользуются не одной, а целым набором. В этой статье постараюсь ответить на вопрос: почему не существует универсальной платформы для поиска электронных компонентов?
Читать полностью »

imageНа технологическом рынке «Яндекс» достаточно успешен, особенно по российским меркам: в мае 2011 года компания разместила свои бумаги в Нью-Йорке и привлекла $1,3 млрд. В июне 2014 года она была зарегистрирована на Московской бирже, а в последние годы открыла офисы в Китае, Франции, Германии, Нидерландах, Швейцарии и Турции.

Фото Alexander Zemlianichenko Jr. / Bloomberg via Getty Images

Корреспондент издания «Ведомости» долго беседовал с основателем и генеральным директором «Яндекса» Аркадием Воложем о последствиях конфликта с Google, о планах развития, о проблемах компании на Украине и многом другом. Geektimes приводит самые интересные цитаты из интервью.Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js