Рубрика «поисковые системы» - 3

Триллион маленьких шинглов - 1

Источник изображения:www.nikonsmallworld.com

Антиплагиат – это специализированный поисковик, о чем уже писали ранее. А любому поисковику, как ни крути, чтобы работать быстро, нужен свой индекс, который учитывает все особенности области поиска. В своей первой статье на Хабре я расскажу о текущей реализации нашего поискового индекса, истории его развития и причинах выбора того или иного решения. Эффективные алгоритмы на .NET — это не миф, а жесткая и продуктивная реальность. Мы погрузимся в мир хеширования, побитового сжатия и многоуровневых кешей с приоритетами. Что делать, если нужен поиск быстрее, чем за O(1)?

Если кто-то еще не знает, где на этой картинке шинглы, добро пожаловать…

Читать полностью »

В нескольких недавних постах обсуждался многообещающий и достаточно простой способ оценки качества поиска по продуктам с использованием намерений. Спешим представить открытый автоматизированный инструмент для такого рода тестирования — Intent-based Search Quality. Идея сводится к использованию заранее подготовленных «фокусированных» запросов, ценность которых заключается в их прямолинейности и однозначной интерпретации.

Первый релиз открытого инструмента для тестирования поиска по продуктам - 1

Если вас заинтересовал подход, обязательно обратите внимание на пост “Я намереваюсь купить” или самый простой способ оценить качество продуктового поиска. Переход от стандартного A/B тестирования к тестированию с использованием намерений может показаться не совсем очевидным.
Читать полностью »

Как маркетологи, работающие с Google, монетизируют наш дискомфорт - 1

Первая часть статьи

Сегодня три из четверых владельцев смартфона, когда у них возникает какая-нибудь потребность, требующая немедленного удовлетворения, первым делом обращаются к Google. Соответственно, работающие с Google маркетологи (в том числе и я) выживают за счет своего умения играть на вашем нетерпении и импульсивности, которые проявляются при использовании мобильного устройства. Мы должны быть тут как тут и подсунуть вам рекламное объявление точно в «микромомент» — то есть в ту секунду, когда вы решили прибегнуть к смартфону, чтобы устранить дискомфорт от невозможности что-то получить. Этим чем-то может быть что угодно — горящая распродажа, маршрут до магазина, который вот-вот закроется, информация о курсах, где количество места быстро расхватывают.

Как в простых выражениях объясняют представители Google: «Микромоменты — это мгновения, насыщенные намерением, когда принимаются решения и формируются предпочтения». Но такая формулировка не стыкуется с тем фактом, который они открыто высказать не могут: настрой «хочу прямо сейчас!» обычно порождает в нас неприятные чувства страха и тревоги. Когда вы что-нибудь присматриваете в подобном расположении духа (тут речь необязательно идет о товарах), эти эмоции подтачивают ваше самообладание. Ваша острая потребность — в информации, навигации, транзакции, неважно — начинает смешиваться с желанием как-то избавиться от тяжелого чувства.
Читать полностью »

Когда какого-нибудь ленивого журналиста осаждают мрачные предчувствия по поводу Алексы от Amazon или Google Home, он пишет что-то в духе: «Даже Оруэлл не мог предвидеть, что мы сами пригласим Большого Брата к себе домой». При этом он упускает один важный момент: виртуальные ассистенты — это не первый случай, когда мы оказались готовы променять приватность на удобство. Началось все еще в начале 2000-х, когда люди в обмен на доступ к продуктам Google и более таргетированную рекламу выложили компании всю информацию о себе.

Тёмная сторона поискового маркетинга: как и зачем Google собирает нашу личную информацию - 1

Сегодня Google поставляет маркетологам (например, мне) ваши личные данные в таких объемах, что мы можем извлечь из них больше, чем из записей с любой камеры или микрофона. Никогда еще у маркетологов вроде меня не было таких широких возможностей получить выгоду от информации о пользователях.

На текущий момент каждую секунду в Google поступает 40 000 поисковых запросов, то есть 3.5 миллиарда в день и 1.2 триллиона в год. Когда вы вбиваете что-то в Google, ваш запрос отправляется в центр данных, где тысяча компьютеров производят отбор результатов и отсылают вам обратно итоговую выдачу. Вся процедура обычно занимает меньше чем пятую долю секунды. Но вот о чем не подозревает большинство людей: параллельно с этим «за кулисами» происходит другой, еще более молниеносный и загадочный процесс — там разворачивается аукцион.
Читать полностью »

Вы знаете, сколько данных вы качаете из сети каждый раз, чтобы увидеть вот эту страничку?

Custom Google Search View - 1

Если без браузерного кэша, то 600 килобайт (в gzip-e) и 38 запросов. Если с кэшем, то 70 килобайт и 7-8 запросов.Читать полностью »

Микрофильм будет существовать половину тысячелетия - 1

Миллионы публикаций, не говоря уже о шпионских документах, можно прочитать на микрофильмах. Но люди по-прежнему считают эти устройства устаревшими и непривлекательными.
Читать полностью »

Каким был Интернет 1.0 до социальных сетей, пока не набежали широкие массы, дерущиеся за деньги и власть?

Сейчас другой Интернет. Время от времени появляются нововведения, решающие старые проблемы и добавляющие новые…
Одно из таких введений — GDPR, вступающий в действие в мае 2018-го.
Читать полностью »

Во всём мире несколько десятков миллионов наименований электронных компонентов. Для эффективной работы с таким количеством информации невозможно обойтись без специальных инструментов поиска. Поэтому, для того чтобы упростить связь между покупателем, продавцом и производителем, существуют так называемые «Поисковики электронных компонентов». В данный момент можно насчитать около двадцати подобных платформ как российских, так и иностранных.

В силу рода своей деятельности часто использую данные платформы для поиска и заказа компонентов. Сначала через параметрический поиск на digikey ищем нужный компонент, после через chipfind находим российского поставщика. Узнали себя? Если да, то эта статья для Вас.
Любители в основном пользуются платформами, которые хорошо разрекламированы, просто не зная о существовании возможности выбора. Специалисты же пользуются не одной, а целым набором. В этой статье постараюсь ответить на вопрос: почему не существует универсальной платформы для поиска электронных компонентов?
Читать полностью »

imageНа технологическом рынке «Яндекс» достаточно успешен, особенно по российским меркам: в мае 2011 года компания разместила свои бумаги в Нью-Йорке и привлекла $1,3 млрд. В июне 2014 года она была зарегистрирована на Московской бирже, а в последние годы открыла офисы в Китае, Франции, Германии, Нидерландах, Швейцарии и Турции.

Фото Alexander Zemlianichenko Jr. / Bloomberg via Getty Images

Корреспондент издания «Ведомости» долго беседовал с основателем и генеральным директором «Яндекса» Аркадием Воложем о последствиях конфликта с Google, о планах развития, о проблемах компании на Украине и многом другом. Geektimes приводит самые интересные цитаты из интервью.Читать полностью »

Государственная поисковая система «Спутник», созданная за $20 млн, находится на грани закрытия - 1
К сожалению, «Спутник» не взлетел

На Geektimes не раз писали о поисковой системе «Спутник», которую несколько лет назад запустил «Ростелеком». Этот государственный поисковик начал работать в 2014 году, но за три года он так и не стал популярным. Несмотря на то, что ориентирован «Спутник» на русскоязычный сегмент интернета, он не занимает и 1% поискового рынка. В то время, как переходы с Google и «Яндекса» на другие сайты исчисляются миллиардами, у «Спутника» этот показатель лишь немного превышает 100 тыс. В итоге проект либо закроют, либо перепрофилируют, решение по этому вопросу пока не принято пишут «Ведомости».

«Спутник» могут переориентировать на работу с большими данными. Со словам собеседников «Ведомостей», это один из вариантов развития событий, точного понимания того, как можно переориентировать систему, еще нет. С другой стороны, этот поисковый сервис вряд ли будет закрыт — на это не решатся его создатели, поскольку «Спутник» позиционировался как ресурс национального масштаба.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js