Рубрика «поисковые технологии» - 22

На пути к простоте: как сложно она дается разработчикам

2016-08-30 в 10:24, admin, рубрики: IP-видеонаблюдение, macroscop, видеоанализ, видеоаналитика, макроскоп, межкамерный трекинг, поисковые алгоритмы, поисковые технологии, Программирование, простота, Работа с видео, разработка, разработчик по

«Сила простоты» — эта фраза все чаще звучит в комнатах разработчиков Macroscop во время планирования версий. Сейчас мы как никогда сфокусированы на простоте продукта, включении в него только того, что реально нужно пользователям, и удалении всего мало востребованного.

Удивительно, но сделать продукт простым для пользователя очень сложно. Мы поняли это на собственном опыте, когда столкнулись с вопросами, на которые не нашли однозначного ответа:
• что важнее, простота или функциональность?
• до какой степени нужно и можно упрощать продукт?
• и на кого ориентироваться в конечном счете при внесении изменений?

Простота – это сложно

Конечно, нам всегда было ясно, что продукт надо делать простым для пользователя. Это подтверждается и здравым смыслом, и опытом успешных компаний из самых разных областей.

Посмотрите, например, на Dropbox. Однажды гендиректор Macroscop Артем Разумков пообщался с одним из создателей этого сервиса. Тот рассказал, что идея хранения файлов в облаке была известна давно, и для этого надо было нажать на кнопку только 1 раз – загрузить файл. То, что придумали они – это просто переход от одного нажатию к нулю нажатий: человек просто помещает файл в обычную папку, и он загружается в облако автоматически. Кнопку «загрузить» вообще не надо нажимать! Эта простая идея перехода от 1 нажатия к 0 нажатий позволила им взлететь до невероятных высот. Вот она сила простоты!
Читать полностью »

Яндекс.Толока. Как люди помогают обучать машинный интеллект

2016-07-20 в 14:48, admin, рубрики: Анализ и проектирование систем, бета-тестирование, Блог компании Яндекс, дизайн, искусственный интеллект, краудсорсинг, машинное обучение, поисковые технологии, толока, метки: толока

Вот уже полтора года в Яндексе для совершенствования поисковых алгоритмов и технологий машинного интеллекта применяется платформа Толока. Может показаться удивительным, но все современные технологии машинного обучения в той или иной степени нуждаются в человеческих оценках.

Люди оценивают релевантность эталонных документов поисковым запросам, чтобы на них ориентировались формулы ранжирования в поиске; люди переписывают аудиозаписи в текст, чтобы на этих данных настроился алгоритм голосового распознавания; люди размечают изображения по категориям, чтобы, натренировавшись на этих примерах, нейронная сеть дальше делала это без людей и лучше людей.

Все это можно делать в Толоке, которая является краудсорсинговой платформой и помогает найти тех, кто решит вашу задачу. Сегодня она переходит в статус беты и отныне открыта для всех внешних заказчиков. Так что пришло время рассказать вам подробно о самой платформе и о том, с какими неожиданными сложностями мы сталкивались в процессе работы над ней, поделимся своими наблюдениями и объясним, как Толока может помочь именно вам.
Читать полностью »

Типографируем названия организаций

2016-07-14 в 10:38, admin, рубрики: antiPe, bautyCo, javascript, regexp, поисковые технологии, Регулярные выражения, типографика, хранение данных

Любые благородные начинания UI-дизайнера и верстальщика хоть как-то навести порядок в списках названий организаций разбивается о копи/паст неграмотного пользователя. Так ли всё плохо и можем ли мы чем-нибудь им помочь? Попробуем разобраться…

Читать полностью »

Создание поиска по библиотеке юным программистом — каково это?

2016-06-23 в 7:12, admin, рубрики: ABBYY, android, ocr, ruby on rails, библиотека, нечеткий поиск, Никита Куликов, оцифровка библиотеки, поисковые технологии, Разработка под android, школьный проект

На днях наткнулся на публикацию моего ровесника, и она побудила меня написать и свою историю о своем проекте, который абсолютно так же не помог, а только помешал поступлению в ВУЗ.

Вступление

В один прекрасный денек я зашёл в библиотеку за одним рассказом. Сказав название и автора рассказа библиотекарю, получил стопку сборников данного автора. Для того чтобы найти среди всего этого многообразия нужный рассказ, пришлось перебрать все произведения. Намного легче было бы «загуглить» нужное произведение и получить желаемое в несколько кликов.
Читать полностью »

Поиск по Postgres с использованием ZomboDb и elasticsearch

2016-06-21 в 8:33, admin, рубрики: elasticsearch, postgresql, zombodb, Администрирование баз данных, поисковые технологии

В какой-то момент разработки проекта встал вопрос поиска по большому количеству текстов. Причем, тексты имеют различную длину: от твиттов до больших статей. Сначала, основным поисковым движком был выбран встроенный в Postgres _tsvector. Для поиска по простым правилам его было вполне достаточно. Массив текстов рос с большой скоростью, а правила поиска усложнялись, поэтому встроенный движок уже не покрывал требований.

Да, существует sphinx, у него есть отличная интеграция с Postgres, но была цель найти решение для использования elasticsearch с Postgres. Почему? elasticsearch показывал хорошие результаты в некоторых case-ах проекта. Да и уже был сервер с ним для хранения логов logstash-а. Также было желание найти такой инструмент, который полностью возьмет на себя синхронизацию данных.

В результате всего на просторах сети был найден проект ZomboDb, который как раз подходил под требования.Читать полностью »

Метрики качества ранжирования

2016-06-16 в 15:25, admin, рубрики: Алгоритмы, Блог компании E-Contenta, введение, математика, машинное обучение, оценка качества, поисковые технологии, ранжирование

В процессе подготовки задачи для вступительного испытания на летнюю школу GoTo, мы обнаружили, что на русском языке практически отсутствует качественное описание основных метрик ранжирования (задача касалась частного случая задачи ранжирования — построения рекомендательного алгоритма). Мы в E-Contenta активно используем различные метрики ранжирования, поэтому решили исправить это недоразуменее, написав эту статью.

Читать полностью »

Будущее компьютерных технологий: обзор современных трендов

2016-06-15 в 13:16, admin, рубрики: AR, VR, Блог компании Plarium, будущее компьютерных технологий, виртуализация, виртуальная реальность, дополненная реальность, Интернет вещей, искусственный интеллект, компьютерные технологии, компьютеры, компьютеры тренды, машинное обучение, поисковые технологии, распределенные системы, тренды, тренды будущего, метки: будущее компьютерных технологий

Будущее компьютерных технологий: обзор современных трендов - 1

Сфера информационных технологий развивается в двух преимущественно независимых циклах: продуктовом и финансовом. В последнее время не утихают споры о том, на каком этапе финансового цикла мы находимся; очень много внимания уделяется финансовым рынкам, которые подчас ведут себя непредсказуемо и сильно колеблются. С другой стороны, продуктовым циклам достается относительно мало внимания, хотя именно они двигают информационные технологии вперед. Но, анализируя опыт прошлого, можно попытаться понять текущий продуктовый цикл и предугадать дальнейшее развитие технологий.

Читать полностью »

Что такое SEO и как оно работает

2016-06-01 в 17:10, admin, рубрики: seo, поисковые технологии, продвижение сайта

“Здравствуйте, Оксана! Несмотря на сложную ситуацию с алгоритмами ранжирования (многие сайты, которые неправильно продвигались, забанили), удается удерживать позиции в Топ10 Яндекс по 75% запросов и в Гугле по 77%”.

Что такое SEO и как оно работает - 1
Это цитата из письма, которое специалист по SEO высылал одному из моих клиентов.
На мой взгляд, эта цитата и этот частный пример очень хорошо демонстрируют ситуацию в целом, сложившуюся сейчас в России:

эта ситуация неустойчивая, рынок лихорадит
SEO-специалист не может контролировать ситуацию
пользователь, который за это платит, ничего не понимает в вопросах SEO

Почему возникла такая ситуация? Читать полностью »

Google I-O Extended 2016

2016-05-12 в 13:58, admin, рубрики: api, Extended 2016, Google API, google i/o, Блог компании Google, конференция, поисковые технологии, Программирование

Привет! 18-20 мая 2016 года в Маунтин Вью, Калифорния, пройдет юбилейная, десятая по счету конференция Google I/O, посвященная самым актуальным передовым трендам в технологиях и программном обеспечении от Google.

Лететь через пол мира на одну конференцию — удовольствие то ещё, да и если всех желающих собрать — никаких конференц-холлов не хватит. Поэтому мы рады вам сообщить, что Google I/O будет проходить и в самых крупных городах России.

Google I/O Extended — уникальная возможность стать участником одного из самых крупных слётов любителей Google-технологий. Всё будет происходить в онлайн-режиме, так что вы сможете вместе с представителями GDG в Маунтин Вью наблюдать за ежегодной презентацией самых крутых новинок в IT мире! Сейчас I/O Extended включает более 550 ивентов в 94 странах на 6 континентах и охватывает всю планету.

Читать полностью »

Чем заменить ELK для просмотра логов?

2016-05-05 в 15:24, admin, рубрики: elasticsearch, kibana, logging, python, RabbitMQ, sphinx, sphinxsearch, поисковые технологии

Что обычно делает python-программист, когда его отправляют воевать с ошибкой?
Сначала он лезет в sentry. Здесь можно найти время, сервер, подробности сообщения об ошибке, traceback и, может быть, какой-нибудь полезный контекст. Затем, если этих данных недостаточно, программист идет ~~c бутылкой~~ к админам. Те залезают на сервер, ищут это сообщение в файловых логах, и, может быть, находят его и некоторые предшествующие ошибке записи, которые ~~в редких случаях~~ могут помочь в расследовании.
А что делать, если в логах только loglevel=ERROR, а ошибка настолько крута, что ее локализация требует сопоставления логики поведения нескольких различных демонов, которые запущены на десятке серверов?

Решение — централизованное хранилище логов. В самом простом случае — syslog (за 5 лет, что был развернут в rutube, не использовался ни разу), для более сложных целей — ELK. Скажу честно, "ластик" — крут, и позволяет быстро крутить разнообразную аналитику, но вы интерфейс Kibana видели? Этой штуке так же далеко до консольных less/grep, как винде до линукса. Поэтому мы решили сделать свой велосипед, без Java и Node.js, зато с sphinxsearch и Python.

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «поисковые технологии» - 22

На пути к простоте: как сложно она дается разработчикам

Простота – это сложно

Яндекс.Толока. Как люди помогают обучать машинный интеллект

Типографируем названия организаций

Создание поиска по библиотеке юным программистом — каково это?

Вступление

Поиск по Postgres с использованием ZomboDb и elasticsearch

Метрики качества ранжирования

Будущее компьютерных технологий: обзор современных трендов

Что такое SEO и как оно работает

Google I-O Extended 2016

Чем заменить ELK для просмотра логов?

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «поисковые технологии» - 22

Простота – это сложно

Вступление

Новости

Актуальные темы

Архив