Рубрика «big data» - 59

Распознаванием лиц в 2018 году никого не удивишь – каждый студент, может, даже школьник, его делал. Но всё становится немного сложнее, когда у вас не датасет на 1 млн пользователей, а:

  • 330 миллионов пользовательских аккаунтов;
  • ежедневно заливается 20 млн пользовательских фотографий;
  • максимальное время на обработку одного фото не должно превышать 0.2 сек;
  • ограниченные объемы оборудования для решения задачи.

Щи, или Распознавание 330 млн лиц на скорости 400 фото - сек - 1

В этой статье мы поделимся опытом разработки и запуска системы распознавания лиц на пользовательских фотографиях в социальной сети Одноклассники и расскажем про все ”от А до Я”:

  • математический аппарат;
  • техническую реализацию;
  • результаты запуска;
  • и акцию StarFace, которую мы использовали для PR-а нашего решения.

Читать полностью »

Добра!

Слушатели первого курса «Разработчик BigData» вышли на финишную прямую — сегодня начался последний месяц, где выжившие займутся боевым выпускным проектом. Соответственно, открыли и набор на этот достаточно непростой курс. Поэтому давайте рассмотрим одну интересную статью-заметку по современным трендам в ИИ, которые тесно связаны с BD, ML и прочим.

Поехали.

Искусственный интеллект находится под пристальным вниманием глав правительств и бизнес-лидеров в качестве основного средства оценки верности решений. Но что происходит в лабораториях, где открытия академических и корпоративных исследователей будут устанавливать курс развития ИИ на следующие годы? Наша собственная команда исследователей из AI Accelerator от PwC нацелилась на ведущие разработки, за которыми следует внимательно следить как бизнес-лидерам, так и технологам. Вот что они из себя представляют и почему они так важны.

Топ-10 трендов технологий искусственного интеллекта (ИИ) в 2018 году - 1Читать полностью »

Привет! Задача снижения размерности является одной из важнейших в анализе данных и может возникнуть в двух следующих случаях. Во-первых, в целях визуализации: перед тем, как работать с многомерными данными, исследователю может быть полезно посмотреть на их структуру, уменьшив размерность и спроецировав их на двумерную или трехмерную плоскость. Во-вторых, понижение размерности полезно для предобработки признаков в моделях машинного обучения, поскольку зачастую неудобно обучать алгоритмы на сотне признаков, среди которых может быть множество зашумленных и/или линейно зависимых, от них нам, конечно, хотелось бы избавиться. Наконец, уменьшение размерности пространства значительно ускоряет обучение моделей, а все мы знаем, что время — это наш самый ценный ресурс.

UMAP (Uniform Manifold Approximation and Projection) — это новый алгоритм уменьшения размерности, библиотека с реализацией которого вышла совсем недавно. Авторы алгоритма считают, что UMAP способен бросить вызов современным моделям снижения размерности, в частности, t-SNE, который на сегодняшний день является наиболее популярным. По результатам их исследований, у UMAP нет ограничений на размерность исходного пространства признаков, которое необходимо уменьшить, он намного быстрее и более вычислительно эффективен, чем t-SNE, а также лучше справляется с задачей переноса глобальной структуры данных в новое, уменьшенное пространство.

В данной статье мы постараемся разобрать, что из себя представляет UMAP, как настраивать алгоритм, и, наконец, проверим, действительно ли он имеет преимущества перед t-SNE.

Обзор нового алгоритма уменьшения размерности UMAP. Действительно ли он лучше и быстрее, чем t-SNE? - 1
Читать полностью »

Менеджмент, тестирование и фронтенд позади, переходим к бекенду — секции-рекордсмену по количеству баззвордов.

image
Читать полностью »

30 марта 2018 г. Neurodata Lab LLC и НИУ ИТМО проводят однодневную конференцию в Санкт-Петербурге (мероприятие в Москве также запланировано на ближайшее будущее), посвященную индустрии Emotion AI, её особенностям и перспективам.

Регистрация доступна по ссылке.

Предварительный анонс приводится ниже, в теле публикации.

image
Читать полностью »

Привет!

Давайте вернемся к периодически затрагиваемой у нас теме машинного обучения и нейронных сетей. Сегодня речь пойдет об основных типах рекомендательных систем, их достоинствах и недостатках. Под катом — интересная статья Тоби Дейгла с кодом на Python,

Над катом — ссылка на большую презентацию нашего замечательного автора Сергея Николенко, чью книгу "Глубокое обучение. Погружение в мир нейронных сетей", написанную в соавторстве с Артуром Кадуриным и Екатериной Архангельской, мы просто не успеваем допечатывать. В презентации описаны основные типы рекомендательных систем и принципы их работы.

Читаем и комментируем!
Читать полностью »

Mail.Ru Group предcтавила рекламодателям новый тип таргетирования — по психотипам, говорится в сообщении компании. Компания определяет психотип пользователя по истории его действий в интернете и показывает ему соответствующую рекламу, разработанную именно для его психотипа.

Читать полностью »

29 января арбитражный апелляционный суд удовлетворил иск «ВКонтакте», обязав компанию Double Data, которая занимается созданием Big Data решений с помощью открытых данных, прекратить использовать данные пользователей соцсети. Во взыскании символической компенсации в размере 1 рубля истцу отказали. Об этом сообщают представители «Сколково», чьим резидентом является Double Data. В «Дабл» собираются обжаловать постановление апелляционной инстанции. Решение может быть оспорено в течение двух месяцев.

Читать полностью »

Сервис DaData.ru, напрямую работающий с Федеральной налоговой службой, помог Яндекс.Деньгам запустить статус-индикатор. Организация, чьи услуги оплачиваются по квитанции, теперь может получить в Яндекс.Деньгах одну из трёх автоматических подписей: «организация здорова», «в процессе ликвидации» или «ликвидирована» (Читать полностью »

«Яндекс» договорился о сотрудничестве с Тель-Авивским университетом (ТАУ), говорится в сообщении интернет-компании. Осенью в ТАУ откроется филиал Школы анализа данных. Благодаря этому образовательные программы «Яндекса» по машинному обучению и анализу данных станут доступны за пределами стран СНГ.

В филиале будут учиться один год. Программа обучения рассчитана на студентов, аспирантов и молодых специалистов, Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js