Оператор фискальных данных «Платформа ОДФ» намерена поставлять рекламной платформе Segmento обезличенные данные по всем проходящим в системе чекам, сообщил «Коммерсант». Обе компании — портфельные инвестиции государственного Сбербанка, уточнила газета. Среди партнёров первой так же есть УК «Атол» и другие собственники. Совладелец второйЧитать полностью »
Рубрика «big data» - 23
Проекты Сбербанка нацелят интернет-рекламу по магазинным чекам
2019-10-21 в 13:03, admin, рубрики: big data, O2O, Segmento, Интернет-реклама, персональные данные, Сбербанк, Текучка, торговля, электронный документооборот, метки: big data, O2O, Segmento, интернет-реклама, персональные данные, Сбербанк, Текучка, торговля, электронный документооборотVariational Inference — что это такое и с чем это едят?
2019-10-18 в 5:46, admin, рубрики: big data, Variational Autoencoder, Variational inference, Variational lower bound, Алгоритмы, искусственный интеллект, математика, машинное обучениеПривет!
Недавно пообщался с коллегами о вариационном автоэнкодере и выяснилось что многие даже работающие в Deep Learning знают о вариационном выводе (Variational Inference) и в частности Нижней вариационной границе только по наслышке и не до конца понимают что это такое.
В этой статье я хочу подробно разобрать эти вопросы. Кому интересено, прошу под кат — будет очень интересно.
Читать полностью »
AI-пицца: как мы использовали две рекуррентные нейросети
2019-10-16 в 15:24, admin, рубрики: big data, Dodo IS, Dodo Pizza, Dodo Pizza Engineering, food science and technology, foodtech, machine learning, neural networks, open source, Блог компании Dodo Pizza Engineering, искусственный интеллект, машинное обучениеТема нейросетей будоражит сердца разработчиков, учёных и маркетологов уже не первый год, а кого-то даже не первое десятилетие. Но все мы знаем, что частенько под проектами на основе нейронок прячется простая биг дата и маркетинговый булшит, раздутый на фоне кликбейтного заголовка. Мы постарались избежать такой истории и разработали проект нейропиццы, основанный на исследовании молекулярной сочетаемости ингредиентов, анализе 300 тыс. рецептов и чистого творчества. Под катом вы можете узнать детали и найти ссылку с открытым кодом на GitHub.
Может ли машина придумать что-то новое или она ограничена тем, что знает? Пока что никто не знает ответа на этот вопрос. Но уже сейчас искусственный интеллект отлично решает задачи анализа больших нестандартных данных.
Однажды в Dodo Pizza решили провести эксперимент: систематизировать и структурно описать то, что во всём мире считается хаотичным и субъективным – вкус. Искусственный интеллект, помог найти самые сумасшедшие сочетания ингредиентов, которые, несмотря на свою необычность, оказались вкусными для большинства людей.
Я и мой коллега выступили в качестве специалистов по нейросетям от МФТИ и Сколтеха в этом необычном проекте. Мы разработали и обучили нейросеть, способную решать задачу генерации кухонных рецептов. В ходе работы было проанализировано более 300 000 рецептов, а также результаты научных исследований на тему молекулярной сочетаемости ингредиентов. На основе этого ИИ научился находить неочевидные связи между ингредиентами и понимать, как они сочетаются между собой и как наличие каждого из них влияет на сочетаемость всех остальных.
Читать полностью »
Дайджест новостей машинного обучения и искусственного интеллекта за сентябрь
2019-10-15 в 15:44, admin, рубрики: big data, data mining, Блог компании Mail.Ru Group, будущее, дайджест, данные, искусственный интеллект, машинное обучение, НовостиПривет, читатели! Отфильтровав для вас большое количество источников и подписок — собрал все наиболее значимые новости из мира машинного обучения и искусственного интеллекта за сентябрь. Не забудьте поделиться с коллегами, или просто с теми, кому интересны такие новости.
Для тех, кто не читал дайджест за август, можете прочесть его здесь.
Итак, а теперь дайджест за сентябрь:
1. Ученые EPFL разработали мягкую искусственную кожу, которая обеспечивает тактильную обратную связь и — благодаря сложному механизму самочувствия — потенциально способна мгновенно адаптироваться к движениям пользователя.
Возможности языка Q и KDB+ на примере сервиса реального времени
2019-10-14 в 14:05, admin, рубрики: big data, kdb+, nosql, базы данных, Блог компании Технологический Центр Дойче Банка, хранилища данныхО том, что такое база KDB+, язык программирования Q, какие у них есть сильные и слабые стороны, можно прочитать в моей предыдущей статье и кратко во введении. В статье же мы реализуем на Q сервис, который будет обрабатывать входящий поток данных и высчитывать поминутно различные агрегирующие функции в режиме “реального времени” (т.е. будет успевать все посчитать до следующей порции данных). Главная особенность Q состоит в том, что это векторный язык, позволяющий оперировать не единичными объектами, а их массивами, массивами массивов и другими сложносоставными объектами. Такие языки как Q и родственные ему K, J, APL знамениты своей краткостью. Нередко программу, занимающую несколько экранов кода на привычном языке типа Java, можно записать на них в несколько строк. Именно это я и хочу продемонстрировать в этой статье.
Создаем датасет для распознавания счетчиков на Яндекс.Толоке
2019-10-11 в 11:00, admin, рубрики: big data, computer vision, data collection, data mining, Блог компании Open Data Science, краудсорсинг, машинное обучение, обработка изображений, разметка данных, толокаКак-то два года назад, случайно включив телевизор, я увидел интересный сюжет в программе "Вести". В нём рассказывали о том, что департамент информационных технологий Москвы создает нейросеть, которая будет считывать показания счетчиков воды по фотографиям. В сюжете телеведущий попросил горожан помочь проекту и прислать снимки своих счетчиков на портал mos.ru, чтобы на них обучить нейронную сеть.
Если Вы — департамент Москвы, то выпустить ролик на федеральном канале и попросить людей прислать изображения счетчиков — не очень большая проблема. Но что делать, если Вы — маленький стартап, и сделать рекламу на телеканале не можете? Как получить 50000 изображений счетчиков в таком случае?Читать полностью »
Обнаружение пересекающихся сообществ в Instagram для определения интересов пользователей
2019-10-09 в 8:32, admin, рубрики: big data, community detection, Instagram, snap, аналитика данных, Блог компании Dentsu Aegis Network, графы, Интернет-реклама, машинное обучение, медийная реклама, Социальные сети и сообществаСколько может рассказать о человеке профиль в соцсети? Фотографии, посты, комментарии, подписки – непаханное поле для анализа. Сегодня поговорим о том, как мы определяем интересы пользователей на основе их подписок в сети Instagram.

Сайзинг Elasticsearch
2019-10-08 в 16:10, admin, рубрики: big data, capacity management, capacity planning, elasticsearch, nosql, sizing, Блог компании Gals Software, Софт— How big a cluster do I need?
— Well, it depends… (злобное хихиканье)
Elasticsearch — сердце Elastic Stack, в котором происходит вся магия с документами: выдача, приём, обработка и хранение. От правильного количества нод и архитектуры решения зависит его производительность. И цена, кстати, тоже, если ваша подписка Gold или Platinum.
Основные характеристики аппаратного обеспечения — это диск (storage), память (memory), процессоры (compute) и сеть (network). Каждый из этих компонентов в ответе за действие, которое Elasticsearch выполняет над документами, это, соответственно, хранение, чтение, вычисления и приём/передача. Поговорим об общих принципах сайзинга и раскроем то самое «it depends». А в конце статьи ссылки на вебинары и статьи по теме. Поехали!
Читать полностью »
Мадагаскар — остров контрастов
2019-10-08 в 6:36, admin, рубрики: big data, vps, Блог компании ua-hosting.company, датацентр, интересные места планеты, Исследования и прогнозы в IT, Мадагаскар, серверы, хостингВстретив на одном из информационных порталов видео с заголовком примерного содержания «Скорость доступа к интернету на Мадагаскаре выше нежели во Франции, Канаде и Великобритании», чего скрывать я был искренне удивлен. Стоит лишь напомнить что островное государство Мадагаскар, в отличии от вышеупомянутых северных стран, географически находится на самом отшибе не слишком благополучного континента — Африка. В тоже время экономическая ситуация в стране ставит антирекорды, что также не дает объяснения столь интригующему утверждению о высоких достижении африканской республики в стандартах доступа к сети.
Родина тех самых «мемных» лемуров, чуть ли не единственное место в мире где до сих пор безуспешно борются с пандемией легочной чумы, страна удивительных баобабов, беспросветной нищеты и скоростного интернета? Верно ли это утверждение, или мы стали свидетелями еще одного примера «фейк ньюз». Далее в статье и попробуем разобраться как же обстоят дела с интернетом в островном Мадагаскаре.
Особенности национального распознавания образов
2019-10-04 в 15:36, admin, рубрики: big data, машинное обучение, мотоциклы, распознавание образов, Тестирование IT-систем, тракторы, транспорт«Когда я слышу про распознавание образов, я никогда не спрашиваю, хорошие там алгоритмы или плохие. Я спрашиваю только, отличают ли они мотоцикл от трактора.»
©