Две недели назад закончился проходивший в офисе Mail.Ru Group хакатон для студентов SmartMailHack. На хакатоне предлагался выбор из трех задач; статья от победителей во второй задаче уже есть на хабре, я же хочу описать решение нашей команды, победившей в первой задаче. Все примеры кода будут на Python & Keras (популярный фреймворк для deep learning).
Рубрика «cnn» - 3
SmartMailHack. Решение 1-го места в задаче классификации логотипов
2018-05-06 в 19:29, admin, рубрики: cnn, data mining, deep learning, machine learning, python, классификация изображений, машинное обучение, хакатонМожно ли научить искусственный интеллект шутить?
2018-03-19 в 7:12, admin, рубрики: big data, cnn, computer vision, deep learning, funcorp, machine learning, Алгоритмы, Блог компании FunCorp, глубокое обучение, машинное обучение, нейронные сети, обработка изображенийВ последнее время машины одержали ряд убедительных побед над людьми: они уже лучше играют в го, шахматы и даже в Dota 2. Алгоритмы сочиняют музыку и пишут стихи. Учёные и предприниматели всего мира дают прогнозы по поводу будущего, в котором искусственный интеллект сильно превзойдёт человека. С большой вероятностью через несколько десятков лет мы будем жить в мире, в котором роботы не только водят автомобили и работают на заводах, но и развлекают нас. Одна из важных составляющих нашей жизни — юмор. Принято считать, что только человек может придумывать шутки. Несмотря на это, многие ученые, инженеры и даже простые обыватели задаются вопросом: можно ли научить компьютер шутить?
Компания Gentleminds, разработчик систем машинного обучения и компьютерного зрения, совместно с FunCorp попробовали создать генератор весёлых подписей к картинкам, используя базу мемов iFunny. Поскольку приложение англоязычное и используется преимущественно в США, подписи будут на английском. Подробности под катом.
Читать полностью »
Щи, или Распознавание 330 млн лиц на скорости 400 фото – сек
2018-03-06 в 21:09, admin, рубрики: big data, cnn, data mining, face detection, face recognition, highload, Блог компании Одноклассники, машинное обучение, обработка изображенийРаспознаванием лиц в 2018 году никого не удивишь – каждый студент, может, даже школьник, его делал. Но всё становится немного сложнее, когда у вас не датасет на 1 млн пользователей, а:
- 330 миллионов пользовательских аккаунтов;
- ежедневно заливается 20 млн пользовательских фотографий;
- максимальное время на обработку одного фото не должно превышать 0.2 сек;
- ограниченные объемы оборудования для решения задачи.
В этой статье мы поделимся опытом разработки и запуска системы распознавания лиц на пользовательских фотографиях в социальной сети Одноклассники и расскажем про все ”от А до Я”:
- математический аппарат;
- техническую реализацию;
- результаты запуска;
- и акцию StarFace, которую мы использовали для PR-а нашего решения.
Журналисты не смогут проигнорировать первый сериал Apple — он про журналистов
2017-11-09 в 8:00, admin, рубрики: apple, cnn, nbc, PR, кино, Медиа, платный контент, Стратегия, Текучка, эффективность бизнеса, метки: apple, CNN, nbc, PR, кино, медиа, онлайн видео, платный контент, Стратегия, Текучка, эффективность бизнесаApple заказала съёмки двух сезонов сериала про американских телевизионщиков, сообщил Hollywood Reporter. В проекте снимутся Дженнифер Энистон и Риз Уизерспун, причём последняя выступит и продюсером серий (она уже пробовала себя в этой профессии на съёмках достаточно успешного сериала «Читать полностью »
Конкурс Topcoder «Konica-Minolta Pathological Image Segmentation Challenge». Заметки участника
2017-10-26 в 12:04, admin, рубрики: cnn, Topcoder, Алгоритмы, Блог компании Avito, Компьютерное зрение, конкурс, машинное обучение, нейросети, обработка изображений, обучение нейронных сетей, сегментация изображенийПривет! Пока мы ждём субботу и Avito Data Science Meetup: Computer Vision, расскажу вам про моё участие в соревновании по машинному обучению KONICA MINOLTA Pathological Image Segmentation Challenge. Хотя я уделил этому всего несколько дней, мне повезло занять 2 место. Описание решения и детективная история под катом.
Нейросеть выполняет 3D-реконструкцию лица по фотографии
2017-09-28 в 10:40, admin, рубрики: cnn, open source, VRN, Демосцена, искусственный интеллект, Софт, Фототехника
Некоторые результаты применения метода VRN — Guided на изображениях из набора AFLW2000-3D
В интернете есть ряд стартапов, в том числе российские, которые занимаются восстановлением 3D-структуры лица по фотографиям. Например, VisionLabs со своим приложением Face.DJ умеет выполнять 3D-реконструкцию по единственной фотографии. Такая трансформация (3D-моделирование по фото) имеет практический смысл. После создания модели появляется возможность, например, изменить причёску, примерить очки, отрастить бороду и т. д. Технология может использоваться в системах проверки и распознавания лиц.
Но теперь бизнес подобных стартапов под угрозой: их работу легко выполняет новая нейросеть VRN (Volumetric Regression Network), которую выложили в открытый доступ на GitHub. Прямо на сайт вы можете загрузить свою или любую другую фотографию — и нейросеть осуществит преобразование в онлайне за несколько секунд (демо).
Читать полностью »
Kaggle: как наши сеточки считали морских львов на Алеутских островах
2017-09-18 в 11:19, admin, рубрики: cnn, computer vision, deep learning, kaggle, machine learning, ods, open data science, python, Алгоритмы, Блог компании Open Data Science, глубокое обучение, машинное обучение, нейронные сети, обработка изображенийПривет, Коллеги!
27 июня закончилось соревнование на Kaggle по подсчёту морских львов (сивучей) на аэрофотоснимках NOAA Fisheries Steller Sea Lions Population Count. В нем состязались 385 команд. Хочу поделиться с вами историей нашего участия в челлендже и (почти) победой в нём.
Как сделать проект по распознаванию рукописных цифр с дообучением онлайн. Гайд для не совсем начинающих
2017-08-25 в 11:04, admin, рубрики: cnn, data mining, deep learning, image recognition, machine learning, ods, open data science, python, TensorFlow, Блог компании Open Data Science, гайд, глубокое обучение, машинное обучение, нейронные сети, обработка изображений, проектПривет!
В последнее время машинное обучение и data science в целом приобретают все большую популярность. Постоянно появляются новые библиотеки и для тренировки моделей машинного обучения может потребоваться совсем немного кода. В такой ситуации можно забыть, что машинное обучение — не самоцель, а инструмент для решения какой-либо задачи. Мало сделать работающую модель, не менее важно качественно презентовать результаты анализа или сделать работающий продукт.
Я хотел бы рассказать о том, как создал проект по распознаванию рукописного ввода цифр с моделями, которые дообучаются на нарисованных пользователями цифрах. Используется две модели: простая нейронная сеть (FNN) на чистом numpy и сверточная сеть (CNN) на Tensorflow. Вы сможете узнать, как сделать практически с нуля следующее:
-
создать простой сайт с использованием Flask и Bootstrap;
-
разместить его на платформе Heroku;
-
реализовать сохранение и загрузку данных с помощью облака Amazon s3;
-
собрать собственный датасет;
-
натренировать модели машинного обучения (FNN и CNN);
-
сделать возможность дообучения этих моделей;
-
сделать сайт, который сможет распознавать нарисованные изображения;
Для полного понимания проекта желательно знать как работает deep learning для распознавания изображений, иметь базовые знания о Flask и немного разбираться в HTML, JS и CSS.
CNN и NBC запустили новостные шоу специально для Snapchat
2017-08-22 в 15:12, admin, рубрики: cnn, nbc, Snapchat, дети, Медиа, мессенджеры, Новости, СМИ, статистика, США, Текучка, метки: CNN, nbc, Snapchat, дети, медиа, мессенджеры, новости, онлайн видео, СМИ, статистика, США, ТекучкаКрупнейшие новостные телеканалы CNN и NBC начали производить контент специально для Snapchat. CNN запустила ежедневное шоу The Update посвященное новостям продолжительностью 3−5 минут.
CNN, которая первой в мире запустила формат 24-часового вещания новостей, плотно сотрудничает со Snap с начала 2015 года. Изначально ее выпуски были скорее похожи на новостной дайджест, изложенный понятным языком. Сейчас речь идет именно о новостном выпускеЧитать полностью »
Британские спутниковые снимки 2: Как все было на самом деле
2017-07-21 в 11:06, admin, рубрики: cnn, deep learning, machine learning, object detection, ods, open data science, python, Алгоритмы, Блог компании Open Data Science, глубокое обучение, машинное обучение, нейронные сети, обработка изображенийСразу оговорюсь, что данный пост не несет большой технической нагрузки и должен восприниматься исключительно в режиме «пятничной истории». Кроме того, текст насыщен английскими словами, какие-то из них я не знаю как перевести, а какие-то просто не хочется переводить.
Краткое содержание первой части:
1. DSTL (научно-техническая лаборатория при министерстве обороны Великобритании) провела соревнование на Kaggle.
2. Соревнование закончилось 7 марта, результаты объявлены 14 марта.
3. Пять из десяти лучших команд — русскоговорящие, причем все они являются членами сообщества Open Data Science.
4. Призовой фонд в $100,000 разделили брутальный малазиец Kyle, команда Романа Соловьева и Артура Кузина, а также я и Сергей Мушинский.
5. По итогам были написаны блог-посты (мой пост, пост Артура, наш с Серегой пост на Kaggle), проведены выступления на митапах (мое выступление в Adroll, мое выстпление в H20.ai, выступление Артура в Yandex, выступление Евгения Некрасова в Mail.Ru Group), написан tech report на arxiv.
Организаторам понравилось качество предложенных решений, но не понравилось, сколько они за это соревнование отстегнули. В Каggle ушло $500k, в то время как призовые всего $100k.
Читать полностью »