Рубрика «машинное обучение» - 109

Word2vec в картинках

2019-04-02 в 18:12, admin, рубрики: embeddings, gensim, nlp, word2vec, векторное представление слов, вложения, машинное обучение

«Во всякой вещи скрыт узор, который есть часть Вселенной. В нём есть симметрия, элегантность и красота — качества, которые прежде всего схватывает всякий истинный художник, запечатлевающий мир. Этот узор можно уловить в смене сезонов, в том, как струится по склону песок, в перепутанных ветвях креозотового кустарника, в узоре его листа.

Мы пытаемся скопировать этот узор в нашей жизни и нашем обществе и потому любим ритм, песню, танец, различные радующие и утешающие нас формы. Однако можно разглядеть и опасность, таящуюся в поиске абсолютного совершенства, ибо очевидно, что совершенный узор — неизменен. И, приближаясь к совершенству, всё сущее идёт к смерти» — Дюна (1965)

Я считаю, что концепция вложений (embeddings) — одна из самых замечательных идей в машинном обучении. Если вы когда-нибудь использовали Siri, Google Assistant, Alexa, Google Translate или даже клавиатуру смартфона с предсказанием следующего слова, то уже работали с моделью обработки естественного языка на основе вложений. За последние десятилетия произошло значительное развитие этой концепции для нейронных моделей (последние разработки включают контекстуализированные вложения слов в передовых моделях, таких как BERT и GPT2).
Читать полностью »

Краткий гайд по созданию оракулов, богов из машины и ошибкам второго рода

2019-04-02 в 12:39, admin, рубрики: Алгоритмы, Блог компании Recognitor, бог из машины, машинное обучение, обработка изображений, ошибки второго рода, распознавание изображений

Наверное, в этом тексте для многих не будет новизны. Наверное, другие скажут что такого не бывает в реальной жизни. Но, уже не первое апреля, а всё написанное тут — чистая правда, которая случалась со мной или с людьми вокруг. Возможно что-то из сказанного заставит вас переосмыслить окружающие вас феномены.
Если подходить к этим историям формально, то можно сказать что все они порождены тем что люди не учитывают ошибку второго рода. У Юдковского, с коим знакома четверть Хабра — эта ошибка обычно зовётся «Подтверждающее искажение»
Краткий гайд по созданию оракулов, богов из машины и ошибкам второго рода - 1
Что это такое? В двух словах — «человек ищет подтверждение своей модели, а не её опровержение». Единственный шанс объяснить лучше, это примеры-примеры-примеры и опыт. Лишь так можно развить чувство что «что-то тут не так».
Мне кажется, что этот короткий рассказ позволят вам посмотреть на ошибки второго рода с совсем другой стороны. Со стороны того, как они уже вошли в нашу жизни, влияют на практически каждое решение. И помогают нам делать богов из окружающих технологий. В машинном обучении я наталкиваюсь на это каждый день.
Читать полностью »

Хакеры заставили автопилот «Теслы» выехать на «встречку»

2019-04-01 в 19:11, admin, рубрики: model s, tesla, информационная безопасность, машинное обучение, обман машинного зрения, обработка изображений, состязательные примеры

Хакеры заставили автопилот «Теслы» выехать на «встречку» - 1
Камеры main, narrow и fisheye («рыбий глаз») на автомобиле Tesla Model S 75. Они обеспечивают входные данные для нейросетей автопилота

Исследователи из компании Tencent Keen Security Lab опубликовали отчёт с описанием успешной атаки на прошивку автомобиля Tesla Model S 75, включая удалённое управление рулевым колесом и атаку с помощью «состязательных примеров» (adversarial example) на автопилот, принудив его выехать на полосу встречного движения. Tesla активно применяет нейросети для многих задач машинного зрения, чем и воспользовались злоумышленники, которые применили стандартные методы атаки на машинное зрение.

Для эксплойта исследователи использовали цепочку уязвимостей, которую впоследствии раскрыли Tesla. Автопроизводитель закрыл уязвимости патчем 2018.24.
Читать полностью »

Нахождение объектов на картинках

2019-04-01 в 7:59, admin, рубрики: computer vision, Алгоритмы, Блог компании Joom, математика, машинное обучение, обработка изображений

Мы занимаемся закупкой трафика из Adwords (рекламная площадка от Google). Одна из регулярных задач в этой области – создание новых баннеров. Тесты показывают, что баннеры теряют эффективность с течением времени, так как пользователи привыкают к баннеру; меняются сезоны и тренды. Кроме того, у нас есть цель захватить разные ниши аудитории, а узко таргетированные баннеры работают лучше.

В связи с выходом в новые страны остро встал вопрос локализации баннеров. Для каждого баннера необходимо создавать версии на разных языках и с разными валютами. Можно просить это делать дизайнеров, но эта ручная работа добавит дополнительную нагрузку на и без того дефицитный ресурс.

Это выглядит как задача, которую несложно автоматизировать. Для этого достаточно сделать программу, которая будет накладывать на болванку баннера локализованную цену на "ценник" и call to action (фразу типа "купить сейчас") на кнопку. Если печать текста на картинке реализовать достаточно просто, то определение положения, куда нужно его поставить — не всегда тривиально. Перчинки добавляет то, что кнопка бывает разных цветов, и немного отличается по форме.

Этому и посвящена статья: как найти указанный объект на картинке? Будут разобраны популярные методы; приведены области применения, особенности, плюсы и минусы. Приведенные методы можно применять и для других целей: разработки программ для камер слежения, автоматизации тестирования UI, и подобных. Описанные трудности можно встретить и в других задачах, а использованные приёмы использовать и для других целей. Например, Canny Edge Detector часто используется для предобработки изображений, а количество ключевых точек (keypoints) можно использовать для оценки визуальной “сложности” изображения.

Надеюсь, что описанные решения пополнят ваш арсенал инструментов и трюков для решения проблем.

Нахождение объектов на картинках - 1

Читать полностью »

Распознавание танков в видеопотоке методами машинного обучения (+2 видео на платформах Эльбрус и Байкал)

2019-04-01 в 7:06, admin, рубрики: AstraLinux, c++, hieroglyph, ocr, smart idreader, smart tank reader, Атликс, байкал, Блог компании Smart Engines, искусственный интеллект, Комдив, М1А2 Абрамс, машинное обучение, Меркава III, обработка изображений, распознавание, распознавание изображений, распознавание объектов, распознавание танков, Т-14, Т-90, танки, Чулан, Эльбрус

Распознавание танков в видеопотоке методами машинного обучения (+2 видео на платформах Эльбрус и Байкал) - 1

В процессе своей деятельности мы ежедневно сталкиваемся с проблемой определения приоритетов развития. Учитывая высокую динамику развития IT индустрии, постоянно возрастающую востребованность со стороны бизнеса и государства к новым технологиям, каждый раз, определяя вектор развития и инвестируя собственные силы и средства в научный потенциал нашей компании, мы следим за тем, чтобы все наши исследования и проекты носили фундаментальный и междисциплинарный характер.

Читать полностью »

Разрабатываем теорию информации как проект с открытым исходным кодом

2019-03-30 в 10:11, admin, рубрики: android apps, bitbucket.org, Git, markdown, natural language processing, termux, Анализ и проектирование систем, искусственный интеллект, машинное обучение

Есть проблема:

найден очень полезный способ описания процессов формирования и преобразования информации,
сформирован теоретический базис этого способа
публикация в чисто-теоретическом виде (без сопровождения объяснениями и примерами) будет доступна только труженикам науки,
формирование примеров — это очень большой объем работы,
времени для занятия этой темой мало, совершенно не хватает двух рук, а из доступной техники — пока только смартфон,
а способ очень красив.

нужно много рук

Под катом попытка решения проблемы с использованием странных на первый взгляд инструментов: Android-смартфон, markdown, Epsilon Notes, динамическая книга, Termux, git, bitbucket, Хабр.

Читать полностью »

10 новых бесплатных курсов по когнитивным сервисам и Azure

2019-03-28 в 12:23, admin, рубрики: learn, microsoft, Microsoft Azure, Блог компании Microsoft, искусственный интеллект, машинное обучение, Учебный процесс в IT

Недавно мы выложили около 20 новых курсов на нашу обучающую платформу Microsoft Learn. Сегодня я расскажу и первых десяти, а немного позже выйдет статья и о второй десятке. Среди новинок: распознавание голоса с когнитивными сервисами, создание чат-ботов с QnA Maker, обработка изображений и многое другое. Подробности под катом!

10 новых бесплатных курсов по когнитивным сервисам и Azure - 1 Читать полностью »

Обман нейронной сети для начинающих

2019-03-28 в 6:01, admin, рубрики: adversarial attacks, digital security, machine learning, python, Блог компании «Digital Security», информационная безопасность, машинное обучение

В рамках ежегодного контеста ZeroNights HackQuest 2018 участникам предлагалось попробовать силы в целом ряде нетривиальных заданий и конкурсов. Часть одного из них была связана с генерированием adversarial-примера для нейронной сети. В наших статьях мы уже уделяли внимание методам атаки и защиты алгоритмов машинного обучения. В рамках же этой публикации мы разберем пример того, как можно было решить задание с ZeroNights Hackquest при помощи библиотеки foolbox.

Читать полностью »

Другой Github 2: машинное обучение, датасеты и Jupyter Notebooks

2019-03-27 в 12:06, admin, рубрики: data science, github, Блог компании Mail.Ru Group, визуализация данных, глубокое обучение, машинное обучение, репозиторий

Другой Github 2: машинное обучение, датасеты и Jupyter Notebooks - 1

Несмотря на то, что в интернете существует множество источников свободного программного обеспечения для машинного обучения, Github остается важным центром обмена информацией для всех типов инструментов с открытым исходным кодом, используемых в сообществе специалистов по машинному обучению и анализу данных.

В этой подборке собраны репозитории по машинному обучению, датасетам и Jupyter Notebooks, ранжированные по количеству звезд. В предыдущей части мы рассказывали о популярных репозиториях для изучения работ по визуализации данных и глубокому обучению.
Читать полностью »

Neural Quantum States — представление волновой функции нейронной сетью

2019-03-27 в 11:17, admin, рубрики: deep learning, quantum mechanics, Raiffeisenbank, raiffeisenIT, Блог компании Райффайзенбанк, машинное обучение, физика

В этой статье мы рассмотрим необычное применение нейронных сетей в целом и ограниченных машин Больцмана в частности для решения двух сложных задач квантовой механики — поиска энергии основного состояния и аппроксимации волновой функции системы многих тел.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 109

Word2vec в картинках

Краткий гайд по созданию оракулов, богов из машины и ошибкам второго рода

Хакеры заставили автопилот «Теслы» выехать на «встречку»

Нахождение объектов на картинках

Распознавание танков в видеопотоке методами машинного обучения (+2 видео на платформах Эльбрус и Байкал)

Разрабатываем теорию информации как проект с открытым исходным кодом

10 новых бесплатных курсов по когнитивным сервисам и Azure

Обман нейронной сети для начинающих

Другой Github 2: машинное обучение, датасеты и Jupyter Notebooks

Neural Quantum States — представление волновой функции нейронной сетью

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 109

Новости

Актуальные темы

Архив