Рубрика «python» - 189

Учим компьютер писать как Толстой, том I

2017-12-02 в 11:12, admin, рубрики: anaconda, gensim, machine learning, python, python3, word embedding, машинное обучение

— Eh bien, mon prince. Gênes et Lucques ne sont plus que des apanages, des поместья, de la famille Buonaparte. Non, je vous préviens que si vous ne me dites pas que nous avons la guerre, si vous vous permettez encore de pallier toutes les infamies, toutes les atrocités de cet Antichrist (ma parole, j'y crois) — je ne vous connais plus, vous n'êtes plus mon ami, vous n'êtes plus мой верный раб, comme vous dites 1. Ну, здравствуйте, здравствуйте. Je vois que je vous fais peur 2, садитесь и рассказывайте.

ТОМ ПЕРВЫЙ

ЧАСТЬ ПЕРВАЯ. Анна Каренина

Недавно на хабре наткнулся на эту статью https://habrahabr.ru/post/342738/. И захотелось написать про word embeddings, python, gensim и word2vec. В этой части я постараюсь рассказать о обучении базовой модели w2v.

Итак, приступаем.

Качаем anaconda. Устанавливаем.
Еще нам пригодится C/C++ tools от visual studio.
Теперь устанавливаем gensim. Именно для него нам и нужен c++.
Устанавливаем nltk.
При установке не забудьте качать библиотеки для Anaconda, а не для стандартного интерпретатора. Иначе все кончится крахом.
Качаем Анну Каренину в TXT.
Советую открыть файл и вырезать оттуда рекламу и заголовки. Потом сохранить в формате utf-8.
Можно приступать к работе.

Читать полностью »

Видеонаблюдение в подъезде своими силами

2017-12-01 в 13:53, admin, рубрики: motion, odroid, poe, python, telegram, видеонаблюдение, Работа с видео, Яндекс.Диск

Прочитал относительно недавнюю публикацию о видеонаблюдении и решил описать свой опыт. Считаю мое решение оптимальным по соотношению цена/функциональность, но с удовольствием выслушаю критику более опытных людей.

Итак, задача — минимальными материальными и временными ресурсами сделать видеонаблюдение в подъезде перед входной (в квартиру) дверью. Желательно не записывать круглые сутки “пустые” картинки, т.е. необходимо детектирование движения. Также хорошо бы иметь удаленный доступ к записям.
Читать полностью »

Hik or Hack? (НЕ)безопасность Интернета вещей на примере IP-камеры Hikvision

2017-12-01 в 6:28, admin, рубрики: hikvision, IoT, ipcamera, python, Блог компании НеоБИТ, Интернет вещей, информационная безопасность, реверс-инжиниринг

Hik or Hack? (НЕ)безопасность Интернета вещей на примере IP-камеры Hikvision - 1 В современном мире нас окружают «умные» устройства, в том или ином виде представляющие собой маленький компьютер. С точки зрения интеграции с современным оборудованием, будь то бытовая электроника и умные дома, медицинское и банковское оборудование, развлекательные системы и промышленное оборудование — все это представляет собой встраиваемые системы (embedded-устройства).

«Умные» гаджеты очень плотно влились в нашу жизнь, и их число из года в год растёт благодаря их низкой стоимости, удобству и простоте в использовании, в том числе через Интернет. Однако за рядом плюсов скрываются минусы, невидимые на первый взгляд рядовому пользователю.

В одном из докладов «Очной ставки» NeoQUEST-2017 рассматривался обширный класс embedded-устройств — IP-камеры, и обсуждались общие подходы к анализу встроенного программного обеспечения. В данной статье мы более подробно остановимся на исследовании камеры Hikvision DS-2CD2432F-IW, ее прошивки и механизмов защиты от встраивания и модификации, используемых производителем.
Читать полностью »

Биороботы нашего времени — избавляемся от рутины вместе с Telegram. Реальный кейс без фантазий

2017-11-30 в 14:48, admin, рубрики: php, python, telegram, Блог компании VDS.SH, интерфейсы, обработка изображений

В интернетах не прекращается хайп вокруг чат-ботов — в частности Telegram — благодаря шуму в СМИ, неоспоримых достоинствах платформы, политике продвижения, средствам разработки и т.д.

Смотришь новости: ну жизни нет без чат-ботов!
Да если их не будет — поезда с рельс сойдут, упадут самолеты, погибнут люди от тоски, когда не смогут найти картинки с котиками.

Но давайте положим руку на сердце: когда последний раз вы что-то заказывали в интернет магазине через чат-бот?

Кто все эти люди, которые заказывают разработку ботов для своих магазинов?

Типичный чат-бот магазина Vasya Limited:
>> автоматизирует ~~поток~~ водопад заявок из 5 человек в день.
>> сливает 4 из 5 заявок, кровью добытых через Яндекс-Директ
>> если повезет — человек найдет номер телефона и позвонит
>> но вероятней всего «Эээ — куда жать?»- закроет и уйдет гуглить дальше.

Чем занят владелец, когда продажи «автоматизированы»:
>> вносит заказы в excel таблицу
>> заполняет почтовые бланки на посылках
>> стоит в очереди на почте с кучей посылок (каждый день!)
>> вносит трек номера в excel таблицу, затем рассылает клиентам

Может хватит на ровном месте встраивать «технологии» туда, где действительно нужен человек, в то время как люди загружены рутиной для роботов?
Читать полностью »

Классификация звуков с помощью TensorFlow

2017-11-29 в 8:48, admin, рубрики: devicehive, IoT, machine learning, python, TensorFlow, Блог компании DataArt, машинное обучение, нейронные сети, Работа со звуком, Разработка для интернета вещей, распознование звуковых файлов

Классификация звуков с помощью TensorFlow - 1

Игорь Пантелеев, Software Developer, DataArt

Для распознавания человеческой речи придумано множество сервисов — достаточно вспомнить Pocketsphinx или Google Speech API. Они способны довольно качественно преобразовать в печатный текст фразы, записанные в виде звукового файла. Но ни одно из этих приложений не может сортировать разные звуки, захваченные микрофоном. Что именно было записано: человеческая речь, крики животных или музыка? Мы столкнулись с необходимостью ответить на этот вопрос. И решили создать пробные проекты для классификации звуков с помощью алгоритмов машинного обучения. В статье описано, какие инструменты мы выбрали, с какими проблемами столкнулись, как обучали модель для TensorFlow, и как запустить наше решение с открытым исходным кодом. Также мы можем загружать результаты распознавания на IoT-платформу DeviceHive, чтобы использовать их в облачных сервисах для сторонних приложений.

Выбор инструментов и модели для классификации

Сначала нам нужно было выбрать ПО для работы с нейронными сетями. Первым решением, которое показалось нам подходящим, была библиотека Python Audio Analysis.

Основная проблема машинного обучения — хороший набор данных. Для распознавания речи и классификации музыки таких наборов очень много. С классификацией случайных звуков дела обстоят не так хорошо, но мы, пусть и не сразу, нашли набор данных с «городскими» звуками.Читать полностью »

ScadaPy сервер JSON

2017-11-27 в 13:10, admin, рубрики: python, scada

В продолжение предыдущих статей о применении python для построения собственной scada системы, хотелось бы описать способ организации обмена между устройствами и вывод данных посредством json — текстового формата обмена данными.

В данном случае будем использовать клиентские части modbusTCP и OPCUA библиотек.Читать полностью »

«Пишите письма…» или тренируемся работать с данными по обращениям граждан в правительство Москвы (DataScience)

2017-11-26 в 19:42, admin, рубрики: data mining, data science, python, машинное обучение, Москва, новичкам, обращения граждан, открытые данные, Учебный процесс в IT

Приветствую коллеги! Пришло время продолжить наш спонтанный мини цикл статей, посвящённый основам машинного обучения и анализа данных.

В прошлый раз мы разбирали с Вами задачку применения линейной регрессии к открытым данным правительства Москвы, а в этот раз данные тоже открыты, но их уже пришлось собирать вручную.

Итак, сегодня мы с Вами поднимем животрепещущую тему – обращения граждан в органы исполнительной власти Москвы, нас с вами сегодня ждет: краткое описание набора данных, примитивный анализ данных, применение к ним модели линейной регрессии, а также краткая отсылка к учебным курсам для тех, кто совсем ничего не поймет из материала статьи. Ну и конечно же останется пространство для самостоятельного творчества.

Напомню, что наша статья рассчитана в первую очередь на начинающих любителей Python и его распространённых библиотек из области DataScience. Готовы? Тогда, милости прошу под кат.

Читать полностью »

Текстовые капчи легко распознаются нейронными сетями глубокого обучения

2017-11-26 в 12:25, admin, рубрики: captcha, python, капча, машинное обучение, обработка изображений, полносверточные нейронные сети, распознавание текста

Текстовые капчи легко распознаются нейронными сетями глубокого обучения - 1

Нейронные сети глубокого обучения достигли больших успехов в распознавании образов. В тоже время текстовые капчи до сих пор используются в некоторых известных сервисах бесплатной электронной почты. Интересно смогут ли нейронные сети глубоко обучения справится с задачей распознавания текстовой капчи? Если да то как?
Читать полностью »

Развитие стратегий устойчивости

2017-11-24 в 10:11, admin, рубрики: machine learning, python, Блог компании Mail.Ru Group, Занимательные задачки, машинное обучение, никто не читает теги, параллельное программирование

В предыдущей статье я описал несколько алгоритмов эволюционных стратегий (evolution strategies, ES), помогающих оптимизировать параметры функции без необходимости явно вычислять градиенты. При решении задач обучения с подкреплением (reinforcement learning, RL) эти алгоритмы можно применять для поиска подходящих наборов параметров модели для агента нейросети (neural network agent). В этой статье я расскажу об использовании ES в некоторых RL-задачах, а также опишу методы поиска более стабильных и устойчивых политик.

Читать полностью »

RNN: может ли нейронная сеть писать как Лев Толстой? (Спойлер: нет)

2017-11-22 в 16:37, admin, рубрики: data mining, deep learning, python, recurrent neural network, TensorFlow, машинное обучение

При изучении технологий Deep Learning я столкнулся с нехваткой относительно простых примеров, на которых можно относительно легко потренироваться и двигаться дальше.

В данном примере мы построим рекуррентную нейронную сеть, которая получив на вход текст романа Толстого «Анна Каренина», будет генерировать свой текст, чем-то напоминающий оригинал, предсказывая, какой должен быть следующий символ.

Структуру изложения я старался делать такой, чтобы можно было повторить все шаги новичку, даже не понимая в деталях, что именно происходит внутри этой сети. Профессионалы Deep Learning скорее всего не найдут тут ничего интересного, а тех, кто только изучает эти технологии, прошу под кат.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «python» - 189

Учим компьютер писать как Толстой, том I

ТОМ ПЕРВЫЙ

ЧАСТЬ ПЕРВАЯ. Анна Каренина

Видеонаблюдение в подъезде своими силами

Hik or Hack? (НЕ)безопасность Интернета вещей на примере IP-камеры Hikvision

Биороботы нашего времени — избавляемся от рутины вместе с Telegram. Реальный кейс без фантазий

Кто все эти люди, которые заказывают разработку ботов для своих магазинов?

Классификация звуков с помощью TensorFlow

Выбор инструментов и модели для классификации

ScadaPy сервер JSON

«Пишите письма…» или тренируемся работать с данными по обращениям граждан в правительство Москвы (DataScience)

Текстовые капчи легко распознаются нейронными сетями глубокого обучения

Развитие стратегий устойчивости

RNN: может ли нейронная сеть писать как Лев Толстой? (Спойлер: нет)

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «python» - 189

ТОМ ПЕРВЫЙ

ЧАСТЬ ПЕРВАЯ. Анна Каренина

Кто все эти люди, которые заказывают разработку ботов для своих магазинов?

Выбор инструментов и модели для классификации

Новости

Актуальные темы

Архив