Архив за 04 марта 2019 - 6

Формула для корейского, или распознаем хангыль быстро, легко и без ошибок - 1На сегодняшний день сделать распознавание корейских символов может любой студент, прослушавший курс по нейросетям. Дайте ему выборку и компьютер с видеокартой, и через некоторое время он принесёт вам сеть, которая будет распознавать корейские символы почти без ошибок.

Но такое решение будет обладать рядом недостатков:

Во-первых, большое количество необходимых вычислений, что влияет на время работы или требуемую энергию (что очень актуально для мобильных устройств). Действительно, если мы хотим распознавать хотя бы 3000 символов, то это будет размер последнего слоя сети. А если вход этого слоя равен хотя бы 512-ти, то получаем 512 * 3000 умножений. Многовато.

Во-вторых, размер. Тот же самый последний слой из предыдущего примера будет весить 512 * 3001 * 4 байт, то есть около 6-ти мегабайт. Это только один слой, вся сеть будет весить десятки мегабайт. Понятно, для настольного компьютера это проблема небольшая, но на смартфоне не все будут готовы хранить столько данных для распознавания одного языка.

В-третьих, такая сеть будет давать непредсказуемый результат на изображениях, которые не являются корейскими символами, но тем не менее используются в корейских текстах. В лабораторных условиях это не трудно, но для практического применения технологии этот вопрос придётся как-то решать.

И в-четвёртых, проблема в количестве символов: 3000, скорее всего, хватит чтобы, например, отличить в меню ресторана стейк от жареного морского огурца, но порой встречаются и более сложные тексты. Обучить сеть на большее количество символов будет сложно: она будет не только более медленной, но и возникнет проблема со сбором обучающей выборки, так как частота символов падает приблизительно экспоненциально. Конечно, можно доставать изображения из шрифтов и аугментировать их, но для обучения хорошей сети этого недостаточно.

И сегодня я расскажу, как нам удалось решить эти проблемы.
Читать полностью »

На выставке Mobile World Congress 2019, которая состоялась на прошлой неделе в Барселоне, компания Oppo показала прототип смартфона с технологией 10-кратного зума без потери качества.

На тот момент было известно, что Oppo планирует выпустить первый смартфон с такой камерой во втором квартале текущего года. Теперь же появилась дополнительная информация на этот счет, которую озвучил вице-президент Oppo.

Официальный анонс смартфона состоится уже в апреле этого года. Его название пока что держится в секрете, но уже сейчас Oppo обещает, что его можно будет найти в свободной продаже со дня выхода. Дефицита не ожидается.

Видеорегистраторы для видеонаблюдения — бесплатно - 1

В компании «Интемс» есть почти новогодняя традиция, каждый год в январе мы ходим в баню проводим инвентаризацию на складе.

И это конечно, само по себе не повод для публикации на Хабре, но дело в том что в самом темном углу мы нашли, то, про что все уже давно забыли — несколько аналоговых видеорегистраторов. В каждом январе я про них вспоминаю, и благополучно забываю до следующего января. Выкинуть вроде жалко, а продавать такое уже стыдно.

Наверное они и дальше продолжили бы лежать на нашем складе, если бы мне не попался на глаза пост от компании Rusonyx — «Бесплатно раздаем железо». В общем вы поняли — мы будем бесплатно раздавать видеорегистраторы.

Под катом модели бесплатных видеорегистраторов, и еще кое что, что мы тоже раздаем абсолютно бесплатно.Читать полностью »

Давно известно, что операционная система Fuchsia создается специалистами компании Google в течение несколько лет. За последние месяцы информации о ней становится все больше, что позволяет надеяться на скорый анонс.

Напомним, новая операционная система, по информации хорошо осведомленных источников, уже работает с приложениями для Android. В данный момент разработчики заняты созданием возможности полноценной работы операционной системы Fuchsia на различных процессорных архитектурах.

Читать полностью »

14 марта Tesla Inc покажет новый электромобиль - 1

В воскресенье глава компании Tesla Inc Илон Маск рассказал о скором анонсе нового электромобиля. Транспортное средство получило название Model Y и будет представлено в Лос-Анджелесе.

По словам представителей компании, инженеры Tesla с 2012 года (выход Model S) работали над улучшением конструкции SUV. Модернизированная версия электромобиля представлена в качестве Tesla X, но работа продолжалась и сейчас усовершенствованный форм-фактор получила модель Model Y.
Читать полностью »

Как стало известно, холдинг «Росэлектроника», входящий в госкорпорацию «Ростех», в данный момент занимается разработкой системы связи нового поколения для Международной космической станции (МКС).

Если говорить точнее, то «Росэлектроника» делает наземный приемо-передающий цифровой телевизионный комплекс нового поколения «Орион-Ц» для связи с Международной космической станцией. При этом используется современная электронная компонентная база и обновленная антенная система.

Опасные для Земли астероиды оказались крепкими орешками

Этот популярный среди фантастов сюжет на практике может столкнуться с существенным затруднением, «придуманным» самой природой. Во всяком случае, так считают ученые из Университета Джона Хопкинса, проведшие компьютерное моделирование событий, происходящих при столкновении двух крупных небесных тел.

Читать полностью »

Neural Ordinary Differential Equations

Значительная доля процессов описывается дифференциальными уравнениями, это могут быть эволюция физической системы во времени, медицинское состояние пациента, фундаментальные характеристики фондового рынка и т.д. Данные о таких процессах последовательны и непрерывны по своей природе, в том смысле, что наблюдения — это просто проявления какого-то непрерывно изменяющегося состояния.

Есть также и другой тип последовательных данных, это дискретные данные, например, данные NLP задач. Состояния в таких данных меняется дискретно: от одного символа или слова к другому.

Сейчас оба типа таких последовательных данных обычно обрабатываются рекуррентными сетями, несмотря на то, что они отличны по своей природе, и похоже, требуют различных подходов.

На последней NIPS-конференции была представлена одна очень интересная статья, которая может помочь решить эту проблему. Авторы предлагают подход, который они назвали Нейронные Обыкновенные Дифференциальные Уравнения (Neural ODE).

Здесь я постарался воспроизвести и кратко изложить результаты этой статьи, чтобы сделать знакомство с ее идеей чуть более простым. Мне кажется, что эта новая архитектура вполне может найти место в стандартном инструментарии дата-сайентиста наряду со сверточными и рекуррентными сетями.

Знакомство с Neural ODE - 1

Читать полностью »

image

Wireshark Foundation выпустила финальную stable-версию популярного сетевого анализатора трафика — Wireshark 3.0.0. В новом релизе устранено несколько багов, реализована возможность анализа новых протоколов и заменен драйвер WinPcap на Npcap.

Wireshark — самый популярный в мире анализатор сетевых протоколов. Он используется для устранения неполадок, анализа, развития и обучения.
Читать полностью »

Смартфон Vivo X27 еще не было официально анонсирован, однако его уже показали в каком-то китайском телевизионном шоу.

Подражатель. Vivo X27 выглядит как Vivo V15 Pro

Стоит отметить, что Vivo X27 выглядит как представленный пару недель назад Vivo V15 ProЧитать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js