Рубрика «wunderfund» - 2

Библиотека Google Benchmark

2017-04-05 в 10:12, admin, рубрики: benchmark, c++, google benchmark library, microbenchmarks, wunder fund, wunderfund, Блог компании Wunder Fund, высокая производительность, Программирование, метки: google benchmark library, microbenchmarks

Библиотека Google Benchmark - 1

Не так давно я писал о C++ библиотеках для микробенчмаркинга. Я рассказал о трех библиотеках: Nonius, Hayai и Celero. Но в действительности я хотел поговорить о четвертой. Мой Windows тогда не поддерживал Google Benchmark library, так что я не мог ее протестировать. К счастью, из комментариев к прошлому посту я узнал, что теперь библиотека доступна в Visual Studio!

Давайте посмотрим, как можно ее использовать.
Читать полностью »

Поиск по регулярным выражениям с помощью суффиксного массива

2017-03-29 в 10:28, admin, рубрики: code search, search, suffix array, wunder fund, wunderfund, Алгоритмы, Блог компании Wunder Fund, Программирование

Еще в январе 2012 Расс Кокс опубликовал замечательный блог-пост, объясняющий работу Google Code Search с помощью триграммного индекса.

К этому времени уже вышли первые версии моей собственной системы поиска по исходному коду под названием livegrep, с другим метод индексации; я писал эту систему независимо от Google, с помощью нескольких друзей. В этой статье я хотел бы представить немного запоздалое объяснение механизма ее работы.
Читать полностью »

Что такое Resizable Concurrent Map

2017-03-17 в 13:22, admin, рубрики: algorithms, lock-free, multithreading, parallel programming, wunderfund, Алгоритмы, Блог компании Wunder Fund, параллельное программирование, Программирование

В одном из прежних постов я рассказывал, как реализовать «простейшую в мире lock-free хеш-таблицу» на C++. Она была настолько проста, что было невозможно удалять из нее записи или менять ее размерность. С тех пор прошло несколько лет, и не так давно я написал несколько многопоточных ассоциативных массивов без таких ограничений. Их можно найти в моем проекте Junction на GitHub.

Junction содержит несколько многопоточных реализаций интерфейса map – даже «самая простая в мире» среди них, под названием ConcurrentMap_Crude. Для краткости будем называть ее Crude map. В этом посте я объясню разницу между Crude map и Linear map из библиотеки Junction. Linear — самый простой map в Junction, поддерживающий и изменение размера, и удаление.

Можете ознакомиться с объяснением того, как работает Crude map, в первоначальном посте. Если коротко, то она основана на открытой адресации и линейном пробировании. Это значит, что она по сути является большим массивом ключей и значений, использующим линейный поиск. Во время добавления или поиска заданного ключа мы вычисляем хеш от ключа, чтобы определить, с какого места начать поиск. Добавление и поиск данных возможны в многопоточном режиме.

Что такое Resizable Concurrent Map - 1
Читать полностью »

Самая простая в мире lock-free хеш-таблица

2017-02-28 в 15:07, admin, рубрики: algorithms, lock-free, multithreading, parallel programming, wunderfund, Алгоритмы, Блог компании Wunder Fund, параллельное программирование, Программирование

Безблокировочная хеш-таблица — это медаль о двух сторонах. В некоторых случаях они позволяют достигать такой производительности, которой не получить другими способами. С другой стороны, они довольно сложны.
Читать полностью »

Введение в lock-free программирование

2017-02-20 в 13:02, admin, рубрики: algorithms, lock-free, multithreading, parallel programming, wunderfund, Алгоритмы, Блог компании Wunder Fund, параллельное программирование, Программирование

В этом посте мы хотели бы еще раз поднять тему программирования без блокировок, сперва дав ему определение, а затем выделить из всего многообразия информации несколько ключевых положений. Мы покажем, как эти положения соотносятся между собой, с помощью блок-схем, а потом мы немного коснемся деталей. Минимальное требование к разработчику, постигающему lock-free, — умение писать правильный многопоточный код, используя мьютексы или другие высокоуровневые объекты синхронизации, например, семафоры или события.
Читать полностью »

Как отлаживать модели машинного обучения

2017-01-31 в 9:45, admin, рубрики: algorithms, data science, machine learning, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучение

Я размышлял, в основном с точки зрения преподавателя, о том, как научить отлаживать модели машинного обучения. Лично мне кажется полезным рассмотреть модель с точки зрения ошибок разного рода: байесовская ошибка (насколько ошибочен лучший из возможных классификаторов), ошибка аппроксимации (что мы потеряем из-за ограничения класса гипотезы), ошибка оценки (связанная с ограниченной длиной выборки), ошибка оптимизации (что случится, если не найти глобальный оптимум для задачи оптимизации). Я понял, что полезно попытаться отнести ошибку к определенной области, а потом устранять недостатки в этой конкретной области. Читать полностью »

Статьи, лежащие в основе подхода Facebook к компьютерному зрению

2016-12-19 в 18:05, admin, рубрики: computer vision, machine learning, neural networks, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучение

Знаете такую компанию — Facebook? Да-да, ту самую, у сайта которой 1,6 миллиардов пользователей. И если взять все посты-поздравления с днем рождения, ваши позорные детские фотографии (у меня они такие), того дальнего родственника, лайкающего каждый ваш статус, — и вот вам множество данных для анализа.

С точки зрения анализа изображений Facebook весьма далеко продвинулся со сверточными нейронными сетями (Convolutional Neural Network, CNN). В августе подразделение Facebook по исследованиям в области искусственного интеллекта (Facebook AI Research, сокращенно FAIR) опубликовала блог-пост об алгоритмах компьютерного зрения, которые лежат в основе некоторых их алгоритмов сегментации изображений. В этом посте мы кратко изложим и разъясним три статьи, на которые ссылается этот блог.

Читать полностью »

Особенности Jupyter Notebook, о которых вы (может быть) не слышали

2016-12-06 в 12:02, admin, рубрики: ipython, ipython notebook, jupyter notebook, python, wunderfund, Блог компании Wunder Fund, Программирование

Jupyter Notebook – это крайне удобный инструмент для создания красивых аналитических отчетов, так как он позволяет хранить вместе код, изображения, комментарии, формулы и графики:

Особенности Jupyter Notebook, о которых вы (может быть) не слышали - 1

Ниже мы расскажем о некоторых фишках, которые делают Jupyter очень крутым. О них можно прочитать и в других местах, но если специально не задаваться этим вопросом, то никогда и не прочитаешь.

Читать полностью »

Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей

2016-11-14 в 19:16, admin, рубрики: deep learning, machine learning, neural networks, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучение

Введение

Представляем вторую статью в серии, задуманной, чтобы помочь быстро разобраться в технологии глубокого обучения; мы будем двигаться от базовых принципов к нетривиальным особенностям с целью получить достойную производительность на двух наборах данных: MNIST (классификация рукописных цифр) и CIFAR-10 (классификация небольших изображений по десяти классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик).
Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей - 1
Читать полностью »

Глубокое обучение для новичков: распознаем рукописные цифры

2016-11-07 в 15:47, admin, рубрики: deep learning, machine learning, neural networks, wunderfund, Алгоритмы, Блог компании Wunder Fund, машинное обучение

Представляем первую статью в серии, задуманной, чтобы помочь быстро разобраться в технологии глубокого обучения; мы будем двигаться от базовых принципов к нетривиальным особенностям с целью получить достойную производительность на двух наборах данных: MNIST (классификация рукописных цифр) и CIFAR-10 (классификация небольших изображений по десяти классам: самолет, автомобиль, птица, кошка, олень, собака, лягушка, лошадь, корабль и грузовик).

Глубокое обучение для новичков: распознаем рукописные цифры - 1
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «wunderfund» - 2

Библиотека Google Benchmark

Поиск по регулярным выражениям с помощью суффиксного массива

Что такое Resizable Concurrent Map

Самая простая в мире lock-free хеш-таблица

Введение в lock-free программирование

Как отлаживать модели машинного обучения

Статьи, лежащие в основе подхода Facebook к компьютерному зрению

Особенности Jupyter Notebook, о которых вы (может быть) не слышали

Глубокое обучение для новичков: распознаем изображения с помощью сверточных сетей

Введение

Глубокое обучение для новичков: распознаем рукописные цифры

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «wunderfund» - 2

Введение

Новости

Актуальные темы

Архив