Рубрика «atomic» - 2

Обзор примитивов синхронизации — спинлоки и тайны ядра процессора

2016-03-06 в 11:15, admin, рубрики: atomic, Mutex, spinlock, программирование микроконтроллеров, системное программирование, метки: spinlock

Последняя статья про классические примитивы синхронизации.

(Наверное, потом напишу ещё одну про совсем уже нетипичную задачу, но это потом.)

Сегодня мы немножко заглянем в процессор. Чуть-чуть.

По сути, мы будем говорить про единственный примитив, который принципиально отличается от остальных: спинлок. Spinlock.

В комментариях к предыдущим заметкам возникла дискуссия — насколько справедливо вообще выделять спинлок как примитив, ведь по сути он — просто мьютекс, верно? Он выполняет ту же функцию — запрещает одновременное исполнение фрагмента кода несколькими параллельными нитями.

На уровне процесса всё так и есть — различия между спинлоком и мьютексом — чисто технические, вопрос реализации и производительности.

Но меня эта тема интересует не только с позиции программиста юзерленда, но и с позиции разработчика ядра, а так же и разработчика самих примитивов синхронизации. И тут уже различие принципиально.

Дело в том, что внутри ядра мьютекс реализован с помощью спинлоков, а вот спинлоки реализованы сами по себе, автономно. Они — действительно базовый примитив. Ниже — только сам процессор.

Есть и ещё одно, семантическое различие. Мьютекс допускает и предполагает снятие нити с процессора, долгую остановку вызывающей нити. Мьютексом можно запереть объект на час или сутки, это приемлемо и нормально. Спинлок принципиально рассчитан только на кратчайшие приостановки, это всегда работа с неатомарным стейтом объекта. Присваивание группы переменных, небольшой цикл — это максимум того, что можно сделать под спинлоком.

Итак, иерархия реализации такова: mutex/cond/sema сделаны на базе спинлоков, спинлоки — на базе атомарных операций, предоставляемых процессором. Мы в них немного заглянем сегодня.

Как устроен спинлок?
Читать полностью »

OpenCL 2.0 и драйверы от AMD и Intel

2014-09-29 в 4:25, admin, рубрики: atomic, compare and set, enterprise software development, gpgpu, opencl, pipe, высокая производительность

Незамеченной на хабре прошла новость о появлении OpenCL 2.0 драйверов от AMD и Intel.

Многим кажется, что подобный API просто очередной маркетинговый buzzword. Отчасти это так, потому что почти все современные аппаратные продукты выходят с пунктом «OpenCL» в списке поддерживаемых технологий и рекламе: последние CPU, GPU, APU (CPU+GPU), FPGA, CPU+FPGA. И многим из области разработки enterprise ПО хочется откреститься от этих «модных» названий, но и это скоро станет невозможно стараниями Oracle и AMD.

Массовый параллелизм аппаратного обеспечения уже давно присутствует в серверах, пресональных компьютерах, телефонах и планшетах, специализированных аппаратных ускорителях. OpenCL в области FPGA рассматривается как способ упростить, удешевить и популяризовать разработку. При этом использование преимуществ, предоставляемых аппаратурой, пока требует от программиста использовать таких API как OpenCL, CUDA, OpenMP. Но появляются попытки скрыть эту сложность от прикладных программистов, например Project Sumatra и ScalaCL.

Читать полностью »

Lock-free структуры данных. Основы: Атомарность и атомарные примитивы

2013-10-08 в 6:00, admin, рубрики: atomic, c++, lock-free, Блог компании i-Free, Программирование, метки: atomic, lock-free

Lock free структуры данных. Основы: Атомарность и атомарные примитивы
Построение lock-free структур данных зиждется на двух китах – атомарных операциях и способах упорядочения доступа к памяти. В этой статье речь пойдет об атомарности и атомарных примитивах.

Анонс. Спасибо за теплый прием Начал! Вижу, что тема lock-free интересна хабрасообществу, это меня радует. Я планировал построить цикл по академическому принципу, плавно переходя от основ к алгоритмам, попутно иллюстрируя текст кодом из libcds. Но часть читателей требует ~~зрелищ~~ не мешкая показать, как пользоваться библиотекой, особо не рассусоливая. Я согласен, в этом есть свой резон. В конечном счете, и мне не так интересно, что там внутри boost, — опишите, как его применять! Поэтому свой эпический цикл я разделю на три части: Основы, Внутри и Извне. Каждая статья эпопеи будет относится к одной из частей. В Основах будет рассказываться о низкоуровневых вещах, вплоть до строения современных процессоров; это часть для почемучек вроде меня. Внутри будет освещать интересные алгоритмы и подходы в мире lock-free, — это скорее теория о том, как реализовать lock-free структуру данных, libcds будет неисчерпаемым источником C++ кода. В Извне будут статьи о практике применения libcds, — программные решения, советы и FAQ. Извне будет питаться вашими вопросами/замечаниями/предложениями, дорогие читатели.

А пока я судорожно готовлю начало Извне, — первая часть Основ. Статья во многом не о C++ (хотя и о нем тоже) и даже не о lock-free (хотя без atomic lock-free алгоритмы неработоспособны), а о реализации атомарных примитивов в современных процессорах и о базовых проблемах, возникающих при использовании таких примитивов.
Атомарность — это первый ~~круг ада~~ низкий уровень из двух.
Читать полностью »

Одним махом 100 миллионов убивахом. Или lock-free распределитель памяти

2013-06-10 в 5:41, admin, рубрики: atomic, c++, c++11, lock-free, threads, параллельное программирование, Программирование, метки: atomic, c++11, lock-free, threads

Постановка задачи

Один из алгоритмов, который я реализовывал, имел интересные особенности при работе с памятью:

Могло выделяться огромное количество, до десятков и сотен миллионов небольших объектов одного типа.
Объекты представляли собой POD- типы.
POD

A Plain Old Data Structure in C++ is an aggregate class that contains only PODS as members, has no user-defined destructor, no user-defined copy assignment operator, and no nonstatic members of pointer-to-member type.
Заранее было неизвестно какое количество объектов понадобится, могло так случится, что потребуется сотня, а может и сто миллионов.
Объекты никогда не удаляются по одному, в какой-то момент они становятся не нужны все сразу.
Алгоритм хорошо распараллеливается, по этому выделением объектов занимается одновременно несколько потоков, по количеству ядер процессора(ов).

Использование в таких условиях стандартного new – delete приводит к очень большим потерям времени на удаление объектов. Если без отладчика удаление происходило хотя бы за несколько секунд, то в присутствии отладчика освобождение памяти замедляется примерно в 100(!) раз, и отладка проекта становится просто невозможной. Кроме того из-за большого количества выделенных объектов достаточно ощутимым становился перерасход памяти на внутренние данные расперделителя памяти.
Для решения задачи выделения огромного количества объектов одного типа, и их пакетного удаления, был сделан lock-free контейнер MassAllocator. Код компилируется Visual Studio 2012. Полный код проекта выложен на github.
Читать полностью »

Nuclear-Сompound Technology!

2013-04-01 в 13:46, admin, рубрики: atom, atomic, battery, Blackberry Z10, cellphone, Galaxy Note 2, galaxy s3, galaxy s4, mugen power, Nuclear, smartphone, аккумулятор, батарейка, Блог компании Mugen Power Batteries, муген, смартфон, Смартфоны и коммуникаторы, Энергия и элементы питания, метки: atom, atomic, battery, blackberry z10, cellphone, GALAXY Note, galaxy s3, galaxy s4, mugen power, Nuclear, smartphone, аккумулятор, батарейка, муген, смартфон

Наша новая батарейка Нюклеар-Компаунд сделает жизнь вашего телефона в 180 раз дольше, а вашу короче и интереснее!

Наши новые батарейки Nuclear-Compound увеличат жизнь вашего телефона на одном заряде в 180 раз
Доступно для:

Galaxy S3
Galaxy S4
Galaxy Note 2
BlackBerry Z10

Подробная информация доступна в официальном пресс-релизе компании

Читать полностью »

Atomic operations

2012-11-02 в 12:17, admin, рубрики: atomic, Программирование, метки: atomic

Стало интересно, как же именно достигается атомарность операций. Кому интересно — добро пожаловать под кат.
Читать полностью »

C++ / Производительность shared_ptr и C++11: почему я не верю библиотекам

2012-02-21 в 15:26, admin, рубрики: atomic, boost, c++, c++0x, c++11, move, shared_ptr, метки: atomic, boost, c++, c++0x, c++11, move, shared_ptr

Здравствуйте!

Оптимизировал я однажды критический участок кода, и был там boost::shared_ptr… И понял я: не верю я библиотекам, хоть и пишут их дядьки умные.

Детали под катом.

Так вот, оптимизировал я код, и был там такой участок:

auto pRes = boost::static_pointer_cast< TBase >( boost::allocate_shared< TDerived >( TAllocator() ) );
<fontЧитать полностью »

Информация

Комментарии

Рекомендуем