О блоках в ObjC и правильной работе с ними написано очень много, в том числе и на хабре. Вопрос о том, как правильно работать с self в блоках, чтобы избежать циклических ссылок, регулярно задается на собеседованиях. При использовании таких фреймворков, как ReactiveCocoa количество блоков в коде сильно возрастает, при этом увеличивается шанс допустить ошибку и потерять в памяти объекты. Про попытку окончательно решить эту проблему, метапрограммирование для с99 с экстеншнами и блоками + хипстерсткие макросы с @ под катом.
Рассмотрим проблему и способы ее решения эволюционно.
self.block = ^{
[self f1];
[self f2];
};
Этот код очевидно содержит проблему. Без зануления self.block объект никогда не сможет быть удален, поскольку блок ссылается на self. При включенном LANG_WARN_OBJC_IMPLICIT_RETAIN_SELF компилятор даже выдаст предупреждение.
Улучшение 1:
__weak __typeof(self)weakSelf = self;
self.block = ^{
[weakSelf m1];
[weakSelf m2];
};
Проблема циклической ссылки решена, но возникает другая. На момент вызова блока объект weakSelf либо существует, либо уже нет. Если объект уже не существует, weakSelf == nil, m1 и m2 не вызовутся — казалось бы, все в порядке. Однако, может получиться так, что на момент вызова m1 объект еще существует, а на момент вызова m2 уже нет. При этом m1 вызовется, а m2 нет — такое поведение может быть неожиданным и неправильным. Это может произойти как при race condition в многопоточном приложении, либо если m1 уменьшает количество ссылок на объект (например, удаляет объект из какой-нибудь коллекции). В случае включенных CLANG_WARN_OBJC_REPEATED_USE_OF_WEAK и CLANG_WARN_OBJC_RECEIVER_WEAK компилятор выдает предупреждение для этого случая.
Улучшение 2:
__weak typeof(self)weakSelf = self;
self.block = ^{
__strong typeof(self)strongSelf = weakSelf;
[strongSelf m1];
[strongSelf m2];
};
Проблема с консистентностью вызовов методов внутри блока решена. Но обнаруживается новая:
__weak typeof(self)weakSelf = self;
self.block = ^{
__strong typeof(self)strongSelf = weakSelf;
[strongSelf m1];
[strongSelf m2];
NSAssert(foo == bar, @"Cool assert!")
};
Макросы, такие как NSAssert и RACObserve, неявно используют self, и проблема с циклической ссылкой возвращается.
Улучшение 3:
__weak typeof(self)weakSelf = self;
self.block = ^{
__strong typeof(self)self = weakSelf;
[self m1];
[self m2];
NSAssert(foo == bar, @"Cool assert!")
};
Теперь проблема с макросами использующими self решена, но при включенном GCC_WARN_SHADOW компилятор выдает предупрежнение.
Улучшение 4:
В библиотеке libextobjc есть макросы @weakify и @stongify которые убирают предупреждение компилятора и немного упрощают код.
@weakify(self); // self теперь новая локальная переменная с __weak
self.block = ^{
@strongify(self); // self теперь новая локальная переменная с __strong
[self m1];
[self m2];
NSAssert(foo == bar, @"Cool assert!")
};
Это почти оптимальное решение, но оно все еще не лишено нескольких недостатков: нужно не забыть поставить в нужные места @weakify и @strongify; использование self после @weakify безопасно, но компилятор может выдавать предупрежнение.
При этом все еще остается вероятность случайно захватить в блоке self по сильной ссылке:
@weakify(self); // self теперь новая локальная переменная с __weak
self.block = ^{
@strongify(self); // self теперь новая локальная переменная с __strong
[self m];
NSLog(@"Ivar value form object: %@", _ivar); // Сильная ссылка на self сохраняется неявно для доступа к _ivar
NSAssert(foo == bar, @"Cool assert!")
};
Для того, что бы этого избежать нужно либо использовать только доступ через property (self.ivar), либо явно использовать переопределенный self:
@weakify(self); // self теперь новая локальная переменная с __weak
self.block = ^{
@strongify(self); // self теперь новая локальная переменная с __strong
[self m];
NSLog(@"Ivar value form object: %@", self->_ivar); // Явно используем свой переопределенный self для доступа к _ivar
NSAssert(foo == bar, @"Cool assert!")
};
При этом нужно помнить, что self может быть nil, и явное разыменование self->_ivar вызовет креш.
С учетом всех этих проблем возникла идея написать макрос, который будет модифицировать не self, а сам блок таким образом, что:
- self вне scope блока изменяться не должен, как в случае @weakify
- внутри блока self должен называться self, чтобы избежать неожиданностей с NSAssert и другими макросами
- до момента вызова блока объект, на который указывает self, хранится по слабой ссылке, а во время вызова блока — по сильной
- по возможности макрос должен помогать находить блоки, которые неявно захватили self через _ivar
- все проверки типов должны работать так же, как и без макроса
- минимизировать изменения в коде при использовании этого макроса
- overhead в runtime должен быть минимальный
Макрос должен работать примерно как функция-декоратор в Python, принимать на вход блок и заворачивать его в новый блок-обертку совместимый по параметрам и возвращаемому значению. Для примера рассмотрим блок:
self.block = ^(NSObject *obj) {
NSLog(@"%@ %@", [self description], obj);
return 0;
};
Начнем модифицировать блок таким образом, чтобы self захватывался как слабая ссылка, по аналогии с кодом из «Улучшение 1». Для этого нам нужен новый scope в котором эта локальная ссылка будет объявлена. В качестве такого scope подойдет анонимный блок, который вызывается сразу после создания:
self.block = ^{
__weak typeof(self) weakSelf = self;
return ^(NSObject *obj) {
NSLog(@"%@ %@", [weakSelf description], obj);
return 0;
};
}();
Компилятор автоматически выведет тип возвращаемого значения для внешнего безымянного блока, все остается типобезопасным.
Теперь нужно каким-то образом сделать так, что бы в момент вызова внутри тела внутреннего блока self становился сильной ссылкой. Для этого придется разделить блок на 2 части: декларацию типа ^(NSObject *obj) и, собственно, само тело в {… }. Превратим тело нашего блока в блок без параметров и поместим его вызов в еще один блок, созданный с использованием декларации типа, который превратит self в сильную ссылку:
self.block = ^{
__weak typeof(self) weakSelf = self;
return ^(NSObject *obj) {
__strong typeof(self)self = weakSelf;
return ^ (void) {
NSLog(@"%@, %@", [self description], obj);
return 0;
}();
};
}();
Основной трюк — это замена исходного блока, эквивалентным ему, но который неявно захватывает weakSelf вместо self, а в момент вызова превращает его в strongSelf.
return ^(NSObject *obj) {
__weak typeof(self)self = weakSelf;
return ^ (void) {
NSLog(@"%@, %@", [self description], obj);
return 0;
}();
};
по сути то же самое, что и
^(NSObject *obj) {
NSLog(@"%@ %@", [self description], obj);
return 0;
};
Итого вместо одного блока создается три. Поскольку самый внешний блок вызывается сразу после создания, от него можно избавиться воспользовавшись code block evaluation aka statement expressions extension:
self.block = ({
__weak typeof(self) weakSelf = self;
^(NSObject *obj) {
__strong typeof(self)self = weakSelf;
return ^ (void) {
NSLog(@"%@, %@", [self description], obj);
return 0;
}();
};
});
Осталось завернуть весь boilerplate в макрос, чтобы этим трюком было удобно пользоваться. Если оставить только общий код, то получится:
({
__weak typeof(self) weakSelf = self;
/* ТИП БЛОКА */ {
__strong typeof(self)self = weakSelf;
return ^ (void) {
/* ТЕЛО БЛОКА */
} ();
};
})
Первой идеей было сделать макрос с двумя параметрами, для типа и тела, который бы вызывался так:
self.block = weakself(^(NSObject *obj), {
NSLog(@"%@ %@", [self description], obj);
return 0;
});
но, к сожалению, при препроцессинге макросы разворачиваются в одну строку, и, как следствие, нельзя поставить breakpoint на произвольную строчку в теле блока. Поэтому пришлось делать так:
self.block = weakself(^(NSObject *obj)) {
NSLog(@"%@ %@", [self description], obj);
return 0;
} weakselfend ;
такой вариант эквивалентен @weakify/@strongify из «Улучшение 4». Код макроса:
#define weakself(ARGS)
({ __weak typeof(self) _private_weakSelf => self;
ARGS {
__strong typeof(_private_weakSelf) self __attribute__((unused)) = _private_weakSelf;
return ^ (void) {
#define weakselfend } (); }; })
Одной из целей при создании макроса было обезопасить себя от неявного захвата self при доступе к ivar. К сожалению, как сделать это в compile time я так и не придумал. Единственный вариант — это assert/log для дебаг версии при создании блока (достаточно просто создать блок чтобы проверка сработала, не обязательно его вызывать). Тут стоит немного напомнить о том, как работает memory management для блоков и объектов, которые они захватывают. Существуют 3 типа блоков:
- NSGlobalBlock — блоки, созданные на верхнем уровне файла с исходным кодом, по сути аналогичны функциям с точки зрения memory management, переменные в scope не захватывают по этому интереса для нас не представляют.
- NSStackBlock — начальный тип для всех остальных созданных блоков, создаются на стеке, не увеличивают счетчики ссылок у объектов, которые захватывают, поскольку время жизни такого блока меньше либо равно времени жизни переменных из его лексического scope.
- NSMallocBlock — это NSStackBlock который был перенесен в heap явным вызовом copy/Block_copy или неявно компилятором. Один из случаев когда компилятор неявно вставляет Block_copy — это возврат блока как результат из функции/блока. В момент превращения NSStackBlock в NSMallocBlock и происходит увеличения счетчиков ссылок объектам, которые блок захватил в свой scope.
Таким образом, для того, что бы проверить, захватывает ли блок сильную ссылку на self нужно сравнить счетчик ссылок на self, до того как блок был перенесен в heap, и после. Если счетчик увеличился, значит блок захватил self по сильной ссылке. Эта проверка не может быть надежной в 100% случаев, поскольку счетчик ссылок на self может изменяться из других потоков во время переноса блока в heap, однако в нормальной программе эта ситуация маловероятна, и для Debug-сборки вполне подходит.
Для получения счетчика ссылок у объекта раньше можно было использовать метод retainCount, однако с ARC он больше не доступен, но CFGetRetainCount по-прежнему работает через toll-free bridging. Осталось только вставить вызовы этой функции с параметром self в нужные места и сравнить результаты.
self.block = {(
__weak typeof(self) weakSelf = self;
// Первый раз счетчик ссылок для self нужно получить здесь
^(NSObject *obj) {
__strong typeof(self)self = weakSelf;
return ^ (void) {
NSLog(@"%@, %@", [self description], obj);
return 0;
}();
};
}) // второй раз здесь и сравнить. Но у нас нет доступа к переменным из statement expression
Проблема в том, что результат statement expressions — это последняя строчка в нем. Поведение аналогично анонимному блоку, который вызывается сразу после объявления. Поскольку последняя строчка statement expression это декларация блока, то для того, чтобы этот блок оставался валидным, компилятор перенесет его в heap. Получается, мы можем сохранить вызов CFGetRetainCount для self в локальную переменную внутри statement expression, а второй вызов CFGetRetainCount нам нужно делать после последней строчки statement expression. Если бы речь шла про C++, мы бы могли создать объект на стеке, а в деструкторе объекта сделать все, что нам нужно, поскольку деструтор бы вызвался после выполнения последней строчки statement expression. К счастью, clang поддерживает gcc-extension который позволяет выставить cleanup-функцию (аналог деструктора) для любой переменной на стеке, которая будет вызвана в тот момент, когда переменая уйдет из области видимости. Через этот extension работает макрос @onExit из libextobjc.
Для реализации проверки счетчика ссылок понадобится дополнительная структура:
struct RefCountCheckerData {
CFTypeRef weakSelf;
NSUInteger refCountBefore;
};
И функция, которая будет выставлена как cleanup.
static inline void vbr_CheckRefCountForWeakSelf(struct RefCountCheckerData *data) {
const NSInteger refCountAfter = CFGetRetainCount(data->weakSelf);
const NSInteger countOfSelfRefInBlock = refCountAfter - data->refCountBefore;
if (countOfSelfRefInBlock > 0) {
raise(SIGPIPE);
}
}
Создаем структуру на стеке, выставляем cleanup функцию и инициализируем указатель на weakSelf и число ссылок на него. Cleanup функция вызовется когда переменная _private_refCountCheckerData уйдет из области видимости, а в этот момент наш блок уже в heap.
self.block = {(
__weak typeof(self) weakSelf = self;
__attribute__((cleanup(vbr_CheckRefCountForWeakSelf), unused))
struct RefCountCheckerData _private_refCountCheckerData = {
.weakSelf = (__bridge CFTypeRef)self,
.refCountBefore = CFGetRetainCount((__bridge CFTypeRef)self),
};
^(NSObject *obj) {
__strong typeof(self)self = weakSelf;
return ^ (void) {
NSLog(@"%@, %@", [self description], obj);
return 0;
}();
};
});
С такой версией макроса сработает breakpoint в отладчике при попытке получить доступ к ivar не через self, например таком self.block = ^{ NSLog(@"%d", _ivarInteger); };
Перед тем как, представить финальный вариант макроса, нужно привести его в современный хипстерский вид. Для ObjC модно делать макросы начинающиеся, как и ключевые слова языка, с @, например: @strongify, @onExit. Но препроцессор не разрешает использовать @ как часть имени макроса. В extobjc для этого используют вставку в начало макроса autoreleasepool {} либо try {} catch (...) {}, символ @ таким образом приклеивается либо к try либо к autoreleasepool. После разворачивания макроса в коде появляется ненужный пустой autoreleasepool либо try catch, но это никого сильно не волнует. Однако такой подход не работает для макроса weakself, потому что результат weakself это выражение, а выражение не может содержать @autoreleasepool try {} catch (...) {} в начале.
self.block = @weakself(^(NSObject *obj)) {
NSLog(@"%@ %@", [self description], obj);
return 0;
} @weakselfend ;
Когда речь идет о сложных выражениях в С на ум первым делом приходит тернарный оператор. Осталось понять, как его применить. Первым в голову пришло записать как-то так: self.block = @1? /* здесь код блоков */: nil;
Для этого нужно всего лишь добавить 1? в начало weakself и :nil; в конец weakselfend. Но self.block = 1? /* здесь код блоков */: nil; вполне корректное выражение, поэтому @weakself и weakself будут работать.
Вариант self.block = @[]? /* здесь код блоков */: nil; не дает использовать @weakself без @, однако после проверки дизассемблера выяснилось, что оптимизатор не выбрасывает создание пустого массива, а это лишний overhead в runtime.
Наконец в голову пришла идея использовать особенности String Literal Concatenation в ObjC.
const char *s0 = "ABC" "DEF"; // это валидная C-строка "ABCDEF"
NSString *s1 = @"ABC" @"DEF"; // это валидная ObjC-строка @"ABCDEF"
NSString *s2 = @"ABC" "DEF"; // это тоже валидная ObjC-строка @"ABCDEF"
NSString *s3 = "ABC" @"DEF"; // а это ошибка компиляции
Итак, финальный вариант макроса:
#define weakself(ARGS)
"weakself should be called as @weakself" @"" ?
({ __weak typeof(self) _private_weakSelf = self;
ARGS {
__strong typeof(_private_weakSelf) self __attribute__((unused)) = _private_weakSelf;
return ^ (void) {
#define weakselfnotnil(ARGS)
"weakself should be called as @weakself" @"" ?
({ __weak typeof(self) _private_weakSelf = self;
ARGS {
__strong typeof(_private_weakSelf) self __attribute__((unused)) = _private_weakSelf;
return ^ (void) { if (self)
#define weakselfend
try {} @finally {} } (); };
}) : nil
@weakselfnotnil отличается тем, что если к моменту вызова блока self уже удален, то блок не вызовется. Подходит только для случаев, когда блок не имеет возвращаемого значения, иначе не понятно, что возвращать в случае если self уже удален. Сделан в основном для безопасного использования ivar через явное разыменованиее self:
self.block = @weakselfnotnil(^) {
NSLog(@"%d", self->_ivar);
} @weakselfend;
Производительность
Сильно беспокоиться из-за производительности тут, пожалуй, не стоит, накладных расходов должно быть не много. Трюк для добавления @ в начало макроса полностью выбрасывается оптимизатором. С накладными расходами на вызов дополнительного блока дела обстоят интереснее. Для проверки как обстоят дела с накладными расходами рассмотрим 2 случая, с использованием макросов из libextobjc и нашего weakself:
- (void)m1 {
@weakify(self);
self.block = ^(NSObject * obj) {
@strongify(self);
NSLog(@"%@", [self description]);
return 0;
};
}
- (void)m2 {
self.block = @weakself(^(NSObject * obj)) {
NSLog(@"%@", [self description]);
return 0;
} @weakselfend;
}
function -[ViewController m1] {
asm{ vst1.64 {d8, d9, d10, d11}, [r4:128]! };
asm{ vst1.64 {d12, d13, d14, d15}, [r4:128] };
r1 = *_NSConcreteStackBlock;
*((sp - 0x40 & !0xf) - 0x50) = r1;
var_4 = 0xc2000000;
var_24 = ((sp - 0x40 & !0xf) - 0x50) + 0x14;
asm{ stm.w r5, {r1, r2, r3} };
r5 = [r0 retain];
objc_initWeak(var_24, r5);
[r5 release];
r0 = *__objc_personality_v0;
r1 = *0xac24;
var_52 = r0;
var_56 = GCC_except_table0;
var_60 = &var_12;
var_68 = (sp - 0x40 & !0xf) - 0x50;
var_64 = (r1 | 0x1) + 0xabc4;
var_32 = 0x1;
[r5 setBlock1:(sp - 0x40 & !0xf) - 0x50];
objc_destroyWeak(var_24);
r0 = _Unwind_SjLj_Unregister(&var_28);
asm{ vld1.64 {d8, d9, d10, d11}, [r4:128]! };
asm{ vld1.64 {d12, d13, d14, d15}, [r4:128] };
Pop();
Pop();
Pop();
return r0;
}
function ___20-[ViewController m1]_block_invoke {
r4 = objc_loadWeakRetained(r0 + 0x14);
r0 = [r4 description];
r5 = [r0 retain];
NSLog(@"%@", r5);
[r5 release];
[r4 release];
return 0x0;
}
function -[ViewController m2] {
r4 = r0;
r0 = *_NSConcreteStackBlock;
*(sp - 0x18) = r0;
var_4 = 0xc2000000;
asm{ stm.w r3, {r0, r1, r2} };
objc_initWeak((sp - 0x18) + 0x14, r4);
r5 = objc_retainBlock(sp - 0x18);
objc_destroyWeak((sp - 0x18) + 0x14);
[r4 setBlock1:r5];
r0 = [r5 release];
return r0;
}
function ___20-[ViewController m2]_block_invoke {
r4 = objc_loadWeakRetained(r0 + 0x14);
r0 = [r4 description];
r5 = [r0 retain];
NSLog(@"%@", r5);
[r5 release];
[r4 release];
return 0x0;
}
Получается, что weakself эффективнее чем @weakify/strongify, внутренний дополнительный блок полностью заинлайнился и _block_invoke в обоих случаях выглядит одинаково. Но способ которым в extobjc «съедают» @ в начале макроса добавляет бесполезный код по обработке исключений в рантайме, что видно по _Unwind_SjLj_Unregister.
function ___20-[ViewController m2]_block_invoke {
r0 = objc_loadWeakRetained(r0 + 0x14);
r1 = *_NSConcreteStackBlock;
*(sp - 0x18) = r1;
var_4 = 0xc2000000;
asm{ stm.w r4, {r1, r2, r3} };
var_20 = r0;
r4 = [r0 retain];
r5 = ___20-[ViewController m2]_block_invoke_2(sp - 0x18);
[var_20 release];
[r4 release];
r0 = r5;
return r0;
}
function ___20-[ViewController m2]_block_invoke_2 {
r0 = *(r0 + 0x14);
r0 = [r0 description];
r4 = [r0 retain];
NSLog(@"%@", r4);
[r4 release];
return 0x0;
}
К сожалению, clang пока не позволяет добавить атрибут always_inline к блоку.
Полный исходный код и autocomplete для Xcode тут.
Автор: notorca