Мозг обладает великолепной способностью различать лица и другие сложные объекты. Вот уже несколько десятилетий учёные безрезультатно бьются над задачей и пытаются понять, как происходит такое распознавание — как кодируются и хранятся изображения в мозге. Согласно общепринятым представлениям, процесс распознавания (идентификации объектов) происходит в нижневисочной коре, то есть инферотемпоральной зоне головного мозга. Но до сих пор оставалось непонятным, какую роль в кодировании данных играют отдельные нейроны и какое количество нейронов, собственно, задействуется в процессе.
Двое биологов из Калифорнийского технологического университета опубликовали научную работу, которая во многом проливает свет на то, как работает головной мозг приматов, в том числе человека. Учёные считают, что расшифровали код, которым в мозге кодируется информация о лицах. Доказательством является то, что учёные смогли только по сигналу мозга восстанавливать (угадывать) лица, которые видит обезьяна (и, соответственно, человек).
Специалисты провели эксперимент с помощью магнитно-резонансной томографии, считывая сигналы нейронов в области коры головного мозга макак, которая отвечает за идентификацию объектов. Во время сканирования мозга подопытным макакам демонстрировали 2000 немного отличающихся лиц людей. Определяя различия в активности нейронов при визуальной обработке разных лиц, учёным удалось сделать предположения о том, каким образом кодируется сигнал. Судя по всему, система обработки визуальной информации макак очень похожа на человеческую. Согласно результатам исследования, для кодирования информации о лицах достаточно всего 205 (!) нейронов головного мозга (их назвали «лицевыми нейронами»).
Учёные научились предсказывать, какое лицо видит макака, считывая сигнал с 200 «лицевых нейронов» её мозга. Это доказывает, что они корректно определили шифр, которым кодируются характеристики лица в этих нейронах
У социальных приматов, таких как макака и человек, эволюция выработала специальный механизм для быстрого распознавания лиц, потому что от этого навыка зависит выживание животного в социальной группе — мы должны мгновенно отличать друзей от незнакомцев. Секундное промедление может стоить жизни, поэтому мозг научился решать эту задачу быстро и эффективно (то есть те, кто мог выполнять задачу быстро и эффективно — выжили).
Казалось бы, логично выделить по одному нейрону на каждое лицо, ведь в мозге действительно есть специфические нейроны, которые реагируют на конкретных людей (их называют клетками Дженнифер Энистон, потому что их открыли у пациента с эпилепсией, мозг которого именно таким уникальным образом реагировал на фотографии Дженнифер Энистон). Но нет, распознавание лиц в общем случае работает не так, потому что ему нужно обрабатывать в том числе лица, которые он никогда не видел раньше, и здесь тоже важна идентификация «свой-чужой».
У нас система распознавания лиц в мозге состоит из кластеров коры минимум по 10 тыс. нейронов. В каждом полушарии располагается шесть таких кластеров, они находятся около уха.
Как только в поле зрения человека попадается лицо другого человека, электрический сигнал немедленно активирует нейроны в этой области, он проходит через пять или шесть названных кластеров и обрабатывается в каждом из них, прежде чем достигнет «лицевых нейронов». Таким образом, в последних хранится только высокоуровневая обработанная информация о специфических характеристиках лица. И вот эти примерно 205 нейронов кодируют информацию о лицах невероятно простым и абстрактным образом.
Ключевая особенность кодирования информации о лицах в мозге — это сочетания габаритов лица и отдельных объектов на лице (межглазное расстояние и проч.). Всего мозг учитывает около 50 таких параметров при распознавании лиц. В таком «лицевом пространстве» умещается практически любое фактически допустимое количество лиц, так что спутать два лица мозг не может. По мнению учёных, для «лицевых нейронов» есть некое подобие шаблона — что-то вроде «среднего лица», и реакция нейрона на новое лицо является разницей каждой из 50-ти характеристик от этой «базы».
В процессе эксперимента учёные из Калифорнийского технологического университета смогли смоделировать лица, которые отличаются настолько минимально и конкретно, что разница в сигнале составляет всего один нейрон. То есть они смогли понять, какой нейрон отвечает за какую характеристику в распознавании лиц. Каждый «лицевой нейрон» считывает комбинированный вектор примерно шести таких параметров. Например, по одному из параметров лицо отличается от «базы» на пять пунктов, по другому параметру — на минус семь пунктов. Сигнал от 205 клеток вместе создаёт уникальный паттерн конкретного лица.
Изменение формы лица путём изменения 50-ти ключевых характеристик
Как уже было сказано, учёные научились идентифицировать, какие характеристики кодируются какими нейронами. Они смогли синтезировать лица, на которые не будут реагировать конкретные нейроны, и даже угадывать, какое лицо видит макака, просто по сигналу от «лицевых нейронов».
Эксперимент и выводы учёных нуждаются в повторении и проверке, но если они окажутся правдивыми, то мы сможем чуть лучше понять систему шифрования, которая используется в той сложной вычислительной системе, какой является мозг человека и других приматов. Это открытие может найти практическое применение в сфере робототехники и подсказать новые подходы в разработке систем машинного зрения.
«Взлом кода для распознавания лиц определённо будет иметь большое значение», — считает Брэд Дюшейн (Brad Duchaine), эксперт в области распознавания лиц из Университета Дартмута. Самое главное, что учёные получили знак, что распознавание изображений в мозге работает по чётким и понятным правилам. Ведь последние достижения в области нейросетей показали, что после обучения нейросети человек зачастую не может понять, на какие стимулы реагирует нейросеть — это своеобразный «чёрный ящик», который функционирует по непонятным правилам. Появились опасения, что человеческий мозг может представлять собой такую же непостижимую систему. К счастью, это оказалось не так.
Научная работа опубликована 1 июня 2017 года в журнале Cell (doi:10.1016/j.cell.2017.05.011), pdf.