Никакого духа в машине нет
В последние несколько лет СМИ захлестнули преувеличенные описания технологий искусственного интеллекта (ИИ) и машинного обучения (МО). Кажется, что ещё ни разу в области информатики не было такого, чтобы столько смехотворных заявлений делало такое количество людей, обладающих таким малым представлением о происходящем. Для любого человека, активно занимавшегося передовым компьютерным оборудованием в 1980-х, происходящее кажется странным.
В номере The Atlantic за этот месяц интеллектуал высокого полёта и автор бестселлеров "Sapiens. Краткая история человечества" и " Homo Deus: Краткая история завтрашнего дня", Юваль Ной Харари описывает влияние ИИ на демократию. Самым интересным аспектом статьи является чрезмерная вера Харари в возможности современных технологий ИИ. Он описывает товарища Google, программу для игры в шахматы от компании DeepMind, как «творческую», «обладающую воображением» и «гениальными инстинктами».
В документальном фильме ВВС «Радость ИИ» профессор Джим Аль-Халили и основатель DeepMind Демис Хассабис описывают, как ИИ-система «сделала настоящее открытие», «способна реально породить новую идею» и разработала «стратегии, придуманные самостоятельно».
И если подобный поток преувеличений и антропоморфизмов используется для описания тупых и механистических систем, то настало время для проверки реальности с возвращением к основам.
Обсуждение компьютерных технологий часто происходит посредством мифов, метафор и человеческих интерпретаций того, что появляется на экране. Метафоры типа «интуиция», «творческое начало» и более новые «стратегии» являются частью нарождающейся мифологии. Эксперты по ИИ находят в игровых ходах ИИ закономерности и называют их «стратегиями», но нейросеть и понятия не имеет о том, что такое стратегия. Если и есть какое-то творческое начало, то оно принадлежат исследователям из DeepMind, разрабатывающим и управляющим процессами тренировки систем.
Сегодняшние системы ИИ тренируются на основе огромного количества автоматизированных проб и ошибок; на каждом этапе для передачи информации об ошибках и подстройки системы с целью уменьшения количества ошибок в будущем используется техника обратного распространения – и это постепенно улучшает эффективность ИИ в выполнении определённой задачи, такой, как игра в шахматы.
Происходящий всплеск эффективности ИИ, МО и т.н. «глубинного обучения» (ГО) по большей части основан на применении этой техники обратного распространения. Её впервые придумали в 1960-х, а к нейросетям её применил в 1980-х Джоффри Хинтон. Иначе говоря, в течение более чем 30 лет никакого значительного концептуального прогресса в области ИИ не было. Большая часть результатов исследований в области ИИ и статей в СМИ показывает, что происходит, когда на исполнение старой идеи бросают горы дорогого вычислительного оборудования и хитроумную рекламную кампанию.
И нельзя сказать, что в компании DeepMind не делают ценной работы. Вспомогательная работа машин при создании новых стратегий и идей – штука интересная, особенно если работу этой машины сложно понять из-за её сложности. В нашей светской культуре магия и загадка технологий манит людей, и придание загадочного образа по большей части сухой и рациональной инженерной области идёт только на пользу. Но в машине-товарище Google нет никакого духа.
Железо против софта, аналоговое против цифрового, Томпсон против Хассабиса
Вся шумиха вокруг машин DeepMind напоминает мне радостное возбуждение, возникшее пару десятилетий назад на волне совсем другой, и, возможно, более глубокой системы «машинного обучения».
В ноябре 1997 года работа Адриана Томпсона – исследователя из Центра вычислительной нейробиологии и робототехники Сассекского университета – попала на обложку журнала New Scientist вместе со статьёй «Создания из доисторического кремния – выпускаем дарвинизм в лаборатории электроники и смотрим, что он создаст. Жёсткая машина, которую никто не понимает».
Работа Томпсона вызвала небольшую сенсацию, поскольку он отверг обычаи и запустил эволюцию МО-системы в электронном оборудовании, вместо того, чтобы как все, использовать программный подход. Он решил сделать это, поскольку понял, что возможности цифрового ПО ограничены двоичной вкл/выкл природой переключателей, составляющих обрабатывающий сигналы
Нейроны человеческого
В своей лаборатории Томпсон провёл эволюцию конфигурации FPGA (типа цифрового кремниевого чипа, в котором связи между его цифровыми переключателями можно постоянно перенастраивать) в целях научить его разделять два разных аудиосигнала. Заглянув после этого внутрь чипа, чтобы посмотреть, как эволюционный процесс настроил связи между переключателями, он отметил впечатляюще эффективную схему работы – она использовала всего 37 компонентов.
Кроме того, получившаяся в результате эволюции схема перестала быть понятной цифровым инженерам. Некоторые из 37 компонент не были связаны с другими, но при их удалении из схемы вся система переставала работать. Единственным разумным объяснением этой странной ситуации было то, что система использовала какие-то загадочные электромагнитные связи между своими вроде как цифровыми компонентами. Иначе говоря, эволюционный процесс взял на вооружение аналоговые характеристики компонентов и материалов системы из реального мира, чтобы проводить свои «вычисления».
Это был взрыв
Хассабис начинал в качестве ведущего программиста ИИ в забытой ныне игре от Lionhead Studio, Black & White.
Так что же произошло? Почему Томпсон практически забыт, а материнская компания Google, Alphabet, закидывает Хассабиса деньгами, а документалки от ВВС поют ему панегирики? По большей части, дело в удачном моменте. В 1990-х ИИ был модным, как бабушкины панталоны. Сегодня на плечах ИИ лежит груз необходимости привести нас к «четвёртой индустриальной революции». Капитал гоняется за «следующим крупным проектом». И хотя цифровые ИИ-системы от DeepMind не очень подходят для моделирования сложных аналоговых систем реального мира вроде погоды или человеческого
DeepMind также пошло на пользу её способность показать товар лицом. DeepMind рекламировала свои технологии и руководство, культивируя технологическую загадочность, однако вся демонстрация её работы сводилась к игрушкам с простейшими вычислимыми правилами. Преимущество игр состоит в их понятности и визуальной привлекательности для СМИ и общественности. На самом деле, большая часть коммерческих применений этой технологии будет связана с банальными фоновыми бизнес-приложениями, например, оптимизацией энергоэффективности дата-центров, в которых Google держит свои компьютеры.
Ceci n'est pas une paddle*
*«Это не весло» – отсылка к картине "Вероломство образов"
Общими у Томпсона и Хассабиса – кроме принадлежности к Британии — определённо были опыт и умения, необходимые для эффективной тренировки и эволюции их систем, но такая зависимость от умений и творческого начала людей, очевидно, является слабостью любого ИИ или МО-системы. Также их технологии были весьма хрупкими. К примеру, системы Томпсона часто переставали работать при температурах, отличных от тех, при которых они эволюционировали. Тем временем в DeepMind простое изменение размера весла в одной из видеоигр компании полностью сводило на нет эффективность ИИ. Эта хрупкость связана с тем, что ИИ от DeepMind не понимает, что такое весло – и даже сама видеоигра; её переключатели работают только с двоичными числами.
Системы МО в последнее время действительно достигли больших успехов, но этот прогресс, по большей части, был получен благодаря использованию для решения задач огромного количества стандартного вычислительного оборудования, а не радикальным инновациям. В какой-то момент недалёкого будущего уже не получится запихнуть больше крохотных кремниевых переключателей на кремниевый чип. Эффективность схемы (больше вычислений на меньшем количестве оборудования) станет важной коммерчески, и в этот момент эволюционирующее оборудование может, наконец, стать модным.
Могут появиться и гибридные системы, комбинирующие подходы Томпсона и Хассабиса. Но, что бы ни случилось, Харрари придётся подождать, пока он сможет приобрести «творческую» ИИ-систему для написания своего следующего бестселлера.
Автор: Вячеслав Голованов