На конференциях с недавнего времени стала мелькать тема “сильного искусственного интеллекта”, но, как правило, для меня находились более актуальные доклады, и я ее успешно избегал. Кроме того, в тридцатиминутном докладе люди стараются говорить как можно конкретнее, и полная картина для человека не в теме ускользает. Когда мне подвернулась книга “Сильный искусственный интеллект”, выпущенная “Альпина Паблишер”, я тут же принялся за ее изучение. Книга написана огромным количеством авторов, и часть имен хорошо известна в кругах Data Science.
Цель книги - обобщить мысли и наработки, которые появлялись за все время по теме AGI (Artificial General Intelligence). Расскажу о них коротко в этой статье. Надеюсь, они будут любопытны и вам.
Чтобы не грузить вас с самого начала терминами и умозаключениями, начну с обобщенной информации. Во введении авторы отвечают на вопрос, что на интуитивном уровне должен представлять AGI с точки зрения конечного решения. Приводятся примеры и мнения, почему текущие решения, которые уже широко освещаются в СМИ, под это определение не подходят. Почему то или иное решение выполняет ряд задач быстрее человека, но мы не приближаемся к AGI?
Всегда ли эффективен тест Тьюринга
Но обо всем по порядку. В главе 1 “Общая история искусственного интеллекта” описываются ключевые достижения, произошедшие с середины 20-го века, которые в некотором роде приблизили нас к созданию интеллектуальных систем. В главе 2 узнаем чуть больше, а именно подходы к определению уровня интеллекта. Если вы не слышали ни о чем, кроме теста Тьюринга, то здесь вы найдете для себя кое-что любопытное.
Тьюринг задался целью определить, может ли машина мыслить.
Стандартная интерпретация этого теста звучит следующим образом: «Человек взаимодействует с одним компьютером и одним человеком. На основании ответов на вопросы он должен определить, с кем он разговаривает: с человеком или компьютерной программой. Задача компьютерной программы — ввести человека в заблуждение, заставив сделать неверный выбор».
Все участники теста не видят друг друга. Если судья не может сказать определенно, кто из собеседников является человеком, то считается, что машина прошла тест. Чтобы протестировать именно интеллект машины, а не её возможность распознавать устную речь, беседа ведется в режиме «только текст», например, с помощью клавиатуры и экрана (компьютера-посредника). Переписка должна производиться через контролируемые промежутки времени, чтобы судья не мог делать заключения, исходя из скорости ответов. Во времена Тьюринга компьютеры реагировали медленнее человека. Сейчас это правило тоже необходимо, потому что они реагируют гораздо быстрее, чем человек.
Или вас не оставит чтение равнодушным, если вы уверены, что текущие решения уже проходят тест Тьюринга или еще не проходят, потому что на самом деле этот тест - только обобщение, а конкретные “реализации” могут быть разные, что в книге также раскрывается.
Представлен хороший обзор различных подходов (отличных от теста Тьюринга) и приведены их положительные и отрицательные стороны. Вывод такой, что привычные нам тесты, в том числе и тест на IQ, могут решаться узкими подходами или их комбинацией, а оценка AGI требует своего пути, но все наработки в этой области пока более теоретические, чем практические. В книге в том числе приводится пример, как тест Тьюринга проходился программой (Eugene Goostman) вообще без применения искусственного интеллекта, а лишь с использованием комбинации широкого дерева диалогов и ухода от тех вопросов, которые в дереве не прописаны: собеседник позиционировал себя как украинский мальчик, плохо говорящий на английском языке, т.е. защищал себя от сложных вопросов сразу и возрастом и незнанием языка. Но даже с использованием технологий искусственного интеллекта, создается впечатление, что для каждой отдельной реализации теста найдется узкоспециализированный подход, который этот тест решит. Возможным решением видится только создание второго AGI, который бы мог на ходу сам придумывать тесты для проверки первого AGI. Или же проверять его интуитивно, основываясь на нашем человеческом опыте.
Чем проще алгоритм - тем лучше
В главе 3 “Основные направления в AGI” описываются те дороги, которые в перспективе могут привести нас к созданию к AGI. Поскольку цель путешествия видится достаточно отдаленной, дорог таких много, и некоторые тянутся аж с прошлого столетия. В первую очередь авторы обратили наше внимание на глубокое обучение и его основные направления: обработка картинок, естественного языка и обучение с подкреплением. На мой вкус, описано слишком кратко, но в целом некоторые вехи недавнего времени обозначены.
Как мне видится, выводом из этого описания является то, что глубокое обучение разделено на отдельные составляющие по типу решаемых задач, и это же его и ограничивает, поскольку воспринимать картину мира через одну модальность затруднительно или даже невозможно.
Вторая дорога - создание качественной модели мозговой деятельности, т.е. правильного распределения каждой задачи на отдельные модули. И пусть каждый из этих модулей будет достаточно узким, но в совокупности система сможет решать сложные задачи.
Признаюсь, читать этот раздел мне было непросто. Авторами употребляются термины, нигде в тексте не объясняющиеся, - нить повествования постоянно теряется. Частично это связано и с тем, что до практической реализации далеко, а все основывается лишь на “кусочных” теоретических исследованиях. Тем не менее, это направление по сути предоставляет “архитектуру” для AGI или можно сказать “фреймворк”. Такие решения уже постепенно развиваются. Авторы приводят некоторое количество примеров, например OpenCog. Хотя в книге не очень то раскрывается суть такого фреймворка, но перейдя по ссылке (https://opencog.org/) вы увидете, что у проекта есть свое сообщество, мероприятия, видео лекции, wiki страничка и т.п.
Далее описывается зверь под названием “Универсальный алгоритмический интеллект”. Раздел содержит много примеров, и все они в некотором роде о “бритве Оккама”.
Бри́тва О́ккама - методологический принцип, в кратком виде гласящий: «Не следует множить сущее без необходимости» (либо «Не следует привлекать новые сущности без крайней на то необходимости»).
Этот принцип получил название от имени английского монаха-францисканца, философа-номиналиста Уильяма из Оккама. Сам Оккам писал: «Что может быть сделано на основе меньшего числа [предположений], не следует делать, исходя из большего» и «Многообразие не следует предполагать без необходимости».
Смысл такой, что поскольку мы не можем придумать модель, которая бы решила любую задачу, потому что при наличии таковой найдем задачу, которую модель решить не может, то давайте лучше будем для каждой новой задачи собирать модель из кусочков, руководствуясь как раз этой “бритвой” - алгоритм должен быть как можно проще. К сожалению, примеры в основном описываются последовательностями чисел и их продолжением. На таких примерах понятен примерный смысл: оценить количество информации заключенной в последовательности и количество информации в выбираемом алгоритме (через его длину) и сравнить. Если алгоритм сложнее, чем последовательность, то выбирать его не нужно. Но как экстраполировать такой подход на более сложные задачи неясно.
Приводятся некоторые современные элементы развития этой темы, в том числе с участием Юргена Шмидхубера. В конце раздела описывается вероятностное программирование, и, если я понял правильно, оно как раз и выполняет в этой концепции роль “бритвы”, т.е. строит распределение вероятностей на алгоритмах. И, наконец, авторы задаются вопросом: вот придумали мы общую концепцию по созданию AGI, но как ее реализовать с точки зрения текущего развития компьютерных наук, алгоритмов, языков программирования.
ИИ в виде робота или целой экосистемы?
В главе 4 “Варианты воплощения” авторы пытаются ответить на вопрос, а что в итоге должен представлять собой “сильный искусственный интеллект”, когда мы, наконец, сможем его создать.
В начале главы делаются некоторые “заготовки”: приводится небольшой экскурс в обучение с подкреплением (Reinforcement Learning (RL)), приводятся некоторые мысли по сочетанию модельного и безмодельного подходов взаимодействия агента с миром, внутренней и внешней мотивации для его обучения и по иерархии стратегий. Далее уже переходим к именно воплощениям.
Первый из вариантов - это, конечно же, “робот”. Для эффективного AGI необходимо, чтобы им была усвоена картина мира, и наличие множества возможностей этот мир воспринимать, перемещаться по нему, взаимодействовать с ним и где-то даже менять. А эти качества присущи физическим воплощениям чего-либо.
После этого авторы размышляют о пути к AGI через эволюционные подходы. Это объясняется тем, что роботу, о котором уже шла речь, или подходам, о которых идет речь дальше, необходимо учиться, или же оптимизировать свою стратегию. Как? Через классический RL, так и через эволюционные алгоритмы.
Но главный вопрос, на мой взгляд, что будет являться наградой или функцией приспособленности. Должен ли этот робот учиться выживать? В книге приводятся варианты воплощения “кнута и пряника” в виде внутренней и внешней мотиваций, но не совсем ясно, откуда они должны взяться.
Наконец, доходим до реализации “сильного интеллекта” в виде экосистемы, к чему сейчас вроде как и движемся, через, например, известную всем Алису. Однако глава завершается вновь не воплощением, а еще одним инструментом достижения цели, а именно нейронауками. Авторы утверждают, что исследования в этой области могут дать обществу новые идеи по реализации архитектур как когнитивных, так и нейросетевых.
Вместо заключения
Теперь, что касается моего мнения о книге.
Положительные моменты следующие: в книге описан действительно широкий спектр различных дисциплин, так или иначе связанных с попытками сформировать основу AGI. В каждом описании соответствующего направления достаточно ссылок, чтобы глубже изучить понравившуюся тему и ключевые факты/наименования, которые можно попросту загуглить. Думаю, такая книга может помочь многим людям, которые задумываются об AGI, не тратить время на изобретение собственных идей, чтобы потом с сожалением обнаружить, что в этом направлении уже кто-то поработал, а, наоборот, присоединиться к уже начавшимся проектам и помогать воплощать их в жизнь.
Моменты, которые меня немного смутили, связаны с логикой повествования. Если после прочтения открыть книгу на любой странице и прочитать случайно выбранный абзац, невозможно понять, зачем он здесь, как авторы или автор к нему пришел, по какой цепочке рассуждений и/или для чего завел вообще об этом разговор.
К тому же, из-за попытки вместить очень много дисциплин в одну книгу, не раскрываются термины. Поскольку цель у книги не расширить знания, а лишь дать обзор основных мотивов, кажется, что повествование должно быть как можно более понятным читателю со средним уровнем знаний по теме... И еще небольшая ремарка от меня, касающаяся примеров. Понятно, что при наличии такого большого числа авторов сложно синхронизироваться, в каком ключе все разъяснять, но меня немного удручало, что одну и ту же вещь объясняли по несколько раз в разных разделах.
Однако в целом, книга оказалась познавательной, так что я ее, скорее, рекомендовал бы к прочтению. Понимание того, чем текущие реализации отличаются от тех, что описываются писателями фантастами может оказаться полезной и в оценке рисков на тех или иных проектах по внедрению машинного и/или глубокого обучения. Кроме того,тема искусственного интеллекта так или иначе всплывает в работе, учебе, общении с друзьями едва ли не каждый день, а вы сможете блеснуть своими знаниями еще и о сильном.
Автор: Владислав Балаев