Адаптировали статью Marina Tosic, в которой автор выясняет, в чём сходства и различия между устройством человеческого мозга и моделей машинного обучения. Разобраться в теме нам помогли: кандидат технических наук Василий Борисов и архитектор ML-решений в РБК Кирилл Думнов.
В 2024 году значение машинного обучения и искусственного интеллекта, наконец, признали все, в том числе Нобелевский комитет. Демис Хассабис и Джон Джампер получили Нобелевскую премию по химии за ИИ-модель, с помощью которой удалось решить поставленную полвека назад задачу предсказания структуры белков. А Нобелевскую премию по физике присудилиДжону Хопфилду и Джеффри Хинтону за изобретение ассоциативной нейронной сети — моделей ИИ, сходных с интеллектом человека.
Время от времени в обществе поднимается беспокойная дискуссия о том, заберёт ли искусственный интеллект работу у белых воротничков, как в своё время тяжёлый физический труд отобрали у человека средства индустриализации. ИИ всё сильнее напоминает человеческий подход к решению задач и принятию решений, и уже не так редко превосходит возможности человека по обработке информации.
Но механизмы человеческого познания изучены не до конца. Никто в полной мере не знает, как устроена психология человеческих поступков и реакций, складывающаяся из факторов сознательного и подсознательного. Она слишком неоднородна и многослойна.
Как работает модель машинного обучения
Машинное обучение — это разновидность ИИ, с помощью которой компьютеры и серверы учатся на накопленных данных, а потом, анализируя новые данные, составляют прогнозы или принимают решения. При этом на программном уровне учтены и заложены не все возможные сценарии.
Наиболее распространённые ML-сценарии:
прогнозирование или регрессия (прогнозирование цен на недвижимость);
классификация (разметка изображений с собаками и кошками);
кластеризация (поиск групп клиентов на основании анализа их покупательских привычек);
выявление аномалий (поиск исключений в транзакциях для выявления мошенничества).
В какой-то мере можно сопоставить эти сценарии с ежедневными когнитивными задачами человека. Мы тоже занимаемся прогнозированием («Будет ли сегодня дождь?»), классификацией («Это друг или враг?») и выявлением аномалий («Этот сыр уже испортился?»). Различия сводятся к тому, как именно мы выполняем эти задачи, и какими исходными данными мы располагаем («Есть облака или небо ясное?»).
В перечисленных сценариях фундаментом получения высококачественных результатов является качество данных.
Важность базовых исходных данных
Для обучения ML-моделей используются разные виды данных:
структурированные данные (строки в электронной таблице);
полуструктурированные данные (файлы JSON, XML);
неструктурированные данные (изображения, PDF документы, текст в свободной форме, аудио и прочее).
Данные — это питательный субстрат для всех аналитических выводов, которые делает ML-модель. Специалисты тратят на подготовку данных приличную часть времени. Часто на это уходит порядка 50–70% от всех трудозатрат в ML-проекте.
Кирилл Думнов
Архитектор ML-решений в РБК, эксперт на онлайн-магистратуре МФТИ и Нетологии «Финансовые технологии и аналитика»
Для обучения искусственного интеллекта требуются огромные массивы данных, чётко определённые цели и специальные алгоритмы. В отличие от людей, нейросети не могут интуитивно переносить знания на новые области без дополнительного обучения, хотя transfer learning приближает их к этому.
На подготовительном этапе у ML-моделей появляется привкус «фильтрации и предварительной подготовки», которые у людей получаются сами собой.
Дата-сайентисты ищут исключения, обрабатывают недостающие значения и дублирующиеся данные, удаляют ненужную часть исходных данных или создают новые. Применяя чисто математический подход, они дорабатывают исходные данные с помощью весовых коэффициентов и конструирования признаков.
По сути, дата-сайентисты организуют исходные данные так, чтобы модель могла учиться на чистых высококачественных данных и выдавать надёжные результаты.
Как устроена человеческая психика
Психотерапевт Dee Penco описывает работу психики следующим образом. Представьте себе человека, как предварительно обученную модель чёрного ящика. Эта модель поступает к нам с предварительно загруженными паттернами знаний и коэффициентами, усвоенными на этапе обучения. Для каждого человека характерно уникальное сочетание этих паттернов и коэффициентов или факторов. Вот примерный список распространённых компонентов:
интеллект и IQ;
мир эмоций и EQ;
мир сознания — то, что модель успела выучить на данный момент: ценности, опыт, цели;
мир подсознательного и бессознательного — то, что к данному моменту модель успела выучить и подавить: краткосрочная и долгосрочная память + ценности, опыт, цели;
генетическая предрасположенность — то, с чем мы родились;
гормональное + физиологическое состояние — нейробиологическая, эндокринная система, возбуждение;
центры принятия решений — личность, эго, супер-эго, наши отдельные внутренние сущности;
интуитивное творчество — иногда его относят к указанной выше группе переменных, а иногда — к отдельным сущностям (интуиция, дивергентное мышление, состояние потока).
Все эти факторы взаимосвязаны и иногда так смешиваются друг с другом, что бывает сложно отделить одно от другого. Помимо этого, каждый фактор может быть относительно универсальным или специализированным, может содержать частицы или информацию, которая бывает доминирующей или недостаточной.
Кроме того, некий алгоритм внутри нас постоянно перетасовывает факторы по важности. Временами тот или иной фактор оказывается впереди, посередине или в хвосте. Например, голодному человеку именно чувство голода диктует, какая информация обрабатывается во вторую, третью, четвёртую очередь — от этого фактора зависит результат. Иными словами, на полный желудок не примешь тех решений, которые предпочтёшь, когда умираешь с голоду.
Если бы каким-то чудом удалось свести человека к уровню ML-моделей — это позволило бы вылечить почти все психические расстройства и кардинально улучшить жизнь людей. Жаль, у человека нельзя настроить или сбросить настройки психологических факторов так же просто, как это делается в машинном обучении.
Что общего в обучении мозга и ML-модели
Кирилл Думнов
Архитектор ML-решений в РБК, эксперт на онлайн-магистратуре МФТИ и Нетологии «Финансовые технологии и аналитика»
Если сравнивать человеческий мозг и модели машинного обучения в контексте принятия решений, то на первый взгляд они действительно похожи: и там, и там идёт обработка информации, поиск оптимального ответа, использование нейронных структур.
Человеческая интуиция во многом напоминает работу ML-модели. Когда мы сталкиваемся с новой ситуацией, мозг мгновенно выдаёт прогноз, основанный на накопленном опыте, даже если мы этого не осознаём. Это не магия, а результат многолетнего обучения на реальных жизненных примерах.
Если человеческий мозг — это вихревая галактика с бурей разных влияний, то модель машинного обучения — это солнечная система с чётко заданными орбитами. И та, и другая вращаются и развиваются, просто с разными масштабами сложности.
Василий Борисов
Кандидат технических наук, доцент, руководитель онлайн-магистратуры УрФУ и Нетологии «Прикладной искусственный интеллект» и «Инженерия машинного обучения»
Человеческий мозг и модели машинного обучения, несмотря на кажущееся различие, демонстрируют поразительное сходство в подходах к принятию решений. Оба используют сложные сети взаимосвязанных элементов (нейроны в мозге, узлы в искусственных нейронных сетях), обрабатывающих информацию параллельно и формирующих на её основе выходные сигналы. В обоих случаях важную роль играют весовые коэффициенты связей — синаптическая сила в мозге и веса синапсов в нейросетях, которые динамически изменяются в процессе обучения и определяют силу влияния одних элементов на другие.
Чем различаются подходы в обучении ML-модели и психики человека
Эксперты отмечают кардинальные различия в обучении ML-модели и человеческой психики.
Василий Борисов
Кандидат технических наук, доцент, руководитель онлайн-магистратуры УрФУ и Нетологии «Прикладной искусственный интеллект» и «Инженерия машинного обучения»
Мозг обладает гораздо большей пластичностью и способен к самоорганизации и адаптации на гораздо более высоком уровне, чем существующие ИИ-модели. Человеческий мозг обладает способностью к творчеству, интуиции и здравому смыслу, которые пока остаются недостижимыми для ML-моделей. Также наш мозг невероятно энергоэффективен, современные ML-модели потребляют значительно больше энергии для выполнения аналогичных задач.
Кирилл Думнов
Архитектор ML-решений в РБК, эксперт на онлайн-магистратуре МФТИ и Нетологии «Финансовые технологии и аналитика»
В машинном обучении применяется формализованный подход. Алгоритмы обучаются выявлять закономерности и делать предсказания на основе строгих математических моделей, без субъективного восприятия и эмоций. Кроме того, у машин нет субъективного восприятия, а их память не работает так же гибко, как у человека.
Подготовленные данные загружаются в ML-алгоритмы (например, нейросети, деревья принятия решений или ансамблевые методы). В типовой настройке контролируемого обучения алгоритм видит примеры, в которых размечены правильные ответы (например, тысяча рисунков с метками «кошка» или «собака»).
Потом ML-модель корректирует внутренние коэффициенты — «факторы важности» — чтобы с максимально возможной точностью сопоставить эти метки и подготовить прогноз. Основываясь на выученных паттернах, обученная модель может присваивать оценку вероятности, указывая, с какой вероятностью на каждом новом изображении показана «кошка» или «собака».
Василий Борисов
Кандидат технических наук, доцент, руководитель онлайн-магистратуры УрФУ и Нетологии «Прикладной искусственный интеллект» и «Инженерия машинного обучения»
Как и нейронные сети, мозг тоже обучается на основе опыта, корректируя весовые коэффициенты связей в зависимости от полученных результатов. Однако обучение мозга является непрерывным, саморегулируемым процессом, основанным на сложнейшей биохимической и физиологической регуляции, включая влияние эмоций, мотивации и бессознательных процессов.
Обучение же ML-моделей, как правило, происходит через контролируемые эксперименты с большими объёмами данных и основано на алгоритмически заданных правилах обновления весов. В данный момент, несмотря на активное развитие, процесс обучения нейронных сетей далёк от гибкости и эффективности обучения мозга.
Машинное обучение работает прямолинейнее, чем человеческий мозг. При решении задачи модель следует чётко определённому процессу суммирования исходных данных с присвоенными коэффициентами, а люди перетасовывают множество факторов: гормоны, подсознание или актуальные физические потребности. Так что у людей процесс принятия решений не такой прозрачный.
Изображение сгенерировано с помощью Canva AI
Существует два основных этапа создания моделей:
Обучение. Модели показывают размеченные данные. Она изучает паттерны, увязывая исходные данные (например, признаки изображений) с результатами (правильной разметкой изображённых животных).
Тестирование. По новым данным (новым изображениям кошек и собак, которые модель раньше не видела) дата-сайентисты измеряют, насколько хорошо она справляется с генерализацией. Если модель раз за разом ошибается с разметкой изображений, следует подправить параметры или добавить примеры для обучения, чтобы повысить точность генерируемых результатов.
Например, если в обучающем датасете 5 000 изображений собак и только 1 000 изображений кошек, модель будет чаще считать, что на картинке нарисована собака – если только не применить специальные приёмы для выравнивания этого дисбаланса. Для каждого возможного ответа («кошка» или «собака») количество примеров в исходном датасете влияет на сложность процесса обучения модели и на точность результатов.
Кирилл Думнов
Архитектор ML-решений в РБК, эксперт на онлайн-магистратуре МФТИ и Нетологии «Финансовые технологии и аналитика»
Мозг и ML совпадают в самой идее — учиться на данных и принимать решения на основе опыта. Но в то время как человек формирует интуитивные и адаптивные модели, машина опирается исключительно на математические закономерности и статистику.
Результаты обучения ML-модели и психики: постоянные корректировки и человеческий фактор
Может показаться, что ML-пайплайн устроен относительно просто. И всё же, его нельзя настроить раз и навсегда.
Когда прогнозы модели утрачивают точность (например, новые данные изменили сценарий), систему нужно переобучить и доработать. Опять же, дата-сайентисты должны решить, как очистить или обогатить данные и перенастроить параметры модели, чтобы улучшить её метрики эффективности. Это и есть «переобучение» в машинном обучении.
Это важно, потому что смещение и ошибки в данных или в моделях могут порождать некорректные результаты, последствия которых проникают в реальную жизнь. Например, модель оценки кредитоспособности, обученная на данных, в которые вкралось смещение, может систематически занижать рейтинг представителям определённых демографических групп, что приводит к несправедливому отказу в выдаче кредитов.
Для оптимизации результатов специалисты по-прежнему отслеживают цикл обратной связи при обучении машин, ведь так можно контролировать развитие и поведение ML/AI-модели.
Кирилл Думнов
Архитектор ML-решений в РБК, эксперт на онлайн-магистратуре МФТИ и Нетологии «Финансовые технологии и аналитика»
Человеческий мозг обучается неявно и многогранно: мы получаем информацию из опыта, эмоций, социальных взаимодействий, проб и ошибок. Наше обучение не ограничено конкретными задачами: мы можем адаптироваться к новой информации и делать выводы даже на основе небольшого количества примеров.
Хотя результаты работы мозга и ИИ могут быть похожи, они достигаются разными путями и с разными особенностями:
Человеческий мозг выдаёт гибкие, креативные решения, основанные на контексте, интуиции и эмоциональном восприятии. Мы можем находить нестандартные подходы и адаптироваться к неожиданным ситуациям. Однако наши решения подвержены когнитивным искажениям, усталости, субъективности.
ИИ работает строго по алгоритмам, анализирует данные быстрее и точнее в рамках заданных параметров. Он превосходит человека в обработке больших объёмов информации и нахождении скрытых закономерностей, но при этом ему сложно работать в условиях неопределённости, где важна интуиция и здравый смысл.
Что дальше: сможет ли ИИ стать сверхчеловеком
Психологи мечтают о дне, когда они смогут до конца познать человеческий мозг во всей его сложности. А специалисты по работе с данными мечтают о том дне, когда ИИ-модели дорастут до AGI (Artificial General Intelligence) — общего искусственного интеллекта, который соответствует или превосходит когнитивные способности человека. При этом каждая область остаётся по-своему уникальной.
Многие люди беспокоятся о том, что нас ждёт: что случится, когда ИИ дорастёт до AGI и заберёт ли он нашу работу благодаря сверхчеловеческим способностям.
Что, если ИИ пойдёт по нашей дорожке — научится испытывать эмоции, начнёт путаться в воспоминаниях, сформирует собственную идентичность и станет непредсказуемым? Мы же этого не ожидали, да?
Совсем не факт, что в конечном счёте ИИ нас превзойдёт. Может, мы его превзойдём. Эта мысль подводит нас к другому вопросу: точно ли черты человеческого характера (факторы) развиваются? Потому что, возможно, это и есть будущее искусственного интеллекта.
А пока что важно признать, что и человеческое мышление, и компьютерные модели могут учиться, адаптироваться и со временем менять решения. Для этого нужны подходящие исходные данные и желание дорабатывать процесс. Чтобы усовершенствовать результат, нужно выбрать исходные данные получше и оптимизировать процесс их обработки — будь то консультации с психологами или данные ML/AI и структура алгоритмов.
Подведём итоги: люди vs машины
Люди принимают решения под влиянием десятка взаимосвязанных факторов, а ML-модели генерируют результаты благодаря data-driven алгоритмам.
Хотя компьютеры и люди думают по-разному, основы их интеллектуальной деятельности на удивление похожи.
Люди получают и собирают исходные данные через органы чувств и хранят их в разных видах памяти. Это интуитивный процесс, в котором сочетаются логика, эмоции, гормоны, прошлый опыт, актуальность момента. Эти факторы подводят нас к тем или иным поступкам и поведению. Благодаря этому уникальному сочетанию люди могут быть одновременно предсказуемыми и непредсказуемыми, рациональными и эмоциональными.
В машинном обучении и искусственном интеллекте процесс основан на данных. Дата-сайентисты берут структурированные, полуструктурированные или неструктурированные данные, хранят, очищают или обогащают их, выполняют разметку, применяют к ним алгоритмы ML/AI. После этого разработанная модель генерирует прогнозы, решения или рекомендации. Но даже для такого, казалось бы, прямолинейного пайплайна всё равно нужны постоянный контроль и адаптация к новым сценариям благодаря усилиям человека.
Ментальные процессы человека непредсказуемы по сравнению с более отслеживаемой работой ML/AI-моделей с заданными параметрами. В этом и кроется ключевая разница в работе психики и ML-модели.
Василий Борисов
Кандидат технических наук, доцент, руководитель онлайн-магистратуры УрФУ и Нетологии «Прикладной искусственный интеллект» и «Инженерия машинного обучения»
Несмотря на некоторые общие черты в подходе к обработке информации и принятию решений, человеческий мозг и ML-модели пока остаются существенно различными системами. ML-модели могут превосходить человека в решении специфических узконаправленных задач. Однако человеческий мозг обладает уникальными когнитивными способностями, которые пока остаются недостижимыми для искусственного интеллекта.
Дальнейшее развитие ML может привести к более тесному сближению этих двух систем. Но полное подражание работе человеческого мозга вряд ли возможно в обозримом будущем.