В IBM не занимаются «когнитивными вычислениями», вне зависимости от того, сколько раз они повторят эти слова
Вчера я переписывался со старым другом, и он напомнил мне о нашем разговоре, состоявшемся почти 50 лет назад. Я пытался объяснить ему, чем я зарабатываю на жизнь, а он пытался понять, почему заставить компьютеры понять что-либо было более сложным делом, чем анализ ключевых слов. Я объяснял концепции предложений, и то, что предложения состоят из слов, но люди на самом деле не используют слова, когда думают – кроме случаев, когда им необходимо добраться до лежащих в их основе идей, и именно с этим у компьютеров возникают сложности.
Спустя 50 лет ключевые слова всё ещё стоят на первом месте у людей, пытающихся заставить компьютеры работать с языком. Однако на этот раз ключевым словом, при помощи которого люди обманывают общественность, служит ИИ. Люди объявляют, что ИИ существует, ИИ думает, и что мы все должны его бояться, или радоваться его приходу – я забыл, что именно.
В какой-то момент мы добились определённых успехов в понимании естественного языка компьютерами, но в 1984 году началась «зима ИИ». Она началась из-за слишком большого количества обещаний по поводу того, что сможет делать ИИ, и что он реально сделать не смог. (Тогда все рекламировали экспертные системы – и где они теперь?) Финансирование прекратилось, а вместе с ним остановилась и реальная работа над обработкой естественного языка.
Но люди до сих пор носятся с ключевыми словами, поскольку Google и им подобные используют их для «поиска». С поиском всё нормально, пока мы подсчитываем слова – именно такого рода задачами и занимаются при анализе данных и машинном обучении. Конечно, подсчитав слова, можно проводить корреляции, и пользователи могут узнать о том, какие слова часто связаны с какими, и использовать эту информацию. Но пользователям пришлось приспособиться к Google, а не наоборот. Мы знаем, что можно вписать в строку поиска, а что нельзя, и мы совершаем такой поиск, с каким Google нам, скорее всего, сможет помочь. Мы знаем, что мы ищем тексты, а не ответы, и не собираемся начинать разговор с некоей сущностью, знающей, о чём мы хотим поговорить. Люди обучаются через диалог, а с Google диалога не получится. Я могу притвориться, что веду диалог с Siri, но на самом деле эти диалоги становятся утомительными, если выходят за пределы вопросов типа, где мне поесть.
Но я не волнуюсь по поводу Google. Наши нужды он удовлетворяет неплохо. Меня волнуют преувеличенные заявления, которые IBM делает о своей программе Watson. Недавно у них прошла рекламка с Бобом Диланом, которая была бы очень смешной, если бы она не разозлила меня так сильно.
Скажу прямо: Watson – это обман. Я не утверждаю, что программа не может обрабатывать слова, и кому-то это даже может приносить пользу. Но её реклама обманывает вас.
Вот отрывок из Ad Week:
Компьютер похваляется, что может читать 800 миллионов страниц в секунду, определяя ключевые темы в работах Дилана, вроде «время уходит» и «любовь угасает».
Энн Рубин, вице-президент IBM по брендированию, рассказала Adweek, что реклама понадобилась, чтобы помочь людям понять новый мир когнитивных вычислений.
«Мы концентрируемся на рекламе, но это гораздо больше, чем просто рекламная кампания, – говорит Рубин. – Это точка зрения IBM, и ею пронизан весь наш маркетинг, наше внутрикорпоративное общение, то, как мы работаем с поставщиками и сотрудниками. Она пронизывает всё, что мы делаем».
IBM говорит, что новая серия реклам должна донести до более широкой аудитории – компаний, принимающих решения людей, разработчиков ПО – понимание того, как работает Watson. В отличие от компьютеров, программируемых обычным образом, такие когнитивные системы, как Watson, понимают, рассуждают и учатся. Компания говорит, что пользу от системы могут получить такие индустрии, как банковская, страховая, здравоохранение и розничная торговля.
Рубин сказала, что Watson умеет думать лучше, чем человеческий мозг, в таких областях, где поиск ответов и связей затрудняется из-за обилия данных. «Можно придумать, что делать с раком, рисками, сомнениями, конкурентами, если принять идею когнитивных вычислений», – говорит она.
Серьёзно? Я ребёнок 60-х, и довольно хорошо помню песни Дилана. Спросите любого из этой эры по поводу Боба Дилана, и никто вам не скажет, что главная тема его песен – это «любовь проходит». Он был певцом протеста и пел о превратностях жизни. Он участвовал в антивоенном движении. Любовь проходит? Это выдал тупой компьютер, умеющий считать слова. Откуда бы Watson мог знать, что многие песни Дилана были частью антивоенного движения? Он что, часто повторял слово «антивоенный»? Да этого слова, возможно, вообще не звучало в его песнях.
В протестной песне №1 Боба Дилана, «The Times They Are a-Changin», Дилан пошёл ва-банк и скрестил народное движение протеста в 1960-х с движением за гражданские права.
Короткие куплеты накладывались друг на друга и производили мощное впечатление, а слова типа:
There's a battle outside and it is ragin'
It’ll soon shake your windows and rattle your walls
For the times they are a-changin'
Там идёт битва, и она разгорается
Скоро она будет сотрясать ваши окна, и шатать ваши стены
Поскольку времена меняются
стали культовыми заявлениями Дилана и пережили своё время.
Но он не поёт про Вьетнам или гражданские права. Поэтому Watson'у было бы невдомёк, что с этими понятиями есть какая-то связь. Есть возможность говорить на какую-то тему, употребляя слова, не говорящие о ней напрямую. Многое значат фундаментальные знания. Несколько лет назад я спросил 20-летнего человека по поводу Боба Дилана, и оказалось, что он никогда о нём не слышал. Он мало что знал про 60-е. Мало что знает и Watson. Нельзя понять слов, не понимая контекста.
Допустим, я вам скажу, что мой друг покупает слишком много снотворного, и я за него волнуюсь. Скажет ли Watson, что я намекаю на самоубийство? Посоветует ли он быстро бежать к другу и побеседовать с ним о его проблемах? Нет, конечно. Люди понимают контекст, поскольку они знают, как работает мир и какие у людей бывают проблемы. Они не считают слова.
А вот ещё, с другого сайта:
Называть Боба Диланаотцом народной музыки будет, наверно, преувеличением. Но совершенно точно можно сказать, что этот певец – один из выдающихся авторов антивоенных и протестных песен ХХ века, поэтому он вполне достоин создания рейтинга 10 лучших протестных песен Боба Дилана. Певец менял свой репертуар от поругания истеблишмента до музыки кантри, поп-музыки и народной музыки, и остаётся продуктивным на поприще протестов против власть предержащих.
Это написал человек. Как я об этом узнал? Потому что Watson не может делать выводы, подсчитав слова на 800 миллионах страниц текста.
Более всего меня расстраивает не Watson, а заявления IBM. Цитирую:
В отличие от компьютеров, программируемых обычным образом, такие когнитивные системы, как Watson, понимают, рассуждают и учатся.
Энн Рубин, вице-президент IBM по брендированию, рассказала Adweek, что реклама понадобилась, чтобы помочь людям понять новый мир когнитивных вычислений.
Я открыл компанию Cognitive Systems в 1981-м. То, о чём я тогда говорил, в IBM очевидно, не читали (хотя им явно понравились используемые мною слова). Watson не рассуждает. Рассуждать можно, только если у вас есть цели, планы, способы их достижения, понимание того, во что могут верить другие, и знание о прошлом опыте, на основе которого можно делать выводы. Также не помешает точка зрения. Что Watson думает, скажем, о терроризме?
Тупой вопрос? Реально думающие существа имеют свою точку зрения по поводу терроризма. У собак её нет, но Watson и до собаки не дотягивает (к примеру, собака хотя бы знает, как привлечь моё внимание).
В 80-х я придумал такую вещь, как "рассуждения на основе прецедентов": она должна была дать возможность компьютерам сравнивать новые ситуации со старыми и на основе этого изменять то, что компьютер считал результатом. У нас получилось построить кое-какие полезные системы. И мы многое узнали о том, как учится человек. Считал ли я, что мы создали компьютеры, которые скоро превзойдут людей по части мышления или станут разумными? Нет, конечно. Я считал, что мы начали создавать компьютеры, которые смогут стать более полезными людям.
Было бы неплохо, если бы IBM поумерила шумиху и сообщила людям, на что реально способен Watson, и перестала бы пороть чушь насчёт уходящей любви и обдумывания рака. IBM обманывает нас, и ей необходимо остановиться.