Прологику и ИИ

в 20:10, , рубрики: llm, ИИ, текстовые модели, экспертные системы

Демо выразительной мощи математики. Эта наука предлагает экстремально компактный способ для представления мыслей. И картинка это подтверждает: всего в двух абзацах определена вся суть аристотелевской логики (силлогистики, Ὄργανον), которая в оригинале занимает несколько книг.Формальная логика развилась к эпохе ЭВМ настолько, что стала основой одних из первых систем ИИ, в первую очередь экспертных систем и баз знаний.

Прологику и ИИ - 1

Случился даже бум интереса, хайп, похожий на то, что мы наблюдаем в области ИИ сегодня. А Япония даже разработала в 80-х целую государственную программу развития компьютеров 5-го поколения на основе ИИ. Всем казалось, что вот-вот ещё чуть-чуть и компьютеры чуть ли не научатся думать. Но реальность разочаровала.
Тем не менее эти системы ведь действительно обладают интеллектом, тем интеллектом, который в них заложен базой знаний (БЗ). И всё ограничивается размером и сложностью этой БЗ и вычислительной мощностью. Продвинутые экспертные системы активно и стабильно используются в современной промышленности. И их индустрия медленно, но неустанно развивается вот уже десятилетия. Без особых, правда, прорывов.
По-моему, IBM-ский Watson, победивший в своё время в Jeopardy! (аналоге "Своей игры") в США, во многом построен на использовании БЗ и экспертных систем. То есть эти системы могут как-то рассуждать.

Совсем другое дело современный тренд развития ИИ, ориентирующийся на обучаемые нейросетки, в первую очередь, LLM. Нейросетки удивительным образом могут схватывать кучу паттернов в текстах, речи, живописи, даже видео, химических формулах и других медиа. Они могут по этим паттернам генерировать нечто настолько похожее на реальность, что часто не отличишь. Но эти системы не учитывают смысл, потому что не видят его, поэтому часто генерируют бред, похожий на правду.
Вся их работа основана на повторении прочитанного/увиденного/воспринятого с некоторыми переработками. Сами переработки также основаны на воспринятом материале - существующих паттернах. Они не способны сгенерировать нечто интелллектуально новое, некую инновацию.
Если нейросети в обучающей выборке попалось несколько десятков однотипных школьных сочинений на заданную тему, то она вполне сносно сгенерирует похожее школьное сочинение. Но она совершенно точно не напишет кандидатскую диссертацию и вообще что-либо принципиально новое.
Более того, опасность нейросетей в том, что они при этом не говорят, что не могут что-то создать, потому что такого стоп-механизма в них в принципе не заложено. Вместо этого они генерируют то, что получается, зачастую просто бред, и никак это не контролируют.

На мой взгляд, совмещение традиционного подхода формальной логики с нейросетями может действительно сделать вторые полезными и безопасными. То есть пусть нейросеть генерит свой вывод - назовём его произвольный шаблонный бред - но при этом следующим этапом делает семантический анализ этого бреда, с проверкой его хотя бы логичности. В случае успеха пусть продолжает генерацию следующей порции, насколько у неё хватает окна контекста. Основная сложность здесь как раз в том, что по-моему, анализ и даже представление семантики так и не развили до полноценного уровня, т.е. не умеют в семантику. Хотя ведь системы машинного перевода как-то работали до внедрения нейросетей, и вполне сносно. Представление семантики, заложенное в обученной нейросетке, не поможет, ведь не может же нейросеть проверять свои смыслы самой же собой, да и не понятно, есть ли вообще в ней такое представление.

Ну и напоследок система уровней интерпретации текста/смысла, как я их запомнил из книжки, прочитанной когда-то в далёком детстве:
1. Фонетика
2. Морфология
3. Лексика
4. Синтаксис
5. Семантика
6. Надсемантический уровень, не помню как его называли, может быть, что-то типа "Метаязыка", или, ближе, литературный смысл (то, что обычно называют "основная идея произведения"). Возможно Прагматика или Семиотика.

Надсемантический уровень не то что машинам недоступен, он даже многим людям часто недоступен. К тому же это макроуровень, его наверняка можно разделить на большее число слоёв.

И добавим мнение не последнего человека в ИТ-индустрии на актуальную тему.

Автор: mahairod

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js