Рубрика «claude»

Большинство тестов для оценки ИИ-моделей не слишком информативны: они часто сводятся к простому запоминанию ответов или касаются тем, которые не всегда актуальны для пользователей. Поэтому некоторые ИИ-энтузиасты используют игры как способ оценки навыков решения задач.

Пол Калкрафт, независимый разработчик, создал приложение, где ИИ-модели играют в игру, похожую на «Крокодил» (Pictionary). Одна модель рисует, а другие пытаются угадать, что изображено.

Читать полностью »

Несколько дней назад Anthropic выпустила Claude Computer Use, который представляет собой модель + код, позволяющий ИИ управлять компьютером. Он делает скриншоты для принятия решений, может выполнять команды bash и так далее.

Это круто, но, очевидно, несёт и массу рисков, ведь Claude Computer Use позволяет искусственному интеллекту автономно выполнять команды на машинах. А значит, можно использовать промпт‑инъекции (prompt injection).

Читать полностью »
Powerful AI: когда механизмы защиты личности перестают работать - 1

Когда человек станет лишним

Представьте будущее, где искусственный интеллект решил большинство существующих проблем человечества. Излечены почти все болезни, голод побеждён, производство автоматизировано, а базовые потребности каждого человека удовлетворены. Звучит как утопия?

Но есть нюанс.

Читать полностью »

На написание и публикацию этого текста меня побудила необходимость быстро объяснить, как определять текст от больших языковых моделей (БЯМ). Важно, что речь идёт только про выявление очевидных случаев, а не бронебойное детектирование.

В голове инструкция выглядела как три коротких пункта. Списочек немедленно разросся обширным введением, замечаниями и примерами. Грех этой инструкцией не поделиться.


Желание обнаружить результат творчества больших языковых моделей возникло до их коммерциализации. Ещё в феврале 2019 года OpenAI порадовалаЧитать полностью »

Изображение сгенерировано ИИ по запросу: "Математик на сёрфе"

Изображение сгенерировано ИИ по запросу: "Математик на сёрфе"

Как известно все люди делятся на две категории: кто любил математику в школе и кто вообще не понимал зачем она нужна в большем объеме чем 4-5 класс.

Читать полностью »

Совсем недавно Meta представила миру Llama 3.1 405B - новую открытую модель, бросающую вызов признанным лидерам, таким как GPT-4o и Claude-3.5 Sonnet.

Опенсорс на арене: правда ли так хороша Llama 3.1 405B? - 1

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js