Рубрика «claude»
Новый универсальный метод взлома LLM от Anthropic «Best-of-N Jailbreaking»
2024-12-14 в 0:10, admin, рубрики: Anthropic, chatgpt, claude, jailbreak, автоматизация, взлом, информационная безопасность, обход защиты, цензураБуквально несколько часов назад (на момент написания этой статьи), компания Anthropic предоставила свое новое исследование по обходу защитных механизмов LLM в открытый доступ.
Новое совместное исследование: «Лучший способ взлома моделей» (Best-of-N Jailbreaking).
«Мы обнаружили простой и универсальный метод, который позволяет обходить механизмы безопасности передовых AI‑моделей и работает с текстом, изображениями и аудио.»
Основная суть
Я 8 часов тестировал модель o1 Pro за 200$ и сравнил ее с Claude Sonnet 3.5 за 20$
2024-12-12 в 17:10, admin, рубрики: chatgpt, chatgpt o1, claude, gpt-o1, gpt-o1 proПосле всей шумихи вокруг выхода o1 Pro я решил провести обширное сравнение. Результаты оказались неожиданными, и я решил поделиться своими выводами с сообществом.
Методология тестирования
Как я взломал одну из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи
2024-12-08 в 17:49, admin, рубрики: chatgpt, claude, jailbreak, prompt engineering, взломы, информационная безопасность, искусственный интеллект, обход защиты, программа, цензураЯ — простой студент, который обучается по направлению «Информационная безопасность». Так вышло, что по программе мне нужно было написать научную статью по теме ИБ. Будучи авантюристом я выбрал тему, которая была мне ближе и интереснее... и так получилось, что в пылу энтузиазма я немного перевыполнил свой план. К сожалению, я был ограничен в объеме по написанию научной статьи, и много интересного материала пришлось вырезать или сократить. Поэтому, тут я хотел бы написать полную версию моей статьи, во всяком случаи, какой я бы хотел ее видеть.
Введение
Как получить доступ к Claude (web-api) из России в 2024?
2024-12-02 в 21:34, admin, рубрики: api, chatgpt, claude, vpn, доступ, искусственный интеллект, нейросетиВведение
Получить доступ к Claude из России может показаться сложной задачей из‑за региональных ограничений сервиса. В этой статье я подробно расскажу, как зарегистрироваться в веб‑версии и API Claude, какие инструменты потребуются для обхода ограничений, и как безопасно пользоваться сервисом в дальнейшем. Руководство основано на личном опыте и включает актуальные на конец 2024 года способы регистрации, проверенные на практике.
ИИ Claude от Anthropic теперь может копировать ваш стиль написания текстов
2024-12-02 в 14:40, admin, рубрики: AI, claude, claude 3.5, ИИМногие пользователи часто интересуются, как сделать так, чтобы ИИ-чатботы писали так же, как они сами. По сути, они хотят, чтобы такие чат-боты, как ChatGPT, Claude и Gemini, копировали их стиль письма, чтобы им не приходилось каждый раз давать ИИ подробные инструкции.
Обзор на Model Context Protocol (MCP) от Anthropic
2024-11-29 в 8:16, admin, рубрики: Anthropic, api, claude, MPC, TypeScript, искуственный интеллектНа заре появления LLM пользователям приходилось просто копировать свой код в текстовое окно, чтобы ИИ могла его обработать. Естественно, такой подход быстро всех утомил, и разработчики начали искать свои способы загрузки данных в модель. У этого подхода была серьезная проблема — каждому приходилось изобретать велосипед заново. Именно поэтому появился протокол MCP (Model Context Protocol) — универсальный способ дать искусственному интеллекту доступ к нужным данным, неважно где они хранятся — на компьютере пользователя или же в интернете.
Как это работает?
Пользователи тестируют способности LLM посредством игр, в частности с помощью Minecraft и Pictionary
2024-11-05 в 21:03, admin, рубрики: AI, chatgpt, claude, gemini, ИИ, нейросетиБольшинство тестов для оценки ИИ-моделей не слишком информативны: они часто сводятся к простому запоминанию ответов или касаются тем, которые не всегда актуальны для пользователей. Поэтому некоторые ИИ-энтузиасты используют игры как способ оценки навыков решения задач.
Пол Калкрафт, независимый разработчик, создал приложение, где ИИ-модели играют в игру, похожую на «Крокодил» (Pictionary). Одна модель рисует, а другие пытаются угадать, что изображено.
ZombAI: промпт-инъекция в Claude Computer Use
2024-10-28 в 6:39, admin, рубрики: claude, zombie, ИИ, уязвимостьНесколько дней назад Anthropic выпустила Claude Computer Use, который представляет собой модель + код, позволяющий ИИ управлять компьютером. Он делает скриншоты для принятия решений, может выполнять команды bash и так далее.
Это круто, но, очевидно, несёт и массу рисков, ведь Claude Computer Use позволяет искусственному интеллекту автономно выполнять команды на машинах. А значит, можно использовать промпт‑инъекции (prompt injection).
Powerful AI: когда механизмы защиты личности перестают работать
2024-10-24 в 22:56, admin, рубрики: claude, антиутопия, будущее, будущее человечества, искусственный интеллект, наблюдение, прогнозыКогда человек станет лишним
Представьте будущее, где искусственный интеллект решил большинство существующих проблем человечества. Излечены почти все болезни, голод побеждён, производство автоматизировано, а базовые потребности каждого человека удовлетворены. Звучит как утопия?
Но есть нюанс.