Существует множество примеров того, как злоумышленники могут атаковать модели, развернутые в инференсе через адверсальные атаки или jailbreaking. (Вкусная подборочка из лекции Карпатого была у меня тут).
Рубрика «RLHF»
Poisoned Data — отравление данных для LLM и создание «Спящего Агента»
2024-08-20 в 6:00, admin, рубрики: AI, ai alignment, llm, RLHF, искусственный интеллектChatGPT — лучший помощник программиста. Примеры реальных задач. Плагины и инструменты
2023-04-17 в 9:00, admin, рубрики: chatgpt, e2b, gpt-4, llama, llm, OpenAI, playwright, RLHF, ruvds_статьи, Wolfram Alpha, wolfram language, Блог компании RUVDS.com, будущее здесь, будущее программирования, ИИ, искусственный интеллект, машинное обучение, новые профессии, обучение с подкреплением, Программирование, промт-инженерыЯзыковая модель ChatGPT никогда не заменит программиста, потому что непосредственно редактирование кода — это крохотная часть разработки (5% по времени). Зато ChatGPT великолепно помогает. И чем выше ваш скилл — тем больше пользы от «подмастерья», выполняющего мелкие задания и черновой кодинг. Он пишет простые функции, генерирует документацию, находит и объясняет ошибки, выполняет кучу других задач (полный список под катом).
Сегодня не использовать ChatGPT просто глупо… Это действительно универсальный помощник, который сильно облегчает жизнь и выводит программирование на принципиально новый уровень. Одно из величайших изобретений в IT за десятилетия, после GUI и интернета.
Пожалуй, никогда программирование не было настолько приятным и эффективным, как сейчас.
Читать полностью »