Рубрика «OpenAI» - 5

Изображение сгенерировано по запросу "Используем таблицу Google как базу для GPT-бота"

Изображение сгенерировано по запросу "Используем таблицу Google как базу для GPT-бота"

Поводом написания этой статьи стал уход из России Notion, так как мы активно подключали в качестве баз данных к нашим GPT-ботам базы в Notion (статья про это: Читать полностью »

На написание и публикацию этого текста меня побудила необходимость быстро объяснить, как определять текст от больших языковых моделей (БЯМ). Важно, что речь идёт только про выявление очевидных случаев, а не бронебойное детектирование.

В голове инструкция выглядела как три коротких пункта. Списочек немедленно разросся обширным введением, замечаниями и примерами. Грех этой инструкцией не поделиться.


Желание обнаружить результат творчества больших языковых моделей возникло до их коммерциализации. Ещё в феврале 2019 года OpenAI порадовалаЧитать полностью »

Любая инновационная технология наверняка столкнется с судебными разбирательствами, но период активного развития искусственного интеллекта выдался особенно суровым в плане юридических споров.

26 судебных дел против OpenAI, Anthropic и Meta*: короткий обзор судебных исков против крупнейших ИИ-компаний - 1

Читать полностью »

Продолжение войны поисковиков. Давид и Голиаф, или борьба Google против ИИ-стартапов - 1

Дисклеймер: это вольный перевод колонки Джона Хермана для издания New York Magazine, выполненный редакцией «Технократии». Подписывайтесь на наш каналЧитать полностью »

Лучше 170 раз услышать: как GPT-4o кодирует изображения? - 1

Интересный факт: GPT-4o взимает по 170 токенов за обработку каждого тайла 512x512 , используемого в режиме высокого разрешения. При соотношении примерно 0,75 токенов на слово можно предположить, что картинка стоит примерно 227 слов, что всего в четыре раза меньше, чем в поговорке «картинка стоит тысячи слов».

Читать полностью »

Изображение сгенерировано ИИ по запросу: "Математик на сёрфе"

Изображение сгенерировано ИИ по запросу: "Математик на сёрфе"

Как известно все люди делятся на две категории: кто любил математику в школе и кто вообще не понимал зачем она нужна в большем объеме чем 4-5 класс.

Читать полностью »

Леопольд Ашенбреннер, бывший сотрудник OpenAI из команды Superalignment, опубликовал документ под названием «Осведомленность о ситуации: Предстоящее десятилетие», в котором он делится своим видением будущего ИИ. Основываясь на своих знаниях в этой области, Ашенбреннер предсказывает стремительное развитие искусственного интеллекта в ближайшее десятилетие.

Мы прочитали этот документ объемом в 165 страниц за вас. В этой статье расскажем о ключевых идеях Ашенбреннера и о его прогнозах на будущее искусственного интеллекта.

Читать полностью »

Это настолько просто сделать, что я даже не понимаю как вообще об этом можно написать полноценную статью. Весь туториал можно уместить буквально в один комментарий под постом, т. к. тут нет чего-то сверхтяжёлого.

В чём суть?

Чтобы снять цензуру, мы просто воспользуемся файн-тюнингом. Нужно будет просто привести модели примеры того, как надо отвечать на непривычные для неё темы.

Грамотное составление датасета

Для того чтобы составить нужный нам датасет, важно соблюдать следующее:

  • В датасете модель должна отвечать развёрнуто и без грамматических ошибок;

  • Читать полностью »

14го декабря в одном из самых авторитетных общенаучных журналов Nature была опубликована статья с, кажется, сенсационным заголовком: «ИИ-модели Google DeepMind превосходят математиков в решении нерешённых проблем». А в блогпосте дочки гугла и вовсе не постеснялся указать, что это — первые находки Больших Языковых Моделей (LLM) в открытых математических проблемах. Неужели правда? Или кликбейт — и это в Nature? А может мы и вправду достигли Читать полностью »

Специалисты Массачусетского технологического института заметили, что сотрудники платформ, которые размечают данные для обучения искусственного интеллекта, задействуют для этого опять же искусственный интеллект. Чтобы оценить масштаб явления, они подрядили 44 пользователя, подрабатывавших разметкой данных на Amazon Mechanical Turk, и заставили их писать краткие пересказы медицинских исследований.

Потом их работу проанализировали с помощью алгоритма, который умеет находить следы работы ChatGPT, а также посмотрели логи нажатий сотрудниками на клавиатуру и использование горячих клавиш "копипейста".

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js