Главная

Рубрика «трансформеры»

Твой ИИ тебя понимает? Разбираем тайны внутреннего мира языковых моделей

2025-02-10 в 7:55, admin, рубрики: AI, python, ИИ, полисемантичность, разрежённый автокодировщик, трансформеры

Современные крупные языковые модели, такие как ChatGPT, Claude или Gemini, поражают своими возможностями. Но главный вопрос остаётся открытым: как именно они думают?

Читать полностью »

Клон ChatGPT в 3000 байтах на C, основанный на GPT-2

2025-02-05 в 9:38, admin, рубрики: C, gpt, нейронные сети, трансформеры

Эта программа представляет собой свободную от зависимостей реализацию GPT-2. Она загружает матрицу весов и файл BPE из оригинальных файлов TensorFlow, токенизирует вывод при помощи простого энкодера, работающего по принципу частотного кодирования, реализует базовый пакет для линейной алгебры, в котором заключены математические операции над матрицами, определяет архитектуру трансформера, выполняет инференс трансформера, а затем очищает вывод от токенов при помощи BPE-декодера. Всё это — примерно в 3000 байт на C.

Читать полностью »

Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году

2024-11-18 в 13:23, admin, рубрики: llm, глубокое обучение, искусственный интеллект, трансформеры

Трансформеры сегодня – золотой стандарт нейросетей, и, особенно, больших языковых моделей. Они стали первой по-настоящему масштабируемой архитектурой, то есть с ними впервые стало возможно гарантировано наращивать перформанс моделей за счет увеличения количества данных и параметров, не упираясь в потолок производительности железа или запоминающей способности нейросети.

Читать полностью »

Рекуррентные нейронные сети наносят ответный удар

2024-10-05 в 20:55, admin, рубрики: gru, LSTM, рекуррентные нейронные сети, трансформеры

Рекуррентные нейронные сети (RNN), а также ее наследники такие, как LSTM и GRU, когда-то были основными инструментами для работы с последовательными данными. Однако в последние годы они были почти полностью вытеснены трансформерами (восхождение Attention is all you need), которые стали доминировать в областях от обработки естественного языка до компьютерного зрения. В статье "Were RNNs All We NeededЧитать полностью »

Всем про LLM. Как рассказать про трансформеры одинаково хорошо и индустриалам, и исследователям

2024-10-03 в 8:44, admin, рубрики: computational linguistics, distillation, image processing, llm, quantization, tabular data, time series, преподавание, трансформеры

Привет. Меня зовут Вика, я работаю в AIRI, преподаю в Школе Анализа Данных и Сколтехе и вместе со своими коллегами занимаюсь обработкой естественного языка, изображений и видео, а также иными задачами, где могли бы пригодиться трансформерные модели. Трансформерные архитектуры — очень мощное орудие, которые может быть применено почти во всех сферах DL, и интереснейший концепт, в котором много потенциала для исследования. А, главное, их очень легко применить к технологиям, которые способны изменить нашу жизнь здесь и сейчас.

Читать полностью »

Как работают трансформеры: разбираем математику

2024-01-18 в 7:16, admin, рубрики: chatgpt, Transformers, матрицы, трансформеры

Читать полностью »

Кто знает, что значит GPT в названии ChatGPT, могут дальше не читать

2024-01-09 в 8:40, admin, рубрики: chatgpt, cnn, GAN, gpt, nlp, perceptron, RNN, нейронные сети, нейросети, трансформеры

В настоящее время искусственный интеллект (ИИ) стремительно развивается. Мы являемся свидетелями интеллектуальной мощи таких нейросетей, как GPT-4 Turbo от OpenAI и Gemini Ultra от Google Читать полностью »

Объясняем простым языком, что такое трансформеры

2023-10-27 в 9:36, admin, рубрики: ml, mlops, ИИ, машинное обучение, нейросети, нейросеть, трансформеры

Облако предлагает много возможностей Читать полностью »

Об экшн-трансформере как следующем этапе развития модели трансформер и не только

2023-02-22 в 9:00, admin, рубрики: Adept, python, ruvds_статьи, Блог компании RUVDS.com, искусственный интеллект, машинное обучение, нейросети, трансформеры, экшн-трансформер

Vectorpocket

В последний год многие интересующиеся технологиями искусственного интеллекта замерли в ожидании и следят за развитием интересного стартапа. Он собирается предложить миру новый способ взаимодействия с компьютером и радикально усовершенствовать этот процесс...Читать полностью »