Рубрика «нейронные сети»
Клон ChatGPT в 3000 байтах на C, основанный на GPT-2
2025-02-05 в 9:38, admin, рубрики: C, gpt, нейронные сети, трансформерыЭта программа представляет собой свободную от зависимостей реализацию GPT-2. Она загружает матрицу весов и файл BPE из оригинальных файлов TensorFlow, токенизирует вывод при помощи простого энкодера, работающего по принципу частотного кодирования, реализует базовый пакет для линейной алгебры, в котором заключены математические операции над матрицами, определяет архитектуру трансформера, выполняет инференс трансформера, а затем очищает вывод от токенов при помощи BPE-декодера. Всё это — примерно в 3000 байт на C.
Loss Landscape Analysis — новая библиотека для анализа точности обучения и оценки обобщающей способности нейросетей
2025-01-28 в 12:00, admin, рубрики: analysis, landscape, loss, анализ, визуализация, машинное обучение, нейронные сети, нейросети, обобщение, функция потерьМой коллега Никита Габдуллин работает в Отделе перспективных исследований ИТ-компании «Криптонит». Он автор библиотеки Loss Landscape Analysis (LLA) и научной статьи о ней, препринт которой доступен на английском языке. Здесь мы подробнее рассказываем о самой библиотеке, в то время как научная публикация в основном посвящена исследованию разных свойств ландшафтов функций потерь. Также в русскоязычной статье мы допускаем некоторые лингвистические вольности, которые не приняты в академической среде, но упрощают восприятие текста.
Анализ обработки признаков в YOLO NAS S при помощи CAM
2025-01-25 в 15:38, admin, рубрики: explainable ai, pytorch, машинное обучение, нейронные сетиМетоды объяснения моделей — практичный инструмент для понимания модели, оценки её точности и стабильности. Однако, часто можно столкнуться с ситуацией, когда фреймворк, в котором метод реализован, просто не "дружит" с реализацией модели. В этом туториале хочу подробно показать CAM (class activation map) для объяснения моделей зрения.
Почему CAM?
Class Activation Maps (CAM) — базовый инструмент для визуализации того, какие области изображения наиболее важны для модели при принятии решения. Он позволяет понять:
-
Какие признаки извлекает модель на разных слоях свертки;
Основы ИИ: введение в искусственный интеллект
2024-12-11 в 9:40, admin, рубрики: ИИ, ИИ и машинное обучение, нейронная сеть, нейронные сети, нейросети, нейросеть![Основы ИИ: введение в искусственный интеллект - 1 Основы ИИ: введение в искусственный интеллект - 1](https://www.pvsm.ru/images/2024/12/11/osnovy-ii-vvedenie-v-iskusstvennyi-intellekt.jpg)
Привет, дорогие читатели ! Сегодня я хочу поговорить с вами об основах искусственного интеллекта. ИИ - это увлекательная сфера, которая стала неотъемлемой частью нашей жизни. Вместе мы изучим, что такое искусственный интеллект, как он работает и как его применяют в современном мире.
Ключевые выводы:
-
Искусственный интеллектЧитать полностью »
Вышел генератор видео Sora от OpenAI: Большие обещания, скромная реальность, разбираемся
2024-12-10 в 14:39, admin, рубрики: chatgpt, OpenAI, sora, видео, генерация видео, искусственный интеллект, нейронные сетиПривет, друзья! OpenAI наконец-то представила публичную версию своего видеогенератора — Sora Turbo. Почти год назад я писал о первых демо этой технологии, и мы все были в полном восторге от показанных возможностей. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.meЧитать полностью »
Рубрика: VPS на пределе возможностей. LLM на CPU с 12Gb RAM
2024-11-12 в 9:01, admin, рубрики: llama, Ollama, ruvds_статьи, vps, ИИ, искуственный интеллект, машинное обучение, нейронные сети, облако, сервер![Рубрика: VPS на пределе возможностей. LLM на CPU с 12Gb RAM - 1 Рубрика: VPS на пределе возможностей. LLM на CPU с 12Gb RAM - 1](https://www.pvsm.ru/images/2024/11/13/rubrika-VPS-na-predele-vozmojnostei-LLM-na-CPU-s-12Gb-RAM.png)
По работе я привык, что если какая-то нейронка не влезает на GPU-сервер, то первое моё действие — проверить, нет ли модели с квантизацией побольше, либо запросить ещё больше VRAM. Однако не все работают на облачных провайдерах, кто-то у нас ещё и заказывает услуги. А тарифы на GPU-серверы порой заставляют серьёзно задуматься о том, так ли они нужны, особенно когда нет потребности в нейронках на сотни миллиардов параметров. Что, если попробовать делать всё на обычном VPS-тарифе с бюджетом в 5000 рублей в месяц? Да и зачем ограничиваться одними лишь нейронками?
Практика: мой опыт интеграции более 50 нейронных сетей в один проект
2024-11-07 в 8:30, admin, рубрики: CUDA, github, lifehack, onnxruntime, python, torch, исскуственный интеллект, лайфхаки, нейронные сети, опытПолтора года назад я начал работу над проектом с открытым исходным кодом, который постепенно рос и развивался. Вдохновившись проектом AUTOMATIC1111, на тот момент только появившимся, я добавлял всё больше функционала и возможностей. Сегодня мой проект включает более 50 нейронных сетей, каждая из которых выполняет свою уникальную задачу. В этой статье я делюсь практическими лайфхаками и выводами, которые помогли мне на этом пути. Надеюсь, что они будут полезны и вам.