Рубрика «машинное обучение» - 18

Компиляция моделей МО в С

2023-10-01 в 10:00, admin, рубрики: C, micrograd, python, ruvds_перевод, компиляция, машинное обучение, модели мо

Статья посвящена знакомству с инструментом micrograd и компиляции генерируемых им нейронных сетей в язык С. При этом она не является руководством по машинному обучению, но вполне может позволить вам лучше понять МО через призму компиляторов. В ходе этого процесса мы также разберём цепное правило, напишем собственный небольшой компилятор и посмотрим, как micrograd масштабируется.

Недавно у меня состоялся приятный разговор с моим другом Крисом. Он познакомил меня с основами машинного обучения, когда я разбирал написанный Андреем Карпаты micrograd.

Для тех, кто не знает, micrograd – это небольшая реализация нейронной сети, написанная на чистом Python без библиотек, в которой вычислительными единицами выступают не векторы и матрицы, а скалярные величины.Читать полностью »

От распределённого бэкенда — к сильному ИИ. Чем сейчас занимается легендарный Джефф Дин?

2023-08-07 в 9:00, admin, рубрики: AGI, AI, bart, chatgpt, CodeVQA, Codey, Google, gpt, Med-PaLM, ml, MusicLM, NotebookLM, PaLM 2, Perspective API, Pic2Word, ruvds_статьи, Sec-PaLM, Universal Translator, Биографии гиков, Блог компании RUVDS.com, Джефф Дин, искусственный интеллект, машинное обучение, нейросети, Программирование, сильный ИИ, Чак Норрис

На Хабре иногда рассказывают про выдающихся программистов современности, таких как Линус Торвальдс, Фабрис Беллар и Джефф Дин. Про этих людей ходят легенды. Особенно выделяется последний, которого в шутку сравнивают с Чаком Норрисом.

Шутки про Джеффа Дина дают понимание, насколько легендарной стала эта личность среди разработчиков Google:

«Когда Джефф Дин разрабатывает программу, то сначала создаёт бинарник, а потом пишет исходный код как документацию».

«Джефф Дин однажды не прошёл тест Тьюринга, потому что правильно установил 203-е число Фибоначчи менее чем за секунду».

«Джефф Дин родился 31 декабря 1969 года в 23:48. Ему потребовалось 12 минут, чтобы запустить свой первый счётчик времени».

Читать полностью »

Запускаем Stable Diffusion на Raspberry PI Zero 2 (или на 260 МБ ОЗУ)

2023-08-04 в 13:00, admin, рубрики: onnxruntime, onnxstream, raspberry pi zero 2, ruvds_перевод, stable diffusion, Блог компании RUVDS.com, генерация изображений, диффузия изображений, искусственный интеллект, машинное обучение, обработка изображений

Задача — запустить Stable Diffusion, включающую большую трансформирующую модель c почти 1 миллиардом параметров, на Raspberry Pi Zero 2 с 512 МБ RAM, не добавляя дополнительного пространства подкачки и не выгружая промежуточные результаты на диск. Рекомендуемый минимальный объём RAM/VRAM для Stable Diffusion составляет 8 ГБ.Читать полностью »

Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

2023-08-02 в 9:02, admin, рубрики: Алгоритмы, Блог компании Яндекс, искусственный интеллект, клавиатуры, команда яндекс.клавиатуры, машинное обучение, разработка мобильных приложений, языковые модели, яндекс, яндекс.клавиатура

Основная задача любой мобильной клавиатуры — помогать пользователям в общении, а именно — вводить текст быстро и без ошибок. Этого можно достичь при помощи разных компонентов: подсказок, автокорректа, тап-модели, голосового ввода, ввода Читать полностью »

GPT-4 со временем становится хуже

2023-08-02 в 7:53, admin, рубрики: chatgpt, gpt-4, Блог компании vStack, ИИ, искусственный интеллект, машинное обучение

Мы думаем, что развитие ИИ идет только в одном направлении. Что они становятся умнее, поглощая больше данных, и всё точнее отвечают на вопросы. Но что если это не так?

Новое исследование из Стэнфорда показало, что за несколько последних месяцев GPT-4 стал ощутимо глупее. Например, ранее он правильно отвечал на простую математическую задачу в 98% случаев, а сейчас — всего лишь в 2% случаев. Рекордный регресс!

Читать полностью »

AI доступный каждому разработчику

2023-08-01 в 11:14, admin, рубрики: AI, asr, chatgpt, TTS, искусственный интеллект, машинное обучение, Программирование

Долгое время я прекрасно обходился без использования технологий искусственного интеллекта. Одни задачи можно было реализовать без всякого ИИ, а для других или готовых моделей не было или это были какие-то коммерческие облачные API.

В последнее время всё сильно изменилось и волна популярности искусственного интеллекта принесла множество крутейших моделей, позволяющих реализовать новые идеи или переосмыслить старые.

Казалось бы, есть и локально запускаемые аналоги ChatGPT или сервисов генерации изображений. Есть библиотеки типа Читать полностью »

Единая нейросетевая модель кредитного скоринга

2023-07-19 в 8:36, admin, рубрики: big data, искусственный интеллект, кредитная история, кредитный скоринг, машинное обучение, нейронные сети, транзакции

Кредитный скоринг - известная и давно решаемая банковская задача, суть которой заключается в оценке рисков банка при выдаче кредита. Для формализации риска в банке используется понятие дефолта.

Существуют разные определения дефолта. Самое распространенное, которое используем и мы — по просрочке на K дней в пределах N месяцев.

Подобное определение дефолта также приводится в соревновании от American Express Читать полностью »

Визуализация реальных масштабов проклятия размерности

2023-07-17 в 9:37, admin, рубрики: python, Алгоритмы, Блог компании Wunder Fund, машинное обучение

Представьте себе набор данных, состоящий из некоторого количества наблюдений. У каждого наблюдения имеется N признаков. Если преобразовать все эти признаки в их числовое представление, то можно будет сказать, что каждое из наблюдений — это точка в N‑мерном пространстве.

Читать полностью »

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

2023-07-06 в 7:58, admin, рубрики: yandexgpt, Блог компании Яндекс, браузеры, искусственный интеллект, команда яндекс.браузера, краткий пересказ, машинное обучение, суммаризация, яндекс

Неделю назад на сайте 300.ya.ru мы продемонстрировали возможности языковой модели YandexGPT применительно к задаче суммаризации текстов. С тех пор многое изменилось: мы обучили новую, более качественную модель, в пересказах которой в 4 раза меньше ошибок. А сегодня мы внедрили её в Яндекс Браузер. Может показаться, что мы просто взяли ту же модель, о которой уже рассказывали сообществу на примере Алисы, и прикрутили к ней кнопку в Браузере. Но не всё так просто. Да, наша базовая модель уже понимала, что такое суммаризация в общих чертах. Но для нас было важно добиться результата в нужной нам форме и с предсказуемым качеством. И вот тут-то начинаются нюансы.

Сегодня поделюсь с Хабром не столько новостью, сколько нашим опытом и советами из области дообучения моделей и промпт-инжиниринга. Расскажу, через что пришлось пройти нашей команде, чтобы модель начала делать то, что от неё ожидают.

Читать полностью »

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

2023-07-03 в 9:00, admin, рубрики: AV1, avc, CAE, content-aware encoding, H.264, H.265, Harmonic, HEVC, netflix, ruvds_статьи, VVC, WaveOne, Алгоритмы, Блог компании RUVDS.com, ИИ-кодеки, кодеки, машинное обучение, машинное обучение кодеков, нейронное улучшение, Работа с видео, сжатие данных, сжатие с учетом контента

Сжатие с учётом контекста, источник: WaveOne (сайт удалён)

Хотя новые стандарты кодеков появляются каждые десять лет, все они основаны на пиксельной математике — манипулировании значениями отдельных пикселей в видеокадре для удаления информации, не важной для восприятия. Другие математические операции уменьшают объём данных после первоначального кодирования.

В новом поколении кодеков алгоритмы машинного обучения используются для анализа и понимания визуального содержания видео, выявления избыточных данных и более эффективного сжатия. Вместо написанных вручную алгоритмов, тут применяют методы Software 2.0, основанные на обучении. Данная область развивается на протяжении десятилетий, но в последние годы получила сильный толчок. Все знают, что в 2017 году произошёл прорыв в разработке ИИ благодаря изобретению трансформеров. В свою очередь, они основаны на концепции внимания, которую придумали в 90-е. Эта техника впервые позволила соотносить друг с другом отдельные части текста или видеокадра.
Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 18

Компиляция моделей МО в С

От распределённого бэкенда — к сильному ИИ. Чем сейчас занимается легендарный Джефф Дин?

Запускаем Stable Diffusion на Raspberry PI Zero 2 (или на 260 МБ ОЗУ)

Как маленькая нейроязыковая модель в Клавиатуре победила серверные подсказки

GPT-4 со временем становится хуже

AI доступный каждому разработчику

Единая нейросетевая модель кредитного скоринга

Визуализация реальных масштабов проклятия размерности

YandexGPT в Браузере: как мы учили модель суммаризировать статьи

Кодеки новой эпохи: HEVC, AV1, VVC и нейросети

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 18

Новости

Актуальные темы

Архив