Рубрика «машинное обучение» - 2

8 лучших советов для аутсорсинга разметки данных - 1

Любой проект в области CV начинается с разметки огромных объёмов изображений и видео. И только успешные результаты и качественные данные гарантируют, что модель сможет обучаться корректно.

Но что делать, если внутренняя команда не справляется с объемами, а квалифицированных специалистов найти сложно? Ответ прост: передать задачу профессионалам.

Читать полностью »

В этой статье я привел основные сведения о методе классификации k-ближайших соседей. Рассказываю все в своем стиле. Теоретические моменты и простая реализация.

Содержание: что это за метод, идея этого метода, как классифицировать (регрессировать) новые объекты, масштабирование признаков, как его можно применять, реализация.

Введение

Читать полностью »

Хотите наладить разметку данных с помощью LLM или сделать чат-бота с определенной личностью? Хорошей идеей будет показать модели несколько примеров, то есть сделать in-context или few-shot learning. Такой подход позволяет с минимальными затратами, без дополнительного обучения влиять на качество работы языковой модели. Впервые этот эффект был обнаружен при применении GPT-2, которая могла отвечать на вопросы, суммаризировать и переводить тексты без явного дообучения на эти задачи. Это событие положило начало современной эпохе языковых моделей.

Читать полностью »

Дилеммы, с которыми вы столкнетесь при разработке биометрических датасетов - 1

Если вы хотите научить модель машинного зрения разбираться в сортах кукурузы или, скажем, отличать пешеходов от автомобилейЧитать полностью »

OpenAI выпустила Sora — нейросеть для генерации коротких видео. Сервисом могут пользоваться владельцы платных подписок ChatGPT Plus и Pro, но после релиза даже им приходится ждать в многочасовой очереди. В этой статье смотрим интерфейс Sora, примеры видео, разбираемся с ограничениями и пытаемся сгенерировать своё видео.

Sora от OpenAI вышла: обзор, примеры видео и ограничения - 1

ОграниченияЧитать полностью »

В этой статье я привел базовые сведения о логистической регрессии и показал как сделать модель с нуля на чистом Python. Логистическая функция, обучение, метрики качества для модели классификации, реализация и небольшой разбор обучения весов.

Статья подойдет для того, кто новичок или кому интересно разобраться в том, как происходит обучение модели на низком уровне.

Введение

Логистическая регрессия (ЛогР)Читать полностью »

Давайте представим, что вы начинающий или опытный биоинформатик, или "простой смертный", который хочет углубиться в анализ биологических данных. Спойлер: биоинформатики тоже смертные! Зачастую, не у каждого хватает ценного времени на проверку огромных последовательностей геномных данных, будь то поиск различных мутаций или прогнозирование структуры белков на основе последовательности аминокислот.

Но не переживайте, в этом вам поможет искусственный интеллектЧитать полностью »

1. Введение

В предыдущих статьях мы рассмотрели теоретические основы NLP, включая базовые понятия, такие как токенизация, стемминг, лемматизация и другие. Мы также поработали с библиотеками NLTK и spaCy и выполнили простые задания по обработке текста.

В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.

Читать полностью »

1. Введение

В прошлой статье мы с вами изучили теоретические основы обработки естественного языка (NLP) и теперь готовы перейти к практике. В мире NLP выбор подходящего языка программирования и инструментов играет ключевую роль в успешной реализации проектов. Одним из наиболее популярных языков для решения задач в этой области является Python. Его простота, читаемость и поддержка мощных библиотек делают его идеальным выбором для разработчиков.

Читать полностью »

https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js