Рубрика «машинное обучение» - 26

Digital art и искусственный интеллект — симбиоз цифр и искусства

2022-01-29 в 13:48, admin, рубрики: AI, nft, python, pytorch, TensorFlow, искусственный интеллект, картинки, Криптовалюты, машинное обучение, обработка изображений, распознавание изображений, Софт, цифровой арт

Рис.1 Vox-модель c графическими паттернами

Читать полностью »

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

2022-01-28 в 7:59, admin, рубрики: computer vision, data mining, deep learning, machine learning, natural language processing, nlp (natural language processing), ozon tech, Блог компании Ozon Tech, машинное обучение, обработка изображений

Привет! Меня зовут Александр, я работаю в команде матчинга Ozon. Ежедневно мы имеем дело с десятками миллионов товаров, и наша задача — поиск и сопоставление одинаковых предложений (нахождение матчей) на нашей площадке, чтобы вы не видели бесконечную ленту одинаковых товаров.
На странице любого товара на Ozon есть картинки, заголовок, описание и дополнительные атрибуты. Всю эту информацию мы хотим извлекать и обрабатывать для решения разных задач. И особенно она важна для команды матчинга.
Чтобы извлекать признаки из товара, мы строим его векторные представления (эмбеддинги), используя различные текстовые модели (fastText, трансформеры) для описаний и заголовков и целый набор архитектур свёрточных сетей (ResNet, Effnet, NFNet) — для картинок. Далее эти векторы используются для генерации фичей и товарного сопоставления.
На Ozon ежедневно появляются миллионы обновлений — и считать эмбеддинги для всех моделей становится проблематично. А что, если вместо этого (где каждый вектор описывает отдельную часть товара) мы получим один вектор для всего товара сразу? Звучит неплохо, только как бы это грамотно реализовать…

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов - 1
Читать полностью »

Масштабируемый подход к частично локальному федеративному обучению

2022-01-15 в 17:38, admin, рубрики: federated, machinelearning, recommendation systems, машинное обучение

Данный текст является авторским переводом поста A Scalable Approach for Partially Local Federated Learning.

Примечания:

Читать полностью »

Кластеризация изображений с помощью нейросети CLIP

2022-01-13 в 10:45, admin, рубрики: CLIP, clustering, clusterization, data engineering, dbscan, machine learning, OpenAI, python, umap, Блог компании FunCorp, искуственный интеллект, машинное обучение, нейросети, обработка изображений

В статье пойдёт речь о том, как можно автоматически разделить датасет изображений на кластеры, которые поделены по качественному контекстному признаку, благодаря эмбедингам из нашумевшей нейронной сети CLIP от компании Илона Маска. Расскажу на примере контента из нашего приложения iFunny.

Читать полностью »

Как ИИ учится рисовать аниме

2022-01-12 в 12:10, admin, рубрики: AI, аниме, Блог компании Cloud4Y, искусственный интеллект, машинное обучение, нейросети

Аниме — мультипликация, которая интересна не только подросткам. Даже среди суровых бородатых айтишников в свитерах есть ценители этого направления. Создатели Waifu Labs – сайта для генерации аниме-портретов – поделились своей внутренней кухней и рассказали, как ИИ создаёт рисунки.

Проекту Waifu Labs исполняется 2 года, за это время их художник-нейросеть «нарисовала» около 20 миллионов изображений.

Читать полностью »

Как работает DeepMind AlphaFold2?

2022-01-08 в 18:50, admin, рубрики: AlphaFold2, DeepMind, биоинформатика, биология, Биотехнологии, машинное обучение, механизм внимания, нейронные сети, трансформеры, Фолдинг белков

Читать полностью »

Сравнительный анализ тональности комментариев в YouTube (осторожно, ненормативная лексика)

2022-01-06 в 17:51, admin, рубрики: data mining, data science, nlp, nlp (natural language processing), sentiment analysis, машинное обучение, Научно-популярное

Читать полностью »

Обзор архитектуры Swin Transformer

2022-01-01 в 20:18, admin, рубрики: attention, CV, swin transformer, машинное обучение, обработка изображений

Трансформеры шагают по планете! В статье вспомним/узнаем как работает visual attention, поймём, что с ним не так, а главное как его поправить, чтобы получить на выходе best paper ICCV21.

CV-трансформеры in a nutshell

Attention Is All You Need

Начнём издалека, а именно с 2017 года, когда A Vaswani et al. опубликовали знаменитую статью «Attention Is All You Need»Читать полностью »

Классификация признаков транзакций в моделях поведенческого скоринга

2022-01-01 в 12:59, admin, рубрики: Behavioral, data mining, scoring, Исследования и прогнозы в IT, машинное обучение, финансы в IT

В настоящей статье изложены выводу, к которым я пришел по результатам исследования датасета, представленного АО «Альфа Банк» в рамках хакатона AlfaBattle 2.0 в декабре 2020 года.

Организатором Хакатона представлены данные о транзакциях по банковским картам в отношении 1.5 млн клиентов, предоставивших впоследствии заявку на получение кредитной карты. Задача Хакатона – построение модели бинарной классификации обеспечивающей предсказание дефолта по кредитной карте на основании транзакционных данных.

Условия задачи представлены здесь

Читать полностью »

Тестируем лучшие видеокарты для расчетов на конец 2021 года: 3090 Turbo и A10

2021-12-26 в 8:12, admin, рубрики: 3090, a10, gpu, Nvidia, бенчмарки, Видеокарты, Компьютерное железо, машинное обучение

Тестируем лучшие видеокарты для расчетов на конец 2021 года: 3090 Turbo и A10 - 1

Недавно на Хабре была статья про сравнение карточек для вычислений. На мой взгляд статья получилась очень даже неплохой, но в ней никак не отразили позиции RTX 3090 Turbo и как-то подозрительно мало времени уделили А10.

На мой взгляд среди карточек с "большим" объемом памяти (более 12 гигабайт) по рекомендованной рыночной цене (РРК) 3090 является лидером хит-парада, а по рыночной цене — скорее уже А10. Детальный разбор почему и как я подходил к выбору карточек и тестированию — прошу под кат.

Также так случилось, что у меня под рукой оказалось большое количество рейзеров разной степени говённости. И сначала я замахивался, чтобы поставить некую точку в вечных дебатах про райзеры (а мнения разнятся от такого до банального "не работает" или "для DL нельзя использовать"), но в итоге все получилось чуть более сумбурно. Но я постарался подойти к тестированию райзеров тоже структурированно и аналитически.

И последнее — в прошлой статье я сокрушался, что мол нет на рынке большого выбора однослотовых решений по вменяемой цене. Теперь на выбор решений много, но с доступностью и ценами ситуация лучше не стала (есть как минимум 2 поколения карточек Quadro и Tesla A10, но геймерских нет, насколько я знаю).

Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 26

Digital art и искусственный интеллект — симбиоз цифр и искусства

Векторное представление товаров Prod2Vec: как мы улучшили матчинг и избавились от кучи эмбеддингов

Масштабируемый подход к частично локальному федеративному обучению

Кластеризация изображений с помощью нейросети CLIP

Как ИИ учится рисовать аниме

Как работает DeepMind AlphaFold2?

Сравнительный анализ тональности комментариев в YouTube (осторожно, ненормативная лексика)

Обзор архитектуры Swin Transformer

CV-трансформеры in a nutshell

Attention Is All You Need

Классификация признаков транзакций в моделях поведенческого скоринга

Тестируем лучшие видеокарты для расчетов на конец 2021 года: 3090 Turbo и A10

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «машинное обучение» - 26

CV-трансформеры in a nutshell

Attention Is All You Need

Новости

Актуальные темы

Архив