Вы, наверное, слышали про dalle-2, midjourney, stable diffusion? Слышали о моделях, которые по тексту генерируют картинку. Совсем недавно они продвинулись настолько, что художники протестуют, закидывая в стоки картинки с призывом запретить AI, а недавно, вообще, в суд подали! В этой статье будем разбираться, как такие модели работают. Начнем с азов и потихоньку накидаем деталей и техник генерации. Но будем избегать сложной математики – если хотите в нее погрузиться, то рекомендую эту статью (ссылка).
Рубрика «обработка изображений» - 4
Как работают text2image модели?
2023-01-16 в 21:57, admin, рубрики: генерация изображений, диффузия, искусственный интеллект, математика, машинное обучение, нейронные сети, обзор, обработка изображенийЕсли у вас плохой почерк, ваши письма попадают в ад. Только это UX-UI-ад для людей
2023-01-06 в 8:01, admin, рубрики: ocr, timeweb_статьи, usability, usps, ux/ui, Блог компании Timeweb Cloud, выгорание, интерфейсы, обработка изображений, распознавание изображений, скорость работы, сортировка, условия работыТам около 800 человек круглосуточно занимаются тем, что за 4 секунды должны перевести нечитаемый адрес в странный код, разработанный Siemens в 1990-х годах (надо ли добавлять, что он не интуитивен и сложен?). Поскольку работники используют сотни быстрых сочетаний клавиш, у них даже клавиатуры специальные.
Если меня когда-нибудь спросят о странной организации работ или о плохом UX/UI-дизайне, пожалуй, я покажу им вот этот пост. Посмотрите, как может выглядеть такая деятельность.
Читать полностью »
Когда картинка дороже слов
2023-01-02 в 13:00, admin, рубрики: airbnb, ruvds_перевод, анализ изображений, Блог компании RUVDS.com, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обработка изображений, свёрточная нейросеть
Владельцы жилья оставляют на сайте Airbnb уникальные предложения аренды по всему миру. На Airbnb есть сотни миллионов сопутствующих фотографий. Фотографии содержат важную информацию о стиле и дизайне, которую сложно передать словами или списком. Поэтому несколько команд сотрудников Airbnb сегодня используют компьютерное зрение (computer vision), чтобы извлекать сведения об удобствах из нашего богатого массива данных, чтобы помогать гостям в удобном поиске предложений, соответствующих их предпочтениям.
В предыдущих постах WIDeText: A Multimodal Deep Learning Framework, Categorizing Listing Photos at Airbnb и Amenity Detection and Beyond — New Frontiers of Computer Vision at Airbnb мы рассказали о том, как используем компьютерное зрение для категоризации помещений и выявления удобств, чтобы сопоставлять фотографии предложений с таксономией дискретных концепций. В этом посте мы расскажем о том, как Airbnb использует эстетику и эмбеддинги изображений для оптимизации различных поверхностей продукта, включая содержимое рекламных объявлений, презентации и рекомендаций позиций.Читать полностью »
Третья жизнь пет-проекта по распознаванию рукописных цифр
2022-12-23 в 11:23, admin, рубрики: dataScience, detection, huggingface, machinelearning, open source, pet, streamlit, yolo, Блог компании Open Data Science, искусственный интеллект, машинное обучение, обработка изображений
В этом блогпосте я поделюсь историей о том, как я обновлял свой старенький пет-проект по распознаванию цифр, как делал разметку для него, и почему модель предсказывает 12 классов, хотя цифр всего 10.
Вступление
Генерируем музыку с помощью Stable Diffusion
2022-12-18 в 6:20, admin, рубрики: big data, machine learning, python, stable diffusion, генерация изображений, генерация музыки, машинное обучение, Научно-популярное, обработка изображенийМногие уже слышали, а может и пробовали модель Stable Diffusion для генерации картинок из текста.

Теперь ту же модель можно использовать для генерации музыки! Модель была дообучена на задаче генерации спектрограмм по входной строке и теперь появилась возможность делать следующее:
Как смотрели нюдсы на древних компьютерах?
2022-12-14 в 11:59, admin, рубрики: ALTAIR 8800, cp/m, PCX, RLE, Visual 1050, Блог компании Дата-центр «Миран», кодирование изображений, Ленна, обработка изображений, сжатие данных, старое железо, эротика
Формат JPEG представили в 1993 году, а GIF — в 1987-м. Но тогда непонятно, как смотрели фотографии девушек на этой прекрасной машине образца 1983 года?
Такой вопрос пришёл мне от читателя обзора портативного компьютера Compaq Portable. Ответ оказался сложнее, чем мы думали. Давайте разберёмся.
Читать полностью »
Релиз InvokeAI 2.2: универсальный холст, удобные установщики, автозагрузка моделей и DPM++
2022-12-02 в 14:48, admin, рубрики: AI, graphic design, image processing, invokeai, machinelearning, neural networks, neural paintings, python, stablediffusion, графический дизайн, дизайн интерфейсов, искусственный интеллект, машинное обучение, нейросети, обработка изображенийПривет! InvokeAI 2.2 теперь доступен для всех. В этом обновлении добавлены UI Outpainting, Embedding Management и другие функции. Ознакомьтесь с выделенными обновлениями ниже, а также с полным описанием всех функций, включенных в релиз.
Что такое InvokeAI?
InvokeAI это интерфейс и оптимизированная реализация нейросети Stable Diffusion. InvokeAI был одним из самых ранних форков основного репозитория CompVis, а теперь превратился в полноценный инструментарий Stable Diffusion с открытым исходным кодом под названием InvokeAI.
Читать полностью »
PERICOLOR-1000: как был устроен «советский Фотошоп»?
2022-12-02 в 9:00, admin, рубрики: Numelec, PERICOLOR-1000, photoshop, ruvds_статьи, Блог компании RUVDS.com, обработка изображений
Отредактировать фотографию, убрать случайные дефекты, отрегулировать яркость и контрастность, повысить чёткость изображения и добавить утраченные фрагменты — что может быть проще? Если под рукой, конечно, имеется верный «Фотошоп»! Однако этот самый «Фотошоп» придумали в 1990 году, а вот фотографию изобрели чуть раньше: Нисефор Ньепс создал свою легендарную работу — «Вид из окна в Ле Гра» — в 1826-м. Но ведь как-то же решали эту задачу наши отцы, скажем, в 70-х и 80-х годах?
На «Хабре» уже публиковался короткий двухминутный фильм о «советском Фотошопе», с помощью которого музейные и научные работники ретушировали и восстанавливали редкие архивные снимки. Хабровчане опознали в нём аппаратно-программный комплекс PERICOLOR-1000 производства французской компании Numelec, но о самом этом наборе устройств известно очень мало — практически ничего. Сохранилась лишь обрывочная документация советского периода, представляющая собой не слишком качественный перевод с французского, в котором, ко всему прочему, используется совершенно непривычная современному айтишнику терминология. Мне стало жутко интересно выяснить как можно больше подробностей об этой удивительной системе, и я принялся целенаправленно искать информацию о ней. Результатами своих поисков я хочу поделиться с вами.
Читать полностью »
Видеоаналитика на взрывоопасном заводе площадью в 700 футбольных полей
2022-11-21 в 13:00, admin, рубрики: Алгоритмы, Анализ и проектирование систем, Блог компании Цифровой СИБУР, видеоаналитика, машинное обучение, нефтехимия, обработка изображений, СибурЕсть распространённый стереотип, будто на заводах надо каски детектировать или даже огонь. Но ведь идея в том, чтобы стремиться не допустить огня и всяких происшествий, а не фотографировать их. Поэтому на практике мы стараемся детектировать то, что происходит до того, как что-то подтечёт, задымится, загорится или пойдёт не по плану.
Меня зовут Щемелинин ВадимЧитать полностью »
Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)
2022-11-12 в 22:50, admin, рубрики: AI, graphic design, image processing, invokeai, machinelearning, neural networks, neural paintings, python, stablediffusion, графический дизайн, искусственный интеллект, машинное обучение, нейросети, обработка изображенийМодель подходит для создания бесшовных узоров, абстрактных рисунков и стилизованных под акварель образов. Как использовать модель и как обучить нейросеть на своих картинках?
Скачать модель здесь: https://huggingface.co/netsvetaev/netsvetaev-free