Рубрика «обработка изображений» - 3

Kandinsky 2.1, или Когда +0,1 значит очень много

2023-04-04 в 9:03, admin, рубрики: kandinsky, kandinsky 2.1, Блог компании Сбер, искусственный интеллект, Кандинский, машинное обучение, Научно-популярное, обработка изображений

В ноябре 2022 года мы выпустили свою первую диффузионную модель для синтеза изображений по текстовым описаниям Kandinsky 2.0 Читать полностью »

Neural Network Optimization: океан в капле

2023-03-16 в 14:51, admin, рубрики: cезон machine learning, neural networks, OpenVINO, tensorrt, Блог компании Doubletapp, дистилляция, искусственный интеллект, квантование, кластеризация, машинное обучение, нейронные сети, обработка изображений, Серверная оптимизация

Всех приветствую, меня зовут Антон Рябых, работаю в Doubletapp. Вместе с коллегой Данилом Гальпериным мы написали статью про важный этап в процессе обучения нейронных сетей и получения необходимых нам результатов — оптимизацию модели. Зачем нужно оптимизировать модель, если и так все работает? Но как только вы начнете разворачивать модель на устройстве, которое будет ее обрабатывать, перед вами встанет множество проблем.

Читать полностью »

5 классных сервисов на основе ИИ (с примерами)

2023-03-09 в 5:30, admin, рубрики: AI, Блог компании RUVDS.com, искусственный интеллект, машинное обучение, облачные сервисы, обработка изображений, подборка сервисов, подборки, Программирование, сервисы, синтез речи

За последний год появилось огромное число новых сервисов, которые работают на нейронных сетях. Кажется, что уже не осталось людей, кто бы не слышал о том, что chatGPT пишет новости, а Midjorney во всю создает шедевры.

Сегодня я бы хотел показать 5 сервисов на основе нейронных сетей, которые не связаны с chatGPT, Midjorney или Stable Diffusion. Эти сервисы помогают обрабатывать аудио, преобразовывать текст в речь и удалять ненужные вещи с картинок.

Cleanvoice

Cleanvoice Читать полностью »

Взгляд компьютерным зрением на работу коммунальных служб

2023-02-20 в 13:01, admin, рубрики: opencv, анализ изображений, визуализация данных, инженерные системы, Компьютерное зрение, машинное обучение, обработка изображений, Работа с видео

Стоит признать, мы таки живем в эпоху киберпанка. Он не похож (пока) на мрачные миры Ридли Скотта и братьев Вачовски, но вполне отвечает меткому определению: high tech, low life Читать полностью »

Величайшие программисты XXI века. Юрки Алакуйяла — гений сжатия

2023-02-06 в 9:00, admin, рубрики: Brotli, Butteraugli, cityhash, Gipfeli, Guetzli, HighwayHash, IT-стандарты, JPEG XL, Jyrki Alakuijala, ruvds_статьи, WebP lossless, Алгоритмы, Блог компании RUVDS.com, обработка изображений, психовизуальные модели, психофизика, сжатие данных, Юрки Алакуйяла

Пару дней назад на Хабре обсуждали, что сжатие информации — главная концепция нашей жизни. И вот перед нами представитель этой самой индустрии. Человек, который видит мир через призму теории информации, энтропии, хаоса и закономерностей.

Мало кто слышал имя Юрки Алакуйяла (@jyzg), но все мы используем его разработки. Картинки JPEG частенько генерируются фантастическим JPEG-энкодером guetzli с применением психовизуальных моделей, а HTTP-трафик в интернете жмётся кодеком brotli, тоже лучшим в своём классе.

Д-р Юрки Алакуйяла — активный член опенсорсного сообщества и исследователь. Работает техлидом Google Research Europe (Швейцария). Среди последних разработок — алгоритмы сжатия JPEG XL, WebP lossless и др.
Читать полностью »

Как Яндекс научился распознавать, что написано в рукописных архивах

2023-01-25 в 7:02, admin, рубрики: ocr, архивы, Блог компании Яндекс, искусственный интеллект, машинное обучение, нейросети, обработка изображений, поиск, поисковые технологии, распознавание текста, яндекс

Привет. Меня зовут Саша, в прошлый раз я рассказывал сообществу про поиск организаций в Яндексе. В этот раз мы вновь поговорим про поиск, но уже совершенно другого рода. Сегодня расскажем про «Поиск по архивам Читать полностью »

Художники против нейросетей: справедливый протест или неолуддизм?

2023-01-21 в 10:00, admin, рубрики: dall-e, deviantart, midjourney, ruvds_статьи_выходного_дня, Блог компании RUVDS.com, Законодательство в IT, искусственный интеллект, нейросети, обработка изображений, Читальный зал

В 2022 году изображения, сгенерированные нейросетями, были примерно везде. Часть аудитории они успели изрядно подзадолбать, но в целом подборки всё более причудливых изображений продолжают уверенно собирать тонны лайков и репостов почти на всех площадках. Однако отнюдь не все были рады происходящему.

Пока соцсети продолжали заполняться терабайтами изображений, сгенерированных Midjourney и её «коллегами», в декабре 2022 года в международном сообществе цифровых художников началась акция протеста в стиле киберпанк: художники на этой и на других платформах массово возмутились распространением изображений, созданных нейросетями.Читать полностью »

Как работают text2image модели?

2023-01-16 в 21:57, admin, рубрики: генерация изображений, диффузия, искусственный интеллект, математика, машинное обучение, нейронные сети, обзор, обработка изображений

Вы, наверное, слышали про dalle-2, midjourney, stable diffusion? Слышали о моделях, которые по тексту генерируют картинку. Совсем недавно они продвинулись настолько, что художники протестуют, закидывая в стоки картинки с призывом запретить AI, а недавно, вообще, в суд подали! В этой статье будем разбираться, как такие модели работают. Начнем с азов и потихоньку накидаем деталей и техник генерации. Но будем избегать сложной математики – если хотите в нее погрузиться, то рекомендую эту статью (ссылка).

Читать полностью »

Если у вас плохой почерк, ваши письма попадают в ад. Только это UX-UI-ад для людей

2023-01-06 в 8:01, admin, рубрики: ocr, timeweb_статьи, usability, usps, ux/ui, Блог компании Timeweb Cloud, выгорание, интерфейсы, обработка изображений, распознавание изображений, скорость работы, сортировка, условия работы

В Штатах адреса всей бумажной почты сканируются и автоматически распознаются. Однако, если адрес написан неразборчиво или поврежден, он отправляется в Центр удаленного декодирования Почтовой службы США в Солт-Лейк-Сити.

Там около 800 человек круглосуточно занимаются тем, что за 4 секунды должны перевести нечитаемый адрес в странный код, разработанный Siemens в 1990-х годах (надо ли добавлять, что он не интуитивен и сложен?). Поскольку работники используют сотни быстрых сочетаний клавиш, у них даже клавиатуры специальные.

Если меня когда-нибудь спросят о странной организации работ или о плохом UX/UI-дизайне, пожалуй, я покажу им вот этот пост. Посмотрите, как может выглядеть такая деятельность.
Читать полностью »

Когда картинка дороже слов

2023-01-02 в 13:00, admin, рубрики: airbnb, ruvds_перевод, анализ изображений, Блог компании RUVDS.com, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обработка изображений, свёрточная нейросеть

Владельцы жилья оставляют на сайте Airbnb уникальные предложения аренды по всему миру. На Airbnb есть сотни миллионов сопутствующих фотографий. Фотографии содержат важную информацию о стиле и дизайне, которую сложно передать словами или списком. Поэтому несколько команд сотрудников Airbnb сегодня используют компьютерное зрение (computer vision), чтобы извлекать сведения об удобствах из нашего богатого массива данных, чтобы помогать гостям в удобном поиске предложений, соответствующих их предпочтениям.

В предыдущих постах WIDeText: A Multimodal Deep Learning Framework, Categorizing Listing Photos at Airbnb и Amenity Detection and Beyond — New Frontiers of Computer Vision at Airbnb мы рассказали о том, как используем компьютерное зрение для категоризации помещений и выявления удобств, чтобы сопоставлять фотографии предложений с таксономией дискретных концепций. В этом посте мы расскажем о том, как Airbnb использует эстетику и эмбеддинги изображений для оптимизации различных поверхностей продукта, включая содержимое рекламных объявлений, презентации и рекомендаций позиций.Читать полностью »

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 3

Kandinsky 2.1, или Когда +0,1 значит очень много

Neural Network Optimization: океан в капле

5 классных сервисов на основе ИИ (с примерами)

Cleanvoice

Взгляд компьютерным зрением на работу коммунальных служб

Величайшие программисты XXI века. Юрки Алакуйяла — гений сжатия

Как Яндекс научился распознавать, что написано в рукописных архивах

Художники против нейросетей: справедливый протест или неолуддизм?

Как работают text2image модели?

Если у вас плохой почерк, ваши письма попадают в ад. Только это UX-UI-ад для людей

Когда картинка дороже слов

Архив

Информация

Обсуждаемое

Рекомендуем

Рубрика «обработка изображений» - 3

Cleanvoice

Новости

Актуальные темы

Архив