Всех приветствую, меня зовут Антон Рябых, работаю в Doubletapp. Вместе с коллегой Данилом Гальпериным мы написали статью про важный этап в процессе обучения нейронных сетей и получения необходимых нам результатов — оптимизацию модели. Зачем нужно оптимизировать модель, если и так все работает? Но как только вы начнете разворачивать модель на устройстве, которое будет ее обрабатывать, перед вами встанет множество проблем.
Рубрика «обработка изображений» - 3
Neural Network Optimization: океан в капле
2023-03-16 в 14:51, admin, рубрики: cезон machine learning, neural networks, OpenVINO, tensorrt, Блог компании Doubletapp, дистилляция, искусственный интеллект, квантование, кластеризация, машинное обучение, нейронные сети, обработка изображений, Серверная оптимизация5 классных сервисов на основе ИИ (с примерами)
2023-03-09 в 5:30, admin, рубрики: AI, Блог компании RUVDS.com, искусственный интеллект, машинное обучение, облачные сервисы, обработка изображений, подборка сервисов, подборки, Программирование, сервисы, синтез речиЗа последний год появилось огромное число новых сервисов, которые работают на нейронных сетях. Кажется, что уже не осталось людей, кто бы не слышал о том, что chatGPT пишет новости, а Midjorney во всю создает шедевры.
Сегодня я бы хотел показать 5 сервисов на основе нейронных сетей, которые не связаны с chatGPT, Midjorney или Stable Diffusion. Эти сервисы помогают обрабатывать аудио, преобразовывать текст в речь и удалять ненужные вещи с картинок.
Cleanvoice
Взгляд компьютерным зрением на работу коммунальных служб
2023-02-20 в 13:01, admin, рубрики: opencv, анализ изображений, визуализация данных, инженерные системы, Компьютерное зрение, машинное обучение, обработка изображений, Работа с видеоСтоит признать, мы таки живем в эпоху киберпанка. Он не похож (пока) на мрачные миры Ридли Скотта и братьев Вачовски, но вполне отвечает меткому определению: high tech, low lifeЧитать полностью »
Величайшие программисты XXI века. Юрки Алакуйяла — гений сжатия
2023-02-06 в 9:00, admin, рубрики: Brotli, Butteraugli, cityhash, Gipfeli, Guetzli, HighwayHash, IT-стандарты, JPEG XL, Jyrki Alakuijala, ruvds_статьи, WebP lossless, Алгоритмы, Блог компании RUVDS.com, обработка изображений, психовизуальные модели, психофизика, сжатие данных, Юрки АлакуйялаМало кто слышал имя Юрки Алакуйяла (@jyzg), но все мы используем его разработки. Картинки JPEG частенько генерируются фантастическим JPEG-энкодером guetzli с применением психовизуальных моделей, а HTTP-трафик в интернете жмётся кодеком brotli, тоже лучшим в своём классе.
Д-р Юрки Алакуйяла — активный член опенсорсного сообщества и исследователь. Работает техлидом Google Research Europe (Швейцария). Среди последних разработок — алгоритмы сжатия JPEG XL, WebP lossless и др.
Читать полностью »
Как Яндекс научился распознавать, что написано в рукописных архивах
2023-01-25 в 7:02, admin, рубрики: ocr, архивы, Блог компании Яндекс, искусственный интеллект, машинное обучение, нейросети, обработка изображений, поиск, поисковые технологии, распознавание текста, яндексПривет. Меня зовут Саша, в прошлый раз я рассказывал сообществу про поиск организаций в Яндексе. В этот раз мы вновь поговорим про поиск, но уже совершенно другого рода. Сегодня расскажем про «Поиск по архивамЧитать полностью »
Художники против нейросетей: справедливый протест или неолуддизм?
2023-01-21 в 10:00, admin, рубрики: dall-e, deviantart, midjourney, ruvds_статьи_выходного_дня, Блог компании RUVDS.com, Законодательство в IT, искусственный интеллект, нейросети, обработка изображений, Читальный залВ 2022 году изображения, сгенерированные нейросетями, были примерно везде. Часть аудитории они успели изрядно подзадолбать, но в целом подборки всё более причудливых изображений продолжают уверенно собирать тонны лайков и репостов почти на всех площадках. Однако отнюдь не все были рады происходящему.
Пока соцсети продолжали заполняться терабайтами изображений, сгенерированных Midjourney и её «коллегами», в декабре 2022 года в международном сообществе цифровых художников началась акция протеста в стиле киберпанк: художники на этой и на других платформах массово возмутились распространением изображений, созданных нейросетями.Читать полностью »
Как работают text2image модели?
2023-01-16 в 21:57, admin, рубрики: генерация изображений, диффузия, искусственный интеллект, математика, машинное обучение, нейронные сети, обзор, обработка изображенийВы, наверное, слышали про dalle-2, midjourney, stable diffusion? Слышали о моделях, которые по тексту генерируют картинку. Совсем недавно они продвинулись настолько, что художники протестуют, закидывая в стоки картинки с призывом запретить AI, а недавно, вообще, в суд подали! В этой статье будем разбираться, как такие модели работают. Начнем с азов и потихоньку накидаем деталей и техник генерации. Но будем избегать сложной математики – если хотите в нее погрузиться, то рекомендую эту статью (ссылка).
Если у вас плохой почерк, ваши письма попадают в ад. Только это UX-UI-ад для людей
2023-01-06 в 8:01, admin, рубрики: ocr, timeweb_статьи, usability, usps, ux/ui, Блог компании Timeweb Cloud, выгорание, интерфейсы, обработка изображений, распознавание изображений, скорость работы, сортировка, условия работыТам около 800 человек круглосуточно занимаются тем, что за 4 секунды должны перевести нечитаемый адрес в странный код, разработанный Siemens в 1990-х годах (надо ли добавлять, что он не интуитивен и сложен?). Поскольку работники используют сотни быстрых сочетаний клавиш, у них даже клавиатуры специальные.
Если меня когда-нибудь спросят о странной организации работ или о плохом UX/UI-дизайне, пожалуй, я покажу им вот этот пост. Посмотрите, как может выглядеть такая деятельность.
Читать полностью »
Когда картинка дороже слов
2023-01-02 в 13:00, admin, рубрики: airbnb, ruvds_перевод, анализ изображений, Блог компании RUVDS.com, искусственный интеллект, Компьютерное зрение, машинное обучение, нейронные сети, обработка изображений, свёрточная нейросетьВладельцы жилья оставляют на сайте Airbnb уникальные предложения аренды по всему миру. На Airbnb есть сотни миллионов сопутствующих фотографий. Фотографии содержат важную информацию о стиле и дизайне, которую сложно передать словами или списком. Поэтому несколько команд сотрудников Airbnb сегодня используют компьютерное зрение (computer vision), чтобы извлекать сведения об удобствах из нашего богатого массива данных, чтобы помогать гостям в удобном поиске предложений, соответствующих их предпочтениям.
В предыдущих постах WIDeText: A Multimodal Deep Learning Framework, Categorizing Listing Photos at Airbnb и Amenity Detection and Beyond — New Frontiers of Computer Vision at Airbnb мы рассказали о том, как используем компьютерное зрение для категоризации помещений и выявления удобств, чтобы сопоставлять фотографии предложений с таксономией дискретных концепций. В этом посте мы расскажем о том, как Airbnb использует эстетику и эмбеддинги изображений для оптимизации различных поверхностей продукта, включая содержимое рекламных объявлений, презентации и рекомендаций позиций.Читать полностью »
Третья жизнь пет-проекта по распознаванию рукописных цифр
2022-12-23 в 11:23, admin, рубрики: dataScience, detection, huggingface, machinelearning, open source, pet, streamlit, yolo, Блог компании Open Data Science, искусственный интеллект, машинное обучение, обработка изображенийВ этом блогпосте я поделюсь историей о том, как я обновлял свой старенький пет-проект по распознаванию цифр, как делал разметку для него, и почему модель предсказывает 12 классов, хотя цифр всего 10.