Архив за 07 февраля 2023

TVGuardian. Задача: заменить ругательства в реальном времени - 1
«Он похож на зануду?» Реплика также может быть оценена, будто Уоллеса сравнивают с клячей, старой лошадью. Видеоролик Джерри Ноулза

Телеприставка подключается к аналоговому телевизору. Её шероховатый пластиковый корпус выглядит так, будто это пришелец из восьмидесятых. Действительно, устройство построено на технологиях конца прошлого века.

Затем из телесигнала пропадает любая обсценная лексика (или часть — уровень фильтрации настраивается). Когда на экране звучит ругательство, аудиодорожка затихает. Чтобы не терять смысл реплики, на экране появляются субтитры с заменой цензурируемого слова или выражения. После окончания нехорошей реплики звук немедленно включается снова.

Даже сегодня умные колонки не транскрибируют речь пользователя, а отсылают её в облако. Очевидно, что четверь века назад точное машинное распознавание речи было в лучшем случае мечтой. Принцип работы приставки куда проще, но также он поражает остроумием и скромностью задействованных ресурсов: вся логика занимает меньше 4 КиБ.
Читать полностью »

Как пишет «Прайм» со ссылкой на директора иркутского филиала сибирского отделения РАН Игоря Бычкова, компания Huawei при сотрудничестве Института динамики систем и теории управления СО РАН может создать в РФ суперкомпьютерный центр. Он разместится в иркутском Академгородке.

Huawei откроет в России суперкомпьютерный центр

«Читать полностью »

Похоже, с переходом Apple на собственные процессоры для Mac компания решила заодно замахнуться на рынок игровых систем. Об этом в интервью рассказали вице-президент Apple по платформенной архитектуре и аппаратным технологиям Тим Миллет и вице-президент по всемирному маркетингу продуктов Боб Борчерс. 

Вместе с глобальной премьерой телефона OnePlus 11 сегодня состоялась и премьера планшета OnePlus Pad. Новинка оказалась очень интересной. Взять хотя бы экран — далеко не у каждого топового планшета кадровая частота составляет даже 120 Гц, здесь же — 144 Гц. Разрешение экрана составляет 2800 х 2000 пикселей, максимальная яркость — 500 кд/кв.м.

Кстати, эта картинка сгенерирована Midjourney
Кстати, эта картинка сгенерирована Midjourney

Читать полностью »

Команда СберБанка объявила о запуске обновления для мобильного приложения «СберБанк Онлайн». Благодаря сотрудничеству с Русским географическим обществом (РГО) среди заставок, которые можно установить на входе в приложение, появился новый набор — «Пролетая над Россией».

8 книг по PostgreSQL: от баз данных с «нуля» для самоучек до руководства про БД в облаках - 1

В целом, эта объектно-реляционная СУБД в дополнительном представлении не нуждается. Разработанная более 20 лет назад, она предназначена для создания и поддержки баз данных серверных приложений, в том числе ресурсоемких аналитических БД. Одна из особенностей PostgreSQL — открытый исходный код. Мы любим ее за развитое комьюнити и возможность развернуть «постгрю» самостоятельно и бесплатно.

Подготовили подборку полезных книг для тех, кто только начал или собирается работать с PostgreSQL. В нее вошли актуальные руководства на русском и английском языках. Если знаете еще одну-две отличных книги, смело рекомендуйте в комментариях.
Читать полностью »

Эксперты «Лаборатории Касперского» в честь Дня безопасного интернета опубликовали рекомендации о том, как можно использовать нашумевшую нейросеть ChatGPT без вреда для ценной информации.

Какой метод генерации аудио лучший? Сравнение GAN, VAE и Diffusion - 1


В прошлой статье я затронул тему генерации звука с помощью диффузионной модели. Но какие методы существуют вообще и какой из них сейчас наиболее перспективен? Сегодня мы рассмотрим долгий путь этого направления в машинном обучении. Послушаем результаты, посмотрим метрики и просто взглянем на новые технологии, применяемые в совершенно разных нейросетях для аудиосинтеза.Читать полностью »

Китайский гигант Baidu сообщил о скором завершении тестирования Ernie Bot — это аналог ChatGPT. Новинку анонсируют в марте. По данным Reuters, языковую модель Ernie представили в 2019 году. Она способна понимать речь, генерировать тексты и изображения. Само слово расшифровывается как Enhanced Representation through Knowledge Integration.


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js