Рубрика «Audio»

Три минуты на освоение обработки аудио и видео | Элегантное использование FFmpeg в Rust

2025-04-15 в 16:16, admin, рубрики: Audio, ffmpeg, Rust

Обработка аудио и видео может показаться сложной задачей, но в разработке нам рано или поздно приходится сталкиваться с такими задачами, как конвертация форматов видео, обрезка, добавление водяных знаков или извлечение аудио.

FFmpeg — это признанный стандарт в индустрии, который умеет почти всё. Его используют популярные программы, такие как VLC, YouTube и OBS. Однако у FFmpeg есть свои подводные камни, которые могут доставить разработчикам головную боль:

Высокий порог входаЧитать полностью »

Teensy 4: Arduino на скорости 600 МГц (почувствуй себя властелином вселенной)

2025-02-23 в 8:05, admin, рубрики: AMS, arduino, Audio, Cortex, DIY, ethernet, IoT, LED, M7, teensy, timeweb_статьи

Последнее время мне стали часто попадаться упоминания контроллеров Teensy, причём в самых интересных и мощных проектах. Какое-то время я не обращал на это внимание, но потом заинтересовался этой темой и чем дальше я в неё погружался, тем больше впечатлялся.

Оказывается, последняя версия Teensy 4 сделана на основе Cortex M7 и работает на частоте 600 МГц, причём ядро там довольно продвинутое и позволяет исполнять две инструкции за такт, использует предсказание ветвлений и аппаратную обработку 64-битных чисел с плавающей точкой, а также много чего ещё, в том числе имеет на борту много RAM, Flash и PSRAM памяти и т. д.

В общем, контроллер очень продвинутый и позволяет создавать проекты в области обработки звука, управления массивами светодиодов, вывода видео на LED экраны, создания музыкальных синтезаторов и т. д. и т. п.

В результате я пришёл к выводу, что с этим стоит познакомиться поближе и на Али был заказан комплект Teensy 4.1 с Audio и Ethernet расширениями, а затем я с большим удовольствием поэкспериментировал с этим железом. Ну а далее я предлагаю свой отчёт о проведённых экспериментах, а также поделюсь своими впечатлениями о Teensy 4.1.
Читать полностью »

Moshi: GPT4-O voice mode дома (обзор)

2024-09-24 в 14:33, admin, рубрики: AI, asr, Audio, large language model, llm, ml, nlu, sound, TTS

Intro

Прежде чем приступать к самому обзору, хотелось бы обозначить отличительные черты подхода, относительно большинства диалоговых систем:

Текущие системы работают в каскадной манере: сначала «активационное» слово, затем аудио переводится в текст (ASR), текст обрабатывается и анализируется, и, наконец, ответ генерируется через TTS. Однако это медленно, теряет эмоции и «живость» разговора, и, что самое важное, все взаимодействие происходит через жесткое чередование говорящих — сначала ты, потом я, и так далее.

Moshi не опирается на сложные каскадные пайплайны (ASR, NLU, TTS), а объединяет все эти функции Читать полностью »

«Невозможный» аудиокодек для Sega MD

2024-04-18 в 8:01, admin, рубрики: Audio, codec, make sega great again, sega genesis, sega megadrive, timeweb_статьи

Вступительный текст про легендарную консоль, вода, бла-бла-бла. Искрой для появления статьи послужил неожиданный факт: ЦАП мегадрайва способен воспроизводить звук с качеством 26 килогерц 8 бит. Что? Хочу такое! Но… Максимальный размер картриджа 4 Мб, этого хватит на 2.5 минуты такого звука, с распаковкой современных кодеков старый процессор не справится. Качество против количества. Нерешаемое противоречие, но если сильно хочется, то всё получается.
Читать полностью »

Windows Chrome: Исправляем задержку звука по Bluetooth

2022-05-20 в 15:10, admin, рубрики: Audio, bluetooth, chrome, dll injection, Google Chrome, latency, windows, звук, разработка под windows, реверс-инжиниринг

Совсем недавно мы купили новый ноутбук на Windows человеку, который до сих пор пользовался Mac'ами. Одна из замеченных проблем - при просмотре видео звук в Bluetooth наушниках запаздывает по отношению к видео, причём заметно. Используя slow motion видео на телефоне, мы выяснили, что задержка составляет порядка 200мс. Это много, и это мешает воспринимать речь в видео.

Читать полностью »

Работа с аудио в Unity — трассировка и облачные вычисления

2021-11-13 в 19:45, admin, рубрики: .net, 3d, Audio, cloud, computing, HRTF, raytracing, unity, volumetric sound

Всем привет! Меня зовут Илья, я из команды TinyPlay. В этой статье хотел бы поделиться тем, как мы работаем с аудио. Надеюсь, для вас эта статья будет полезной.

Работа с аудио в Unity — трассировка и облачные вычисления - 1

Архитектура аудио

Читать полностью »

Некролог на смерть Chromecast Audio: Google убил черные диски

2019-01-17 в 19:19, admin, рубрики: Audio, chromecast audio, Google, беспроводная передача данных, Беспроводные технологии, Блог компании Pult.ru, гаджеты, звук, Производство и разработка электроники, стриминг, устройства google

Несколько дней назад www.reddit.com сообщил, что Googlе прекращает выпуск Chromecast Audio, устройства, которое в свое время стало одним из самых удобных альтернатив большим мультирум системам. Для тех, кто успел забыть, что это за штуковина, напомню, что это такой диск, который превращал любые колонки в беспроводные, принимал звуковой сигнал по WI-FI, предлагал 3 варианта коммутации и стоил $ 35. Лично для меня Chromecast Audio и тв-приставка Chromecast стали если не эталонами, то своеобразным символами того, что инновации могут существенно расширить возможности пользователя без астрономических затрат.

Некролог на смерть Chromecast Audio: Google убил черные диски - 1
Читать полностью »

Советский HI-FI и его создатели: цифровая звукозапись в СССР — в шаге от победы

2018-12-27 в 18:40, admin, рубрики: Audio, cccр, CD, Hi-Fi, Блог компании Pult.ru, звук, история, история цифровой записи, Научно-популярное, советский союз, старое железо, техника cccр, цифровая запись

Не многие знают о том, что в СССР существовала собственная программа по созданию цифровых аудиоформатов и устройств для их воспроизведения. Вполне вероятно, что она могла бы составить конкуренцию CD. В прошлых материалах этого цикла я касался первых CD-проигрывателей, созданных в Эстонской ССР. Эти устройства были выпущены через 10 лет после появления первых прототипов в США, под уже существующий западный стандарт. Задолго до этого в Союзе проводились работы по разработке собственного стандарта цифровой звукозаписи.

Советский HI-FI и его создатели: цифровая звукозапись в СССР — в шаге от победы - 1

Первые прототипы такой записи на оптическом диске и проигрыватель для них были созданы за год до появления серийного устройства Philips. А готовые к серийному выпуску советские проигрыватели оптических дисков показали на ВДНХ практически одновременно с первыми серийными образцами на Западе в 1982-м году. Под катом неизвестная история советской программы по созданию цифровой звукозаписи.
Читать полностью »

Легенды мирового колонкостроения: эволюция трехполосного стандарта, студийный культ JBL

2018-07-28 в 1:38, admin, рубрики: Audio, JBL, акустика, акустические системы, АС, Блог компании Pult.ru, звук, звукозапись, история аудио, история бренда, колонки, монитор, периферия, старое железо, технологии, физика

Акустические системы, о которых пойдет речь, известны тем, что установили новый отраслевой стандарт в звукозаписи, а несколько позже и в домашнем аудио. Эта разработка JBL стала значимой частью истории не только этой компании, но также мировой звукозаписывающей индустрии, акустического дизайна студий и в какой-то степени истории музыки.

Легенды мирового колонкостроения: эволюция трехполосного стандарта, студийный культ JBL - 1

Речь пойдет об одной из самых популярных линеек студийных мониторов за всю историю электроакустики. Эволюционную преемственность в этой линейе можно проследить с конца 60-х до настоящего времени. Иными словами, пост о мониторах JBL 4310 и разработках, созданных на их основе.

Именно благодаря решениям, реализованным в этих АС, к 1977-му году подавляющее количество звукозаписывающих студий в мире использовало студийные мониторы JBL.

Так, по данным опроса Billboard, к концу 70-х общее количество студий, использующих оборудование JBL, превышало общее количество студий с оборудованием всех остальных брендов.
Читать полностью »

Pitch-tracking, или определение частоты основного тона в речи, на примерах алгоритмов Praat, YAAPT и YIN

2018-07-06 в 16:20, admin, рубрики: Audio, python, signal processing, speech, Tracking, Алгоритмы, Блог компании Neurodata Lab, звук, машинное обучение, Программирование

В сфере распознавания эмоций голос – второй по важности после лица источник эмоциональных данных. Голос можно охарактеризовать по нескольким параметрам. Высота голоса – одна из основных таких характеристик, однако в сфере акустических технологий корректнее называть этот параметр частотой основного тона.

Частота основного тона имеет непосредственное отношение к тому, что мы называем интонацией. А интонация, например, связана с эмоционально-экспрессивными характеристиками голоса.

Тем не менее, определение частоты основного тона является не совсем тривиальной задачей с интересными нюансами. В этой статье мы обсудим особенности алгоритмов для ее определения и сравним существующие решения на примерах конкретных аудиозаписей.
Читать полностью »

Информация

Комментарии

Рекомендуем