Рубрика «транскрибация»
Эволюция протоколов встреч: от листка в блокноте до ИИ-ассистента
2025-10-25 в 5:17, admin, рубрики: видеовстречи, встречи, запись разговоров, машинное обучение, нейросети, расшифровка, собрания, суммаризация, транскрибацияI. Первые шаги: листок, стенография и диктофон
В середине XX века к протоколированию добавился диктофон. Уже не надо было все ловить «на лету» — можно записать разговор и потом «разложить» записи в текст. Но диктофон имел слабое место: качество записи, шум, шепоты, пересекающиеся голоса — всё это мешало точности. К тому же, никто не может слушать три часа записи без усталости — и всё равно надо вручную транскрибировать, выбирать, что важно.
Но технология, решая одну проблему, тут же создала другую. Часовые записи становились «цифровым кладбищемЧитать полностью »
Топ моделей для контента
2025-07-25 в 12:13, admin, рубрики: midjourney, ИИ, контент, модели ии, нейросети, создание видео, создание изображений, создание контента, транскрибация
В последние годы генеративные нейросети стали не просто трендом, а полноценным инструментом для создания контента. Текст, изображения, аудио и даже видео — всё это можно сгенерировать с помощью моделей искусственного интеллектаЧитать полностью »
OpenAI взимает оплату поминутно, так что сделаем минуты короче
2025-06-26 в 10:38, admin, рубрики: OpenAI, voice-to-text, транскрибация, транскрипция
Хотите ускорить и удешевить транскрибации OpenAI? Просто повысьте скорость аудио.
Я имею в виду буквально. Перед транскрибацией увеличьте скорость аудио в два или в три раза в Читать полностью »
ТОП-5 нейросетей для транскрибации аудио в текст (часть 2)
2025-05-21 в 13:24, admin, рубрики: speech-to-text, Whisper, нейросети, расшифровка аудио, транскрибация
В первой части мы проверили три сервиса: AssemblyAI, Riverside и Teamlogs. Все они обещали точную и быструю транскрибацию, но на деле…
На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта
2025-05-19 в 13:51, admin, рубрики: gemma, Nemo, obsidian, Ollama, Whisper, диаризация, расшифровка аудио, саммари, саммаризация, транскрибацияВсем привет! Меня зовут Николай Луняка, и я, как и многие из вас, ежедневно утопаю в потоке информации. Количество аудиоконтента растёт в геометрической прогрессии, при этом его нужно ещё «переварить» и зафиксировать.
Интереснейшие лекции хочется сохранить не только в памяти, но и в виде тезисов, а ещё есть подкасты, интервью, да и банальные голосовые заметки, надиктованные на бегу. Знакомая картина?
На помощь приходят облачные сервисы: транскрибация, Читать полностью »
Как я научился анализировать собственные собесы с помощью Whisper (и почему это нужно каждому айтишнику и не только)
2025-05-17 в 10:16, admin, рубрики: gpt, OpenAI, python, Whisper, анализ речи, карьерный рост, подготовка к интервью, сезон open source, собеседование, транскрибацияСобеседования — всегда стресс. Я замечал, что после каждого интервью трудно вспомнить детали: какие вопросы задавали, как именно я отвечал, где были ошибки или неточности. А переслушивать запись, которая может длиться от часа и выше это долго и неэффективно.
Задумался: а что если использовать что‑то, что автоматически превратит аудиозапись интервью в текст? Так я открыл для себя Whisper от OpenAI. Ниже подробности о его применении.
⚠️ Важно: записывать интервью можно только с согласия всех участников, иначе это может преследоваться законом.
Выжимаем максимум из моделей Whisper на Apple Silicon
2025-02-23 в 9:15, admin, рубрики: Whisper, нейросети, транскрибация
Недавно захотел вспомнить молодость и пересмотреть отличные лекции по машинному обучению из университета. Смотреть, конечно же, стало скучно уже на 5 минуте, и мне пришла в голову отличная идея. Что если перевести все лекции в текст и просто нажимать CtrlЧитать полностью »
Сравнение трёх алгоритмов транскрибации: Whisper, встроенный в macOS и автоматическая расшифровка YouTube
2024-12-20 в 9:21, admin, рубрики: Whisper, YouTube, транскрибацияПри работе с видеоконтентом нередко возникает задача получить точную текстовую расшифровку. Качество транскрипции напрямую влияет на удобство дальнейшей обработки: поиск по тексту, добавление субтитров, анализ контента, подготовка документации или статей.
В этой статье я сравню три автоматических решения для транскрибации одного и того же технического видеоролика:
-
Алгоритм на базе Whisper от OpenAI
-
Встроенный механизм распознавания речи в macOS
-
Автоматическая расшифровка, сгенерированная в YouTube


