Мы включили HD-Voice на сети «Билайн» в Москве. Ниже записи звука до и после, а также технические детали.
В основе режима HD-voice лежит технология AMR-WB (Adaptive Multi Rate Wadeband) – широкополосное адаптивное кодирование с переменной скоростью), также данный кодек известен как стандарт G.722.22. В теории человек может услышать звуки в диапазоне 20Гц – 20кГц, но на практике достаточно передавать звук в существенно более узком диапазоне. При кодировании речи в AMR-WB используется диапазон частот 50Гц-7кГЦ, этого абсолютно достаточно для полноценной передачи голоса. Для примера, в кодеке AMR используется диапазон 300-3кГц. Метод может использоваться в сетях 2G и 3G.
Проще говоря, теперь человеческий голос будет звучать естественнее, потому что перестанет «ужиматься» в довольно узкую полосу, необходимость которой была когда-то продиктована ограничениями инфраструктуры. Кроме того, при HD-кодировании, внешние шумы оказывают меньшее воздействие на разборчивость речи.
Как мы дошли до HD-Voice, и как это работает?
Речь человека занимает некоторую полосу звуковых частот, обычно её принимают равной 20Гц-20кГц. Передать весь спектр по беспроводным каналам связи без сжатия сложно, поэтому голос без урезания полосы передается только в проводных системах. Для целей сжатия речи используются голосовые кодеки или вокодеры. Их побочным действием является искажение передаваемого голоса за счет ограничения полосы частот голосового сообщения.
Самым первым голосовым кодеком, использовавшимся в мобильных сетях, был «Full Rate» — FR. Одновременно с FR, был введен и кодек «Half Rate», единственное предназначение которого – увеличение количества одновременно обслуживаемых абонентов, и, как понятно из его названия, он занимает в радиоканале половину полосы кодека FR. Однако качество голоса после перекодирования в FR, было не очень высоким, а для некоторых стран (к примеру, арабских, где скорость речи высокая и много высочастотных звуков), и вовсе неприемлемым. Поэтому кодек FR был переработан, и появился «Enhanced Full Rate», обеспечивающий существенно лучшее качество голоса, при меньшем создаваемом битрейте.
С ростом проникновения мобильных сетей, требования к качеству голосовых услуг стали расти, и проявилась проблема с ухудшением качества голоса, при низком уровне радиосигнала от базовой станции. Для решения этой задачи, был разработан новый кодек — «Adaptive Multi Rate», который использовал тот же диапазон частот для анализа и сжатия, но алгоритм был реализован таким образом, что битрейт кодека динамически менялся, в зависимости от качества принимаемого сигнала. Благодаря этому, появилась возможность при хороших радиоусловиях предоставить отличное качество голоса, а при плохих – сохранять разговор даже там, где кодеки FR/EFR не смогли бы работать вовсе.
Все сети 3G работают только с использованием кодека AMR или последующих его реализаций, например AMR-WB. Но поскольку в сети остается большое количество абонентов использующих телефоны поддерживающие только работу с кодеками EFR/HR, сеть 2G продолжает работать со всеми кодеками (FR/EFR/HR/AMR FR/AMR HR) сразу, обеспечивая голосовой связью любой телефон.
В настоящее время требования к качеству голоса в мобильных сетях продолжают расти, и настало время для использования технологии AMR-WB. Все кодеки, описанные выше, используют для сжатия диапазон частот до 200Гц-3.4кГц, в то время как AMR-WB для кодирования использует полосу голосового сообщения на уровне 50Гц-7кГц., т.е. AMR-WB позволяет передавать в два раза большую полосу частот, что и дает увеличение качества и насыщенности высокими и низкими частотами передаваемого голоса.
Некоторые характеристики кодеков приведены в таблице:
Кодек | Стандарт | Год создания | Диапазон сжимаемых частот | Создаваемый битрейт |
Full Rate — FR | GSM 06.10 | 1990 | 200-3400 Hz | 13 kbit/s |
Half Rate — HR | GSM 06.20 | 1990 | 200-3400 Hz | 5.6 kbit/s |
Enhanced Full Rate — EFR | GSM 06.60 | 1995 | 200-3400 Hz | 12.2 kbit/s |
Adaptive Multi Rate — AMR | 3GPP TS 26.071 | 1999 | 200-3400 Hz | 4.75 — 12.20 kbit/s |
Adaptive Multi Rate — WideBand — AMR-WB | 3GPP TS 26.190 | 2001 | 50-7000 Hz | 6.60 — 23.85 kbit/s |
Adaptive Multi Rate-WideBand+ — AMR-WB+ | 3GPP TS 26.290 | 2004 | 50-7000 Hz |
6 — 36 kbit/s (mono) 7 — 48 kbit/s (stereo) |
Hint для любознательных программистов: образец реализации кодека AMR на языке Си имеется в стандарте 3GPP TS 26.073 (его можно легко найти, скачать и попробовать реализовать).
На диаграмме ниже можно увидеть сравнение качества голоса, по шкале MOS (Mean Opinion Score), в зависимости от используемого кодека. Шкала MOS – субъективная оценка качества голоса от 0 до 5, где 0 – полное отсутствие слышимости, а 5 – живая речь. Кодек G.711 – применяется в проводной телефонии, то есть это качество которое вы должны слышать со своего городского телефона (если он, конечно, не переведен на IP канал, но это тема совсем другого разговора).
Как видно из диаграммы, кодек AMR-WB, обеспечивает, при хороших радиоусловиях, качество голоса выше, чем проводной домашний телефон.
Для примера – два фрагмента музыкальной композиции, которые сжимались кодеками AMR и AMR-WB, можете сами сравнить качество звука, и визуально оценить разницу в звуковой картине, создаваемой разными кодеками.
Верхний трек, кодированный в AMR
Нижний трек, кодированный в AMR-WB
Тесты
Мы не первые, кто запускает эту технологию в России, поэтому кое-какие наработки уже были. Наш первый участок сети с HD-Voice был построен в пределах МКАД, на оборудовании Ericsson. Активирование AMR-WB заняло длительное время: сначала проходило тестирование на одном контроллере (с многочисленными драйв-тестами по измерению качества речи). И даже после того как на одном контроллере все было протестировано, последующая активация проходила поэтапно, контроллер за контроллером. Весь процесс активирования занял почти полгода.
Вот эталонные сэмплы с финала тестов, которые оценивались аппаратно с помощью точных замеров в разные моменты.
Это уже работает?
Да, сейчас технология реализована в сети 3G для Москвы. Для того, чтоб воспользоваться режимом, не нужно производить дополнительных настроек, он активизируется сам, если оба абонента находятся в сети 3G и оба их телефона поддерживают работу кодека.
На схеме изображены условия, которые нужны для функционирования AMR-WB. Сейчас как говорилось выше, кодек запущен в сети 3G, следующий этап обеспечить работу кодека между сетью 2G и 3G, далее — между сетями и между операторами.
Какие устройства поддерживаются?
Alcatel One Touch 916/916D
Alcatel One Touch 918
Alcatel One Touch 983
Alcatel One Touch 985/985D
Alcatel One Touch 991/991D/991T
Alcatel One Touch 992D
Alcatel One Touch 993/993D
Alcatel One Touch 995/996
Alcatel One Touch Idol
Alcatel One Touch Idol Ultra
Alcatel One Touch Scribe Easy
Alcatel One Touch Scribe HD
Alcatel One Touch Star
Alcatel One Touch Tribe
Alcatel One X'POP
Apple iPhone 5
Apple iPhone 5S
Apple iPhone 5C
BlackBerry Q10
BlackBerry Q5
BlackBerry Torch 9810
BlackBerry Z10
BlackBerry Z30
HTC Desire 500
HTC ChaCha
HTC Desire C
HTC Desire HD
HTC Desire S
HTC Desire X
HTC Desire Z
HTC EVO 3D
HTC Incredible
HTC One
HTC One mini
HTC One S
HTC One SV
HTC One V
HTC One X
HTC One X+
HTC One XL
HTC One® (M8)
HTC Radar
HTC Raider
HTC Rhyme
HTC Sensation
HTC Sensation XE
HTC Sensation XL
HTC Titan
HTC Touch HD
HTC Wildfire S
HTC Windows Phone 8X
HTC Windows Phone 8S
Huawei Ascend D Quad
Huawei Ascend D2 LTE (VoLTE)
Huawei Ascend G510
Huawei Ascend G740
Huawei Ascend P1 U9200
Huawei Ascend P2
Huawei Ascend P6
Huawei Boulder U8350
LG A310
LG Nexus 4 E960
LG Nexus 5
LG Optimus 3D
LG Optimus G
LG Optimus G Pro
LG Optimus L4 II
LG Optimus L5
LG Optimus L5 II
LG Optimus L7
LG Optimus L7 II
LG Optimus L9
LG Optimus LTE2 F160LV (VoLTE)
LG Optimus F7
LG Optimus F180S (VoLTE)
LG Optimus Vu2 F200 (K,L,S) (VoLTE)
LG Optimus Vu3 F300 (K,L,S) (VoLTE)
LG Optimus GX F310L (VoLTE)
LG Optimus G2 F320S (VoLTE)
LG Optimus G Pro F240S (VoLTE)
LG Optimus LTE III F260S (VoLTE)
LG Optimus G Flex F340S (VoLTE)
LG Optimus 3D Max (P720)
LG Optimus 3D (P920)
LG Optimus 4X HD (P880)
LG Prada (P940)
LG Prada 3.0
Motorola Quench
Motorola RAZR (XT910)
Motorola RAZR i (XT890)
Motorola Moto G
Nokia 300
Nokia 301
Nokia 302
Nokia 500
Nokia 515
Nokia 600
Nokia 603
Nokia 700
Nokia 701
Nokia 808 PureView
Nokia 5230
Nokia 5330 Mobile TV Edition
Nokia 5530 XpressMusic
Nokia 5630 XpressMusic
Nokia 5730 XpressMusic
Nokia 6260 Slide
Nokia 6600i slide
Nokia 6700 classic
Nokia 6700 slide
Nokia 6710 Navigator
Nokia 6720 classic
Nokia 6760 slide
Nokia 6790 slide
Nokia 7230
Nokia Asha 300
Nokia Asha 301
Nokia Asha 302
Nokia Asha 303
Nokia Asha 311
Nokia C2-01
Nokia C3-01 Touch and Type
Nokia C5-03
Nokia C5-04
Nokia C6-00
Nokia C6-01
Nokia C7-00
Nokia E5-00
Nokia E52
Nokia E55
Nokia E6-00
Nokia E63
Nokia E7 Communicator
Nokia E7-00
Nokia E71x
Nokia E72
Nokia E73 Mode
Nokia Lumia 510
Nokia Lumia 520
Nokia Lumia 520.2
Nokia Lumia 521
Nokia Lumia 610
Nokia Lumia 610 NFC
Nokia Lumia 620
Nokia Lumia 625
Nokia Lumia 710
Nokia Lumia 720
Nokia Lumia 800
Nokia Lumia 810
Nokia Lumia 820
Nokia Lumia 822
Nokia Lumia 900
Nokia Lumia 920
Nokia Lumia 920T
Nokia Lumia 925
Nokia Lumia 925 Superman Edition
Nokia Lumia 925T
Nokia Lumia 928
Nokia Lumia 929 LTE-A (Cat 4)
Nokia Lumia 1020.2
Nokia Lumia 1020 3G
Nokia Lumia 1020 LTE
Nokia Lumia 1520
Nokia N7
Nokia N8
Nokia N86 8MP
Nokia N9
Nokia N97
Nokia N97 mini
Nokia X3-02
Nokia X5
Nokia X6-00
Nokia X7-00
Samsung Galaxy Star
Samsung Galaxy Light
Samsung Ativ S
Samsung Galaxy Ace
Samsung Galaxy Ace 2
Samsung Galaxy Express
Samsung Galaxy Fame
Samsung Galaxy Mini
Samsung Galaxy Mini 2
Samsung Galaxy Nexus
Samsung Galaxy Note
Samsung Galaxy Note II
Samsung Galaxy Note 3
Samsung Galaxy Note 10.1
Samsung Galaxy S II
Samsung Galaxy S III
Samsung Galaxy S4
Samsung Galaxy S4 Mini
Samsung Galaxy S5
Samsung Galaxy S Advance
Samsung Galaxy S Plus
Samsung Galaxy W
Samsung Galaxy Y
Samsung Omnia 7
Samsung Omnia Pro B7350
Samsung S5610
Samsung Wave 3
Samsung Trend Plus
Sony Ericsson Elm
Sony Ericsson Hazel
Sony Ericsson Live with Walkman
Sony Ericsson Xperia X8
Sony Ericsson Xperia X10 Mini
Sony Ericsson Xperia X10 mini pro
Sony Ericsson Xperia acro
Sony Ericsson Xperia active
Sony Ericsson Xperia Arc
Sony Ericsson Xperia arc S
Sony Ericsson Xperia mini
Sony Ericsson Xperia Mini Pro
Sony Ericsson Xperia neo
Sony Ericsson Xperia neo V
Sony Ericsson Xperia Play
Sony Ericsson Xperia ray
Sony Ericsson W995
Sony Xperia A SO-04E
Sony Xperia acro S
Sony Xperia E
Sony Xperia E dual C1605
Sony Xperia Go (ST27i)
Sony Xperia i1 HSPA+ C6902
Sony Xperia i1 LTE
Sony Xperia J
Sony Xperia L
Sony Xperia M
Sony Xperia M35t (VoLTE)
Sony Xperia miro
Sony Xperia P
Sony Xperia S
Sony Xperia Sola
Sony Xperia SP
Sony Xperia T
Sony Xperia Tipo
Sony Xperia Tipo Dual
Sony Xperia U
Sony Xperia V
Sony Xperia Z
Sony Xperia ZL
Sony Xperia ZR
Sony Xperia Z1
Sony Xperia Z1S (T Mobile US only)
Sony Xperia Z1 Compact LTE-A D5503
Sony Xperia Z2 LTE-A D6543/D6503
TechFaith Wildfire 80
ZTE Blade V880
ZTE Crescent (San Francisco 2 on Orange)
ZTE Era
ZTE F160 Atlanta
ZTE Grand X
ZTE Grand X IN
ZTE Orbit
ZTE R252 / Orange Tara
ZTE Kis Pro / Orange Zali
ZTE Skate (Monte Carlo on Orange)
ZTE Smart Netphone 701
ZTE Tania
ZTE TMN smart A15
Проблемы распознавания
Человеческая речь такова, что в радиоэфире и на узкой полосе аудиоспектра плохо различаются звуки «С» и «Ф». Также страдают пары «Т» и «П», «М» и «Н». Отсюда мнемонический системы с именами: «Диктую, номер два-ноль-ноль три Ольги, как понял, приём?». Отсюда же растут вещи вроде назначения наиболее ответственным частям позывных с «р» — например, снайпер, который ни в коем случае не должен перепутать свой позывной, скорее всего, будет «тридцать третьим», потому что в эфире это очень хорошо различимо в условиях узкой полосы.
Также с HD-Voice растёт узнаваемость голоса. Это важно и для личного общения, и для набирающей популярность дополнительной аутентификации по голосу, к примеру, в банках.
Автор: geran_utran