СИСТЕМЫ ВИДЕОЗАПИСИ: ОПТИМАЛЬНОЕ РЕШЕНИЕ ДЛЯ КАЖДОЙ ЗАДАЧИ ч2 Таблица 2. Требования к пропускной способности (видео со сжатием)
Видеоформат Ориентировочная пропускная способность, Мбит/с Поддерживаемое разрешение
Motion JPEG 5-16 QCIF, CIF, 4CIF
Н.261 0,03-1,92 QCIF, GIF
Н.263 0,03-4 QCIF, CIF, 4CIF, 16CIF
MPEG-4 0,1-100 QCIF, CIF, 4CIF, 16CIF
MPEG-1 0,4-2 QCIF, CIF
MPEG-2 0,3-100 QCIF, CIF, 4CIF, 16CIF
Wavelet 2-6 QCIF, CIF, 4CIF
JPEG-2000 1,5-5 QCIF, CIF, 4CIF, 16CIF
Всего выделяется три типа кадров:
• I - Intra frame. Ключевые кадры, которые сжимаются без изменений.
• Р - Predicted frame (предсказанный кадр). При кодировании этих кадров часть информации удаляется, так что их размер примерно в 2-3 раз меньше, чем у l-кадра. При воспроизведении Р-кадра используется информация от предыдущих I- или Р-кадров.
• В - Bidirectional frame (двунаправленный кадр). В этом случае потери информации при кодировании еще более значительны, так что размер этих кадров примерно в 3-5 раз меньше, чем у l-кадра. При воспроизведении В-кадра используется информация уже от двух (предыдущих и последующих) I- или Р- кадров. В-кадры предусмотрены только в MPEG и Н.263, а в Н.261 их нет.
При кодировании формируется группа кадров разных типов (GOP - group of pictures). Степень сжатия определяется, в частности, длиной группы. Наиболее типичная последовательность (для GOP = 8) может выглядеть следующим образом: IBBBPBBBIBBBPBBBL... Соответственно очередь воспроизведения по номерам кадров будет выглядеть так: 1 523467891310...
В MPEG-1 GOP обычно IBBPBBIBBPBBIE (длина 6);
в MPEG-2 GOP обычно IBBPBBPBBPBBPBBIBBPE (длина 15)
По окончании разбивки кадров на типы начинается процесс подготовки к кодированию. Технологии потоковой видеотрансляции идеально подходят для систем мониторинга в реальном времени, но абсолютно непригодны для видеодокументирования. Видеозаписи, полученные с помощью delta-кодирования (алгоритмы MPEG, Н.2бх), не позволяют точно восстановить каждый кадр видеоряда (не только I-frame, но и каждый В- и P-frame), поэтому эти видеозаписи непригодны для последующего анализа видеоизображений и проведения экспертно-криминалистических исследований.
Подробнее об алгоритмах сжатия
В основе ставших уже классическими стандартов сжатия JPEG и MPEG, так же как и в сравнительно новых методах сжатия на основе Wavelet-преобразования, лежит переход от пространственного представления изображения к спектральному.
В случае JPEG и MPEG для такого перехода используется дискретное косинус-преобразование (ДКП) на блоках 8x8 пикселей, в случае Wavelet, JPEG-2000 - система фильтров, примененных к изображению.
Обычно пиксели в блоке и сами блоки изображения каким-то образом связаны (коррелированны) между собой - например, однотонный фон, равномерный градиент освещения, повторяющийся узор и т.д. Алгоритм ДКП, используя коррелирующие эффекты, производит преобразование блоков в частотные Фурье-компоненты. При этом небольшая часть информации теряется из-за округления за счет выравнивания сильно выделяющихся участков, которые не подчиняются корреляции. После этой процедуры в действие вступает алгоритм квантования, использующий матрицу квантования, элементами которой являются нормирующие коэффициенты для частотных Фурье-компонентов. После квантования многие коэффициенты в блоке обнуляются (нулевой коэффициент представляет собой среднюю яркость исходного блока). Число ненулевых спектральных составляющих тем выше, чем больше мелких деталей содержалось в исходном блоке.
Чувствительность человеческого глаза к точности передачи высокочастотных спектральных составляющих невелика, что позволяет сократить число бит, используемых для их кодирования. Реализуется такое сокращение делением каждого частотного коэффициента на соответствующий ему элемент матрицы квантования. Эти матрицы для цветностных компонентов (Сb и Сг) содержат, как правило, большие коэффициенты для одних и тех же спектральных составляющих, чем для яркостной.
Особенности MPEG
В формат MPEG-2 были введены еще несколько новых, нигде ранее не используемых алгоритмов компрессии видеоданных. Так, один из этих алгоритмов позволяет выделить в потоке видеоданных слои с разным приоритетом. Наиболее приоритетный на данный момент слой (например, передний план) кодируется с большим разрешением, чем слои с меньшим приоритетом. Другой алгоритм дробит блоки матрицы квантования на два потока. Один поток данных, более высокоприоритетный, состоит из низкочастотных (наиболее критичных к качеству) компонентов, другой, соответственно менее приоритетный, из высокочастотных компонентов. В дальнейшем эти потоки обрабатываются по-разному. Эти расширения продекларированы в стандарте MPEG-2 Scslability Extentions, но на сегодняшний день ни один MPEG-2-кодер не создает потоки с этими возможностями.
В MPEG-2 динамические сцены смотрятся намного лучше, чем в MPEG-1 и Н.261/Н.263 (и в их разновидностях Н.261+/Н.263+). Это улучшение происходит за счет того, что в MPEG-2 выше точность вычисления векторов движения, улучшен алгоритм предсказания значений коэффициентов и др.
Стандарт MPEG-4 был существенно доработан по сравнению с MPEG-2 по нескольким направлениям: добавлены новые схемы разбиения исходной видеокартинки на исходные блоки для ДКП, расширена схема поиска векторов движения и усложнены алгоритмы компенсации движения. Этим было достигнуто существенное улучшение качества видеокартинки при потоковой видеотрансляции. Но практически никакого улучшения не произошло для режима покадровой записи. В MPEG-4 остались все недостатки ДКП и его непригодность для документальной покадровой видеозаписи.
JPEG-2000 и технология Wavelet
Другой принцип положен в основу технологии Wavelet и базирующейся на ней спецификации JPEG-2000. При Wavelet-преобразованиях переход в частотную область достигается применением набора фильтров. Исходное изображение (естественно, после преобразования RGB -YCrCb) фильтруется с применением низкочастотного и высокочастотного фильтров по строкам и столбцам с последующим прореживанием. При этом вместо изображения размером MxN пикселей после первого прохода синтезируется четыре изображения Subband размером (М/2)х(М/2) каждое. Наиболее информативным из них является [hh] - то, которое было получено с использованием низкочастотного фильтра как по строкам, так и по столбцам. Применение низкочастотного фильтра по строкам и высокочастотного - по столбцам [hg] или высокочастотного - по строкам и низкочастотного - по столбцам [gh] дает значительно более обедненную картинку, и совсем малоинформативным оказывается изображение [gg], полученное с использованием высокочастотного фильтра как по горизонтали, так и по вертикали. Subband [hg] и [gh] обычно квантуются и после применения статистического кодирования попадают непосредственно в выходной поток, [gg] чаще всего просто игнорируется, а вот [hh] повторно подвергается той же процедуре, что и исходное изображение. В случае формата 4CIF (Full) число итераций обычно составляет 4-6.
Ограничения, подобного блоку 8x8 в JPEG и MPEG, Wavelet-преобразование не накладывает, но характерные для него искажения (рябь, размывание мелких деталей) также довольно неприятны. Некоторые системы используют модификации Wavelet на основе так называемой дельта-компрессии (Delta), которая за счет передачи лишь изменений между отдельными кадрами видеоизображений позволяет обеспечить дополнительную степень компрессии до 5:1 и выше (при различиях между смежными кадрами - до 20% и меньше). Однако Delta-Wavelet, как и все другие схемы delta-компрессии, непригодна для документальной видеозаписи и проведения экcпертизы, поэтому delta-схемы являются скорее ухудшением достоинств Wavelet.
Самым передовым стандартом и наиболее перспективным для целей документальной видеозаписи сегодня является JPEG-2000.
Сравнение методов компрессии
У всех методов компрессии есть свои достоинства и недостатки.
MPEG-подобные, оптимизированные по скорости алгоритмы компрессии Н.261 и Н.263 (с модификациями Н.261+, Н.263+) разрабатывались в расчете на видеоконференции и видеотелефонию по сетям ISDN, то есть на приложения с практическим отсутствием динамических сцен. По мнению большинства экспертов, формируемые ими изображения (при высокой динамике) имеют блочную структуру, являются нечеткими и 'дергаными'. По степени компрессии они занимают промежуточное положение между Wavelet и MPEG и встречаются в цифровых системах видеозаписи довольно редко.
MPEG-1 обеспечивает качество, приблизительно эквивалентное VHS, и может использоваться в случае, если пропускная способность канала ограничена 2 Мбит/с. В то же время качество передачи динамичных сцен, характерных для системы видеонадзора за движением транспорта, довольно невысокое.
MPEG-2 разрабатывался в расчете на пропускную способность канала передачи 0,3-100 Мбит/с с ориентацией на телевидение высокой четкости (HDTV). При коэффициентах сжатия до 30:1 он обеспечивает качество, приблизительно эквивалентное DVD, с хорошим воспроизведением динамичных сцен. В то же время при больших коэффициентах сжатия (до 200:1) начинают проявляться эффекты мозаики, искажения (типа ступеньки и т.д.). Гибкость алгоритма позволяет использовать его в различных сферах: от съемки и монтажа видеопродукции до последующего ее цифрового распространения (DVD) и передачи (DVB -Digital Video Broadcasting). Очевидное различие этих задач приводит к разнообразию возможных схем кодирования. Сильная сторона MPEG-2 - жестко определенная международным стандартом процедура декодирования. Это означает, что, несмотря на возможные различия использованных схем компрессии, любой MPEG-2-поток будет успешно воспроизведен стандартным MPEG-2-декодером. Таким образом, гарантируется совместимость оборудования различных поставщиков.
MPEG-4 является стандартом, ориентированным на клиент-серверные системы доставки интерактивного мультимедиа по сети. Аудиовизуальные сцены в нем рассматриваются как объекты, которые мультиплексируются в единый поток наряду с дополнительным описанием сцен. Это дает возможность конечному пользователю при воспроизведении самому управлять процессом презентации. В некоторых отношениях (в частности, по качеству видео) он является шагом назад по сравнению с MPEG-2, однако при том же bitrate, что и Н.261, он обеспечивает существенно (на 30-40%) более высокое качество. Для разрешения 4CIF (Full) средний информационный поток составляет около 1 Мбит/с (лучше, чем у MPEG-2 и Wavelet).
Общий недостаток методов компрессии семейства MPEG заключается в том, что они практически перестают работать при мультиплексировании видеосигналов, когда могут возникать задержки между отдельными видеокадрами до 100-200 мс и более, а при интервале между кадрами более 475 мс появляется противоречие со стандартом MPEG-2 System, которое может привести к невозможности воспроизведения записей некоторыми декодерами. Второй существенный недостаток методов компрессии семейства MPEG - синтетичность 'неопорных' видеокадров, что делает их абсолютно непригодными для систем, где требуется последующий криминалистический анализ видеорядов.
Просмотрено :
67629 раз Материал предоставлен :
Руководитель интернет-проектов, Иванов П.А.
Компания: ООО "Актив-СБ"
Тел. Для связи: (495)783-26-56
Факс (495)783-26-56
сайта : http://www.aktivsb.ru
e-mail для связи
[email protected] Сайт :
Голосовать: |
Читательский рейтинг :(0 голосов) |
|