Метрика EPSNR

Метрика EPSNR

Метрика EPSNR

EPSNR — расчетное пиковое отношение сигнала к шуму (от англ. Estimated Peak Signal-to-Noise Ratio). Метрика разработана специалистами Elecard и позволяет оценить уровень искажения видео во время последнего сжатия без использования исходного видео.

EPSNR измеряет относительный размер квантайзера к квантованному коэффициенту дискретного косинусного преобразования (ДКП), выраженному в децибелах, поэтому его можно сопоставить с PSNR. Допустим, коэффициент в закодированном потоке равен 5, а квантайзер — 20. Таким образом, деквантованный коэффициент будет равен 100, а исходный коэффициент до квантования был в диапазоне от 90 до 110. Если коэффициент после квантования равен нулю, то исходное значение лежит в диапазоне от -10 до +10 (для квантайзера, равного 20).

Если модифицировать все деквантованные коэффициенты, добавив к ним случайное число в диапазоне от -Q/2 до +Q/2, то это будет соответствовать реальной погрешности квантования. Конечно, для малых коэффициентов в нижней правой части преобразованного блока этот метод не работает, так как его распределение не равномерно, а ближе к гауссовскому распределению около нуля. Таким образом, для малых коэффициентов применяются особые модификации.

Коэффициенты, модифицированные вышеуказанным способом, используются для расчета пикселей, а затем между декодированным и измененным изображением вычисляется стандартный PSNR. Полученная в результате кривая EPSNR ведет себя аналогично реальному PSNR.

Очевидно, что этот метод работает лучше при более высоких коэффициентах и меньших квантайзерах, например для видео с большим количеством деталей и динамических сцен, закодированного на высоких битрейтах.

Ниже представлены несколько примеров метрик PSNR и EPSNR, рассчитанных для одного видео, закодированного с разной степенью сжатия.

epsnr1

epsnr2

epsnr3

epsnr4

Голубая кривая — PSNR, красная — EPSNR. Шкала в дБ. Видео в разрешении 1080p, имеет множество мелких деталей, очень сложное для кодирования.

На графиках видно, что модель хорошо работает для 10–40 Мбит/с, в то время как при 5 Мбит/с есть значительные проблемы с B-кадрами. А вот I- и P-кадры выглядят более или менее хорошо даже при 5 Мбит/с и PSNR 25–27 дБ. Так происходит из-за упомянутой проблемы малых коэффициентов. В тестовом видео при 5 Мбит/с почти все коэффициенты в B-кадрах равны нулю, поэтому сложно оценить реальное распределение их значений. Средний размер сжатых B-кадров при 5 Мбит/с равен 4 170 байт, в то время как размер P-кадров — 45 729 байт. Эта разница приводит к такой большой погрешности при расчете EPSNR для B-кадра по сравнению с P-кадром.

 

13 октября 2017

Вычислить EPSNR потока с помощью Elecard StreamEye