Критерии и методы укрупнённой оценки качества изображений в растровых графических форматах

Алгоритмы улучшения качества изображений, хранящихся в растровых графических форматах, получают всё большее распространение. На сегодняшний день их существует огромное количество и беспрерывно появляются новые. Это связано с появлением новых способов и технических средств получения, передачи и воспроизводства растровых изображений. Алгоритмы обработки изображений, в основном, ориентированы на ликвидацию недоработок в технических средствах и технологиях, работающих с изображениями. Эти недоработки можно идентифицировать не только визуально, но и пользуясь описанием технических характеристик техники и технологий.

Перед тем, как улучшать изображение, необходимо дать оценку его качеству. Человек, бросив один взгляд на изображение, может сказать яркое оно или тёмное, контрастное или нет, чёткое или размытое и т.д. Алгоритмы же работают детально, анализируя изображение попиксельно или небольшими группами пикселей. Поэтому, на основании работы алгоритма, тяжело дать общую оценку качеству изображения.

К показателям, по которым можно оценить изображение как единое целое, относятся следующие:

  • яркость;
  • контрастность;
  • преобладающий тон;
  • резкость.

Прежде чем приступить к выработке критериев и методов оценки качества, необходимо выбрать цветовую модель. Наиболее удобной представляется модель RGB по нескольким причинам:

  • эта модель достаточна проста как для понимания, так и для математического описания;
  • она применяется во многих технических устройствах и, при необходимости, преобразуется в другие цветовые модели;
  • она близка к представлениям о природе чувствительности к цвету человеческого глаза.

Требования к критериям оценки качества изображений следующие:

  • показатели качества для сравнения с критериями должны вычисляться;
  • значения критериев должны иметь относительный характер (не зависеть от диапазона яркости RGB);
  • критерии должны быть понятны и наглядны для человека.

Достаточно наглядно оценка качества изображения может быть представлена с помощью RGB-гистограмм.

Гистограмма тёмного неконтрастного изображения
Рис. 1. Гистограмма тёмного неконтрастного изображения

Гистограмма светлого изображения
Рис. 2. Гистограмма светлого изображения

Гистограмма сбалансированного полутонового изображения
Рис. 3. Гистограмма сбалансированного полутонового изображения

Гистограмма высококонтрастного изображения
Рис. 4. Гистограмма высококонтрастного изображения

Гистограмма постеризованного изображения
Рис. 5. Гистограмма постеризованного изображения

Недостатком этого способа является отсутствие численного выражения для показателей качества.

Цветовую модель RGB удобно представить в виде куба в прямоугольной системе координат, где в начале координат расположена точка чёрного цвета (яркость R = G = B = 0), а вдоль осей возрастают значения яркости R, G и B. На главной диагонали куба, выходящей из начала координат, расположены ахроматические цвета.

Цветовая модель RGB
Рис. 6. Цветовая модель RGB

В вершинах куба расположены основные цвета (красный, зелёный, синий), дополнительные к ним (жёлтый, циан и пурпурный), а также чёрный и белый. На гранях куба находятся так называемые «чистые» тона.

RGB — куб и его невидимые грани
Рис. 7. RGB — куб и его невидимые грани

Отсутствие у цвета третей составляющей — признак «чистого» тона. Появление и увеличение доли третьей составляющей в цвете приводит к снижению насыщенности тона, т.е. к приближению данного цвета к ахроматическим цветам.

Оценка яркости изображения

Яркость изображения можно выразить как среднюю яркость всех пикселей (математическое ожидание в терминах теории вероятностей).

Яркость пикселя вычисляется по формуле:

Y_p~=~R_p~+~G_p~+~B_p

Яркость всего изображения Y, содержащего N пикселей будет равна:

Y_p~=~{1/N}~sum{p=1}{N}{R_p~+~G_p~+~B_p}

Данное выражение характеризует физическую яркость изображения. Поскольку чувствительность человеческого газа к разным частям спектра неодинакова (максимальная в жёлто-зелёной, меньше в красной, ещё меньше в синей), яркость цветного пикселя будет восприниматься субъективно в зависимости от его тональных характеристик.

Чувствительность человеческого глаза к различным частям спектра
Рис. 8. Чувствительность человеческого глаза к различным частям спектра

В соответствии с рекомендациями стандарта Федеральной комиссии связи (FCC), яркость изображения (видимая) вычисляется по формуле:

Y_p~=~{1/N}~sum{p=1}{N}{0.299R_p~+~0.587G_p~+~0.114B_p}

Оценка как физической (Y), так и видимой (Y_s) яркости изображения представлена в абсолютных величинах. Перейти к относительным величинам можно разделив значение яркости на максимально возможное значение яркости:

Y_rel~=~Y/{Y_max}

Тогда Y_rel будет лежать в диапазоне [0,1]. Значение 0 будет соответствовать абсолютно чёрному изображению, а значение 1 – абсолютно белому. Изображение оптимальной яркости должно иметь значение Y_rel близкое к 0.5.

Оценка контрастности изображения

Контрастность изображения бывает яркостная и тоновая.

Яркостная контрастность представляет собой разницу между физической или видимой яркостью отдельных участков изображения. Вообще говоря, вычисление физической или видимой яркости можно рассматривать как конвертацию цветного изображения в ахроматические цвета. Поэтому яркостная контрастность — это сравнение двух участков изображения, приведенных к ахроматическим цветам.

Если проанализировать RGB-гистограммы, то можно сделать вывод, что у контрастного изображения количество тёмных и светлых пикселей должно быть приблизительно одинаковым, разница в их яркости — значительна, а основное место сосредоточения пикселей — возле границ диапазона.

Хорошим критерием оценки яркостной контрастности будет дисперсия яркости пикселей изображения:

sigma^2~=~{1/N}~sum{p=1}{N}{(Y_p~-~Y)^2}

Более универсальный безразмерный критерий оценки яркостной контрастности — отношение средне-квадратического отклонения к максимально возможному значению яркости:

C~=~{2 sigma}/Y_max

C изменяется в диапазоне [0,1]. Значение 0 соответствует однотонному изображению, значение 1 — максимально контрастному. Оптимальное значение контрастности зависит от типа объекта, представленного на изображении.

Более сложный случай представляет тоновая контрастность. Конвертированные в оттенки серого цвета могут иметь одинаковую яркость, но визуально чётко различаться.

Можно вычислить «средний тон» пикселя для всего изображения. Его удобно выразить через средние значения RGB:

R~=~{1/N} sum{p=1}{N}{R_p}
G~=~{1/N} sum{p=1}{N}{G_p}
B~=~{1/N} sum{p=1}{N}{B_p}

Расстояние в RGB кубе между пикселями изображения и «средним тоном» определяется по формуле:

d_p~=~sqrt{(R_p~-~R)^2~+~(G_p~-~G)^2~+~(B_p~-~B)^2}

В качестве оценки тоновой контрастности изображения можно взять среднее расстояние в RGB кубе между пикселями и «средним тоном»:

d~=~{1/N}sum{p=1}{N}{d_p}

В RGB-кубе максимальное расстояние между двумя точками равно длине главой диагонали:

d_max~=~sqrt{3} R_max~=~ sqrt{3} G_max~=~sqrt{3}B_max

Хорошую тоновую контрастность будут иметь пиксели, расположенные на расстоянии R_max, G_max или B_max (длины ребра RGB-куба):

d~>=~R_max=~R_max"/>

Оценка преобладающего тона

Преобладающим тоном можно считать «средний тон». Это утверждение имеет физический смысл: изображение будет представляться такого цвета, если его угловой размер будет равен разрешающей способности глаза.

Оценка тоновой насыщенности

Тоновая насыщенность — это отличие цвета от ахроматического при их одинаковой яркости. В RGB-кубе тоновую насыщенность пикселя можно выразить как расстояние до диагонали ахроматических цветов:

h_p~=~sqrt{{R_p}^2~+~{G_p}^2~+~{B_p}^2~-~{(R_p~+~G_p~+~B_p)^2}/3}

Для всего изображения оценка тоновой насыщенности может быть выражена как среднее значение тоновой насыщенности для всех пикселей:

h~=~{1/N}sum{p=1}{N}{h_p}

Оценка резкости изображения

Понятие резкость, как характеристику аппаратных средств и технологий, можно разделить на три составляющие:

  • резкость, как характеристика фокусировки объектива на объект;
  • резкость как характеристика оборудования, позволяющая воспроизводить без искажений яркостный переход максимального контраста;
  • резкость как результат специальной обработки исходного изображения.

Идеальное оборудование должно обеспечить вывод информации о смене цвета в элементе изображения таким образом, чтобы никакого промежутка между цветами не было.

С физической точки зрения нерезкий переход можно рассматривать как диффузное смешение двух контрастных цветов.

С точки зрения человеческого восприятия резкость — это наличие контура контрастного перехода (яркостного или тонового) между двумя соседними частями изображения.

Для оценки резкости изображения в ахроматических цветах удобно использовать яркость пикселей. Такое изображение может быть представлено прямоугольной матрицей (размерностью соответствующей размерам изображения в пикселях), элементами которой являются значения яркости пикселя.

Контрастный (сверху) и неконтрастный (снизу) переходы между цветами
Рис. 9. Контрастный (сверху) и неконтрастный (снизу) переходы между цветами

Поскольку в настоящее время в большинстве случаев используется квадратный пиксель, можно составить другую матрицу (матрицу яркостных контрастов), элементами которой будут разности яркости последующего и предыдущего пикселей по горизонтали или по вертикали Delta Y_ij (Y_p_{x+1}~-~Y_p_x или Y_p_{y+1}~-~Y_p_y). Можно учитывать и диагональные разности.

Значения элементов матрицы характеризуются следующим образом:

  • Delta Y_ij~<~0, если яркость следующего пикселя меньше яркости предыдущего;
  • Delta Y_ij~>~0~0"/>, если яркость следующего пикселя больше яркости предыдущего;
  • Delta Y_ij~=~0, если яркость следующего пикселя равна яркости предыдущего;
  • Delta Y_ij~approx~0, если изменение яркости незначительно;
  • delim{|}{Delta Y_ij}{|}~> >~0 >~0"/>,если имеется резкий контрастный переход.

Далее осуществляется сканирование строк для разностей по горизонтали (столбцов для разностей по вертикали) матрицы яркостных контрастов. Строка (столбец) разбивается на участки, в которые входят элементы, имеющие одинаковый знак (переходые участки) или участки со значениями элементов равными 0.

Для каждого переходного участка оценивается:

  • длина m (количество элементов матрицы контрастов);
  • крутизна участка k, то есть, соотношение суммарного изменение яркости на участке к длине участка:
k~=~{1/m}sum{i,j=1}{m}{delim{|}{Delta Y_ij}{|}}

Для проведения анализа матрицы яркостных контрастов необходимо определить критерии и их значения: какое значение элемента матрицы считать контрастным переходом, а какое — нет.

Порог «минимальной заметной разницы» контрастной чувствительности (JND) или дифференциальный порог определяют согласно закона Вебера-Фехнера, который формулируется следующим образом: субъективная величина ощущения, измеренная в единицах минимальной заметной разницы, пропорциональна логарифму физической величины стимула:

p~=~{k*log{X/X_0}}

где:

  • p — субъективная величина ощущения;
  • k — коэффициент пропорциональности;
  • X — значение интенсивности стимула;
  • X_0 — граничное значение интенсивности стимула;

Закон утверждает: ощущение разницы между близкими по величине стимулами пропорциональна величине стимулов, т.е.:

{Delta X}/X~=~const

где:

  • Delta X — изменение интенсивности стимула.

Это отношение называется пороговым контрастом, а Delta X — дифференциальным порогом. В средине дифференциального порога изменения интенсивности стимула не ощутимы.

Отношение Вебера-Фехнера (пороговый контраст) составляет 1-3%.

Таким образом, для каждого переходного участка матрицы яркостных контрастов в идеальном случае m~=~1 или k~=~delim{|}{Delta Y_ij}{|}, {delim{|}{Delta Y_ij}{|}}/{Y_p}~>~0.03~0.03"/> (здесь и далее k — крутизна участка).

Поскольку критерии оценки резкости связаны с локальными участками изображения, общая оценка резкости по этим критериям будет сильно зависеть от типа объекта на изображении (документ, пейзаж и т.д.). И всё же в качестве оценки резкости всего изображения можно предложить средние значения длины и крутизны для всех n переходных участков.

m_mid~=~{1/n}sum{i=1}{n}{m_i}
k_mid~=~{1/n}sum{i=1}{n}{k_i}

Для оценки резкости цветных изображений вместо разности яркости соседних пикселей можно использовать расстояние в RGB-кубе между цветами этих пикселей:

Delta d_ij~=~sqrt{(R_{i+1}~-~R_i)^2+~(G_{i+1}~-~G_i)^2+~(B_{i+1}~-~B_i)^2}

При сканировании матрицы тоновых контрастов, подобно сканированию матрицы яркостных контрастов, необходимо контролировать тенденцию изменения тона: отрезки, соединяющие пиксели в RGB-кубе должны лежать на одной прямой. Реально они могут иметь некоторое незначительное отклонение ε. Осуществить такой контроль можно сравнивая сумму длин расстояний между цветами в RGB-кубе с расстоянием между крайними точками этой ломаной линии:

sum{i=1}{m}{Delta d_ij~-~sqrt{({R_1~-~R_m})^2+~({G_1~-~G_m})^2+~{B_1~-~B_m)^2}}~<=~varepsilon

Прекращение выполнения данного условия можно считать границей участка.

Далее оценка резкости цветного изображения проводится подобно оценке резкости ахроматического изображения. Крутизна участка будет вычисляться через расстояния между цветами пикселей в RGB-кубе:

k~=~{1/m}sum{i,j=1}{m}{delta_ij}

m_mid и k_mid для всего цветного изображения вычисляются также, как и для ахроматического изображения.

Несмотря на грубость и приблизительность предложенных критериев и методов оценки, их можно успешно использовать для предварительного отбора изображений из больших массивов в автоматическом режиме; для предварительной оценки качества изображений с целью выбора более детальных методов оценки и т.п.

Литература:

  • David H. Hubel. Eye, blain and vision. – Scientific American library a division of help. – New York.
  • А.Гонта, Е.Седов Резкость изображения и оборудование CCTV. Источник: security-bridge.com
  • В.Т.Фисенко, Т.Ю.Фисенко, Компьютерная обработка и распознавание изображений: учеб. пособие. – СПб: СПбГУ ИТМО, 2008. – 192 с.

Автор: fantom (Сергей)
Свои комментарии по содержанию статьи отправляйте непосредственно автору материала на почту: withe@meta.ua или fantom-withe@yandex.ru.

Это интересно

Смотрите также