На Хабре было немало статей про использование различных методов обработки изображений, включая классификацию данных, фильтрацию. Многие из этих подходов применяются и в дистанционном зондировании при обработке цифровых изображений Земли.
От момента, как снимок получен со спутника, до возможности его анализировать должен пройти целый цикл процедур по приведению его в вид, удобный для получения и последующего анализа визуальной информации.
Тех, кому интересен сам процесс, прошу под кат (трафик):
Перед тем, как перейти к самой сути мне бы хотелось сразу ввести ряд элементарных понятий, которые, наверняка, многим уже знакомы, но, все же, не будем отступать от конкретики. Те же, кто уверен в своей компетентности по данному вопросу, пусть сразу переходят к самому интересному.
Само цифровое изображение и процесс его получения
Как все знают, цифровое изображение – это матрица пикселей, значение каждого из которой получается в результате усреднения по четырем составляющим: координатам пространства (x и y), длине волны и времени.
Сам процесс составления матрицы идет таким образом: солнечное излучение отражается от объектов съемки, энергия, попадающая на поверхность датчика, фиксируется им, затем интегрируется, из чего задается интегральное значение пикселя. Целочисленное же значение получается после преобразования интегрального значения в электрический сигнал. Каждый пиксель хранит информацию в двоичном виде. Чем больше бит (памяти ) выделяется на пиксель, тем больше число значений, соответствующих одному пикселю, тем точнее аппроксимируется исходный дискретный сигнал, тем больше информации снимок может хранить.
В ПЗС – сканерах уже упомянутые детекторы сканируют Землю и разделяют непрерывный поток данных на пиксели.
От вида сканера зависит очень многое, им определяется способ получения изображений. Так, существуют три основных вида сканеров:
- Линейный сканер (пример — AVHRR) – самый простой, он оснащен только одним детекторным элементом.
- Поперечный ПЗС-сканер (GOES, MODIS, TM) – использует для сканирования линейку детекторов, расположенных вдоль маршрута съемки. Параллельное сканирование Земли осуществляется при каждом цикле движения зеркала.
- Продольные сканеры (IKONOS, QuickBird, SPOT) имеют тысячи детекторов в ПЗС-линейке, следовательно, параллельное сканирование осуществляется просто за счет движения платформы по орбите.
Цифровые снимки отображаются либо с использованием 8-битной шкалы оттенков серого, либо 24-битной, которая основана на смешении различных оттенков R, G, B. Исходный диапазон значений пикселей превращается в ограниченный диапазон путем комбинирования цветовых значений, соответствующих любым трем каналам многоспектрального цифрового снимка. Один пиксель отображается 2563 векторами RGB, один вектор – один цвет.
Как в оптических датчиках формируются спектральные каналы:
Пучок света, поступивший на датчики, делится на несколько лучей. Каждый луч, проходя свой оптический путь, идет через спектральный фильтр. Для разделения спектральных диапазонов могут быть использованы призмы и дифракционные решетки.
Предварительные процедуры обработки снимка
В цикл предварительных процедур по обработке снимка входят следующие:
- Радиометрическая коррекция – устраняет варьирование значений яркости пикселей, которое происходит в результате неправильной работы детекторов, влияния рельефа и атмосферы.
- Атмосферная коррекция – коррекция за влияние атмосферы, которая определяет расположение диапазонов съемки за счет окон прозрачности.
- Геометрическая коррекция включает исправление таких искажений снимка, как полосчатость, выпадение строк, также геокодирование – привязывание снимка таким образом, что каждой точке изображения задается координата соответствующей точки на местности. Математически геопривязка обычно осуществляется с помощью степенных полиномов. Точность привязки увеличивается при наличии опорных точек, тогда снимок как бы «сажается» по ним. После геокодирования определяют яркостные характеристики уже трансформированного изображения различными методами: ближайшего соседа, билинейной интерполяции, бикубической свертки.
- Ортотрансформирование – при нем устраняются ошибки изображения за счет перепадов высот рельефа местности, в результате в полученном изображении устранены многие огрехи центрального проектирования.
Далее следует процесс улучшения качества изображения, включающий:
- Спектральные преобразования, которые строятся на работе со спектральной диаграммой – графиком, показывающим зависимость между количеством пикселей изображения и значениями спектральной яркости. При спектральных преобразованиях изменяется такой параметр как контрастность. Для его повышения существует ряд методов, к примеру:
- линейное растягивание гистограммы, заключающееся в том, что всем значениям яркости присваиваются новые значения с целью охватить весь возможный диапазон от 0 до 255:
- Нормализация гистограммы – на весь диапазон значений яркости растягивается только наиболее интенсивный (наиболее информативный) участок диаграммы:
- Линеаризация гистограммы – каждому пикселю присваивается новое значение яркости, причем таким образом, чтобы у каждого яркостного уровня было примерно одинаковое количество пикселей:
- линейное растягивание гистограммы, заключающееся в том, что всем значениям яркости присваиваются новые значения с целью охватить весь возможный диапазон от 0 до 255:
- Фильтрация – усиливает воспроизведение объектов, устраняет шумы, подчеркивает структурные линии, сглаживает изображение и делает многое другое – в зависимости от поставленной задачи. Весь процесс фильтрации строится на понятии скользящего окна – квадратной матрицы весовых коэффициентов (обычно это матрица 3*3 или 5*5). Каждое значение яркости пикселя пересчитывается следующим образом: если пиксель стоит в центре окна, перемещающегося от пикселя к пикселю изображения, то ему присваивается новое значение, вычисленное по функциональной зависимости из значений окружающих его пикселей. Так окно «проскальзывает» по всем пикселям изображения, меняя их значение. В зависимости от подобранных весовых коэффициентов меняются свойства полученного изображения. Более подробно фильтрацию описал читатель UnickSoft в своем посте.
- Преобразование Фурье улучшает качество изображения путем его разложения на множество пространственно-частотных компонент. Распределение яркостных характеристик в пространстве представляется в виде линейной комбинации периодических функций sin и cos с заданными характеристиками в частотной области. К примеру, чтобы удалить шумы, достаточно выявить периодичность их появления.
Завершающий этап работы со снимками – дешифрирование
Дешифрирование – это процесс обнаружения и распознавания объектов и явлений местности на снимке. Оно может быть как ручным, то есть базирующимся на визуальной (человеческой) оценке изображения, так и машинным (автоматическим). Последнее, что-то мне подсказывает, представляет для многих читательов больший интерес. Машинная обработка, по сути своей, сводится к различным механизмам классификации. Для начала нужно представить все пиксели (их спектральные яркости) как вектора в пространстве спектральных признаков. При анализе количественных связей спектральных яркостей разных объектов происходит разделение пикселей по классам. Классификация снимков делится на классификацию с обучением и классификацию без обучения.
Классификация с обучением
Классификация с обучением предполагает наличие эталона, с яркостью которого сравнивается яркость каждого пикселя. В результате, имея несколько эталонов, заранее заданных, мы получаем множество объектов, разделенных на классы. Эта классификация работает только в случае, если известны заранее те объекты, которые отображены на снимке, классы четко различимы и их количество невелико.
Вот только немногие из методов, которые могут использоваться в классификации с обучением:
- Метод минимального расстояния – значения яркости пикселей рассматриваются как вектора в пространстве спектральных признаков. Между этими значениями и значениями векторов эталонных участков высчитывается спектральное расстояние, как корень из суммы квадратов разности векторов пикселя и эталона (проще говоря, эвклидово расстояние между ними). Все пиксели распределяются по классам в зависимости от того, превосходит ли расстояние между ними и эталоном заданное или нет. Так, если расстояние меньше, то класс определен, пиксель можно отнести к эталону:
- Метод дистанции Махаланобиса – очень похож на первый способ, только при классификации измеряется не эвклидово расстояние между векторами, а расстояние Махаланобиса, которое учитывает дисперсию значений яркости эталона. В этом способе, если эвклидово расстояние до двух эталонов от данного пикселя равно, то победу одержит тот класс, дисперсия эталонной выборки которого больше:
- Метод спектрального угла – изначально задается максимальное значение спектрального угла (угла между вектором-эталоном и вектором данного пикселя). Находится спектральный угол, и, как с эвклидовым расстоянием, если угол меньше заданного, то пиксель попадает в класс эталона, с которым идет сравнение:
Классификация без обучения
Классификация без обучения построена на полностью автоматическом распределении пикселей по классам на основе статистики распределения яркостных значений пикселей. Данный вид классификации используется, если изначально неизвестно, сколько объектов присутствует на снимке, количество объектов велико, в результате машина сама выдает полученные классы, а мы уже определяем, каким объектам их поставить в соответствие.
- Метод ISODATA (Iterative Self-Organizing Data Analysis Technique Algorithm) основан на кластерном анализе с использованием метода последовательных приближений. После рассмотрения яркостей пикселей, как векторов в пространстве спектральных признаков, ближайшие определяются в один класс. Для каждой спектральной зоны идет расчет статистических параметров распределения яркостей. Все пиксели делятся на некоторое n число равных диапазонов, внутри каждого из которых находится среднее значение. Для каждого пикселя диапазона рассчитывается спектральное расстояние до среднего значения. Все пиксели, расстояние между которыми наименьшее определяются в один кластер. Так проходит первая итерация. При второй итерации и последующих идет расчет уже реальных средних значений для каждого кластера. Каждая новая итерация уточняет границы будущих классов:
- Метод K-средних – похож на предыдущий метод, за тем лишь исключением, что начальные средние значения задаются (это возможно только, если объекты на снимке хорошо читаемы).
Все процессы предварительной обработки и улучшения качества снимков, также дешифрирования представляют собой огромное поле для рассуждений, каждый из них может служить поводом целой статьи (и не одной). Если кого заинтересует конкретная тема, прошу оставлять свои пожелания в комментариях для последующего развития сюжета. Далее планируется пост про использование различных индексов, таких как вегетационный NDVI, для улучшения дешифрирования и идентификации объектов.
В статье была использована информация с сайта, также из следующих источников: 1 и 2.
P.S. Есть возможность бесплатно скачать цифровые данные на сайте геологической службы США
Для собственных экспериментов в обработке снимков есть бесплатный демо-софт (правда, с некоторыми ограниченными функциями, по сравнению с полной версией, но для разминки достаточно) и еще один софт.
Автор: oljakli