Нижеизложенный материал, вероятно, знаком, или даже хорошо известен, программистам, имевшим опыт работы с OpenGL, между тем, я счел уместным напомнить о модели oblique frustum, отчасти наблюдая (и разделяя) интерес читателей Хабра к вопросам OpenGL и в целом трёхмерного моделирования, отчасти из несогласия с позицией некоторых разработчиков вроде «…чтобы это использовать, вовсе не обязательно разбираться в том, как работает матрица проекции», отчасти из уважения и благодарности к Эрику Ленгелу|Eric Lengyel, изобретательная мысль которого обогатила приемы работы в среде OpenGL.
Если в моделируемых вами сценах присутствуют зеркальные отражения, и вы подзабыли или не слышали про «oblique frustum», то возможно, что эта статья не будет для вас бесполезной.
Несмотря на то, что я, вслед за Эриком Ленгелом, более придерживался при изложении материала представлений OpenGL, все последующие рассуждения легко распространяются на любые другие системы трёхмерного моделирования.
Отражения в 3D–сценах
В случае, когда в 3D-сценах присутствуют отражающие поверхности, обычная практика получения отражения заключается в рендеринге сцены с использованием вспомогательной камеры вида, которая сама является отражением основной камеры вида плоскостью отражающей поверхности.
Рис. 1. Верхняя камера является основной камерой, через которую происходит рендеринг сцены, содержащей отражающую поверхность. Нижняя камера является вспомогательной камерой, предназначенной для рендеринга отражения. Ось X направлена к наблюдателю для обеих пирамид видимости (в принятых для OpenGL представлениях), и очевидно, что координатная система для камеры, осуществляющей рендеринг отражения, является левосторонней.
При рендеринге отражения вспомогательной камерой (камерой отражения), может оказаться, что часть объектов, расположенных между наблюдателем и отражающей поверхностью, оказывается в результирующем рендере, образуя нежелательные артефакты в изображении. Чтобы отсечь нежелательную часть отраженной сцены с финального рендера, программист ограничивает наблюдаемую из камеры отражения часть объема трёхмерной сцены воображаемой поверхностью, используя различные приемы для того, чтобы прервать визуализацию сцены за границей этой поверхности.
Можно воспользоваться инструкцией „discard” для фрагментного шейдера или ей подобными, специфическими для отдельных реализаций рендеринга в общей идеологии 3D–моделирования ( например „kill” в AGALMiniAssembler), однако, если нам желательно решение универсальное, одинаково хорошо работающее на любом процессоре, то стоит обратить внимание на технику, предложеную Эриком Ленгелом.
Идея Эрика Ленгела заключалась в том, чтобы модифицировать проекционную матрицу таким способом, чтобы ближний план пирамиды видимости стал как раз своего рода секущей плоскостью, отделяющей нежелательный в конечном рендере объем основной сцены.
Для дальнейшего уместно напомнить элементарные представления аналитической геометрии.
Плоскость в пространстве
Для удобства изложения, будем придерживаться следующих обозначений:
Плоскость
Для любой пространственной 3D-точки и вектора , совокупность 3D-точек , отличных от , удовлетворяющих уравнению определяет плоскость, при этом точка является одной из принадлежащих этой плоскости точек, а вектор является её вектором нормали.
Рис. 2. Плоскость полностью определяется принадлежащей ей точкой и нормаль-вектором .
Уравнение плоскости часто записывается следующим выражением:
где и есть компоненты нормального вектора , причем . Значение равно расстоянию до плоскости от начала координат (помним, что компоненты нормального вектора, деленные на его длину, есть направляющие косинусы единичного вектора нормали плоскости).
В случае нормализованного вектора нормали, выражение
может быть использовано, для нахождения расстояния от плоскости до произвольной точки . Если , лежит в плоскости. В случае, если , точка находится с положительной стороны плоскости, т.е. со стороны нормального вектора плоскости, при , точка располагается в стороне от плоскости, в направлении противоположном направлению нормального вектора плоскости .
Удобно записать плоскость четырехмерным вектором. Коротко уравнение плоскости запишется так: . Очевидно, что для произвольной точки , имеющей в однородных 4-хмерных координатах -координату равную 1, Выражение (2) может быть переписано как , где и точка лежит в плоскости, если .
Преобразование плоскости
Для понимания особенности пространственного преобразования плоскости, потребуется некоторое внимание уделить преобразованию нормального вектора. При пространственном преобразовании полигональной модели, вектора касательные к поверхности полигонов и вектора нормальные ведут себя неодинаково. Вектор касательный часто можно представить как разницу между двумя преобразованными вершинами, т.е. между двумя естественным образом преобразованными точками, и, вследствие этого, характер преобразованного вектора совпадает с нашими ожиданиями. Но, в общем случае пространственного преобразования, матрица которого не является ортогональной, прямое применение матрицы преобразования к нормальному вектору приведет к тому, что этот вектор перестанет быть нормальным – перпендикулярным к поверхности полигона.
Поскольку вектор касательный и вектор нормальный , принадлежащие одному полигону, должны оставаться перпендикулярными, для скалярного произведения преобразованных векторов и должно выполняться то же условие что и для исходных векторов: . Совершим несколько простых алгебраических операций, чтобы прояснить природу нормального вектора:
если – 3х3-матрица трансформации пространства (для случая касательного и нормального векторов пространственные перемещения несущественны), и , то зададимся целью найти матрицу преобразования для , такую, чтобы выполнялось
вспомним, что умножение векторов можно записать и следующим образом (совершенно равнозначным):
Поскольку , выражение выполняется, если , где – единичная матрица. Из чего следует, что . Вектор, трансформация которого происходит подобным образом (посредством транспонированной обратной матрицы преобразования), является вектором ковариантным, тогда как вектор, трансформирующийся подобно вектору касательному, является вектором контравариантным.
Однако, плоскость в однородных координатах, в отличие от нормального вектора, имеет ненулевую -координату, и следует дополнительно исследовать её поведение при 4х4-преобразованиях.
Расстояние до плоскости от начала координат, после применения пространственного преобразования, с учетом особенностей преобразования нормального вектора, для лежащей в этой плоскости точки , через знакомое скалярное произведение:
Мы воспользовались в данных вычислениях матрицей преобразования , дополненной к операциям поворота, масштабирования и скоса операцией сдвига:
Матрица обратного преобразования к матрице ищется обычным алгоритмом обращения матриц:
Транспонируем обратную матрицу:
Можем видеть, что из Выражения (5) есть результат умножения четвёртой строки транспонированной обратной матрицы преобразования на четырёхмерный вектор в однородной координатной записи , т.е. для плоскости , её образ при пространственной трансформации, описываемой 4х4 матрицей превращения , выражается:
Для дальнейшего существенно, что плоскость подчиняется ковариантному характеру пространственного преобразования.
Перспективная проекция
Перспективное проецирование применяется, чтобы создать у наблюдателя ощущение глубины на проекционном плане, матрица перспективного преобразования должна отобразить пространство пирамиды видимости в нормализованное пространство куба видимости. Пирамида видимости обычно может быть выражена через термины top, bottom, left, right, far, near или fovy, aspect, near, far, некоторые реализации OpenGL имеют среди своих инструментов средства работы как для правосторонней так и для левой координатных систем. Отличия и порядок умножения матрицы на вектор в каждой из систем, должны быть ясны любому программисту.
Рис. 3. Усеченная пирамида видимости (frustum) в системах компьютерной графики отсекает зону видимости, для целей последующего рендеринга, с боков и вдоль осей проецирования. Пирамида видимости, в пространстве камеры вида, располагается в правосторонней системе координат так, что вершина пирамиды лежит в центре координатной системы, а направление вида из камеры противоположно оси , ближний план находится на удалении вдоль отрицательного направления оси , дальний план – на удалении вдоль отрицательного направления оси .
В общем случае, пирамида видимости не обязана иметь форму правильной усеченной пирамиды, она может быть и асимметричной, поэтому модель с top, bottom, left, right, far, near является более подходящей для иллюстраций особенностей oblique frustum («скошенной пирамиды видимости»). «Сжатое пространство» куба видимости, замкнутое в объёме, ограниченном плоскостями , для единообразия с англоязычной терминологией будем в дальнейшем называть пространством клипа.
Чтобы организовать задуманное нами отсечение части объектов в исходной пирамиде видимости, нам потребуется модифицировать применяемую в нашей модели матрицу перспективной проекции. Параметры таковой матрицы программисты OpenGL могут найти на сайте основной документации по OpenGL, программисты на Flash (AS3), вероятнее всего обратятся к классу PerspectiveMatrix3D, программисты Direct3D имеют свои источники, пишущие для андроида найдут всё необходимое в классе android.opengl.Matrix, и т.д. Не исключено, что кто-то, поняв основную идею, предпочтет расширить свой собственный класс перспективного преобразования дополнительной функциональностью.
Точка из пространства пирамиды видимости камеры вида отображается в пространство клипа канонического куба, например, следующим 4х4-матричным преобразованием (воспользуемся матрицей перспективного преобразования генерируемой glFrustum()-функцией OpenGL):
При таком преобразовании, -координата преобразованной точки в однородном пространстве клипа имеет знак противоположный знаку -координаты точки в пространстве камеры вида.
Особенности искажения пространства стандартной матрицей преобразования видны из Рис.4:
-координата из пространства пирамиды видимости отражается в диапазон [-1, 1] NDC, причём бесконечный диапазон за дальним планом пирамиды видимости из камеры вида сжимается в конечный промежуток внутри NDC; конечное расстояние от камеры до ближнего плана вдоль оси Z расширяется до бесконечного промежутка NDC; а точки вдоль оси Z, находящиеся до камеры, отражаются в диапазон .
Рис. 4. Отражение -координаты точки из пространства камеры вида в пространство нормализованных координат устройства (NDC — normalized device coordinates).
Заменяя ближний план пирамиды видимости плоскостью отсечения, мы должны сохранить основные особенности матрицы перспективного преобразования, -координата точки, лежащей на модифицированном ближнем плане, в нормализованных координатах устройства (NDC) должна остаться равной -1. Все дальнейшие наблюдения являются универсальными для любых обратимых проекционных матриц, и использование матрицы проекции из Выражения (10) служит лишь целям иллюстрации общего процесса модификации матрицы преобразования.
Если является одной из плоскостей, ограничивающих пространство клипа, и при этом матрица преобразования является матрицей проекции из пространства камеры в пространство клипа, то не сложно осуществить отображение этой плоскости в пространство камеры из пространства клипа посредством транспонированной матрицы , что очевидно следует из Выражения (9):
Модифицирование ближнего плана пирамиды видимости
Для начала, извлечем из произвольной проекционной матрицы четырехмерные векторы, соответствующие шести плоскостям отсечения пирамиды видимости. Эрик Ленгел исходил из того, что плоскости в пространстве клипа всегда неизменны: нормаль любой плоскости параллельна одной из главных координатных осей.
На Рис.5 показаны элементы «-» трёхмерного среза четырехмерного однородного пространства клипа. Внутри этого среза -координата любой точки равна 1, таким образом, и -координата каждой плоскости равна 1, и, разумеется, одна из -,-, или -координат равна ±1, что отражено в Таблице 1. Для понимания Таблицы 1 надо ещё раз внимательно посмотреть на Выражение (11): сумма некоторых двух столбцов матрицы не что иное, как сумма соответствующих двух строк матрицы .
Рис. 5. Нормальные векторы для левой, правой, ближней и дальней плоскостей, ограничивающих однородное кубическое пространство клипа. Нормальные векторы для верхней и нижней плоскостей пространства клипа направлены от и к наблюдателю.
Табл. 1. Взаимосвязь между координатами пространства клипа и пространства усеченной пирамиды видимости камеры вида. Матрица проекции переводит пространство камеры вида в пространство клипа, и обозначение представляет -ую строку матрицы .
Пусть – некоторая плоскость, показанная ни Рис. 6, в координатном пространстве камеры вида, посредством которой мы и намереваемся ограничить нашу геометрию. Камера располагается с отрицательной стороны плоскости (со стороны противоположной направлению вектора плоскости), поэтому . Именно этой плоскостью мы намерены заменить ближний план пирамиды видимости, поэтому, в соответствии с соотношениями из Таблицы 1, для должно выполняться:
Мы не можем модифицировать четвертую строку матрицы перспективной проекции, т.к. она используется для отражения отрицательной -координаты в -координату, и необходима для дальнейшей корректной работы графического конвеера. Однако, со вторым слагаемым правой части Выражения (12) мы можем поступать более свободно:
Рис. 6. Замена ближнего плана пирамиды видимости плоскостью .
Поскольку, согласно Таблицы 1, третья строка матрицы проекции входит в состав выражения для дальнего плана пирамиды видимости, то очевидно, что её модифицирование необходимо учесть для дальнего плана:
И этот результат являет собой заметную проблему для перспективной проекции: поскольку , то дальний план и ближний план пирамиды видимости перестают быть параллельными, в случае отличных от нуля значений для и . Более того, форма усеченной пирамиды приобретает вид крайне нежелательный в последующем рендеринге: рассмотрим некоторую точку , для которой выполняется , и это влечет за собой равенство нулю и , из чего мы должны заключить, что наши новые ближний и дальний планы пересекутся образом подобным показанному на Рис. 7 (а).
Проекция глубины точки, ранее достигавшая максимума на дальнем плане, и необходимая нам для процесса графической растеризации, более не представляет собой проекцию вдоль оси , а скорее, становится значением, зависящим от положения между ближним и дальним планами. Зависимость глубины проекции от направления внутри пирамиды видимости серьезнейшим образом скажется на правильности значений буфера глубины. Однако, этот нежелательный эффект, можно снизить до приемлимого для задачи растеризации уровня, уменьшив угол между ближним и дальним планами до минимально возможного. Как и всякую плоскость, плоскость можно масштабировать, и это её свойство как нельзя кстати в нашем случае. Масштабирование плоскости скажется на ориентации дальнего плана , так что нам требуется лишь подобрать коэффициент масштабирования таким образом, чтобы минимизировать угол между и без ущерба для содержания сцены внутри пирамиды видимости как показано на Рис. 7 (b).
Рис. 7. (а) Пересечение измененного в соответствии с Выражением (14) дальнего плана с модифицированным ближним планом в «-»-плоскости. (b) Масштабирование ближнего плана параметром , введенным Выражением (17) изменяет угол между дальним и ближним планом до минимально возможного, не повреждая при этом начального вида усечения. Затененная область относится к объему пространства, не подвергнутого усечению.
Пусть является проекцией нового ближнего плана в пространстве клипа ( – исходная матрица проекции). Угол внутри пирамиды видимости, лежащий напротив плоскости , будет иметь следующие координаты:
Для большинства перспективных проекций, знаки компонент и у преобразованных плоскостей совпадут со знаками соответствующих компонент и , что нам позволяет воспользоваться знаками координатного разложения исходной плоскости.
Имея компоненты преобразованного угла , мы уже можем вычислить компоненты оригинального угла , лежащего напротив плоскости , как . В обычной пирамиде видимости, точка в вершине угла, образованного пересечением двух боковых плоскостей и дальнего плана, лежащая напротив плоскости , является наиболее удаленной от плоскости точкой.
Чтобы наш дальний план содержал точку , должно выполняться условие , дополним Выражение (14) масштабирующим плоскость фактором
и найдем из условия масштабирующий фактор:
Замена на в Выражении (13)
и позволит нам оптимальным образом сориентировать дальний план пирамиды видимости, как показано на Рис. 7 (b) (данная техника замещения работает корректно и для пирамиды видимости, дальний план которой удален на бесконечность,– случай бесконечной проекционной матрицы,– для этого достаточно потребовать, чтобы дальний план был параллелен одной из двух образующих противоположный плоскости угол граней).
Практическое использование произведенных выше наблюдений
Все ранее проделанные теоретические изыскания распространяются на любые обратимые проекционные матрицы, но, поскольку, в качестве примера уже привлекалась стандартная для OpenGL матрица в Выражении (10), то логично продолжить цепочку примеров с нею же.
Обратная матрица к ней будет выглядеть таким образом:
Получим значение для третьей строки модифицированной проекционной матрицы, как предложено Выражением (18) с учетом из Выражения (17):
Поскольку , то это выражение можно записать как
Умножив обратную матрицу из Выражения (19) на из Выражения (15), мы получим :
Чтобы убедиться в правильности разработанного метода модифицирования проекционной матрицы, рассмотрим частный случай расположения плоскости отсечения перпендикулярно оси , т.е. параллельно обычному ближнему плану пирамиды видимости,— в координатной записи такая плоскость будет выглядеть как , где -некоторая положительная дистанция. Естественно ожидать, что в новой проекционной матрице для пирамиды видимости, ближний план которой удалён на расстояние от камеры, дальний план останется в своей прежней позиции.
Скалярное произведение для такой плоскости будет равно , а Выражение (21) для вычисления третьей строки модифицированной матрицы проекции приведет к
— результату, совпавшему с ожиданиями: при третья строка модифицированной матрицы совпадает с третьей строкой проекционной матрицы из Выражения (10).
Как уже предполагалось выше, следует ожидать, что процесс растеризации не будет столь же привычным, как в случае немодифицированной пирамиды видимости. Полный диапазон значений буфера глубины не будет достигаться вдоль различных направлений внутри пирамиды видимости вследствие изменения в геометрии пирамиды. Возьмем вектор произвольного направления в пространстве камеры вида, для которого , и исследуем нормализованную -координату точки , расположенной внутри пирамиды видимости:
где -масштабирующий фактор, введенный Выражением (17). Для , Выражение (24) становится
Мы полагаем, что скалярное произведение , поскольку иначе точка лежала бы вне пирамиды видимости. Рассмотрим ситуацию, когда стремится к бесконечности:
полученное выражение указывает максимально достижимое значение нормализованной -координаты в направлении .
Исследуем направление вдоль взгляда прямого взгляда из позиции камеры: предельное значение, указанное Выражением (26), меньше единицы, если выполняется условие . В этом случае, -координата дальнего плана , заданного Выражением (16), меньше нуля, и дальний план не является плоскостью, ограничивающей объем пирамиды видимости. Поскольку дальний план может оказаться не достижимым вдоль направления , диапазон нормализованных значений для буфера глубины может оказаться существенно уже, чем в случае обычной пирамиды видимости.
Хорошей практикой для программиста будет, перед тем, как утвердить для дальнейшей работы выбранную пространственную модель, исследовать поведение нормализованной координаты внутри модифицированной (скошенной | oblique frustum) пирамиды видимости. Своевременно обнаружив проблемные места, он может поправить или положение камеры, или изменить угол наклона секущей плоскости таким образом, чтобы упростить работу буфера глубины, по возможности приблизив её к нормальному режиму. Затраты на такое действие не будут особенно значительными, но результат послужит спокойствию перфекциониста.
Продолжая эксплуатировать стандартную матрицу проекции из Выражения (10), легко перейти к очередному примеру её использования для исследования значений нормализованной -координаты внутри модифицированной пирамиды видимости:
допустим, что плоскость, отсекающая неугодную нам геометрию, и которой мы замещаем ближний план пирамиды видимости, в направляющих косинусах представлена как , и, в нашем частном случае, имеют положительные значения (плоскость лежит напротив правого верхнего угла пирамиды), при этом -угол между отрицательным направлением оси и нормальным вектором нашей плоскости. Рассмотрим изменение нормализованной -координаты вдоль отрицательного направления оси в зависимости от угла между нормальным вектором плоскости ближнего плана и отрицательным направлением оси , и расстоянием от камеры до ближнего плана.
Скалярное произведение для этого случая, с учетом Выражения (22) даст следующий результат:
и третья строка преобразованной матрицы проекции приобретет вид
Рассмотрим поведение нормализованной координаты в направлении фронтального вида из камеры для точек , из диапазона значений : нормализованная -координата для этого случая станет
Последнее Выражение вполне подходит для целей численного исследования. Пример такого исследования можно видеть на Рис. 8. Диапазон нормализованных значений, предназначенных для буфера глубины, сильно сужается с ростом угла между нормалью плоскости и отрицательным направлением оси , также значительно ухудшить точность работы буфера глубины может перемещение ближнего плана по направлению от камеры к дальнему плану (известно, что слишком близкое размещение к камере ближнего плана также неблагоприятно сказывается на значениях нормализованных координат).
Рис. 8. Сужение диапазона нормализованной -координаты в направлении проекции , в зависимости от угла между нормаль-вектором ближней (секущей) плоскости и отрицательным направлением оси , и расстоянием от камеры до ближней (секущей) плоскости. Значения, близкие к 1, соответствуют ситуации, когда исследуемая пространственная точка располагается вблизи модифицированного дальнего плана, при этом ближний план достаточно удален от дальнего плана и его нормаль-вектор незначительно отклонен от отрицательного направления оси . С ростом угла и перемещением ближнего плана в направлении от камеры, диапазон нормированных значений -координаты сужается до значений малопригодных для работы большинства буферов глубины.
Заключение
Программисту в процессе разработки приложения часто приходится искать компромисс между быстродействием и реалистичностью рендеринга. Техника, изложенная в настоящей статье, позволяет не только достичь максимального быстродействия на самом широком спектре устройств, но и помогает определить ситуацию, в которой желательно отредактировать сцену, для наиболее благоприятного ее отображения.
Совмещение процессов модификации пирамиды видимости и тестирования работы буфера глубины для модифицированной пирамиды (или учет произведенных выше наблюдений) — залог высокого качества конечного результата непростого труда программиста.
Литература
[1] Eric Lengyel, Oblique View Frustum Depth Projection and Clipping. Journal of Game Development, Vol. 1, No. 2 (March 2005), pp. 5–16.
[2] Eric Lengyel, Mathematics for 3D Game Programming and Computer Graphics. Charles River Media, 2002, p. 103.
Автор: nailer