Для записи трёхмерных поворотов программисты графики используют кватернионы. Однако в кватернионах сложно разобраться, потому что изучают их поверхностно. Мы просто принимаем на веру странные таблицы умножения и другие загадочные определения, и используем их как «чёрные ящики», поворачивающие векторы так, как нам нужно. Почему и ? Почему мы берём вектор и превращаем его в «мнимый» вектор, чтобы преобразовать его, например ? Да кому это интересно, если всё работает, правда?
Существует способ описания поворотов под названием ротор, который относится к области и комплексных чисел (в 2D), и кватернионов (в 3D), и даже обобщается до любого количества измерений.
Мы можем создавать роторы практически полностью с нуля, вместо того, чтобы определять из ничего кватернионы и пытаться объяснить, как они работают задним числом. Это занимает больше времени, но мне кажется, что это стоит того, потому что их гораздо легче понять!
Кроме того, для визуализации и понимания трёхмерных роторов не нужно использовать четвёртое пространственное измерение.
Было бы здорово, если бы начали вытеснять использование и изучение кватернионов, заменяя их роторами. Заменить их очень просто, а код останется почти таким же. Всё, что можно делать с кватернионами, например, интерполяцию и устранение блокировки осей (Gimbal lock), можно сделать и с роторами. Но понимать мы начинаем гораздо больше.
(В оригинале статьи все графики интерактивны, а за статьёй следует видео. Нажимая на кнопки воспроизведения, можно запустить соответствующий раздел видео. Также можно нажать под видео кнопку перехода, чтобы перейти к соответствующему разделу статьи. Можно развернуть окно, чтобы для видео было больше места, или установить для него постоянный размер.)
1. Плоскости поворотов
1.1. Повороты выполняются на двухмерных плоскостях
В трёхмерном пространстве мы обычно воспринимаем повороты как происходящие вокруг осей, как колесо вращается на оси, но вместо этого корректнее будет представлять плоскость, на которой лежит колесо. Эта плоскость перпендикулярна оси.
Эта старушка крутит колесо в плоскости , перпендикулярно оси .
Так получается, потому что если мы разделили вектор на две части, одна из которых лежит на плоскости (), а другая находится за её пределами (), то поворот вращает внутреннюю часть, а внешняя остаётся неизменной.
Поворот в плоскости [в оригинале статьи это анимация и камеру можно перемещать]
В двухмерном пространстве есть только одна плоскость, в которой возможен поворот (внешней части нет). Поэтому считать, что повороты происходят вокруг третьей оси (перпендикулярной к 2D-плоскости) строго говоря неверно, потому что для выполнения поворотов мы не должны добавлять ещё одно измерение.
Если рассказать двухмерному «плоскоземельщику» (который живёт внутри 2D-плоскости и никогда не выбирался из двухмерного пространства) о перпендикулярной оси поворота, то он бы спросил: «В каком направлении указывает эта ось? Я не могу её представить!»
И в более высоких измерениях (4D и выше) невозможно определить один вектор нормали к 2D-плоскости (например, в 4D у 2D-плоскости есть два направления нормалей, в 5D есть три направления нормалей, а в их )
1.2. Точное направление поворотов
Кроме того, когда мы думаем о повороте вокруг оси, направление поворота не определено, и поэтому его нужно определять по правилу (так называемому «правилу правой руки»).
Однако если считать, что повороты происходят внутри плоскостей, то направление становится понятным: поворот в плоскости означает поворот, который перемещает (единичный) вектор к (единичному) вектору внутри плоскости, которую они совместно образуют. Поворот в плоскости — это поворот в обратном направлении: он перемещает вектор к вектору .
Помню, что когда я впервые узнал о трёх матрицах 3D-поворотов вдоль ортогональных плоскостей, то первым делом подумал: какого чёрта матрица имеет противоположный знак? Так получается из-за правила правой руки, по которому мы должны определять поворот вокруг оси так, чтобы он выполнялся от к , а не от к , чтобы сохранять постоянное «праворукое» направление поворота. Когда мы начинаем говорить непосредственно о самой плоскости, это правило становится ненужным.
2. Бивекторы
2.1. Внешнее произведение
Для вычисления оси поворота при повороте одного вектора к другому вектору мы берём векторное произведение двух векторов, чтобы получить вектор, перпендикулярный им обоим. Но зачем нам «уходить» из плоскости, если поворот по сути своей является двухмерной операцией?
Вместо этого мы возьмём то, что называется внешним произведением (также известное как двухмерное векторное произведение), двух векторов, создав новый элемент под названием «бивектор» (или 2-вектор) , представляющий плоскость, которую совместно образуют два вектора. Если векторное произведение создаёт вектор нормали к плоскости, то внешнее произведение создаёт саму плоскость. Вычисление нормали к плоскости не относится к делу.
можно представить как параллелограмм, построенный из векторов и в плоскости, которую они совместно образуют.
Поначалу идея бивектора может казаться странной, но скоро мы увидим, что они почти столь же фундаментальны, как и сами векторы. Если вектор можно сравнить с прямой, то бивектор подобен плоскости… Свойства внешнего произведения ухватывают важные свойства плоскостей.
2.2. Базис для бивекторов
Бивекторы, как и векторы, имеют компоненты. Но они определяются на базисе плоскостей, а не прямых, как векторы.
Три ортогональных базисных плоскости — это , и , как мы видим из рисунка.
Но сначала давайте рассмотрим более простой двухмерный случай…
2.3. Двухмерные бивекторы
В 2D есть только одна плоскость, а именно . То есть двухмерный бивектор имеет только один компонент. Для бивектора, составленного из векторов и , это число равно площади (со знаком) параллелограмма, образованного двумя векторами.
В оригинале статьи с 2D-бивектором можно поэкспериментировать на интерактивном графике, изменяя (единичные) векторы, из которых он составлен:
Можно увидеть, что при изменении угла между векторами площадь параллелограмма меняется (в соответствии с синусом угла).
Если векторы совпадают или параллельны, то они не образуют правильной плоскости и результат будет равен нулю. Это простое свойство определяет то, чем является бивектор:
Взглянув на сумму двух векторов, можно увидеть, что из свойства следует:
Следовательно:
Так же, как направление поворота, важен порядок аргументов во внешнем произведении. Перемена мест аргументов меняет знак результата (это называется «антисимметрией»).
На графике знак обозначается цветом, который сменяется с синего на зелёный. Знак меняется, когда поворот из в переходит от движения по часовой стрелке к движению против часовой стрелки (т.е. если он соответствует направлению (от к ) или направлению (от к )).
Можно увидеть, что свойства внешнего произведения устроены так, что передают свойства плоскостей и поворотов.
2.4. Двухмерные бивекторы из неединичных векторов
Очевидно, что векторы не обязаны быть единичной длины, и на этом графике данное ограничение устранено:
Площадь параллелограмма со знаком пропорциональна длинам обоих векторов: , где — это угол между и . То есть, например, при удвоении длины одного вектора вдвое увеличивается площадь.
Мы можем получить истинное значение, подставив векторы в виде компонентов:
2.5. Трёхмерные бивекторы
Так же, как координаты вектора можно считать проекциями вектора на три ортогональных базисных оси (, , ), координаты бивектора можно считать проекциями меньше плоскости на три ортогональные базисные плоскости.
Проекции вектора являются длинами этого вектора вдоль каждого базисного вектора, а проекции бивектора являются площадями плоскости на каждую базисную плоскость.
Для вектора:
Для бивектора:
Где , , — это просто числа, наподобие , , (они подчёркнуты цветами, соответствующими цветам на графике).
Компоненты 3D-бивектора — это просто три 2D-проекции бивектора на базисные 2D-плоскости.
Пользуясь тем же методом, что и раньше, мы находим, что истинные величины компонентов выглядят во многом похоже на компонент XY из двухмерного случая, но применённого ко всем трём плоскостям:
Можно поэкспериментировать с 3D-бивектором на интерактивном графике в оригинале статьи:
Норма бивектора определяется аналогично норме вектора (квадратный корень из суммы квадратов компонентов). Это равно площади параллелограмма, образованного и , т.е. , где — угол между и .
Если мы разделим бивектор на его норму, то сократим две длины векторов и (абсолютное) значение синуса угла, то есть у нас останется бивектор , который будет построен так, как будто два вектора изначально были перпендикулярны и имели единичную длину. Это очень чистое представление плоскости, содержащей оба вектора. Значит:
Напоминает ли вам что-нибудь внешнее произведение? В 3D определение внешнего произведения очень схоже с определением векторного произведения. На самом деле, вектор в 3D, получаемый из векторного произведения (например, вектор нормали) будет иметь три компонента, равные компонентам бивектора (числа будут теми же, но базис отличается).
$$display$$begin{eqnarray}mathbf{a} wedge mathbf{b} &=& & (a_x b_y - b_x a_y)(mathbf{x} wedge mathbf{y}) \ & & + & (a_x b_z - b_x a_z)(mathbf{x} wedge mathbf{z}) \ & & + & (a_y b_z - b_y a_z)(mathbf{y} wedge mathbf{z}) \ \ mathbf{a} times mathbf{b} &=& & (a_x b_y - b_x a_y) mathbf{z} \ & & - & (a_x b_z - b_x a_z) mathbf{y} \ & & + & (a_y b_z - b_y a_z) mathbf{x}end{eqnarray}$$display$$
Определение бивектора имеет геометрический смысл, а не появляется из ниоткуда. Помню, что когда изучал векторные произведения, я думал: «Какого чёрта оно возвращает вектор, длина которого равна площади параллелограмма, образованного этими двумя векторами? Это кажется таким случайным. И почему нам можно превратить площадь параллелограмма в длину вектора?»
2.6. Семантика векторов и бивекторов
В 3D бивектор имеет три координаты, по одной на плоскость: (, и ). Векторы также имеют три координаты, по одной на ось (, и ). Каждая плоскость перпендикулярна к одной оси. Это совпадение возникает только в трёх измерениях (*) и именно поэтому мы постоянно путаем бивекторы с векторами.
В 2D есть только один базисный бивектор (), а в 3D есть 3 базисных бивектора (, , ), в 4D есть 6 базисных бивектора (, , , , , ) и так далее...
В программировании они оба имеют одинаковую схему размещения в памяти, но разные операции. Использование 3D-вектора вместо 3D-бивектора похоже на «преобразование типа» бивектора.
Вот пример: вы могли видеть, что векторы нормалей преобразуются иначе, чем обычные векторы, с помощью «обратного переноса» матрицы , вместо самой матрицы. Так происходит, потому что на самом деле они на самом деле являются не векторами, а бивекторами, которые «преобразованием типов» превратили в векторы. В физике есть хак под названием «осевой вектор», который был введён для того, чтобы отличать векторы, получаемые векторным произведением, от обычных векторов. Бивектор является истинным «типом» объекта и должен восприниматься и обрабатываться соответствующим образом.
Мы можем продолжать брать внешнее произведение для получения не только ориентированных 2D-площадей, но и ориентированных 3D-объёмов. Тривектор можно получить, дважды выполнив внешнее произведение:
В трёхмерном пространстве всё на этом заканчивается. Как и в 2D, где есть только одна плоскость, заполняющая всё 2D-пространство, в 3D есть только один объём, заполняющий всё 3D-пространство.
[Но в nD мы можем продолжать создавать ещё большие внешние произведения векторов, пока не достигнем n-ного измерения. Например в 4D у нас есть четыре базисных тривектора (3-вектора) (, , , ) и один базисный 4-вектор ]
В 3D тривектор имеет только один базисный компонент (), равный объёму параллелепипеда, образованного тремя векторами. Тройное внешнее произведение является улучшенной версией скалярного тройного произведения (), потому что в нём задействован только один тип операций, оно возвращает корректный тип (объём вместо скаляра) и работает в любом количестве измерений.
3. Геометрическое произведение
3.1. Умножение векторов друг на друга
Геометрическое произведение (обозначаемое без символа) — это ещё одна операция, которую можно выполнить с векторами. Геометрическое произведение определяется так, что векторы имеют обратные величины (например , где 1 — это просто число 1!) и обладают удобными свойствами, например ассоциативностью (). Цель этого в том, чтобы иметь возможность перемножать векторы так, чтобы (как и в случае с матрицами) умножение соответствовало геометрическим операциям.
Наличие обратных величин полезно, потому что каким бы ни был объект , он не повлияет на векторы, то есть будет вести себя так же, как и при умножении числа на 1.
Чтобы определить произведение, сначала заметим, что можно разделить произведение (или любую функцию, получающую два аргумента) на сумму части, которая не изменяется, если мы поменяем аргументы местами, и на ту часть, которая изменится, следующим образом:
Первый член больше не зависит от порядка аргументов и (он называется «симметричной» частью), а второй член при перемене мест аргументов меняет знак (он называется «антисимметричной» частью).
Скалярное произведение двух векторов (также называемое внутренним произведением) симметрично и является мерой расстояния (), поэтому с геометрической точки зрения кажется полезным, чтобы мы сделали его равным симметричной части:
Аналогично, внешнее произведение двух векторов антисимметрично, поэтому полезно будет приравнять его к антисимметричной части:
Кроме того, скалярное произведение содержит косинус угла между двумя векторами (), в то время как внешнее произведение содержит синус угла. Вместе они полностью описывают угол между векторами, а также образуемую ими плоскость.
Именно полнота описания делает произведение обратимым, потому что мы можем перейти от одного вектора к другому с помощью информации, содержащейся в их произведении. Если я дам вам и , то вы сможете получить . Это невозможно сделать, зная только косинус или только синус/плоскость.
То есть геометрическое произведение равно:
Это странно, потому что умножение двух векторов даёт сумму двух различных вещей: скаляра и бивектора. Однако это похоже на то, как комплексное число является суммой скаляра и «мнимого» числа, поэтому вы уже могли к этому привыкнуть. Здесь часть с бивектором соответствует «мнимой» части комплексного числа. Только это не «мнимое» значение, это просто бивектор, который мы по-настоящему можем показать графически!
По сути, перемножив два вектора, мы вычисляем их полезные свойства («длину их проекций друг на друга» / «косинус угла» () и «плоскость, которую они вместе образуют» / «синус угла» ()), которые мы соединяем вместе знаком «плюс». Геометрическое произведение также даёт операции «групп свойств», которые к ним можно применить, и эти операции имеют геометрические интерпретации (например: поворот и отражение векторов). Это мы скоро увидим.
Можно выразить геометрическое произведение через синус и косинус: , где — это бивектор обоих векторов на плоскости, составленный из двух единичных перпендикулярных векторов.
3.2. Таблица умножения
Таблица умножения позволяет сделать произведение более конкретным: давайте посмотрим, что произойдёт, если мы получим произведения базисных векторов (, , ).
Для любого базисного вектора, например оси , результат будет равен :
Для любой пары базисных векторов, например, осей и , результат будет бивектором, который они вместе образуют:
(то есть мы можем назвать просто , так как это одно и то же!)
Это даёт нам следующую таблицу:
По сути, эта таблица тривиальна, по сравнению, например, с таблицей кватернионов.
Например, вот умножение двух векторов и :
3.3. Формула отражения (традиционный вид)
Отражение на вектор [в оригинале статьи каждый вектор можно перемещать]
Если у нас есть единичный вектор и вектор , мы можем отразить через плоскость, перпендикулярную .
Это делается обычным образом: мы разделяем на часть, перпендикулярную к плоскости: , и часть, параллельную плоскости: .
Затем, для того, чтобы отразить вектор, перевернём перпендикулярную часть, а параллельную оставим неизменной:
3.4. Формула отражения (вид для геометрического произведения)
На этом этапе мы можем заменить скалярное произведение на его версию в виде геометрического произведения , и получить следующее:
(, так как является единичным вектором)
Это даёт нам абсолютно то же самое, но в другой записи. Использование записи в виде простого произведения вместо формулы для кодирования такой фундаментальной операции, как отражение, будет очень полезным!
Если вы не понимаете, как работает многократное взятие геометрического произведения, то просто посмотрите на базисные векторы. Есть всего три возможных случая:
Результаты будут следующими: вектор, вектор, вектор + тривектор. Однако последний случай может возникнуть, только когда все три вектора независимы, что никогда не истинно для
Любопытствующие могут посмотреть, на то, что происходит на каждом этапе с точки зрения геометрического произведения.
- Первый этап:
Если, как и раньше, мы разделим на часть, перпендикулярную к плоскости (), и часть, параллельную ей (), то мы получим:
, потому что эти векторы перпендикулярны, а , потому что эти векторы параллельны.
Первый член — это просто длина проекции на , т.е. первый член — это просто длина .
Давайте назовём нормализованной версией , то есть . Тогда второй член — это просто бивектор , умноженный на длину .
Этот бивектор составлен из двух перпендикулярных единичных векторов, то есть это очень чистое представление плоскости векторов и . Он не содержит информацию об их относительном угле или их длинах, только ориентацию плоскости.
То есть оба члена являются просто разложением на две ортогональные проекции ( и ), а также образуемой ими плоскость ():
Прежде чем переходить к следующему шагу, мы можем заменить внешнее произведение геометрическим, потому что и перпендикулярны, а потому их внешнее и геометрическое произведение будут эквивалентными (так так часть со скалярным произведением из их геометрического произведения равна нулю).
- Второй этап будет следующим:
Первый член — это просто компонент вдоль , т.е. компонент , перпендикулярный плоскости. Другими словами, первый член — это просто .
Так как и (снова) перпендикулярны, их геометрическое произведение просто является их внешним произведением, то есть можно поменять их местами и изменить знак.
- И наконец, последний этап переворачивает знак:
То есть мы видим, что компонент , перпендикулярный плоскости, перевёрнут, а параллельная часть остаётся такой же!
Длина не очень важна, поэтому ниже мы её игнорируем, но если не является единичным вектором, то мы должны выполнить деление на его длину и формула превращается в , что больше походит на «послойное произведение», к которому вы уже должны были привыкнуть.
3.5. Два отражения — это поворот: ситуация в 2D
Оказывается, что если мы применим к два последовательных отражения (сначала с вектором , а затем с вектором ), то получим поворот на удвоенный угол между векторами и .
Мы можем показать каждый последующий этап отражения на показанном ниже графике:
Также в оригинале статьи можно изменить векторы , и , но исходная конфигурация векторов на графике (нажмите на кнопку «Reset Vector Positions») особенно явно демонстрирует, почему поворот в результате происходит на удвоенный угол. Ещё одна неплохая конфигурация — задание в качестве и осей и .
3.6. Два отражения — это поворот: ситуация в 3D
В случае 3D вектор можно разделить на две части, одна из которых лежит на плоскости, заданной и , а другая лежит снаружи плоскости (перпендикулярна ей). Как показано на графике ниже, когда вектор отражается каждой из плоскостей, его внешняя часть остаётся той же. Что касается внутренней части, то мы возвращаемся в 2D, и она просто поворачивается на удвоенный угол!
3.7. Роторы
С точки зрения геометрического произведения два отражения просто соответствуют следующему:
Мы называем ротором, потому что умножая на с обеих сторон вектора, мы выполняем поворот ( — это то же самое, что и , только в перевёрнутой частью-бивектором).
Применение ротора к обеим сторонам вектора поворачивает этот вектор в плоскости векторов и на удвоенный угол между и .
И на этом всё!
Сравнение 3D-роторов и кватернионов
Можно заметить, что 3D-роторы во многом выглядят как кватернионы:
На самом деле, код/математика практически те же самые! Главное различие в том, что , и заменяются на , и , но работают они в основном так же. Сравнение кода можно посмотреть здесь. Я не стал реализовывать всё, например log/exp для интерполяции, но их создать довольно просто.
Однако, как мы видели, 3D-роторы — это трёхмерная концепция, не требующая для визуализации использования «четырёхмерных двойных поворотов» или «стереографического проецирования». Попытка визуализировать кватернионы, работающие в 4D, для объяснения 3D-поворотов немного похожа на то, чтобы пытаться понять движение планет с геоцентрической точки зрения. Т.е. такой подход слишком сложен, потому что мы смотрим на него с неверной точки зрения.
Как мы увидели, моделирование поворотов как происходящих внутри плоскостей, а не вокруг векторов, сильно нам помогает. Например, квадраты базисных бивекторов дают , точно так же как и базисные кватернионы ():
Умножение двух бивекторов друг на друга даёт третий бивектор, но по сути это тривиально, и нам не нужно запоминать, что :
(Заметьте, что мы использовали )
Эти свойства являются следствием геометрического произведения, а не возникают ниоткуда!
Дополнительное чтение
(Кстати, в геометрической алгебре есть не только роторы, но и другие крутые штуки!)
- Linear and Geometric Algebra by Macdonald [ссылка на Amazon]
Отличный источник, очень чёткий и понятный, потому что подразумевалось, что он заменит учебник линейной алгебры для студентов.
- Geometric Algebra For Computer Science by Dorst et al. [ссылка на Amazon]
Отличный источник, потому что программирование иногда позволяет лучше разобраться в предмете.
Примечание: в этой книге авторы дают понять, что геометрическая алгебра медленее, чем кватернионы (и тому подобное...). На самом деле она должна иметь примерно такой же код (т.е. не стоит писать код для геометрической алгебры, создавая обобщённую struct, которая может содержать все возможные типы k-векторов, просто пишите при необходимости по одной struct для каждого типа k-векторов. То есть для замены кватернионов можно написать одну структуру Bivector и одну структуру Rotor, которая является Scalar + Bivector).
Автор: PatientZero