Туманные вычисления
- 1 year ago
- 0
- 0
Алгоритм вычисления собственных значений — алгоритм, позволяющий определить собственные значения и собственные векторы заданной матрицы . Создание эффективных и устойчивых алгоритмов для этой задачи является одной из ключевых задач вычислительной математики .
Если задана n × n квадратная матрица A над вещественными или комплексными числами, то собственное значение λ и соответствующий ему корневой вектор v — это пара, удовлетворяющая равенству :
где v ненулевой n × 1 вектор-столбец, E является n × n единичной матрицей , k — положительным целым, а λ и v могут быть комплексными, даже если A вещественна. Если k = 1 , вектор просто называется собственным вектором . В этом случае A v = λ v . Любое собственное значение λ матрицы A имеет простой собственный вектор, соответствующий ему так, что если k — наименьшее целое, при котором ( A - λ E ) k v = 0 для корневого вектора v , то ( A - λ E ) k -1 v будет простым собственным вектором. Значение k всегда можно взять меньше либо равным n . В частности, ( A - λ E ) n v = 0 для всех корневых векторов v , соответствующих λ.
Для любого собственного значения λ матрицы A ядро ker( A - λ E ) состоит из всех собственных векторов, соответствующих λ , (вместе с 0) и называется собственным подпространством числа λ , а векторное подпространство ker(( A - λ E ) n ) состоит из всех корневых векторов (дополненное нулевым вектором) и называется корневым подпространством . Геометрическая кратность значения λ является размерностью его собственного подпространства. Алгебраическая кратность значения λ является размерностью его корневого подпространства. Дальнейшие термины связаны с равенством:
Здесь det — определитель , λ i — все различные собственные значения матрицы A , а α i — соответствующие алгебраические кратности. Функция p A ( z ) — это характеристический многочлен матрицы A . Таким образом, алгебраическая кратность является кратностью собственных значений как корней характеристического многочлена. Поскольку любой собственный вектор является корневым вектором, геометрическая кратность меньше либо равна алгебраической кратности. Сумма алгебраических кратностей равна n степени характеристического многочлена. Уравнение p A ( z ) = 0 называется характеристическим уравнением , поскольку его корни являются в точности собственными значениями матрицы A . По теореме Гамильтона — Кэли сама матрица A удовлетворяет тому же самому уравнению: p A ( A ) = 0 . Как следствие, столбцы матрицы должны быть либо 0, либо корневыми векторами, соответствующими собственному значению λ j , поскольку они уничтожаются матрицей
Любой набор корневых векторов различных собственных значений линейно независим, так что базис для всего
C
n
можно выбрать из набора корневых векторов. Точнее этот базис
{
v
i
}
n
i
=1
можно выбрать и выстроить так, что:
Если эти базисные вектора расположить как столбцы матрицы V = [ v 1 v 2 ... v n ] , то V можно использовать для преобразования матрицы A в её нормальную жорданову форму :
где λ i — собственные значения, β i = 1 если ( A - λ i +1 ) v i +1 = v i и β i = 0 в других случаях.
Если W является обратимой матрицей и λ — собственное значение матрицы A с соответствующим корневым вектором v , то ( W -1 AW - λ E ) k W - k v = 0 . Таким образом, λ является собственным значением матрицы W -1 AW с соответствующим корневым вектором W - k v . Таким образом, подобные матрицы имеют те же самые собственные значения.
Эрмитово-сопряжённая матрица M * к комплексной матрице M — это траспонированная матрица с заменой всех элементов на сопряжённые значения: M * = M T . Квадратная матрица A называется нормальной , если она коммутирует с эрмитово-сопряжённой: A * A = AA * . Матрица называется эрмитовой , если она равна своей сопряжённой: A * = A . Все эрмитовы матрицы нормальны. Если A имеет только вещественные элементы, то сопряжённая к ней — это просто транспонированная матрица, и она будет эрмитовой в том и только в том случае, когда она симметрична . Если применить это к столбцам, сопряжённость можно использовать для определения канонического скалярного произведения в C n : w • v = w * v . Нормальные, эрмитовы и вещественные симметричные матрицы имеют ряд полезных свойств:
Возможно как для вещественных, так и для комплексных матриц иметь все собственные значения вещественными, не будучи при этом эрмитовой матрицей. Например, вещественная треугольная матрица имеет все свои собственные значения на диагонали, но, в общем случае, не симметрична.
Любую задачу вычислительной математики можно рассматривать как вычисление некоторой функции ƒ от некоторого аргумента x . Число обусловленности κ (ƒ, x ) задачи — это отношение относительной ошибки результата вычисления к относительной ошибке параметра функции и зависит как от функции, так и от параметра. Число обусловленности описывает насколько возрастает ошибка во время вычислений. Десятичный логарифм этого числа говорит о количестве знаков, которые мы теряем по отношению к исходным данным. Число обусловленности относится к наилучшему сценарию, отражая нестабильность самой задачи, независимо от способа решения. Никакой алгоритм не может дать результат лучше, чем определённый числом обусловленности, разве что случайно. Однако плохо разработанный алгоритм может дать существенно более плохие результаты. Например, как будет упомянуто ниже, задача нахождения собственных значений нормальной матрицы всегда хорошо обусловлена, однако задача нахождения корней многочлена может быть . Такие алгоритмы вычисления собственных значений, которые работают путём нахождения корней характеристического многочлена, могут оказаться плохо обусловленными, даже если сама задача хорошо обусловлена.
Для задачи решения системы линейных уравнений A v = b , где A является обратимой, число обусловленности κ ( A -1 , b ) определяется выражением || A || op || A -1 || op , где || || op — операторная норма , подчинённая обычной евклидовой норме на C n . Поскольку это число не зависит от b и является тем же самым как для A , так и для A -1 , оно обычно называется числом обусловленности κ ( A ) матрицы A . Это значение κ ( A ) является также абсолютным значением отношения наибольшего собственного значения матрицы A к её наименьшему собственному значению. Если A является унитарной , то || A || op = || A -1 || op = 1 , так что κ ( A ) = 1 . В общем случае для матриц часто сложно вычислить операторную норму. По этой причине обычно используют другие нормы матрицы для оценки числа обусловленности.
Для задачи вычисления собственных значений , что если λ является собственным значением диагонализируемой n × n матрицы A с матрицей собственных векторов V , то абсолютная ошибка вычисления λ ограничена произведением κ ( V ) и абсолютной ошибкой в A : . Как следствие, число обусловленности для вычисления λ равно κ (λ, A ) = κ ( V ) = || V || op || V -1 || op . Если матрица A нормальна, то V является унитарной и κ (λ, A ) = 1 . Таким образом, задача вычисления собственных значений нормальных матриц хорошо обусловлена.
Было показано, что число обусловленности задачи вычисления собственного подпространства нормальной матрицы A , соответствующего собственному значению λ , обратно пропорционально минимальному расстоянию между λ и другими, отличными от λ , собственными значениями матрицы A . В частности, задача определения собственного подпространства для нормальных матриц хорошо обусловлена для изолированных собственных значений. Если собственные значения не изолированы, лучшее, на что мы можем рассчитывать, это определение подпространства всех собственных векторов близлежащих собственных значений.
Любой нормированный многочлен является характеристическим многочленом сопровождающей матрицы , поэтому алгоритм для вычисления собственных значений можно использовать для нахождения корней многочленов. Теорема Абеля — Руффини показывает, что любой такой алгоритм для размерности большей 4 должен либо быть бесконечным, либо вовлекать функции более сложные, чем элементарные арифметические операции или дробные степени. По этой причине алгоритмы, вычисляющие точно собственные значения за конечное число шагов, существуют только для специальных классов матриц. В общем случае алгоритмы являются итеративными , дающими на каждой итерации очередное приближение к решению.
Некоторые алгоритмы дают все собственные значения, другие дают несколько значений или даже всего одно, однако и эти алгоритмы можно использовать для вычисления всех собственных значений. Как только собственное значение λ матрицы A определено, его можно использовать либо для приведения алгоритма к получению другого собственного значения, либо для сведения задачи к такой, которая не имеет λ в качестве решения.
Приведение обычно осуществляется сдвигом: A заменяется на A - μ E для некоторой константы μ . Собственное значение, найденное для A - μ E , должно быть добавлено к μ , чтобы получить собственное значение матрицы A . Например, в степенном методе μ = λ . Итерация степенного метода находит самое большое по абсолютной величине значение, так что даже если λ является приближением к собственному значению, итерация степенного метода вряд ли найдёт его во второй раз. И наоборот, методы, основанные на обратных итерациях находят наименьшее собственное значение, так что μ выбирается подальше от λ в надежде оказаться ближе к какому-нибудь другому собственному значению.
Приведение можно совершить путём сужения матрицы A к пространству столбцов матрицы A - λ E . Поскольку A - λ E вырождена, пространство столбцов имеет меньшую размерность. Алгоритм вычисления собственных значений можно тогда применить к этой суженой матрице. Процесс можно продолжать, пока не будут найдены все собственные значения.
Если алгоритм не даёт к собственные значения, общей практикой является применение алгоритма, основанного на обратной итерации, с приравниванием μ к ближайшей аппроксимации собственного значения. Это быстро приводит к собственному вектору ближайшего к μ собственного значения. Для небольших матриц альтернативой служит использование столбцового подпространства произведения A - λ́ E для каждого из остальных собственных значений λ́.
Поскольку собственными значениями треугольной матрицы являются диагональные элементы, в общем случае не существует конечного метода, подобного исключениям Гаусса , для приведения матрицы к треугольной форме, сохраняя при этом собственные значения, однако можно получить нечто близкое к треугольной матрице. Верхняя матрица Хессенберга — это квадратная матрица, у которой все элементы ниже первой поддиагонали равны нулю. Нижняя матрица Хессенберга — это квадратная матрица, у которой все члены выше первой наддиагонали равны нулю. Матрицы, которые являются как нижними, так и верхними матрицами Хессенберга — это трёхдиагональные матрицы . Матрицы Хессенберга и трёхдиагональные матрицы являются исходными точками многих алгоритмов вычисления собственных значений, поскольку нулевые значения уменьшают сложность задачи. Существует несколько методов сведения матриц к матрицам Хессенберга с теми же собственными значениями. Если исходная матрица симметрична или эрмитова, то результирующая матрица будет трёхдиагональной.
Если нужны только собственные значения, нет необходимости вычислять матрицу подобия, поскольку преобразованная матрица имеет те же собственные значения. Если также нужны и собственные векторы, матрица подобия необходима для преобразования собственных векторов матрицы Хессенберга к собственным векторам исходной матрицы.
Метод | Применим к матрицам | Результат | Цена без матрицы подобия | Цена с матрицей подобия | Описание |
---|---|---|---|---|---|
Преобразования Хаусхолдера | общего вида | матрица Хессенберга | 2 n 3 ⁄ 3 + O ( n 2 ) | 4 n 3 ⁄ 3 + O ( n 2 ) | Отражение каждого столбца относительно подпространства для обнуления нижних элементов столбца. |
Повороты Гивенса | общего вида | матрица Хессенберга | 4 n 3 ⁄ 3 + O ( n 2 ) | Осуществляется плоское вращении для обнуления отдельных элементов. Вращения упорядочены так, что следующие вращения не затрагивают нулевые элементы. | |
Итерации Арнольди | общего вида | матрица Хессенберга | Осуществляется ортогонализация Грама ― Шмидта на подпространствах Крылова . | ||
эрмитова | трёхдиагональная матрица | Итерации Арнольди для эрмитовых матриц. |
Итеративные алгоритмы решают задачу вычисления собственных значений путём построения последовательностей, сходящихся к собственным значениям. Некоторые алгоритмы дают также последовательности векторов, сходящихся к собственным векторам. Чаще всего последовательности собственных значений выражаются через последовательности подобных матриц, которые сходятся к треугольной или диагональной форме, что позволяет затем просто получить собственные значения. Последовательности собственных векторов выражаются через соответствующие матрицы подобия.
Метод | Применим к матрицам | Результат | Цена за один шаг | Сходимость | Описание |
---|---|---|---|---|---|
Степенной метод | общего вида | наибольшее собственное значение и соответствующий вектор | O ( n 2 ) | Линейная | Многократное умножение матрицы на произвольно выбранный начальный вектор с последующей нормализацией. |
Обратный степенной метод | общего вида | ближайшее к μ собственное значение и соответствующий вектор | Линейная | Степенная итерация с матрицей ( A - μ E ) -1 | |
Метод итераций Рэлея | общего вида | ближайшее к μ собственное значение и соответствующий вектор | Кубическая | Степенная итерация с матрицей ( A - μ i E ) -1 , где μ i является отношением Рэлея от предыдущей итерации. | |
Предобусловленная обратная итерация или | положительно определённая вещественная симметричная | ближайшее к μ собственное значение и соответствующий вектор | Обратная итерация с предобуславливанием (приближённое обращение матрицы A ). | ||
Метод деления пополам | вещественная симметричная трёхдиагональная | любое собственное значение | Линейная | Использует метод бисекции для поиска корней характеристического многочлена и свойства последовательности Штурма . | |
Итерации Лагерра | вещественная симметричная трёхдиагональная | любое собственное значение | Кубическая | Использует вычисления корней характеристического многочлена и свойства последовательности Штурма . | |
QR-алгоритм | хессенберга | все собственные значения | O ( n 2 ) | Кубическая | Разложение A = QR , где Q ортогональная, R ― треугольная, затем используется итерация к RQ . |
все собственные значения | 6 n 3 + O ( n 2 ) | ||||
Метод Якоби | вещественная симметричная | все собственные значения | O ( n 3 ) | квадратичная | Использует поворот Гивенса в попытке избавиться от недиагональных элементов. Попытка не удаётся, но усиливает диагональ. |
эрмитова трёхдиагональная | все собственные значения | O ( n 2 ) | Матрица разбивается на подматрицы, которые диагонализируются, затем воссоединяются. | ||
все собственные значения | ( 4 ⁄ 3 ) n 3 + O ( n 2 ) | ||||
Метод гомотопии | вещественная симметричная трёхдиагональная | все собственные значения | O ( n 2 ) | Строится вычисляемая гомотопия. | |
вещественная симметричная | ближайшее к μ собственное значение и соответствующий собственный вектор | Предобусловленная обратная итерация, применённая к ( A - μ E ) 2 | |||
Алгоритм MRRR | вещественная симметричная трёхдиагональная | некоторые или все собственные значения и соответствующие собственные вектора | O ( n 2 ) | «Multiple Relatively Robust Representations» — Осуществляется обратная итерация с разложением LDL T смещённой матрицы. |
Не существует простых алгоритмов прямого вычисления собственных значений для матриц в общем случае, но для многих специальных классов матриц собственные значения можно вычислить прямо. Это:
Поскольку определитель треугольной матрицы является произведением её диагональных элементов, то для треугольной матрицы T . Таким образом, собственные значения T ― это её диагональные элементы.
Если p ― любой многочлен и p ( A ) = 0, то собственные значения матрицы A удовлетворяют тому же уравнению. Если удаётся разложить многочлен p на множители, то собственные значения A находятся среди его корней.
Например, проектор ― это квадратная матрица P , удовлетворяющая уравнению P 2 = P . Корнями соответствующего скалярного полиномиального уравнения λ 2 = λ будут 0 и 1. Таким образом, проектор имеет 0 и 1 в качестве собственных значений. Кратность собственного значения 0 ― это дефект P , в то время как кратность 1 ― это ранг P .
Другой пример ― матрица A , удовлетворяющая уравнению A 2 = α 2 E для некоторого скаляра α . Собственные значения должны быть равны ±α . Операторы проектирования:
удовлетворяют равенствам:
и
Пространства столбцов матриц P + и P - являются подпространствами собственных векторов матрицы A , соответствующими +α и -α , соответственно.
Для размерностей от 2 до 4 существуют использующие радикалы формулы, которые можно использовать для вычисления собственных значений. Для матриц 2×2 и 3×3 это обычная практика, но для матриц 4×4 растущая сложность делает этот подход менее привлекательным.
Для матриц 2×2
характеристический многочлен равен
Собственные значения можно найти как корни квадратного уравнения :
Если определить как расстояние между двумя собственными значениями, легко вычислить:
с подобными формулами для c и d . Отсюда следует, что вычисление хорошо обусловлено, если собственные значения изолированы.
Собственные векторы можно получить, используя теорему Гамильтона — Кэли . Если λ 1 , λ 2 — собственные значения, то ( A - λ 1 E )( A - λ 2 E ) = ( A - λ 2 E )( A - λ 1 E ) = 0 , так что столбцы ( A - λ 2 E ) обнуляются матрицей ( A - λ 1 E ) и наоборот. Предполагая, что ни одна из матриц не равна нулю, столбцы каждой матрицы должны содержать собственные векторы для другого собственного значения (если же матрица нулевая, то A является произведением единичной матрицы на константу и любой ненулевой вектор является собственным).
Например, пусть:
тогда tr( A ) = 4 - 3 = 1 и det( A ) = 4(-3) - 3(-2) = -6 , так что характеристическое уравнение равно
а собственные значения равны 3 и −2. Теперь:
В обеих матрицах столбцы отличаются скалярными коэффициентами, так что можно выбирать любой столбец. Так, (1, -2) можно использовать в качестве собственного вектора, соответствующего собственному значению −2, а (3, -1) в качестве собственного вектора для собственного числа 3, что легко можно проверить умножением на матрицу A .
Если A является матрицей 3×3, то характеристическим уравнением будет:
Это уравнение можно решить с помощью методов Кардано или Лагранжа , но аффинное преобразование матрицы A существенно упрощает выражение и ведёт прямо к тригонометрическому решению . Если A = pB + qE , то A и B имеют одни и те же собственные векторы и β является собственным значением матрицы B тогда и только тогда, когда α = pβ + q является собственным значением матрицы A . Если положить и , получим:
Подстановка β = 2cos θ и некоторое упрощение с использованием тождества cos 3 θ = 4cos 3 θ - 3cos θ сводит уравнение к cos 3 θ = det( B ) / 2 . Таким образом,
Если det( B ) является комплексным числом или больше 2 по абсолютной величине, арккосинус для всех трёх величин k следует брать из одной и той же ветви. Проблема не возникает, если A вещественна и симметрична, приводя к простому алгоритму:
% Given a real symmetric 3x3 matrix A, compute the eigenvalues
p1 = A(1,2)^2 + A(1,3)^2 + A(2,3)^2
if (p1 == 0)
% A is diagonal.
eig1 = A(1,1)
eig2 = A(2,2)
eig3 = A(3,3)
else
q = trace(A)/3
p2 = (A(1,1) - q)^2 + (A(2,2) - q)^2 + (A(3,3) - q)^2 + 2 * p1
p = sqrt(p2 / 6)
B = (1 / p) * (A - q * E) % E is the identity matrix
r = det(B) / 2
% In exact arithmetic for a symmetric matrix -1 <= r <= 1
% but computation error can leave it slightly outside this range.
if (r <= -1)
phi = pi / 3
elseif (r >= 1)
phi = 0
else
phi = acos(r) / 3
end
% the eigenvalues satisfy eig3 <= eig2 <= eig1
eig1 = q + 2 * p * cos(phi)
eig3 = q + 2 * p * cos(phi + (2*pi/3))
eig2 = 3 * q - eig1 - eig3 % since trace(A) = eig1 + eig2 + eig3
end
Снова, собственные векторы A можно получить путём использования теоремы Гамильтона — Кэли . Если α 1 , α 2 , α 3 — различные собственные значения матрицы A , то ( A - α 1 E )( A - α 2 E )( A - α 3 E ) = 0 . Тогда столбцы произведения любых двух из этих матриц содержат собственные векторы третьего собственного значения. Однако если a 3 = a 1 , то ( A - α 1 E ) 2 ( A - α 2 E ) = 0 и ( A - α 2 E )( A - α 1 E ) 2 = 0 . Таким образом, корневое собственное подпространство α 1 натянуто на столбцы A - α 2 E , в то время как обычное собственное подпространство натянуто на столбцы ( A - α 1 E )( A - α 2 E ) . Обычное собственное подпространство α 2 натянуто на столбцы ( A - α 1 E ) 2 .
Например, пусть
Характеристическое уравнение равно
с собственными значениями 1 (кратности 2) и −1. Вычисляем:
а затем
Тогда (-4, -4, 4) является собственным вектором для −1, а (4, 2, -2) является собственным вектором для 1. Векторы (2, 3, -1) и (6, 5, -3) являются корневыми векторами, соответствующими значению 1, любой из которых можно скомбинировать с (-4, -4, 4) и (4, 2, -2) , образуя базис корневых векторов матрицы A .