안녕하세요. 지난 포스팅의 선형대수학 - 대각화 2에서는 중복되는 고유값을 가지는 경우에 대각화 가능성에 대해서 이야기하였습니다. 오늘은 선형대수학에서 중요한 정리 중 하나인 케일리-해밀턴 정리 (Cayley-Hamilton Theorem)에 대해서 이야기해보도록 하겠습니다.
정의1. $T$ 불변 부분공간 ($T$-invariant subspace)
$T$를 벡터공간 $V$ 상에서의 선형 연산자라고 하자. $V$의 부분공간 $W$가 $T(W) \subseteq W$ 즉, 모든 $v \in W$에 대해서 $T(v) \in W$를 만족하면 부분공간 $W$를 $T$ 불변 부분공간이라고 한다.
Let $T$ be a linear operator on a vector space $V$. A subspace $W$ of $V$ is called a $T$-invariant subspace of $V$ if $T(W) \subseteq W$, that is, if $T(v) \in W$ for all $v \in W$.
설명
간단한 예를 들어보도록 하겠습니다. $T$가 $\mathbb{R}^{3}$ 상에서 선형 연산자라고 가정하겠습니다. 즉, $T(a, b, c) = (a + b, b + c, 0)$이라고 정의하도록 하겠습니다. 그러면 $xy$ 평면인 $W_{1} = \{(x, y, 0) | x, y \in \mathbb{R}\}$은 임의의 벡터 $(a, b, 0) \in W_{1}$을 가져오더라도 $T(a, b, 0) = (a + b, b, 0) \in W_{1}$을 만족하기 때문에 $W_{1}$은 $T$ 불변 부분공간이 됩니다. 그렇다면 $x$축인 $W_{2} = \{(x, 0, 0) | x \in \mathbb{R}\}$은 어떨까요? 이 역시 임의의 벡터 $(a, 0, 0) \in W_{2}$에 대해서 $T(a, 0, 0) = (a, 0, 0) \in W_{2}$를 만족하기 때문에 $W_{2}$는 $T$ 불변 부분공간이 됩니다. 하지만, $z$축인 $W_{3} = \{(0, 0, z) | z \in \mathbb{R}\}$을 고려하면 임의의 벡터 $(0, 0, c) \in W_{3}$에 대해서 $T(0, 0, c) = (0, c, 0) \notin W_{3}$이기 때문에 $W_{3}$는 $T$ 불변 부분공간이 아닙니다.
정의2. $T$ 순환 부분공간 ($T$-cyclic subspace)
$T$를 벡터공간 $V$ 상에서의 선형 연산자, $\mathbf{x}$를 벡터공간 $V$의 0이 아닌 벡터라고 하면 아래의 부분공간을 $\mathbf{x}$에 의해 생성된 벡터공간 $V$의 $T$ 순환 부분공간이라고 한다.
$$W = \text{span} \left( \{ \mathbf{x}, T(\mathbf{x}), T^{2}(\mathbf{x}), \dots \} \right)$$
Let $T$ be a linear operator on a vector space $V$, and let $\mathbf{x}$ be a nonzero vector in $V$. The subspace
$$W = \text{span} \left( \{ \mathbf{x}, T(\mathbf{x}), T^{2}(\mathbf{x}), \dots \} \right)$$
is called the $T$-cyclic subspace of $V$ generated by $\mathbf{x}$.
설명
오늘 가장 중요한 케일리-해밀턴 정리의 기본 개념이 바로 정의2에서 설명한 $T$ 순환 부분공간입니다. 간단한 예를 통해 이해해보겠습니다.
$T$를 $\mathbf{R}^{3}$ 상에서 $T(a, b, c) = (-b + c, a + c, 3c)$로 정의된 선형연산자라고 하겠습니다. 그러면 처음에 $\mathbf{R}^{3}$ 상의 벡터인 $e_{1} = (1, 0 ,0)$을 선택하도록 하겠습니다. 정의2에 따라서 다음과 같이 연산을 수행합니다.
$$T(e_{1}) = T(1, 0, 0) = (0, 1, 0) = e_{2}$$
$$T(T(e_{1})) = T(e_{2}) = T(0, 1, 0) = (-1, 0, 0)$$
$$T(T(T(e_{1}))) = T(T(e_{2})) = T(-1, 0, 0) = (0, -1, 0)$$
$$T(T(T(T(e_{1})))) = T(T(T(e_{2}))) = T(T(-1, 0, 0)) = T(0, -1, 0) = (1, 0, 0) = e_{1}$$
즉, $\text{span} \left( \{ e_{1}, T(e_{1}), T^{2}(e_{1}), \dots \} \right) = \text{span} \left( \{ e_{1}, e_{2} \} \right) = \{(s, t, 0) | s, t \in \mathbb{R}\}$이 성립함을 알 수 있습니다. 따라서, $xy$ 평면은 벡터 $e_{1}$에 의해 생성되는 $T$ 순환 부분공간입니다.
다른 예시로 미분 연산자를 생각해보겠습니다. 이를 위해 $T$를 다항공간 $P(\mathbb{R})$ 상에서 정의된 선형연산자로 $T(f(x)) = f^{'}(x)$와 같이 정의된다고 가정하겠습니다. 그러면 $x^{2}$에 의해 생성되는 $T$ 순환 부분공간은 다음과 같습니다.
$$\text{span} \left( \{ x^{2}, T(x^{2}), T^{2}(x^{2}), \dots \} \right) = \text{span} \left( \{ x^{2}, 2x, 2 \} \right) = P_{2}(\mathbb{R})$$
즉, 2차 다항식은 $x^{2}$에 의해 생성되는 $T$ 순환 부분공간입니다.
여기서, 한가지 재밌는 사실은 $T$ 순환 부분공간이 벡터공간 $V$ 내에서 벡터 $\mathbf{x}$를 포함하는 가장 작은 $T$ 불변 부분공간이라는 점 입니다.
정리1
$T$를 유한 차원의 벡터공간 $V$에서 정의된 선형 연산자, 그리고 $W$를 벡터공간 $V$의 $T$ 불변 부분공간이라고 하자. 그러면 $T_{W}$의 특성 다항식은 $T$의 특성 다항식을 나눌 수 있다.
증명
부분공간 $W$의 순서 기저 $\gamma = \{ v_{1}, \dots, v_{k} \}$를 선택하자. 이때, $W$는 $V$의 부분공간이기 때문에 $W$의 순서 기저 $\gamma$를 확장하여 $V$의 순서 기저인 $\beta = \{ v_{1}, \dots, v_{k}, v_{k + 1}, \dots, v_{n} \}$으로 만들 수 있다. 순서기저 $\beta$에 대한 선형 연산자 $T$의 행렬표현을 $A = [T]_{\beta}$, 순서기저 $\gamma$에 대한 선형 연산자 $T_{W}$의 행렬표현을 $B_{1} = [T_{W}]_{\gamma}$라고 하면 행렬 $A$를 다음과 같이 쓸 수 있다.
$$A = \begin{pmatrix} B_{1} & B_{2} \\ O & B_{3} \end{pmatrix}$$
여기서, $f(t)$를 선형 연산자 $T$의 특성 다항식, $g(t)$를 선형 연산자 $T_{W}$의 특성 다항식이라고 정의하자. 그러면 특성 다항식의 정의에 의해 다음과 같이 쓸 수 있다.
$$\begin{align*} f(t) &= \text{det} (A - tI_{n}) \\ &= \text{det} \begin{pmatrix} B_{1} - tI_{k} & B_{2} \\ O & B_{3} - tI_{n - k} \end{pmatrix} \\ &= g(t) \cdot \text{det} (B_{3} - t I_{n - k}) \end{align*}$$
따라서, $g(t)$는 $f(t)$를 나눌 수 있다.
간단한 예시를 들어보도록 하겠습니다. $T$를 $\mathbb{R}^{4}$ 상에서의 선형 연산자로 다음과 같이 정의된다고 하겠습니다.
$$T(a, b, c, d) = (a + b + 2c - d, b + d, 2c - d, c + d)$$
그리고 $W = \{ (t, s, 0, 0) | t, s \in \mathbb{R} \}$이라고 하겠습니다. 이때, 임의의 벡터 $(a, b, 0, 0) \in W$에 대해서 $T(a, b, 0, 0) = (a + b, 0, 0) \in W$이기 때문에 $W$는 벡터공간 $\mathbb{R}^{4}$의 $T$ 불변 부분공간입니다.
여기서, $\gamma = \{ e_{1}, e_{2} \}$를 부분공간 $W$의 순서기저, 그리고 이를 확장하여 $\mathbb{R}^{4}$의 순서기저를 $\beta$라고 정의하면 다음과 같이 쓸 수 있습니다.
$$B_{1} = [T_{W}]_{\gamma} = \begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}$$
$$A = [T]_{\beta} = \begin{pmatrix} 1 & 1 & 2 & -1 \\ 0 & 1 & 0 & 1 \\ 0 & 0 & 2 & -1 \\ 0 & 0 & 1 & 1 \end{pmatrix}$$
이때, $f(t)$를 선형연산자 $T$의 특성 다항식이라고 두고 $g(t)$를 선형연산자 $T_{W}$의 특성 다항식으로 두면 다음과 정리1에 의해 다음과 같이 쓸 수 있습니다.
$$\begin{align*} f(t) &= \text{det} (A - t I_{4}) \\ &= \text{det} \begin{pmatrix} 1 - t & 1 & 2 & -1 \\ 0 & 1 - t & 0 & 1 \\ 0 & 0 & 2 - t & -1 \\ 0 & 0 & 1 & 1 - t \end{pmatrix} \\ &= \text{det} \begin{pmatrix} 1 - t & 1 \\ 0 & 1 - t \end{pmatrix} \cdot \text{det} \begin{pmatrix} 2 - t & -1 \\ 1 & 1 - t \end{pmatrix} \\ &= g(t) \cdot \text{det} \begin{pmatrix} 2 - t & -1 \\ 1 & 1 - t \end{pmatrix}\end{align*}$$
정리2
$T$를 유한 차원의 벡터공간 $V$에서 정의된 선형 연산자, 그리고 $W$를 영이 아닌 벡터 $\mathbf{x}$에 의해 생성된 벡터공간 $V$의 $T$ 순환 부분공간이라고 하자. 그리고 $k = \text{dim} (W)$라고 하면 다음이 성립한다.
(a). $\{ v, T(v), T^{2}(v), \dots, T^{k - 1}(v) \}$는 부분공간 $W$의 기저이다.
(b), 만약 $a_{0}v + a_{1}T(v) + \cdots + a_{k - 1}T^{k - 1} (v) = 0$을 만족하면 $T_{W}$의 특성 다항식 $f(t)$는 다음과 같다.
$$f(t) = (-1)^{k} ( a_{0} + a_{1} t + \cdots + a_{k - 1} t^{k - 1} + t^{k} )$$
증명
(a). $v \neq 0$이기 때문에 $\{ v \}$는 선형독립이다. 그리고, $j$를 아래 집합이 선형독립이 되는 가장 큰 양의 정수라고 하자.
$$\beta = \{ v, T(v), \dots, T^{j - 1}(v) \}$$
이때, $V$는 유한 차원의 벡터공간이기 때문에 $j$는 반드시 존재한다. 다음으로 $Z = \text{span} (\beta)$라고 하자. 그러면 $\beta$는 기저의 정의에 의해 $Z$의 기저이다. 또한, $T^{j}(v) \in Z$이므로 $Z$는 벡터공간 $V$의 $T$ 불변 부분공간임을 증명할 수 있다. 임의의 벡터 $\mathbf{w} \in Z$를 선택한다. 여기서, $\mathbf{w}$는 기저 $\beta$의 선형결합으로 표현할 수 있기 때문에 다음과 같이 쓸 수 있다.
$$\mathbf{w} = b_{0} v + b_{1} T(v) + \cdots + b_{j - 1} T^{j - 1}(v)$$
따라서, 다음과 같이 쓸 수 있다.
$$T(\mathbf{w}) = b_{0} T(v) + b_{1} T^{2}(v) + \cdots + b_{j - 1} T^{j} (v)$$
즉, $T(w)$는 벡터공간 $Z$의 원소들의 선형결합으로 표현할 수 있기 때문에 $Z$에 속한다. 따라서, $Z$는 $T$ 불변 부분공간이다. 게다가, $v \in Z$이다. 여기서, $T$ 순환 부분공간 $W$는 벡터 $v$를 포함하는 벡터공간 $V$의 가장 작은 $T$ 불변 부분공간이기 때문에 $W \subseteq Z$이다. 그 역방향은 자명하므로 $Z = W$이다. 이는 $\beta$가 부분공간 $W$의 기저임을 증명하며 $\text{dim} (W) = j$이므로 $j = k$임을 의미하므로 (a)가 증명된다.
(b). (a)에 의해 $\beta$를 부분공간 $W$의 순서기저라고 볼 수 있다. 이제 $a_{0}, \dots, a_{k - 1}$를 아래의 시글 만족하는 스카라라고 가정하자.
$$a_{0} v + a_{1} T(v) + \cdots + a_{k - 1} T^{k - 1}(v) + T^{k}(v) = 0$$
그러면 선형변환의 행렬표현에 의해 다음과 같이 쓸 수 있다.
$$[T_{W}]_{\beta} = \begin{pmatrix} 0 & 0 & \cdots & 0 & -a_{0} \\ 1 & 0 & \cdots & 0 & -a_{1} \\ \vdots & \vdots & \ddots & \vdots & \vdots \\ 0 & 0 & \cdots & 1 & -a_{k - 1} \end{pmatrix}$$
이때, 주어진 행렬은 다음의 특성 다항식을 갖는다.
$$f(t) = (-1)^{k} (a_{0} + a_{1} t + \cdots + a_{k - 1} t^{k - 1} + t^{k})$$
따라서, $f(t)$는 $T_{W}$의 특성 다항식이므로 (b)가 증명된다.
간단한 예시를 들어보도록 하겠습니다. 이전에 보았던 예시를 그대로 사용하도록 하겠습니다. $T$를 $\mathbf{R}^{3}$ 상에서 $T(a, b, c) = (-b + c, a + c, 3c)$로 정의된 선형연산자라고 하겠습니다. 그리고 $W = \text{span} (\{ e_{1}, e_{2} \})$라고 두겠습니다. 그러면 $W$는 $e_{1}$에 의해 생성되는 $T$ 순환 부분공간이 됩니다. 저희는 이제부터 선형 변환 $T_{W}$의 특성 다항식을 구할 때 두 가지 방법으로 시도해볼 수 있습니다.
(a). 정리2 사용
이전에 예시에 의해 $\{e_{1}, e_{2}\}$는 부분공간 $W$를 생성할 수 있음을 알 수 있습니다. 그리고 $T^{2}(e_{1}) = -e_{1}$인 것도 알고 있죠. 따라서, 다음의 식이 성립합니다.
$$1 \cdot e_{1} + 0 \cdot T(e_{1}) + T^{2} (e_{1}) = 0$$
따라서, 정리2의 (b)에 의해 $f(t) = (-1)^{2} (1 + 0 \cdot t + t^{2}) = t^{2} + 1$인 선형변환 $T_{W}$의 특성 다항식을 얻을 수 있습니다.
(b). 행렬식 사용
$\beta = \{ e_{1}, e_{2} \}$라고 두겠습니다. 그러면 $\beta$는 부분공간 $W$의 순서 기저가 됩니다. 그리고 $T(e_{1}) = e_{2}$ 이고 $T(e_{2}) = -e_{1}$를 만족하기 때문에 선형변환의 행렬표현에 의해 다음과 같이 쓸 수 있습니다.
$$[T_{W}]_{\beta} = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$$
따라서, 특성 다항식의 정의에 의해 다음과 같이 구할 수 있습니다.
$$f(t) = \text{det} \begin{pmatrix} -t & -1 \\ 1 & -t \end{pmatrix} = t^{2} + 1$$
두 방식 모두 동일한 특성 다항식을 얻을 수 있습니다. 하지만, 선형변환이 정의된 벡터공간의 차원이 굉장히 크면 행렬식을 사용할 때 계산량이 굉장히 많아집니다. 하지만, 만약 부분공간 $W$가 $T$ 순환 부분공간임이 증명만 된다면 굳이 행렬식을 사용하지 않기 때문에 아주 쉽게 구할 수 있습니다.
정리3. 케일리-해밀턴 정리 (Cayley-Hamilton Theorem)
$T$를 유한 차원의 벡터공간 $V$에서 정의된 선형 연산자라고 두고 $f(t)$를 선형 연산자 $T$의 특성 다항식이라고 정의하자. 그러면 $f(T) = T_{0}$로 영변환을 만족한다. 즉, $T$는 특성 다항식의 해를 만족한다.
증명
케일리-해밀턴 정리를 증명하기 위해서는 임의의 벡터 $v \in V$에 대해서 $f(T)(v) = 0$을 만족함을 보여야합니다. 이를 위해 두 가지 케이스로 나누어서 증명하도록 하겠습니다.
CASE1. $v = 0$인 경우
이 경우 $f(T)$가 선형이기 때문에 자명하게 $f(T)(v) = 0$을 만족한다.
CASE2. $v \neq 0$인 경우
$W$를 $v$에 의해 생성된 $T$ 순환 부분공간이라고 가정하자. 그리고 $\text{dim} (W) = k$라고 두자. 정리2.(a)에 의해 $a_{0}, \dots, a_{k - 1}$은 다음 식을 만족하는 스칼라이다.
$$a_{0} v + a_{1} T(v) + \cdots + a_{k - 1} T^{k - 1}(v) + T^{k}(v) = 0$$
따라서, 정리2.(b)에 의해 $T_{W}$의 특성 다항식 $g(t)$를 구할 수 있다.
$$g(t) = (-1)^{k} (a_{0} + a_{1} t + \cdots + a_{k - 1} t^{k - 1} + t^{k})$$
이제 $t$에 선형 변환 $T$를 대입하여 다음과 같이 쓸 수 있다.
$$g(T)(v) = (-1)^{k} (a_{0} I + a_{1} T + a_{2} T^{2} + \cdots + a_{k - 1} T^{k - 1} + T^{k}) (v) = 0$$
여기서, $W$는 $T$ 순환 부분공간이기 때문에 벡터 $v$를 포함하는 벡터공간 $V$의 가장 작은 $T$ 불변 부분공간이다. 따라서, 정리1에 의해 $T_{W}$의 특성 다항식인 $g(t)$은 $T$의 특성 다항식인 $f(t)$를 나눌 수 있다. 이는 나머지-몫의 정리에 의해 $f(t) = q(t) g(t)$를 만족하는 다항식 $q(t)$가 존재한다. 따라서, 다음과 같이 쓸 수 있다.
$$ f(T)(v) = q(T) g(T) (v) = q(T) (g(T)(v)) = q(T)(0) = 0 $$
모든 $v \in V$에 대해서 $f(T) (v) = 0$을 만족하므로 $f(T) = T_{0}$임이 증명된다.
즉, 케일리-해밀턴 정리는 기존의 특성 다항식이 스칼라에만 국한되는 것이 아니라 선형 변환 $T$를 대입해도 성립한다는 것을 보여주고 있습니다. 이는 선형 변환이 아닌 행렬로 바꾸어서 설명해도 동일하게 성립합니다. 간단한 예시를 들어보도록 하겠습니다. 선형 변환 $T$를 $\mathbb{R}^{2}$에서 $T(a, b) = (a + 2b, -2a + b)$로 정의되었다고 가정하겠습니다. 그리고 $\beta = \{ e_{1}, e_{2} \}$라고 두면 주어진 선형변환의 행렬표현은 다음과 같습니다.
$$A = [T]_{\beta} = \begin{pmatrix} 1 & 2 \\ -2 & 1 \end{pmatrix}$$
따라서, 선형 변환 $T$의 특성 다항식은 다음과 같습니다.
$$f(t) = \text{det} (A - tI) = \text{det} \begin{pmatrix} 1 - t & 2 \\ -2 & 1 - t \end{pmatrix} = t^{2} - 2t + 5$$
그러면 특성 다항식 $f(t)$에 $A$를 대입해보도록 하겠습니다.
$$\begin{align*} f(A) &= A^{2} - 2A + 5I \\ &= \begin{pmatrix} -3 & 4 \\ -4 & -3 \end{pmatrix} + \begin{pmatrix} -2 & -4 \\ 4 & -2 \end{pmatrix} + \begin{pmatrix} 5 & 0 \\ 0 & 5 \end{pmatrix} \\ &= \begin{pmatrix} 0 & 0 \\ 0 & 0 \end{pmatrix} \end{align*}$$
즉, $f(A) = 0$을 알 수 있죠.
따름정리3-1. 행렬에 대한 케일리-해밀턴 정리 (Cayley-Hamilton Theorem for Matrix)
$A$를 $n \times n$ 크기의 행렬, $f(t)$를 행렬 $A$의 특성 다항식이라고 정의하자. 그러면 $f(A) = O$을 만족한다. 여기서, $O$은 $n \times n$ 크기의 영행렬이다.
참고문헌
Linear Algebra (Stephan. H)
'수학 > 선형대수학' 카테고리의 다른 글
선형대수학 - 노름과 직교성 (0) | 2023.08.01 |
---|---|
선형대수학 - 내적과 내적공간 (0) | 2023.07.19 |
선형대수학 - 대각화 2 (0) | 2023.03.05 |
선형대수학 - 대각화 1 (0) | 2023.03.05 |
선형대수학 - 고유값과 고유벡터 2 (0) | 2023.02.17 |