"

35

[latexpage]

35.1. Không gian hạt nhân

Tìm một cơ sở cho không gian hạt nhân

Phân tích SVD cho phép tính toán một cơ sở trực chuẩn cho không gian hạt nhân của một ma trận. Để hiểu điều này, trước hết ta hãy xem xét một ma trận có dạng

\[\tilde{S} = \begin{pmatrix} 1.3 & 0 & 0 \\ 0 & 2.1 & 0 \end{pmatrix},\]

Không gian hạt nhân của ma trận này có thể được tìm thấy dễ dàng bằng cách giải phương trình [latex]\tilde{S}x=0[/latex]. Ta thu được rằng [latex]x=(x_{1}, x_{2}, x_{3})[/latex] nằm trong không gian hạt nhân khi và chỉ khi hai thành phần đầu tiên của [latex]x[/latex] bằng không:

\[x_{1}=x_{2}=0.\]

Với một ma trận tổng quát [latex]A[/latex], có phân tích SVD như được cho trong định lý SVD thì sao? Vì [latex]U[/latex] là ma trận trực giao, ta có thể nhân trước phương trình không gian hạt nhân [latex]Ax=0[/latex] với [latex]U^{T}[/latex], và giải theo biến "đã được xoay" [latex]\tilde{x} := V^{T}x[/latex]. Ta thu được điều kiện đối với [latex]\tilde{x}[/latex]

\[0 = \tilde{S}\tilde{x} = \left( \begin{array}{c} \sigma_{1}\tilde{x}_{1} \\ \vdots \\ \sigma_{r}\tilde{x}_{r} \\ 0 \\ \vdots \\ 0 \end{array} \right).\]

Điều kiện trên tương đương với việc [latex]r[/latex] thành phần đầu tiên của [latex]\tilde{x}[/latex] bằng không. Vì [latex]x = V\tilde{x}[/latex], điều này tương ứng với việc [latex]x[/latex] thuộc vào bao tuyến tính của [latex]n-r[/latex] cột cuối cùng của [latex]V[/latex]. Lưu ý rằng các cột này tạo thành một tập hợp các véctơ trực giao đôi một, đã được chuẩn hóa, và căng không gian hạt nhân: do đó chúng tạo thành một cơ sở trực chuẩn cho không gian đó.

Định lý: Không gian hạt nhân thông qua SVD
 

Không gian hạt nhân của một ma trận [latex]A[/latex] có phân tích SVD

[latex]A = U\tilde{S}V^{T}, \quad \tilde{S} := \begin{pmatrix} S & 0 \\ 0 & 0 \end{pmatrix}, \quad S = \mathbf{diag}(\sigma_{1},\dots,\sigma_{r}),[/latex]

trong đó [latex]U \in \mathbb{R}^{m \times m}, V \in \mathbb{R}^{n \times n}[/latex] đều là các ma trận trực giao, nhận [latex]n-r[/latex] cột cuối cùng của [latex]V[/latex] làm một cơ sở trực chuẩn.

Ma trận có hạng cột đầy đủ

Các ma trận đơn ánh (hay, có hạng cột đầy đủ) là các ma trận có không gian hạt nhân chỉ gồm [latex]\{0\}[/latex]. Nếu số chiều của không gian hạt nhân là không, thì ta phải có [latex]n=r[/latex]. Do đó, các ma trận có hạng cột đầy đủ là các ma trận có SVD dạng

\[A=U \begin{pmatrix} S \\ 0 \end{pmatrix}V^{T}.\]

35.2. Không gian ảnh và hạng thông qua SVD

Cơ sở của không gian ảnh

Tương tự như không gian hạt nhân, ta có thể biểu diễn không gian ảnh theo phân tích SVD của ma trận [latex]A[/latex]. Thật vậy, không gian ảnh của [latex]A[/latex] là tập hợp các véctơ có dạng

\[Ax=U \begin{pmatrix} S & 0\\ 0 & 0 \end{pmatrix}V^{T}x.\]

trong đó [latex]x \in \mathbb{R}^{n}[/latex]. Vì [latex]V[/latex] là ma trận trực giao, khi [latex]x[/latex] quét khắp [latex]\mathbb{R}^{n}[/latex], thì [latex]\tilde{x} := V^{T}x[/latex] cũng vậy. Phân tích véctơ sau thành hai véctơ con [latex]\tilde{x}=(\tilde{x}_{r},\tilde{x}_{n-r})[/latex], ta thu được rằng không gian ảnh là tập hợp các véctơ [latex]U\tilde{y}[/latex], với

\[\tilde{y} = \begin{pmatrix} S & 0\\ 0 & 0 \end{pmatrix} \begin{pmatrix} \tilde{x}_{r} \\ \tilde{x}_{n-r} \end{pmatrix} = \begin{pmatrix} S\tilde{x}_{r} \\ 0 \end{pmatrix},\]

trong đó [latex]\tilde{x}_{r}[/latex] là một véctơ bất kỳ của [latex]\mathbb{R}^{r}[/latex]. Vì [latex]S[/latex] là ma trận khả nghịch, [latex]z := S\tilde{x}_{r}[/latex] cũng quét khắp [latex]\mathbb{R}^{r}[/latex]. Ta thu được rằng không gian ảnh là tập hợp các véctơ [latex]U\tilde{y}[/latex], trong đó [latex]\tilde{y}[/latex] có dạng [latex](z, 0)[/latex] với [latex]z \in \mathbb{R}^{r}[/latex] bất kỳ. Điều này có nghĩa là không gian ảnh là bao tuyến tính của [latex]r[/latex] cột đầu tiên của ma trận trực giao [latex]U[/latex], và các cột này tạo thành một cơ sở trực chuẩn cho nó. Do đó, số [latex]r[/latex] của các dyad xuất hiện trong phép phân tích SVD thực sự là hạng (số chiều của không gian ảnh).

Định lý: Không gian ảnh và hạng thông qua SVD
 

Không gian ảnh của một ma trận

[latex]A[/latex] có phân tích SVD [latex]A = U\tilde{S}V^{T}, \quad \tilde{S} := \begin{pmatrix} S & 0 \\ 0 & 0 \end{pmatrix}, \quad S = \mathbf{diag}(\sigma_{1},\dots,\sigma_{r}),[/latex]

trong đó [latex]U \in \mathbb{R}^{m \times m}[/latex] và [latex]V \in \mathbb{R}^{n \times n}[/latex] đều là các ma trận trực giao, nhận [latex]r[/latex] cột đầu tiên của [latex]U[/latex] làm một cơ sở trực chuẩn.

Ma trận có hạng hàng đầy đủ

Một ma trận toàn ánh (hay, có hạng hàng đầy đủ) có không gian ảnh [latex]r=m[/latex]. Các ma trận này được đặc trưng bởi một SVD có dạng

\[ A = U \begin{pmatrix} S & 0 \end{pmatrix} V^T. \]

Ví dụ: Không gian ảnh của một ma trận [latex]4 \times 5[/latex].

35.3. Định lý cơ bản của đại số tuyến tính

Định lý đã được đề cập tại đây cho phép phân tích một véctơ bất kỳ thành hai véctơ trực giao, véctơ thứ nhất nằm trong không gian hạt nhân của ma trận [latex]A[/latex], và véctơ thứ hai nằm trong không gian ảnh của ma trận chuyển vị của nó.

Định lý cơ bản của đại số tuyến tính
 

Cho [latex]A \in \mathbb{R}^{m \times n}[/latex]. Các tập hợp [latex]\mathbf{N}(A)[/latex] và [latex]\mathbf{R}(A^{T})[/latex] tạo thành một phép phân tích trực giao của [latex]\mathbb{R}^{n}[/latex], theo nghĩa là một véctơ bất kỳ [latex]x \in \mathbb{R}^{n}[/latex] có thể được viết là

[latex]x = y+z, \quad y \in \mathbf{N}(A), \quad z \in \mathbf{R}(A^{T}), \quad y^{T}z = 0.[/latex]

Đặc biệt, ta thu được rằng điều kiện để một véctơ [latex]x[/latex] trực giao với mọi véctơ trong không gian hạt nhân suy ra rằng nó phải nằm trong không gian ảnh:

\[x^{T}y = 0 \text{ whenever } Ay=0 \; \Longleftrightarrow \; \exists \lambda \in \mathbb{R}^{m}: x = A^{T}\lambda.\]

Chứng minh.

35.4. Chuẩn ma trận và số điều kiện

Chuẩn ma trận hữu ích để đo độ lớn của một ma trận. Một số trong chúng có thể được diễn giải theo các tính chất đầu vào-đầu ra của ánh xạ tuyến tính tương ứng; ví dụ, chuẩn Frobenius đo lường phản ứng trung bình đối với các véctơ đơn vị, trong khi chuẩn giá trị kỳ dị lớn nhất (LSV) đo lường độ lợi đỉnh. Hai chuẩn này có thể được đọc dễ dàng từ SVD.

Chuẩn Frobenius

Chuẩn Frobenius có thể được định nghĩa là

\[||A||_{F} = \sqrt{\mathbf{Tr} A^{T}A}\]

Sử dụng phân tích SVD [latex](U, \tilde{S}, V)[/latex] của [latex]A[/latex], ta thu được

\[||A||_{F}^{2} = \mathbf{Tr}(V\tilde{S}^{T}\tilde{S}V^{T})=\mathbf{Tr}(V^{T}V\tilde{S}^{T}\tilde{S})=\mathbf{Tr}(\tilde{S}^{T}\tilde{S})=\sum_{i=1}^{r}\sigma_{i}^{2}.\]

Do đó, bình phương chuẩn Frobenius không gì khác hơn là tổng bình phương của các giá trị kỳ dị.

Chuẩn giá trị kỳ dị lớn nhất

Một cách khác để đo độ lớn của ma trận là dựa trên việc tìm tỷ lệ lớn nhất của chuẩn đầu ra so với chuẩn đầu vào. Khi chuẩn được sử dụng là chuẩn Euclid, đại lượng tương ứng

\[||A||_{LSV} := \max_{x : \; ||x||_{2} \le 1}||Ax||_{2}\]

được gọi là chuẩn giá trị kỳ dị lớn nhất (LSV). Lý do cho cách gọi này được cho bởi định lý sau.

Định lý: Chuẩn giá trị kỳ dị lớn nhất

Với một ma trận [latex]A[/latex] bất kỳ,

\[||A||_{LSV} := \max_{x :  \; ||x||_{2} \le 1}||Ax||_{2} = \sigma_{1}(A),\]

trong đó [latex]\sigma_{1}(A)[/latex] là giá trị kỳ dị lớn nhất của [latex]A[/latex]. Bất kỳ véctơ kỳ dị trái nào tương ứng với giá trị kỳ dị này đều đạt được giá trị lớn nhất trong biểu thức trên.

Số điều kiện

Số điều kiện của một ma trận khả nghịch [latex]A[/latex] cỡ [latex]n \times n[/latex] là tỷ lệ giữa giá trị kỳ dị lớn nhất và nhỏ nhất:

[latex]\kappa(A)=\dfrac{\sigma_{1}}{\sigma_{n}}=||A||_{LSV}\cdot||A^{-1}||_{LSV}.[/latex]

Trong phần tiếp theo, con số này sẽ cung cấp một thước đo về độ nhạy của nghiệm của một hệ phương trình tuyến tính đối với những thay đổi trong [latex]A[/latex].

License

Icon for the Public Domain license

This work (Đại số tuyến tính by Tony Tin) is free of known copyright restrictions.