Giải hệ phương trình tuyến tính bằng SVD

Tony Tin

36 36.1. Tập nghiệm

Xét hệ phương trình tuyến tính

\[ Ax = y, \]

trong đó [latex]A \in \mathbb{R}^{m\times n}[/latex] và [latex]y \in \mathbb{R}^m[/latex] là các dữ liệu đã cho. Ta có thể mô tả hoàn toàn tập hợp các nghiệm thông qua SVD, như sau. Giả sử rằng [latex]A[/latex] có một phân tích SVD được cho tại đây. Với [latex]A = U\tilde{S}V^T[/latex], ta nhân trước hệ phương trình tuyến tính với ma trận nghịch đảo của [latex]U[/latex], là [latex]U^T[/latex]; sau đó ta biểu diễn phương trình theo véctơ đã được xoay [latex]\tilde{x} = V^Tx[/latex]. Điều này dẫn đến

\[ \tilde{S}\tilde{x}=\tilde{y}, \]

trong đó [latex]\tilde{y} := U^Ty[/latex] là vế phải "đã được xoay" của phương trình.

Do dạng đơn giản của [latex]\tilde{S}[/latex], biểu thức trên được viết là

\[ \begin{aligned} \sigma_i \tilde{x}_i &= \tilde{y}_i, & i &= 1, \ldots, r, \\ 0 &= \tilde{y}_i, & i &= r+1, \ldots, m. \end{aligned} \]

Hai trường hợp có thể xảy ra:

Nếu [latex]m-r[/latex] thành phần cuối của [latex]\tilde{y}[/latex] không bằng không, thì hệ trên là vô nghiệm, và tập nghiệm là rỗng. Điều này xảy ra khi [latex]y[/latex] không thuộc không gian ảnh của [latex]A[/latex].
Nếu [latex]y[/latex] thuộc không gian ảnh của [latex]A[/latex], thì tập hợp các điều kiện cuối cùng trong hệ trên được thỏa mãn, và ta có thể giải tìm [latex]\tilde{x}[/latex] với tập hợp các điều kiện đầu tiên:

\[ \tilde{x}_i = \frac{\tilde{y}_i}{\sigma_i}, \quad i = 1,\ldots, r. \]

[latex]n-r[/latex] thành phần cuối của [latex]\tilde{x}[/latex] là tự do. Điều này tương ứng với các phần tử trong không gian hạt nhân của [latex]A[/latex]. Nếu [latex]A[/latex] có hạng cột đầy đủ (không gian hạt nhân của nó chỉ gồm [latex]\{0\}[/latex]), thì có một nghiệm duy nhất.

36.2. Ma trận giả nghịch

Định nghĩa

Tập nghiệm có thể được mô tả một cách thuận tiện thông qua ma trận giả nghịch của [latex]A[/latex], ký hiệu là [latex]A^\dagger[/latex], và được định nghĩa thông qua SVD của [latex]A[/latex]:

\[ A = U \tilde{S} V^T, \quad \tilde{S} = \textbf{diag}(\sigma_1,\ldots,\sigma_r,0,\ldots,0), \]

là ma trận có cùng SVD, với các giá trị kỳ dị khác không được nghịch đảo, và ma trận [latex]\tilde{S}[/latex] được chuyển vị:

[latex]A^\dagger := V \tilde{S}^\dagger U^T, \quad \tilde{S}^\dagger = \textbf{diag}(\sigma_1^{-1},\ldots,\sigma_r^{-1},0,\ldots,0).[/latex]

Ma trận giả nghịch của một ma trận luôn được định nghĩa rõ ràng, và nó có cùng kích thước với ma trận chuyển vị [latex]A^T[/latex]. Khi ma trận là khả nghịch (là ma trận vuông và có hạng cột hoặc hàng đầy đủ: [latex]m=n=r[/latex]), thì nó thu gọn về ma trận nghịch đảo.

Ví dụ: ma trận giả nghịch của một ma trận \( 4 \times 5 \).

Mối liên hệ với tập nghiệm

Từ những phân tích ở trên, ta thấy rằng tập nghiệm có thể được viết dưới dạng

\[ \mathbf{S} = \left\{ A^\dagger y + z :~ z \in \mathbf{N}(A) \right\}, \]

trong đó [latex]\mathbf{N}(A)[/latex] là không gian hạt nhân của [latex]A[/latex]. Cả [latex]A^\dagger[/latex] và một cơ sở cho không gian hạt nhân đều có thể được tính toán thông qua SVD.

Trường hợp [latex]A[/latex] có hạng đầy đủ

Nếu [latex]A[/latex] có hạng cột đầy đủ, ma trận giả nghịch có thể được viết là

\[ A^\dagger = (A^T A)^{-1} A^T. \]

Trong trường hợp đó, [latex]A^\dagger[/latex] là một ma trận nghịch đảo trái của [latex]A[/latex], vì [latex]A^\dagger A = I_n[/latex].

Nếu [latex]A[/latex] có hạng hàng đầy đủ, thì ma trận giả nghịch có thể được viết là

\[ A^\dagger = A^T (A A^T)^{-1}. \]

Trong trường hợp đó, [latex]A^\dagger[/latex] là một ma trận nghịch đảo phải của [latex]A[/latex], vì [latex]A A^\dagger = I_m[/latex].

36.3. Phân tích độ nhạy và số điều kiện

Phân tích độ nhạy đề cập đến quá trình định lượng tác động của những thay đổi trong các hệ số của hệ phương trình tuyến tính (ma trận [latex]A[/latex] và véctơ [latex]y[/latex]) đối với nghiệm. Để đơn giản, ta hãy giả sử rằng [latex]A[/latex] là ma trận vuông và khả nghịch, và chỉ phân tích ảnh hưởng của sai số trong [latex]y[/latex]. Số điều kiện của ma trận [latex]A[/latex] định lượng điều này.

Ta bắt đầu từ hệ phương trình tuyến tính ở trên, có nghiệm duy nhất [latex]x = A^{-1} y[/latex]. Bây giờ giả sử rằng [latex]y[/latex] được thay đổi thành [latex]y + \delta y[/latex], trong đó [latex]\delta y[/latex] là một véctơ chứa những thay đổi trong [latex]y[/latex]. Ta ký hiệu nghiệm mới là [latex]x + \delta x[/latex], là [latex]A^{-1} (y + \delta y)[/latex]. Từ các phương trình:

\[ \delta x = A^{-1} \delta y, \]

và sử dụng định nghĩa của chuẩn giá trị kỳ dị lớn nhất, ta thu được:

[latex]\|\delta x\|_2 \leq \|A^{-1}\|_{LSV} \cdot \|\delta y\|_2, \quad \|y\|_2 \leq \|A\|_{LSV} \cdot \|x\|_2.[/latex]

Kết hợp hai bất đẳng thức ta được:

\[ \frac{\|\delta x\|_2}{\|x\|_2} \leq \kappa(A) \cdot \frac{\|\delta y\|_2}{\|y\|_2}, \]

trong đó [latex]\kappa(A)[/latex] là số điều kiện của [latex]A[/latex], được định nghĩa là:

\[ \kappa(A) := \|A\| \cdot \|A^{-1}\|. \]

Ta có thể biểu diễn số điều kiện dưới dạng tỷ lệ giữa giá trị kỳ dị lớn nhất và nhỏ nhất của [latex]A[/latex]:

\[ \kappa(A) = \frac{\sigma_1(A)}{\sigma_n(A)}. \]

Số điều kiện đưa ra một chặn trên cho tỷ lệ giữa sai số tương đối ở vế phải và sai số tương đối của nghiệm. Ta cũng có thể phân tích ảnh hưởng của sai số trong chính ma trận đối với nghiệm. Số điều kiện cũng đóng một vai trò quan trọng ở đó.

License

Icon for the Public Domain license

This work (Đại số tuyến tính by Tony Tin) is free of known copyright restrictions.

36.1. Tập nghiệm