Sự tồn tại và tính duy nhất nghiệm

Tony Tin

19 19.1. Tập hợp nghiệm của một phương trình tuyến tính

Xét phương trình tuyến tính theo biến [latex]x \in \mathbb{R}^n[/latex]:

[latex]\begin{align*}Ax = y,\end{align*}[/latex]

trong đó [latex]A \in \mathbb{R}^{m \times n}[/latex] và [latex]y \in \mathbb{R}^m[/latex] cho trước, và [latex]x \in \mathbb{R}^n[/latex] là ma trận biến.

Tập hợp nghiệm của phương trình trên, nếu không rỗng, là một không gian con tịnh tiến. Tức là, nó có dạng [latex]x_0 + L[/latex] trong đó [latex]L[/latex] là một không gian con.

Chúng ta mong muốn

xác định xem nghiệm có tồn tại không;
nếu có, xác định xem nó có duy nhất không;
tính một nghiệm [latex]x_0[/latex] nếu có;
tìm một cơ sở trực chuẩn của không gian con [latex]L[/latex].

19.2. Sự tồn tại: ảnh và hạng của một ma trận

Ảnh

Ảnh (hay, không gian cột) của một ma trận [latex]A[/latex] cỡ [latex]m \times n[/latex] được định nghĩa là tập con sau đây của [latex]\mathbb{R}^m[/latex]:

[latex]\begin{align*} \mathbf{R}(A) := \{Ax : x \in \mathbb{R}^n\}. \end{align*}[/latex]

Ảnh mô tả các véctơ [latex]y = Ax[/latex] có thể đạt được trong không gian đầu ra bằng một lựa chọn tùy ý của một véctơ [latex]x[/latex] trong không gian đầu vào. Ảnh chính là không gian con sinh bởi các cột của [latex]A[/latex].

Nếu [latex]y \notin \mathbf{R}(A)[/latex], ta nói rằng phương trình tuyến tính [latex]Ax = y[/latex] là vô nghiệm. Tập hợp nghiệm của phương trình tuyến tính là rỗng.

Từ một ma trận [latex]A[/latex], có thể tìm được một ma trận mà các cột của nó sinh ra ảnh của ma trận [latex]A[/latex] và trực giao với nhau. Do đó, [latex]U^TU = I_r[/latex], trong đó [latex]r[/latex] là chiều của ảnh. Một thuật toán để có được ma trận [latex]U[/latex] là thuật toán Gram-Schmidt.

Ví dụ: Một hệ tuyến tính vô nghiệm.

Hạng

Chiều của ảnh được gọi là hạng của ma trận. Như chúng ta sẽ thấy sau, hạng không thể vượt quá bất kỳ chiều nào của ma trận [latex]A: r \leq \mathrm{min}(m, n)[/latex]. Một ma trận được gọi là có hạng đầy đủ nếu [latex]r = \mathrm{min}(m, n)[/latex].

Lưu ý rằng hạng là một khái niệm rất ‘‘mong manh’’, theo nghĩa là những thay đổi nhỏ trong các phần tử của ma trận có thể làm thay đổi đáng kể hạng của nó. Các ma trận ngẫu nhiên đều có hạng đầy đủ.

Ví dụ 1: Ảnh và hạng của một ma trận đơn giản.

Xét ma trận\[ A = \begin{pmatrix} 1 & 2 \\ 3 & 4 \end{pmatrix}. \]

Ảnh: Các cột của \(A\) là\[ c_1 = \begin{pmatrix} 1 \\ 3 \end{pmatrix}, \quad c_2 = \begin{pmatrix} 2 \\ 4 \end{pmatrix}. \]

Bất kỳ tổ hợp tuyến tính nào của các véctơ này đều có thể được biểu diễn dưới dạng \(Ax\), với \(x \in \mathbb{R}^2\). Đối với ma trận \(A\) của chúng ta, ảnh có thể được biểu diễn trực quan là mặt phẳng sinh bởi \(c_1\) và \(c_2\).

Hạng: Hạng của một ma trận là chiều của ảnh của nó. Đối với ma trận \(A\) của chúng ta, vì cả hai véctơ cột đều độc lập tuyến tính, hạng là:\[ \text{rank}(A) = 2. \]Do đó, ma trận \(A\) có hạng đầy đủ.

Xem thêm:

Ma trận có hạng hàng đầy đủ

Ma trận [latex]A[/latex] được gọi là có hạng hàng đầy đủ nếu ảnh của nó là toàn bộ không gian đầu ra, [latex]\mathbb{R}^m[/latex]. Tên gọi ‘‘hạng hàng đầy đủ’’ xuất phát từ việc hạng bằng số hàng của [latex]A[/latex]. Vì hạng luôn nhỏ hơn hoặc bằng số nhỏ hơn trong số cột và số hàng, một ma trận [latex]m \times n[/latex] có hạng hàng đầy đủ nhất thiết phải có số hàng ít hơn số cột (tức là, [latex]m \leq n[/latex]).

Một điều kiện tương đương để [latex]A[/latex] có hạng hàng đầy đủ là ma trận vuông [latex]m \times m[/latex] [latex]AA^T[/latex] khả nghịch, nghĩa là nó có hạng đầy đủ là [latex]m[/latex].

Chứng minh.

Ma trận có hạng cột đầy đủ khi và chỉ khi hạt nhân của nó chỉ gồm phần tử \(\{0\}\), tức là, \[ Ax = 0 \implies x = 0.\]

Nếu \(A^T A\) khả nghịch, thì điều kiện \(Ax = 0\) kéo theo \(A^T Ax = 0\), và điều này lại kéo theo \(x = 0\).

Ngược lại, giả sử ma trận có hạng cột đầy đủ, và gọi \(x\) là véctơ sao cho \(A^T Ax = 0\). Khi đó ta có \(x^T A^T Ax = ||Ax||_2^2 = 0\), nghĩa là \(Ax = 0\). Vì \(A\) có hạng cột đầy đủ, ta thu được \(x = 0\), như mong muốn. Chứng minh cho tính chất kia cũng tương tự.

19.3. Tính duy nhất: hạt nhân của một ma trận

Hạt nhân

Hạt nhân của một ma trận [latex]m \times n[/latex] [latex]A[/latex] là không gian con sau đây của [latex]\mathbb{R}^n[/latex]:

[latex]\begin{align*} \mathbf{N}(A) := \{ x \in \mathbb{R}^n : Ax = 0 \}. \end{align*}[/latex]

Hạt nhân mô tả sự không xác định của [latex]x[/latex] khi biết [latex]y = Ax[/latex]: bất kỳ [latex]z \in \mathbf{N}(A)[/latex] nào cũng sẽ thỏa mãn [latex]A(x+z) = y[/latex], do đó [latex]x[/latex] không thể được xác định chỉ bằng việc biết [latex]y[/latex] nếu hạt nhân không phải là tập chỉ gồm phần tử [latex]\{0\}[/latex].

Từ một ma trận [latex]A[/latex], chúng ta có thể thu được một ma trận mà các cột của nó sinh ra hạt nhân của ma trận [latex]A[/latex], và trực giao với nhau. Do đó, [latex]U^TU = I_p[/latex], trong đó [latex]p[/latex] là chiều của hạt nhân.

Ví dụ 2: Hạt nhân của một ma trận đơn giản.

Xét ma trận

\[ A = \begin{pmatrix} 1 & 2 & 1\\ 2 & 4 & 2 \end{pmatrix}. \]

Hạt nhân, \( \mathbf{N}(A) \), được định nghĩa là

\[ \mathbf{N}(A) = \{ x \in \mathbb{R}^3 : Ax = 0 \}. \]

Với cấu trúc ma trận đã cho, với mọi véctơ \( x \) sao cho thành phần thứ nhất bằng \(-2\) lần thành phần thứ hai và thành phần thứ ba có thể tùy ý, thì \( Ax = 0 \).

Ví dụ, véctơ

\[ x = \begin{pmatrix} -2 \\ 1 \\ 0 \end{pmatrix}, \]

thỏa mãn \( Ax = 0 \) và do đó thuộc hạt nhân của \( A \). Chiều của hạt nhân này, \( p \), là 2 (vì chúng ta có hai biến tự do).

Số khuyết

Số khuyết của một ma trận là chiều của hạt nhân. Định lý về hạng và số khuyết phát biểu rằng số khuyết của một ma trận [latex]A[/latex] cỡ [latex]m \times n[/latex] là [latex]n - r[/latex], trong đó [latex]r[/latex] là hạng của [latex]A[/latex].

Ma trận có hạng cột đầy đủ

Ma trận [latex]A[/latex] được gọi là có hạng cột đầy đủ nếu hạt nhân của nó chỉ gồm phần tử [latex]\{0\}[/latex]. Trong trường hợp này, nếu ta ký hiệu [latex]a_i[/latex] là [latex]n[/latex] cột của [latex]A[/latex], phương trình

[latex]\begin{align*} (Ax =) \sum_{i=1}^n a_ix_i = 0 \end{align*}[/latex]

có [latex]x = 0[/latex] là nghiệm duy nhất. Do đó, [latex]A[/latex] là đơn ánh khi và chỉ khi các cột của nó độc lập tuyến tính. Vì hạng luôn nhỏ hơn hoặc bằng số nhỏ hơn trong số cột và số hàng, một ma trận [latex]m \times n[/latex] có hạng cột đầy đủ nhất thiết phải có số cột ít hơn số hàng (tức là, [latex]m \geq n[/latex]).

Thuật ngữ ‘‘đơn ánh’’ xuất phát từ việc đối với các ma trận như vậy, điều kiện [latex]y = Ax[/latex] xác định duy nhất [latex]x[/latex], vì [latex]Ax_1 = y[/latex] và [latex]Ax_2 = y[/latex] kéo theo [latex]A(x_1 - x_2) = 0[/latex], do đó nghiệm là duy nhất: [latex]x_1 = x_2[/latex]. Tên gọi ‘‘hạng cột đầy đủ’’ xuất phát từ việc hạng bằng số cột của [latex]A[/latex].

Một điều kiện tương đương để [latex]A[/latex] có hạng cột đầy đủ là ma trận vuông [latex]n \times n[/latex] [latex]A^TA[/latex] khả nghịch, nghĩa là nó có hạng đầy đủ là [latex]n[/latex].

Chứng minh: Tương tự như chứng minh của ma trận có hạng hàng đầy đủ.

Ví dụ: Hạt nhân của một ma trận chuyển vị của ma trận liên thuộc.

19.4. Các định lý cơ bản

Hai kết quả quan trọng về hạt nhân và ảnh của một ma trận.

Định lý về hạng và số khuyết

Số khuyết (chiều của hạt nhân) và hạng (chiều của ảnh) của một ma trận [latex]m \times n[/latex] [latex]A[/latex] có tổng bằng số cột của [latex]A[/latex], là [latex]n[/latex].

Proof.

Ma trận có hạng cột đầy đủ khi và chỉ khi hạt nhân của nó chỉ gồm phần tử [latex]\{0\}[/latex], tức là, \[ Ax = 0 \implies x = 0 \] Nếu [latex]A^T A[/latex] khả nghịch, thì điều kiện [latex]Ax = 0[/latex] kéo theo [latex]A^T Ax = 0[/latex], từ đó suy ra [latex]x = 0[/latex].

Ngược lại, giả sử ma trận có hạng cột đầy đủ, và cho [latex]x[/latex] là véctơ sao cho [latex]A^T Ax = 0[/latex]. Khi đó ta có [latex]x^T A^T Ax = ||Ax||_2^2 = 0[/latex], nghĩa là [latex]Ax = 0[/latex]. Vì [latex]A[/latex] có hạng cột đầy đủ, ta thu được [latex]x = 0[/latex], như mong muốn. Chứng minh cho tính chất còn lại là tương tự.

Một kết quả quan trọng khác liên quan đến định nghĩa của phần bù trực giao của một không gian con.

Định lý cơ bản của đại số tuyến tính

Cho \(A \in \mathbb{R}^{m \times n}\). Các tập hợp \(\mathbf{N}(A)\) và \(\mathbf{R}(A^T)\) tạo thành một phân tích trực giao của \(\mathbb{R}^n\), theo nghĩa là mọi véctơ \(x \in \mathbb{R}^n\) có thể được viết thành

\[ x = y + z, \ y \in \mathbf{N}(A), \ z \in \mathbf{R}(A^T), \ y^T z = 0. \]

Cụ thể, ta thu được rằng điều kiện để một véctơ \(x\) trực giao với mọi véctơ trong hạt nhân của \(A\) kéo theo rằng nó phải thuộc ảnh của ma trận chuyển vị của nó:

\[ x^T y = 0 \text{ mỗi khi } Ay = 0 \iff \exists \lambda \in \mathbb{R}^m : x = A^T\lambda. \]

Chứng minh.

Định lý này dựa trên thực tế là nếu một phân tích SVD của ma trận [latex]A[/latex] là

\[ A = U\tilde{\Sigma}V^T, \quad \tilde{\Sigma} = \text{diag}(\sigma_1, \ldots, \sigma_r, 0, \ldots, 0) \]

thì một phân tích SVD của ma trận chuyển vị của nó có thể thu được đơn giản bằng cách chuyển vị tích ba ma trận liên quan:

\[ A^T = (U\tilde{\Sigma}V^T)^T = V\tilde{\Sigma}U^T. \]

Do đó, các véctơ suy biến trái của [latex]A[/latex] là các véctơ suy biến phải của [latex]A^T[/latex].

Từ đó ta kết luận cụ thể rằng ảnh của [latex]A^T[/latex] được sinh bởi [latex]r[/latex] cột đầu tiên của [latex]V[/latex]. Vì hạt nhân của [latex]A[/latex] được sinh bởi [latex]n-r[/latex] cột cuối cùng của [latex]V[/latex], ta quan sát thấy rằng hạt nhân của [latex]A[/latex] và ảnh của [latex]A^T[/latex] là hai không gian con trực giao, có tổng số chiều bằng chiều của toàn bộ không gian. Chính xác hơn, ta có thể biểu diễn một véctơ [latex]x[/latex] bất kỳ dưới dạng một tổ hợp tuyến tính của các cột của [latex]V[/latex]; [latex]r[/latex] cột đầu tiên tương ứng với véctơ [latex]z \in \mathbf{R}(A^T)[/latex] và [latex]n-r[/latex] cột cuối cùng tương ứng với véctơ [latex]y \in \mathbf{N}(A)[/latex]:

\[ x = V (V^T x) = \underbrace{\sum_{i=1}^r \tilde{x}_i v_i}_{=z} + \underbrace{\sum_{i=r+1}^n \tilde{x}_i v_i}_{=y}, \quad \tilde{x} := V^T x. \]

Điều này chứng minh kết quả đầu tiên trong định lý.

Phát biểu cuối cùng sau đó là một hệ quả hiển nhiên của kết quả này: nếu \(x\) trực giao với hạt nhân, thì véctơ \(y\) trong định lý trên phải bằng không, do đó \(x \in \mathbf{R}(A^T)\).


	Hình vẽ phác thảo chứng minh: xét một ma trận [latex]3 \times 2[/latex] [latex]A[/latex], và ký hiệu [latex]a_i \in \mathbb{R}^3 (i = 1, 2)[/latex] là các \textbf{cột} của nó, sao cho [latex]\begin{align} A = \begin{pmatrix} a_1 & a_2 \end{pmatrix}, \quad A^T = \begin{pmatrix} a_1^T \\[1ex] a_2^T \end{pmatrix}. \end{align}[/latex] Khi đó [latex]A^Tx = 0[/latex] khi và chỉ khi [latex]a_i^Tx = 0, i = 1, 2[/latex]. Nói cách khác: [latex]x[/latex] thuộc hạt nhân của [latex]A^T[/latex] khi và chỉ khi nó trực giao với các véctơ [latex]a_i \, (i = 1, 2)[/latex]. Nhưng hai véctơ đó sinh ra ảnh của [latex]A[/latex], do đó [latex]x[/latex] trực giao với mọi phần tử trong ảnh.

License

Icon for the Public Domain license

This work (Đại số tuyến tính by Tony Tin) is free of known copyright restrictions.

19.1. Tập hợp nghiệm của một phương trình tuyến tính