6
6.1. Hàm tuyến tính và hàm afin
Định nghĩa
Một hàm [latex]f: \mathbb{R}^n \rightarrow \mathbb{R}[/latex] là tuyến tính nếu và chỉ nếu [latex]f[/latex] bảo toàn phép nhân vô hướng và phép cộng :
- với mọi [latex]x \in \mathbb{R}^n[/latex], và [latex]\alpha \in \mathbb{R}[/latex], [latex]f(\alpha x) = \alpha f(x)[/latex]; và
- với mọi [latex]x_1, x_2 \in \mathbb{R}^n[/latex], [latex]f(x_1 + x_2) = f(x_1) + f(x_2)[/latex].
Một hàm [latex]f[/latex] là afin nếu và chỉ nếu hàm [latex]\tilde{f}: \mathbb{R}^n \rightarrow \mathbb{R}[/latex] với các giá trị [latex]\tilde{f}(x) = f(x) - f(0)[/latex] là tuyến tính.
Một đặc trưng khác của hàm tuyến tính:
Một hàm [latex]f : \mathbb{R}^n \rightarrow \mathbb{R}^m[/latex] là tuyến tính nếu và chỉ nếu một trong các điều kiện sau đây đúng.
|
Ví dụ 1:
Xét các hàm [latex]f_1, f_2, f_3: \mathbb{R}^2 \rightarrow \mathbb{R}[/latex] với các giá trị Hàm [latex]f_1[/latex] là tuyến tính; [latex]f_2[/latex] là afin; và [latex]f_3[/latex] không là tuyến tính cũng không là afin. |
Kết nối với vector thông qua tích vô hướng
Định lý sau đây cho thấy mối liên hệ giữa các hàm tuyến tính và tích vô hướng.
Định lý biểu diễn hàm afin thông qua tích vô hướng:
Một hàm [latex]f: \mathbb{R}^n \rightarrow \mathbb{R}[/latex] là afin nếu và chỉ nếu nó có thể được biểu diễn thông qua tích vô hướng: |
Định lý cho thấy rằng một vector có thể được coi là một hàm tuyến tính từ không gian “đầu vào” [latex]\mathbb{R}^n[/latex] đến không gian “đầu ra” [latex]\mathbb{R}[/latex].
Gradient của một hàm afin
Gradient của một hàm [latex]f: \mathbb{R}^n \rightarrow \mathbb{R}[/latex] tại một điểm [latex]x[/latex], được ký hiệu là [latex]\nabla f(x)[/latex], là vector các đạo hàm bậc nhất đối với [latex]x_1, \cdots, x_n[/latex] (xem ở đây để có định nghĩa chính thức và các ví dụ). Khi [latex]n=1[/latex] (chỉ có một biến đầu vào), gradient đơn giản là đạo hàm.
Một hàm afin [latex]f: \mathbb{R}^n \rightarrow \mathbb{R}[/latex], với các giá trị [latex]f(x) = a^Tx+b[/latex] có một gradient rất đơn giản: vector hằng số [latex]a[/latex]. Tức là, đối với một hàm afin [latex]f[/latex], chúng ta có với mọi [latex]x[/latex]:
[latex]\begin{align*} \nabla f(x) = a \end{align*}[/latex]
Ví dụ 2:
gradient của một hàm tuyến tính: Xét hàm [latex]f : \mathbb{R}^2 \rightarrow \mathbb{R}[/latex], với các giá trị [latex]f(x) = x_1 + 2x_2[/latex]. Gradient của nó là hằng số, với các giá trị
|
Giải thích
- [latex]b = f(0)[/latex] là số hạng hằng số. Vì lý do này, đôi khi nó được gọi là độ lệch, hoặc giao điểm (vì nó là điểm mà [latex]f[/latex] giao với trục tung nếu chúng ta vẽ đồ thị của hàm).
- Các số hạng [latex]a_j[/latex], [latex]j = 1, \cdots, n[/latex], tương ứng với gradient của [latex]f[/latex], cho các hệ số ảnh hưởng của [latex]x_j[/latex] lên [latex]f[/latex]. Ví dụ, nếu [latex]a_1 \gg a_3[/latex], thì thành phần thứ nhất của [latex]x[/latex] có ảnh hưởng lớn hơn nhiều đến giá trị của [latex]f(x)[/latex] so với thành phần thứ ba.
Xem thêm: Định luật Beer-Lambert trong phép đo quang phổ hấp thụ..
6.2. Phép xấp xỉ bậc nhất của các hàm phi tuyến
Hầu hết các hàm mà chúng ta sử dụng là phi tuyến. Một phương pháp kỹ thuật phổ biến là xấp xỉ một hàm phi tuyến cho trước bằng một hàm tuyến tính (hoặc afin), bằng cách lấy đạo hàm. Đây là lý do chính khiến tính tuyến tính trở thành một công cụ phổ biến trong Kỹ thuật.
Trường hợp một chiều
Xét một hàm của một biến [latex]f: \mathbb{R} \rightarrow \mathbb{R}[/latex], và giả sử nó khả vi ở mọi nơi. Sau đó, chúng ta có thể xấp xỉ các giá trị hàm tại một điểm [latex]x[/latex] gần một điểm [latex]x_{0}[/latex] như sau:
[latex]\begin{align*} f(x) \simeq l(x):= f(x_0) + f'(x_0)(x-x_0), \end{align*}[/latex]
trong đó [latex]f'(x)[/latex] biểu thị đạo hàm của [latex]f[/latex] tại [latex]x[/latex].
Trường hợp nhiều chiều
ới nhiều hơn một biến, chúng ta có một kết quả tương tự. Chúng ta hãy xấp xỉ một hàm khả vi [latex]f: \mathbb{R}^n \rightarrow \mathbb{R}[/latex] bằng một hàm tuyến tính [latex]l[/latex], sao cho [latex]f[/latex] và [latex]l[/latex] trùng nhau lên đến và bao gồm cả các đạo hàm bậc nhất. Phép xấp xỉ tương ứng [latex]l[/latex] được gọi là phép xấp xỉ bậc nhất của [latex]f[/latex] tại [latex]x_0[/latex].
Hàm xấp xỉ [latex]l[/latex] phải có dạng
[latex]\begin{align*} l(x) = a^Tx+b, \end{align*}[/latex]
trong đó [latex]a \in \mathbb{R}^n[/latex] và [latex]b \in \mathbb{R}[/latex]. Điều kiện của chúng ta rằng [latex]l[/latex] trùng với [latex]f[/latex] lên đến và bao gồm cả các đạo hàm bậc nhất cho thấy rằng chúng ta phải có
[latex]\begin{align*} \nabla l(x) = a =\nabla f(x_0), a^Tx_0 + b = f(x_0), \end{align*}[/latex]
trong đó [latex]\nabla f(x_0)[/latex] là gradient của [latex]f[/latex] tại [latex]x_0[/latex]. Giải cho [latex]a,b[/latex], chúng ta thu được kết quả sau:
Định lý: Khai triển bậc nhất của một hàm.
Phép xấp xỉ bậc nhất của một hàm khả vi [latex]f[/latex] tại một điểm [latex]x_0[/latex] có dạng |
Ví dụ 3: xấp xỉ tuyến tính cho một hàm phi tuyến Xét hàm log-sum-exp
|
6.3. Các mô hình tuyến tính khác
Tính tuyến tính có thể được sinh ra từ một sự thay đổi biến đơn giản. Điều này được minh họa rõ nhất bằng một ví dụ cụ thể.
Ví dụ: Các luật luỹ thừa.