Ma trận Gram

Tony Tin

Xét [latex]m[/latex] véctơ [latex]n[/latex] chiều [latex]x_1, \cdots, x_m[/latex]. Ma trận Gram của các véctơ này là ma trận [latex]m\times m[/latex] [latex]G[/latex] với các phần tử [latex]G_{ij}=x_i^Tx_j[/latex]. Ma trận này có thể được biểu diễn một cách gọn gàng qua ma trận [latex]X = [x_1, \cdots, x_m][/latex], như sau

[latex]\begin{align*} G &= X^T X = \left(\begin{array}{c} x_1^T \\ \vdots \\ x_m^T \end{array}\right) \left(\begin{array}{lll} x_1 & \ldots & x_m \end{array}\right). \end{align*}[/latex]

Theo định nghĩa, một ma trận Gram luôn đối xứng, nghĩa là [latex]G_{ij} = G_{ji}[/latex] với mọi cặp [latex](i,j)[/latex]. Nó cũng là ma trận nửa xác định dương, nghĩa là [latex]u^TGu \ge 0[/latex] với mọi vector [latex]u \in \mathbb{R}^n[/latex] (điều này xuất phát từ đẳng thức [latex]u^TGu = ||Xu||_2^2[/latex]).

Giả sử rằng mỗi véctơ [latex]x_i[/latex] được chuẩn hóa: [latex]||x_i||_2 =1[/latex]. Khi đó, hệ số [latex]G_{ij}[/latex] có thể được biểu diễn là

[latex]\begin{align*} G_{ij} &= \cos \theta_{ij}, \end{align*}[/latex]

trong đó [latex]\theta_{ij}[/latex] là góc giữa hai vector [latex]x_i[/latex] và [latex]x_j[/latex]. Do đó [latex]G_{ij}[/latex] là một thước đo về mức độ tương đồng giữa [latex]x_i[/latex] và [latex]x_j[/latex].

Ma trận [latex]G[/latex] xuất hiện, ví dụ, trong phân loại văn bản, với [latex]G_{ij}[/latex] là một thước đo độ tương đồng giữa tài liệu thứ [latex]i[/latex] và thứ [latex]j[/latex], và [latex]x_i, x_j[/latex] là biểu diễn “túi từ” (bag-of-words) tương ứng của chúng (được chuẩn hóa để có chuẩn Euclide bằng 1).

Xem thêm:

License

Icon for the Public Domain license

This work (Đại số tuyến tính by Tony Tin) is free of known copyright restrictions.

License

Share This Book