"

 

alt text  

Trong các ứng dụng nén ảnh, chúng ta được cho biểu diễn pixel của một ảnh ‘‘đích’’, dưới dạng một véctơ [latex]y \in \mathbb{R}^m[/latex]. Chúng ta muốn biểu diễn hình ảnh đó dưới dạng một tổ hợp tuyến tính của các ảnh ‘‘cơ bản’’ [latex]a_j[/latex], [latex]j=1,\ldots,n[/latex], trong đó ma trận [latex]A=[a_1,\ldots,a_n] \in \mathbb{R}^{m \times n}[/latex] được gọi là từ điển. Hình bên trái cho thấy tổng cộng [latex]n[/latex] ảnh ‘‘cơ bản’’.

Để biểu diễn hình ảnh theo từ điển, chúng ta muốn tìm các hệ số [latex]x_j[/latex], [latex]j=1,\ldots,n[/latex] sao cho

\[y = \sum_{j=1}^{n} x_j a_j,\]

hay, ngắn gọn hơn, [latex]y = Ax[/latex].

Nếu biểu diễn của hình ảnh (tức là, véctơ [latex]x[/latex]) có nhiều số không (ta nói: [latex]x[/latex] là thưa), thì chúng ta có thể biểu diễn toàn bộ hình ảnh chỉ với một vài giá trị (các thành phần của [latex]x[/latex] khác không). Khi đó, ví dụ, chúng ta có thể gửi hình ảnh qua một mạng truyền thông với tốc độ cao. Miễn là bên nhận có sẵn từ điển, họ có thể tái tạo lại hình ảnh một cách hoàn hảo.

Trong thực tế, có thể mong muốn đánh đổi tính thưa của biểu diễn (thông qua [latex]x[/latex]) với độ chính xác của biểu diễn. Cụ thể, chúng ta có thể ưu tiên một biểu diễn [latex]x[/latex] mà trong đó [latex]Ax[/latex] chỉ xấp xỉ [latex]y[/latex], nhưng lại có nhiều số không hơn. Quá trình tìm kiếm sự đánh đổi tốt giữa tính thưa và độ chính xác được gọi là nén ảnh.

License

Icon for the Public Domain license

This work (Đại số tuyến tính by Tony Tin) is free of known copyright restrictions.