Quay lại ví dụ túi từ, chúng ta có thể sử dụng khái niệm góc để đo mức độ gần gũi của hai tài liệu khác nhau.
Cho hai tài liệu và một danh sách các từ đã được định nghĩa trước xuất hiện trong các tài liệu (từ điển), chúng ta có thể tính toán các véctơ tần số [latex]x, y[/latex] của các từ khi chúng xuất hiện trong các tài liệu. Góc giữa hai véctơ là một thước đo được sử dụng rộng rãi về độ gần gũi (tương đồng) giữa các tài liệu.
Xem thêm: