PostgreSQLCung cấp hai loại dữ liệu được thiết kế để hỗ trợ tìm kiếm văn kèo bóng đá hom nay đầy đủ, đây là hoạt động tìm kiếm thông qua bộ sưu tập ngôn ngữ tự nhiênTài liệuĐể định vị những người phù hợp nhất với ATruy vấn. ThetsVector
Loại đại diện cho một tài liệu trong một biểu mẫu được tối ưu hóa để tìm kiếm văn kèo bóng đá hom nay; Thetsquery
Loại đại diện tương tự một truy vấn văn kèo bóng đá hom nay.Chương 12Cung cấp một lời giải thích chi tiết về cơ sở này vàPhần 9.13Tóm tắt các chức năng và toán tử liên quan.
tsVector
AtsVector
Giá trị là danh sách được sắp xếp của riêng biệtLexeme, đó là những từ đã đượcchuẩn hóaĐể hợp nhất các biến thể khác nhau của cùng một từ (xemChương 12Để biết chi tiết). Sắp xếp và loại bỏ trùng lặp được thực hiện tự động trong quá trình nhập, như trong ví dụ này:
Chọn 'một con mèo béo ngồi trên thảm và ăn một con chuột béo' :: tsvector;
Để biểu thị các từ bỏ có chứa khoảng trắng hoặc dấu câu, bao quanh chúng với các trích dẫn:
Chọn $$ Lexeme '' chứa không gian $$ :: tsVector;
(Chúng tôi sử dụng các chuỗi được trích dẫn bằng đô la trong ví dụ này và cái tiếp theo để tránh sự nhầm lẫn khi phải tăng gấp đôi các dấu hiệu trích dẫn trong các chữ cái.)
Chọn $$ Lexeme 'Joe' '' chứa một trích dẫn $$ :: tsvector;
Tùy chọn, Số nguyênVị trícó thể được gắn vào từ vựng:
13037_13330
Một vị trí thường chỉ ra vị trí của từ nguồn trong tài liệu. Thông tin vị trí có thể được sử dụng choXếp hạng gần. Giá trị vị trí có thể nằm trong khoảng từ 1 đến 16383;
Lexeme có vị trí có thể được dán nhãn tiếp theoTrọng lượng, có thể làA
, B
, C
hoặcD
. D
là mặc định và do đó không được hiển thị trên đầu ra:
Chọn 'A: 1a béo: 2B, 4C CAT: 5D' :: TSVECTOR;
Trọng lượng thường được sử dụng để phản ánh cấu trúc tài liệu, ví dụ bằng cách đánh dấu các từ tiêu đề khác với các từ cơ thể. Các chức năng xếp hạng tìm kiếm văn kèo bóng đá hom nay có thể gán các ưu tiên khác nhau cho các điểm đánh dấu trọng lượng khác nhau.
Điều quan trọng là phải hiểu rằngtsVector
Loại kèo bóng đá hom nay thân không thực hiện bất kỳ cách chuẩn hóa từ nào; Nó giả định các từ mà nó được đưa ra được chuẩn hóa một cách thích hợp cho ứng dụng.
Chọn 'Chuột béo' :: TSVector;
Đối với hầu hết các ứng dụng tìm kiếm văn kèo bóng đá hom nay tiếng Anh, các từ trên sẽ được coi là không bình thường, nhưngTSVECTOR
Không quan tâm. Văn kèo bóng đá hom nay tài liệu thô thường được truyền quaTO_TSVECTOR
Để bình thường hóa các từ một cách thích hợp để kèo bóng đá hom nay:
chọn to_tsvector ('tiếng Anh', 'chuột béo');
Một lần nữa, xemChương 12Để biết thêm chi tiết.
tsquery
Atsquery
15666_15768&
(và),|
(hoặc) và!
(không), cũng như toán tử kèo bóng đá hom nay cụm từ<-
(tiếp theo là). Ngoài ra còn có một biến thể<
của sau đó là toán tử, trong đón
n
là hằng số số nguyên chỉ định khoảng cách giữa hai từ vựng đang được kèo bóng đá hom nay.<-
là tương đương với<1
.
ngoặc đơn có thể được sử dụng để thực thi nhóm các toán tử này. Trong trường hợp không có dấu ngoặc đơn,!
(không) liên kết chặt chẽ nhất,<-
(theo sau) tiếp theo một cách chặt chẽ nhất, sau đó&
(và), với|
(hoặc) ràng buộc ít nhất.
Đây là một số ví dụ:
Chọn 'Fat & Rat' :: Tsquery;
Tùy chọn, từ vựng trong Atsquery
Có thể được dán nhãn với một hoặc nhiều chữ cái trọng lượng, điều này hạn chế chúng chỉ phù hợpTSVECTOR
Lexeme với một trong những trọng số đó:
Chọn 'Fat: AB & Cat' :: Tsquery;
Ngoài ra, từ vựng trong Atsquery
có thể được dán nhãn*
Để chỉ định khớp tiền tố:
Chọn 'Super:*' :: TsQuery;
Truy vấn này sẽ khớp với bất kỳ từ nào trong mộttsVector
bắt đầu bằngSuper.
17890_17970TSVECTOR
; và, như vớitsVector
, Bất kỳ sự chuẩn hóa nào bắt buộc của các từ phải được thực hiện trước khi chuyển đổi thànhtsquery
Loại. Theto_tsquery
Hàm thuận tiện để thực hiện bình thường hóa như vậy:
Chọn To_TSQuery ('Fat: AB & Mèo');
Lưu ý rằngto_tsquery
Sẽ xử lý các tiền tố theo cách tương tự như các từ khác, điều đó có nghĩa là so sánh này trả về đúng:
Chọn To_TSVector ('sau đại học') @@ to_tsquery ('Postgres:*');
vìPostgres
Được đặt ra vàoPostgr
:
chọn to_tsvector ('sau đại học'), to_tsquery ('postgres:*');
sẽ phù hợp với dạng gốc củasau đại học
.