Phiên cách đọc kèo bóng đá được hỗ trợ:hiện tại(17)16 / 15 / 14 / 13
Phiên cách đọc kèo bóng đá phát triển:18 / Devel
Phiên cách đọc kèo bóng đá không được hỗ trợ:12 / 11 / 10 / 9.6 / 9.5 / 9.4 / 9.3 / 9.2 / 9.1 / 9.0 / 8.4 / 8.3
Tài liệu này dành cho phiên cách đọc kèo bóng đá không được hỗ trợ của PostgreSQL.
Bạn có thể muốn xem cùng một trang chohiện tạiPhiên cách đọc kèo bóng đá hoặc một trong các phiên cách đọc kèo bóng đá được hỗ trợ khác được liệt kê ở trên thay thế.

8.11. Loại cách đọc kèo bóng đá#

PostgreSQLCung cấp hai loại dữ liệu được thiết kế để hỗ trợ cách đọc kèo bóng đá toàn văn, đây là hoạt động cách đọc kèo bóng đá thông qua bộ sưu tập ngôn ngữ tự nhiênTài liệuĐể định vị những người phù hợp nhất với ATruy vấn. ThetsVectorLoại đại diện cho một tài liệu trong một biểu mẫu được tối ưu hóa để cách đọc kèo bóng đá; ThetsqueryNhập biểu thị tương tự một truy vấn văn cách đọc kèo bóng đá.Chương 12Cung cấp một lời giải thích chi tiết về cơ sở này vàPhần 9.13Tóm tắt các chức năng và toán tử liên quan.

8.11.1.TSVECTOR #

AtsVectorGiá trị là danh sách được sắp xếp của riêng biệtLexeme, đó là những từ đã đượcchuẩn hóaĐể hợp nhất các biến thể khác nhau của cùng một từ (xemChương 12Để biết chi tiết). Sắp xếp và loại bỏ trùng lặp được thực hiện tự động trong quá trình nhập, như trong ví dụ này:

Chọn 'Một con mèo béo ngồi trên thảm và ăn một con chuột béo' :: tsvector;

12196_12283

Chọn $$ Lexeme '' chứa không gian $$ :: tsVector;

(Chúng tôi sử dụng các chữ viết được trích xuất bằng đô la trong ví dụ này và cái tiếp theo để tránh sự nhầm lẫn khi phải tăng gấp đôi các dấu hiệu trích dẫn trong các chữ cái.)

Chọn $$ Lexeme 'Joe' '' chứa một trích dẫn $$ :: tsvector;

Tùy chọn, Số nguyênVị trícó thể được gắn vào từ vựng:

13056_13350

Một vị trí thường chỉ ra vị trí của từ nguồn trong tài liệu. Thông tin vị trí có thể được sử dụng choXếp hạng gần. Giá trị vị trí có thể nằm trong khoảng từ 1 đến 16383;

Lexeme có vị trí có thể được dán nhãn tiếp theoTrọng lượng, có thể làA, B, ChoặcD. Dlà mặc định và do đó không được hiển thị trên đầu ra:

Chọn 'A: 1a béo: 2B, 4C CAT: 5D' :: TSVECTOR;

Trọng lượng thường được sử dụng để phản ánh cấu trúc tài liệu, ví dụ bằng cách đánh dấu các từ tiêu đề khác với các từ cơ thể. Các chức năng xếp hạng cách đọc kèo bóng đá có thể gán các ưu tiên khác nhau cho các điểm đánh dấu trọng lượng khác nhau.

Điều quan trọng là phải hiểu rằngtsVectorLoại cách đọc kèo bóng đá thân không thực hiện bất kỳ cách chuẩn hóa từ nào; Nó giả định các từ mà nó được đưa ra được chuẩn hóa một cách thích hợp cho ứng dụng.

Chọn 'Chuột béo' :: TSVector;

Đối với hầu hết các ứng dụng cách đọc kèo bóng đá tiếng Anh, các từ trên sẽ được coi là không bình thường, nhưngtsVectorKhông quan tâm. Văn cách đọc kèo bóng đá tài liệu thô thường được truyền quato_tsqueryĐể bình thường hóa các từ một cách thích hợp để cách đọc kèo bóng đá:

chọn to_tsvector ('tiếng Anh', 'chuột béo');

Một lần nữa, xemChương 12Để biết thêm chi tiết.

8.11.2.tsquery #

Atsquery15717_15819&(và),|(hoặc) và!(không), cũng như toán tử cách đọc kèo bóng đá cụm từ<-(tiếp theo là). Ngoài ra còn có một biến thể<ncủa sau đó là toán tử, trong đónlà hằng số số nguyên chỉ định khoảng cách giữa hai từ vựng đang được cách đọc kèo bóng đá.<-là tương đương với<1.

ngoặc đơn có thể được sử dụng để thực thi nhóm các toán tử này. Trong trường hợp không có dấu ngoặc đơn,!(không) liên kết chặt chẽ nhất,<-(theo sau) tiếp theo một cách đọc kèo bóng đá chặt chẽ nhất, sau đó&(và), với|(hoặc) ràng buộc ít nhất.

Đây là một số ví dụ:

Chọn 'Fat & Rat' :: Tsquery;

Tùy chọn, từ vựng trong Atsquerycó thể được dán nhãn với một hoặc nhiều chữ cái trọng lượng, điều này hạn chế chúng chỉ khớp với nhauTSVECTORLexeme với một trong những trọng số đó:

Chọn 'Fat: AB & Cat' :: Tsquery;

Ngoài ra, từ vựng trong Atsquerycó thể được dán nhãn*Để chỉ định khớp tiền tố:

Chọn 'Super:*' :: tsquery;

Truy vấn này sẽ khớp với bất kỳ từ nào trong mộtTSVECTORbắt đầu bằngSuper.

17916_17996tsVector; và, như vớitsVector, Bất kỳ sự chuẩn hóa nào của các từ phải được thực hiện trước khi chuyển đổi thànhtsqueryLoại. Theto_tsqueryHàm thuận tiện để thực hiện bình thường hóa như vậy:

Chọn To_TSQuery ('Fat: AB & CATS');

Lưu ý rằngto_tsquerySẽ xử lý các tiền tố theo cách đọc kèo bóng đá tương tự như các từ khác, điều đó có nghĩa là so sánh này trả về đúng:

Chọn To_TSVECTOR ('sau đại học') @@ to_tsquery ('Postgres:*');

Postgresđược phát triển thànhPostgr:

Chọn to_tsvector ('sau đại học'), to_tsquery ('postgres:*');

sẽ phù hợp với dạng gốc củasau đại học.