PostgreSQL: soi kèo bóng đá | |||
---|---|---|---|
prev | UP | Chương 12. Tìm kiếm toàn văn | Tiếp theo |
Các ví dụ trong phần trước được minh họa toàn bộ văn bản khớp bằng cách sử dụng các chuỗi hằng số đơn giản. Phần này cho thấy cách tìm kiếm dữ liệu bảng, tùy chọn sử dụng các chỉ kèo bóng đá cúp c2.
Có thể thực hiện tìm kiếm văn bản đầy đủ mà không cần chỉ kèo bóng đá cúp c2. Một truy vấn đơn giản để inTiêu đềcủa mỗi hàng có chứa từbạnTrong nóBodyTrường là:
Chọn tiêu đề
Điều này cũng sẽ tìm thấy các từ liên quan nhưbạn bèvàthân thiện, vì tất cả những thứ này được giảm xuống cùng một từ vựng được chuẩn hóa.
Truy vấn ở trên chỉ định rằngtiếng AnhCấu hình sẽ được sử dụng để phân tích và bình thường hóa các chuỗi. Ngoài ra, chúng tôi có thể bỏ qua các tham số cấu hình:
Chọn tiêu đề
Truy vấn này sẽ sử dụng cấu hình được đặt bởidefault_text_search_config.
Một ví dụ phức tạp hơn là chọn mười tài liệu gần đây nhất có chứaTạovàkèo bóng đá cúp c2trongTiêu đềhoặcBody:
Chọn tiêu đề
Để rõ ràng, chúng tôi đã bỏ quaHOUNESCE
Các cuộc gọi chức năng cần thiết để tìm các hàng có chứanullTrong một trong hai trường.
Mặc dù các truy vấn này sẽ hoạt động mà không có chỉ kèo bóng đá cúp c2, hầu hết các ứng dụng sẽ thấy cách tiếp cận này quá chậm, ngoại trừ có lẽ đối với các tìm kiếm ad-hoc thỉnh thoảng. Sử dụng thực tế tìm kiếm văn bản thường yêu cầu tạo một chỉ kèo bóng đá cúp c2.
Chúng ta có thể tạo mộtGinindex (Phần 12.9) Để tăng tốc các tìm kiếm văn kèo bóng đá cúp c2:
11987_12062
Lưu ý rằng phiên kèo bóng đá cúp c2 2 đối số củato_tsVector
được sử dụng. Chỉ có thể sử dụng các chức năng tìm kiếm văn bản chỉ định tên cấu hình có thể được sử dụng trong các chỉ kèo bóng đá cúp c2 biểu thức (Phần 11.7). Điều này là do nội dung chỉ kèo bóng đá cúp c2 phải không bị ảnh hưởng bởidefault_text_search_config. Nếu chúng bị ảnh hưởng, nội dung chỉ kèo bóng đá cúp c2 có thể không nhất quán vì các kèo bóng đá cúp c2 khác nhau có thể chứaTSVectors được tạo với các cấu hình tìm kiếm văn bản khác nhau và sẽ không có cách nào để đoán đó là cái nào. Không thể bỏ và khôi phục một chỉ kèo bóng đá cúp c2 như vậy một cách chính xác.
Bởi vì phiên kèo bóng đá cúp c2 hai đối số củaTO_TSVECTOR
đã được sử dụng trong chỉ kèo bóng đá cúp c2 ở trên, chỉ có một tham chiếu truy vấn sử dụng phiên bản 2-parument củato_tsVector
Với cùng tên cấu hình sẽ sử dụng chỉ kèo bóng đá cúp c2 đó. Đó là,WHERE TO_TSVECTOR ('English', body) @@ 'A & B'Có thể sử dụng chỉ kèo bóng đá cúp c2, nhưngwhere to_tsvector (body) @@ 'A & B'Không thể. Điều này đảm bảo rằng một chỉ kèo bóng đá cúp c2 sẽ chỉ được sử dụng với cùng một cấu hình được sử dụng để tạo các kèo bóng đá cúp c2 nhập chỉ kèo bóng đá cúp c2.
Có thể thiết lập các chỉ kèo bóng đá cúp c2 biểu thức phức tạp hơn trong đó tên cấu hình được chỉ định bởi một cột khác, ví dụ:
13504_13581
WHERECONFIG_NAMElà một cột trongPGWEBBảng. Điều này cho phép các cấu hình hỗn hợp trong cùng một chỉ kèo bóng đá cúp c2 trong khi ghi cấu hình nào được sử dụng cho mỗi kèo bóng đá cúp c2 nhập chỉ kèo bóng đá cúp c2.WHERE TO_TSVECTOR (config_name, body) @@ 'A & B'.
Chỉ kèo bóng đá cúp c2 thậm chí có thể kết nối các cột:
14147_14238
Một cách tiếp cận khác là tạo riêng biệttsVectorCột để giữ đầu ra củato_tsVector
. Ví dụ này là một sự kết hợp củaTiêu đềvàBody, sử dụngHOUNESCE
Để đảm bảo rằng một trường vẫn sẽ được lập chỉ kèo bóng đá cúp c2 khi phần kia lànull:
14664_14850
sau đó chúng ta tạo mộtGinChỉ kèo bóng đá cúp c2 để tăng tốc tìm kiếm:
14976_15052
Bây giờ chúng tôi đã sẵn sàng để thực hiện tìm kiếm văn kèo bóng đá cúp c2 đầy đủ nhanh:
Chọn tiêu đề
Khi sử dụng một cột riêng để lưu trữtsVectorBiểu diễn, cần phải tạo một trình kích hoạt để giữtsVectorCột dòng bất cứ lúc nàoTiêu đềhoặcBodyThay đổi.Phần 12.4.3Giải thích cách làm điều đó.
Một lợi thế của cách tiếp cận cột riêng biệt so với chỉ kèo bóng đá cúp c2 biểu thức là không cần thiết phải chỉ định rõ ràng cấu hình tìm kiếm văn bản trong các truy vấn để sử dụng chỉ kèo bóng đá cúp c2. Như được hiển thị trong ví dụ trên, truy vấn có thể phụ thuộc vàoDefault_Text_search_config. Một lợi thế khác là các tìm kiếm sẽ nhanh hơn, vì sẽ không cần thiết để làm lạito_tsVector
Cuộc gọi để xác minh chỉ số khớp. (Điều này quan trọng hơn khi sử dụng chỉ kèo bóng đá cúp c2 GIST hơn chỉ kèo bóng đá cúp c2 gin; xemPhần 12.9.) Tuy nhiênTSVECTORĐại diện không được lưu trữ rõ ràng.