Phần này mô tả cách đọc kèo bóng đá chức năng và toán tử bổ sung hữu ích liên quan đến tìm kiếm văn bản.
Phần 12.3.1Cho thấy cách cách đọc kèo bóng đá tài liệu văn bản thô có thể được chuyển đổi thànhtsVector
Giá trị.PostgreSQLCũng cung cấp cách đọc kèo bóng đá chức năng và toán tử có thể được sử dụng để thao tác cách đọc kèo bóng đá tài liệu đã có trongtsVector
Mẫu.
TSVECTOR
||TSVECTOR
ThetsVector
Toán tử kết hợp trả về một vectơ kết hợp cách đọc kèo bóng đá từ vựng và thông tin vị trí của hai vectơ được đưa ra dưới dạng đối số. Vị trí và nhãn trọng lượng được giữ lại trong quá trình nối.to_tsVector
Về sự kết hợp của hai chuỗi tài liệu gốc. .
Một lợi thế của việc sử dụng kết nối ở dạng vectơ, thay vì kết nối văn bản trước khi áp dụngto_tsVector
, là bạn có thể sử dụng cách đọc kèo bóng đá cấu hình khác nhau để phân tích cách đọc kèo bóng đá phần khác nhau của tài liệu. Ngoài ra, bởi vìSetweight
Chức năng đánh dấu tất cả cách đọc kèo bóng đá từ vựng của vectơ đã cho theo cùng một cách, cần phải phân tích văn bản và làmSetweight
Trước khi kết nối nếu bạn muốn dán nhãn cách đọc kèo bóng đá phần khác nhau của tài liệu với cách đọc kèo bóng đá trọng số khác nhau.
setweight (Vector
tsVector
, Trọng lượng
"Char"
) trả vềtsVector
Setweight
Trả về một bản sao của vectơ đầu vào trong đó mọi vị trí đã được dán nhãn với đã choTrọng lượng
, hoặcA
, B
, C
hoặcD
. (D
là mặc định cho cách đọc kèo bóng đá vectơ mới và do đó không được hiển thị trên đầu ra.) cách đọc kèo bóng đá nhãn này được giữ lại khi cách đọc kèo bóng đá vectơ được nối, cho phép cách đọc kèo bóng đá từ từ cách đọc kèo bóng đá phần khác nhau của tài liệu được tính theo cách đọc kèo bóng đá hàm xếp hạng.
Lưu ý rằng cách đọc kèo bóng đá nhãn trọng lượng áp dụng choVị trí, khôngLexeme. Nếu vectơ đầu vào đã bị tước cách đọc kèo bóng đá vị trí thìSetweight
Không làm gì.
length (Vector
TSVECTOR
) trả vềSố nguyên
Trả về số lượng từ vựng được lưu trữ trong vectơ.
Dải (Vector
TSVECTOR
) trả vềtsVector
Trả về một vectơ liệt kê cách đọc kèo bóng đá từ vựng giống như vectơ đã cho, nhưng không có bất kỳ thông tin vị trí hoặc trọng lượng nào. Kết quả thường nhỏ hơn nhiều so với một vectơ không có dấu, nhưng nó cũng ít hữu ích hơn.<-
(tiếp theo là)tsquery
toán tử sẽ không bao giờ khớp đầu vào bị tước, vì nó không thể xác định khoảng cách giữa cách đọc kèo bóng đá lần xuất hiện từ vựng.
Danh sách đầy đủ củatsVector
cách đọc kèo bóng đá hàm liên quan đến có sẵn trongBảng 9.42.
Phần 12.3.2Cho thấy cách cách đọc kèo bóng đá truy vấn văn bản thô có thể được chuyển đổi thànhtsquery
Giá trị.PostgreSQLCũng cung cấp cách đọc kèo bóng đá chức năng và toán tử có thể được sử dụng để thao tác cách đọc kèo bóng đá truy vấn đã có trongtsquery
Mẫu.
tsquery
&&tsquery
Trả về và kết hợp hai truy vấn đã cho.
tsquery
||tsquery
Trả về sự kết hợp của hai truy vấn đã cho.
!!tsquery
Trả về phủ định (không) của truy vấn đã cho.
tsquery
<-tsquery
Trả về một truy vấn tìm kiếm một trận đấu với truy vấn đã cho đầu tiên ngay sau đó là một trận đấu với truy vấn đã cho thứ hai, sử dụng<-
(tiếp theo là)tsquery
toán tử. Ví dụ:
Chọn To_TSQuery ('Fat') <- to_tsquery ('Cat | Rat');
tsquery_phrase (Query1
tsquery
, Query2
tsquery
[,Khoảng cách đọc kèo bóng đá
Số nguyên
]) trả vềtsquery
17885_18025Khoảng cách đọc kèo bóng đá
Lexeme, sử dụng<
n
tsquery
Nhà điều hành. Ví dụ:
chọn tsquery_phrase (to_tsquery ('fat'), to_tsquery ('cat'), 10);
numnode (Truy vấn
tsquery
) trả vềSố nguyên
Trả về số lượng nút (toán tử cộng với Lexeme) trong Atsquery
. Chức cách đọc kèo bóng đá này hữu ích để xác định xemTruy vấn
có ý nghĩa (trả về 0) hoặc chỉ chứa cách đọc kèo bóng đá từ dừng (trả về 0). Ví dụ:
chọn numnode (plainto_tsquery ('bất kỳ'));
Querytree (Truy vấn
tsquery
) Trả vềText
Trả về phần của Atsquery
có thể được sử dụng để tìm kiếm một chỉ mục. Hàm này rất hữu ích để phát hiện cách đọc kèo bóng đá truy vấn không thể vượt qua, ví dụ như cách đọc kèo bóng đá truy vấn chỉ có chứa cách đọc kèo bóng đá từ dừng hoặc chỉ cách đọc kèo bóng đá thuật ngữ bị phủ định.
chọn QueryTree (to_tsquery ('xác định'));
Thets_rewrite
Gia đình chức cách đọc kèo bóng đá Tìm kiếm một đã chotsquery
Đối với cách đọc kèo bóng đá lần xuất hiện của một truy vấn con mục tiêu và thay thế mỗi lần xuất hiện bằng một truy vấn con thay thế. Về bản chất, hoạt động này là mộttsquery
-Pecific phiên bản thay thế chuỗi con. Một kết hợp mục tiêu và thay thế có thể được coi làQuy tắc viết lại truy vấn. Một bộ sưu tập cách đọc kèo bóng đá quy tắc viết lại như vậy có thể là một hỗ trợ tìm kiếm mạnh mẽ.New York
, Big Apple
, NYC
, Gotham
) hoặc thu hẹp tìm kiếm để hướng người dùng đến một số chủ đề nóng. Có một số sự chồng chéo về chức cách đọc kèo bóng đá giữa tính cách đọc kèo bóng đá này và từ điển từ điển (Phần 12.6.4). Tuy nhiên, bạn có thể sửa đổi một tập hợp cách đọc kèo bóng đá quy tắc viết lại trên đường bay mà không cần tái hiện
ts_rewrite (Truy vấn
tsquery
, Target
tsquery
, thay thế
tsquery
) trả vềtsquery
Hình thức này củaTS_REWRITE
Chỉ cần áp dụng một quy tắc viết lại:Target
được thay thế bằngThay thế
Bất cứ nơi nào nó xuất hiện trongTruy vấn
. Ví dụ:
22297_22409
ts_rewrite (Truy vấn
tsquery
, Chọn
Text
) Trả vềtsquery
Mẫu này củaTS_REWRITE
Chấp nhận bắt đầuTruy vấn
và SQLChọn
Lệnh được đưa ra dưới dạng chuỗi văn bản. TheChọn
Phải mang lại hai cột củatsquery
Loại. Cho mỗi hàng củaChọn
Kết quả, sự xuất hiện của giá trị cột thứ nhất (mục tiêu) được thay thế bằng giá trị cột thứ hai (thay thế) trong hiện tại hiện tạiTruy vấn
Giá trị. Ví dụ:
23402_23609
Lưu ý rằng khi nhiều quy tắc viết lại được áp dụng theo cách đọc kèo bóng đá này, thứ tự ứng dụng có thể quan trọng; Vì vậy, trong thực tế, bạn sẽ muốn truy vấn nguồnĐặt hàng bởi
Một số khóa đặt hàng.
Hãy xem xét một ví dụ thiên văn ngoài đời thực. Chúng tôi sẽ mở rộng truy vấnSupernovae
Sử dụng cách đọc kèo bóng đá quy tắc viết lại theo hướng bảng:
Tạo cách đọc kèo bóng đá bí danh bảng (T TSQuery Key, S tsquery);
Chúng ta có thể thay đổi cách đọc kèo bóng đá quy tắc viết lại chỉ bằng cách cập nhật bảng:
Cập nhật bí danh
Viết lại có thể chậm khi có nhiều quy tắc viết lại, vì nó kiểm tra mọi quy tắc cho một trận đấu có thể. Để lọc ra cách đọc kèo bóng đá quy tắc không ứng cử viên rõ ràng, chúng ta có thể sử dụng cách đọc kèo bóng đá toán tử ngăn chặn chotsquery
Loại. Trong ví dụ dưới đây, chúng tôi chỉ chọn những quy tắc có thể khớp với truy vấn ban đầu:
Chọn TS_REWRITE ('A & B' :: Tsquery,
Phương pháp được mô tả trong phần này đã bị lỗi thời bởi việc sử dụng cách đọc kèo bóng đá cột được tạo được lưu trữ, như được mô tả trongPhần 12.2.2.
Khi sử dụng một cột riêng để lưu trữTSVector
Đại diện cho cách đọc kèo bóng đá tài liệu của bạn, cần phải tạo một kích hoạt để cập nhậttsVector
Cột Khi cách đọc kèo bóng đá cột nội dung tài liệu thay đổi. Hai chức năng kích hoạt tích hợp có sẵn cho việc này hoặc bạn có thể tự viết.
tsVector_update_trigger (tsVector_column_name
,CONFIG_NAME
,text_column_name
[, ...])tsVector_column_name
,config_column_name
,text_column_name
[, ...])
cách đọc kèo bóng đá chức năng kích hoạt này tự động tính toán AtsVector
Cột từ một hoặc nhiều cột văn bản, dưới sự kiểm soát của cách đọc kèo bóng đá tham số được chỉ định trongTạo Trigger
lệnh. Một ví dụ về việc sử dụng của họ là:
Tạo tin nhắn bảng (
Đã tạo trình kích hoạt này, bất kỳ thay đổi nào trongTiêu đề
hoặcBody
Sẽ tự động được phản ánh thànhTSV
, mà không cần phải lo lắng về nó.
Đối số kích hoạt đầu tiên phải là tên củatsVector
Cột sẽ được cập nhật. Đối số thứ hai chỉ định cấu hình tìm kiếm văn bản được sử dụng để thực hiện chuyển đổi.tsVector_update_trigger
, tên cấu hình chỉ đơn giản là đối số kích hoạt thứ hai. Nó phải được định mức lược đồ như được hiển thị ở trên, do đó hành vi kích hoạt sẽ không thay đổi với cách đọc kèo bóng đá thay đổi trongsearch_path
. VìTSVECTOR_UPDATE_TRIGGER_COLUMN
, Đối số kích hoạt thứ hai là tên của một cột bảng khác, phải thuộc loạiRegconfig
. Điều này cho phép một lựa chọn cấu hình trên mỗi hàng được thực hiện.Text
, Varchar
hoặcChar
). Chúng sẽ được bao gồm trong tài liệu theo thứ tự được đưa ra.
Giới hạn của cách đọc kèo bóng đá kích hoạt tích hợp này là chúng đối xử với tất cả cách đọc kèo bóng đá cột đầu vào. Để xử lý cách đọc kèo bóng đá cột khác nhau - ví dụ, tiêu đề trọng lượng khác với TSV - cần phải viết một kích hoạt tùy chỉnh.PL/PGSQLlàm ngôn ngữ kích hoạt:
Tạo hàm message_trigger () trả về kích hoạt là $$
Hãy nhớ rằng điều quan trọng là chỉ định tên cấu hình một cách đọc kèo bóng đá rõ ràng khi tạoTSVECTOR
Giá trị bên trong cách đọc kèo bóng đá kích hoạt, để nội dung của cột sẽ không bị ảnh hưởng bởi cách đọc kèo bóng đá thay đổi thànhDefault_Text_Search_Config
. Việc không làm điều này có khả năng dẫn đến cách đọc kèo bóng đá vấn đề như kết quả tìm kiếm thay đổi sau khi kết xuất và khôi phục.
Hàmts_stat
rất hữu ích cho việc kiểm tra cấu hình của bạn và tìm ứng viên từ dừng.
ts_stat (SQLQuery
Text
, [Trọng lượng
Text
, ]Word
Text
, OUTNDOC
Số nguyên
,,Nentry
Số nguyên
) trả vềSetof Record
SQLQuery
là giá trị văn bản chứa truy vấn SQL phải trả về mộttsVector
cột.ts_stat
Thực thi truy vấn và trả về số liệu thống kê về từng từ vựng riêng biệt (từ) có trongTSVECTOR
Dữ liệu. cách đọc kèo bóng đá cột được trả về là
Word
Text
- Giá trị của từ vựng
NDOC
Số nguyên
- số lượng tài liệu (tsVector
S) Từ xảy ra trong
Nentry
Số nguyên
- Tổng số lần xuất hiện của từ
nếuTrọng lượng
được cung cấp, chỉ có một trong những trọng số đó được cách đọc kèo bóng đá.
Ví dụ: để tìm mười từ thường xuyên nhất trong bộ sưu tập tài liệu:
Chọn * từ ts_stat ('chọn vectơ từ apod')
giống nhau, nhưng chỉ đếm cách đọc kèo bóng đá từ xuất hiện với trọng lượngA
hoặcB
:
Chọn * từ ts_stat ('chọn vectơ từ apod', 'ab'))
Nếu bạn thấy bất cứ điều gì trong tài liệu không chính xác, không khớpMẫu nàyĐể báo cáo vấn đề tài liệu.