Hành vi của cấu hình tìm kiếm văn kèo bóng đá cúp c2 tùy chỉnh có thể dễ dàng trở nên khó hiểu. Các chức năng được mô tả trong phần này rất hữu ích để kiểm tra các đối tượng tìm kiếm văn kèo bóng đá cúp c2. Bạn có thể kiểm tra một cấu hình hoàn chỉnh hoặc kiểm tra trình phân tích cú pháp và từ điển riêng biệt.
hàmTS_DEBUG
Cho phép dễ dàng kiểm tra cấu hình tìm kiếm văn kèo bóng đá cúp c2.
ts_debug ([config
Regconfig
, ]Document
Text
,, NGOÀIbí danh
Text
,, NGOÀIMô tả
Text
,, NGOÀImã thông báo
Text
,, NGOÀITừ điển
Regdictionary []
,, NGOÀITừ điển
Regdictionary
,, NGOÀILexeme
Text []
) trả về kèo bóng đá cúp c2 ghi setof
ts_debug
Hiển thị thông tin về mỗi mã thông báoDocument
Được sản xuất bởi trình phân tích cú pháp và được xử lý bởi các từ điển được cấu hình. Nó sử dụng cấu hình được chỉ định bởiconfig
hoặcdefault_text_search_config
Nếu đối số đó bị bỏ qua.
ts_debug
Trả về một hàng cho mỗi mã thông báo được xác định trong văn kèo bóng đá cúp c2 của trình phân tích cú pháp. Các cột được trả về là
bí danh
Text
- Tên ngắn của loại mã thông báo
Mô tả
Text
- Mô tả loại mã thông báo
mã thông báo
Text
- Văn kèo bóng đá cúp c2 của mã thông báo
Từ điển
Regdictionary []
- Từ điển được chọn bởi cấu hình cho loại mã thông báo này
Từ điển
Regdictionary
14065_14115null
Nếu không có
Lexeme
Text []
- Lexeme (s) được sản xuất bởi từ điển đã nhận ra mã thông báo hoặcnull
Nếu không có; một mảng trống () có nghĩa là nó được công nhận là một từ dừng
Đây là một ví dụ đơn giản:
14643_16648
Để trình diễn rộng rãi hơn, trước tiên chúng tôi tạo ra mộtpublic.english
Cấu hình và từ điển ISPELL cho ngôn ngữ tiếng Anh:
Tạo cấu hình tìm kiếm văn kèo bóng đá cúp c2 công khai.English (copy = pg_catalog.english); Tạo từ điển tìm kiếm văn kèo bóng đá cúp c2 English_ispell ( Template = ispell, Dictfile = tiếng Anh, Afffile = tiếng Anh, Stopwords = tiếng Anh ); Thay đổi cấu hình tìm kiếm văn kèo bóng đá cúp c2 công khai.english Thay đổi ánh xạ cho asciiword bằng English_ispell, English_stem;
17226_18005
Trong ví dụ này, từsáng nhất
đã được trình phân tích cú pháp công nhận làASCII Word
(bí danhasciiword
). Đối với loại mã thông báo này, danh sách từ điển làEnglish_ispell
vàEnglish_stem
. Từ được công nhận bởiEnglish_ispell
, đã giảm nó thành danh từSáng
. TừSupernovaes
không được biết đếnEnglish_ispell
Từ điển để nó được chuyển sang từ điển tiếp theo, và may mắn thay, đã được công nhận (trên thực tế,18706_18720
là một từ điển bóng tuyết nhận ra mọi thứ; Đó là lý do tại sao nó được đặt ở cuối danh sách từ điển).
TừThe
đã được công nhận bởiEnglish_ispell
Từ điển như một từ dừng (Phần 12.6.1) và sẽ không được lập chỉ mục. Các không gian cũng bị loại bỏ, vì cấu hình không cung cấp từ điển nào cho chúng.
Bạn có thể giảm chiều rộng của đầu ra bằng cách chỉ định rõ ràng những cột bạn muốn thấy:
19373_19834
Các chức năng sau cho phép kiểm tra trực tiếp trình phân tích cú pháp tìm kiếm văn kèo bóng đá cúp c2.
ts_parse (Parser_name
Text
,Document
Text
,, NGOÀITokid
Số nguyên
, Outmã thông báo
Text
) Trả vềSETOF Record
ts_parse (Parser_oid
OID
,Document
Text
,, NGOÀITokid
Số nguyên
, OUTmã thông báo
Text
) trả vềSETOF Record
ts_parse
phân tích cú pháp đã choDocument
và trả về một loạt các kèo bóng đá cúp c2 ghi, một kèo bóng đá cúp c2 ghi cho mỗi mã thông báo được tạo bởi phân tích cú pháp. Mỗi kèo bóng đá cúp c2 ghi bao gồm mộtTokid
Hiển thị loại mã thông báo được gán và Amã thông báo
đó là văn kèo bóng đá cúp c2 của mã thông báo. Ví dụ:
Chọn * từ ts_parse ('mặc định', '123 - một số'); tokid | mã thông báo -------+-------- 22 | 123 12 | 12 | - 1 | Một 12 | 1 | con số
ts_token_type (Parser_name
Text
, raTokid
Số nguyên
,, NGOÀIbí danh
Text
, OUTMô tả
Text
) trả vềSETOF Record
ts_token_type (Parser_oid
oid
, raTokid
Số nguyên
,, NGOÀIbí danh
Text
, raMô tả
Text
) Trả vềSETOF Record
ts_token_type
Trả về một bảng mô tả từng loại mã thông báo mà trình phân tích cú pháp được chỉ định có thể nhận ra. Đối với mỗi loại mã thông báo, bảng cung cấp số nguyênTokid
Trình phân tích cú pháp sử dụng để dán nhãn mã thông báo thuộc loại đó,bí danh
Tên loại mã thông báo trong các lệnh cấu hình và ngắnMô tả
. Ví dụ:
23069_24294
Thets_lexize
Hàm tạo điều kiện kiểm kèo bóng đá cúp c2 từ điển.
ts_lexize (dict
Regdictionary
,mã thông báo
Text
) trả vềText []
ts_lexize
Trả về một mảng từ vựng nếu đầu vàomã thông báo
được biết đến từ điển hoặc một mảng trống nếu mã thông báo được biết đến từ điển nhưng đó là một từ dừng hoặcnull
Nếu đó là một từ không xác định.
ví dụ:
Chọn TS_LEXIZE ('English_stem', 'Stars'); ts_lexize ----------- ngôi sao Chọn ts_lexize ('English_stem', 'a'); ts_lexize -----------
Thets_lexize
Hàm mong đợi mộtmã thông báo, không phải văn kèo bóng đá cúp c2. Đây là một trường hợp điều này có thể gây nhầm lẫn:
Chọn TS_LEXIZE ('Thesaurus_astro', 'Supernovae Stars') là NULL; ? Cột? ---------- t
Từ điển Thesaurusthesaurus_astro
không biết cụm từSupernovae Stars
, nhưngts_lexize
Thất bại vì nó không phân tích văn kèo bóng đá cúp c2 đầu vào nhưng coi nó là một mã thông báo duy nhất. Sử dụngPlainto_tsquery
hoặcto_tsVector
Để kiểm kèo bóng đá cúp c2 từ điển từ điển, ví dụ:
Chọn Plainto_tsquery ('Supernovae Stars'); Plainto_tsquery ----------------- 'Sn'