Postgresql 9.3.25 Tài liệu | ||||
---|---|---|---|---|
prev | UP | Chương 12. Đầy đủ Tìm kiếm văn kèo bóng đá hôm nay và ngày mai | NEXT |
Hành vi của cấu hình tìm kiếm văn kèo bóng đá hôm nay và ngày mai tùy chỉnh có thể dễ dàng trở nên khó hiểu. Các chức năng được mô tả trong phần này là Hữu ích để kiểm tra các đối tượng tìm kiếm văn kèo bóng đá hôm nay và ngày mai. Bạn có thể kiểm tra hoàn chỉnh Cấu hình, hoặc trình phân tích cú pháp kiểm tra và từ điển riêng biệt.
hàmts_debug
cho phép dễ dàng
kiểm tra cấu hình tìm kiếm văn kèo bóng đá hôm nay và ngày mai.
ts_debug ([ config Regconfig, ]Document Text,,
NGOÀIbí danh Text,,
NGOÀIMô tả Text,,
NGOÀImã thông báo Text,,
NGOÀITừ điển Regdictionary [],,
NGOÀITừ điển Regdictionary,,
NGOÀILexeme Text [])
trả về kèo bóng đá hôm nay và ngày mai ghi setof
11262_11272
11277_11322Documentnhư
được sản xuất bởi trình phân tích cú pháp và được xử lý bởi cấu hình
Từ điển. Nó sử dụng cấu hình được chỉ định bởiconfighoặcdefault_text_search_configNếu đối số đó là
bỏ qua.
ts_debug
Trả về một hàng cho mỗi
Mã thông báo được xác định trong văn kèo bóng đá hôm nay và ngày mai của trình phân tích cú pháp. Các cột trở lại
là
bí danh Text- Tên ngắn của loại mã thông báo
Mô tả Text- Mô tả loại mã thông báo
mã thông báo Text- Văn kèo bóng đá hôm nay và ngày mai của mã thông báo
Từ điển Regdictionary []- Từ điển được chọn bởi Cấu hình cho loại mã thông báo này
Từ điển Regdictionary- Từ điển nhận ra mã thông báo hoặcnullNếu không có
Lexeme Text []- Lexeme (s) được sản xuất bởi từ điển đã nhận ra mã thông báo hoặcnullNếu không có; một mảng trống () có nghĩa là nó đã được công nhận là một từ dừng
Đây là một ví dụ đơn giản:
12875_14891
Để trình diễn rộng rãi hơn, trước tiên chúng tôi tạo ra mộtpublic.englishCấu hình và từ điển ISPELL cho ngôn ngữ tiếng Anh:
Tạo cấu hình tìm kiếm văn kèo bóng đá hôm nay và ngày mai công khai.English (copy = pg_catalog.english); Tạo từ điển tìm kiếm văn kèo bóng đá hôm nay và ngày mai English_ispell ( Template = ispell, Dictfile = tiếng Anh, Afffile = tiếng Anh, Stopwords = tiếng Anh ); Thay đổi cấu hình tìm kiếm văn kèo bóng đá hôm nay và ngày mai công khai.english Thay đổi ánh xạ cho asciiword bằng English_ispell, English_stem;
15453_16235
Trong ví dụ này, từsáng nhấtWAS Được công nhận bởi trình phân tích cú pháp làASCII Word(bí danhasciiword). Đối với loại mã thông báo này, Danh sách từ điển làEnglish_ispellvàEnglish_stem. Từ được công nhận bởiEnglish_ispell, đã giảm nó thành danh từSáng. TừSupernovaeskhông được biết đếnEnglish_ispellTừ điển để nó được chuyển cho Từ điển tiếp theo, và, may mắn thay, đã được công nhận (trên thực tế,English_stemlà một từ điển bóng tuyết trong đó nhận ra mọi thứ; Đó là lý do tại sao nó được đặt ở cuối của danh sách từ điển).
TừTheđã được công nhận bởiEnglish_ispellTừ điển như một từ dừng (Phần 12.6.1) và sẽ không được lập chỉ mục. Các không gian cũng bị loại bỏ, Vì cấu hình không cung cấp từ điển nào cho họ.
Bạn có thể giảm chiều rộng của đầu ra bằng cách chỉ định rõ ràng Cột bạn muốn xem:
Chọn bí danh, mã thông báo, từ điển, từ vựng Từ ts_debug ('public.english', 'các siêu tân tinh sáng nhất'); Bí danh | mã thông báo | Từ điển | từ vựng -----------+-------------+----------------+------------- asciiword | | Tiếng Anh_ispell | trống | | | asciiword | Sáng nhất | Tiếng Anh_ispell | sáng trống | | | asciiword | Supernovaes | Tiếng Anh_stem | supernova
Các chức năng sau cho phép kiểm tra trực tiếp tìm kiếm văn kèo bóng đá hôm nay và ngày mai trình phân tích cú pháp.
ts_parse (Parser_name Text, Document Text,, NGOÀITokid Số nguyên, ramã thông báo 18500_18506) trả vềSetof Recordts_parse (Parser_oid oid, Document Text,, NGOÀITokid Số nguyên, OUTmã thông báo Text) trả vềSetof Record
ts_parse
phân tích cú pháp đã choDocumentvà trả về một loạt
Hồ sơ, một cho mỗi mã thông báo được tạo ra bằng cách phân tích cú pháp. Mỗi kèo bóng đá hôm nay và ngày mai ghi
Bao gồm mộtTokidHiển thị được gán
loại mã thông báo và mộtmã thông báođó là văn kèo bóng đá hôm nay và ngày mai
của mã thông báo. Ví dụ:
Chọn * từ ts_parse ('mặc định', '123 - một số'); tokid | mã thông báo -------+-------- 22 | 123 12 | 12 | - 1 | Một 12 | 1 | con số
ts_token_type (Parser_name Text, OutTokid Số nguyên,, NGOÀIbí danh 19692_19698, OutMô tả Text) trở lạikèo bóng đá hôm nay và ngày mai ghi Setofts_token_type (Parser_oid oid, OutTokid Số nguyên, NGOÀIbí danh Text, OutMô tả Text) trả vềkèo bóng đá hôm nay và ngày mai ghi Setof
ts_token_type
Trả về một bảng
trong đó mô tả từng loại mã thông báo mà trình phân tích cú pháp được chỉ định có thể
nhận ra. Đối với mỗi loại mã thông báo, bảng cung cấp số nguyênTokidmà trình phân tích cú pháp sử dụng để dán nhãn
mã thông báo thuộc loại đó,bí danhTên đó
loại mã thông báo trong các lệnh cấu hình và ngắnMô tả. Ví dụ:
Chọn * từ ts_token_type ('mặc định'); tokid | Bí danh | Sự miêu tả -------+---------------------+-------------------------------------------------- 1 | asciiword | Từ, tất cả ascii 2 | Từ | Từ, tất cả các chữ cái 3 | Numword | Từ, chữ cái và chữ số 4 | Email | Địa chỉ email 5 | URL | URL 6 | Máy chủ | Chủ nhà 7 | sfloat | Ký hiệu khoa học 8 | Phiên kèo bóng đá hôm nay và ngày mai | Số phiên kèo bóng đá hôm nay và ngày mai 9 | HWORD_NUMPART | Phần, chữ cái và chữ số chữ báo chí 10 | HWORD_PART | Phần từ được gạch nối, tất cả các chữ cái 11 | HWORD_ASCIIPART | Phần từ được gạch nối, tất cả ascii 12 | trống | Biểu tượng không gian 13 | Tag | Thẻ XML 14 | Giao thức | Đầu giao thức 15 | numHword | Từ, chữ cái và chữ số được gạch nối 16 | asciihword | Từ Hyphenated, tất cả ascii 17 | HWORD | Từ được báo chí, tất cả các chữ cái 18 | url_path | Đường dẫn URL 19 | Tệp | Tệp hoặc tên đường dẫn 20 | FLOAT | Ký hiệu thập phân 21 | int | Đã ký Số nguyên 22 | uint | Số nguyên không dấu 23 | thực thể | Thực thể XML
Thets_lexize
Hàm tạo điều kiện
Kiểm kèo bóng đá hôm nay và ngày mai từ điển.
ts_lexize (dict Regdictionary, 22265_22272 Text) trả vềText []
ts_lexize
Trả về một mảng
từ bỏ nếu đầu vàomã thông báođược biết đến
đến từ điển hoặc một mảng trống nếu mã thông báo được biết đến
Từ điển nhưng nó là một từ dừng, hoặcnullNếu đó là một từ không xác định.
ví dụ:
Chọn TS_LEXIZE ('English_stem', 'Stars'); ts_lexize ----------- ngôi sao Chọn ts_lexize ('English_stem', 'a'); ts_lexize -----------
Lưu ý:The
ts_lexize
Hàm mong đợi mộtmã thông báo, không phải văn kèo bóng đá hôm nay và ngày mai. Đây là một trường hợp Điều này có thể gây nhầm lẫn:Chọn ts_lexize ('thesaurus_astro', 'Supernovae Stars') là NULL; ? Cột? ---------- t23183_23210thesaurus_astrokhông biết cụm từSupernovae Stars, nhưng
ts_lexize
thất bại vì nó không phân tích lại đầu vào Văn kèo bóng đá hôm nay và ngày mai nhưng coi nó như một mã thông báo duy nhất. Sử dụngPlainto_tsquery
hoặcto_tsVector
Để kiểm kèo bóng đá hôm nay và ngày mai từ điển từ điển, cho ví dụ:Chọn Plainto_tsquery ('Supernovae Stars'); Plainto_tsquery ----------------- 'Sn'