Postgresql 8.4.22 Tài liệu | ||||
---|---|---|---|---|
prev | Backward nhanh | Chương 12. Tìm kiếm toàn văn | Chuyển tiếp nhanh | NEXT |
trình kèo chấp bóng đá hôm nay tìm kiếm văn bản chịu trách nhiệm chia tài liệu thô văn bản thànhmã thông báovà xác định mỗi Loại mã thông báo, trong đó tập hợp các loại có thể được xác định bởi trình kèo chấp bóng đá hôm nay chính nó. Lưu ý rằng trình kèo chấp bóng đá hôm nay hoàn toàn không sửa đổi văn bản - Nó chỉ đơn giản là xác định ranh giới từ hợp lý. Vì điều này Phạm vi hạn chế, ít cần tùy chỉnh cụ thể của ứng dụng trình kèo chấp bóng đá hôm nay so với từ điển tùy chỉnh. Hiện tạiPostgreSQLChỉ cung cấp một trình kèo chấp bóng đá hôm nay tích hợp, được tìm thấy là hữu ích cho một phạm vi của các ứng dụng.
Trình kèo chấp bóng đá hôm nay tích hợp được đặt tênpg_catalog.default. Nó nhận ra 23 mã thông báo Các loại:
Bảng 12-1. Các loại mã thông báo của trình kèo chấp bóng đá hôm nay mặc định
bí danh | Mô tả | Ví dụ |
---|---|---|
asciiword | Word, tất cả các chữ cái ASCII | Voi |
Word | Word, tất cả các chữ cái | Mañana |
numword | Word, chữ cái và chữ số | beta1 |
asciihword | Từ Hyphenated, tất cả ASCII | cập nhật |
HWORD | Từ được viết, tất cả các chữ cái | |
numHword | Từ, chữ cái và chữ số | PostgreSQL-beta1 |
HWORD_ASCIIPART | Phần từ được kèo chấp bóng đá hôm nay, tất cả ASCII | PostgreSQLTrong bối cảnhPostgresql-beta1 |
HWORD_PART | Phần từ được kèo chấp bóng đá hôm nay, tất cả các chữ cái | LógicohoặcMatemáticaTrong bối cảnhLÓGICO-MATEMATICA |
HWORD_NUMPART | Phần, chữ cái và chữ số | beta1Trong bối cảnhPostgresql-beta1 |
Địa chỉ email | foo@example.com | |
Giao thức | Đầu giao thức | http: // |
url | url | example.com/stuff/index.html |
host | host | ví dụ.com |
url_path | đường dẫn url | /stuff/index.html, trong bối cảnh của một url |
FILE | Tệp hoặc tên đường dẫn | /usr/local/foo.txt, nếu không Trong một url |
SFloat | Ký hiệu khoa học | -1.234e56 |
float | ký hiệu thập kèo chấp bóng đá hôm nay | -1.234 |
int | Số nguyên đã ký | -1234 |
UINT | Số nguyên không dấu | 1234 |
phiên bản | số phiên bản | 8.3.0 |
TAG | TAG XML | <a href = "từ điển.html" |
thực thể | thực thể XML | & amp; |
trống | Biểu tượng không gian | (bất kỳ khoảng trắng hoặc dấu câu nào không được công nhận) |
Lưu ý:Khái niệm của trình kèo chấp bóng đá hôm nay"Thư"được xác định bởi cơ sở dữ liệu Cài đặt địa phương, cụ thểlc_ctype. Các từ chỉ chứa cơ bản Các chữ cái ASCII được báo cáo là một loại mã thông báo riêng biệt, vì nó đôi khi hữu ích để kèo chấp bóng đá hôm nay biệt chúng. Ở hầu hết châu Âu Ngôn ngữ, loại mã thông báoWordvàasciiwordnên được xử lý như nhau.
Trình kèo chấp bóng đá hôm nay có thể tạo ra các mã thông báo chồng chéo từ cùng một phần của văn bản. Ví dụ, một từ được gạch nối sẽ được báo cáo cả hai là toàn bộ từ và như mỗi thành phần:
chọn bí danh, mô tả, mã thông báo từ ts_debug ('foo-Bar-beta1'); Bí danh | Mô tả | mã thông báo -----------------+------------------------------------------+------------------- numHword | Từ ngữ, chữ cái và chữ số | Foo-Bar-beta1 HWORD_ASCIIPART | Phần từ dấu gạch nối, tất cả ASCII | foo trống | Biểu tượng không gian | - HWORD_ASCIIPART | Phần từ dấu gạch nối, tất cả ASCII | thanh trống | Biểu tượng không gian | - HWORD_NUMPART | Bầu, chữ dấu gạch nối, chữ cái và chữ số | beta1
Hành vi này là mong muốn vì nó cho phép các tìm kiếm hoạt động cho cả toàn bộ từ ghép và cho các thành phần. Đây là Một ví dụ về hướng dẫn khác:
chọn bí danh, mô tả, mã thông báo từ ts_debug ('http://example.com/stuff/index.html'); Bí danh | Mô tả | mã thông báo ----------+---------------+-------------------------------------- Giao thức | Đầu giao thức | http: // URL | URL | Ví dụ.com/stuff/index.html Máy chủ | Máy chủ | Ví dụ.com url_path | Đường dẫn URL | /stuff/index.html