Phiên bản được hỗ trợ:hiện tại(17) /16 / 15 / 14 / 13
Phiên bản phát triển:18 / Devel
Phiên bản không được hỗ trợ:12 / 11 / 10 / 9.6 / 9.5 / 9.4 / 9.3 / 9.2 / 9.1 / 9.0 / 8.4 / 8.3

12.6. kèo bóng đá hôm nay và ngày mai#

kèo bóng đá hôm nay và ngày mai được sử dụng để loại bỏ các từ không nên xem xét trong tìm kiếm (Dừng từ) và đếnbình thườngCác từ sao cho các dạng dẫn xuất khác nhau của cùng kèo bóng đá hôm nay và ngày mai từ sẽ khớp. kèo bóng đá hôm nay và ngày mai từ được chuẩn hóa thành công được gọi làLexeme. Ngoài việc cải thiện chất lượng tìm kiếm, bình thường hóa và loại bỏ kèo bóng đá hôm nay và ngày mai từ dừng, giảm kích thước củatsVectorĐại diện của kèo bóng đá hôm nay và ngày mai tài liệu, do đó cải thiện hiệu suất. Bình thường hóa không phải lúc nào cũng có ý nghĩa ngôn ngữ và thường phụ thuộc vào ngữ nghĩa ứng dụng.

kèo bóng đá hôm nay và ngày mai số ví dụ về chuẩn hóa:

  • Ti ngôn ngữ - kèo bóng đá hôm nay và ngày mai ISPELL cố gắng giảm các từ đầu vào xuống dạng chuẩn hóa; kèo bóng đá hôm nay và ngày mai thân cây loại bỏ kết thúc từ

  • urlVị trí có thể được chính thức hóa để làm cho kèo bóng đá hôm nay và ngày mai URL tương đương phù hợp:

    • http: //www.pgsql.ru/db/mw/index.html

    • http: //www.pgsql.ru/db/mw/

    • http: //www.pgsql.ru/db/../db/mw/index.html

  • Tên màu có thể được thay thế bằng kèo bóng đá hôm nay và ngày mai giá trị thập lục phân của chúng, ví dụ:Đỏ, xanh lá cây, xanh dương, Magenta - FF0000, 00FF00, 0000FF, FF00FF

  • Nếu số lượng lập chỉ mục, chúng ta có thể xóa kèo bóng đá hôm nay và ngày mai số chữ số phân số để giảm phạm vi số có thể, ví dụ3.14159265359,3.1415926,3.14sẽ giống nhau sau khi bình thường hóa nếu chỉ có hai chữ số được giữ sau điểm thập phân.

kèo bóng đá hôm nay và ngày mai là một chương trình chấp nhận mã thông báo làm đầu vào và trả về:

  • Một mảng từ vựng nếu mã thông báo đầu vào được biết đến kèo bóng đá hôm nay và ngày mai (lưu ý rằng một mã thông báo có thể tạo ra nhiều hơn một từ vựng)

  • kèo bóng đá hôm nay và ngày mai từ vựng duy nhất vớiTSL_Filter13421_13562Lọc kèo bóng đá hôm nay và ngày mai)

  • Một mảng trống nếu kèo bóng đá hôm nay và ngày mai biết mã thông báo, nhưng đó là một từ dừng

  • nullNếu kèo bóng đá hôm nay và ngày mai không nhận ra mã thông báo đầu vào

PostgreSQLCung cấp kèo bóng đá hôm nay và ngày mai được xác định trước cho nhiều ngôn ngữ. Ngoài ra còn có một số mẫu được xác định trước có thể được sử dụng để tạo kèo bóng đá hôm nay và ngày mai mới với các tham số tùy chỉnh. Mỗi mẫu kèo bóng đá hôm nay và ngày mai được xác định trước được mô tả dưới đây. Nếu không có mẫu hiện có phù hợp, có thể tạo ra các mẫu mới; XemPREDT/khu vực củaPostgreSQLPhân phối cho kèo bóng đá hôm nay và ngày mai ví dụ.

Cấu hình tìm kiếm văn bản liên kết một trình phân tích cú pháp cùng với một bộ kèo bóng đá hôm nay và ngày mai để xử lý mã thông báo đầu ra của trình phân tích cú pháp. Đối với mỗi loại mã thông báo mà trình phân tích cú pháp có thể trả về, một danh sách kèo bóng đá hôm nay và ngày mai riêng biệt được chỉ định bởi cấu hình. Khi một mã thông báo thuộc loại đó được tìm thấy bởi trình phân tích cú pháp, mỗi kèo bóng đá hôm nay và ngày mai trong danh sách được tư vấn lần lượt, cho đến khi một số kèo bóng đá hôm nay và ngày mai nhận ra nó là một từ đã biết. Nếu nó được xác định là một từ dừng hoặc nếu không có kèo bóng đá hôm nay và ngày mai nhận ra mã thông báo, nó sẽ bị loại bỏ và không được lập chỉ mục hoặc tìm kiếm. Thông thường, kèo bóng đá hôm nay và ngày mai đầu tiên trả về khôngnullĐầu ra xác định kết quả và bất kỳ kèo bóng đá hôm nay và ngày mai còn lại nào không được tư vấn; Nhưng một kèo bóng đá hôm nay và ngày mai lọc có thể thay thế từ đã cho bằng một từ đã được sửa đổi, sau đó được truyền đến các kèo bóng đá hôm nay và ngày mai tiếp theo.

15270_15474SnowballStemmer hoặcđơn giản, nhận ra mọi thứ. Ví dụ: cho kèo bóng đá hôm nay và ngày mai tìm kiếm dành riêng cho thiên văn học (Astro_enCấu hình) Người ta có thể liên kết loại mã thông báoasciiword(ASCII Word) đến một kèo bóng đá hôm nay và ngày mai đồng nghĩa với thuật ngữ thiên văn, kèo bóng đá hôm nay và ngày mai tiếng Anh chung và ASnowballEnglish Stemmer:

thay đổi cấu hình tìm kiếm văn bản astro_en
    Thêm ánh xạ cho asciiword bằng astrosyn, english_ispell, English_stem;

Một kèo bóng đá hôm nay và ngày mai lọc có thể được đặt ở bất cứ đâu trong danh sách, ngoại trừ ở cuối nơi nó sẽ vô dụng. Lọc kèo bóng đá hôm nay và ngày mai rất hữu ích để bình thường hóa một phần các từ để đơn giản hóa nhiệm vụ của các kèo bóng đá hôm nay và ngày mai sau này. Ví dụ: kèo bóng đá hôm nay và ngày mai lọc có thể được sử dụng để loại bỏ các điểm nhấn khỏi các chữ cái có dấu, như được thực hiện bởiUnaccentMô -đun.

12.6.1. Dừng từ#

kèo bóng đá hôm nay và ngày mai từ dừng là những từ rất phổ biến, xuất hiện trong hầu hết mọi tài liệu và không có giá trị phân biệt đối xử. Do đó, chúng có thể bị bỏ qua trong bối cảnh tìm kiếm toàn văn. Ví dụ: mọi văn bản tiếng Anh đều chứa kèo bóng đá hôm nay và ngày mai từ nhưAThe, vì vậy việc lưu trữ chúng là vô ích. Tuy nhiên, kèo bóng đá hôm nay và ngày mai từ dừng lại ảnh hưởng đến kèo bóng đá hôm nay và ngày mai vị trí trongTSVECTOR, từ đó ảnh hưởng đến xếp hạng:

chọn to_tsvector ('tiếng Anh', 'trong danh sách kèo bóng đá hôm nay và ngày mai từ dừng');
        to_tsVector
--------------------------------
 'Danh sách': 3 'Dừng': 5 'Word': 6

Vị trí bị thiếu 1,2,4 là do kèo bóng đá hôm nay và ngày mai từ dừng. Xếp hạng được tính toán cho kèo bóng đá hôm nay và ngày mai tài liệu có và không có từ dừng hoàn toàn khác:

Chọn TS_RANK_CD (to_TSVECTOR ('English', 'trong danh sách kèo bóng đá hôm nay và ngày mai từ dừng'), to_tsquery ('list & stop'));
 TS_RANK_CD
------------
       0,05

Chọn ts_rank_cd (to_tsvector ('tiếng Anh', 'danh sách kèo bóng đá hôm nay và ngày mai từ dừng'), to_tsquery ('list & stop'));
 TS_RANK_CD
------------
        0,1

Nó tùy thuộc vào kèo bóng đá hôm nay và ngày mai cụ thể cách nó đối xử với các từ dừng. Ví dụ,ISPELLkèo bóng đá hôm nay và ngày mai đầu tiên bình thường hóa các từ và sau đó nhìn vào danh sách các từ dừng, trong khiSnowballstemmers first check the list of stop words. Lý do cho các hành vi khác nhau là kèo bóng đá hôm nay và ngày mai nỗ lực để giảm tiếng ồn.

12.6.2. kèo bóng đá hôm nay và ngày mai đơn giản#

18518_18524đơn giảnMẫu kèo bóng đá hôm nay và ngày mai hoạt động bằng cách chuyển đổi mã thông báo đầu vào thành chữ thường và kiểm tra nó đối với một tệp các từ dừng. Nếu nó được tìm thấy trong tệp thì một mảng trống sẽ được trả về, khiến mã thông báo bị loại bỏ. Nếu không, dạng từ có hàm lượng từ thấp hơn được trả về dưới dạng từ vựng được chuẩn hóa. Ngoài ra, kèo bóng đá hôm nay và ngày mai có thể được cấu hình để báo cáo các từ không ngừng là không được nhận ra, cho phép chúng được chuyển sang kèo bóng đá hôm nay và ngày mai tiếp theo trong danh sách.

Đây là một ví dụ về định nghĩa kèo bóng đá hôm nay và ngày mai bằng cách sử dụngđơn giảnMẫu:

Tạo kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản công khai.simple_dict (
    Mẫu = pg_catalog.simple,
    Stopwords = tiếng Anh
);

ở đây,tiếng Anhlà tên cơ sở của kèo bóng đá hôm nay và ngày mai tệp của các từ dừng. Tên đầy đủ của tệp sẽ là$ Sharedir/Tsearch_data/English.stop, trong đó$ sharedircó nghĩa làPostgreSQLThư mục dữ liệu chia sẻ của cài đặt, thường là/USR/Local/Share/PostgreSQL(Sử dụngpg_config --SharedirĐể xác định nó nếu bạn không chắc chắn). Định dạng tệp chỉ đơn giản là kèo bóng đá hôm nay và ngày mai danh sách các từ, kèo bóng đá hôm nay và ngày mai từ trên mỗi dòng. Các đường trống và không gian dấu vết bị bỏ qua và trường hợp trên được gấp lại thành chữ thường, nhưng không có xử lý nào khác được thực hiện trên nội dung tệp.

Bây giờ chúng ta có thể kiểm tra kèo bóng đá hôm nay và ngày mai của chúng ta:

chọn ts_lexize ('public.simple_dict', 'có');
 ts_lexize
-----------
 Đúng

Chọn ts_lexize ('public.simple_dict', 'the');
 ts_lexize
-----------

Chúng ta cũng có thể chọn trả lạinull, thay vì từ có chữ thấp hơn, nếu nó không được tìm thấy trong tệp từ dừng. Hành vi này được chọn bằng cách đặt kèo bóng đá hôm nay và ngày maiChấp nhậntham số đếnSai. Tiếp tục ví dụ:

thay đổi kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản công khai.simple_dict (Accept = false);

Chọn ts_lexize ('public.simple_dict', 'có');
 ts_lexize
-----------

Chọn ts_lexize ('public.simple_dict', 'the');
 ts_lexize
-----------

Với cài đặt mặc định củaChấp nhận=TRUE, Chỉ hữu ích khi đặt Ađơn giảnkèo bóng đá hôm nay và ngày mai ở cuối danh sách các kèo bóng đá hôm nay và ngày mai, vì nó sẽ không bao giờ chuyển bất kỳ mã thông báo nào cho một kèo bóng đá hôm nay và ngày mai sau. Ngược lại,Chấp nhận=Saichỉ hữu ích khi có ít nhất một kèo bóng đá hôm nay và ngày mai sau.

THẬN TRỌNG

Hầu hết các loại kèo bóng đá hôm nay và ngày mai đều dựa vào các tệp cấu hình, chẳng hạn như các tệp của các từ dừng. Những tệp nàyphảiđược lưu trữ trong mã hóa UTF-8. Chúng sẽ được dịch sang mã hóa cơ sở dữ liệu thực tế, nếu điều đó khác, khi chúng được đọc vào máy chủ.

THẬN TRỌNG

Thông thường, một phiên cơ sở dữ liệu sẽ chỉ đọc một tệp cấu hình kèo bóng đá hôm nay và ngày mai chỉ một lần, khi nó được sử dụng lần đầu tiên trong phiên. Nếu bạn sửa đổi tệp cấu hình và muốn buộc các phiên hiện có để chọn nội dung mới, hãy phát hành mộtthay đổi kèo bóng đá hôm nay và ngày mai tìm kiếm văn bảnLệnh trên kèo bóng đá hôm nay và ngày mai. Đây có thể là mộtgiảCập nhật không thực sự thay đổi bất kỳ giá trị tham số nào.

12.6.3. kèo bóng đá hôm nay và ngày mai đồng nghĩa#

Mẫu kèo bóng đá hôm nay và ngày mai này được sử dụng để tạo kèo bóng đá hôm nay và ngày mai thay thế một từ bằng một từ đồng nghĩa. Các cụm từ không được hỗ trợ (sử dụng mẫu Thesaurus (Phần 12.6.4) cho điều đó). Một kèo bóng đá hôm nay và ngày mai đồng nghĩa có thể được sử dụng để khắc phục các vấn đề ngôn ngữ, ví dụ, để ngăn chặn một kèo bóng đá hôm nay và ngày mai gốc tiếng Anh giảm từMạnhParisHàngđếnpari. Nó đủ để có kèo bóng đá hôm nay và ngày maiParis Parisdòng trong kèo bóng đá hôm nay và ngày mai đồng nghĩa và đặt nó trướcEnglish_stemkèo bóng đá hôm nay và ngày mai. Ví dụ:

Chọn * từ ts_debug ('tiếng Anh', 'paris');
   Bí danh |   Mô tả | mã thông báo |  kèo bóng đá hôm nay và ngày mai |  kèo bóng đá hôm nay và ngày mai | từ vựng
-----------+------------------+-------+----------------+--------------+-------------
 asciiword | Từ, tất cả ASCII | Paris | English_stem | Tiếng Anh_stem | pari

Tạo kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản my_synonymy (
    Template = từ đồng nghĩa,
    Từ đồng nghĩa = my_syn từ
);

Thay đổi cấu hình tìm kiếm văn bản tiếng Anh
    Thay đổi ánh xạ cho asciiword
    Với my_synonymy, English_stem;

Chọn * từ ts_debug ('tiếng Anh', 'paris');
   Bí danh |   Mô tả | mã thông báo |       kèo bóng đá hôm nay và ngày mai | kèo bóng đá hôm nay và ngày mai | từ vựng
-----------+------------------+-------+-------------------------------+------------+-------------
 asciiword | Từ, tất cả ASCII | Paris | my_synonymy, English_stem | my_synonymy | Paris

Tham số duy nhất theo yêu cầu củaTừ đồng nghĩaMẫu làTừ đồng nghĩa, là tên cơ sở của tệp cấu hình của nó -my_synonymoussTrong ví dụ trên. Tên đầy đủ của tệp sẽ là$ sharedir/tsearch_data/my_synonymys.syn(trong đó$ sharedircó nghĩa làPostgreSQLThư mục dữ liệu chia sẻ của cài đặt). Định dạng tệp chỉ là kèo bóng đá hôm nay và ngày mai dòng cho mỗi từ được thay thế, với từ theo sau là từ đồng nghĩa của nó, được phân tách bằng không gian trắng. Các đường trống và không gian dấu vết bị bỏ qua.

TheTừ đồng nghĩaMẫu cũng có tham số tùy chọncaseSensitive, mặc định làSai. KhicaseSensitiveSai, kèo bóng đá hôm nay và ngày mai từ trong tệp đồng nghĩa được gấp lại thành chữ thường, như là mã thông báo đầu vào. Khi nó làtrue, kèo bóng đá hôm nay và ngày mai từ và mã thông báo không được gấp lại thành chữ thường, nhưng được so sánh AS-IS.

kèo bóng đá hôm nay và ngày mai dấu hoa thị (*) có thể được đặt ở cuối kèo bóng đá hôm nay và ngày mai từ đồng nghĩa trong tệp cấu hình. Điều này chỉ ra rằng từ đồng nghĩa là tiền tố. Dấu hoa thị bị bỏ qua khi mục được sử dụng trongto_tsVector (), nhưng khi nó được sử dụng trongto_tsquery (), Kết quả sẽ là mục truy vấn với điểm đánh dấu khớp tiền tố (xemPhần 12.3.2). Ví dụ: giả sử chúng ta có kèo bóng đá hôm nay và ngày mai mục này trong$ sharedir/tsearch_data/từ đồng nghĩa_sample.syn:

Postgres PGSQL
Postgresql PGSQL
Postgre PGSQL
Gogle Googl
Chỉ số chỉ mục*

Sau đó chúng ta sẽ nhận được kèo bóng đá hôm nay và ngày mai kết quả sau:

25943_26702

12.6.4. kèo bóng đá hôm nay và ngày mai Thesaurus#

Một kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai (đôi khi viết tắt làTZ) là kèo bóng đá hôm nay và ngày mai tập hợp các từ bao gồm thông tin về các mối quan hệ của các từ và cụm từ, tức là, các thuật ngữ rộng hơn (bt), kèo bóng đá hôm nay và ngày mai thuật ngữ hẹp hơn (nt), Điều khoản ưa thích, Điều khoản không được ưu tiên, Điều khoản liên quan, v.v.

Về cơ bản, một kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai thay thế tất cả các thuật ngữ không được ưu tiên bằng một thuật ngữ ưa thích và, tùy chọn, bảo tồn các thuật ngữ gốc để lập chỉ mục.PostgreSQL27555_27664cụm từHỗ trợ. Một kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai yêu cầu một tệp cấu hình của định dạng sau:

# Đây là kèo bóng đá hôm nay và ngày mai bình luận
Từ mẫu: từ được lập chỉ mục (các) từ
Thêm (các) từ mẫu: từ được lập chỉ mục nhiều hơn
...

trong đó đại tràng (:) Biểu tượng hoạt động như kèo bóng đá hôm nay và ngày mai dấu phân cách giữa kèo bóng đá hôm nay và ngày mai cụm từ và sự thay thế của nó.

Một kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai sử dụng ASubdictionary(được chỉ định trong cấu hình của kèo bóng đá hôm nay và ngày mai) để bình thường hóa văn bản đầu vào trước khi kiểm tra các kết quả phù hợp với cụm từ. Chỉ có thể chọn một bộ phụ. Một lỗi được báo cáo nếu sự phụ không thể nhận ra một từ. Trong trường hợp đó, bạn nên loại bỏ việc sử dụng từ hoặc dạy cho phụ về nó. Bạn có thể đặt dấu hoa thị (*) Khi bắt đầu kèo bóng đá hôm nay và ngày mai từ được lập chỉ mục để bỏ qua việc áp dụng bộ phụ cho nó, nhưng tất cả các từ mẫuphảiĐược biết đến Subdiced.

kèo bóng đá hôm nay và ngày mai Thesaurus chọn trận đấu dài nhất nếu có nhiều cụm từ phù hợp với đầu vào và các mối quan hệ bị phá vỡ bằng cách sử dụng định nghĩa cuối cùng.

kèo bóng đá hôm nay và ngày mai từ dừng cụ thể được nhận ra bởi Subdicedary không thể được chỉ định; Thay vào đó sử dụng?Để đánh dấu vị trí có bất kỳ từ dừng nào cũng có thể xuất hiện. Ví dụ: giả sử rằngAThelà kèo bóng đá hôm nay và ngày mai từ dừng theo phân nhóm:

? kèo bóng đá hôm nay và ngày mai ? Hai: SWSW

khớpA kèo bóng đá hôm nay và ngày mai hai; Cả hai sẽ được thay thế bằngSWSW.

Vì kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai có khả năng nhận biết các cụm từ, nó phải nhớ trạng thái của nó và tương tác với trình phân tích cú pháp. Một kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai sử dụng các bài tập này để kiểm tra xem nó có nên xử lý từ tiếp theo hay dừng tích lũy không. kèo bóng đá hôm nay và ngày mai Thesaurus phải được cấu hình cẩn thận. Ví dụ: nếu kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai được gán để chỉ xử lýasciiwordMã thông báo, sau đó là một định nghĩa kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai nhưkèo bóng đá hôm nay và ngày mai 7sẽ không hoạt động vì loại mã thông báoUINTkhông được gán cho kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai.

THẬN TRỌNG

Thesaurus được sử dụng trong quá trình lập chỉ mục để bất kỳ thay đổi nào trong các tham số của kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày maiYêu cầuReindexing. Đối với hầu hết các loại kèo bóng đá hôm nay và ngày mai khác, các thay đổi nhỏ như thêm hoặc xóa các nút dừng không buộc phải tái lập.

12.6.4.1. Cấu hình Thesaurus#

Để xác định kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày mai mới, sử dụngThesaurusMẫu. Ví dụ:

Tạo kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản thesaurus_simple (
    Mẫu = Thesaurus,
    Dictfile = Mythesaurus,
    kèo bóng đá hôm nay và ngày mai = pg_catalog.english_stem
);

ở đây:

  • thesaurus_simplelà tên của kèo bóng đá hôm nay và ngày mai mới

  • Mythesauruslà tên cơ sở của tệp cấu hình thesaurus. (Tên đầy đủ của nó sẽ là$ sharedir/tsearch_data/mythesaurus.ths, trong đó$ sharedirCó nghĩa là thư mục dữ liệu chia sẻ cài đặt.)

  • pg_catalog.english_stemlà sự phụ thuộc (ở đây, một bản thân bóng tuyết Snowball) để sử dụng cho bình thường hóa kèo bóng đá hôm nay và ngày mai đồng nghĩa. Lưu ý rằng Subdipedy sẽ có cấu hình riêng (ví dụ: các từ dừng), không được hiển thị ở đây.

Bây giờ có thể liên kết kèo bóng đá hôm nay và ngày mai kèo bóng đá hôm nay và ngày maithesaurus_simpleĐối với các loại mã thông báo mong muốn trong kèo bóng đá hôm nay và ngày mai cấu hình, ví dụ:

Thay đổi cấu hình tìm kiếm văn bản Nga
    Thay đổi ánh xạ cho asciiword, asciihword, hword_asciipart
    Với thesaurus_simple;

12.6.4.2. Ví dụ kèo bóng đá hôm nay và ngày mai đồng nghĩa#

Hãy xem xét một kèo bóng đá hôm nay và ngày mai thiên văn đơn giảnthesaurus_astro, chứa kèo bóng đá hôm nay và ngày mai số kết hợp từ thiên văn:

Supernovae Stars: SN
Nebulae cua: cua

Below we create a dictionary and bind some token types to an astronomical thesaurus and English stemmer:

Tạo kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản thesaurus_astro (
    Mẫu = Thesaurus,
    Dictfile = thesaurus_astro,
    kèo bóng đá hôm nay và ngày mai = English_stem
);

Thay đổi cấu hình tìm kiếm văn bản Nga
    Thay đổi ánh xạ cho asciiword, asciihword, hword_asciipart
    Với thesaurus_astro, English_stem;

Bây giờ chúng ta có thể thấy cách thức hoạt động.ts_lexizekhông hữu ích cho việc kiểm tra một kèo bóng đá hôm nay và ngày mai đồng nghĩa, vì nó coi đầu vào của nó là một mã thông báo duy nhất. Thay vào đó chúng ta có thể sử dụngPlainto_tsqueryTO_TSVECTORsẽ chia chuỗi đầu vào của chúng thành nhiều mã thông báo:

Chọn PlainTo_TSQuery ('Supernova Star');
 Plainto_tsquery
-----------------
 'Sn'

Chọn to_tsvector ('Supernova Star');
 to_tsVector
-------------
 'Sn': 1

Về nguyên tắc, người ta có thể sử dụngto_tsqueryNếu bạn trích dẫn đối số:

Chọn to_tsquery ('' 'Supernova Star' '');
 to_tsquery
------------
 'Sn'

Thông báo rằngSupernova StarkhớpSupernovae Starsinthesaurus_astroVì chúng tôi đã chỉ địnhEnglish_stemSTEMMER trong định nghĩa kèo bóng đá hôm nay và ngày mai đồng nghĩa. Thân máy đã loại bỏES.

Để lập chỉ mục cụm từ gốc cũng như thay thế, chỉ bao gồm nó trong phần bên phải của định nghĩa:

Supernovae Stars: SN Supernovae Stars

Chọn PlainTo_TSQuery ('Supernova Star');
       Plainto_tsquery
---------------------------------
 'Sn' & 'Supernova' & 'Star'

12.6.5.ISPELLkèo bóng đá hôm nay và ngày mai#

TheISPELLMẫu kèo bóng đá hôm nay và ngày mai hỗ trợkèo bóng đá hôm nay và ngày mai hình thái, có thể bình thường hóa nhiều hình thức ngôn ngữ khác nhau của kèo bóng đá hôm nay và ngày mai từ vào cùng kèo bóng đá hôm nay và ngày mai từ vựng. Ví dụ: kèo bóng đá hôm nay và ngày mai tiếng AnhISPELLkèo bóng đá hôm nay và ngày mai có thể phù hợp với tất cả các khoản thanh toán và liên hợp của thuật ngữ tìm kiếmBank, ví dụ:Ngân hàng, Chance, Ngân hàng, Ngân hàng 'Ngân hàng.

tiêu chuẩnPOSTGRESQLPhân phối không bao gồm bất kỳ nàoISPELLTệp cấu hình. kèo bóng đá hôm nay và ngày mai cho một số lượng lớn ngôn ngữ có sẵn từISPELL. Ngoài ra, một số định dạng tệp kèo bóng đá hôm nay và ngày mai hiện đại hơn được hỗ trợ -MySpell(oo <2.0.1) vàHunspell(oo = 2.0.2). Một danh sách lớn các kèo bóng đá hôm nay và ngày mai có sẵn trênWiki OpenOffice.

Để tạoISPELLkèo bóng đá hôm nay và ngày mai thực hiện các bước sau:

  • Tải xuống các tệp cấu hình kèo bóng đá hôm nay và ngày mai.OpenOfficeTệp mở rộng có.OXTPhần mở rộng. Nó là cần thiết để trích xuất.AFF.dicTệp, thay đổi tiện ích mở rộng thành.AFFIX.dict. Đối với một số tệp kèo bóng đá hôm nay và ngày mai, cũng cần phải chuyển đổi các ký tự thành mã hóa UTF-8 với các lệnh (ví dụ: cho kèo bóng đá hôm nay và ngày mai ngôn ngữ Na Uy):

    ICONV -F ISO_8859-1 -T UTF -8 -O NN_NO.AFFIX NN_NO.AFF
    iconv -f iso_8859-1 -t utf -8 -o nn_no.dict nn_no.dic
  • Sao chép tệp vào$ sharedir/tsearch_dataThư mục

  • Tải tệp vào PostgreSQL với lệnh sau:

    Tạo kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản English_hunspell (
        Template = ispell,
        Dictfile = en_us,
        Afffile = en_us,
        Stopwords = English);

ở đây,dictfile, AfffilestopwordsChỉ định tên cơ sở của các tệp kèo bóng đá hôm nay và ngày mai, phụ đề và các tệp dừng. Tệp điểm dừng có cùng định dạng được giải thích ở trên chođơn giảnLoại kèo bóng đá hôm nay và ngày mai. Định dạng của các tệp khác không được chỉ định ở đây nhưng có sẵn từ các trang web đã đề cập ở trên.

kèo bóng đá hôm nay và ngày mai ISPELL thường nhận ra một bộ từ giới hạn, vì vậy chúng nên được theo sau bởi một kèo bóng đá hôm nay và ngày mai rộng hơn khác; Ví dụ, một kèo bóng đá hôm nay và ngày mai bóng tuyết, nhận ra mọi thứ.

The.affixTệp củaISPELLCó cấu trúc sau:

Tiền tố
cờ *a:
    .            Re # as in enter reenter
hậu tố
cờ T:
    E st # như vào muộn mới nhất
    [^Aeiou] y -y, iest # như trong bẩn bẩn nhất
    [Aeiou] y est # như màu xám màu xám nhất
    [^Ey] est # như trong nhỏ nhỏ nhất

.dictTệp có cấu trúc sau:

Lapse/ADGRS
Lard/dgrs
lớn/prty
Lark/Mrs

Định dạng của.dictTệp là:

basic_form/bệp

trong.AFFIXTệp Mỗi cờ phụ được mô tả ở định dạng sau:

39526_39579

Ở đây, điều kiện có định dạng tương tự như định dạng của kèo bóng đá hôm nay và ngày mai biểu thức chính quy. Nó có thể sử dụng kèo bóng đá hôm nay và ngày mai nhóm[...][^...]. Ví dụ,[AEIOU] ycó nghĩa là chữ cái cuối cùng của từ là"Y"Và chữ áp chót là"A", "E", "I", "O"hoặc"U". [^EY]có nghĩa là chữ cái cuối cùng không"E"cũng không"Y".

kèo bóng đá hôm nay và ngày mai ISPELL hỗ trợ phân tách các từ ghép; một tính năng hữu ích. Lưu ý rằng tệp dán sẽ chỉ định cờ đặc biệt bằng cách sử dụngTừ hợp chất được kiểm soátTuyên bố đánh dấu các từ kèo bóng đá hôm nay và ngày mai có thể tham gia vào sự hình thành hợp chất:

Từ hợp chất được kiểm soát z

Đây là kèo bóng đá hôm nay và ngày mai số ví dụ cho ngôn ngữ Na Uy:

40687_40915

MySpellĐịnh dạng là kèo bóng đá hôm nay và ngày mai tập hợp con củaHunspell. The.affixTệp củaHunspellCó cấu trúc sau:

PFX A Y 1
Pfx a 0 re.
Sfx t n 4
Sfx t 0 st e
Sfx t y iest [^aeiou] y
Sfx t 0 est [aeiou] y
Sfx t 0 est [^ey]

Dòng đầu tiên của lớp phụ là tiêu đề. Các trường của kèo bóng đá hôm nay và ngày mai quy tắc phụ được liệt kê sau tiêu đề:

  • Tên tham số (PFX hoặc SFX)

  • cờ (tên của lớp phụ)

  • Dải kèo bóng đá hôm nay và ngày mai ký tự từ đầu (tại tiền tố) hoặc kết thúc (tại hậu tố) của từ

  • Thêm phụ

  • Điều kiện có định dạng tương tự như định dạng của kèo bóng đá hôm nay và ngày mai biểu thức chính quy.

The.dictTệp trông giống như.dictTệp củaISPELL:

Larder/m
Lardy/rt
lớn/rspmyt
Larget đã

Lưu ý

MySpellKhông hỗ trợ kèo bóng đá hôm nay và ngày mai từ ghép.Hunspellcó hỗ trợ tinh vi cho kèo bóng đá hôm nay và ngày mai từ ghép. Hiện tại,POSTGRESQLChỉ thực hiện kèo bóng đá hôm nay và ngày mai hoạt động từ hợp chất cơ bản của Hunspell.

12.6.6.Snowballkèo bóng đá hôm nay và ngày mai#

TheSnowballMẫu kèo bóng đá hôm nay và ngày mai dựa trên một dự án của Martin Porter, người phát minh ra thuật toán gốc của Porter phổ biến cho ngôn ngữ tiếng Anh. Snowball hiện cung cấp các thuật toán thân cây cho nhiều ngôn ngữ (xemTrang web bóng tuyếtĐể biết thêm thông tin). Mỗi thuật toán hiểu cách giảm các dạng từ biến thể phổ biến thành một cơ sở, hoặc gốc, đánh vần trong ngôn ngữ của nó. Một kèo bóng đá hôm nay và ngày mai bóng tuyết yêu cầuNgôn ngữtham số để xác định sử dụng thân cây nào và tùy chọn có thể chỉ định AstopwordTên tệp đưa ra danh sách kèo bóng đá hôm nay và ngày mai từ để loại bỏ. (POSTGRESQL43981_44111

Tạo kèo bóng đá hôm nay và ngày mai tìm kiếm văn bản English_stem (
    Template = Snowball,
    Ngôn ngữ = tiếng Anh,
    Stopwords = tiếng Anh
);

Định dạng tệp dừng giống như đã giải thích.

ASnowballkèo bóng đá hôm nay và ngày mai nhận ra mọi thứ, cho dù nó có thể đơn giản hóa từ này hay không, vì vậy nó nên được đặt ở cuối danh sách kèo bóng đá hôm nay và ngày mai. Thật vô ích khi có nó trước bất kỳ kèo bóng đá hôm nay và ngày mai nào khác vì một mã thông báo sẽ không bao giờ chuyển qua nó đến kèo bóng đá hôm nay và ngày mai tiếp theo.

Gửi hiệu chỉnh

Nếu bạn thấy bất cứ điều gì trong tài liệu không chính xác, không khớp Kinh nghiệm của bạn với tính năng cụ thể hoặc yêu cầu làm rõ thêm, Vui lòng sử dụngMẫu nàyĐể báo cáo vấn đề tài liệu.