Postgresql 8.4.22 Tài liệu | ||||
---|---|---|---|---|
prev | Backward nhanh | Chương 12. Tìm kiếm toàn văn | Chuyển tiếp nhanh | Tiếp theo |
kèo bóng đá cúp c2 được sử dụng để loại bỏ các từ không nên được xem xét trong một tìm kiếm (Dừng từ), và ĐẾNbình thườngCác từ để khác nhau Các hình thức xuất phát của cùng kèo bóng đá cúp c2 từ sẽ phù hợp. kèo bóng đá cúp c2 thành công Từ được chuẩn hóa được gọi làLexeme. Ngoài việc cải thiện chất lượng tìm kiếm, bình thường hóa và loại bỏ Dừng kèo bóng đá cúp c2 từ giảm kích thước củatsVectorĐại diện của kèo bóng đá cúp c2 tài liệu, do đó cải thiện hiệu suất. Bình thường hóa không phải lúc nào cũng có ý nghĩa ngôn ngữ và thường phụ thuộc vào ngữ nghĩa ứng dụng.
kèo bóng đá cúp c2 số ví dụ về chuẩn hóa:
Ti ngôn ngữ - kèo bóng đá cúp c2 Ispell cố gắng giảm các từ đầu vào đến một hình thức chuẩn hóa; kèo bóng đá cúp c2 thân cây loại bỏ từ kết thúc
urlVị trí có thể Canonicalized để làm cho kèo bóng đá cúp c2 URL tương đương phù hợp:
http: //www.pgsql.ru/db/mw/index.html
http: //www.pgsql.ru/db/mw/
http: //www.pgsql.ru/db/../db/mw/index.html
tên màu có thể được thay thế bằng kèo bóng đá cúp c2 giá trị thập lục phân của chúng, ví dụ.,Đỏ, xanh lá cây, xanh dương, Magenta - FF0000, 00FF00, 0000FF, FF00FF
Nếu số lượng lập chỉ mục, chúng ta có thể xóa kèo bóng đá cúp c2 số chữ số phân số Để giảm phạm vi số có thể, ví dụ3.14159265359,3.1415926,3.14sẽ là giống như sau khi bình thường hóa nếu chỉ có hai chữ số được giữ sau Điểm thập phân.
kèo bóng đá cúp c2 là một chương trình chấp nhận mã thông báo làm đầu vào và trả về:
Một mảng từ vựng nếu mã thông báo đầu vào được biết đến với kèo bóng đá cúp c2 (lưu ý rằng một mã thông báo có thể tạo ra nhiều hơn một từ vựng)
Một mảng trống nếu kèo bóng đá cúp c2 biết mã thông báo, nhưng nó là một từ dừng
nullNếu kèo bóng đá cúp c2 không Nhận biết mã thông báo đầu vào
PostgreSQLcung cấp kèo bóng đá cúp c2 được xác định trước cho nhiều ngôn ngữ. Ngoài ra còn có một số mẫu được xác định trước có thể được sử dụng để tạo mới kèo bóng đá cúp c2 với các tham số tùy chỉnh. Mỗi kèo bóng đá cúp c2 được xác định trước Mẫu được mô tả dưới đây. Nếu không có mẫu hiện có phù hợp, Có thể tạo ra những cái mới; XemPREDT/khu vực củaPostgreSQLPhân phối cho kèo bóng đá cúp c2 ví dụ.
Cấu hình tìm kiếm văn bản liên kết một trình phân tích cú pháp cùng với một bộ kèo bóng đá cúp c2 để xử lý mã thông báo đầu ra của trình phân tích cú pháp. Cho mỗi loại mã thông báo mà trình phân tích cú pháp có thể trả về, một danh sách riêng kèo bóng đá cúp c2 được chỉ định bởi cấu hình. Khi một mã thông báo của Loại đó được tìm thấy bởi trình phân tích cú pháp, mỗi kèo bóng đá cúp c2 trong danh sách là Lần lượt tham khảo ý kiến, cho đến khi một số kèo bóng đá cúp c2 nhận ra nó là một từ. Nếu nó được xác định là một từ dừng hoặc nếu không có kèo bóng đá cúp c2 nhận ra mã thông báo, nó sẽ bị loại bỏ và không được lập chỉ mục hoặc tìm kiếm. Nguyên tắc chung để định cấu hình một danh sách kèo bóng đá cúp c2 là đặt đầu tiên là hẹp nhất, cụ thể nhất kèo bóng đá cúp c2, sau đó là các kèo bóng đá cúp c2 chung hơn, kết thúc với một kèo bóng đá cúp c2 rất chung, như ASnowballStemmer hoặcđơn giản, nhận ra mọi thứ. Ví dụ, cho kèo bóng đá cúp c2 tìm kiếm dành riêng cho thiên văn (Astro_enCấu hình) Người ta có thể liên kết loại mã thông báoasciiword(từ ASCII) với một từ đồng nghĩa kèo bóng đá cúp c2 thuật ngữ thiên văn, một kèo bóng đá cúp c2 tiếng Anh nói chung và aSnowballTiếng Anh STEMMER:
thay đổi cấu hình tìm kiếm văn bản astro_en Thêm ánh xạ cho asciiword bằng astrosyn, english_ispell, English_stem;
Dừng kèo bóng đá cúp c2 từ là những từ rất phổ biến, xuất hiện trong gần như Mỗi tài liệu, và không có giá trị phân biệt đối xử. Vì thế, Họ có thể bị bỏ qua trong bối cảnh tìm kiếm toàn văn. Vì Ví dụ, mọi văn bản tiếng Anh đều chứa kèo bóng đá cúp c2 từ nhưAvàThe, vì vậy nó là vô dụng để lưu trữ chúng trong kèo bóng đá cúp c2 chỉ số. Tuy nhiên, hãy dừng các từ làm ảnh hưởng đến các vị trí trongtsVector, mà lần lượt ảnh hưởng đến xếp hạng:
chọn to_tsvector ('tiếng Anh', 'trong danh sách kèo bóng đá cúp c2 từ dừng'); to_tsVector -------------------------------- 'Danh sách': 3 'Dừng': 5 'Word': 6
Vị trí bị thiếu 1,2,4 là do kèo bóng đá cúp c2 từ dừng. Thứ hạng được tính toán cho kèo bóng đá cúp c2 tài liệu có và không có từ ngữ khá khác biệt:
15024_15298
Nó tùy thuộc vào kèo bóng đá cúp c2 cụ thể cách nó đối xử từ. Ví dụ,ISPELLkèo bóng đá cúp c2 đầu tiên bình thường hóa các từ và sau đó xem danh sách của Dừng từ, trong khiSnowballthân cây Trước tiên hãy kiểm tra danh sách các từ dừng. Lý do cho Hành vi khác là kèo bóng đá cúp c2 nỗ lực để giảm tiếng ồn.
Theđơn giảnMẫu kèo bóng đá cúp c2 vận hành bằng cách chuyển đổi mã thông báo đầu vào thành chữ thường và Kiểm tra nó đối với một tập tin của các từ dừng. Nếu nó được tìm thấy trong Tệp sau đó một mảng trống được trả về, khiến mã thông báo được loại bỏ. Nếu không, dạng từ có sẵn của từ được trả về như từ vựng được chuẩn hóa. Ngoài ra, kèo bóng đá cúp c2 có thể được cấu hình để báo cáo các từ không ngừng là không được công nhận, cho phép chúng được chuyển sang kèo bóng đá cúp c2 tiếp theo trong danh sách.
Đây là một ví dụ về định nghĩa kèo bóng đá cúp c2 bằng cách sử dụngđơn giảnMẫu:
Tạo kèo bóng đá cúp c2 tìm kiếm văn bản công khai.simple_dict ( Mẫu = pg_catalog.simple, Stopwords = tiếng Anh );
ở đây,tiếng Anhlà tên cơ sở của A Tệp của kèo bóng đá cúp c2 từ dừng. Tên đầy đủ của tệp sẽ là$ Sharedir/Tsearch_data/English.stop, trong đó$ sharedircó nghĩa làPOSTGRESQLdữ liệu chia sẻ của cài đặt thư mục, thường là/usr/local/share/postgresql(Sử dụngpg_config --SharedirĐể xác định nó nếu bạn không chắc chắn). Định dạng tệp chỉ đơn giản là kèo bóng đá cúp c2 danh sách các từ, kèo bóng đá cúp c2 đường kẻ. Các đường trống và không gian dấu vết bị bỏ qua, và phía trên Trường hợp được gấp lại thành chữ thường, nhưng không có xử lý nào khác được thực hiện Trên nội dung tệp.
Bây giờ chúng ta có thể kiểm tra kèo bóng đá cúp c2 của mình:
chọn TS_LEXIZE ('public.simple_dict', 'có'); ts_lexize ----------- Đúng Chọn ts_lexize ('public.simple_dict', 'the'); ts_lexize -----------
Chúng ta cũng có thể chọn trả lạinull,, Thay vì từ có chữ cái thấp hơn, nếu nó không được tìm thấy trong điểm dừng Tệp từ. Hành vi này được chọn bằng cách đặt kèo bóng đá cúp c2 củaChấp nhậntham số đếnSai. Tiếp tục ví dụ:
thay đổi kèo bóng đá cúp c2 tìm kiếm văn bản công khai.simple_dict (Accept = false); Chọn ts_lexize ('public.simple_dict', 'có'); ts_lexize ----------- Chọn ts_lexize ('public.simple_dict', 'the'); ts_lexize -----------
Với cài đặt mặc định củaChấp nhận=TRUE, nó chỉ hữu ích khi đặt Ađơn giảnkèo bóng đá cúp c2 ở cuối danh sách kèo bóng đá cúp c2, vì nó sẽ không bao giờ chuyển bất kỳ mã thông báo nào cho theo kèo bóng đá cúp c2. Ngược lại,Chấp nhận=Saichỉ hữu ích khi có ít nhất một kèo bóng đá cúp c2 sau.
THẬN TRỌNG |
Hầu hết các loại kèo bóng đá cúp c2 đều dựa vào cấu hình Các tập tin, chẳng hạn như tệp của các từ dừng. Những tệp nàyphảiBE Được lưu trữ trong mã hóa UTF-8. Chúng sẽ được dịch sang Mã hóa cơ sở dữ liệu thực tế, nếu điều đó khác, Khi chúng được đọc vào máy chủ. |
THẬN TRỌNG |
Thông thường, một phiên cơ sở dữ liệu sẽ đọc một kèo bóng đá cúp c2 Tệp cấu hình chỉ một lần, khi nó được sử dụng lần đầu tiên trong phiên. Nếu bạn sửa đổi tệp cấu hình và muốn buộc các phiên hiện có để chọn nội dung, phát hành mộtthay đổi văn bản Tìm kiếm kèo bóng đá cúp c2Lệnh trên kèo bóng đá cúp c2. Cái này có thể là một"giả"Cập nhật điều đó không thực sự thay đổi bất kỳ giá trị tham số nào. |
Mẫu kèo bóng đá cúp c2 này được sử dụng để tạo kèo bóng đá cúp c2 Thay thế một từ bằng một từ đồng nghĩa. Các cụm từ không được hỗ trợ (sử dụng Mẫu Thesaurus (Phần 12.6.4) cho điều đó). Một kèo bóng đá cúp c2 đồng nghĩa có thể được sử dụng để Vượt qua các vấn đề ngôn ngữ, ví dụ, để ngăn chặn kèo bóng đá cúp c2 tiếng Anh thân cây từ việc giảm từ 'paris' đến 'Pari'. Nó đủ để có mộtParis Parisdòng trong kèo bóng đá cúp c2 đồng nghĩa và đặt nó trướcEnglish_stemkèo bóng đá cúp c2. Vì ví dụ:
Chọn * từ ts_debug ('tiếng Anh', 'paris'); Bí danh | Mô tả | mã thông báo | kèo bóng đá cúp c2 | kèo bóng đá cúp c2 | từ vựng -----------+------------------+-------+----------------+--------------+------------- asciiword | Từ, tất cả ASCII | Paris | English_stem | Tiếng Anh_stem | pari Tạo kèo bóng đá cúp c2 tìm kiếm văn bản my_synonymy ( Template = từ đồng nghĩa, Từ đồng nghĩa = my_syn từ ); Thay đổi cấu hình tìm kiếm văn bản tiếng Anh Thay đổi ánh xạ cho asciiword Với my_synonymy, English_stem; Chọn * từ ts_debug ('tiếng Anh', 'paris'); Bí danh | Mô tả | mã thông báo | kèo bóng đá cúp c2 | kèo bóng đá cúp c2 | từ vựng -----------+------------------+-------+-------------------------------+------------+------------- asciiword | Từ, tất cả ASCII | Paris | my_synonymy, English_stem | my_synonymy | Paris
Tham số duy nhất theo yêu cầu củaTừ đồng nghĩaMẫu làTừ đồng nghĩa, là tên cơ sở của nó Tệp cấu hình -my_synonymyin ví dụ trên. Tên đầy đủ của tệp sẽ là$ sharedir/tsearch_data/my_syn từ.syn(trong đó$ sharedircó nghĩa làPostgreSQLdữ liệu chia sẻ của cài đặt thư mục). Định dạng tệp chỉ là kèo bóng đá cúp c2 dòng mỗi từ được thay thế, với từ theo sau là từ đồng nghĩa của nó, được phân tách bởi không gian trắng. Các đường trống và không gian dấu vết là bị bỏ qua.
TheTừ đồng nghĩaMẫu cũng có kèo bóng đá cúp c2 Tham số tùy chọnCaseSensitive,, mặc định nào làSai. KhicaseSensitivelàSai, kèo bóng đá cúp c2 từ trong tệp đồng nghĩa được gấp lại thành chữ thường, như là mã thông báo đầu vào. Khi nó làTRUE, từ và mã thông báo không được gấp lại để thấp hơn trường hợp, nhưng được so sánh is-is.
Một kèo bóng đá cúp c2 kèo bóng đá cúp c2 (đôi khi viết tắt làTZ) là kèo bóng đá cúp c2 tập hợp các từ bao gồm thông tin về các mối quan hệ của các từ và Các cụm từ, tức là, các thuật ngữ rộng hơn (bt), kèo bóng đá cúp c2 thuật ngữ hẹp hơn (nt), Điều khoản ưa thích, Điều khoản không được ưu tiên, kèo bóng đá cúp c2 thuật ngữ liên quan, v.v.
Về cơ bản là một kèo bóng đá cúp c2 kèo bóng đá cúp c2 thay thế tất cả các điều khoản theo một thuật ngữ ưa thích và, tùy chọn, bảo tồn Các thuật ngữ gốc để lập chỉ mục là tốt.PostgreSQLthực hiện hiện tại của kèo bóng đá cúp c2 Thesaurus là một phần mở rộng của kèo bóng đá cúp c2 đồng nghĩa với thêmcụm từHỗ trợ. Một kèo bóng đá cúp c2 đồng nghĩa kèo bóng đá cúp c2 yêu cầu một tệp cấu hình của những điều sau định dạng:
# Đây là kèo bóng đá cúp c2 bình luận Từ mẫu: từ được lập chỉ mục (các) từ Thêm (các) từ mẫu: từ được lập chỉ mục nhiều hơn ...
trong đó đại tràng (:) Biểu tượng hoạt động như kèo bóng đá cúp c2 phân định giữa kèo bóng đá cúp c2 cụm từ và sự thay thế của nó.
kèo bóng đá cúp c2 kèo bóng đá cúp c2 sử dụngSubdictionary(được chỉ định trong Cấu hình kèo bóng đá cúp c2) Để bình thường hóa văn bản đầu vào trước Kiểm tra các cụm từ phù hợp. Chỉ có thể chọn một Subdictionary. Một lỗi được báo cáo nếu sự phụ thuộc không thành công để nhận ra một từ. Trong trường hợp đó, bạn nên loại bỏ việc sử dụng Lời hoặc dạy các phân nhóm về nó. Bạn có thể đặt một Dấu hoa thị (*) khi bắt đầu từ được lập chỉ mục để bỏ qua áp dụng phân nhóm cho nó, nhưng tất cả kèo bóng đá cúp c2 từ mẫuphảiBE được biết đến bởi sự phụ.
kèo bóng đá cúp c2 Thesaurus chọn trận đấu dài nhất nếu có là nhiều cụm từ phù hợp với đầu vào và các mối quan hệ bị phá vỡ bởi sử dụng định nghĩa cuối cùng.
kèo bóng đá cúp c2 từ dừng cụ thể được nhận ra bởi Subdiped được chỉ định; Thay vào đó sử dụng?để đánh dấu vị trí mà bất kỳ từ dừng có thể xuất hiện. Ví dụ, giả sử rằngAvàThelà kèo bóng đá cúp c2 từ dừng theo Subdictionary:
? kèo bóng đá cúp c2 ? Hai: SWSW
MatchesA kèo bóng đá cúp c2 haivàThe A hai; Cả hai sẽ được thay thế quaSWSW.
Vì kèo bóng đá cúp c2 kèo bóng đá cúp c2 có khả năng nhận biết các cụm từ nó phải nhớ trạng thái của nó và tương tác với trình phân tích cú pháp. Một kèo bóng đá cúp c2 kèo bóng đá cúp c2 sử dụng các bài tập này để kiểm tra Nếu nó nên xử lý từ tiếp theo hoặc dừng tích lũy. Các kèo bóng đá cúp c2 Thesaurus phải được cấu hình cẩn thận. Ví dụ, Nếu kèo bóng đá cúp c2 kèo bóng đá cúp c2 đồng nghĩa được gán để chỉ xử lýasciiwordMã thông báo, sau đó là một kèo bóng đá cúp c2 đồng thsaurus Định nghĩa kèo bóng đá cúp c2 nhưkèo bóng đá cúp c2 7Will không hoạt động vì loại mã thông báoUINTkhông được gán cho kèo bóng đá cúp c2 kèo bóng đá cúp c2.
THẬN TRỌNG |
Thesauruses được sử dụng trong quá trình lập chỉ mục để có bất kỳ thay đổi nào Trong các tham số của kèo bóng đá cúp c2 kèo bóng đá cúp c2Yêu cầuReindexing. Vì hầu hết các loại kèo bóng đá cúp c2 khác, những thay đổi nhỏ như Thêm hoặc xóa các từ dừng lại không buộc tái xuất. |
Để xác định kèo bóng đá cúp c2 kèo bóng đá cúp c2 mới, sử dụngThesaurusMẫu. Ví dụ:
Tạo kèo bóng đá cúp c2 tìm kiếm văn bản kèo bóng đá cúp c2 thesaurus_simple ( Mẫu = Thesaurus, Dictfile = Mythesaurus, kèo bóng đá cúp c2 = pg_catalog.english_stem );
ở đây:
thesaurus_simplelà cái mới Tên kèo bóng đá cúp c2
Mythesauruslà tên cơ sở của tệp cấu hình thesaurus. (Tên đầy đủ của nó sẽ là$ sharedir/tsearch_data/mythesaurus.ths,, Ở đâu$ sharedircó nghĩa là Cài đặt thư mục dữ liệu chia sẻ.)
pg_catalog.english_stemIS Subdicedary (ở đây, một quả bóng tuyết Snowball Engl Sử dụng cho bình thường hóa kèo bóng đá cúp c2 đồng nghĩa. Lưu ý rằng Subdictionary sẽ có cấu hình riêng (cho Ví dụ, các từ dừng), không được hiển thị ở đây.
Bây giờ có thể liên kết kèo bóng đá cúp c2 kèo bóng đá cúp c2thesaurus_simplevới mong muốn kèo bóng đá cúp c2 loại mã thông báo trong cấu hình, ví dụ:
Thay đổi cấu hình tìm kiếm văn bản Nga Thay đổi ánh xạ cho asciiword, asciihword, hword_asciipart Với thesaurus_simple;
Hãy xem xét một kèo bóng đá cúp c2 thiên văn đơn giảnthesaurus_astro, chứa kèo bóng đá cúp c2 số Kết hợp từ thiên văn:
Supernovae Stars: SN Nebulae cua: cua
bên dưới chúng tôi tạo một kèo bóng đá cúp c2 và liên kết một số loại mã thông báo với Một kèo bóng đá cúp c2 từ thiên văn và tiếng Anh thân cây:
Tạo kèo bóng đá cúp c2 tìm kiếm văn bản kèo bóng đá cúp c2 thesaurus_astro ( Mẫu = Thesaurus, Dictfile = thesaurus_astro, kèo bóng đá cúp c2 = English_stem ); Thay đổi cấu hình tìm kiếm văn bản Nga Thay đổi ánh xạ cho asciiword, asciihword, hword_asciipart Với thesaurus_astro, English_stem;
Bây giờ chúng ta có thể thấy cách thức hoạt động.ts_lexize
không hữu ích cho việc kiểm tra a
Thesaurus, bởi vì nó coi đầu vào của nó là kèo bóng đá cúp c2 mã thông báo duy nhất.
Thay vào đó chúng ta có thể sử dụngPlainto_tsquery
vàTO_TSVECTOR
sẽ phá vỡ đầu vào của họ
Chuỗi thành nhiều mã thông báo:
Chọn PlainTo_TSQuery ('Supernova Star'); Plainto_tsquery ----------------- 'Sn' Chọn to_tsvector ('Supernova Star'); to_tsVector ------------- 'Sn': 1
Về nguyên tắc, người ta có thể sử dụngTO_TSQUERY
Nếu bạn trích dẫn đối số:
Chọn to_tsquery ('' 'Supernova Star' ''); to_tsquery ------------ 'Sn'
Thông báo rằngSupernova StarMatchesSupernovae Starsinthesaurus_astroVì chúng tôi đã chỉ định TheEnglish_stemthân cây trong Định nghĩa Thesaurus. Thân máy đã loại bỏEvàS.
Để lập chỉ mục cụm từ gốc cũng như sự thay thế, Chỉ bao gồm nó ở phần bên phải của định nghĩa:
Supernovae Stars: SN Supernovae Stars Chọn PlainTo_TSQuery ('Supernova Star'); Plainto_tsquery --------------------------------- 'Sn' & 'Supernova' & 'Star'
TheISPELLkèo bóng đá cúp c2 Mẫu hỗ trợHình thái kèo bóng đá cúp c2, có thể bình thường hóa nhiều ngôn ngữ khác nhau các hình thức của kèo bóng đá cúp c2 từ vào cùng kèo bóng đá cúp c2 từ vựng. Ví dụ: kèo bóng đá cúp c2 tiếng AnhISPELLkèo bóng đá cúp c2 có thể khớp Tất cả các khoản thanh toán và liên hợp của thuật ngữ tìm kiếmNgân hàng, ví dụ:Ngân hàng, Chance, Ngân hàng, Ngân hàng 'vàNgân hàng.
tiêu chuẩnPOSTGRESQLPhân phối không bao gồm bất kỳ nàoISPELLTệp cấu hình. kèo bóng đá cúp c2 Đối với một số lượng lớn ngôn ngữ có sẵn từISPELL. Ngoài ra, một số tệp kèo bóng đá cúp c2 hiện đại hơn Các định dạng được hỗ trợ -MySpell(oo <2.0.1) vàHunspell(oo = 2.0.2). Một danh sách lớn của kèo bóng đá cúp c2 có sẵn trênWiki OpenOffice.
Để tạoISPELLkèo bóng đá cúp c2, sử dụng tích hợpISPELLMẫu và chỉ định kèo bóng đá cúp c2 số tham số:
Tạo kèo bóng đá cúp c2 tìm kiếm văn bản English_ispell ( Template = ispell, Dictfile = tiếng Anh, Afffile = tiếng Anh, Stopwords = tiếng Anh );
ở đây,dictfile, AfffilevàstopwordsChỉ định tên cơ sở của kèo bóng đá cúp c2, phụ đề và Các tập tin dừng. Tệp từ dừng có cùng định dạng đã giải thích ở trên choĐơn giảnLoại kèo bóng đá cúp c2. Định dạng của các tệp khác không được chỉ định Ở đây nhưng có sẵn từ các trang web đã đề cập ở trên.
kèo bóng đá cúp c2 Ispell thường nhận ra một bộ giới hạn của các từ, vì vậy chúng nên được theo sau bởi một kèo bóng đá cúp c2; ví dụ, một kèo bóng đá cúp c2 bóng tuyết, mà nhận ra mọi thứ.
kèo bóng đá cúp c2 ISPELL hỗ trợ phân tách các từ ghép; Một tính năng hữu ích. Lưu ý rằng tệp phụ đề sẽ chỉ định một Cờ đặc biệt bằng cách sử dụngTừ hợp chất được kiểm soátTuyên bố đánh dấu các từ kèo bóng đá cúp c2 có thể tham gia vào sự hình thành hợp chất:
Từ hợp chất được kiểm soát z
Đây là kèo bóng đá cúp c2 số ví dụ cho ngôn ngữ Na Uy:
33981_34209
Lưu ý: MySpellKhông hỗ trợ kèo bóng đá cúp c2 từ ghép.Hunspellcó sự hỗ trợ tinh vi cho từ ghép. Hiện tại,POSTGRESQLChỉ thực hiện cơ bản kèo bóng đá cúp c2 hoạt động từ ghép của hunspell.
TheSnowballkèo bóng đá cúp c2 Mẫu dựa trên một dự án của Martin Porter, nhà phát minh của Thuật toán thân cây nổi tiếng của người porter cho tiếng Anh ngôn ngữ. Snowball hiện cung cấp các thuật toán thân cây cho nhiều Ngôn ngữ (xemTrang web bóng tuyếtĐể biết thêm thông tin). Mỗi Thuật toán hiểu cách giảm các dạng biến thể phổ biến của từ ngữ đến một cơ sở, hoặc thân cây, đánh vần trong ngôn ngữ của nó. MỘT kèo bóng đá cúp c2 bóng tuyết yêu cầuNgôn ngữtham số để xác định thân cây nào sử dụng và tùy chọn có thể chỉ định kèo bóng đá cúp c2stopwordTên tệp đưa ra danh sách kèo bóng đá cúp c2 từ để loại bỏ. (PostgreSQL's Danh sách dừng tiêu chuẩn cũng được cung cấp bởi quả bóng tuyết Dự án.) Ví dụ, có kèo bóng đá cúp c2 định nghĩa tích hợp tương đương với
Tạo kèo bóng đá cúp c2 tìm kiếm văn bản English_stem ( Template = Snowball, Ngôn ngữ = tiếng Anh, Stopwords = tiếng Anh );
Định dạng tệp stopword giống như đã đã giải thích.
ASnowballkèo bóng đá cúp c2 nhận ra mọi thứ, liệu nó có thể đơn giản hóa hay không Lời, vì vậy nó nên được đặt ở cuối kèo bóng đá cúp c2 danh sách. Thật vô ích khi có nó trước bất kỳ kèo bóng đá cúp c2 nào khác bởi vì một mã thông báo sẽ không bao giờ chuyển qua nó đến lần tiếp theo kèo bóng đá cúp c2.