Unaccent
là một từ điển tìm kiếm văn bản loại bỏ kèo bóng đá việt nam điểm nhấn (dấu hiệu diarritic) khỏi từ vựng. Đó là một từ điển lọc, có nghĩa là đầu ra của nó luôn được chuyển sang từ điển tiếp theo (nếu có), không giống như hành vi thông thường của từ điển. Điều này cho phép xử lý không nhạy cảm với điểm nhấn để tìm kiếm toàn văn.
Việc triển khai hiện tại củaUnaccent
kèo bóng đá việt nam thể được sử dụng làm từ điển bình thường hóa choThesaurus
Từ điển.
Mô -đun này được coi làđáng tin cậyKhăn, nghĩa là, nó có thể được cài đặt bởi những người kèo bóng đá việt nam phải là người siêu giám sát cóTạo
Đặc quyền trên cơ sở dữ kèo bóng đá việt nam hiện tại.
ANUnaccent
Từ điển chấp nhận kèo bóng đá việt nam tùy chọn sau:
Quy tắc
là tên cơ sở của tệp chứa danh sách kèo bóng đá việt nam quy tắc dịch. Tệp này phải được lưu trữ trong$ sharedir/tsearch_data/
(trong đó$ sharedir
có nghĩa làPostgreSQLThư mục dữ kèo bóng đá việt nam chung của cài đặt). Tên của nó phải kết thúc trong.rules
(kèo bóng đá việt nam được đưa vàoQuy tắc
tham số).
Tệp quy tắc có định dạng sau:
Mỗi dòng đại diện cho kèo bóng đá việt nam quy tắc dịch, bao gồm kèo bóng đá việt nam ký tự có giọng theo sau là kèo bóng đá việt nam ký tự không có giọng. Đầu tiên được dịch sang thứ hai. Ví dụ,
à a Á a  a à a Ä a A Æ ae
Hai ký tự phải được phân tách bằng khoảng trắng và bất kỳ khoảng trắng dẫn đầu hoặc dấu vết nào trên kèo bóng đá việt nam dòng đều bị bỏ qua.
Ngoài ra, nếu chỉ có một ký tự được đưa ra trên một dòng, kèo bóng đá việt nam trường hợp của ký tự đó sẽ bị xóa; Điều này hữu ích trong kèo bóng đá việt nam ngôn ngữ nơi kèo bóng đá việt nam điểm nhấn được biểu diễn bằng kèo bóng đá việt nam ký tự riêng biệt.
Trên thực tế, mỗiHồiNhân vậtCó thể là bất kỳ chuỗi nào kèo bóng đá việt nam chứa khoảng trắng, vì vậyUnaccent
Từ điển có thể được sử dụng cho kèo bóng đá việt nam loại thay thế phụ khác bên cạnh việc loại bỏ diacritic.
như với người khác12170_12182Tệp cấu hình tìm kiếm văn bản, tệp quy tắc phải được lưu trữ trong mã hóa UTF-8. Dữ liệu được tự động dịch vào mã hóa cơ sở dữ liệu hiện tại khi được tải. Bất kỳ dòng nào chứa kèo bóng đá việt nam ký tự không thể dịch được đều bị bỏ qua, để kèo bóng đá việt nam tệp quy tắc có thể chứa kèo bóng đá việt nam quy tắc không áp dụng trong mã hóa hiện tại.
Một ví dụ đầy đủ hơn, có thể tìm thấy trực tiếp kèo bóng đá việt nam ngôn ngữ châu Âu, có thể được tìm thấy trongunaccent.rules
, được cài đặt trong$ sharedir/tsearch_data/
KhiUnccent
Mô -đun được cài đặt. Tệp quy tắc này dịch kèo bóng đá việt nam ký tự có điểm nhấn thành cùng một ký tự mà không có điểm nhấn và nó cũng mở rộng dây chằng thành chuỗi kèo bóng đá việt nam ký tự đơn giản tương đương (ví dụ: æ sang AE).
Cài đặtUnaccent
tiện ích mở rộng tạo mẫu tìm kiếm văn kèo bóng đá việt namUnaccent
và từ điểnUnaccent
Dựa trên nó. TheUnaccent
Từ điển có cài đặt tham số mặc địnhquy tắc = 'Unaccent'
, làm cho nó có thể sử dụng ngay với tiêu chuẩnunaccent.rules
Tệp. Nếu bạn muốn, bạn có thể thay đổi tham số, ví dụ
MyDB =# thay đổi từ điển tìm kiếm văn kèo bóng đá việt nam Unaccent (quy tắc = 'my_rules');
hoặc tạo từ điển mới dựa trên mẫu.
Để kiểm tra từ điển, bạn có thể thử:
MyDB =# Chọn TS_LEXIZE ('Unaccent', 'Hôtel'); ts_lexize ----------- Khách sạn
Đây là kèo bóng đá việt nam ví dụ cho thấy cách chènUnaccent
Từ điển thành cấu hình tìm kiếm văn kèo bóng đá việt nam:
MyDB =# Tạo cấu hình tìm kiếm văn kèo bóng đá việt nam fr (sao chép = tiếng Pháp); mydb =# thay đổi cấu hình tìm kiếm văn kèo bóng đá việt nam fr Thay đổi ánh xạ cho hword, hword_part, word Với Unaccent, French_stem; mydb =# Chọn to_tsVector ('fr', 'Hôtels de la mer'); to_tsVector ------------------- 'Khách sạn': 1 'Mer': 4 (1 hàng) mydb =# Chọn to_tsVector ('fr', 'Hôtel de la mer') @@ to_tsquery ('fr', 'khách sạn'); ? Cột? ---------- t (1 hàng) mydb =# Chọn TS_HEADLINE ('fr', 'Hôtel de la mer', to_tsquery ('fr', 'khách sạn'))); ts_headline ------------------------ <b Hôtel </b de la mer (1 hàng)
TheUnaccent ()
Hàm loại bỏ kèo bóng đá việt nam điểm nhấn (dấu hiệu dấu hiệu) khỏi một chuỗi đã cho. Về cơ bản, đó là một trình bao bọc xung quanhUnaccent
-type từ điển, nhưng nó có thể được sử dụng bên ngoài bối cảnh tìm kiếm văn kèo bóng đá việt nam thông thường.
Unaccent ([Từ điển
Regdictionary
, ]chuỗi
Text
) trả vềText
NếuTừ điển
Đối số bị bỏ qua, Từ điển tìm kiếm văn kèo bóng đá việt nam có tênUnaccent
và xuất hiện trong cùng lược đồ vớiunaccent ()
15911_15938
Ví dụ:
chọn Unaccent ('Unaccent', 'Hôtel'); Chọn Unaccent ('Hôtel');
Nếu bạn thấy bất cứ điều gì trong tài kèo bóng đá việt nam không chính xác, không khớp Kinh nghiệm của bạn với tính năng cụ thể hoặc yêu cầu làm rõ thêm, Vui lòng sử dụngMẫu nàyĐể báo cáo vấn đề tài kèo bóng đá việt nam.