Hỗ trợ bộ ký tự trongPostgreSQL11493_11683EUC11719_11996PostgreSQLCụm cơ sở dữ liệu bằng cách sử dụnginitDB
. Nó có thể được ghi đè khi bạn tạo cơ sở dữ liệu, vì vậy bạn có thể có nhiều cơ sở dữ liệu với một bộ ký tự khác nhau.
12228_12342lc_ctype
(Phân loại ký tự) vàlc_collate
(Sắp xếp chuỗi) Cài đặt địa phương. VìC
hoặcPOSIX
Locale, bất kỳ bộ ký tự nào cũng được cho phép, nhưng đối với các địa phương do LIBC cung cấp khác, chỉ có một bộ ký tự sẽ hoạt động chính xác. .
Bảng 24.1Hiển thị các bộ ký tự có sẵn để sử dụng trongPostgreSQL.
Bảng 24.1.PostgreSQLBộ ký tự
tên | Mô tả | Ngôn ngữ | máy chủ? | ICU? | byte/char | Bí danh |
---|---|---|---|---|---|---|
Big5 |
Big Five | Trung Quốc truyền thống | không | Không | 1 | Win950 , Windows950 |
EUC_CN |
Mở rộng mã Unix-CN | Trung Quốc đơn giản | Có | Có | 1 | |
EUC_JP |
Code unix-jp mở rộng | Nhật Bản | Có | Có | 1 | |
EUC_JIS_2004 |
Code Unix-JP mở rộng, JIS X 0213 | Nhật Bản | Có | Không | 1 Từ3 | |
EUC_KR |
Mở rộng UNIX CODE-KR | Hàn Quốc | Có | Có | 1 Từ3 | |
EUC_TW |
unix codin-Tw | Trung Quốc truyền thống, Đài Loan | Có | Có | 1 Từ4 | |
GB18030 |
Tiêu chuẩn quốc gia | Trung Quốc | Không | không | 1 | |
GBK |
Tiêu chuẩn quốc gia mở rộng | Trung Quốc đơn giản | Không | không | 1 Từ2 | Win936 , Windows936 |
ISO_8859_5 |
ISO 8859-5,ECMA 113 | Latin/Cyrillic | Có | Có | 1 | |
ISO_8859_6 |
ISO 8859-6,ECMA 114 | Latin/tiếng Ả Rập | Có | 17190_17195 | 1 | |
ISO_8859_7 |
ISO 8859-7,ECMA 118 | Latin/Hy Lạp | Có | Có | 1 | |
ISO_8859_8 |
ISO 8859-8,ECMA 121 | Latin/tiếng Do Thái | Có | Có | 1 | |
Johab |
Johab | Hàn Quốc (Hangul) | Không | Không | 1 | |
KOI8R |
KOI8-R | Cyrillic (tiếng Nga) | Có | Có | 1 | KOI8 |
KOI8U |
KOI8-U | Cyrillic (Ukraine) | Có | Có | 1 | |
Latin1 |
ISO 8859-1,ECMA 94 | Tây Âu | Có | Có | 1 | ISO88591 |
Latin2 |
ISO 8859-2,ECMA 94 | Trung Âu | Có | Có | 1 | ISO88592 |
Latin3 |
ISO 8859-3,ECMA 94 | Nam Âu | Có | Có | 1 | ISO88593 |
19978_19986 |
ISO 8859-4,ECMA 94 | Bắc Âu | Có | Có | 1 | ISO88594 |
Latin5 |
ISO 8859-9,ECMA 128 | Thổ Nhĩ Kỳ | Có | Có | 1 | ISO88599 |
Latin6 |
ISO 8859-10,ECMA 144 | Nordic | Có | Có | 1 | ISO885910 |
Latin7 |
ISO 8859-13 | Baltic | Có | Có | 1 | ISO885913 |
Latin8 |
ISO 8859-14 | Celtic | Có | Có | 1 | ISO885914 |
Latin9 |
ISO 8859-15 | Latin1 với Euro và Accent | 21741_21746 | Có | 1 | ISO885915 |
Latin10 |
ISO 8859-16,ASROSR 14111 | Rumani | Có | Không | 1 | ISO885916 |
MULE_INTERNAL |
Mã nội bộ Mule | Emacs đa ngôn ngữ | Có | không | 1 | |
SJIS |
SHIFT JIS | Nhật Bản | không | không | 22738_22743 | MSKANJI , ShiftJis , Win932 , Windows932 |
Shift_Jis_2004 |
SHIFT JIS, JIS X 0213 | Nhật Bản | Không | không | 1 | |
SQL_ASCII |
không xác định (xem văn bản) | bất kỳ | Có | không | 1 | |
UHC |
Mã Hangul thống nhất | Hàn Quốc | Không | Không | 1 Từ2 | 23812_23820 , Windows949 |
UTF8 |
Unicode, 8-bit | tất cả | Có | Có | 1 | unicode |
Win866 |
Windows CP866 | Cyrillic | Có | Có | 1 | Alt |
Win874 |
Windows CP874 | Thái | Có | không | 1 | |
Win1250 |
Windows CP1250 | Trung Âu | Có | Có | 1 | |
Win1251 |
Windows CP1251 | Cyrillic | Có | Có | 1 | Win |
Win1252 |
Windows CP1252 | Tây Âu | Có | Có | 1 | |
Win1253 |
Windows CP1253 | Hy Lạp | Có | Có | 1 | |
Win1254 |
Windows CP1254 | Thổ Nhĩ Kỳ | Có | Có | 1 | |
Win1255 |
Windows CP1255 | Hê -bơ -rơ | Có | Có | 1 | |
Win1256 |
Windows CP1256 | Ả Rập | Có | Có | 1 | |
Win1257 |
Windows CP1257 | Baltic | Có | Có | 1 | |
Win1258 |
Windows CP1258 | Việt Nam | Có | Có | 1 | ABC , TCVN , TCVN5712 , VSCII |
Không phải tất cả máy kháchAPIS Hỗ trợ tất cả các bộ ký tự được liệt kê. Ví dụ:PostgreSQLTrình điều khiển JDBC không hỗ trợMule_Internal
, Latin6
, Latin8
vàLatin10
.
TheSQL_ASCII
Cài đặt hoạt động khác biệt đáng kể so với các cài đặt khác. Khi bộ máy chủ được đặt làSQL_ASCII
, máy chủ diễn giải các giá trị byte 0 Ném127 theo tiêu chuẩn ASCII, trong khi các giá trị byte 128 Phản255 được lấy làm ký tự không được giải thích. Không có chuyển đổi mã hóa sẽ được thực hiện khi cài đặt làSQL_ASCII
. Do đó, cài đặt này không phải là một tuyên bố rằng một mã hóa cụ thể đang được sử dụng, như một tuyên bố thiếu hiểu biết về mã hóa. Trong hầu hết các trường hợp, nếu bạn đang làm việc với bất kỳ dữ liệu không ASCII nào, việc sử dụng là không khôn ngoanSQL_ASCII
Cài đặt vìPostgreSQLsẽ không thể giúp bạn bằng cách chuyển đổi hoặc xác thực các ký tự không phải ASCII.
initDB
Xác định bộ ký tự mặc định (mã hóa) cho mộtPostgreSQLCụm. Ví dụ,
initDB -e euc_jp
Đặt ký tự mặc định được đặt thànhEUC_JP
(Mã Unix mở rộng cho tiếng Nhật). Bạn có thể sử dụng--Encoding
thay vì-e
Nếu bạn thích các chuỗi tùy chọn dài hơn. Nếu không-e
hoặc--Encoding
Tùy chọn được đưa ra,initDB
Cố gắng xác định mã hóa phù hợp để sử dụng dựa trên ngôn ngữ được chỉ định hoặc mặc định.
29598_29732
29759_29849
Điều này sẽ tạo cơ sở dữ liệu có tênHàn Quốc
sử dụng bộ ký tựEUC_KR
và LocaleKO_KR
. Một cách khác để thực hiện điều này là sử dụng lệnh SQL này:
30138_30255
Lưu ý rằng các lệnh trên chỉ định sao chépTemplate0
30356_30556Phần 23.3.
Mã hóa cho cơ sở dữ liệu được lưu trữ trong danh mục hệ thốngpg_database
. Bạn có thể thấy nó bằng cách sử dụngPSQL
-L
Tùy chọn hoặc\ L
lệnh.
$PSQL -L
Danh sách cơ sở dữ liệu
Tên | Chủ sở hữu | Mã hóa | Đối chiếu | Ctype | Truy cập các đặc quyền
-----------+----------+-----------+-------------+--------------+-----------------------------------------------------
clocaledb | Hlinnaka | SQL_ASCII | C | C |
Tiếng Anhdb | Hlinnaka | UTF8 | en_gb.utf8 | en_gb.utf8 |
Tiếng Nhật | Hlinnaka | UTF8 | ja_jp.utf8 | ja_jp.utf8 |
Hàn Quốc | Hlinnaka | Euc_kr | ko_kr.euckr | ko_kr.euckr |
Postgres | Hlinnaka | UTF8 | fi_fi.utf8 | fi_fi.utf8 |
Template0 | Hlinnaka | UTF8 | fi_fi.utf8 | fi_fi.utf8 | = c/hlinnaka, hlinnaka = ctc/hlinnaka
Template1 | Hlinnaka | UTF8 | fi_fi.utf8 | fi_fi.utf8 | = c/hlinnaka, hlinnaka = ctc/hlinnaka
Trên hầu hết các hệ điều hành hiện đại,PostgreSQLCó thể xác định bộ ký tự nào được ngụ ý bởilc_ctype
32041_32352
PostgreSQLsẽ cho phép Superusers tạo cơ sở dữ liệu bằngSQL_ASCII
mã hóa ngay cả khilc_ctype
không phảiC
hoặcPOSIX
. Như đã lưu ý ở trên,SQL_ASCII
Không thực thi rằng dữ liệu được lưu trữ trong cơ sở dữ liệu có bất kỳ mã hóa cụ thể nào và do đó, sự lựa chọn này đặt ra rủi ro của hành vi sai trái phụ thuộc vào địa phương. Sử dụng kết hợp các cài đặt này không được chấp nhận và một ngày nào đó có thể bị cấm hoàn toàn.
POSTGRESQLHỗ trợ chuyển đổi bộ ký tự tự động giữa máy chủ và máy khách cho nhiều kết hợp các bộ ký tự (Phần 24.3.4hiển thị cái nào).
Để bật chuyển đổi bộ ký tự tự động, bạn phải nóiPostgreSQLBộ ký tự (mã hóa) bạn muốn sử dụng trong máy khách. Có một số cách để thực hiện điều này:
Sử dụng\ mã hóa
Lệnh trongPSQL. \ mã hóa
Cho phép bạn thay đổi mã hóa máy khách khi đang bay. Ví dụ: để thay đổi mã hóa thànhSJIS
, loại:
\ mã hóa SJIS
libpq(Phần 34.11) có các chức năng để kiểm soát mã hóa máy khách.
Sử dụngđặt client_encoding thành
. Đặt mã hóa máy khách có thể được thực hiện với lệnh SQL này:
đặt client_encoding thành 'giá trị
';
Ngoài ra bạn có thể sử dụng cú pháp SQL tiêu chuẩnĐặt tên
cho mục đích này:
Đặt tên 'giá trị
';
Để truy vấn mã hóa máy khách hiện tại:
35084_35109
Để trở lại mã hóa mặc định:
35204_35230
Sử dụngpgclientencoding
. Nếu biến môi trườngpgclientencoding
được xác định trong môi trường của khách hàng, mã hóa máy khách được chọn tự động khi kết nối với máy chủ được thực hiện. (Điều này sau đó có thể được ghi đè bằng bất kỳ phương thức nào khác được đề cập ở trên.)
Sử dụng biến cấu hìnhclient_encoding. Nếuclient_encoding
Biến được đặt, mã hóa máy khách được chọn tự động khi kết nối với máy chủ được thực hiện. (Điều này sau đó có thể được ghi đè bằng bất kỳ phương thức nào khác được đề cập ở trên.)
Nếu không thể chuyển đổi một ký tự cụ thể - Giả sử bạn đã chọnEUC_JP
cho máy chủ vàLatin1
Đối với máy khách và một số ký tự Nhật Bản được trả về không có đại diện trongLatin1
- Một lỗi được báo cáo.
Nếu bộ ký tự máy khách được xác định làSQL_ASCII
36522_36648SQL_ASCII
36684_36882SQL_ASCII
không khôn ngoan trừ khi bạn đang làm việc với dữ liệu All-ASCII.
PostgreSQLCho phép chuyển đổi giữa bất kỳ hai bộ ký tự nào mà chức năng chuyển đổi được liệt kê trongpg_conversion
Danh mục hệ thống.POSTGRESQLđi kèm với một số chuyển đổi được xác định trước, như được tóm tắt trongBảng 24.2và được hiển thị chi tiết hơn trongBảng 24.3. Bạn có thể tạo chuyển đổi mới bằng lệnh SQLTạo chuyển đổi. (Để được sử dụng để chuyển đổi máy khách/máy chủ tự động, chuyển đổi phải được đánh dấu làMặc địnhKhăncho cặp bộ ký tự của nó.)
Bảng 24.2. Chuyển đổi bộ ký tự máy khách/máy chủ tích hợp
Bộ ký tự máy chủ | Bộ ký tự máy khách có sẵn |
---|---|
Big5 |
Không được hỗ trợ làm mã hóa máy chủ |
EUC_CN |
EUC_CN, Mule_Internal , UTF8 |
EUC_JP |
EUC_JP, MULE_INTERNAL , SJIS , UTF8 |
EUC_JIS_2004 |
EUC_JIS_2004, Shift_Jis_2004 , UTF8 |
EUC_KR |
EUC_KR, MULE_INTERNAL , UTF8 |
EUC_TW |
EUC_TW, Big5 , Mule_Internal , UTF8 |
GB18030 |
Không được hỗ trợ làm mã hóa máy chủ |
GBK |
Không được hỗ trợ làm mã hóa máy chủ |
ISO_8859_5 |
ISO_8859_5, KOI8R , MULE_INTERNAL , UTF8 , Win866 , Win1251 |
ISO_8859_6 |
ISO_8859_6, UTF8 |
ISO_8859_7 |
ISO_8859_7, UTF8 |
ISO_8859_8 |
ISO_8859_8, UTF8 |
Johab |
Không được hỗ trợ làm mã hóa máy chủ |
KOI8R |
KOI8R, ISO_8859_5 , MULE_INTERNAL , UTF8 , Win866 , Win1251 |
KOI8U |
KOI8U, UTF8 |
Latin1 |
Latin1, Mule_Internal , UTF8 |
Latin2 |
Latin2, Mule_Internal , UTF8 , Win1250 |
Latin3 |
Latin3, Mule_Internal , UTF8 |
Latin4 |
Latin4, Mule_Internal , UTF8 |
Latin5 |
Latin5, UTF8 |
Latin6 |
Latin6, UTF8 |
Latin7 |
Latin7, UTF8 |
Latin8 |
Latin8, UTF8 |
Latin9 |
Latin9, UTF8 |
Latin10 |
Latin10, UTF8 |
MULE_INTERNAL |
Mule_Internal, Big5 , EUC_CN , EUC_JP , EUC_KR , EUC_TW , ISO_8859_5 , KOI8R , Latin1 đếnLatin4 , SJIS , Win866 , Win1250 , Win1251 |
SJIS |
Không được hỗ trợ làm mã hóa máy chủ |
shift_jis_2004 |
Không được hỗ trợ làm mã hóa máy chủ |
SQL_ASCII |
Bất kỳ (không có chuyển đổi nào được thực hiện) |
UHC |
Không được hỗ trợ làm mã hóa máy chủ |
UTF8 |
Tất cả các mã hóa được hỗ trợ |
Win866 |
Win866, ISO_8859_5 , KOI8R , Mule_Internal , UTF8 , Win1251 |
Win874 |
Win874, UTF8 |
Win1250 |
Win1250, Latin2 , Mule_Internal , UTF8 |
Win1251 |
Win1251, ISO_8859_5 , KOI8R , Mule_Internal , UTF8 , Win866 |
Win1252 |
Win1252, UTF8 |
Win1253 |
Win1253, UTF8 |
Win1254 |
Win1254, UTF8 |
Win1255 |
Win1255, UTF8 |
Win1256 |
Win1256, UTF8 |
Win1257 |
Win1257, UTF8 |
Win1258 |
Win1258, UTF8 |
Bảng 24.3. Tất cả các chuyển đổi bộ ký tự tích hợp
Tên chuyển đổi[A] | mã hóa nguồn | Mã hóa đích |
---|---|---|
BIG5_TO_EUC_TW |
Big5 |
EUC_TW |
BIG5_TO_MIC |
Big5 |
MULE_INTERNAL |
BIG5_TO_UTF8 |
Big5 |
UTF8 |
EUC_CN_TO_MIC |
EUC_CN |
Mule_Internal |
EUC_CN_TO_UTF8 |
EUC_CN |
UTF8 |
EUC_JP_TO_MIC |
EUC_JP |
MULE_INTERNAL |
EUC_JP_TO_SJIS |
EUC_JP |
SJIS |
EUC_JP_TO_UTF8 |
EUC_JP |
UTF8 |
EUC_KR_TO_MIC |
EUC_KR |
Mule_Internal |
EUC_KR_TO_UTF8 |
EUC_KR |
UTF8 |
EUC_TW_TO_BIG5 |
EUC_TW |
Big5 |
EUC_TW_TO_MIC |
EUC_TW |
MULE_INTERNAL |
EUC_TW_TO_UTF8 |
EUC_TW |
UTF8 |
GB18030_TO_UTF8 |
GB18030 |
UTF8 |
GBK_TO_UTF8 |
GBK |
UTF8 |
ISO_8859_10_TO_UTF8 |
Latin6 |
UTF8 |
ISO_8859_13_TO_UTF8 |
Latin7 |
UTF8 |
ISO_8859_14_TO_UTF8 |
Latin8 |
UTF8 |
ISO_8859_15_TO_UTF8 |
Latin9 |
UTF8 |
ISO_8859_16_TO_UTF8 |
Latin10 |
UTF8 |
ISO_8859_1_TO_MIC |
Latin1 |
Mule_Internal |
ISO_8859_1_TO_UTF8 |
Latin1 |
UTF8 |
ISO_8859_2_TO_MIC |
Latin2 |
Mule_Internal |
ISO_8859_2_TO_UTF8 |
Latin2 |
UTF8 |
ISO_8859_2_TO_WINDOWS_1250 |
Latin2 |
Win1250 |
ISO_8859_3_TO_MIC |
Latin3 |
MULE_INTERNAL |
ISO_8859_3_TO_UTF8 |
Latin3 |
UTF8 |
ISO_8859_4_TO_MIC |
Latin4 |
MULE_INTERNAL |
ISO_8859_4_TO_UTF8 |
Latin4 |
UTF8 |
ISO_8859_5_TO_KOI8_R |
ISO_8859_5 |
KOI8R |
ISO_8859_5_TO_MIC |
ISO_8859_5 |
MULE_INTERNAL |
ISO_8859_5_TO_UTF8 |
ISO_8859_5 |
UTF8 |
ISO_8859_5_TO_WINDOWS_1251 |
ISO_8859_5 |
Win1251 |
ISO_8859_5_TO_WINDows_866 |
ISO_8859_5 |
Win866 |
ISO_8859_6_TO_UTF8 |
ISO_8859_6 |
UTF8 |
57674_57694 |
ISO_8859_7 |
UTF8 |
ISO_8859_8_TO_UTF8 |
ISO_8859_8 |
UTF8 |
ISO_8859_9_TO_UTF8 |
Latin5 |
UTF8 |
Johab_to_utf8 |
Johab |
UTF8 |
KOI8_R_TO_ISO_8859_5 |
KOI8R |
ISO_8859_5 |
KOI8_R_TO_MIC |
KOI8R |
Mule_Internal |
KOI8_R_TO_UTF8 |
KOI8R |
UTF8 |
KOI8_R_TO_WINDOWS_1251 |
KOI8R |
Win1251 |
KOI8_R_TO_WINDOWS_866 |
KOI8R |
Win866 |
KOI8_U_TO_UTF8 |
KOI8U |
UTF8 |
MIC_TO_BIG5 |
MULE_INTERNAL |
Big5 |
MIC_TO_EUC_CN |
MULE_INTERNAL |
EUC_CN |
MIC_TO_EUC_JP |
MULE_INTERNAL |
EUC_JP |
MIC_TO_EUC_KR |
Mule_Internal |
EUC_KR |
MIC_TO_EUC_TW |
Mule_Internal |
EUC_TW |
MIC_TO_ISO_8859_1 |
MULE_INTERNAL |
Latin1 |
MIC_TO_ISO_8859_2 |
Mule_Internal |
Latin2 |
MIC_TO_ISO_8859_3 |
Mule_Internal |
Latin3 |
MIC_TO_ISO_8859_4 |
Mule_Internal |
Latin4 |
MIC_TO_ISO_8859_5 |
MULE_INTERNAL |
ISO_8859_5 |
MIC_TO_KOI8_R |
MULE_INTERNAL |
KOI8R |
MIC_TO_SJIS |
Mule_Internal |
SJIS |
MIC_TO_WINDOWS_1250 |
Mule_Internal |
Win1250 |
MIC_TO_WINDows_1251 |
Mule_Internal |
Win1251 |
MIC_TO_WINDOWS_866 |
Mule_Internal |
Win866 |
SJIS_TO_EUC_JP |
SJIS |
EUC_JP |
SJIS_TO_MIC |
SJIS |
MULE_INTERNAL |
SJIS_TO_UTF8 |
SJIS |
UTF8 |
Windows_1258_TO_UTF8 |
Win1258 |
UTF8 |
UHC_TO_UTF8 |
UHC |
UTF8 |
UTF8_TO_BIG5 |
UTF8 |
Big5 |
UTF8_TO_EUC_CN |
UTF8 |
EUC_CN |
UTF8_TO_EUC_JP |
UTF8 |
EUC_JP |
UTF8_TO_EUC_KR |
UTF8 |
EUC_KR |
UTF8_TO_EUC_TW |
UTF8 |
EUC_TW |
65507_65524 |
UTF8 |
GB18030 |
UTF8_TO_GBK |
UTF8 |
GBK |
UTF8_TO_ISO_8859_1 |
UTF8 |
Latin1 |
UTF8_TO_ISO_8859_10 |
UTF8 |
Latin6 |
UTF8_TO_ISO_8859_13 |
UTF8 |
Latin7 |
UTF8_TO_ISO_8859_14 |
UTF8 |
Latin8 |
UTF8_TO_ISO_8859_15 |
UTF8 |
Latin9 |
UTF8_TO_ISO_8859_16 |
UTF8 |
Latin10 |
UTF8_TO_ISO_8859_2 |
UTF8 |
Latin2 |
UTF8_TO_ISO_8859_3 |
UTF8 |
Latin3 |
UTF8_TO_ISO_8859_4 |
UTF8 |
Latin4 |
UTF8_TO_ISO_8859_5 |
UTF8 |
ISO_8859_5 |
UTF8_TO_ISO_8859_6 |
UTF8 |
ISO_8859_6 |
UTF8_TO_ISO_8859_7 |
UTF8 |
ISO_8859_7 |
UTF8_TO_ISO_8859_8 |
UTF8 |
ISO_8859_8 |
UTF8_TO_ISO_8859_9 |
UTF8 |
Latin5 |
UTF8_TO_JOHAB |
UTF8 |
Johab |
UTF8_TO_KOI8_R |
UTF8 |
KOI8R |
UTF8_TO_KOI8_U |
UTF8 |
KOI8U |
UTF8_TO_SJIS |
UTF8 |
SJIS |
UTF8_TO_WINDows_1258 |
UTF8 |
Win1258 |
UTF8_TO_UHC |
UTF8 |
UHC |
UTF8_TO_WINDows_1250 |
UTF8 |
Win1250 |
UTF8_TO_WINDows_1251 |
UTF8 |
Win1251 |
UTF8_TO_WINDows_1252 |
UTF8 |
Win1252 |
UTF8_TO_WINDows_1253 |
UTF8 |
Win1253 |
UTF8_TO_WINDows_1254 |
UTF8 |
Win1254 |
UTF8_TO_WINDows_1255 |
UTF8 |
Win1255 |
UTF8_TO_WINDows_1256 |
UTF8 |
Win1256 |
UTF8_TO_WINDows_1257 |
UTF8 |
Win1257 |
UTF8_TO_WINDows_866 |
UTF8 |
Win866 |
UTF8_TO_WINDows_874 |
UTF8 |
Win874 |
Windows_1250_TO_ISO_8859_2 |
Win1250 |
Latin2 |
Windows_1250_TO_MIC |
Win1250 |
MULE_INTERNAL |
Windows_1250_TO_UTF8 |
Win1250 |
UTF8 |
Windows_1251_TO_ISO_8859_5 |
Win1251 |
ISO_8859_5 |
Windows_1251_TO_KOI8_R |
Win1251 |
KOI8R |
Windows_1251_TO_MIC |
Win1251 |
Mule_Internal |
Windows_1251_TO_UTF8 |
Win1251 |
UTF8 |
Windows_1251_TO_WINDows_866 |
Win1251 |
Win866 |
Windows_1252_TO_UTF8 |
Win1252 |
UTF8 |
Windows_1256_TO_UTF8 |
Win1256 |
UTF8 |
Windows_866_TO_ISO_8859_5 |
Win866 |
ISO_8859_5 |
Windows_866_TO_KOI8_R |
75223_75231 |
KOI8R |
Windows_866_TO_MIC |
Win866 |
MULE_INTERNAL |
Windows_866_TO_UTF8 |
Win866 |
UTF8 |
Windows_866_TO_WINDows_1251 |
Win866 |
win |
Windows_874_TO_UTF8 |
Win874 |
UTF8 |
EUC_JIS_2004_TO_UTF8 |
EUC_JIS_2004 |
UTF8 |
UTF8_TO_EUC_JIS_2004 |
UTF8 |
EUC_JIS_2004 |
shift_jis_2004_to_utf8 |
shift_jis_2004 |
UTF8 |
UTF8_TO_SHIFT_JIS_2004 |
UTF8 |
shift_jis_2004 |
EUC_JIS_2004_TO_SHIFT_JIS_2004 |
EUC_JIS_2004 |
shift_jis_2004 |
Shift_Jis_2004_TO_EUC_JIS_2004 |
shift_jis_2004 |
EUC_JIS_2004 |
Đây là những nguồn tốt để bắt đầu tìm hiểu về các loại hệ thống mã hóa khác nhau.
Chứa các giải thích chi tiết vềEUC_JP
, EUC_CN
, EUC_KR
, EUC_TW
.
Trang web của Hiệp hội Unicode.
UTF-8 (định dạng chuyển đổi UCS/UNICode 8 bit) được xác định ở đây.
Nếu bạn thấy bất cứ điều gì trong tài liệu không chính xác, không khớp Kinh nghiệm của bạn với tính năng cụ thể hoặc yêu cầu làm rõ thêm, Vui lòng sử dụngMẫu nàyĐể báo cáo vấn đề tài liệu.