目前的 Unicode 字元分為 17 ( 0 - 16 ) 組編排,每組稱為平面(Plane),而每平面擁有 65536(即 216)個代碼點。然而目前只用了少數平面。
平面 | 始末字元值 | 中文名稱 | 英文名稱 |
---|---|---|---|
0 號平面 | U+0000 - U+FFFF | 基本多文種平面 | Basic Multilingual Plane,簡稱 BMP |
1 號平面 | U+10000 - U+1FFFF | 多文種補充平面 | Supplementary Multilingual Plane,簡稱 SMP |
2 號平面 | U+20000 - U+2FFFF | 表意文字補充平面 | Supplementary Ideographic Plane,簡稱 SIP |
3 號平面 | U+30000 - U+3FFFF | 表意文字第三平面 | Tertiary Ideographic Plane,簡稱 TIP |
4 號平面 至 13 號平面 | U+40000 - U+DFFFF | (尚未使用) | |
14 號平面 | U+E0000 - U+EFFFF | 特別用途補充平面 | Supplementary Special-purpose Plane,簡稱 SSP |
15 號平面 | U+F0000 - U+FFFFF | 保留作為私人使用區(A 區) | Private Use Area-A,簡稱 PUA-A |
16 號平面 | U+100000 - U+10FFFF | 保留作為私人使用區(B 區) | Private Use Area-B,簡稱 PUA-B |
Plane 0 基本多文種平面
基本多文種平面(Basic Multilingual Plane, BMP),或稱基本平面或 0 號平面(Plane 0),是 Unicode 中的一個編碼區段。編碼從 U+0000至U+FFFF。
跟漢字比較相關的,已分配的編碼區段為:
編碼範圍 | 中文名稱 | 英語名稱 |
---|---|---|
2E80-2EFF | 中日韓漢字部首補充 | CJK Radicals Supplement |
2F00-2FDF | 康熙部首 | Kangxi Radicals |
2FF0-2FFF | 表意文字序列 | Ideographic Description Characters |
3000-303F | 中日韓符號和標點 | CJK Symbols and Punctuation |
3100-312F | 注音符號 | Bopomofo |
3190-319F | 漢文注釋標誌 | Kanbun |
31A0-31BF | 注音字母擴充 | Bopomofo Extended |
31C0-31EF | 中日韓筆畫 | CJK Strokes |
3300-33FF | 中日韓相容字元 | CJK Compatibility |
3400-4DBF | 中日韓統一表意文字擴充區A | CJK Unified Ideographs Extension A |
4DC0-4DFF | 易經六十四卦符號 | Yijing Hexagrams Symbols |
4E00-9FFF | 中日韓統一表意文字 | CJK Unified Ideographs |
F900-FAFF | 中日韓相容表意文字 | CJK Compatibility Ideographs |
FE30-FE4F | 中日韓相容形式 | CJK Compatibility Forms |
現時擺放了
中日韓統一表意文字擴充 A 區 (3400-4DBF)、
中日韓統一表意文字 (F900-FAFF)、
中日韓相容形式 (FE30-FE4F)
Plane 1 第一輔助平面
第一輔助平面又稱多文種補充平面(Supplementary Multilingual Plane,縮寫 SMP,或簡稱 Plane 1),主要擺放絕大多數古代文字,現時已不再使用或很少使用文字、速記、數學字母符號、音符、圖形符號及用於學者的專業論文中使用的古老或過時的語言書寫符號,以及網路通信等使用的 繪文字。範圍在 U+10000~U+1FFFF。
Plane 2 第二輔助平面
第二輔助平面又稱為表意文字補充平面(Supplementary Ideographic Plane,縮寫 SIP,或簡稱 Plane 2),整個範圍在 U+20000~U+2FFFF。整個平面組態的都是一些罕用的漢字或地區的方言用字,如粵語用字及越南語的字喃。
現時擺放了
中日韓統一表意文字擴充 B 區(20000-2A6DF)(4萬3253個漢字)、
中日韓統一表意文字擴充 C 區(2A700-2B73F)(4149個漢字)、
中日韓統一表意文字擴充 D 區(2B740-2B81F)(222個漢字)、
中日韓統一表意文字擴充 E 區(2B820-2CEAF)(5762個漢字)、
中日韓統一表意文字擴充 F 區(2CEB0-2EBEF)(7473個漢字)
中日韓統一表意文字擴充 I 區 (2EBF0–2EE5F)
以及
中日韓相容表意文字增補(CJK Compatibility Ideographs Supplement)。
Plane 3 第三輔助平面
第三輔助平面已有相關編碼提案。本平面現已用來擺放漢字擴充區 G 和 H,並規劃用於擺放甲骨文、金文、小篆、中國戰國時期文字等,範圍在U+30000~U+3FFFF。
已分配的編碼區段為:
中日韓統一表意文字擴充 G 區 (30000-3134F)
中日韓統一表意文字擴展 H 區 (31350-323AF)
資料來源:
1. CJK Unified Ideographs
2. 中日韓統一表意文字