中日韓統一表意文字擴展區B

中日韓統一表意文字擴展區B(英語:CJK Unified Ideographs Extension B)是一個Unicode區段,在Unicode版本3.1被引入。

中日韓統一表意文字擴展區B
CJK Unified Ideographs Extension B
範圍U+20000..U+2A6DF
(42,720個碼位)
平面表意文字補充平面SIP
文字漢字
已分配42,720個碼位
未分配0個保留碼位
統一碼版本歷史
3.142,711 (+42,711)
13.042,718 (+7)
14.042,720 (+2)
註釋[1][2]

擴展B區包含有42,711個新的漢字,位置在 U+20000–U+2A6DD。根據IRG N777號文件页面存档备份,存于互联网档案馆),這四萬多個漢字分別從以下字典或字集中取得:

  • 康熙字典》中出現的18,486個未收錄漢字(包括一個在補遺篇出現的漢字);
  • 汉语大字典》中出現的28,914個未收錄漢字;
  • 辭源》中出現的66個未收錄漢字;
  • 辭海》中出現的247個未收錄漢字;
  • 汉语大词典》中出現的553個未收錄漢字;
  • 中国大百科全书》中出現的86個未收錄漢字;
  • 北大方正排版系统中出現的65個未收錄漢字;
  • 四庫全書》中出現的522個未收錄漢字;
  • 香港增補字符集中出現的1,081個未收錄漢字;
  • 日本工業標準的JIS X 0213第3水準及第4水準的302個未收錄漢字;
  • 南韓 PKS 5700-3:1998 中出現的166個未收錄漢字;
  • 北韓 KPS 9566-97 和 KPS 10721-2000 國家標準所收錄的5,642個漢字;
  • 台灣 CNS 11643 的第4至7和15平面所收錄的30,177個漢字;
  • 越南 TCVN、VHN 01:1998 和 VHN 02:1998 所收錄的4,232個喃字

這些漢字中重複的漢字有不少,所以經過整理之後,實際總數只有42,711個漢字。

另外,在 U+2F800–U+2FA1D 的位置,放了542個來自台灣的兼容漢字。

因擴展B區在整理上有缺陷,收錄了以下8個本來應該與其他漢字統一的字:[3][4]

而在 WG2 N1155文件中,亦列出了152對可考慮統一的漢字。

字符列表编辑

以下列表列出了在中日韩统一表意文字扩展区B中的所有文字:

為避免頁面過大,下列提供分段的中日韩统一表意文字扩展区B列表:

参见编辑

參考資料编辑

引用编辑

  1. ^ Unicode character database. The Unicode Standard. [2016-07-09]. (原始内容存档于2017-09-25). 
  2. ^ Enumerated Versions of The Unicode Standard. The Unicode Standard. [2016-07-09]. (原始内容存档于2016-06-29). 
  3. ^ 存档副本 (PDF). [2011-02-01]. (原始内容存档 (PDF)于2007-06-12). 
  4. ^ Cook, Richard. Defect Report on Duplicate Encoded CJK Forms (PDF). ISO/IEC JTC1/SC2/WG2. 6 October 2003 [2012-03-28]. (原始内容存档 (PDF)于2007-06-12). 

來源编辑