文字 (Unicode)

Unicode中,一种文字script)是字母和其他书面符号的一个集合,用于在一个或多个书写系统writing system)中表示文本信息。[1]有些文字只支持一种书写系统和语言,例如亚美尼亚语。其他文字支持许多不同的书写系统:例如,拉丁文字支持英语法语英语French orthography德语意大利语英语Italian alphabet越南语拉丁语本身以及其他多种语言。一些语言有多种可选的书写系统,因而也就使用多种文字:例如,在土耳其语中,阿拉伯文字在20世纪之前使用,但在20世纪初过渡到拉丁文字。有关每种文字支持的语言列表,请参阅按文字列出的语言列表英语List of languages by writing system符号和Unicode控制字符某种程度上与文字互补。

统一化后的变音字符标点字符经常具有“通用”或“继承”的文字属性。然而,独立的文字往往有自己的标点变音符号,以至于许多文字不仅包含字母,还包含变音符号等标记、标点、数字,甚至还有自己的特殊符号和空格字符。

Unicode 15.0定义了161种独立的文字,包括94种现代文字和67种古代或历史文字。[2][3]更多的文字正在编码过程中,有的已被临时分配予计划中的编码。[4]

定义和分类编辑

当多种语言使用相同的文字时,经常会出现一些差异,特别是在变音符号和其他标记方面。例如,瑞典语和英语都使用拉丁文字。但是,瑞典语英语Swedish alphabet包括字符å(有时称为瑞典语的O),而英语没有这样的字符。英语也没有使用变音符号“组合用上圆圈”来表示任何字符。通常,共享相同文字的语言共享许多相同的字符。尽管瑞典语和英语书写系统存在这些外围差异,但它们被认为使用同一种拉丁文字。因而,Unicode对文字的抽象是一种基本的组织手段。不同字母或书写系统之间的差异仍然存在,并通过Unicode灵活的文字、组合标记和校对算法得到支持。

文字与书写系统编辑

书写系统有时被视为文字的同义词。但是,它也可以指一种文字所支持的具体的具体书写系统。例如,拉丁文字支持越南语书写系统。一个书写系统也可能涵盖多种文字;例如,日本的书写系统使用汉字平假名片假名

大多数书写系统可以大致分为几类:象形logographic)、音节syllabic)、字母alphabetic,亦称segmental)、元音附标abugida)、辅音音素abjad)和特征featural);然而,这些分类的所有特征都可能以不同的比例出现在任何给定的书写系统中,这导致通常很难对一个系统进行纯粹的分类。术语复杂系统有时用于分类有困难的混合系统。

Unicode通过其众多的文字支持所有这些类型的书写系统。Unicode还为字符添加了更多属性,以帮助区分各种字符以及它们在Unicode文本处理算法中的行为方式。

特殊文字属性值编辑

除了显式或特定的文字属性外,Unicode还使用三个特殊值:[5]

通用
Unicode只能将通用字符集中的一个字符分配给一种文字。但是,许多字符(不属于正式的自然语言书写系统的一部分,或在许多书写系统中统一的字符)可能用于多种文字(例如货币符号、规约符号、数字和标点符号)。在这些情况下,Unicode将它们定义为属于“通用”文字(ISO 15924代码Zyyy)。
继承
许多变音符号和非间距组合字符可以应用于来自多种文字的字符。在这些情况下,Unicode 将它们分配给“继承”文字(ISO 15924 代码Zinh),这意味着它们属于与它们所组合的主要字符相同的文字类型,因此在不同的上下文中它们可能被视为属于不同的文字。例如,U+0308  ̈  COMBINING DIAERESIS(组合用分音符)既可以与U+0065 e LATIN SMALL LETTER E(小写拉丁字母E)组合为拉丁字母ë,也可以与U+0435 е CYRILLIC SMALL LETTER IE(小写西里尔字母IE)组合为西里尔字母ё。在前一个例子中,它继承了主要字符的拉丁文字属性,而在后一个例子中继承了西里尔文字属性。
未知
“未知”文字值(ISO 15924 代码Zzzz)被赋予未分配的、私用的、非字符的以及代理用的码点。

文字中的字符类别编辑

Unicode为每个字符提供了一个通用的类别属性。所以每个字符除了属于一种文字之外,还从属于一个类别。通常的文字由字母字符组成,包括:大写字母、小写字母和修饰字母。一些字符被认为是一些预组的连字的标题字母,例如Dz(U+01F2)。此类标题连字均采用拉丁语和希腊语文字,并且都是兼容字符,因此Unicode不鼓励使用它们。将来不太可能添加新的标题字母。

大多数书写系统不区分大小写字母。对于这些文字,所有字母都归类为“其他字母”或“修饰字母”。中日韩统一表意文字等表意文字也被归类为“其他字母”。然而,一些文字确实区分了大写和小写:拉丁文字、西里尔文字、希腊文字、亚美尼亚文字、格鲁吉亚文字和沙漠文字,但即使对于这些文字,也有一些字母既不是大写也不是小写。

文字还可以包含任何其他一般类别字符,例如标记(变音符号和其他)、数字(数字)、标点符号分隔符(单词分隔符,例如空格)、符号和非图形格式字符。当它们仅被特定文字使用时,它们会包含在特定文字中,否则通常会被统一化并包含在标点符号或变音符号区块中。但是,任何文字(除了“通用”和“继承:文字)中的大部分字符都是字母。

Unicode中的文字列表编辑

Unicode根据 ISO 15924列表定义了一百多个文字名称(称为“别名”或“属性值别名”)。Unicode对ISO 15924的Zyyy(未确定文字的代码)使用“通用”名称,对ISO 15924的Zinh(继承文字的代码)使用“继承”,对ISO 15924的Zzzz(未编码文字的代码)使用“未知”。此外,ISO 15924文字代码Zsym(符号)和Zmth(数学符号)未被使用,它们不被认为是Unicode意义上的文字。

ISO 15924文字代碼[a][b]Unicode[c][d]
ISO 15924Unicode收录的文字[e]
代碼No.ISO 15924
名稱
中文名稱別名[f]方向版本字元數備註
Adlm166Adlam富拉語文字英语Adlam scriptAdlam從右至左書寫  9.088
Afak439Afaka阿法卡音節文字英语Afaka syllabary從左至右  未被Unicode收錄, proposal under review by the Unicode Technical Committee[6][7]
Aghb239Caucasian Albanian高加索阿爾巴尼亞文英语Caucasian Albanian scriptCaucasian Albanian從左至右  7.053古代/歷史文字
Ahom338Ahom, Tai Ahom阿洪姆文Ahom從左至右  8.058古代/歷史文字
Arab160Arabic阿拉伯文Arabic從右至左書寫  1.01,281
Aran161Arabic (Nastaliq variant)波斯體阿拉伯文從右至左書寫  Typographic variant of Arabic
Armi124Imperial Aramaic阿拉米字母Imperial Aramaic從右至左書寫  5.231古代/歷史文字
Armn230Armenian亞美尼亞字母Armenian從左至右  1.095
Avst134Avestan阿維斯陀字母英语Avestan alphabetAvestan從右至左書寫  5.261古代/歷史文字
Bali360Balinese峇里字母Balinese從左至右  5.0121
Bamu435Bamum巴姆穆文字Bamum從左至右  5.2657
Bass259Bassa Vah巴薩文英语Bassa scriptBassa Vah從左至右  7.036古代/歷史文字
Batk365Batak巴塔克文英语Batak scriptBatak從左至右  6.056
Beng325Bengali (Bangla)孟加拉文Bengali從左至右  1.096
Bhks334Bhaiksuki拜克舒基文英语Bhaiksuki scriptBhaiksuki從左至右  9.097古代/歷史文字
Blis550Blissymbols布力辛博文從左至右  未被Unicode收錄, proposal in initial/exploratory stage[6]
Bopo285Bopomofo注音符號Bopomofo從左至右、從右至左書寫  1.072
Brah300Brahmi婆罗米文Brahmi從左至右  6.0109古代/歷史文字
Brai570Braille點字Braille從左至右  3.0256
Bugi367Buginese布吉文Buginese從左至右  4.130
Buhd372Buhid布希德文Buhid從左至右  3.220
Cakm349Chakma查克馬文英语Chakma scriptChakma從左至右  6.170
Cans440Unified Canadian Aboriginal Syllabics加拿大原住民音節文字Canadian Aboriginal從左至右  3.0710
Cari201Carian卡里亞字母英语Carian alphabetsCarian從左至右、從右至左書寫  5.149古代/歷史文字
Cham358Cham占文Cham從左至右  5.183
Cher445Cherokee切羅基文Cherokee從左至右  3.0172
Chrs109Chorasmian花剌子模文Chorasmian從右至左書寫、从上至下  未被Unicode收錄
Cirt291Cirth克爾斯文英语Cirth從左至右  未被Unicode收錄
Copt204Coptic科普特字母Coptic從左至右  1.0137古代/歷史文字, Disunified from Greek in 4.1
Cpmn402Cypro-Minoan塞普勒斯-米諾斯文字英语Cypro-Minoan syllabaryCypro Minoan從左至右  未被Unicode收錄
Cprt403Cypriot syllabary賽普勒斯音節文字Cypriot從右至左書寫  4.055古代/歷史文字
Cyrl220Cyrillic西里尔字母Cyrillic從左至右  1.0443
Cyrs221Cyrillic (Old Church Slavonic variant)早期西里尔字母從左至右  古代/歷史文字, typographic variant of Cyrillic
Deva315Devanagari (Nagari)天城文Devanagari從左至右  1.0154
Diak342Dives Akuru迪維希阿庫魯文英语Dhives AkuruDives Akuru從左至右  未被Unicode收錄
Dogr328Dogra多格拉文英语Dogri scriptDogra從左至右  11.060古代/歷史文字
Dsrt250Deseret (Mormon)德瑟雷特字母英语Deseret alphabetDeseret從左至右  3.180
Dupl755Duployan shorthand, Duployan stenography杜普雷速記英语Duployan shorthandDuployan從左至右  7.0143
Egyd070Egyptian demotic世俗體雙向文稿  未被Unicode收錄
Egyh060Egyptian hieratic僧侶體未被Unicode收錄
Egyp050Egyptian hieroglyphs圣书体Egyptian Hieroglyphs從右至左書寫、從左至右  5.21,080古代/歷史文字
Elba226Elbasan愛爾巴桑字母英语Elbasan scriptElbasan從左至右  7.040古代/歷史文字
Elym128Elymaic埃利邁文Elymaic從右至左書寫  12.023古代/歷史文字
Ethi430Ethiopic (Geʻez)吉茲字母Ethiopic從左至右  3.0495
Geok241Khutsuri (Asomtavruli and Nuskhuri)喬治亞文小草體Georgian從左至右  Unicode groups Geok and Geor together as "Georgian"
Geor240Georgian (Mkhedruli and Mtavruli)喬治亞文騎士體Georgian從左至右  1.0173For Unicode, see also Geok
Glag225Glagolitic格拉哥里字母Glagolitic從左至右  4.1132古代/歷史文字
Gong312Gunjala Gondi貢賈拉貢德文字英语Gunjala Gondi LipiGunjala Gondi從左至右  11.063
Gonm313Masaram Gondi馬薩拉姆貢德文字英语Gondi writingMasaram Gondi從左至右  10.075
Goth206Gothic哥德字母Gothic從左至右  3.127古代/歷史文字
Gran343Grantha古兰塔文Grantha從左至右  7.085古代/歷史文字
Grek200Greek希腊字母Greek從左至右  1.0518Sometimes expressed as boustrophedon (mirroring of alternate lines rather than purely left-to-right)
Gujr320Gujarati古吉拉特文Gujarati從左至右  1.091
Guru310Gurmukhi古木基文Gurmukhi從左至右  1.080
Hanb503Han with Bopomofo (alias for Han + Bopomofo)漢字(帶注音符號)直書從右至左、從左至右  See Hani, Bopo
Hang286Hangul (Hangŭl, Hangeul)諺文Hangul從左至右、直書從右至左  1.011,739Hangul syllables relocated in 2.0
Hani500Han (Hanzi, Kanji, Hanja)漢字(中文漢字、日本漢字、韓國漢字)Han從左至右、直書從右至左  1.089,233
Hano371Hanunoo (Hanunóo)哈努諾字母英语Hanunuo scriptHanunoo從左至右、从下至上  3.221
Hans501Han (Simplified variant)簡體中文從左至右  Subset Hani
Hant502Han (Traditional variant)繁體中文從左至右  Subset Hani
Hatr127Hatran哈特拉文英语Hatran alphabetHatran從右至左書寫  8.026古代/歷史文字
Hebr125Hebrew希伯來文Hebrew從右至左書寫  1.0134
Hira410Hiragana平假名Hiragana直書從右至左、從左至右  1.0379
Hluw080Anatolian Hieroglyphs (Luwian Hieroglyphs, Hittite Hieroglyphs)安納托利亞象形文字英语Anatolian hieroglyphsAnatolian Hieroglyphs從左至右  8.0583古代/歷史文字
Hmng450Pahawh Hmong救世苗文Pahawh Hmong從左至右  7.0127
Hmnp451Nyiakeng Puachue Hmong創世紀苗文Nyiakeng Puachue Hmong從左至右  12.071
Hrkt412Japanese syllabaries (alias for Hiragana + Katakana)假名Katakana or Hiragana直書從右至左、從左至右  See Hira, Kana
Hung176Old Hungarian (Hungarian Runic)古匈牙利字母Old Hungarian從右至左書寫  8.0108古代/歷史文字
Inds610Indus (Harappan)印度河文字從右至左書寫牛耕式轉行書寫法  未被Unicode收錄, proposal in initial/exploratory stage[6]
Ital210Old Italic (Etruscan, Oscan, etc.)古意大利字母Old Italic從右至左書寫、從左至右  3.139古代/歷史文字
Jamo284Jamo (alias for Jamo subset of Hangul)韩语字母Subset Hang
Java361Javanese爪哇字母Javanese從左至右  5.290
Jpan413Japanese (alias for Han + Hiragana + Katakana)日文文字直書從右至左、從左至右  See Hani, Hira and Kana
Jurc510Jurchen女真文從左至右  未被Unicode收錄
Kali357Kayah Li克耶里字母英语Kayah Li alphabetKayah Li從左至右  5.147
Kana411Katakana片假名Katakana直書從右至左、從左至右  1.0304
Khar305Kharoshthi佉卢文Kharoshthi從右至左書寫  4.168古代/歷史文字
Khmr355Khmer高棉文Khmer從左至右  3.0146
Khoj322Khojki可吉文英语Khojki scriptKhojki從左至右  7.062古代/歷史文字
Kitl505Khitan large script契丹大字從左至右  未被Unicode收錄
Kits288Khitan small script契丹小字Khitan Small Script直書從右至左 
Knda345Kannada卡納達文Kannada從左至右  1.089
Kore287Korean (alias for Hangul + Han)韓漢混用文从上至下、從左至右、從右至左書寫  See Hani and Hang
Kpel436Kpelle克培列文英语Kpelle syllabary從左至右  未被Unicode收錄, proposal in initial/exploratory stage[6]
Kthi317Kaithi凱提文Kaithi從左至右  5.267古代/歷史文字
Lana351Tai Tham (Lanna)老傣文Tai Tham從左至右  5.2127
Laoo356Lao寮文Lao從左至右  1.082
Latf217Latin (Fraktur variant)德文尖角體從左至右  Typographic variant of Latin
Latg216Latin (Gaelic variant)蓋爾體英语Gaelic type從左至右  Typographic variant of Latin
Latn215Latin拉丁字母Latin從左至右  1.01,366See Latin script in Unicode
Leke364Leke勒克文英语Leke script從左至右  未被Unicode收錄
Lepc335Lepcha (Róng)绒巴文Lepcha從左至右  5.174
Limb336Limbu林布文Limbu從左至右  4.068
Lina400Linear A線形文字ALinear A從左至右  7.0341古代/歷史文字
Linb401Linear B線形文字BLinear B從左至右  4.0211古代/歷史文字
Lisu399Lisu (Fraser)老傈僳文Lisu從左至右  5.248
Loma437Loma洛瑪文英语Loma language#Writing systems從左至右  未被Unicode收錄, proposal in initial/exploratory stage[6]
Lyci202Lycian呂基亞字母Lycian從左至右  5.129古代/歷史文字
Lydi116Lydian呂底亞字母英语Lydian alphabetLydian從右至左書寫  5.127古代/歷史文字
Mahj314Mahajani馬哈佳尼文英语MahajaniMahajani從左至右  7.039古代/歷史文字
Maka366Makasar望加錫文英语Makassarese language#Historical writing systemMakasar從左至右  11.025古代/歷史文字
Mand140Mandaic, Mandaean曼達安字母英语Mandaic scriptMandaic從右至左書寫  6.029
Mani139Manichaean摩尼字母Manichaean從右至左書寫  7.051古代/歷史文字
Marc332Marchen象雄文Marchen從左至右  9.068古代/歷史文字
Maya090Mayan hieroglyphs瑪雅文字未被Unicode收錄
Medf265Medefaidrin (Oberi Okaime, Oberi Ɔkaimɛ)梅德法伊德林文英语MedefaidrinMedefaidrin從左至右  11.091
Mend438Mende Kikakui門德基卡庫文英语Mende Kikakui scriptMende Kikakui從右至左書寫  7.0213
Merc101Meroitic Cursive麥羅埃文草書體Meroitic Cursive從右至左書寫  6.190古代/歷史文字
Mero100Meroitic Hieroglyphs麥羅埃文聖書體Meroitic Hieroglyphs從右至左書寫  6.132古代/歷史文字
Mlym347Malayalam馬拉雅拉姆文Malayalam從左至右  1.0117
Modi324Modi, Moḍī莫迪文英语Modi scriptModi從左至右  7.079古代/歷史文字
Mong145Mongolian蒙古文Mongolian从左至右垂直、從左至右  3.0167Includes Clear, Manchu scripts
Moon218Moon (Moon code, Moon script, Moon type)穆恩字母從左至右  未被Unicode收錄, proposal in initial/exploratory stage[6]
Mroo264Mro, Mru默祿文英语Mru language#AlphabetMro從左至右  7.043
Mtei337Meitei Mayek (Meithei, Meetei)梅泰文英语Meitei scriptMeetei Mayek從左至右  5.279
Mult323Multani穆爾塔尼文英语Multani scriptMultani從左至右  8.038古代/歷史文字
Mymr350Myanmar (Burmese)缅文Myanmar從左至右  3.0223
Nand311Nandinagari南迪城文英语NandinagariNandinagari從左至右  12.065古代/歷史文字
Narb106Old North Arabian (Ancient North Arabian)古北阿拉伯字母英语Ancient North ArabianOld North Arabian從右至左書寫  7.032古代/歷史文字
Nbat159Nabataean納巴泰字母Nabataean從右至左書寫  7.040古代/歷史文字
Newa333Newa, Newar, Newari, Nepāla lipi普拉卡利特文英语Pracalit scriptNewa從左至右  9.094
Nkdb085Naxi Dongba (na²¹ɕi³³ to³³ba²¹, Nakhi Tomba)东巴文從左至右  未被Unicode收錄
Nkgb420Nakhi Geba (na²¹ɕi³³ gʌ²¹ba²¹, 'Na-'Khi ²Ggŏ-¹baw, Nakhi Geba)哥巴文從左至右  未被Unicode收錄, proposal in initial/exploratory stage[6]
Nkoo165N’Ko, N'Ko西非書面文字NKo從右至左書寫  5.062
Nshu499Nüshu女书Nushu直書從右至左  10.0397
Ogam212Ogham歐甘字母Ogham从下至上、從左至右  3.029古代/歷史文字
Olck261Ol Chiki (Ol Cemet', Ol, Santali)桑塔利文英语Ol Chiki scriptOl Chiki從左至右  5.148
Orkh175Old Turkic, Orkhon Runic古突厥文Old Turkic從右至左書寫  5.273古代/歷史文字
Orya327Oriya (Odia)奧里亞文Oriya從左至右  1.090
Osge219Osage歐塞奇字母英语Osage scriptOsage從左至右  9.072
Osma260Osmanya奧斯曼亞字母Osmanya從左至右  4.040
Palm126Palmyrene帕爾邁拉字母英语Palmyrene alphabetPalmyrene從右至左書寫  7.032古代/歷史文字
Pauc263Pau Cin Hau包钦豪文英语Pau Cin Hau scriptPau Cin Hau從左至右  7.057
Perm227Old Permic古彼爾姆文Old Permic從左至右  7.043古代/歷史文字
Phag331Phags-pa八思巴字Phags-pa从左至右垂直  5.056古代/歷史文字
Phli131Inscriptional Pahlavi碑刻巴列維文英语Inscriptional PahlaviInscriptional Pahlavi從右至左書寫  5.227古代/歷史文字
Phlp132Psalter Pahlavi詩篇巴列維文英语Psalter PahlaviPsalter Pahlavi從右至左書寫  7.029古代/歷史文字
Phlv133Book Pahlavi書本巴列維文從右至左書寫  未被Unicode收錄
Phnx115Phoenician音標Phoenician從右至左書寫  5.029古代/歷史文字
Piqd293Klingon (KLI pIqaD)克林貢文英语Klingon scripts從左至右  Rejected for inclusion in the Unicode Standard[8][9]
Plrd282Miao (Pollard)柏格理苗文Miao從左至右  6.1149
Prti130Inscriptional Parthian碑刻帕提亞文英语Inscriptional ParthianInscriptional Parthian從右至左書寫  5.230古代/歷史文字
Qaaa900Reserved for private use (start)私人使用區(開始)未被Unicode收錄
Qaai908(Private use)(私人用途)未被Unicode收錄 (Before version 5.2, this was used instead of Zinh)
Qabx949Reserved for private use (end)私人使用區(結束)未被Unicode收錄
Rjng363Rejang (Redjang, Kaganga)勒姜字母英语Rejang scriptRejang從左至右  5.137
Rohg167Hanifi Rohingya哈乃斐羅興亞文字Hanifi Rohingya從右至左書寫  11.050
Roro620Rongorongo朗格朗格牛耕式轉行書寫法  未被Unicode收錄, proposal in initial/exploratory stage[6]
Runr211Runic盧恩字母Runic從左至右、牛耕式轉行書寫法  3.086古代/歷史文字
Samr123Samaritan撒瑪利亞字母英语Samaritan alphabetSamaritan從右至左書寫、从上至下  5.261
Sara292Sarati沙拉堤文字英语Sarati从上至下、從左至右、從右至左書寫牛耕式轉行書寫法、从左至右垂直  未被Unicode收錄
Sarb105Old South Arabian古南阿拉伯字母Old South Arabian從右至左書寫  5.232古代/歷史文字
Saur344Saurashtra索拉什特拉文英语Saurashtra scriptSaurashtra從左至右  5.182
Sgnw095SignWriting手語書寫符號英语SignWritingSignWriting从左至右垂直  8.0672
Shaw281Shavian (Shaw)蕭伯納字母Shavian從左至右  4.048
Shrd319Sharada, Śāradā夏拉達文Sharada從左至右  6.194
Shui530Shuishu水書直書從右至左  未被Unicode收錄
Sidd302Siddham, Siddhaṃ, Siddhamātṛkā悉曇文字Siddham從左至右  7.092古代/歷史文字
Sind318Khudawadi, Sindhi庫達巴蒂文英语Khudabadi scriptKhudawadi從左至右  7.069
Sinh348Sinhala僧伽羅文Sinhala從左至右  3.0110
Sogd141Sogdian粟特字母Sogdian縱書與橫書、从上至下  11.042古代/歷史文字
Sogo142Old Sogdian粟特字母Old Sogdian從右至左書寫  11.040古代/歷史文字
Sora398Sora Sompeng索拉僧平字母Sora Sompeng從左至右  6.135
Soyo329Soyombo索永布文字Soyombo從左至右  10.083古代/歷史文字
Sund362Sundanese巽他字母英语Sundanese scriptSundanese從左至右  5.172
Sylo316Syloti Nagri錫爾赫特城文英语Sylheti NagariSyloti Nagri從左至右  4.144
Syrc135Syriac敘利亞字母Syriac從右至左書寫  3.088
Syre138Syriac (Estrangelo variant)敘利亞字母古典體從右至左書寫  敘利亞字母的印刷變體
Syrj137Syriac (Western variant)敘利亞字母西部變體從右至左書寫  敘利亞字母的印刷變體
Syrn136Syriac (Eastern variant)敘利亞字母東部變體從右至左書寫  敘利亞字母的印刷變體
Tagb373Tagbanwa塔格巴努亞文英语Tagbanwa scriptTagbanwa從左至右  3.218
Takr321Takri, Ṭākrī, Ṭāṅkrī塔克里文Takri從左至右  6.167
Tale353Tai Le傣仂文Tai Le從左至右  4.035
Talu354New Tai Lue新傣仂文New Tai Lue從左至右  4.183
Taml346Tamil泰米爾文Tamil從左至右  1.0123
Tang520Tangut西夏文Tangut直書從右至左、從左至右  9.06,892古代/歷史文字
Tavt359Tai Viet傣擔文Tai Viet從左至右  5.272
Telu340Telugu泰卢固文Telugu從左至右  1.098
Teng290Tengwar滕格瓦字母英语Tengwar從左至右  未被Unicode收錄
Tfng120Tifinagh (Berber)提非納文Tifinagh從左至右、從右至左書寫、从上至下、从下至上  4.159
Tglg370Tagalog (Baybayin, Alibata)貝貝因文英语BaybayinTagalog從左至右  3.220
Thaa170Thaana它拿字母Thaana從右至左書寫  3.050
Thai352Thai泰文Thai從左至右  1.086
Tibt330Tibetan藏文Tibetan從左至右  2.0207Added in 1.0, removed in 1.1 and reintroduced in 2.0
Tirh326Tirhuta底罗仆多文Tirhuta從左至右  14.082
Tasa書寫系統14.089
Toto294書寫系統Toto從左至右  14.031
Ugar040Ugaritic烏加里特字母Ugaritic從左至右  4.031古代/歷史文字
Vaii470Vai瓦伊文Vai從左至右  5.1300
Visp280Visible Speech可視語言從左至右  未被Unicode收錄
Wara262Warang Citi (Varang Kshiti)瓦蘭齊地文英语Warang CitiWarang Citi從左至右  7.084
Wcho283Wancho文喬字母英语Wancho scriptWancho從左至右  12.059
Wole480Woleai沃萊艾文英语Woleai script從左至右  未被Unicode收錄, proposal in initial/exploratory stage[6]
Xpeo030Old Persian古波斯楔形文字Old Persian從左至右  4.150古代/歷史文字
Xsux020Cuneiform, Sumero-Akkadian楔形文字Cuneiform從左至右  5.01,234古代/歷史文字
Yezi192Yezidi雅兹迪文Yezidi從右至左書寫  未被Unicode收錄
Yiii460Yi彝文Yi從左至右  3.01,220
Zanb339Zanabazar Square (Zanabazarin Dörböljin Useg, Xewtee Dörböljin Bicig, Horizontal Square Script)札那巴札尔方形字母Zanabazar Square從左至右  10.072古代/歷史文字
Zinh994Code for inherited script繼承文字Inherited10.0571
Zmth995Mathematical notation數學符號Not a 'script' in Unicode
Zsym996Symbols符號Not a 'script' in Unicode
Zsye993Symbols (emoji variant)颜文字Not a 'script' in Unicode
Zxxx997Code for unwritten documents不成文Not a 'script' in Unicode
Zyyy998Code for undetermined script未定Common7,805
Zzzz999Code for uncoded script未編碼Unknown976,118All other code points
附註
  1. ^ ISO 15924 publications 截至2019年8月19日 (2019-08-19)
  2. ^ ISO 15924 Normative text file 截至2019年8月19日 (2019-08-19)
  3. ^ ISO 15924 Changes (including Aliases for Unicode; 截至2019年8月19日 (2019-08-19))
  4. ^ Unicode version 12.1
  5. ^ Unicode charts
  6. ^ Unicode uses the "Property Value Alias" (Alias) as the script-name. These Alias names are part of Unicode and are published informatively next to ISO 15924

Unicode中缺少的文字编辑

随着Unicode的每个新版本发布,国际字符代码中都添加了新的书写系统。根据加州大学伯克利分校的语言学家Deborah Anderson博士的一份声明,Unicode中尚有100多种书写系统未包含。

根据德国美因茨应用科学大学、法国ANRT Nancy和美国加州大学伯克利分校的项目“Missing Scripts”清单,根据目前的研究状况(2022年1月),人类已知的书写系统有294种。其中131个尚未以Unicode编码,即尚不能在计算机或手机上使用。

参见编辑

参考资料编辑

  1. ^ Glossary. unicode.org. [2022-10-24]. (原始内容存档于2015-12-26). 
  2. ^ Unicode Character Database: Scripts. unicode.org. [2022-10-24]. (原始内容存档于2022-10-19). 
  3. ^ Chapter 14: Additional Ancient and Historic Scripts (PDF). Mountain View, CA: Unicode, Inc. September 2022 [2022-10-24]. ISBN 978-1-936213-32-0. (原始内容存档 (PDF)于2022-10-07). 
  4. ^ https://www.unicode.org/roadmaps/页面存档备份,存于互联网档案馆) Roadmaps to Unicode
  5. ^ UAX #24: Unicode Script Property. www.unicode.org. [2022-10-24]. (原始内容存档于2022-10-05). 
  6. ^ 6.0 6.1 6.2 6.3 6.4 6.5 6.6 6.7 6.8 Proposed New Scripts. Unicode Consortium. 2018-05-25 [2018-09-12]. 
  7. ^ Roadmap to the SMP. Unicode Consortium. 2018-08-08 [2018-09-12]. 
  8. ^ Michael Everson. Proposal to encode Klingon in Plane 1 of ISO/IEC 10646-2. 1997-09-18. 
  9. ^ The Unicode Consortium. Approved Minutes of the UTC 87 / L2 184 Joint Meeting. 2001-08-14. 

外部链接编辑

🔥 Top keywords: Baike: 首页Special:搜索九龍城寨之圍城胖猫跳江事件Energy (組合)淚之女王背着善宰跑逆天奇案2金智媛习近平郭葦昀金秀賢 (男演員)不夠善良的我們九龍寨城邊佑錫伍允龍春色寄情人劉俊謙 (香港)張書偉怪獸8號虽然不是英雄葉乃文謝坤達神耆小子六四事件我的婆婆怎麼那麼可愛排球少年!!角色列表唐振剛2024年湯姆斯盃Seventeen (組合)蕭景鴻排球少年!!WIND BREAKER—防風少年—安東尼·愛德華茲 (籃球運動員)ILLIT中华人民共和国中華民國BABYMONSTER與鳳行張文傑BOYNEXTDOOR彭丽媛笑看風雲日本母亲节习明泽金惠奫徐巧芯從Lv2開始開外掛的前勇者候補過著悠哉異世界生活德雷克 (歌手)搜查班長1958支配物种乘風2024張員瑛承欢记嚴爵香港梅龍高速公路塌陷事故柯建銘葬送的芙莉蓮迷宮飯轉生貴族憑鑑定技能扭轉人生~繼承弱小領土後,招募優秀人才打造最強領土~为人民服务 (2022年电影)黃道十二宮IVE (組合)草榴社区歐倩怡沒有秘密周雨彤柯佳嬿無職轉生~到了異世界就拿出真本事~謝京穎埃马纽埃尔·马克龙破墓周處除三害 (電影)許瑋甯Twitter五月天打天下2逆天奇案李主儐大谷翔平家族榮耀之繼承者胡子彤郭晉安毛泽东Baike: 分類索引沈伯洋白紙運動文化大革命城市猎人 (2024年电影)2024年花蓮地震(G)I-DLE城市猎人朴成焄郭宁宁2024年優霸盃哥吉拉-1.0汤姆斯杯