組合字符

組合字符Combining character)在字體排印學中是用來改變其它字符所用的字符。在拉丁字母中,最常見的組合字符為附加符號(包含重音號)。 [1]

西里爾字母У短音符組合成Ў.

統一碼也包含許多預組字符(Precomposed character),即事先將字符組好並賦予碼位。所以有可能同時使用組合字符和預組字符。這導致了若要比較兩個統一碼字串或設計編碼轉換器時,需要先執行Unicode正規化[2]

在統一碼中,用於歐洲語言和國際音標的組合用附加符號為〈U+0300–U+036F〉。組合用附加符號亦存在統一碼中的多個區塊。在統一碼中,附加符號總是加在主要字符之後。因此,有可能加入多個附加符號。直到2006年,只有少數軟體能正確顯示此類組合。

OpenType编辑

OpenType則有ccmp功能標籤,以定義字形是由其它組合字符所組合出來或可分解之,另有mark標籤用以將組合字符疊加於基本字符,以及mkmk標籤用以組合字符彼此之間的組合。

統一碼範圍编辑

組合附加符號
Combining Diacritical Marks
[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+030x◌̀◌́◌̂◌̃◌̄◌̅◌̆◌̇◌̈◌̉◌̊◌̋◌̌◌̍◌̎◌̏
U+031x◌̐◌̑◌̒◌̓◌̔◌̕◌̖◌̗◌̘◌̙◌̚◌̛◌̜◌̝◌̞◌̟
U+032x◌̠◌̡◌̢◌̣◌̤◌̥◌̦◌̧◌̨◌̩◌̪◌̫◌̬◌̭◌̮◌̯
U+033x◌̰◌̱◌̲◌̳◌̴◌̵◌̶◌̷◌̸◌̹◌̺◌̻◌̼◌̽◌̾◌̿
U+034x◌̀◌́◌͂◌̓◌̈́◌ͅ◌͆◌͇◌͈◌͉◌͊◌͋◌͌◌͍◌͎ CGJ 
U+035x◌͐◌͑◌͒◌͓◌͔◌͕◌͖◌͗◌͘◌͙◌͚◌͛◌͜◌◌͝◌◌͞◌◌͟◌
U+036x◌͠◌◌͡◌◌͢◌◌ͣ◌ͤ◌ͥ◌ͦ◌ͧ◌ͨ◌ͩ◌ͪ◌ͫ◌ͬ◌ͭ◌ͮ◌ͯ
注释
1.^ 依據 Unicode 14.0

碼點U+0346–034A為國際音標符號:

  • U+0346  ͆ :唇齿化
  • U+0347  ͇齒齦音
  • U+0348  ͈強音
  • U+0349  ͉ :弱音
  • U+034A  ͊ :去鼻音化

碼點U+034B–034E用於言語障礙國際音標附加符號

  • U+034B  ͋ :鼻腔洩氣
  • U+034C  ͌ :齶咽擦音
  • U+034D  ͍ :唇部伸展
  • U+034E  ͎ :哨音
组合附加符号扩展
Combining Diacritical Marks Extended
[1][2]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+1ABx◌᪰◌᪱◌᪲◌᪳◌᪴◌᪵◌᪶◌᪷◌᪸◌᪹◌᪺◌᪻◌᪼◌᪽◌᪾◌ᪿ
U+1ACx◌ᫀ
U+1ADx
U+1AEx
U+1AFx
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
組合附加符號補充
Combining Diacritical Marks Supplement
[1][2]
Unicode Consortium 官方碼表(PDF)
0123456789ABCDEF
U+1DCx◌᷀◌᷁◌᷂◌᷃◌᷄◌᷅◌᷆◌᷇◌᷈◌᷉◌᷊◌᷋◌᷌◌᷍◌᷎◌᷏
U+1DDx◌᷐◌᷑◌᷒◌ᷓ◌ᷔ◌ᷕ◌ᷖ◌ᷗ◌ᷘ◌ᷙ◌ᷚ◌ᷛ◌ᷜ◌ᷝ◌ᷞ◌ᷟ
U+1DEx◌ᷠ◌ᷡ◌ᷢ◌ᷣ◌ᷤ◌ᷥ◌ᷦ◌ᷧ◌ᷨ◌ᷩ◌ᷪ◌ᷫ◌ᷬ◌ᷭ◌ᷮ◌ᷯ
U+1DFx◌ᷰ◌ᷱ◌ᷲ◌ᷳ◌ᷴ◌᷵◌᷶◌᷷◌᷸◌᷹◌᷻◌᷼◌᷽◌᷾◌᷿
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
符號用組合附加符號
Combining Diacritical Marks for Symbols[1][2]
Unicode Consortium 官方碼表 (PDF)
0123456789ABCDEF
U+20Dx◌⃐◌⃑◌⃒◌⃓◌⃔◌⃕◌⃖◌⃗◌⃘◌⃙◌⃚◌⃛◌⃜◌⃝◌⃞◌⃟
U+20Ex◌⃠◌⃡◌⃢◌⃣◌⃤◌⃥◌⃦◌⃧◌⃨◌⃩◌⃪◌⃫◌⃬◌⃭◌⃮◌⃯
U+20Fx◌⃰
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域为未分配码位
組合半符號
Combining Half Marks[1]
Unicode Consortium 官方碼表 (PDF)
 0123456789ABCDEF
U+FE2x◌︠◌︡◌︢◌︣◌︤◌︥◌︦◌︧◌︨◌︩◌︪◌︫◌︬◌︭◌︮◌︯
注释
1.^ 依据 Unicode 13.0

註釋编辑

  1. ^ Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  2. ^ 例如,當在做windows-1258和越南資訊交換標準代碼之間的轉換時,前者使用組合字符而後者使用大量預組字符。轉換器若只是單純地與統一碼做轉換,則會導致混亂。
  3. ^ Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  4. ^ Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  5. ^ 5.0 5.1 5.2 5.3 Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.

參見编辑

外部連結编辑