Unicode中的音标符号

Unicode通过已有的书写系统和添加带音标字符的额外的区段支持一些音标文字和标记法。这些语音学符号产生于已有的文字,通常是拉丁文、希腊文或西里尔文。Unicode中没有专门的“国际音标字符”。除官方标准的国际音标外,这些区段还包括了已被现今标准规范废除的国际音标符号、乌拉尔音标英语Uralic Phonetic Alphabet、过去使用的汉语音调符号等。

音标字符编辑

国际音标利用来自其他书写系统最常用的标音字母。国际音标常使用拉丁字母、希腊字母和西里尔字母,组合用变音符号还补充语音文本的意义。最后,这些标音字母利用为表达语言学含义特别修订的字母。一个“修饰字母”不是作为独立的字母,但作为前面字符的修饰[1]产生有区别的字素,尤其是在国际音标中。例如,ʰ不是用来表达它本身,但修饰了前面的符号。因此,是单独的区别于t的国际音标符号。然而,这些“修饰字母”的一部分也用于全音素文字。例如,ʿ 用来转写闪米特语的ayin或夏威夷语okina,或者 ˚ 转写阿布哈兹语 ә

从国际音标到Unicode编辑

辅音编辑

下表包含了国际音标用的音位的Unicode码点。加粗的码点表示Unicode图标提供应用程序注释,如U+026D ɭ LATIN SMALL LETTER L WITH RETROFLEX HOOK ,HTML:ɭ用于“浊卷舌边音”。粗斜体表示字符名称本身标示了发音,如U+0298 ʘ LATIN LETTER BILABIAL CLICK ,HTML:ʘ

双唇唇齿齿齿龈龈后卷舌唇硬腭
塞音p 0070b 0062 0070 032A 0062 032A 0074 032A 0064 032At
0074
d 0064ʈ 0288ɖ 0256
内爆音ɓ̥ 0253 0325ɓ 0253ɗ̪ 0257 032Aɗ 0257*
挤喉音 0070 02BCt̪ʼ 0074 032A 02BC 0074 02BCʈʼ 0288 02BC
鼻音 006D 0325m 006Dɱ̊ 0271 030Aɱ 0271n̪̊ 006E 032A 030A 006E 032A 006E 0325n 006Eɳ̊ 0273 030Aɳ 0273
颤音ʙ 0299 0072 0325r 0072*
闪音ⱱ̟ 2C71 031F 2C71ɾ 027Eɽ 027D
边闪音ɺ 027A*
擦音ɸ 0278β 03B2f
0066
v 0076θ 03B8ð 00F0s 0073z 007Aʃ 0283ʒ 0292ʂ 0282ʐ 0290
边擦音ɬ 026Cɮ 026E*
挤喉擦音 0073 02BCʃʼ 0283 02BC
挤喉边擦音ɬʼ 026C 02BC
敲击音ʬ
02AC
ʭ
02AD
近音β̞̊ 03B2 031E 030Aβ̞ 03B2 031Eʋ̥ 028B 0325ʋ 028Bð̞ 00F0 031Eɹ̥ 0279 0325ɹ 0279ɻ̊ 027B 030Aɻ 027Bɥ̊ 0265 030Aɥ 0265
边近音 006C 0325l 006Cɭ 026D
搭嘴音ʘ
0298
ǀ
01C0
ǃ
01C3
ǃ / ǂ
01C3 / 01C2
边搭嘴音*ǁ
01C1
龈腭硬腭唇软腭软腭小舌会厌声门
塞音ȶ 0236ȡ 0221c 0063ɟ 025Fk͡p 006B 0361 0070ɡ͡b 0261 0361 0062k 006Bɡ 0261q 0071ɢ 0262ʡ 02A1ʔ 0294
内爆音ʄ 0284ɠ 0260ʛ 029B
挤喉音 0063 02BC 006B 02BC 0071 02BC
鼻音ȵ 0235ɲ 0272ŋ͡m 014B 0361 006Dŋ 014Bɴ 0274
颤音ʀ 0280*
闪音*
边闪音**
擦音ɕ 0255ʑ 0291ç 0063 0327ʝ 029Dx 0078ɣ 0263χ 03C7ʁ 0281ħ 0127ʕ 0295ʜ 029Cʢ 02A2h 0068ɦ 0266
近音j 006Aʍ 028Dw 0077ɰ 0270
边近音ȴ 0234ʎ 028Eʟ 029F

元音编辑

下表描述了元音及其Unicode / UCS码点。表格中成对的元音分别地表示不圆唇和圆唇的变化。另外,带Unicode名称的字符以粗体标出。带有额外应用程序注释的字符以粗斜体标出。直接借用其他文字(拉丁字母、希腊字母或西里尔字母)的以斜体标出。

Unicode元音码点
本表格表示语音学上的元音图

圆点两边的元音格式为不圆唇 · 圆唇

i · y
0069 0079
ɨ · ʉ
0268 0289
ɯ · u
026F 0075
次闭ɪ · ʏ
026A 028F
ɪ̈ · ʊ̈
026A 0308 · 028A 0308
 · ʊ
028A
半闭e · ø
0065 00F8
ɘ · ɵ
0258 0275
ɤ · o
0264 006F
ə
0259
半开ɛ · œ
025B 0153
ɜ · ɞ
025C 025E
ʌ · ɔ
028C 0254
次开æ ·
00E6
ɐ
0250
a · ɶ
0061 0276
ɑ · ɒ
0251 0252
元音长度标记ː
02D0

Unicode区段编辑

不同于标准拉丁字母或希腊字母如m和ɛ,这些符号放在特定的语音学用区段:

从Unicode区段到文字编辑

语音学用的字符放在六个Unicode区段中。

国际音标扩展(U+0250–02AF)编辑

國際音標擴展
IPA Extensions[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+025xɐɑɒɓɔɕɖɗɘəɚɛɜɝɞɟ
U+026xɠɡɢɣɤɥɦɧɨɩɪɫɬɭɮɯ
U+027xɰɱɲɳɴɵɶɷɸɹɺɻɼɽɾɿ
U+028xʀʁʂʃʄʅʆʇʈʉʊʋʌʍʎʏ
U+029xʐʑʒʓʔʕʖʗʘʙʚʛʜʝʞʟ
U+02Axʠʡʢʣʤʥʦʧʨʩʪʫʬʭʮʯ
註釋
1.^ 依據 Unicode 14.0

占位修饰符号(U+02B0–02FF)编辑

占位修饰符号区段里面的字符用来和前面的字母组成一个单元(即“修饰”)。如字符U+02B0 ʰ MODIFIER LETTER SMALL H不是简单的表示上标h(h),但是作为送气音符号放在字母后面表示送气,像是。这个区段包含了:

  • 拉丁上标修饰符号(U+02B0–U+02B8): ʰ 送气ʱ 呼气音ʲ 腭音化ʳ, ʴ, ʵ, ʶ 儿化或 r-offglides ʷ 唇化ʸ 腭化,美式标音系统英语Americanist phonetic notation用(U+02B2)
  • 杂项语音学修饰符(U+02B9–U+02D7):ʹ ʺ ʻ ʼ ʽ ʾ ʿ ˀ ˁ ˂ ˃ ˄ ˅ ˆ ˇ ˈ ˉ ˊ ˋ ˌ ˍ ˎ ˏ ː ˑ ˒ ˓ ˔ ˕ ˖ ˗
  • 间隔用变音符号(U+02D8–U+02DD):˘ 抑扬符 ˙ 上点˚ 上圈;˛ ogonek˜ 腭化符;˝ 双尖音符
  • 基于1989年国际音标附加的(U+02DE–U+02E4):˞ ˟ ˠ ˡ ˢ ˣ ˤ
  • 声调符号(U+02E5–U+02E9):˥ ˦ ˧ ˨ ˩
  • 扩展注音符号声调标记:U+02EA ˪ YIN DEPARTING TONE MARKU+02EB ˫ YANG DEPARTING TONE MARK
  • 国际音标修饰字符:U+02EC ˬ MODIFIER LETTER VOICING,不送气
  • 其他修饰符号:U+02EE ˮ MODIFIER LETTER DOUBLE APOSTROPHE,用于涅涅茨语
  • 乌拉尔音标修饰符号(U+02EF–U+02FF):˯˰ ˱ ˲ ˳ ˴ ˵ ˶ ˷ ˸ ˹ ˺ ˻ ˼ ˽ ˾ ˿
佔位修飾符號
Spacing Modifier Letters[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+02Bxʰʱʲʳʴʵʶʷʸʹʺʻʼʽʾʿ
U+02Cxˀˁ˂˃˄˅ˆˇˈˉˊˋˌˍˎˏ
U+02Dxːˑ˒˓˔˕˖˗˘˙˚˛˜˝˞˟
U+02Exˠˡˢˣˤ˥˦˧˨˩˪˫ˬ˭ˮ˯
U+02Fx˰˱˲˳˴˵˶˷˸˹˺˻˼˽˾˿
註釋
1.^ 依據 Unicode 14.0

音标扩展(U+1D00–1D7F)编辑

这个区段和下面的音标扩展增补包括了:

  • 小型大写字母“ɢ ɪ ɴ ɶ ʀ ʏ ʙ ʜ ʟ”
  • 倒转的小写字母“ɐ ɥ ɯ ɹ ɺ ɻ ʇ ʌ ʍ ʎ ʞ ʮ ʯ”
  • 额外的小型大写字母“ʁ ʛ ᴀ ᴁ ᴃ ᴄ ᴅ ᴆ ᴇ ᴊ ᴋ ᴌ ᴍ ᴎ ᴏ ᴐ ᴘ ᴙ ᴚ ᴛ ᴜ ᴠ ᴡ ᴢ ᴣ ᴦ ᴧ ᴨ ᴩ ᴪ”
  • 带硬腭音钩的小写字母“ƫ ᶀ ᶁ ᶂ ᶃ ᶄ ᶅ ᶆ ᶇ ᶈ ᶉ ᶊ ᶋ ᶌ ᶍ ᶎ ᶪ ᶵ”
  • 带卷舌钩的小写字母“ᶏ ᶐ ᶒ ᶓ ᶔ ᶕ ᶖ ᶗ ᶘ ᶙ ᶚ ᶩ ᶯ ᶼ”
音標擴展
Phonetic Extensions[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+1D0x
U+1D1x
U+1D2x
U+1D3xᴿ
U+1D4x
U+1D5x
U+1D6x
U+1D7xᵿ
註釋
1.^ 依据 Unicode 14.0

音标扩展增补(U+1D80–1DBF)编辑

音標擴展補充
Phonetic Extensions Supplement[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+1D8x
U+1D9x
U+1DAx
U+1DBxᶿ
注釋
1.^ 依據 Unicode 15.0

声调修饰符号(U+A700–A71F)编辑

  • U+A700到U+A707的8个符号不是标准的国际音标符号。它们只是在早期被用于标示汉语的声调调类(不是调值,平上去入、各分阴阳,所以一共8个符号),标准国际音标规范中没有这8个符号。
  • U+A717到U+A71A不是标准的国际音标符号,它们用于记录奇南特克语的声调符号。
  • U+A71B到U+A71F不是标准的国际音标符号,它们用于记录非洲语言的声调
聲調修飾符號
Modifier Tone Letters[1]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+A70x
U+A71x
註釋
1.^ 依據 Unicode 15.0

上标和下标(U+2070–209F)编辑

上標和下標
Superscripts and Subscripts[1][2][3]
Unicode Consortium 官方碼表(PDF)
 0123456789ABCDEF
U+207x
U+208x
U+209x
註釋
1.^ 依據 Unicode 14.0
2.^ 灰色區域表示未分配的碼位
3.^ 字符¹(U+00B9),²(U+00B2)與³(U+00B3)位於拉丁字母補充-1


参见编辑

参考资料编辑

  1. ^ 存档副本. [2014-08-27]. (原始内容存档于2021-02-24). 

外部链接编辑