可变宽度编码
字符编码方案
可变宽度编码是一种字符编码方案,其中藉由不同长度的代码,对字符集(符号库)进行编码以表示文字,通常使用于计算机中。[1][a]最常见的可变宽度编码为多字节编码,它使用不同数量的字节(或称八位字节)来编码不同的字符。(有些作者,尤其在微軟文档中,使用“多字节字符集”这一术语。但这样实属用词不当,因表示大小是编码的属性,而非字符集的属性。 )
在早期的微型计算机的冒险游戏中,有时为将英文文本打包成更少的字节,使用每个字符少于一个字节的早期可变宽度编码。然而,因与磁带不同,它允许随机访问,允许按需加载文本的磁盘的产生与计算机内存的增加和通用压缩算法的运用,使这些技巧在很大程度上已经过时。
多字节编码多为因增加字符数量而不致破坏与已存在的限制之间的向后兼容性而产生。例如,若每个字符以一个字节(8比特)存储,则最多可编码256个可能的字符;故为了编码数量超过256个的字符,显而易见的选择则是每个编码单元使用两个及以上数量的字节,如两个字节(16比特)可编码65536个可能的字符,但这样的改变将会破坏与已存在之系统的兼容性,故可能根本便不可行。
註釋编辑
- ^ The concept long precedes the advent of the electronic computer, however, as seen with Morse code.
參考文獻编辑
- ^ Crispin, M. UTF-9 and UTF-18 Efficient Transformation Formats of Unicode. 2005-04 [2022-09-23]. doi:10.17487/rfc4042. (原始内容存档于2022-10-05) (英语).
🔥 Top keywords: Baike: 首页Special:搜索胖猫跳江事件背着善宰跑九龍城寨之圍城逆天奇案2璩静淚之女王歌手2024Energy (組合)新生 (网络剧)习近平匈牙利邊佑錫劉俊謙 (香港)金智媛神耆小子塞尔维亚金秀賢 (男演員)母亲节猩球崛起:王國誕生九龍寨城馴鹿寶貝家族榮耀之繼承者Seventeen (組合)六四事件不夠善良的我們张维为楊佩潔TripleS支配物种庆余年郭葦昀洪若潭命案金惠奫2024年英雄联盟季中邀请赛春色寄情人BABYMONSTER笑看風雲乘風2024排球少年!!角色列表破墓徐巧芯中华人民共和国中華民國打天下2WIND BREAKER—防風少年—习明泽排球少年!!彭丽媛磁暴ILLIT贾斯汀·比伯逆天奇案BOYNEXTDOOR猿人爭霸戰:猩凶革命張書偉我的婆婆怎麼那麼可愛我獨自升級怪獸8號謝坤達IVE (組合)與鳳行關於我轉生變成史萊姆這檔事角色列表黃道十二宮福建號航空母艦虽然不是英雄葉乃文五月天張員瑛草榴社区張文傑2024年花蓮地震极光香緹·摩爾迷宮飯呂家愷搜查班長1958日本劉德華海莉·鮑德溫蕭景鴻越位 (足球)葬送的芙莉蓮周處除三害 (電影)毛泽东願榮光歸香港林峯周雨彤伍允龍羅毓儀香港Baike: 分類索引沒有秘密猩球崛起:終極決戰角質層唐振剛柯佳嬿文化大革命