字形GBK 對字形作了的規定
原則上與 GB 13000.1 G列(即源自中國大陸法定標準的漢字)下的字形/筆形保持一致。
在 CJK 漢字認同規則的總框架內,對所有的 GBK 編碼漢字實施“無重碼正形”(“GB 化”);即在不造成重碼的前提下,盡量采用中國新字形。
對于超出 CJK 漢字認同規則的、或認同規則尚未明確規定的漢字,在 GBK 碼位上暫安放舊字形。這樣,在許多情況下 GBK 收入了同一漢字的新舊兩種字形。
非漢字符號的字形,凡 GB 2312 已經包括的,與 GB 2312 保持一致;超出 GB 2312 的部分,與 GB 13000.1 保持一致。
帶聲調的拼音字母取半角形式。
標準 ASCII 碼是
雖然標準 ASCII 碼是 7 位編碼,但由于計算機基本處理單位為字節( 1byte = 8bit ),所以一般仍以一個字節來存放一個 ASCII 字符。每一個字節中多余出來的一位(最高位)在計算機內部通常保持為 0 (在數據傳輸時可用作奇偶校驗位)。
由于標準 ASCII字符集字符數目有限,在實際應用中往往無法滿足要求。為此,國際標準化組織又制定了 ISO2022 標準,它規定了在保持與 ISO646 兼容的前提下將 ASCII字符集擴充為 8 位代碼的統一方法。 ISO 陸續制定了一批適用于不同地區的擴充 ASCII字符集,每種擴充 ASCII 字符集分別可以擴充 128 個字符,這些擴充字符的編碼均為高位為 1 的 8 位代碼(即十進制數 128~255 ),稱為擴展 ASCII 碼。
通過了解字符的存儲編碼,可以解決很多由編碼不匹配引起的問題,比如網頁亂碼、郵件亂碼,本文簡單扼要地闡明了ASCII編碼、EBCDIC編碼、GB2312編碼、UTF-8編碼、以及Base64編碼。