gbk與utf-8的詳細(xì)區(qū)別
GB 2312或GB 2312-80是一個簡體中文字符集的中國國家標(biāo)準(zhǔn),全稱為《信息交換用漢字編碼字符集·基本集》,又稱為GB0,由中國國家標(biāo)準(zhǔn)總局發(fā)布,1981年5月1日實施。接下來是小編為大家收集的gbk與utf-8的詳細(xì)區(qū)別,希望能幫到大家。
gbk與utf-8的詳細(xì)區(qū)別
GB 2312標(biāo)準(zhǔn)共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB 2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄語西里爾字母在內(nèi)的682個全角字符。
GB 2312的出現(xiàn),基本滿足了漢字的計算機處理需要,它所收錄的漢字已經(jīng)覆蓋中國大陸99.75%的使用頻率。
對于人名、古漢語等方面出現(xiàn)的罕用字,GB 2312不能處理,這導(dǎo)致了后來GBK及GB 18030漢字字符集的出現(xiàn)。
UTF-8是UNICODE的一種變長字符編碼又稱萬國碼,由Ken Thompson于1992年創(chuàng)建?,F(xiàn)在已經(jīng)標(biāo)準(zhǔn)化為RFC 3629。UTF-8用1到6個字節(jié)編碼UNICODE字符。用在網(wǎng)頁上可以同一頁面顯示中文簡體繁體及其它語言(如日文,韓文)KesionCMS的GBK版本與UTF-8版本功能是一樣的.只不過編碼方式不同。
GBK的文字編碼是雙字節(jié)來表示的,即不論中、英文字符均使用雙字節(jié)來表示,只不過為區(qū)分中文,將其最高位都定成1。
至于UTF-8編碼則是用以解決國際上字符的一種多字節(jié)編碼,它對英文使用8位(即一個字節(jié)),中文使用24位(三個字節(jié))來編碼。對于英文字符較多的網(wǎng)站則用UTF-8節(jié)省空間。
GBK包含全部中文字符;UTF-8則包含全世界所有國家需要用到的字符。
GBK是在國家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴容后兼容GB2312的標(biāo)準(zhǔn),UTF-8編碼的文字可以在各國各種支持UTF8字符集的瀏覽器上顯示。
比如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,而無需他們下載IE的中文語言支持包。 所以,對于英文比較多的論壇 ,使用GBK則每個字符占用2個字節(jié),而使用UTF-8英文卻只占一個字節(jié)。
看了“gbk與utf-8的詳細(xì)區(qū)別”還想看:
1.編碼與編號有區(qū)別嗎