編碼與編號有區(qū)別嗎

時間：2016-03-13 17:38:35 映芳735由分享

　　有人認為編號和編碼是同個意思，其實，編碼比編號復雜多了，編號僅僅就是一個順序代號，編碼里面卻蘊含著很多信息。下面小編帶你了解一下。

　　編號：

　　給順序號作為一種識別的方法，如給房間編號，限定于有限的或確定的數(shù)字內(nèi)。

　　編碼：

　　編碼(Encoding)在認知上是解釋傳入的刺激的一種基本知覺的過程。技術上來說，這是一個復雜的、多階段的轉(zhuǎn)換過程，從較為客觀的感覺輸入(例如光、聲)到主觀上有意義的體驗。

　　字符編碼是一套法則，使用該法則能夠?qū)ψ匀徽Z言的字符的一個集合(如字母表或音節(jié)表)，與其他東西的一個集合(如號碼或電脈沖)進行配對。

　　編碼分類：

　　數(shù)字系統(tǒng)中常用的編碼有兩類，一類是二進制編碼，另一類是二—十進制編碼。

　　編碼體系：

　　1.ASCII與Binary

　　我們?nèi)粘＝佑|到的文件分ASCII和Binary兩種。ASCII是“美國信息交換標準編碼”的英文字頭縮寫，可稱之為“美標”。美標規(guī)定了用從0到127的128個數(shù)字來代表信息的規(guī)范編碼，其中包括33個控制碼，一個空格碼，和94個形象碼。形象碼中包括了英文大小寫字母，阿拉伯數(shù)字，標點符號等。我們平時閱讀的英文電腦文本，就是以形象碼的方式傳遞和存儲的。美標是國際上大部分大小電腦的通用編碼。

　　然而電腦中的一個字符大都是用一個八位數(shù)的二進制數(shù)字表示。這樣每一字符便可能有256個不同的數(shù)值。由于美標只規(guī)定了128個編碼，剩下的另外128個數(shù)碼沒有規(guī)范，各家用法不一。另外美標中的33個控制碼，各廠家用法也不盡一致。這樣我們在不同電腦間交換文件的時候，就有必要區(qū)分兩類不同的文件。第一類文件中每一個字都是美標形象碼或空格碼。這類文件稱為“美標文本文件”(ASCII Text Files)，或略為“文本文件”，通?？稍诓煌娔X系統(tǒng)間直接交換。第二類文件，也就是含有控制碼或非美標碼的文件，通常不能在不同電腦系統(tǒng)間直接交換。這類文件有一個通稱，叫“二進制文件”(Binary Files)。

　　2.國標、區(qū)位、“準國標”

　　“國標”是“中華人民共和國國家標準信息交換用漢字編碼”的簡稱。國標表(基本表)把七千余漢字、以及標點符號、外文字母等，排成一個94行、94列的方陣。方陣中每一橫行叫一個“區(qū)”，每個區(qū)有九十四個“位”。一個漢字在方陣中的坐標，稱為該字的“區(qū)位碼”。例如“中”字在方陣中處于第54區(qū)第48位，它的區(qū)位碼就是5448。

　　其實94這個數(shù)字。它是美標中形象碼的總數(shù)。國標表沿用這個數(shù)字，本意大概是要用兩個美標形象符代表一個漢字。由于美標形象符的編碼是從33到126，漢字區(qū)、位碼如果各加上32，就會與美標形象碼的范圍重合。如上例“中”字區(qū)、位碼加上32后，得86,80。這兩個數(shù)字的十六進制放在一起得5650，稱為該字的“國標碼”，而與其相對應的兩個美標符號，VP，也就是“中”字的“國標符”了。

　　3.GBK碼

　　GBK碼是GB碼的擴展字符編碼，對多達2萬多的簡繁漢字進行了編碼，簡體版的Win95和Win98都是使用GBK作系統(tǒng)內(nèi)碼。

　　4.BIG5碼

　　BIG5碼是針對繁體漢字的漢字編碼，目前在臺灣、香港的電腦系統(tǒng)中得到普遍應用。

　　5.HZ碼

　　HZ碼是在Internet上廣泛使用的一種漢字編碼。“HZ”方案的特點，是以“純國標”的中文與美標碼混用。那么“HZ”是怎樣區(qū)分國標符和美標符的呢?答案其實也很簡單：當一串美標碼中間插入一段國標碼的時候，我們便在國標碼的前面加上~，后面加上~。這些附加碼分別叫“逃出碼”和“逃入碼”。由于這些附加碼本身也是美標形象碼，整個文件就儼然是一個美標文本文件，可以安然地在電腦網(wǎng)上傳遞，也和大部分英文文本處理軟件兼容。

　　6.ISO-2022CJK碼

　　ISO-2022是國際標準組織(ISO)為各種語言字符制定的編碼標準。采用二個字節(jié)編碼，其中漢語編碼稱ISO-2022 CN，日語、韓語的編碼分別稱JP、KR。一般將三者合稱CJK碼。目前CJK碼主要在Internet網(wǎng)絡中使用。

　　7.UCS和ISO10646

　　1993年，國際標準ISO10646 定義了通用字符集 (Universal Character Set, UCS)。 UCS 是所有其他字符集標準的一個超集。它保證與其他字符集是雙向兼容的。就是說，如果你將任何文本字符串翻譯到 UCS格式，然后再翻譯回原編碼, 你不會丟失任何信息。

　　UCS 包含了用于表達所有已知語言的字符。不僅包括拉丁語，希臘語，斯拉夫語，希伯來語,阿拉伯語，亞美尼亞語和喬治亞語的描述，還包括中文，日文和韓文這樣的象形文字，以及平假名，片假名，孟加拉語, 旁遮普語果魯穆奇字符(Gurmukhi)，泰米爾語，印.埃納德語(Kannada)，Malayalam，泰國語，老撾語，漢語拼音(Bopomofo)， Hangul，Devangari，Gujarati， Oriya，Telugu 以及其它語種。對于還沒有加入的語言, 由于正在研究怎樣在計算機中最好地編碼它們，因而最終它們都將被加入。這些語言包括Tibetian，高棉語，Runic(古代北歐文字)，埃塞俄比亞語，其他象形文字，以及各種各樣的印-歐語系的語言，還包括挑選出來的藝術語言比如 Tengwar，Cirth 和克林貢語(Klingon)。UCS 還包括大量的圖形的，印刷用的，數(shù)學用的和科學用的符號，包括所有由 TeX，Postscript， MS-DOS，MS-Windows， Macintosh， OCR 字體，以及許多其他字處理和出版系統(tǒng)提供的字符。

　　8.Unicode碼

　　。Unicode其實就是寬字節(jié)字符集，它對每個字符都固定使用兩個字節(jié)即16位表示，于是當處理字符時，不必擔心只處理半個字符。

　　目前，Unicode在網(wǎng)絡、Windows系統(tǒng)和很多大型軟件中得到應用。

　　字符種類：

　　1.文字編碼

　　2.語義編碼

　　3.電子編碼

　　4.神經(jīng)編碼

　　5.記憶編碼

　　6.加密

　　7.譯碼

　　小編推薦：HS編碼

　　HS采用六位數(shù)編碼，把全部國際貿(mào)易商品分為22類，98章。章以下再分為目和子目。商品編碼第一、二位數(shù)碼代表"章"，第三、四位數(shù)碼代表"目"(Heading)，第五、六位數(shù)碼代表"子目"(Subheading)。前6位數(shù)是HS國際標準編碼，HS有1241個四位數(shù)的稅目，5113個六位數(shù)子目。有的國家根據(jù)本國的實際，已分出第七、八、九位數(shù)碼。

　　在HS中，"類"基本上是按經(jīng)濟部門劃分的，如食品、飲料和煙酒在第四類，化學工業(yè)及其相關工業(yè)產(chǎn)品在第六，紡織原料及制品在第十一類，機電設備在第十六類。運輸設備在第十七類，武器、彈藥在第十九類等。HS"章"分類基本采取兩種辦法:一是按商品原材料的屬性分類，相同原料的產(chǎn)品一般歸入同一章。章內(nèi)按產(chǎn)品的加工程度從原料到成品順序排列。如52章棉花，按原棉--已梳棉--棉紗--棉布順序排列。二是按商品的用途或性能分類。制造業(yè)的許多產(chǎn)品很難按其原料分類，尤其是可用多種材料制作的產(chǎn)品或由混合材料制成的產(chǎn)品(如第64章鞋、第65章帽、第95章玩具等)及機電儀產(chǎn)品等，HS按其功能或用途分為不同的章，而不考慮其使用何種原料，章內(nèi)再按原料或加工程序排列出目或子目。HS的各章均列有一個起"兜底"作用，名為"其他"的子目，使任何進出口商品都能在這個分類體系中找到自己適當?shù)奈恢谩?/p>

　　我國目前使用的HS編碼，一共10位，其中前面8位稱為主碼，后兩位稱為附加碼。

編碼與編號有區(qū)別嗎

相關文章

熱門文章