→ろゆっく コンピュータ資料室←

文字などの表現(認識)について




 数字の表現は、「データサイズについて」(→ 参照)にて解説しましたが、「文字はどのようにして表現(認識)しているの?」 と疑問を持たれる方も多いと思います。


 コンピュータ上では、文字も2進数を基本として表現しています。

 文字は 1Byte (1バイト) = 8Bit で表現します。ただし、かなや漢字においては 2Byte で表現しています。

1B (8Bit) は 8桁の2進数なのですが、8桁のままでは認識しづらいので、上位4桁と下位4桁に分割します。つまり、4桁ずつの2進数とします。

 4桁ですので 24 = 16 とおりの表現が出来ます。これを1桁の数字で表すのですが、数字は 0〜9 の 10文字なので、不足分はアルファベットを利用しています。

0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F

以上の16文字で表現。これを16進数と言います。

 8Bit (1Byte) では、このような表記になります。(小さい順)
01, 02, 03, 04, 05, 06, 07, 08, 09, 0A, 0B, 0C, 0D, 0E, 0F, 10, 11, ・・・・

・・・19, 1A, 1B, 1C, 1D, 1E, 1F, 20, 21, 22 ・・・・ FD, FE, FF


 この2桁の16進数ので、文字を認識しているのです。1Byte では 256 種類の文字を表現することが可能です。

2桁の16進数と文字の割り当ては、文字コードによって違いがあります。
日本において一般的な [ JIS X 0201 コード ] を例に見てみましょう。

JIS X 0201 コードの例

文字のデジタル化の例

 かな・漢字は 2Byte = 16Bit で表現しているので、「2バイト文字」ともいうこともあります。
4桁の16進数に文字(かな・漢字)を割り当てています。日本では JIS規格(JIS X 0208)にて割り当てが定められています。
ちなみに、16進数での表記はこうなります。(小さい順)
0000, 0001, 0002, 0003, ・・・・・ FFFD, FFFE, FFFF


 また、色の表現なども16進数で表現することもあります。
 例えば、白色の場合、Red(赤)= FF, Green(緑)=FF, Blue(青)=FF, で "#FFFFFF" というように。

 コンピュータは 16Bit、または 32Bit の単位で動いていますので、一度の処理で
   16Bit の場合、216 = 65536 とおりの表現が可能。
   32Bit の場合、232 = 131072 とおりの表現が可能。
ということになります。

 説明が下手なのでわかりづらいかもしれませんね。お許しください。
→ろゆっく コンピュータ資料室←

(C) Copyright ROYUCK Allrights Reserved