数字の表現は、「データサイズについて」(→ 参照)にて解説しましたが、「文字はどのようにして表現(認識)しているの?」 と疑問を持たれる方も多いと思います。 コンピュータ上では、文字も2進数を基本として表現しています。 文字は 1Byte (1バイト) = 8Bit で表現します。ただし、かなや漢字においては 2Byte で表現しています。 1B (8Bit) は 8桁の2進数なのですが、8桁のままでは認識しづらいので、上位4桁と下位4桁に分割します。つまり、4桁ずつの2進数とします。 4桁ですので 24 = 16 とおりの表現が出来ます。これを1桁の数字で表すのですが、数字は 0〜9 の 10文字なので、不足分はアルファベットを利用しています。 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, F 以上の16文字で表現。これを16進数と言います。 8Bit (1Byte) では、このような表記になります。(小さい順) この2桁の16進数ので、文字を認識しているのです。1Byte では 256 種類の文字を表現することが可能です。 2桁の16進数と文字の割り当ては、文字コードによって違いがあります。 日本において一般的な [ JIS X 0201 コード ] を例に見てみましょう。 → 文字のデジタル化の例 かな・漢字は 2Byte = 16Bit で表現しているので、「2バイト文字」ともいうこともあります。 4桁の16進数に文字(かな・漢字)を割り当てています。日本では JIS規格(JIS X 0208)にて割り当てが定められています。 ちなみに、16進数での表記はこうなります。(小さい順) |
また、色の表現なども16進数で表現することもあります。 例えば、白色の場合、Red(赤)= FF, Green(緑)=FF, Blue(青)=FF, で "#FFFFFF" というように。 コンピュータは 16Bit、または 32Bit の単位で動いていますので、一度の処理で 16Bit の場合、216 = 65536 とおりの表現が可能。 32Bit の場合、232 = 131072 とおりの表現が可能。 ということになります。 説明が下手なのでわかりづらいかもしれませんね。お許しください。 |