文字コード (文字の配列順)


・JIS X 0201

下に JIS X 0201 (8ビット版) を示す。表示されていないところは制御文字が割り当てられている。(SP はスペース。) 文字の順序は,「SP ! " # $ % ...」 のように縦方向に見ていく。ASCII との違いで重要なのは,JIS で ¥ が割り当てられている位置に \ が入ることである。

 0  1  2  3  4  5  6  7  8  9  A  B  C  D  E  F 
 0 NULDLESP0@P`p
 1 SOHDC1!1AQaq
 2 STXDC2 "2BRbr
 3 ETXDC3#3CScs
 4 EOTDC4$4DTdt
 5 ENGNAK%5EUeu
 6 ACKSYN&6FVfv
 7 BELETB'7GWgw
 8 BSCAN(8HXhx
 9 HTEM)9IYiy
 A LFSUB*:JZjz
 B VTESC+;K[k{
 C FFFS,<L\l|
 D CRGS-=M]m}
 E SORS.>N^n~
 F SIUS/?O_oDEL
「。」から「゜」までの文字も1バイト文字であるが,ここでは表記に JIS X 0208 のものを用いる。

・ISO 8859-1

西欧の言語の処理には ISO 8859-1 がよく使われる。左半分は ASCII と同一,右半分にアクセント付き文字等が配置されている。文字コード順でソートすると,アクセント付きの文字は全て z の後に来るように並べられてしまうので,「辞書順」で並べたい場合には,ちょっとした処理が必要。(cf. Lesson 8 「サブルーチン」,Lesson 14「locale の利用」)

ISO 8859-1 のコード表
環境によっては表中に ? と表示される箇所があるかもしれないが,これは,? という文字を指すのでなく,使用している環境では表示できない文字であることを表わす。

・JISX 0208

日本語の処理には,JIS (ISO-2022-JP)・Shift JIS・EUC-JP が広く使われているが,どのコードでも,基本的に文字集合および文字の配列順序は同じである。ここではエンコーディングの仕方は問題にしないので,区点表示により順序を示す。こちらの表では,文字の順序は横方向に見ていく。

JIS X 0208 (区点表示) を見る場合はここをクリックすること。ファイルサイズが少し大きいので,表示に時間がかかる。

・Unicode

Unicode における文字の配列順序ついては「Unicode に収められた文字の例」を参照。