|
読み方 : ベース・ロク・ジュウ・ヨン
インターネットメールでバイナリーデータを送る場合に使用されるデータエンコード方式の 1 つ。 インターネットメールは、基本的に 7 bit のキャラクターコードからなる文字列を送受信するためのシステムとして設計されているため、バイナリーコード (や Shift JIS や EUC などの漢字コード) をそのまま直接送信することはできません。バイナリーコード中には、メール本文のメッセージ行を区切るための特殊文字が含まれていたり、キャラクターとして利用できない多くのデータが含まれている可能性があり、そのまま送信しようとすると、途中でデータが化けたり、場合によっては、メールシステムに障害を発生させることがあります。このためアプリケーションの文書ファイルデータや、GIF や JPEG などのグラフィックスデータ、音声データなどはそのままではインターネットメールのデータとして送信できません。また、ワープロソフトの出力するテキストファイルのように、1 段落が 1 つの文であるような長い行の文を送ろうとすると、メールシステムの制限により、途中で不要な改行などが行われてしまうことがあります。 この問題を回避するには、送り手側でこうしたバイナリーのデータをインターネットメールシステムが問題なく転送できるキャラクターコードのデータにいったん変換し、それを受信側で元のバイナリーデータに戻します。こうしたデータ変換処理がデータのエンコード化であり、Base64 はこのエンコード方式の 1 つです。インターネットメールで使用されるバイナリーデータのエンコード方式としては、ほかにも uuencode や Quoted Printable などがありますが、Base64 は最も広く利用されています。 Base64 では、元のバイナリーデータの 6 bit 分を 0〜63 までの数値とみなし、これらにアルファベットの大文字 (26 文字)、アルファベットの小文字 (26 文字)、数字 (0〜9 までの 10 文字)、記号 (「+」と「/」の 2 文字) の 64 文字に変換する。このデータ変換は、元のデータの 3 byte (24 bit) を 6 bit×4 とみなして、4 文字に変換します。元のデータが 3 の倍数でない場合には、変換結果が 4 の倍数になるように、「=」を 1 つないし 2 つ追加します。 このエンコード方式では、元の 3 byte が常に 4 byte に変換されるので、元のデータよりもサイズが 33 %程度増えることになります (たとえすべてテキスト文字の場合でも、必ず 3 byte が 4 byte に変換される) 。メールシステムによっては、一度に転送できるメールサイズに制限がある場合があるので、大きなファイルを送る場合は、あらかじめ圧縮しておくか (Base64 や uuencode、Quoted Printable などエンコードには、圧縮機能は含まれていない)、複数のメールに分割して送り、受信側で復元する必要があります。
|
|
|
|
| |
| 索引 |
記号・数字,
A,
B,
C,
D,
E,
F,
G,
H,
I,
J,
K,
L,
M,
N,
O,
P,
Q,
R,
S,
T,
U,
V,
W,
X,
Y,
Z
|
| |
|