TOP Japanese Conversion Unicode

Byte Order Mark

BOMDesc
ef bb bfUTF-8U+FEFFのUTF-8での表現
ff feUTF-16LEUTF-16LEとUTF-32LEは最初の2バイトが等しいため、4バイトまで読んで判断
fe ffUTF-16BE
ff fe 00 00UTF-32LEUTF-16LEとUTF-32LEは最初の2バイトが等しいため、4バイトまで読んで判断
00 00 fe ffUTF-32BE

BOMなし

  • RFC 2781 ではBOMが付いていないUTF-16文書はビッグエンディアンとして解釈
  • TCP/IPネットワークではプロトコルヘッダやMIME等の手段で符号化スキームが指定されずBOMも付与されない場合、ビッグエンディアン
  • Windows上の文書における「Unicodeテキスト」はUTF16-LE

管理人/副管理人のみ編集できます