当Wikiでは、分かりづらいIT・パソコン用語の解説や、PC・周辺機器の機能・性能等の情報をまとめています。

UCS-2やUCS-4(Unicode)で定義される文字集合を用いて記述された文字列に、UCS-4の一部の文字を埋め込むためのエンコード方式。UTF-8など他のUTFと併用することができる
。UTF-16ではUCS-2の範囲は基本的にはそのまま表現し、UCS-4の部分は独自のエンコード方式を使用して4バイトで表現する。UTF-16では2バイト文字の1バイト目を先に書く方法(ビッグエンディアン)と1バイト目を後に書く方法(リトルエンディアン)が用意されている。
しかし、この2つの方法はそのままでは見分けがつかないため、文書の先頭にバイトオーダーマークという記号を挿入させることで見分けがつくようにしている。



文字コード用語へ戻る

メンバーのみ編集できます