UTF-16と文字
ショートカット: 違い、類似点、ジャカード類似性係数、参考文献。
UTF-16と文字の違い
UTF-16 vs. 文字
UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。. 文字(もじ)とは、言葉・言語を伝達し記録するために線や点を使って形作られた記号のこと。文字の起源は、多くの場合ものごとを簡略化して描いた絵文字(ピクトグラム)であり、それが転用されたり変形、簡略化されたりして文字となったと見られる。.
UTF-16と文字間の類似点
UTF-16と文字は(ユニオンペディアに)共通で2ものを持っています: Unicode、文字。
200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.
UTF-16とUnicode · Unicodeと文字 · 続きを見る »
文字(もじ)とは、言葉・言語を伝達し記録するために線や点を使って形作られた記号のこと。文字の起源は、多くの場合ものごとを簡略化して描いた絵文字(ピクトグラム)であり、それが転用されたり変形、簡略化されたりして文字となったと見られる。.
UTF-16と文字 · 文字と文字 · 続きを見る »
上記のリストは以下の質問に答えます
- 何UTF-16と文字ことは共通しています
- 何がUTF-16と文字間の類似点があります
UTF-16と文字の間の比較
文字が287を有しているUTF-16は、23の関係を有しています。 彼らは一般的な2で持っているように、ジャカード指数は0.65%です = 2 / (23 + 287)。
参考文献
この記事では、UTF-16と文字との関係を示しています。情報が抽出された各記事にアクセスするには、次のURLをご覧ください: