ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
無料
ブラウザよりも高速アクセス!
 

Unicodeと追加面

ショートカット: 違い類似点ジャカード類似性係数参考文献

Unicodeと追加面の違い

Unicode vs. 追加面

200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。. 追加面(ついかめん)、補足面(ほそくめん)、補助面(ほじょめん)は、ISO/IEC 10646およびUnicodeにおける最初の面である基本多言語面以外の面のことを言う。.

Unicodeと追加面間の類似点

Unicodeと追加面は(ユニオンペディアに)共通で10ものを持っています: 基本多言語面第三漢字面面 (文字コード)追加多言語面追加特殊用途面追加漢字面ISO/IEC 10646UTF-16UTF-32UTF-8

基本多言語面

基本多言語面(きほんたげんごめん、Basic Multilingual Plane, BMP)は、ISO/IEC 10646の第0群第0面およびUnicodeの第0面。最初の65536の符号位置である000016~FFFF16からなる。 最もよく使う、基本的な文字・記号のほとんどが含まれる。 UCS-2は、BMPのみからなる。また、Unicode 3.0までのUnicodeは、BMPのみからなっていた。.

Unicodeと基本多言語面 · 基本多言語面と追加面 · 続きを見る »

第三漢字面

三漢字面(だいさんかんじめん、Tertiary Ideographic Plane, TIP)は、ISO/IEC 10646の第0群第3面およびUnicodeの第3面。ロードマップにおいては甲骨文字・金文・小篆といった現在一般的には使用されない古代の漢字を将来的に収録する予定の追加面の一つであったが、後述の通り、追加漢字面に入りきらなかった(現代の書体に基づく)漢字が最初に収録される見込みとなった。.

Unicodeと第三漢字面 · 第三漢字面と追加面 · 続きを見る »

面 (文字コード)

面(めん)、字面(じめん)、プレーン(plane)とは、マルチバイト文字符号化方式において、下位から第3バイト(およびそれより上位バイト)で特定される、符号空間の一部分である。.

Unicodeと面 (文字コード) · 追加面と面 (文字コード) · 続きを見る »

追加多言語面

追加多言語面(ついかたげんごめん)もしくは補助多言語面(ほじょたげんごめん、Supplementary Multilingual Plane, SMP)は、追加面の一つでISO/IEC 10646の第0群第1面およびUnicodeの第1面。正式名称は「用字及び記号のための追加多言語面」(ようじおよびきごうのためのついかたげんごめん、Supplementary Multilingual Plane for scripts and symbols)。現在使うもののいない古代の用字系や人工文字など、基本多言語面に入りきらなかった文字のうち漢字以外を収録する。.

Unicodeと追加多言語面 · 追加多言語面と追加面 · 続きを見る »

追加特殊用途面

追加特殊用途面(ついかとくしゅようとめん、Supplementary Special-purpose Plane, SSP)は、追加面の一つでISO/IEC 10646の第0群第14面およびUnicodeの第14面。.

Unicodeと追加特殊用途面 · 追加特殊用途面と追加面 · 続きを見る »

追加漢字面

追加漢字面(ついかかんじめん、Supplementary Ideographic Plane, SIP)は、追加面の一つでISO/IEC 10646の第0群第2面およびUnicodeの第2面。基本多言語面に入りきらなかった漢字を収録する補足面の一つ。補助漢字面(ほじょかんじめん)とも呼ばれる。.

Unicodeと追加漢字面 · 追加漢字面と追加面 · 続きを見る »

ISO/IEC 10646

ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 UCSの文字空間は0 - 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 - 10FFFFと定義された。 符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。 面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。.

ISO/IEC 10646とUnicode · ISO/IEC 10646と追加面 · 続きを見る »

UTF-16

UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。.

UTF-16とUnicode · UTF-16と追加面 · 続きを見る »

UTF-32

UTF-32(およびUCS-4、#歴史を参照)は、Unicodeの各符号位置に32ビット符号単位一つだけを使う、固定長のUnicodeの符号化形式及び符号化スキーム(文字符号化方式#文字符号化形式と文字符号化スキーム)である。他のUTF(Unicode transformation format)はすべて符号位置によって符号単位列の長さが変化する可変長であるため、UTF-32はもっとも単純なUTFであるとみなせる。 UTF-32は、テキストファイルで使用されることは少なく、主にシステムのメモリ上での管理や、符号位置の数で管理するデータベースなどで使用される。.

UTF-32とUnicode · UTF-32と追加面 · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

UTF-8とUnicode · UTF-8と追加面 · 続きを見る »

上記のリストは以下の質問に答えます

Unicodeと追加面の間の比較

追加面が17を有しているUnicodeは、162の関係を有しています。 彼らは一般的な10で持っているように、ジャカード指数は5.59%です = 10 / (162 + 17)。

参考文献

この記事では、Unicodeと追加面との関係を示しています。情報が抽出された各記事にアクセスするには、次のURLをご覧ください:

ヘイ!私たちは今、Facebook上です! »