ISO/IEC 10646とUnicode間の類似点
ISO/IEC 10646とUnicodeは(ユニオンペディアに)共通で15ものを持っています: 基本多言語面、互換性、DIS 10646、面 (文字コード)、追加面、ISO/IEC 8859、JIS X 0208、JIS X 0221、UTF-16、UTF-32、UTF-8、文字コード、文字符号化方式、文字集合、8ビット。
基本多言語面
基本多言語面(きほんたげんごめん、Basic Multilingual Plane, BMP)は、ISO/IEC 10646の第0群第0面およびUnicodeの第0面。最初の65536の符号位置である000016~FFFF16からなる。 最もよく使う、基本的な文字・記号のほとんどが含まれる。 UCS-2は、BMPのみからなる。また、Unicode 3.0までのUnicodeは、BMPのみからなっていた。.
ISO/IEC 10646と基本多言語面 · Unicodeと基本多言語面 ·
互換性
互換性(ごかんせい、)とは、ある部品やコンポーネント(構成要素)などを置き換えても同様に動作させることができる性質のこと。 特に工業製品では、互換性を確保することで新たなシステムを用意する必要がなくなり、設計や部品の再利用性が高まることでコストカットを見込めることや、過去の製品からの買い替えなどを進めることができたりする。ただし、古い基準に縛られてしまうために技術革新の妨げとなるという側面もある。互換性を確保するために余計なコストがかかる場合は軽視されることがあるほか、メーカー間の互換性はベンダーロックインを狙うため、あえて削ぐものもある。.
ISO/IEC 10646と互換性 · Unicodeと互換性 ·
DIS 10646
DIS 10646とは、ISO/IEC 10646の原案である。.
DIS 10646とISO/IEC 10646 · DIS 10646とUnicode ·
面 (文字コード)
面(めん)、字面(じめん)、プレーン(plane)とは、マルチバイト文字符号化方式において、下位から第3バイト(およびそれより上位バイト)で特定される、符号空間の一部分である。.
ISO/IEC 10646と面 (文字コード) · Unicodeと面 (文字コード) ·
追加面
追加面(ついかめん)、補足面(ほそくめん)、補助面(ほじょめん)は、ISO/IEC 10646およびUnicodeにおける最初の面である基本多言語面以外の面のことを言う。.
ISO/IEC 10646と追加面 · Unicodeと追加面 ·
ISO/IEC 8859
ISO 8859(より正式にはISO/IEC 8859)はコンピュータでの利用を目的とした8ビット文字コードの標準である。ISOとIECが合同で定めた。この標準は複数の部(英: part)に分かれており、それぞれがISO/IEC 8859-1、ISO/IEC 8859-2などのように番号付きで出版されている。それぞれの部自体を、非公式に標準として参照することがある。2009年現在、15の部(破棄されたISO/IEC 8859-12標準を除く)が存在する。.
ISO/IEC 10646とISO/IEC 8859 · ISO/IEC 8859とUnicode ·
JIS X 0208
JIS X 0208(ジス X 0208)は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.
ISO/IEC 10646とJIS X 0208 · JIS X 0208とUnicode ·
JIS X 0221
JIS X 0221は、日本工業規格(JIS)の制定している文字コード規格の一つで規格の名称は「国際符号化文字集合(UCS)」、ISO/IEC 10646の国際一致規格である。.
ISO/IEC 10646とJIS X 0221 · JIS X 0221とUnicode ·
UTF-16
UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。.
ISO/IEC 10646とUTF-16 · UTF-16とUnicode ·
UTF-32
UTF-32(およびUCS-4、#歴史を参照)は、Unicodeの各符号位置に32ビット符号単位一つだけを使う、固定長のUnicodeの符号化形式及び符号化スキーム(文字符号化方式#文字符号化形式と文字符号化スキーム)である。他のUTF(Unicode transformation format)はすべて符号位置によって符号単位列の長さが変化する可変長であるため、UTF-32はもっとも単純なUTFであるとみなせる。 UTF-32は、テキストファイルで使用されることは少なく、主にシステムのメモリ上での管理や、符号位置の数で管理するデータベースなどで使用される。.
ISO/IEC 10646とUTF-32 · UTF-32とUnicode ·
UTF-8
UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.
ISO/IEC 10646とUTF-8 · UTF-8とUnicode ·
文字コード
文字コード(もじコード)とはコンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.
ISO/IEC 10646と文字コード · Unicodeと文字コード ·
文字符号化方式
文字符号化方式(もじふごうかほうしき、character encoding scheme、CES)とは、符号化文字集合で文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換する符号化方式。 文字符号化体系、文字符号化スキーム (character coding scheme) とも言う。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 (encoding scheme) などとも言う。 この用語はUnicodeやIETFの標準などで用いているが、ISO/IECやJISの標準では用いず「符号化文字集合の構造」あるいは「'''文字符号の構造及び拡張法'''」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。.
ISO/IEC 10646と文字符号化方式 · Unicodeと文字符号化方式 ·
文字集合
文字集合(もじしゅうごう、character set)は、文字(キャラクタ (コンピュータ))をその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.
ISO/IEC 10646と文字集合 · Unicodeと文字集合 ·
8ビット
CPUは一つの命令で操作できるデータによって分類することができる。16ビットプロセッサが一つの命令で16ビットのデータを操作できるのに対して、8ビットプロセッサは一つの命令で8ビットしか操作できない。 8ビットプロセッサの例.
上記のリストは以下の質問に答えます
- 何ISO/IEC 10646とUnicodeことは共通しています
- 何がISO/IEC 10646とUnicode間の類似点があります
ISO/IEC 10646とUnicodeの間の比較
Unicodeが162を有しているISO/IEC 10646は、25の関係を有しています。 彼らは一般的な15で持っているように、ジャカード指数は8.02%です = 15 / (25 + 162)。
参考文献
この記事では、ISO/IEC 10646とUnicodeとの関係を示しています。情報が抽出された各記事にアクセスするには、次のURLをご覧ください: