ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
インストール
ブラウザよりも高速アクセス!
 

JIS X 0221とUnicode

ショートカット: 違い類似点ジャカード類似性係数参考文献

JIS X 0221とUnicodeの違い

JIS X 0221 vs. Unicode

JIS X 0221は、日本工業規格(JIS)の制定している文字コード規格の一つで規格の名称は「国際符号化文字集合(UCS)」、ISO/IEC 10646の国際一致規格である。. 200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

JIS X 0221とUnicode間の類似点

JIS X 0221とUnicodeは(ユニオンペディアに)共通で9ものを持っています: CJK統合漢字ISO/IEC 10646ISO/IEC 646JIS X 0201JIS X 0208JIS X 0212JIS X 0213文字コード2008年

CJK統合漢字

CJK統合漢字(シージェーケーとうごうかんじ、)は、ISO/IEC 10646(略称:UCS)およびにて採用されている符号化用漢字集合およびその符号表である。CJK統合漢字の名称は、中国語、日本語、朝鮮語で使われている漢字をひとまとめにしたことからきている。CJK統合漢字の初版であるUnified Repertoire and Ordering第二版は1992年に制定されたが、1994年にベトナムで使われていた漢字も含めることにしたため、CJKVと呼ばれる事もある。CJKVは、中国語・日本語・朝鮮語・ベトナム語を表す英語の頭文字である。特に、その4つの言語で共通して使われる、または使われていた文字体系である漢字(チュノムを含む)のこと。ソフトウェアの国際化、中でも文字コードに関する分野で用いられる。 CJK統合漢字は、日本・中国・台湾・北朝鮮・韓国・ベトナムの各漢字コードとの対応表も定めているが、事情によりCJK統合漢字との対応を持たない各国・各地域の漢字コードをUCSに適切に変換できるよう、互換用の領域が別途定められている。この領域の漢字はCJK互換漢字と呼ばれる。.

CJK統合漢字とJIS X 0221 · CJK統合漢字とUnicode · 続きを見る »

ISO/IEC 10646

ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 UCSの文字空間は0 - 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 - 10FFFFと定義された。 符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。 面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。.

ISO/IEC 10646とJIS X 0221 · ISO/IEC 10646とUnicode · 続きを見る »

ISO/IEC 646

ISO/IEC 646は7ビットの文字コードを規定する国際標準化機構 (ISO) 標準であり、これを元に各国語版の文字コードが規定される。 アメリカの規格であるASCIIを国際化した体裁となっている。ラテンアルファベット(ISO基本ラテンアルファベット)と数字を中心とした共通部分と、ASCIIでは記号となっている各国規格で自由に割り当てられる部分に分かれており、ヨーロッパ各国ではこの部分にダイアクリティカルマークつき文字を割り当てることにより自国語の文章を符号化できるようになっている。 現在ではヨーロッパでは8ビットコードであるISO/IEC 8859が主流となっており、この規格はあまり使われていない。なお、UnicodeのISO規格であるISO/IEC 10646の規格番号は、この規格の番号にちょうど10000を加えた値となっている。.

ISO/IEC 646とJIS X 0221 · ISO/IEC 646とUnicode · 続きを見る »

JIS X 0201

JIS X 0201は、日本工業規格 (JIS) の制定している文字コード規格で、初版は1969年6月1日の制定であり、現存のJISにおける最も古い文字コードである。規格名称は7ビット及び8ビットの情報交換用符号化文字集合。名称が示す通り、7ビット符号と8ビット符号での運用が予定されている。図形文字の集合を規定するための規格であり、JIS X 0211 (ISO/IEC 6429) で規定される制御文字集合と組み合わせて使用する。現在の規格番号は日本工業規格の部門X(情報処理)の新設に伴って1987年3月1日に変更されたもので、旧規格番号はJIS C 6220。俗称はANKコードで、'ANK'はこのコードの主要構成文字であるアルファベット (Alphabet)、数字 (Numerical digit)、片仮名 (Katakana) の頭文字より来ている。 JIS X 0201はラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合よりなっている。このうちラテン文字用図形文字集合はAmerican Standard Code for Information Interchange (ASCII) と同様ISO/IEC 646の版の1つとなっている。ASCIIと比較すると2文字が異なっており、92番の文字にバックスラッシュ ('') の替わりに円記号 ('¥') が、126番にチルダ ('~') の替わりにオーバーライン ('‾') が割り当てられている。片仮名用図形文字集合は片仮名と日本語用の約物よりなっており、最後の31文字分は未定義となっている。また、単独の濁点と半濁点のみ収録されており濁点付き片仮名と半濁点付き片仮名は収録されていない。 全体的な構造はJIS X 0202 (ISO/IEC 2022) に従った構造となっており、8ビット符号では16進で21から7Eにラテン文字を、A1からFEに片仮名を割り当てる。7ビット符号では21から7Eの領域を、SHIFT-INとSHIFT-OUTでラテン文字と片仮名を切り替えながら使用する。このとき、SO(0E)以降は片仮名、SI(0F)以降はラテン文字となる。 現在では主にShift_JISおよびEUC-JPの一部として用いられており、単独で用いられることはほとんどない。これらの文字コードは JIS X 0208の文字も含んでおり、JIS X 0208にはJIS X 0201にあるほぼすべての文字があるため文字が重複することとなる。この区別のため、JIS X 0201の文字をJIS X 0208の文字の半分の幅で表示することが多い。このため、これらの文字を俗に半角文字、特に片仮名を半角カナとよぶ事が多い。また、Shift_JISのアルファベット部分はASCIIとJIS X 0201との区別が曖昧なまま使われることが多いため、円記号とバックスラッシュの区別においてしばしば混乱が起きる。.

JIS X 0201とJIS X 0221 · JIS X 0201とUnicode · 続きを見る »

JIS X 0208

JIS X 0208(ジス X 0208)は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.

JIS X 0208とJIS X 0221 · JIS X 0208とUnicode · 続きを見る »

JIS X 0212

JIS X 0212(ジス X 0212)は、JIS X 0208:1983に含まれない文字を集めた、6067字の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「情報交換用漢字符号-補助漢字」である。1990年10月1日に制定され、JIS X 0208と組み合わせて利用される。JIS補助漢字の通称がある。.

JIS X 0212とJIS X 0221 · JIS X 0212とUnicode · 続きを見る »

JIS X 0213

JIS X 0213(ジス X 0213)はJIS X 0208:1997を拡張した、日本語用の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である。 2000年に制定、2004年、2012年に改正された。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。 JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。.

JIS X 0213とJIS X 0221 · JIS X 0213とUnicode · 続きを見る »

文字コード

文字コード(もじコード)とはコンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.

JIS X 0221と文字コード · Unicodeと文字コード · 続きを見る »

2008年

この項目では、国際的な視点に基づいた2008年について記載する。.

2008年とJIS X 0221 · 2008年とUnicode · 続きを見る »

上記のリストは以下の質問に答えます

JIS X 0221とUnicodeの間の比較

Unicodeが162を有しているJIS X 0221は、38の関係を有しています。 彼らは一般的な9で持っているように、ジャカード指数は4.50%です = 9 / (38 + 162)。

参考文献

この記事では、JIS X 0221とUnicodeとの関係を示しています。情報が抽出された各記事にアクセスするには、次のURLをご覧ください:

ヘイ!私たちは今、Facebook上です! »