JIS X 0201とUnicode間の類似点
JIS X 0201とUnicodeは(ユニオンペディアに)共通で10ものを持っています: $、ASCII、バックスラッシュ、円記号、EUC-JP、ISO/IEC 646、JIS X 0208、Shift JIS、文字コード、文字集合。
$
(ドル、ダラー、ペソ)は、通貨記号の1つ。ドル記号 (dollar sign)、ペソ記号 (signo de pesos)。 ドル、ペソのほか、主にスペイン語・ポルトガル語圏のさまざまな通貨で使われる。.
ASCII
ASCII(アスキー、American Standard Code for Information Interchange)は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.
ASCIIとJIS X 0201 · ASCIIとUnicode ·
バックスラッシュ
バックスラッシュ(backslash)、逆斜線(ぎゃくしゃせん)、あるいはリバースソリダス (reverse solidus) は約物の一つで、「 」と書き表される。バックスラッシュとはスラッシュ (/) の逆という意味である。「 / 」に比べれば、自然言語ではあまり使われることのない記号である。 バックスラッシュと円記号 (¥) の問題については、円記号も参照のこと。.
JIS X 0201とバックスラッシュ · Unicodeとバックスラッシュ ·
円記号
¥ は、日本の通貨単位の円や中華人民共和国の人民元などを表す通貨記号である。Unicode文字名称は「」、JIS文字名称は円記号(えんきごう)。金額を表す数字に前置する。 この円記号は、コンピュータでの文字コード変換マッピングに厄介な問題を抱えた記号の1つ(類似の問題を抱える記号には「₩」がある)として知られ、円記号のその問題は「円記号問題」と呼ばれる。.
JIS X 0201と円記号 · Unicodeと円記号 ·
EUC-JP
EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつである。UNIX以外のOS上で使われることもある。 1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。 EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。 日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPやShift_JISと異なり制御文字SS2(シングルシフトツー、0x8E)に続けて現れるので都合2バイト、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので都合3バイトを要する。 JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。 UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年ではUTF-8を使用したシステムも普及している。.
EUC-JPとJIS X 0201 · EUC-JPとUnicode ·
ISO/IEC 646
ISO/IEC 646は7ビットの文字コードを規定する国際標準化機構 (ISO) 標準であり、これを元に各国語版の文字コードが規定される。 アメリカの規格であるASCIIを国際化した体裁となっている。ラテンアルファベット(ISO基本ラテンアルファベット)と数字を中心とした共通部分と、ASCIIでは記号となっている各国規格で自由に割り当てられる部分に分かれており、ヨーロッパ各国ではこの部分にダイアクリティカルマークつき文字を割り当てることにより自国語の文章を符号化できるようになっている。 現在ではヨーロッパでは8ビットコードであるISO/IEC 8859が主流となっており、この規格はあまり使われていない。なお、UnicodeのISO規格であるISO/IEC 10646の規格番号は、この規格の番号にちょうど10000を加えた値となっている。.
ISO/IEC 646とJIS X 0201 · ISO/IEC 646とUnicode ·
JIS X 0208
JIS X 0208(ジス X 0208)は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.
JIS X 0201とJIS X 0208 · JIS X 0208とUnicode ·
Shift JIS
Shift_JIS(シフトジス)は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、現在は標準化文書JIS X 0213の附属書1で規定されている(Shift JIS-2004)。「Shift_JIS」はIANAにおける登録名である 。 マイクロソフトなどの各ベンダーが実装するShift_JISの亜種については「Microsoftコードページ932」を参照。Mac OSが実装する亜種については「MacJapanese」を参照。.
JIS X 0201とShift JIS · Shift JISとUnicode ·
文字コード
文字コード(もじコード)とはコンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.
JIS X 0201と文字コード · Unicodeと文字コード ·
文字集合
文字集合(もじしゅうごう、character set)は、文字(キャラクタ (コンピュータ))をその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.
上記のリストは以下の質問に答えます
- 何JIS X 0201とUnicodeことは共通しています
- 何がJIS X 0201とUnicode間の類似点があります
JIS X 0201とUnicodeの間の比較
Unicodeが162を有しているJIS X 0201は、145の関係を有しています。 彼らは一般的な10で持っているように、ジャカード指数は3.26%です = 10 / (145 + 162)。
参考文献
この記事では、JIS X 0201とUnicodeとの関係を示しています。情報が抽出された各記事にアクセスするには、次のURLをご覧ください: