ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
インストール
ブラウザよりも高速アクセス!
 

ISO/IEC 8859とUnicode

ショートカット: 違い類似点ジャカード類似性係数参考文献

ISO/IEC 8859とUnicodeの違い

ISO/IEC 8859 vs. Unicode

ISO 8859(より正式にはISO/IEC 8859)はコンピュータでの利用を目的とした8ビット文字コードの標準である。ISOとIECが合同で定めた。この標準は複数の部(英: part)に分かれており、それぞれがISO/IEC 8859-1、ISO/IEC 8859-2などのように番号付きで出版されている。それぞれの部自体を、非公式に標準として参照することがある。2009年現在、15の部(破棄されたISO/IEC 8859-12標準を除く)が存在する。. 200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

ISO/IEC 8859とUnicode間の類似点

ISO/IEC 8859とUnicodeは(ユニオンペディアに)共通で14ものを持っています: ASCII十六進法バイト (情報)ユーロ記号ユニコードコンソーシアムエンディアン円記号ISO/IEC 10646ISO/IEC 646Microsoft Windows NTUTF-16UTF-32UTF-8文字コード

ASCII

ASCII(アスキー、American Standard Code for Information Interchange)は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.

ASCIIとISO/IEC 8859 · ASCIIとUnicode · 続きを見る »

十六進法

十六進法(じゅうろくしんほう、 hexadecimal)とは、16を底(てい)とし、底およびその冪を基準にして数を表す方法である。.

ISO/IEC 8859と十六進法 · Unicodeと十六進法 · 続きを見る »

バイト (情報)

バイト (byte) は、「複数ビット」を意味する、データ量あるいは情報量の単位である。 1980年頃から1バイトは8ビット (bit) であることが一般的であったが、 正式に定義されたのは2008年発行のIEC_80000-13である。 8ビットは、256個の異なる値(たとえば整数であれば、符号無しで0から255、符号付きで−128から+127、など)を表すことができる。.

ISO/IEC 8859とバイト (情報) · Unicodeとバイト (情報) · 続きを見る »

ユーロ記号

ユーロ記号 はユーロ通貨のために使われる通貨記号である。この通貨記号は1996年12月12日、欧州委員会により公開された。.

ISO/IEC 8859とユーロ記号 · Unicodeとユーロ記号 · 続きを見る »

ユニコードコンソーシアム

180px ユニコードコンソーシアム(The Unicode Consortium)は、Unicodeの開発を調整する非営利団体である。1990年12月に設立が発表され、1991年に「Unicode Inc.」としてアメリカ合衆国カリフォルニア州の非営利法人となっている。.

ISO/IEC 8859とユニコードコンソーシアム · Unicodeとユニコードコンソーシアム · 続きを見る »

エンディアン

ンディアン(endianness)は、複数のバイトなどを並べる順序の種類である。一般的な用語による表現ではバイトオーダ(byte order)、ないしそれを一部訳して日本語ではバイト順とも言う。 英語の「endian」という単語自体には元々は「配置方式」「並び順」といった意味はなかった(#語源を参照)。日本では総称として「エンディアン」と呼ぶことが多いが、英語でそれに相当する語はendianness(エンディアンネス)である。.

ISO/IEC 8859とエンディアン · Unicodeとエンディアン · 続きを見る »

円記号

¥ は、日本の通貨単位の円や中華人民共和国の人民元などを表す通貨記号である。Unicode文字名称は「」、JIS文字名称は円記号(えんきごう)。金額を表す数字に前置する。 この円記号は、コンピュータでの文字コード変換マッピングに厄介な問題を抱えた記号の1つ(類似の問題を抱える記号には「₩」がある)として知られ、円記号のその問題は「円記号問題」と呼ばれる。.

ISO/IEC 8859と円記号 · Unicodeと円記号 · 続きを見る »

ISO/IEC 10646

ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 UCSの文字空間は0 - 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 - 10FFFFと定義された。 符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。 面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。.

ISO/IEC 10646とISO/IEC 8859 · ISO/IEC 10646とUnicode · 続きを見る »

ISO/IEC 646

ISO/IEC 646は7ビットの文字コードを規定する国際標準化機構 (ISO) 標準であり、これを元に各国語版の文字コードが規定される。 アメリカの規格であるASCIIを国際化した体裁となっている。ラテンアルファベット(ISO基本ラテンアルファベット)と数字を中心とした共通部分と、ASCIIでは記号となっている各国規格で自由に割り当てられる部分に分かれており、ヨーロッパ各国ではこの部分にダイアクリティカルマークつき文字を割り当てることにより自国語の文章を符号化できるようになっている。 現在ではヨーロッパでは8ビットコードであるISO/IEC 8859が主流となっており、この規格はあまり使われていない。なお、UnicodeのISO規格であるISO/IEC 10646の規格番号は、この規格の番号にちょうど10000を加えた値となっている。.

ISO/IEC 646とISO/IEC 8859 · ISO/IEC 646とUnicode · 続きを見る »

Microsoft Windows NT

Microsoft Windows NT(マイクロソフト ウィンドウズ エヌティー)は、マイクロソフトが開発したオペレーティングシステム (OS) である。DECが手がけたVMSのアーキテクチャを基礎としており、開発もDECの元社員が全面的に行い、リリースに至っている。 Windows 9x系といったWindowsファミリーのオペレーティングシステムより安定性に優れている。Windows 2000 以降はOSの名称からNTは外されたものの、OSとしてはWindows NTのバージョン5以降であり、現在のWindows 10(Windows NT ver10.0)に至るまでWindowsNTは継続した製品シリーズである。.

ISO/IEC 8859とMicrosoft Windows NT · Microsoft Windows NTとUnicode · 続きを見る »

UTF-16

UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。.

ISO/IEC 8859とUTF-16 · UTF-16とUnicode · 続きを見る »

UTF-32

UTF-32(およびUCS-4、#歴史を参照)は、Unicodeの各符号位置に32ビット符号単位一つだけを使う、固定長のUnicodeの符号化形式及び符号化スキーム(文字符号化方式#文字符号化形式と文字符号化スキーム)である。他のUTF(Unicode transformation format)はすべて符号位置によって符号単位列の長さが変化する可変長であるため、UTF-32はもっとも単純なUTFであるとみなせる。 UTF-32は、テキストファイルで使用されることは少なく、主にシステムのメモリ上での管理や、符号位置の数で管理するデータベースなどで使用される。.

ISO/IEC 8859とUTF-32 · UTF-32とUnicode · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

ISO/IEC 8859とUTF-8 · UTF-8とUnicode · 続きを見る »

文字コード

文字コード(もじコード)とはコンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.

ISO/IEC 8859と文字コード · Unicodeと文字コード · 続きを見る »

上記のリストは以下の質問に答えます

ISO/IEC 8859とUnicodeの間の比較

Unicodeが162を有しているISO/IEC 8859は、341の関係を有しています。 彼らは一般的な14で持っているように、ジャカード指数は2.78%です = 14 / (341 + 162)。

参考文献

この記事では、ISO/IEC 8859とUnicodeとの関係を示しています。情報が抽出された各記事にアクセスするには、次のURLをご覧ください:

ヘイ!私たちは今、Facebook上です! »