文字集合

文字集合（もじしゅうごう、character set）は、文字（キャラクタ (コンピュータ)）をその要素（「元」）とする集合である。文字セットという場合もある。例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.

42 関係: ASCII、平仮名、ビット、フォント、アルファベット、インターネットアーキテクチャ委員会、キャラクタ (コンピュータ)、コンピュータ、コードページ、スカラー、写像、元 (数学)、符号点、EUC-JP、順序集合、部分集合、集合、通信、IBM、Iconv、Internet Assigned Numbers Authority、ISO/IEC 10646、ISO/IEC 2022、ISO/IEC 646、ISO/IEC 8859、JIS X 0201、JIS X 0208、JIS X 0213、JIS X 0221、Macintosh、Microsoft Windows、Multipurpose Internet Mail Extensions、Request for Comments、Shift JIS、Unicode、UNIX、UTF-8、W3C勧告、標準化、文字、文字コード、文字符号化方式。

ASCII

ASCII（アスキー、American Standard Code for Information Interchange）は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.

新しい！!: 文字集合とASCII · 続きを見る »

平仮名

平仮名（ひらがな）とは、日本語の表記に用いられる音節文字のこと。仮名の一種で、借字（万葉仮名）を起源として成立した。借字として使われる漢字を、極度に草体化したものである。.

新しい！!: 文字集合と平仮名 · 続きを見る »

ビット (bit, b) は、ほとんどのデジタルコンピュータが扱うデータの最小単位。英語の binary digit （2進数字）の略であり、2進数の1けたのこと。量子情報科学においては古典ビットと呼ばれる。 1ビットを用いて2通りの状態を表現できる（二元符号）。これらの2状態は一般に"0"、"1"と表記される。情報理論における選択情報およびエントロピーの単位も「ビット」と呼んでいるが、これらの単位は「シャノン」とも呼ばれる（詳細は情報量を参照）。省略記法として、バイトの略記である大文字の B と区別するために、小文字の b と表記する。.

新しい！!: 文字集合とビット · 続きを見る »

フォント

フォント（）は、本来「同じサイズで、書体デザインの同じ活字の一揃い」を指す言葉だが、現在ではコンピュータ画面に表示したり、紙面に印刷（書籍など）したりするために利用できるようにした書体データを意味している。金属活字の時代から書体の世界に関わっている者からは、データとしてのフォントはデジタルフォントとして区別して呼ばれることもある。書体という言葉は、現在ではフォント（の使用ライセンス数）を数える単位としても用いられるが、ここでは分けて考えることとする。（書体参照）.

新しい！!: 文字集合とフォント · 続きを見る »

アルファベット

アルファベット（alphabet）は、ひとつひとつの文字が原則としてひとつの子音または母音という音素をあらわす表音文字の一種であり、また、それを伝統的な配列で並べたものをいう。「アルファベット」という語は、ギリシア文字の最初の2文字 α, β の読み方である「アルファ」（ἄλφα）、「ベータ」（βήτα）に由来する。日常語において「アルファベット」という単語は主にヨーロッパ系の言語の文字一覧を表すが、学術的には後述する定義を満たしさえすればヨーロッパ系の言語でなくともよい。また、文字一覧はどの言語習得においても初期に学ぶことであるから、「学習の初歩」を意味することもある。なお、英語の「alphabet」という単語は日常語においてもヨーロッパ系言語に限らない文字一覧を表す。たとえばハングルはKorean alphabetと呼ばれる。日本においては「アルファベット」の語は、世界でもっとも広く通用している代表的なアルファベットであるラテン文字（ローマ字）の代名詞としても定着しており、一方で（歴史的経緯により）「ローマ字」の語を日本語のラテン文字化に限定する用法も一般的である。形式言語とオートマトンの理論の用語では、その対象とする文字列や文などに現れる要素（終端記号）を「アルファベット」という。これは、一般的な用語のアルファベットとだいたい同様に文字のことを指すこともあるが、文字というよりは語にあたる「トークン」のことである場合もある。詳細は、アルファベット (計算機科学) の記事を参照。.

新しい！!: 文字集合とアルファベット · 続きを見る »

インターネットアーキテクチャ委員会

インターネットアーキテクチャ委員会（インターネットアーキテクチャいいんかい、Internet Architecture Board、IAB）とは、インターネットソサエティ(ISOC)がインターネットの技術的・工学的開発を監督するために設置した委員会である。配下には多くのタスクフォースがあり、最も重要なものとしてInternet Engineering Task Force(IETF)とInternet Research Task Force(IRTF)がある。 IAB の母体となったのは、アメリカ国防総省の国防高等研究計画局が1979年に設立した Internet Configuration Control Board である。同委員会は1984年に Internet Advisory Board となり、1986年5月には Internet Activity Board となった。その後、1992年1月、インターネットがアメリカ政府の管理下から徐々に国際的な公共物となってきたことを受けて、ISOC 管理下のインターネットアーキテクチャ委員会となった。.

新しい！!: 文字集合とインターネットアーキテクチャ委員会 · 続きを見る »

キャラクタ (コンピュータ)

ャラクタ (character) は、文字のことであるが、情報処理においては「文字コード」で表される「文字集合」という集合の要素（「元」）のことである。.

新しい！!: 文字集合とキャラクタ (コンピュータ) · 続きを見る »

コンピュータ

ンピュータ（Computer）とは、自動計算機、とくに計算開始後は人手を介さずに計算終了まで動作する電子式汎用計算機。実際の対象は文字の置き換えなど数値計算に限らず、情報処理やコンピューティングと呼ばれる幅広い分野で応用される。現代ではプログラム内蔵方式のディジタルコンピュータを指す場合が多く、特にパーソナルコンピュータやメインフレーム、スーパーコンピュータなどを含めた汎用的なシステムを指すことが多いが、ディジタルコンピュータは特定の機能を実現するために機械や装置等に組み込まれる組み込みシステムとしても広く用いられる。電卓・機械式計算機・アナログ計算機については各項を参照。.

新しい！!: 文字集合とコンピュータ · 続きを見る »

コードページ

ードページとは、特定の符号化文字集合を指定するための数字、またはその数字で指定された符号化文字集合、あるいはそのような方法で符号化文字集合を指定するためのシステムのことである。cpと表示されることもある。それぞれの符号化文字集合は「コードページ○○（○○は2桁から5桁の数字）」という形で管理される。コードページという用語は、システムベンダ各社が管理している符号化文字集合を指す時にしか用いられず、ISO等の公的な規格の文字集合を「コードページ○○」などということはない。IBMおよび、マイクロソフトは各自、コードページを定めて管理している。マイクロソフトのコードページ群はMS-DOSやWindowsなどで利用されている。IBMのコードページはSystem iやDB2等の文字データ表現体系(CDRA: "Character Data Representation Architecture")をサポートするIBMシステムで利用されている。.

新しい！!: 文字集合とコードページ · 続きを見る »

スカラー

ラー、スカラ; scalar.

新しい！!: 文字集合とスカラー · 続きを見る »

写像

写像（しゃぞう、mapping, map）とは、二つの集合が与えられたときに、一方の集合の各元に対し、他方の集合のただひとつの元を指定して結びつける対応のことである。函数（関数）、変換、作用素、射などが写像の同義語として用いられることもある。ブルバキに見られるように、写像は集合とともに現代数学の基礎となる道具の一つである。現代的な立場では、「写像」と（一価の）「函数」は論理的におなじ概念を表すものと理解されているが、歴史的には「函数」の語は解析学に出自を持つものであり、一部には必ずしも写像でないものも函数の名の下におなじ範疇に扱われる（多価函数参照）。文献によっては「数の集合（大抵の場合実数体または複素数体の部分集合）を終域に持つ写像」をして特に「函数」と呼び、「写像」はより一般の場合に用いる。函数、二項関係、対応の各項も参照のこと。.

新しい！!: 文字集合と写像 · 続きを見る »

元 (数学)

数学において元（げん、element）とは、集合を構成する個々の数学的対象のことである。ジュゼッペ・ペアノの導入した記法に従えば、対象が集合の元であることをと書き表す。このとき対象が集合に属する（ぞくする、membership）、あるいは集合は対象を含むとも言う。「属する」という二項関係は、数学的対象と集合（あるいは一般にクラス）との間に定まる非対称な関係（帰属関係）である。外延性の公理により、集合はそれに属する全ての数学的対象を指定することで特徴づけられる。通常用いられるにおいては基礎の公理が述べるところによって帰属関係は整礎、すなわち任意の集合は自身を元として含むことはない（帰属関係は反対称関係である）。しかし、基礎の公理の代わりにを置くではそのような制約を受けないが存在し得る。帰属関係は推移的でない。これは集合の包含関係がそうであることと対照的である。.

新しい！!: 文字集合と元 (数学) · 続きを見る »

符号点

号点（ふごうてん）は、符号化文字集合内の、文字を割り当てうる個々の点。コードポイント (code point)。Unicodeでは符号位置（ふごういち）と訳す。文脈によっては単に点（てん、point）ともいう。符号点は文字を割り当て「うる」点であり、規格によっては、実際に文字を割り当てる以外に、エスケープなどの目的の文字以外の何かが割り当てられることもある。.

新しい！!: 文字集合と符号点 · 続きを見る »

EUC-JP

EUC-JP（Extended UNIX Code Packed Format for Japanese、日本語EUC）はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード（符号化方式）のひとつである。UNIX以外のOS上で使われることもある。 1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC（Extended UNIX Codeの略）として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR（韓国語）、EUC-CN（簡体中国語）等がある。 EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPやShift_JISと異なり制御文字SS2（シングルシフトツー、0x8E）に続けて現れるので都合2バイト、補助漢字は制御文字SS3（シングルシフトスリー、0x8F）に続けて現れるので都合3バイトを要する。 JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004（2000年初版時はEUC-JISX0213）。 UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年ではUTF-8を使用したシステムも普及している。.

新しい！!: 文字集合とEUC-JP · 続きを見る »

順序集合

数学において順序集合（じゅんじょしゅうごう、ordered set）とは「順序」の概念が定義された集合の事で、「順序」とは大小、高低、長短等の序列に関わる概念を抽象化したものである。ただし、順序集合内の2つの元, に順序関係が定まっている（「比較可能」である）必要はなく、両者が「比較不能」であってもよい。比較不能のケースを許容していることを強調して順序集合の事を半順序集合（はんじゅんじょしゅうごう、partially ordered set, poset）ともいう。一方、半順序集合の中で比較不能のケースがないものを特に全順序集合という。（「半順序」という言葉が「全順序」の対義語ではない事に注意。全順序集合も半順序集合の一種である。）全順序集合の簡単な例は整数の集合や実数の集合で、通常の大小比較を順序とみなしたものがある。一方、全順序ではない半順序集合の例としては、正の整数全体の集合に整除関係で順序を入れたものや、（2つ以上元を含む）集合の冪集合において、包含関係を順序とみなしたものがある。例えば2元集合においてとはいずれも他方を包含していないので S の冪集合は全順序ではない。実生活に近い例では、「AさんはBさんの子孫である」という事を「A＜B」という大小関係とみなす事で人間全体の集合を半順序集合とみなせる。AさんとBさんはどちらも他方の子孫でない事もありうる（兄弟同士、叔父と甥、赤の他人等）ので、この順序集合は全順序ではない。.

新しい！!: 文字集合と順序集合 · 続きを見る »

部分集合

集合 A が集合 B の部分集合（ぶぶんしゅうごう、subset; 下位集合）であるとは、A が B の一部（あるいは全部）の要素だけからなることである。A が B の一部分であるという意味で部分集合という。二つの集合の一方が他方の部分集合であるとき、この二つの集合の間に包含関係があるという。.

新しい！!: 文字集合と部分集合 · 続きを見る »

集合

数学における集合 (しゅうごう、set, ensemble, Menge) とは、大雑把に言えばいくつかの「もの」からなる「集まり」である。集合を構成する個々の「もの」のことを元 (げん、; 要素) という。集合は、集合論のみならず現代数学全体における最も基本的な概念の一つであり、現代数学のほとんどが集合と写像の言葉で書かれていると言ってよい。慣例的に、ある種の集合が系 (けい、) や族 (ぞく、) などと呼ばれることもある。実際には、これらの呼び名に本質的な違いはないが細かなニュアンスの違いを含むと考えられている。たとえば、方程式系（「相互に連立する」方程式の集合）、集合族（「一定の規則に基づく」集合の集合）、加法族（「加法的な性質を持つ」集合族）など。.

新しい！!: 文字集合と集合 · 続きを見る »

通信

通信（つうしん）とは、情報の伝達を意味する言葉である。有史以前から徐々に発展し、近代における様々なそして急激な技術的発展によって、より多様で利便性の高い、大衆的なものに発展してきた。.

新しい！!: 文字集合と通信 · 続きを見る »

IBM

IBM（アイビーエム、正式社名: International Business Machines Corporation）は、民間法人や公的機関を対象とするコンピュータ関連製品およびサービスを提供する企業である。本社はアメリカ合衆国ニューヨーク州アーモンクに所在する。世界170カ国以上で事業を展開している。.

新しい！!: 文字集合とIBM · 続きを見る »

Iconv

iconv（アイコンブ）は異なる文字コード間の相互変換を行う標準API。または、そのAPIに付属する文字コード変換プログラム。名前は「International Codeset Conversion Library」に由来する。.

新しい！!: 文字集合とIconv · 続きを見る »

Internet Assigned Numbers Authority

Internet Assigned Numbers Authority（IANA、アイアナ）とはインターネットに関連する番号を管理する組織である。IPアドレス・ドメイン名・ポート番号等の標準化・割り当て・管理などを行う。アメリカの南カリフォルニア大学のISI（Information Sciences Institute）にある。ジョン・ポステルが中心となって始めた組織。運営費用の一部がアメリカ政府により援助されていたが国際的な機関となるために1999年、ICANNの援助によって活動する組織に変更された。現在、ICANNの下部組織。 XML宣言に記述するエンコーディングの名前は、IANAに登録されたキャラクタセット名が使用される。.

新しい！!: 文字集合とInternet Assigned Numbers Authority · 続きを見る »

ISO/IEC 10646

ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221（国際符号化文字集合）。 UCSの文字空間は0 - 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 - 10FFFFと定義された。符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。.

新しい！!: 文字集合とISO/IEC 10646 · 続きを見る »

ISO/IEC 2022

ISO/IEC 2022（旧称 ISO 2022）は、.

新しい！!: 文字集合とISO/IEC 2022 · 続きを見る »

ISO/IEC 646

ISO/IEC 646は7ビットの文字コードを規定する国際標準化機構 (ISO) 標準であり、これを元に各国語版の文字コードが規定される。アメリカの規格であるASCIIを国際化した体裁となっている。ラテンアルファベット（ISO基本ラテンアルファベット）と数字を中心とした共通部分と、ASCIIでは記号となっている各国規格で自由に割り当てられる部分に分かれており、ヨーロッパ各国ではこの部分にダイアクリティカルマークつき文字を割り当てることにより自国語の文章を符号化できるようになっている。現在ではヨーロッパでは8ビットコードであるISO/IEC 8859が主流となっており、この規格はあまり使われていない。なお、UnicodeのISO規格であるISO/IEC 10646の規格番号は、この規格の番号にちょうど10000を加えた値となっている。.

新しい！!: 文字集合とISO/IEC 646 · 続きを見る »

ISO/IEC 8859

ISO 8859（より正式にはISO/IEC 8859）はコンピュータでの利用を目的とした8ビット文字コードの標準である。ISOとIECが合同で定めた。この標準は複数の部（英: part）に分かれており、それぞれがISO/IEC 8859-1、ISO/IEC 8859-2などのように番号付きで出版されている。それぞれの部自体を、非公式に標準として参照することがある。2009年現在、15の部（破棄されたISO/IEC 8859-12標準を除く）が存在する。.

新しい！!: 文字集合とISO/IEC 8859 · 続きを見る »

JIS X 0201

JIS X 0201は、日本工業規格 (JIS) の制定している文字コード規格で、初版は1969年6月1日の制定であり、現存のJISにおける最も古い文字コードである。規格名称は7ビット及び8ビットの情報交換用符号化文字集合。名称が示す通り、7ビット符号と8ビット符号での運用が予定されている。図形文字の集合を規定するための規格であり、JIS X 0211 (ISO/IEC 6429) で規定される制御文字集合と組み合わせて使用する。現在の規格番号は日本工業規格の部門X（情報処理）の新設に伴って1987年3月1日に変更されたもので、旧規格番号はJIS C 6220。俗称はANKコードで、'ANK'はこのコードの主要構成文字であるアルファベット (Alphabet)、数字 (Numerical digit)、片仮名 (Katakana) の頭文字より来ている。 JIS X 0201はラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合よりなっている。このうちラテン文字用図形文字集合はAmerican Standard Code for Information Interchange (ASCII) と同様ISO/IEC 646の版の1つとなっている。ASCIIと比較すると2文字が異なっており、92番の文字にバックスラッシュ ('') の替わりに円記号 ('¥') が、126番にチルダ ('~') の替わりにオーバーライン ('‾') が割り当てられている。片仮名用図形文字集合は片仮名と日本語用の約物よりなっており、最後の31文字分は未定義となっている。また、単独の濁点と半濁点のみ収録されており濁点付き片仮名と半濁点付き片仮名は収録されていない。全体的な構造はJIS X 0202 (ISO/IEC 2022) に従った構造となっており、8ビット符号では16進で21から7Eにラテン文字を、A1からFEに片仮名を割り当てる。7ビット符号では21から7Eの領域を、SHIFT-INとSHIFT-OUTでラテン文字と片仮名を切り替えながら使用する。このとき、SO(0E)以降は片仮名、SI(0F)以降はラテン文字となる。現在では主にShift_JISおよびEUC-JPの一部として用いられており、単独で用いられることはほとんどない。これらの文字コードは JIS X 0208の文字も含んでおり、JIS X 0208にはJIS X 0201にあるほぼすべての文字があるため文字が重複することとなる。この区別のため、JIS X 0201の文字をJIS X 0208の文字の半分の幅で表示することが多い。このため、これらの文字を俗に半角文字、特に片仮名を半角カナとよぶ事が多い。また、Shift_JISのアルファベット部分はASCIIとJIS X 0201との区別が曖昧なまま使われることが多いため、円記号とバックスラッシュの区別においてしばしば混乱が起きる。.

新しい！!: 文字集合とJIS X 0201 · 続きを見る »

JIS X 0208

JIS X 0208（ジス X 0208）は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.

新しい！!: 文字集合とJIS X 0208 · 続きを見る »

JIS X 0213

JIS X 0213（ジス X 0213）はJIS X 0208:1997を拡張した、日本語用の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である。 2000年に制定、2004年、2012年に改正された。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。 JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。.

新しい！!: 文字集合とJIS X 0213 · 続きを見る »

JIS X 0221

JIS X 0221は、日本工業規格（JIS）の制定している文字コード規格の一つで規格の名称は「国際符号化文字集合（UCS）」、ISO/IEC 10646の国際一致規格である。.

新しい！!: 文字集合とJIS X 0221 · 続きを見る »

Macintosh

Macintosh 128K（1984年-） iMac 2007年モデル Macintosh（マッキントッシュ）は、アップルが開発および販売を行っているパーソナルコンピュータ。通称・略称は、Mac（マック）。.

新しい！!: 文字集合とMacintosh · 続きを見る »

Microsoft Windows

Microsoft Windows（マイクロソフトウィンドウズ）は、マイクロソフトが開発・販売するオペレーティングシステム (OS) の製品群。グラフィカルユーザインタフェース (GUI)を採用している。.

新しい！!: 文字集合とMicrosoft Windows · 続きを見る »

Multipurpose Internet Mail Extensions

Multipurpose Internet Mail Extension（多目的インターネットメール拡張）は、規格上US-ASCIIのテキストしか使用できないインターネットの電子メールでさまざまなフォーマット（書式）を扱えるようにする規格である。通常はMIME（マイム）と略される。RFC 2045、RFC 2046、RFC 2047、RFC 4288、RFC 4289、RFC 2049 で規定されている。.

新しい！!: 文字集合とMultipurpose Internet Mail Extensions · 続きを見る »

Request for Comments

Request for Comments（リクエストフォーコメンツ、略称：RFC）はIETF（Internet Engineering Task Force）による技術仕様の保存、公開形式である。内容には特に制限はないが、プロトコルやファイルフォーマットが主に扱われる。RFCとは「コメント募集」を意味する英語の略語であり、もともとは技術仕様を公開し、それについての意見を広く募集してより良いものにしていく観点から始められたようである。全てのRFCはインターネット上で公開されており、誰でも閲覧することができる。.

新しい！!: 文字集合とRequest for Comments · 続きを見る »

Shift JIS

Shift_JIS（シフトジス）は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、現在は標準化文書JIS X 0213の附属書1で規定されている(Shift JIS-2004)。「Shift_JIS」はIANAにおける登録名である。マイクロソフトなどの各ベンダーが実装するShift_JISの亜種については「Microsoftコードページ932」を参照。Mac OSが実装する亜種については「MacJapanese」を参照。.

新しい！!: 文字集合とShift JIS · 続きを見る »

Unicode

200px Unicode（ユニコード）は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合（文字セット）が単一の大規模文字セットであること（「Uni」という名はそれに由来する）などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

新しい！!: 文字集合とUnicode · 続きを見る »

UNIX

UNIX （ユニックス、Unix、）は、コンピュータ用のマルチタスク・マルチユーザーのオペレーティングシステムの一種である。公式な商標は「UNIX」だが、商標以外の意味として「Unix」、またはスモールキャピタルを使用して「Unix」などとも書かれる。Unixは1969年、AT&Tのベル研究所にて、ケン・トンプソン、デニス・リッチーらが開発を開始した。当初はアセンブリ言語のみで開発されたが、1973年にほぼ全体をC言語で書き直した。このため、Unixは歴史上、初めて高水準言語で書かれたOSであると言われる。 1973年の段階ではPDP-11に依存したコードが多く、移植性は低かったが、その後徐々にPDP-11に依存したコードを減少させ、1978年にInterdata 8/32への移植に成功して以降、徐々に他のプラットフォームにも移植されていった。現在では「Unix」という語は、Unix標準に準拠するあらゆるオペレーティングシステムの総称でもある。現在ではUnixシステムは多数の系統に分かれており、AT&Tの開発停止後も、多数の商用ベンダーや非営利組織などによって開発が続けられている。 1970年代から1980年代の初期にかけて、Unixは大学や研究所などの教育機関で広範囲に採用され、特にカリフォルニア大学バークレー校をオリジナルとするBSD系統が誕生した。また Version 7 Unix や UNIX System V の特徴を持つオペレーティングシステムは「伝統的なUNIX」(traditional Unix)とも呼ばれる。 2007年に、「UNIX」の商標の所有者である標準化団体のThe Open Groupは、Single UNIX Specificationを完全に満たすと認証を受けたシステムのみが「UNIX」の商標を得られるとした。このためそれ以外のシステムは（ずっと以前から、AT&T版およびBSD以外を指して使われていた用語だが）「Unixシステムライク」または「Unixライク（Unix系）」と呼ばれるようになった。ただし The Open Groupはその呼称を気に入っていない。現在では多く使われているUnixとしてはmacOS、AIX、HP-UX、Solarisなどがある（いずれも商用）。また認証を受けていないUnix系としてはLinux（派生OSにAndroid他）やMINIX、BSDの派生OS（FreeBSD、NetBSD、OpenBSD、DragonFly BSDなど）がある。.

新しい！!: 文字集合とUNIX · 続きを見る »

UTF-8

UTF-8（ユーティーエフはち、ユーティーエフエイト）はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

新しい！!: 文字集合とUTF-8 · 続きを見る »

W3C勧告

W3C勧告（英: W3C recommendation）とは、World Wide Web Consortium (W3C) の規格を扱うワーキンググループにおける批准プロセスの最終段階である。W3C勧告となった文書は、W3Cメンバー組織と一般社会のレビューを済ませている。Web技術の標準化を目的としている。他の業界での公式な工業規格と同等なレベルのものである。.

新しい！!: 文字集合とW3C勧告 · 続きを見る »

標準化

標準化（ひょうじゅんか、英語：standardization(スタンダーダイゼーション)）という用語は、文脈によって様々な意味を持つ。「標準（standard）」という用語には、相互運用のための広く合意されたガイドラインという意味が含まれ、「標準化」はそのような標準を確立する過程を指すのが一般的である。社会科学や経済学では、「標準化」の考え方は協調ゲームの解法と近い。それぞれの利害関係者がそれぞれに何らかの利益を得つつ、全体として一貫した決定に到達する。「標準化」は、よりよい選択をし、その選択結果を標準として批准する過程である。なお、JISにおける「標準」の定義は次のとおりである。「関係する人々の間で利益又は利便が公正に得られるように、統一し、単純化を図る目的で、もの（生産活動の産出物）及びもの以外（組織、責任権限、システム、方法など）について定めた取決め。」 (JIS Z 8002:2006）.

新しい！!: 文字集合と標準化 · 続きを見る »

文字

文字（もじ）とは、言葉・言語を伝達し記録するために線や点を使って形作られた記号のこと。文字の起源は、多くの場合ものごとを簡略化して描いた絵文字（ピクトグラム）であり、それが転用されたり変形、簡略化されたりして文字となったと見られる。.

新しい！!: 文字集合と文字 · 続きを見る »

文字コード

文字コード（もじコード）とはコンピュータ上で文字（キャラクタ (コンピュータ)）を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係（文字コード体系）のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.

新しい！!: 文字集合と文字コード · 続きを見る »

文字符号化方式

文字符号化方式（もじふごうかほうしき、character encoding scheme、CES）とは、符号化文字集合で文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列（通常、バイト列）に変換する符号化方式。文字符号化体系、文字符号化スキーム (character coding scheme) とも言う。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 (encoding scheme) などとも言う。この用語はUnicodeやIETFの標準などで用いているが、ISO/IECやJISの標準では用いず「符号化文字集合の構造」あるいは「'''文字符号の構造及び拡張法'''」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。.

新しい！!: 文字集合と文字符号化方式 · 続きを見る »

ここにリダイレクトされます：

文字セット、符号化漢字集合、符号化文字集合。

ユニオンペディアは百科事典や辞書のように組織化概念地図や意味ネットワークです。これは、それぞれの概念との関係の簡単な定義を与えます。

これは、概念図の基礎となる巨大なオンライン精神的な地図です。これを使うのは無料で、各記事やドキュメントをダウンロードすることができます。それは教師、教育者、生徒や学生が使用できるツール、リソースや勉強、研究、教育、学習や教育のための基準、です。学問の世界のための：学校、プライマリ、セカンダリ、高校、ミドル、大学、技術的な学位、学部、修士または博士号のために。論文、報告書、プロジェクト、アイデア、ドキュメント、調査、要約、または論文のために。ここで定義、説明、またはあなたが情報を必要とする各重要なの意味、および用語集などのそれに関連する概念のリストです。日本語, 英語, スペイン語, ポルトガル語, 中国の, フランス語, ドイツ語, イタリア語, ポーランド語, オランダ語, ロシア語, アラビア語, ヒンディー語, スウェーデン語, ウクライナ語, ハンガリー語, カタロニア語, チェコ語, ヘブライ語, デンマーク語, フィンランド語, インドネシア語, ノルウェー語, ルーマニア語, トルコ語, ベトナム語, 韓国語, タイ語, ギリシャ語, ブルガリア語, クロアチア語, スロバキア語, リトアニア語, フィリピン人, ラトビア語, エストニア語とスロベニア語で利用できます。すぐにその他の言語。

すべての情報は、ウィキペディアから抽出し、それがクリエイティブクリエイティブ・コモンズ表示-継承ライセンスで利用することができます。

ユニオンペディアはウィキメディア財団の承認を受けておらず、提携もしていません。

Google Play、Android および Google Play ロゴは、Google Inc. の商標です。

個人情報保護方針