ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
インストール
ブラウザよりも高速アクセス!
 

面 (文字コード)

索引 面 (文字コード)

面(めん)、字面(じめん)、プレーン(plane)とは、マルチバイト文字符号化方式において、下位から第3バイト(およびそれより上位バイト)で特定される、符号空間の一部分である。.

53 関係: ASCIIじょ吉野家大漢和辞典変体仮名字体少数民族今昔文字鏡住民基本台帳収録変体仮名マルチバイト文字バイト (情報)ヲシテトンパ文字ビットデザレット文字制御文字アース (文字)エスケープシーケンスゴート文字ショー文字図形文字Big5CCCIICNS 11643簡体字線文字B繁体字絵文字異体字セレクタDIS 10646EUC-JP言語追加面GT書体IモードISO/IEC 10646ISO/IEC 2022JIS X 0208JIS X 0213Shift JISTRONコードUnicodeUTF-16UTF-8楽譜漢字文字符号化方式文字集合整数1986年...1988年1992年8ビット インデックスを展開 (3 もっと) »

ASCII

ASCII(アスキー、American Standard Code for Information Interchange)は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.

新しい!!: 面 (文字コード)とASCII · 続きを見る »

じょ

𥝱(じょ)および秭(し)は漢字文化圏における数の単位の一つ。𥝱がいくつを示すかは時代や地域により異なるが、現在では 1024 を示す。元々の漢字は秭(積み重ねる意)であり、日本で用いられる𥝱は和製漢字(国字)である。 当初は、10倍ごとに位取りの名称を定める「下数」が行われていたので、「秭」は 109 となる。「秭」は『詩経』周頌に見え、経典に使用例のある最大の数である。 ベトナム語で、十億のことを「tỷ」というが、これは「秭」の漢字音である。 後に行われた「上数」では、秭は垓 (1064) の垓倍で 10128 を指した。「中数」の万万進では垓 (1032) の億倍で 1040、万進では垓 (1020) の万倍で 1024 となる。しかし下数以外で「秭」はほとんど使われることがない。 1024 のような巨大な数をどのように表現するかは中華人民共和国で議論がある(垓を参照)が、科学的目的には指数表記を用いるので問題はない。 日本では江戸時代に万進に統一されたので 1024 となり、かつて日本統治下にあった台湾・韓国でも秭は 1024 となった。ただし、いずれの国でも京以上の命数が使われることはまれであり、通常は指数表記が使われる。本来秭と書かれていた単位であるが、日本では『塵劫記』で「𥝱」と誤って書かれ、旁(つくり)の「予」から読み方も「じょ」となった。今日の日本では「𥝱」(じょ)の方が一般的である。 𥝱の位および前後の位の命数は以下のようになる。上数は数が非常に多いので、一部のみを表示している。 英語の単位 (short scale) では、1𥝱は septillion に相当する。.

新しい!!: 面 (文字コード)とじょ · 続きを見る »

吉野家

吉野家(よしのや)は、牛丼を主力商品とする、大手外食チェーンストア(牛丼屋)。 株式会社吉野家ホールディングス(略称:吉野家HD)の孫会社・株式会社吉野家(、略称:吉野家。株式会社吉野家資産管理サービスの子会社なので吉野家HDの孫会社)が、同店の運営企業である。日本国における牛丼チェーン店舗数では2008年9月末以降、すき家に次いで第2位である(沿革参照)。 本社所在地は、東京都中央区で、日本国だけでなく中華人民共和国、台湾、フィリピン、シンガポール、マレーシア、アメリカ合衆国、カンボジア、インドネシアにも支店を持つ。愛称・通称は「吉牛(よしぎゅう、吉野家の牛丼の略)」(後述)。吉野屋は誤記。.

新しい!!: 面 (文字コード)と吉野家 · 続きを見る »

大漢和辞典

『大漢和辭典』(だいかんわじてん)は、大修館書店で出版されている世界最大の漢和辞典。諸橋轍次を代表とし、数十年に及ぶ歳月(鈴木一平の依頼があった1925年から補巻が刊行された2000年までだと75年)を費やし完成。諸橋大漢和と称されることもある。.

新しい!!: 面 (文字コード)と大漢和辞典 · 続きを見る »

変体仮名

変体仮名(へんたいがな)は、平仮名の字体のうち、1900年(明治33年)の小学校令施行規則改正以降の学校教育で用いられていないものの総称である。平仮名の字体の統一が進んだ結果、現在の日本では変体仮名はあまり使用されなくなったが、看板や書道、地名、人名など限定的な場面では使われている#築島1981、pp.352-353。。異体仮名(いたいがな)とも呼ばれる。また、ケンペルの日本誌では、大和仮名(やまとがな)とも表記されている。 変体仮名に対し、現在使われている字体を「現用字体」「現用仮名」「正体仮名」「本則仮名」と呼ぶ。また、変体仮名の使い分け(現用字体を含む)のことも「変体仮名」と呼ぶことがある。 Image:Hiragana_I_01.svg|以(い) Image:Hiragana_E_01.svg|江(え) Image:Hiragana_O_01.svg|於(お) Image:Hiragana_KA_01.svg|可(か) Image:Hiragana_KI_01.svg|起(き) Image:Hiragana_KO_01.svg|古(こ) Image:Hiragana_SI_01.svg|志(し) Image:Hiragana_SU_01.svg|春(す) Image:Hiragana_TA_01.svg|多(た) Image:Hiragana_NA_01.svg|奈(な) Image:Hiragana_NO_01.svg|能(の) Image:Hiragana_HA_01.svg|者(は) Image:Hiragana_YU_01.svg|由(ゆ) Image:Hiragana_RE_01.svg|連(れ) Image:Hiragana_RO_01.svg|路(ろ) Image:Hiragana_WA_01.svg|王(わ).

新しい!!: 面 (文字コード)と変体仮名 · 続きを見る »

字体

図1(刀) 図2(刃) 図3 字体(じたい)とは、図形を一定の文字体系の一字と視覚的に認識する概念、すなわち文字の骨格となる「抽象的な」概念のことである。.

新しい!!: 面 (文字コード)と字体 · 続きを見る »

少数民族

少数民族(しょうすうみんぞく)とは、ある民族や国家や地域など何かしらの枠組みが複数の民族集団(ethnic group)によって構成されている場合に、相対的に少数からなる民族集団のことを言う。.

新しい!!: 面 (文字コード)と少数民族 · 続きを見る »

今昔文字鏡

今昔文字鏡(こんじゃくもじきょう)は、エーアイ・ネットが開発し、販売する(単漢字15万字版までの商品・インデックスフォントについては紀伊國屋書店が販売)、Windows用の漢字検索ソフトと印字用フォントを組み合わせた入力、印字用アプリケーションソフトウェア。最新版の収録字数は17万字以上である。.

新しい!!: 面 (文字コード)と今昔文字鏡 · 続きを見る »

住民基本台帳収録変体仮名

住民基本台帳収録変体仮名(じゅうみんきほんだいちょうしゅうろくへんたいがな)とは、住民票で使用される168文字からなる変体仮名の総称。略して住基仮名(じゅうきがな)とも呼ぶ。.

新しい!!: 面 (文字コード)と住民基本台帳収録変体仮名 · 続きを見る »

マルチバイト文字

マルチバイト文字(マルチバイトもじ)とは、.

新しい!!: 面 (文字コード)とマルチバイト文字 · 続きを見る »

バイト (情報)

バイト (byte) は、「複数ビット」を意味する、データ量あるいは情報量の単位である。 1980年頃から1バイトは8ビット (bit) であることが一般的であったが、 正式に定義されたのは2008年発行のIEC_80000-13である。 8ビットは、256個の異なる値(たとえば整数であれば、符号無しで0から255、符号付きで−128から+127、など)を表すことができる。.

新しい!!: 面 (文字コード)とバイト (情報) · 続きを見る »

ヲシテ

ヲシテは、ヲシテ文献で用いられている「文字」。いわゆる「神代文字」の一種。.

新しい!!: 面 (文字コード)とヲシテ · 続きを見る »

トンパ文字

トンパ文字(トンパもじ、中国語:東巴文)またはトンバ文字とは、中国のチベット東部や雲南省北部に住む少数民族の一つナシ族に伝わる、象形文字の一種である。ナシ語の表記に用い、異体字を除くと約1400の単字からなり、語彙は豊富である。現在、世界で唯一の「生きた象形文字」とされる。 2003年、ユネスコが主催する世界記録遺産にも登録された。.

新しい!!: 面 (文字コード)とトンパ文字 · 続きを見る »

ビット

ビット (bit, b) は、ほとんどのデジタルコンピュータが扱うデータの最小単位。英語の binary digit (2進数字)の略であり、2進数の1けたのこと。量子情報科学においては古典ビットと呼ばれる。 1ビットを用いて2通りの状態を表現できる(二元符号)。これらの2状態は一般に"0"、"1"と表記される。 情報理論における選択情報およびエントロピーの単位も「ビット」と呼んでいるが、これらの単位は「シャノン」とも呼ばれる(詳細は情報量を参照)。 省略記法として、バイトの略記である大文字の B と区別するために、小文字の b と表記する。.

新しい!!: 面 (文字コード)とビット · 続きを見る »

デザレット文字

デザレット文字(デザレットもじ、Deseret alphabet)は、アメリカ合衆国の末日聖徒イエス・キリスト教会において19世紀後半に使用された、英語を表記するための文字。 38文字からなるアルファベットであり、左から右へ書かれる。.

新しい!!: 面 (文字コード)とデザレット文字 · 続きを見る »

制御文字

ンピューティングと電気通信において、制御文字(せいぎょもじ、control character)とは、文字コードの規格で定義される文字のうち、ディスプレイ・プリンター・通信装置などに対して、特別な動作(制御)をさせるために使う文字である。制御キャラクタともいい、情報処理用語規格では「制御機能文字」と呼ばれている。 「文字」という名前であるがディスプレイやプリンターには表示されない。そのため、非表示文字(ひひょうじもじ、non-printing character、印字不可文字)とも言う。それに対し、制御文字以外の表示可能な文字を図形文字(graphic character)という。図形文字と制御文字は電気信号上は区別がなく、同じデータストリーム上に現われる。これをという。 制御文字にどのような文字コードを割り当てるかは、ASCII、EBCDICなどの文字コード体系により異なる。ASCIIでは0から31および127が制御文字に割り当てられている(技術的にはこれをという)。ISO 8859で定義される拡張ASCIIでは、これに128から159までの制御文字を追加した。これはと呼ばれる。 これらの65個の制御文字はUnicodeに引き継がれた。Unicodeではさらに制御文字を追加しているが、これはゼロ幅非接合子のようなフォーマット用文字とは区別される。 EBCDICには、ASCIIの65個の制御文字全てのほか、主としてIBMの周辺機器を制御するための追加の制御文字が含まれている。.

新しい!!: 面 (文字コード)と制御文字 · 続きを見る »

アース (文字)

アース (Ath) は、森岡浩之および赤井孝美の創作した架空文字で、アーヴ語の表記に用いられる。.

新しい!!: 面 (文字コード)とアース (文字) · 続きを見る »

エスケープシーケンス

ープシーケンス (escape sequence) とは、コンピュータシステムにおいて、通常の文字列では表せない特殊な文字や機能を、規定された特別な文字の並びにより表したもの。.

新しい!!: 面 (文字コード)とエスケープシーケンス · 続きを見る »

ゴート文字

ート文字(ゴートもじ、英: )とは、4世紀ごろウルフィラにより考案されたとされる、ゴート語を表記するための音素文字である。それ以前のゴート語表記はルーン文字で行われたと考えられている。 ウルフィラは、聖書をゴート語に翻訳して布教を行うために、この文字を考案したという。この文字にはギリシア文字の強い影響が見られるが、いくつかの文字はラテン文字を借用している。各文字の名前は、ルーン文字の名前を由来とすることが明らかである。.

新しい!!: 面 (文字コード)とゴート文字 · 続きを見る »

ショー文字

ョー文字(Shaw's alphabet、Shavian alphabet)は、ジョージ・バーナード・ショーの遺言によって英語の表音的な正書法のために制定された、40文字(合字を含めて48文字)からなるアルファベットである。1959年にキングズリー・リードによって作成された。 英語の正書法改革案としておそらくもっとも有名で、かつもっとも過激なものだが、現実に使われることはほとんどなかった。.

新しい!!: 面 (文字コード)とショー文字 · 続きを見る »

図形文字

図形文字(ずけいもじ、graphic character)とは、文字コード規格で定められた符号化文字のうち、一般的に使われる意味での文字にほぼ相当するものをいう。「図形キャラクタ」と表記されることもある。「印刷可能な文字(printable characters)」や「表示可能な文字」も同じものを表している。.

新しい!!: 面 (文字コード)と図形文字 · 続きを見る »

Big5

Big5(ビッグファイブ、中国語名:大五碼あるいは五大碼)は、繁体字中国語の文字コード(文字集合)で、台湾・香港・マカオといった繁体字圏で最も一般的に使われている。.

新しい!!: 面 (文字コード)とBig5 · 続きを見る »

CCCII

CCCII(中文資訊交換碼、Chinese Character Code of Information Interchange)は、中華民国(台湾)の符号化文字集合。ISO/IEC 2022準拠の94×94×94コードである。各文字を21212116 - 7E7E7E16で表す、3バイト(3×7ビット)コードである。 1980年に行政院文化建設委員会が制定した。最初の収録文字は5139文字だったが、その後、何度も追加・改定がなされ、1999年現在で73400文字が収録されている。(改定が矛盾しているなど混乱があるので、文献によって字数が異なることがある) 212B2116 - 212F7816に非漢字331字(部首214字を含む)、21302116 - 21633016に常用国字標準字体表4808字、21642116 - 26254316にそれ以外の漢字37615字が収録されている。 CCCIIでは6面をまとめて群と呼び(256面を群と呼ぶISO/IEC 10646とは異なる)、先に述べた符号位置は全て第1群(第1 - 第6面、21212116 - 267E7E16)に属する。第1群に収録されている漢字は伝統字である。第2群(第7 - 第12面、27212116 - 2C7E7E16)には、それぞれの伝統字の符号に06000016を足した符号位置に、対応する簡体字が収録されている。さらに第3~第16群に、それ以外の異字体が収録されている。そのため、第1群以外は、ごく一部しか文字が定義されていない。 CCCIIを使った文字符号化方式としては、EUCの1種のEUC-CCCII-FT(CCCII-FT内碼)がある。 台湾の他の文字コードであるBig5やCNS 11643と互換性は無い。 Category:文字コード Category:台湾の言語.

新しい!!: 面 (文字コード)とCCCII · 続きを見る »

CNS 11643

CNS 11643は、中華民国(台湾)の文字コード(文字集合)の規格。 1983年にまず試用版が発行され、2年間の試用期間を経た後に漢字の重複や排列順序の間違いを正し、1986年に最初の正式版が発行された。約13000字をISO/IEC 2022に適合するよう94×94文字集合2個に編成し、それぞれ第一字面・第二字面と呼ぶ。この他、初期には第十四字面があったが廃止され、後に第三~第七字面と第十五字面が追加された。符号空間としては第十六字面まで想定されている。 CNS 11643をEUCで符号化したものを、繁体字中国語EUC (EUC-TW) という。 公的規格であり、体系としてはBig5より整っているが、正式版が発行された時点ではBig5がすでに広く普及していたこと、文字集合を複数の字面に分割したことから1文字が2バイトに収まらない場合があること、重複や排列を正したために試用版をベースとしたBig5との変換が単純な計算でできないことなどの理由により、.

新しい!!: 面 (文字コード)とCNS 11643 · 続きを見る »

簡体字

簡体字(かんたいじ、简体字、)または規範字(きはんじ、、)は、1950年代に中華人民共和国で制定された、従来の漢字を簡略化した字体体系である。簡体字という呼称は通称・俗称であり、正式には簡化字(かんかじ、、)と言う。 中国大陸のほか、シンガポールやマレーシアなどでも採用されている。.

新しい!!: 面 (文字コード)と簡体字 · 続きを見る »

線文字B

線文字B(せんもじB、Linear B)は、紀元前1550年から紀元前1200年頃まで、ギリシア本土およびクレタ島で使われていた文字である。古いギリシア語の方言を表記するのに用いられた。 主に粘土板の上に左から右に書かれ、音節文字と「表意文字」と呼ばれるが実際は文字ではない絵画的な記号、および数字と単位記号から構成される。 この文字によって表されるギリシア語をミケーネ・ギリシャ語と称する。.

新しい!!: 面 (文字コード)と線文字B · 続きを見る »

繁体字

繁体字(はんたいじ、、)または正体字(せいたいじ、、)は、中国語において、系統的な簡略化を経ていない筆画が多い漢字の字体を指す。特に中華人民共和国の一連の「文字改革」政策による簡体字(簡化字)との対比によりこう呼ぶ。現在では主に台湾のほか、中華人民共和国の特別行政区である香港・マカオで使用され、中華圏外の華人コミュニティーでも見られる。日本でいう「旧字体」に近いが同じではない。字体や用字法は地域ごとに異なる点が見られ、1980年代以降、それ以前に活字でよく見られた字体よりも筆写体に近づいたものが規範とされる。.

新しい!!: 面 (文字コード)と繁体字 · 続きを見る »

絵文字

絵文字(えもじ、えもんじ)とは、語(音形)ではなく、ものや事柄を、絵を文字のように用いて象徴的に示唆したもののこと。 日本語で絵文字という場合、以下の複数の意味で用いられる。.

新しい!!: 面 (文字コード)と絵文字 · 続きを見る »

異体字セレクタ

体字セレクタ (Variation Selector) は、Unicode および ISO/IEC 10646 (UCS) における、文字の字体をより詳細に指定するためのセレクタ (選択子) である。.

新しい!!: 面 (文字コード)と異体字セレクタ · 続きを見る »

DIS 10646

DIS 10646とは、ISO/IEC 10646の原案である。.

新しい!!: 面 (文字コード)とDIS 10646 · 続きを見る »

EUC-JP

EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつである。UNIX以外のOS上で使われることもある。 1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。 EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。 日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPやShift_JISと異なり制御文字SS2(シングルシフトツー、0x8E)に続けて現れるので都合2バイト、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので都合3バイトを要する。 JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。 UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年ではUTF-8を使用したシステムも普及している。.

新しい!!: 面 (文字コード)とEUC-JP · 続きを見る »

言語

この記事では言語(げんご)、特に自然言語について述べる。.

新しい!!: 面 (文字コード)と言語 · 続きを見る »

追加面

追加面(ついかめん)、補足面(ほそくめん)、補助面(ほじょめん)は、ISO/IEC 10646およびUnicodeにおける最初の面である基本多言語面以外の面のことを言う。.

新しい!!: 面 (文字コード)と追加面 · 続きを見る »

GT書体

GT書体(ジーティーしょたい)とは、東京大学多国語処理研究会の「マルチメディア通信システムにおける多国語処理の研究プロジェクト」として行われている、漢字や国字の蒐集活動によって纏められた大規模文字セットの書体である。.

新しい!!: 面 (文字コード)とGT書体 · 続きを見る »

Iモード

iモード、i-mode(アイモード)は、NTTドコモ(以下、ドコモ)の対応携帯電話(フィーチャー・フォン)にてキャリアメール(iモードメール)の送受信やウェブページ閲覧などができる世界初の携帯電話IP接続サービスである。.

新しい!!: 面 (文字コード)とIモード · 続きを見る »

ISO/IEC 10646

ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 UCSの文字空間は0 - 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 - 10FFFFと定義された。 符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。 面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。.

新しい!!: 面 (文字コード)とISO/IEC 10646 · 続きを見る »

ISO/IEC 2022

ISO/IEC 2022(旧称 ISO 2022)は、.

新しい!!: 面 (文字コード)とISO/IEC 2022 · 続きを見る »

JIS X 0208

JIS X 0208(ジス X 0208)は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.

新しい!!: 面 (文字コード)とJIS X 0208 · 続きを見る »

JIS X 0213

JIS X 0213(ジス X 0213)はJIS X 0208:1997を拡張した、日本語用の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である。 2000年に制定、2004年、2012年に改正された。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。 JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。.

新しい!!: 面 (文字コード)とJIS X 0213 · 続きを見る »

Shift JIS

Shift_JIS(シフトジス)は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、現在は標準化文書JIS X 0213の附属書1で規定されている(Shift JIS-2004)。「Shift_JIS」はIANAにおける登録名である 。 マイクロソフトなどの各ベンダーが実装するShift_JISの亜種については「Microsoftコードページ932」を参照。Mac OSが実装する亜種については「MacJapanese」を参照。.

新しい!!: 面 (文字コード)とShift JIS · 続きを見る »

TRONコード

TRONコード(トロンコード)とは、TRONプロジェクトで使用されている文字コードである。TRON多国語言語環境の初期論文は1987年に発表され(「TAD言語環境と多国語対応」)、以来主にBTRONで利用されてきた。.

新しい!!: 面 (文字コード)とTRONコード · 続きを見る »

Unicode

200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

新しい!!: 面 (文字コード)とUnicode · 続きを見る »

UTF-16

UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。.

新しい!!: 面 (文字コード)とUTF-16 · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

新しい!!: 面 (文字コード)とUTF-8 · 続きを見る »

楽譜

楽譜(がくふ)は、楽曲を演奏記号や符号などの記号によって書き表したものである。一般に、西洋音楽に発祥したものを指すが、世界の音楽において、様々な楽譜が存在している。また、この記号化の規則を記譜法といい、楽譜を譜面と呼んだり、単に譜と呼んだりもする。.

新しい!!: 面 (文字コード)と楽譜 · 続きを見る »

漢字

漢字(かんじ)は、中国古代の黄河文明で発祥した表語文字。四大文明で使用された古代文字のうち、現用される唯一の文字体系である。また史上最も文字数が多い文字体系であり、その数は10万字を超え、他の文字体系を圧倒する。古代から周辺諸国家や地域に伝播して漢字文化圏を形成し、言語のみならず文化上の大きな影響を与えた。 現代では中国語、日本語、朝鮮語の記述に使われる。20世紀に入り、漢字文化圏内でも日本語と中国語以外は漢字表記をほとんど廃止したが、なお約15億人が使用し、約50億人が使うラテン文字についで、世界で2番目に使用者数が多い。.

新しい!!: 面 (文字コード)と漢字 · 続きを見る »

文字符号化方式

文字符号化方式(もじふごうかほうしき、character encoding scheme、CES)とは、符号化文字集合で文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換する符号化方式。 文字符号化体系、文字符号化スキーム (character coding scheme) とも言う。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 (encoding scheme) などとも言う。 この用語はUnicodeやIETFの標準などで用いているが、ISO/IECやJISの標準では用いず「符号化文字集合の構造」あるいは「'''文字符号の構造及び拡張法'''」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。.

新しい!!: 面 (文字コード)と文字符号化方式 · 続きを見る »

文字集合

文字集合(もじしゅうごう、character set)は、文字(キャラクタ (コンピュータ))をその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.

新しい!!: 面 (文字コード)と文字集合 · 続きを見る »

整数

数学における整数(せいすう、integer, whole number, Ganze Zahl, nombre entier, número entero)は、0 とそれに 1 ずつ加えていって得られる自然数 (1, 2, 3, 4, …) および 1 ずつ引いていって得られる数 (−1, −2, −3, −4, …) の総称である。 整数は数直線上の格子点として視覚化される 整数の全体からなる集合は普通、太字の Z または黒板太字の \mathbb Z で表す。これはドイツ語 Zahlen(「数」の意・複数形)に由来する。 抽象代数学、特に代数的整数論では、しばしば「代数体の整数環」の元という意味で代数的整数あるいは「整数」という言葉を用いる。有理数全体の成す体はそれ自身が代数体の最も簡単な例であり、有理数体の代数体としての整数環すなわち、「有理数の中で整なもの」の全体の成す環は、本項でいう意味での整数全体の成す環である。一般の「整数」との区別のためにここでいう意味の整数を有理整数 (rational integer) と呼ぶことがある接頭辞「有理(的)」(rational) はそもそも「整数比」であるという意味なので、この呼称は自己循環的にもみえる。しかし、有理整数と呼ぶ場合の「有理」は「有理数の中で」という程度の意味の単なる符牒であって、「整数比」という本来の意味合いに拘るのは徒労である。。.

新しい!!: 面 (文字コード)と整数 · 続きを見る »

1986年

この項目では、国際的な視点に基づいた1986年について記載する。.

新しい!!: 面 (文字コード)と1986年 · 続きを見る »

1988年

この項目では、国際的な視点に基づいた1988年について記載する。.

新しい!!: 面 (文字コード)と1988年 · 続きを見る »

1992年

この項目では、国際的な視点に基づいた1992年について記載する。.

新しい!!: 面 (文字コード)と1992年 · 続きを見る »

8ビット

CPUは一つの命令で操作できるデータによって分類することができる。16ビットプロセッサが一つの命令で16ビットのデータを操作できるのに対して、8ビットプロセッサは一つの命令で8ビットしか操作できない。 8ビットプロセッサの例.

新しい!!: 面 (文字コード)と8ビット · 続きを見る »

ここにリダイレクトされます:

符号面

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »