ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
ダウンロード
ブラウザよりも高速アクセス!
 

ISO/IEC 2022

索引 ISO/IEC 2022

ISO/IEC 2022(旧称 ISO 2022)は、.

107 関係: ARMSCIIASCIIASMO 449多言語化中国語仮名 (文字)マルチバイト文字チェコ語バイト (情報)モンゴル語ヨーロッパラテン文字ロシア語トルコ語ヘブライ語ヘブライ文字ブルガリア語プリンターパーソナルコンピュータビットドイツ工業規格ダイアクリティカルマークベラルーシ語ベトナム語制御文字アラビア語アラビア文字アルメニア文字インドウルドゥー語ウクライナ語エスペラントエスケープシーケンスカシミール語キリル文字ギリシア語ギリシア文字コードページシンド語スロバキア語タミル文字タイ文字タジク語図形文字国際化と地域化国際標準化機構Big5CJKVCNS 11643米国国家規格協会...結合文字片仮名EcmaインターナショナルEUC-JPExtended Unix Code言語電子メールGB 2312Internet Assigned Numbers AuthorityISCIIISO-2022-JPISO/IEC 646ISO/IEC 8859ISO/IEC 8859-1ISO/IEC 8859-11ISO/IEC 8859-6ITU-TJIS X 0201JIS X 0208JIS X 0212JIS X 0213JUNETKOI8KOI8-RKOI8-UKS X 1001Microsoft WindowsMS-DOSMultipurpose Internet Mail ExtensionsPASCIIRequest for CommentsShift JISTIS-620TSCIIUNIXUTF-8VISCIIX Window System東アジア漢字朝鮮語最上位ビット情報処理学会文字文字化け文字符号化方式文字集合日本工業規格日本工業標準調査会日本語拡張ASCII1978年1980年代1983年1990年2000年2004年 インデックスを展開 (57 もっと) »

ARMSCII

ARMSCIIは Armenian Standard Code for Information Interchange (情報交換用アルメニア標準符号化文字集合) の頭字語である。シングルバイトの文字コードで、アルメニア国家標準166-97により定義されている。 この文字コードをサポートしているシステムはほとんどない。ほとんどの現代のコンピュータは既定でARMSCIIをサポートしていないので、Webブラウザや電子メールで正しくアルメニア語テキストを情報交換するには、通常Unicodeを使った方がよい。 以下の変種が定義されている.

新しい!!: ISO/IEC 2022とARMSCII · 続きを見る »

ASCII

ASCII(アスキー、American Standard Code for Information Interchange)は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.

新しい!!: ISO/IEC 2022とASCII · 続きを見る »

ASMO 449

ASMO 449は、アラビア語の表記に使われるアラビア文字を収録した7ビットの文字コードである。ISOではISO 9036として標準化されており、Ecma InternationalによってISO-IR-89として登録されている。IANAはASMO_449という名前のキャラクタセットをISO_9036、arabic7、iso-ir-89、csISO89ASMO449という別名とともに登録している。.

新しい!!: ISO/IEC 2022とASMO 449 · 続きを見る »

多言語化

フトウェアの多言語化(たげんごか。multilingualization、または multilingualisation、m17n)とは、あるソフトウェアが、複数の、言語、文字、文化的慣習を混在させて扱うことができるようにすることである。しばしば、m17n と表記される。これは、多言語化を意味する英語の multilingualization の最初の m と 最後の n のあいだが17文字であることに由来している。国際化(internationalization)とは相互に補完しあう直交概念である。.

新しい!!: ISO/IEC 2022と多言語化 · 続きを見る »

中国語

記載なし。

新しい!!: ISO/IEC 2022と中国語 · 続きを見る »

仮名 (文字)

仮名(かな)とは、漢字をもとにして日本で作られた文字のこと。現在一般には平仮名と片仮名のことを指す。表音文字の一種であり、基本的に1字が1音節をあらわす音節文字に分類される。漢字に対して和字(わじ)ともいう。ただし和字は和製漢字を意味することもある。.

新しい!!: ISO/IEC 2022と仮名 (文字) · 続きを見る »

マルチバイト文字

マルチバイト文字(マルチバイトもじ)とは、.

新しい!!: ISO/IEC 2022とマルチバイト文字 · 続きを見る »

チェコ語

チェコ語(Čeština 、Český jazyk)は、スロヴァキア語やポーランド語、カシューブ語(ポメラニア語)、ソルブ語(ソラビア語、ヴェンド語とも)などと共に、西スラヴ語の一つである。チェコ共和国の人口(約1030万人、2007年3月現在)の9割以上を占めるチェコ人と、周辺国やアメリカ合衆国、カナダ等にコミュニティを作るチェコ系住民に話されている言語である(共和国の国内外合わせて約1200万人の話者が存在する)。.

新しい!!: ISO/IEC 2022とチェコ語 · 続きを見る »

バイト (情報)

バイト (byte) は、「複数ビット」を意味する、データ量あるいは情報量の単位である。 1980年頃から1バイトは8ビット (bit) であることが一般的であったが、 正式に定義されたのは2008年発行のIEC_80000-13である。 8ビットは、256個の異なる値(たとえば整数であれば、符号無しで0から255、符号付きで−128から+127、など)を表すことができる。.

新しい!!: ISO/IEC 2022とバイト (情報) · 続きを見る »

モンゴル語

モンゴル文字で書かれた「モンゴル」 モンゴル語(モンゴルご、Монгол хэл、Mongol hel、、mongGul kele)は、モンゴル諸語に属する言語であり、モンゴル国の国家公用語である。モンゴル語を含むモンゴル語族は、テュルク語族及びツングース語族とともにアルタイ諸語と呼ばれる。 第8条はモンゴル語をモンゴル国の国家公用語に規定している。モンゴル国では、行政・教育・放送のほとんどがモンゴル語でなされるが、バヤン・ウルギー県では学校教育をカザフ語で行うことが認められている。こうした地域の人々の中にはモンゴル語を全く解さない者もいる。モンゴル国外には10万人以上のモンゴル国民が居住(日本国内にも合法・不法合わせ数千人が滞在しているものと推定されている)しており、かれらの母語でもある。 モンゴル諸語のうち、どこまでを「モンゴル語」と呼ぶのか明確な定義はないが、一般的にはモンゴル国や中国の内モンゴル自治区でも話されているものがモンゴル語とされる。.

新しい!!: ISO/IEC 2022とモンゴル語 · 続きを見る »

ヨーロッパ

ヨーロッパ日本語の「ヨーロッパ」の直接の原語は、『広辞苑』第5版「ヨーロッパ」によるとポルトガル語・オランダ語、『デジタル大辞泉』goo辞書版「」によるとポルトガル語。(、)又は欧州は、地球上の七つの大州の一つ。漢字表記は欧羅巴。 地理的には、ユーラシア大陸北西の半島部を包括し、ウラル山脈およびコーカサス山脈の分水嶺とウラル川・カスピ海・黒海、そして黒海とエーゲ海を繋ぐボスポラス海峡-マルマラ海-ダーダネルス海峡が、アジアと区分される東の境界となる増田 (1967)、pp.38–39、Ⅲ.地理的にみたヨーロッパの構造 ヨーロッパの地理的範囲 "Europe" (pp. 68-9); "Asia" (pp. 90-1): "A commonly accepted division between Asia and Europe...

新しい!!: ISO/IEC 2022とヨーロッパ · 続きを見る »

ラテン文字

ラテン文字(ラテンもじ、abecedarium Latinum、Latin alphabet、ラテンアルファベット)は、表音文字(音素文字・アルファベット)の一つである。ローマ文字、ローマ字(alfabeto Romano、Roman alphabet)とも呼ばれる。 文字を右書きで横に並べることで単語を表記し、単語間を分かち書きで区切って並べることで文章を構成する。それぞれの文字は子音か母音を表す。 今日、人類社会で最も解読者人口が多い文字である。 元来ラテン語の文字で、古くから西欧・中欧の諸言語で使われているが、近代以降はこれら以外にも使用言語が多い。ただし発音の文字への表記方法は各言語ごとに異なっており、同じ綴りでも言語によって違う発音をすることはラテン文字においては全く珍しくない。英語など、古い時代に表記法が定められた言語においては表記と発音の間の乖離も大きなものとなってきている。.

新しい!!: ISO/IEC 2022とラテン文字 · 続きを見る »

ロシア語

ア語(ロシアご、русский язык )は、インド・ヨーロッパ語族のスラヴ語派東スラヴ語群に属する言語。露語とも略される。ロシア連邦の公用語。ロシア連邦の国語表記には、キリル文字を使用する。近縁の言語にウクライナ語とベラルーシ語がある。.

新しい!!: ISO/IEC 2022とロシア語 · 続きを見る »

トルコ語

トルコ語(トルコご、)は、アゼルバイジャン語やトルクメン語と同じチュルク諸語の南西語群(オグズ語群)に属する言語。.

新しい!!: ISO/IEC 2022とトルコ語 · 続きを見る »

ヘブライ語

ヘブライ語(ヘブライご、עברית, Ivrit, Lingua Hebraea)は、アフロ・アジア語族のセム語派に属する北西セム語の一つ。ヘブル語とも呼ばれる。.

新しい!!: ISO/IEC 2022とヘブライ語 · 続きを見る »

ヘブライ文字

ヘブライ文字(ヘブライもじ、ヘブル文字とも)とは、ヘブライ語やイディッシュ語を表記するための文字である。 現代のヘブライ文字は、アラム文字より派生したアブジャドの一種で、右書き(右から左に)で書く。ヘブライ語の話者はヘブライ文字をアレフベートと呼ぶ。22文字の子音文字からなる表音文字で、うち k、m、n、p、 の5つの文字に非語末形と語末形(ソフェート)の区別がある。.

新しい!!: ISO/IEC 2022とヘブライ文字 · 続きを見る »

ブルガリア語

ブルガリア語(български език )は、ブルガリアの公用語。インド・ヨーロッパ語族のスラヴ語派南スラヴ語群に属する言語。マケドニア共和国の公用語マケドニア語とはきわめて近しい関係にあるとされる。ISO 639による言語コードは、2字がbg, 3字がbulで表される。 ブルガリアのほか、ルーマニア、セルビア、トルコ、ギリシャ、ハンガリー、モルドバ、ウクライナ、ロシア、アメリカ、イスラエル、カナダなどで話されており、母語話者人口は900万人ほどである。.

新しい!!: ISO/IEC 2022とブルガリア語 · 続きを見る »

プリンター

プソン・PM-700C(1996年〈平成8年〉11月発売) プリンター()は、印刷用の機器の総称である。印刷機(いんさつき)などとも呼ばれる。 本稿では特にコンピュータからの情報の出力に用いられる機械について説明する。その他のプリンター、印刷機については、印刷を参照。.

新しい!!: ISO/IEC 2022とプリンター · 続きを見る »

パーソナルコンピュータ

パーソナルコンピュータ(personal computer)とは、個人によって占有されて使用されるコンピュータのことである。 略称はパソコン日本独自の略語である。(著書『インターネットの秘密』より)またはPC(ピーシー)ただし「PC」という略称は、特にPC/AT互換機を指す場合もある。「Mac対PC」のような用法。。.

新しい!!: ISO/IEC 2022とパーソナルコンピュータ · 続きを見る »

ビット

ビット (bit, b) は、ほとんどのデジタルコンピュータが扱うデータの最小単位。英語の binary digit (2進数字)の略であり、2進数の1けたのこと。量子情報科学においては古典ビットと呼ばれる。 1ビットを用いて2通りの状態を表現できる(二元符号)。これらの2状態は一般に"0"、"1"と表記される。 情報理論における選択情報およびエントロピーの単位も「ビット」と呼んでいるが、これらの単位は「シャノン」とも呼ばれる(詳細は情報量を参照)。 省略記法として、バイトの略記である大文字の B と区別するために、小文字の b と表記する。.

新しい!!: ISO/IEC 2022とビット · 続きを見る »

ドイツ工業規格

ドイツ工業規格(ドイツこうぎょうきかく、Deutsche Industrie Normen、略称DIN(ディン、ダイン))はDeutsches Institut für Normung(ドイツ規格協会)により発行されている工業規格である。パソコンとキーボードやマウスの接続部分に採用されるコネクタ(DINコネクタ)、カーオーディオやカーナビの外寸サイズなどがDINに準拠している。.

新しい!!: ISO/IEC 2022とドイツ工業規格 · 続きを見る »

ダイアクリティカルマーク

ダイアクリティカルマーク()または発音区別符号(はつおんくべつふごう)は、ラテン文字等の文字で、同じ字形の文字であるが、発音が区別されるべき場合に文字に付される記号のこと。あえて日本語の文字で似た概念を探せば、濁点と半濁点に相当するであろう。満州文字における圏点もこれに類似したものといえる。.

新しい!!: ISO/IEC 2022とダイアクリティカルマーク · 続きを見る »

ベラルーシ語

ベラルーシ語(Беларуская мова)は、ベラルーシ共和国の公用語。白ロシア語(はくろしあご)と呼ばれていたこともある。話者は700万人から800万人で、ベラルーシやポーランド東部に分布している。系統的には、インド・ヨーロッパ語族スラヴ語派に属し、ロシア語、ウクライナ語とともに東スラヴグループを形成する。 東スラヴ語群に属しロシア語やウクライナ語に非常に近いが、ポーランド・リトアニア共和国内の地域であったことから本来は現在に比べ西スラヴ語であるポーランド語寄りの特徴を持っていた服部 2004, p. 136.

新しい!!: ISO/IEC 2022とベラルーシ語 · 続きを見る »

ベトナム語

'''ベトナム語''' ベトナム語(ベトナムご、)は、ベトナム社会主義共和国の総人口のおよそ 87% を占めるキン族の母語であり、ベトナムの公用語である。キン語や安南語ともいい、ベトナムの少数民族の間でも共通語として話されるほか、中国と台湾など周辺諸国のキン族/京族、アメリカ合衆国、フランスなど在外ベトナム系移民によっても話される。.

新しい!!: ISO/IEC 2022とベトナム語 · 続きを見る »

制御文字

ンピューティングと電気通信において、制御文字(せいぎょもじ、control character)とは、文字コードの規格で定義される文字のうち、ディスプレイ・プリンター・通信装置などに対して、特別な動作(制御)をさせるために使う文字である。制御キャラクタともいい、情報処理用語規格では「制御機能文字」と呼ばれている。 「文字」という名前であるがディスプレイやプリンターには表示されない。そのため、非表示文字(ひひょうじもじ、non-printing character、印字不可文字)とも言う。それに対し、制御文字以外の表示可能な文字を図形文字(graphic character)という。図形文字と制御文字は電気信号上は区別がなく、同じデータストリーム上に現われる。これをという。 制御文字にどのような文字コードを割り当てるかは、ASCII、EBCDICなどの文字コード体系により異なる。ASCIIでは0から31および127が制御文字に割り当てられている(技術的にはこれをという)。ISO 8859で定義される拡張ASCIIでは、これに128から159までの制御文字を追加した。これはと呼ばれる。 これらの65個の制御文字はUnicodeに引き継がれた。Unicodeではさらに制御文字を追加しているが、これはゼロ幅非接合子のようなフォーマット用文字とは区別される。 EBCDICには、ASCIIの65個の制御文字全てのほか、主としてIBMの周辺機器を制御するための追加の制御文字が含まれている。.

新しい!!: ISO/IEC 2022と制御文字 · 続きを見る »

アラビア語

アラビア語(アラビアご、اللغة العربية, UNGEGN式:al-lughatu l-ʻarabīyah, アッ.

新しい!!: ISO/IEC 2022とアラビア語 · 続きを見る »

アラビア文字

アラビア文字(アラビアもじ)は、アラビア語をはじめ、世界中のイスラム文化圏に属する諸言語を記述するのに使われる文字。ラテン文字、漢字に次いで、世界で三番目に使用者数が多い文字体系である。.

新しい!!: ISO/IEC 2022とアラビア文字 · 続きを見る »

アルメニア文字

アルメニア文字で記されたマルコによる福音書(4章40節から5章7節、9世紀) アルメニア文字(アルメニアもじ)は、アルメニア語の表記に用いられる文字である。38文字(加えて、合字が2つ)から成り、大文字と小文字がある。書記順序はラテン文字と同じく横書きで、左から右に向けて順次書いていく。.

新しい!!: ISO/IEC 2022とアルメニア文字 · 続きを見る »

インド

インドは、南アジアに位置し、インド洋の大半とインド亜大陸を領有する連邦共和制国家である。ヒンディー語の正式名称भारत गणराज्य(ラテン文字転写: Bhārat Gaṇarājya、バーラト・ガナラージヤ、Republic of India)を日本語訳したインド共和国とも呼ばれる。 西から時計回りにパキスタン、中華人民共和国、ネパール、ブータン、バングラデシュ、ミャンマー、スリランカ、モルディブ、インドネシアに接しており、アラビア海とベンガル湾の二つの海湾に挟まれて、国内にガンジス川が流れている。首都はニューデリー、最大都市はムンバイ。 1947年にイギリスから独立。インダス文明に遡る古い歴史、世界第二位の人口を持つ。国花は蓮、国樹は印度菩提樹、国獣はベンガルトラ、国鳥はインドクジャク、国の遺産動物はインドゾウである。.

新しい!!: ISO/IEC 2022とインド · 続きを見る »

ウルドゥー語

ウルドゥー語()は、インド・ヨーロッパ語族インド語派に属する言語の一つ。ヒンディー語とともに、ヒンドゥスターニー語の標準のひとつをなす。.

新しい!!: ISO/IEC 2022とウルドゥー語 · 続きを見る »

ウクライナ語

ウクライナ語( )は、インド・ヨーロッパ語族のスラヴ語派の東スラヴ語群に属し、キリル文字を使用する言語である。ウクライナの公用語である。ウクライナ国外においても、諸外国に住むウクライナ人によって使用されている。本国での話者人口は3680万人。本国以外に、ロシア、ベラルーシ、カザフスタン、ポーランド、カナダやアメリカ合衆国などの南北アメリカ、オーストラリアなどにも話者がおり、それらを合計すれば約4500万人になる。スラヴ語派においてはロシア語、ポーランド語に次いで第3位の話者人口である。11月9日はウクライナ語の記念日となっている。.

新しい!!: ISO/IEC 2022とウクライナ語 · 続きを見る »

エスペラント

ペラント (Esperanto) とは、ルドヴィコ・ザメンホフとその弟子(協力者)が考案・整備した人工言語。母語の異なる人々の間での意思伝達を目的とする、国際補助語としては最も世界的に認知され、普及の成果を収めた言語となっている。.

新しい!!: ISO/IEC 2022とエスペラント · 続きを見る »

エスケープシーケンス

ープシーケンス (escape sequence) とは、コンピュータシステムにおいて、通常の文字列では表せない特殊な文字や機能を、規定された特別な文字の並びにより表したもの。.

新しい!!: ISO/IEC 2022とエスケープシーケンス · 続きを見る »

カシミール語

ミール語 (Kashmiri, कॉशुर) は、主にインドのジャンムー・カシミール州西部で話されている言語である。パキスタンにも少数の話者がいる。インド・アーリア語派のダルド語群に属し、この語群の中ではもっともよく知られた言語である。話者の人口は約558万人(2001年)。 インド憲法の第8付則に定められた22の指定言語のひとつである。スリナガル一帯で話される方言が標準的と考えられている。ただし、ジャンムー・カシミール州の公用語はウルドゥー語である。 インド語派の大部分の言語の語順が SOV であるのに対し、カシミール語はドイツ語と同様のV2語順を取る。 カシミール地方は、14世紀以降イスラム国家の支配を受け、イスラム化が進んだ。1907年まではペルシア語が公用語であり、それ以降はペルシア語の影響を強く受けたウルドゥー語が公用語になった。このため、カシミール語はペルシア語の強い影響を受けている。.

新しい!!: ISO/IEC 2022とカシミール語 · 続きを見る »

キリル文字

リル文字(キリルもじ、Кириллица、Cyrillic alphabet、キリール文字とも)は、主にスラヴ諸語を表記するのに用いられる表音文字の体系の一種である。日本等では特にロシア語の文字として知られ、ロシア語で使う 33 文字(大文字小文字を同一視して)は、ロシア文字とも呼ばれる。しかし、キリル文字はブルガリア語やセルビア語をはじめとする多くの言語で使用されており、文字もそれぞれ微妙に異なる。そして、キリル文字発祥の地はブルガリアであるとされるため、キリル文字の総称としてロシア文字と呼ぶのは不適当である。.

新しい!!: ISO/IEC 2022とキリル文字 · 続きを見る »

ギリシア語

リシア語(ギリシアご、現代ギリシア語: Ελληνικά, または Ελληνική γλώσσα )はインド・ヨーロッパ語族ヘレニック語派(ギリシア語派)に属する言語。単独でヘレニック語派(ギリシア語派)を形成する。ギリシア共和国やキプロス共和国、イスタンブールのギリシア人居住区などで使用されており、話者は約1200万人。また、ラテン語とともに学名や専門用語にも使用されている。省略形は希語。.

新しい!!: ISO/IEC 2022とギリシア語 · 続きを見る »

ギリシア文字

リシア文字(ギリシアもじ)とは、ギリシア語を書き表すために用いられる文字である。現代ギリシア語では24文字からなる。.

新しい!!: ISO/IEC 2022とギリシア文字 · 続きを見る »

コードページ

ードページとは、特定の符号化文字集合を指定するための数字、またはその数字で指定された符号化文字集合、あるいはそのような方法で符号化文字集合を指定するためのシステムのことである。cpと表示されることもある。それぞれの符号化文字集合は「コードページ○○(○○は2桁から5桁の数字)」という形で管理される。 コードページという用語は、システムベンダ各社が管理している符号化文字集合を指す時にしか用いられず、ISO等の公的な規格の文字集合を「コードページ○○」などということはない。IBMおよび、マイクロソフトは各自、コードページを定めて管理している。マイクロソフトのコードページ群はMS-DOSやWindowsなどで利用されている。IBMのコードページはSystem iやDB2等の文字データ表現体系(CDRA: "Character Data Representation Architecture")をサポートするIBMシステムで利用されている。.

新しい!!: ISO/IEC 2022とコードページ · 続きを見る »

シンド語

ンド語(シンドご、سنڌي、सिन्धी.、Sindhi language)は、パキスタンのシンド州の公用語。シンディー語、スィンディー語とも呼ばれる。パキスタンに1850万人、インドに280万人の話者がいる。インド国内での話者数はそれほど多くないが、1967年にインド憲法の第8付則に定められた指定言語に加えられた。パキスタンのシンド語話者のほとんどはシンド州にすんでいる。1947年にインドとパキスタンが英領植民地から分離独立した際にシンド州はパキスタン側に属する事となり、この土地に住む人々の一部(多くがヒンドゥー教徒)がインドをはじめとする外国に移住したため、世界各地にシンド語話者のコミュニティーが点在している。 パキスタンの南東部シンド州には、シンド語を母語として話すものが多く、初等学校では必修科目として教えられている。シンド語の語彙は非常に豊富なため多くの作家がこの言語を用い、シンド語の文学や詩が多く残っている。.

新しい!!: ISO/IEC 2022とシンド語 · 続きを見る »

スロバキア語

バキア語(、) またはスロヴァキア語は、スロバキア人の典型的母語であり、スロバキア共和国の公用語である。インド・ヨーロッパ語族、スラヴ語派に属する。スラヴ語派ではチェコ語、ポーランド語などと同様西スラヴ語群に属し、とりわけチェコ語には近く、チェコ語の話者とスロヴァキア語の話者とが互いの言語で会話が成立する程である。言語コードはISO 639-1はsk, ISO 639-2は SLO/SLK.

新しい!!: ISO/IEC 2022とスロバキア語 · 続きを見る »

タミル文字

タミル文字(タミルもじ)は、主にタミル語を表記するために使われる文字である。 現行のタミル文字は、紀元4〜5世紀に北インドで用いられたブラーフミー文字をその源とする。また同様に南インドでサンスクリットを表記するため歴史的に用いられてきたグランタ文字と並行的に発展進化してきたという経緯があり、両者には非常に多くの共通点がある。 しかしサンスクリットおよび現代ヒンディー語、マラーティー語、ネパール語等を表記するデーヴァナーガリー文字や、グルムキー文字、ベンガル文字、グジャラーティー文字、オリヤー文字といった、同じブラーフミー文字を起源とする北インド系の各文字とは大きく異なった印象を受ける。また同じ南インドのテルグ文字、カンナダ文字、マラヤーラム文字などよりも北方の影響が少なく、最も南方的純粋さを残す文字と言えるであろう。また地域的に近いスリランカのシンハラ文字とも、かなり形態を異にしている。 現代タミル語には12の母音字、18の子音字に加えて6の外来語用の子音字がある。ただし子音字とその発音は、必ずしも一対一対応している訳ではない。子音字が随伴母音 (通常は/a/の音価) を伴った音節として読まれるアブギダである。子音字に11種の母音符号を付加することで、随伴母音以外の母音を伴う音節を表すのが基本だが、組み合わせによって特殊な形になる場合もある。また母音を伴わない子音は子音字の上に付点を打って表現する。 文は左から右へと書かれ、各文字はデーヴァナーガリーのように頭線で繋がったりはせず個々独立する。また単語と単語の間には空白が取られるなどの点は、ラテン文字(ただし音素文字ではないが)と変わらない。.

新しい!!: ISO/IEC 2022とタミル文字 · 続きを見る »

タイ文字

タイ文字は主にタイ語を表記する表音文字。シャム文字とも呼ばれる。.

新しい!!: ISO/IEC 2022とタイ文字 · 続きを見る »

タジク語

タジク語またはタジク・ペルシア語は、主にタジキスタン共和国とウズベキスタンのタジク人が母語としている言語で、タジキスタン共和国の公用語。系統的にはインド・ヨーロッパ語族イラン語派に属し、アフガニスタンのダリー語、イランのペルシア語とともに、新ペルシア語を基盤とする言語である。 歴史的には「ペルシア語」(ファールシー)と呼ばれていた言語であり、「タジク語」という名称は当時のソ連国内のペルシア語を指す呼称として1920年代に作られたものである。標準語はサマルカンド、ブハラ地方の方言(ドゥシャンベの北西部もこの方言圏に含まれる)に基づいている。 話者はタジキスタンを中心に、ウズベキスタン、キルギスなどに分布する。話者の総数は約850~1000万人。その大半が旧ソビエト連邦圏内に暮らす。タジキスタンでは人口の約80%がタジク語を母語とする。タジキスタンの他にはウズベキスタンに約933,560人(ただし、ウズベキスタンのタジク語人口は政治的に非常に少なく見積もられており、実際のタジク語話者はこれよりはるかに多いとされる)、キルギスに33,518人、カザフスタンに25,514人。 アフガニスタンのタジク人の言語はダリー語と呼ばれている。ダリー語とタジク語はともにペルシア語の東部方言に属しており、西部方言に属するイランのペルシア語と比べて古い時代のペルシア語の発音を留めている(ただし、ダリー語のほうがより古風である)。ペルシア語(タジク語、ダリー語、イラン・ペルシア語)はいずれもアラビア語の語彙を多く含んでいるが、タジク語にはロシア語及びウズベク語などのテュルク諸語の語彙が多く含まれ、構文にもウズベク語の影響が見られる。一方、ダリー語はパシュトー語の語彙も多く含み、英語やヒンドゥスターニー語からも語彙を取り入れている。イラン・ペルシア語は、近代に取り入れた語彙はフランス語からのものが多い。書き言葉としてのペルシア語はどの地域でも通用するが、話し言葉による地方の方言の格差は、イントネーションと発音に大きな違いが見られる。 中国のタジク族の言語(サリコル語、ワクヒ語)も「タジク語」と総称されているが、これらは東イラン語群に属するパミール語系の言語であり、西イラン語群に属するペルシア語(本稿のタジク語)とは別の系統に属する。.

新しい!!: ISO/IEC 2022とタジク語 · 続きを見る »

図形文字

図形文字(ずけいもじ、graphic character)とは、文字コード規格で定められた符号化文字のうち、一般的に使われる意味での文字にほぼ相当するものをいう。「図形キャラクタ」と表記されることもある。「印刷可能な文字(printable characters)」や「表示可能な文字」も同じものを表している。.

新しい!!: ISO/IEC 2022と図形文字 · 続きを見る »

国際化と地域化

情報処理における国際化と地域化(こくさいか と ちいきか)は、ソフトウェアを開発した環境とは異なる環境、特に外国や異文化に適合させる手段である。 国際化(internationalization internationalisation、i18n) は、ソフトウェアに技術的な変更を加えることなく多様な言語や地域に適合できるようにする、ソフトウェア設計の工程である。 地域化(localization localisation、L10N)は、地域固有の構成部品や翻訳テキストを追加することによって、ソフトウェアを特定の地域や言語に適合させる工程である。 かつては、ソフトウェアの地域化や多言語化のために必要に応じて技術的な変更が行われてきた。しかし、このようなやり方ではソフトウェアの規模拡大や対応する言語が多くなるに従い、開発や保守に多くの時間と費用がかかるため対応が難しい。1990年代にプログラミング言語やオペレーティングシステムの国際化対応が標準化されると、ソフトウェアを予め国際化することにより、地域固有データの追加や最小限の変更で地域化が行われるようになった。 両者の概念は時々集合的にグローバライゼーション (globalization、G11N) と呼ばれる。ただし、この言葉はソフトウェア工学の範囲を越えて社会的な国際化の意味で使われることも多い。.

新しい!!: ISO/IEC 2022と国際化と地域化 · 続きを見る »

国際標準化機構

国際標準化機構(こくさいひょうじゅんかきこう、International Organization for Standardization)、略称 ISO(アイエスオー、イソ、アイソ)は、各国の国家標準化団体で構成される非政府組織である。 スイス・ジュネーヴに本部を置く、スイス民法による非営利法人である。1947年2月23日に設立された。国際的な標準である国際規格(IS: international standard)を策定している。 国際連合経済社会理事会に総合協議資格(general consultative status)を有する機関に認定された最初の組織の1つである。.

新しい!!: ISO/IEC 2022と国際標準化機構 · 続きを見る »

Big5

Big5(ビッグファイブ、中国語名:大五碼あるいは五大碼)は、繁体字中国語の文字コード(文字集合)で、台湾・香港・マカオといった繁体字圏で最も一般的に使われている。.

新しい!!: ISO/IEC 2022とBig5 · 続きを見る »

CJKV

CJKV は、中国語・日本語・朝鮮語・ベトナム語 (Chinese-Japanese-Korean-Vietnamese) の略。特に、その四言語で共通して使われる、または使われていた文字体系である漢字(チュノムを含む)のこと。ソフトウェアの国際化、中でも文字コードに関する分野で用いられる。 比較的早くに漢字を廃止し、漢字に含めるべきか諸説あるチュノムを擁するベトナム語を除いた中国語、日本語、朝鮮語の頭文字だけをとって CJK と呼ぶこともある。主な東アジアの書記系を総称するときに用いられる。用語の使用頻度は CJKV より CJK のほうが多いが、CJK と言いながら実際は CJKV について述べていることも多い。.

新しい!!: ISO/IEC 2022とCJKV · 続きを見る »

CNS 11643

CNS 11643は、中華民国(台湾)の文字コード(文字集合)の規格。 1983年にまず試用版が発行され、2年間の試用期間を経た後に漢字の重複や排列順序の間違いを正し、1986年に最初の正式版が発行された。約13000字をISO/IEC 2022に適合するよう94×94文字集合2個に編成し、それぞれ第一字面・第二字面と呼ぶ。この他、初期には第十四字面があったが廃止され、後に第三~第七字面と第十五字面が追加された。符号空間としては第十六字面まで想定されている。 CNS 11643をEUCで符号化したものを、繁体字中国語EUC (EUC-TW) という。 公的規格であり、体系としてはBig5より整っているが、正式版が発行された時点ではBig5がすでに広く普及していたこと、文字集合を複数の字面に分割したことから1文字が2バイトに収まらない場合があること、重複や排列を正したために試用版をベースとしたBig5との変換が単純な計算でできないことなどの理由により、.

新しい!!: ISO/IEC 2022とCNS 11643 · 続きを見る »

米国国家規格協会

米国国家規格協会(べいこくこっかきかくきょうかい、)は、アメリカ合衆国の国内における工業分野の標準化組織であり、公の合意形成のためにさまざまな規格開発を担っている。 略称はANSI(アンシ、アンジ、アンシー)。訳は米国国家標準協会とも。また、元は旧称 (ASA) の訳だった米国規格協会・米国標準協会とも呼ばれる。本部はワシントンD.C.にあるが、事務局はニューヨークにある。 電子工業会 (EIA)、電気通信工業会 (TIA) などの国内規格作成団体による仕様を承認し、ANSI規格とする。 ANSI規格は、日本の日本工業規格 (JIS) に相当するとされる。ただし、政府(大臣)が制定する規格であるJISと違い、ANSI規格を制定するのは政府から独立した私的な非営利組織のANSIである。 国際標準化機構 (ISO) 設立メンバーであり、ISO、国際電気標準会議 (IEC)、国際認定フォーラム (IAF) にアメリカ代表として参加している。アメリカの国内規格機関ではあるが、ISO等の規格に先だって決まることも多く、ANSI規格がISO規格になることも多い。また、製造業における国際標準化団体としてIPC (エレクトロニクス)があるが、ANSIの標準開発組織として正式に認可されている。ASCIIの文字コード規格 (X.34) が、ISO646になるなどの例がある。.

新しい!!: ISO/IEC 2022と米国国家規格協会 · 続きを見る »

結合文字

結合文字(けつごうもじ、combining character)とは、文字コードにおいて先行する文字と組み合わせるための図形文字をいう。ダイアクリティカルマークや、仮名の結合可能な濁点・半濁点、ヘブライ文字のニクダー、アラビア文字のシャクル、ブラーフミー系文字の母音記号などが結合文字に属する。異体字セレクタも結合文字の一種である。.

新しい!!: ISO/IEC 2022と結合文字 · 続きを見る »

片仮名

片仮名(かたかな)とは、日本語の表記に用いられる音節文字のこと。仮名の一種で、借字を起源として成立した。.

新しい!!: ISO/IEC 2022と片仮名 · 続きを見る »

Ecmaインターナショナル

Ecmaインターナショナル(エクマ・インターナショナル、Ecma International)は情報通信システムの分野における国際的な標準化団体。以前は欧州電子計算機工業会という名称であったが、1994年にその国際的な立場を反映してこの名称に改められた。この名称はもはや略語ではなく、大文字にせずに「Ecma International」と表記する。 1961年にヨーロッパにおける計算機システムを標準化するために設立された。本部はジュネーヴにある。.

新しい!!: ISO/IEC 2022とEcmaインターナショナル · 続きを見る »

EUC-JP

EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつである。UNIX以外のOS上で使われることもある。 1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。 EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。 日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPやShift_JISと異なり制御文字SS2(シングルシフトツー、0x8E)に続けて現れるので都合2バイト、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので都合3バイトを要する。 JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。 UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年ではUTF-8を使用したシステムも普及している。.

新しい!!: ISO/IEC 2022とEUC-JP · 続きを見る »

Extended Unix Code

Extended Unix Code(EUC)は、UNIX上で使われてきた文字コードの符号化方式である。.

新しい!!: ISO/IEC 2022とExtended Unix Code · 続きを見る »

言語

この記事では言語(げんご)、特に自然言語について述べる。.

新しい!!: ISO/IEC 2022と言語 · 続きを見る »

電子メール

電子メール(でんしメール、英: Electronic mail、E-mail、Eメール)は、コンピュータネットワークを使用して、郵便のように情報等を交換する手段である。電子郵便(でんしゆうびん)とも言う。.

新しい!!: ISO/IEC 2022と電子メール · 続きを見る »

GB 2312

GB 2312-80(あるいはGB 2312-1980)は、中華人民共和国の国家規格として定められた簡体字中国語の符号化文字集合(いわゆる文字コード)で、主に中国大陸などで使われる。規格名は《信息交换用汉字编码字符集・基本集》という。GB0とも呼ばれ、GBコードといったときには、多くの場合この規格を指す。漢字を含む文字集合規格の基本となっていることや構造など、日本のJIS X 0208と共通点が多い。.

新しい!!: ISO/IEC 2022とGB 2312 · 続きを見る »

Internet Assigned Numbers Authority

Internet Assigned Numbers Authority(IANA、アイアナ)とはインターネットに関連する番号を管理する組織である。IPアドレス・ドメイン名・ポート番号等の標準化・割り当て・管理などを行う。アメリカの南カリフォルニア大学のISI(Information Sciences Institute)にある。 ジョン・ポステルが中心となって始めた組織。運営費用の一部がアメリカ政府により援助されていたが国際的な機関となるために1999年、ICANNの援助によって活動する組織に変更された。現在、ICANNの下部組織。 XML宣言に記述するエンコーディングの名前は、IANAに登録されたキャラクタセット名が使用される。.

新しい!!: ISO/IEC 2022とInternet Assigned Numbers Authority · 続きを見る »

ISCII

ISCII (Indian Script Code for Information Interchange सूचना अन्तरविनिमय के लिए भारतीय लिपि संहिता、情報交換用インド文字符号 IS13194:1991) はインドの各種書記系を表現するための符号化方式である。主要なインド系文字とローマ字転写を符号化する。対応している用字系は以下の通り: アッサム文字、ベンガル文字、デーヴァナーガリー、グジャラーティー文字、グルムキー文字、カンナダ文字、マラヤーラム文字、オリヤー文字、タミル文字、およびテルグ文字。ISCIIはアラビア文字に基づく書記系を符号化しないが、それにもかかわらず、カシミール語、シンド語、ウルドゥー語、ペルシア語、パシュトー語およびアラビア語の書記系切り替え符号が提供されている。アラビア文字に基づく書記系は、その後PASCII文字コードで符号化された。 ブラーフミー文字から派生した書記系はそのほとんどが類似した構造を持つが、文字の形状が異なるため、ISCIIは同じ音価の文字を同じ符号位置に符号化して、各種の用字系を重ね合わせている。たとえば、ISCII符号0xB3 0xDBはを表す。これはデーヴァナーガリーではのように、グルムキー文字ではのように、そしてタミル文字ではのように描画される。書記系はリッチテキストではマークアップによって選択され、プレーンテキストでは後述のATRを用いて選択される。 単一の符号化を使用する動機の1つは、ある書記系から他のものへの翻字が容易になることである。しかしながら、あまりに非互換性が大きいためこれは実際には現実的な考えではない。を参照。 ISCIIは固定長の8ビット符号である。下位128個の符号位置はASCIIそのままで、上位128個の符号位置がISCII特有である。 ISCIIではデフォルトで使われる「デフォルト書記系」を指定する手段は提供されていない。.

新しい!!: ISO/IEC 2022とISCII · 続きを見る »

ISO-2022-JP

ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする (アナウンス機能のエスケープシーケンスは省略される)。俗に「JISコード」と呼ばれることもある。.

新しい!!: ISO/IEC 2022とISO-2022-JP · 続きを見る »

ISO/IEC 646

ISO/IEC 646は7ビットの文字コードを規定する国際標準化機構 (ISO) 標準であり、これを元に各国語版の文字コードが規定される。 アメリカの規格であるASCIIを国際化した体裁となっている。ラテンアルファベット(ISO基本ラテンアルファベット)と数字を中心とした共通部分と、ASCIIでは記号となっている各国規格で自由に割り当てられる部分に分かれており、ヨーロッパ各国ではこの部分にダイアクリティカルマークつき文字を割り当てることにより自国語の文章を符号化できるようになっている。 現在ではヨーロッパでは8ビットコードであるISO/IEC 8859が主流となっており、この規格はあまり使われていない。なお、UnicodeのISO規格であるISO/IEC 10646の規格番号は、この規格の番号にちょうど10000を加えた値となっている。.

新しい!!: ISO/IEC 2022とISO/IEC 646 · 続きを見る »

ISO/IEC 8859

ISO 8859(より正式にはISO/IEC 8859)はコンピュータでの利用を目的とした8ビット文字コードの標準である。ISOとIECが合同で定めた。この標準は複数の部(英: part)に分かれており、それぞれがISO/IEC 8859-1、ISO/IEC 8859-2などのように番号付きで出版されている。それぞれの部自体を、非公式に標準として参照することがある。2009年現在、15の部(破棄されたISO/IEC 8859-12標準を除く)が存在する。.

新しい!!: ISO/IEC 2022とISO/IEC 8859 · 続きを見る »

ISO/IEC 8859-1

ISO 8859-1(より正式にはISO/IEC 8859-1)はISO/IEC 8859の第一部であり、ラテンアルファベットの文字コード標準である。よりくだけた言い方ではLatin-1と呼ばれる。最初はISOによって開発されたが、後にISOとIECによって合同で保守されている。この標準に追加の文字を(16進符号0x00-0x1Fの「C0領域」と、0x80-0x9F「C1領域」の範囲に)割り当てたものは、2つの広く使われているキャラクタセットの基となる。ISO-8859-1(余分なハイフンに注意)とWindows-1252と呼ばれるものである。 2004年6月、8ビット符号化文字集合の整備を担当するISO/IECの作業部会は、国際符号化文字集合 (UCS) とUnicodeの開発に専念するために解散し、ISO 8859-1を含むすべてのISO 8859の整備を中止した。コンピュータアプリケーションにおいては、(UTF-8やUTF-16のような)完全なUCSサポートを提供するエンコーディングが、ISO 8859-1に基づくエンコーディングよりもますます多く使われるようになりつつある。.

新しい!!: ISO/IEC 2022とISO/IEC 8859-1 · 続きを見る »

ISO/IEC 8859-11

ISO 8859-11は8ビットの文字コードで、ISO 8859標準の一部である。タイ語で使われる文字をカバーする。1999年にISO 8859標準へ追加された。タイの国家標準TIS-620 (1990年) とほとんど同じであり、ISO 8859-11は16進値 A0 にノーブレークスペースを定義しているのに対し、TIS-620は未定義のまま残しているという点のみが違う (現実には、この小さな違いは通常無視される)。 ISO-8859-11はISO 8859シリーズに基づくIANAキャラクタセットの通常のパターンに従っているが、登録されたIANAキャラクタセット名ではない。しかしながら、同等に近いTIS-620 (ノーブレークスペースが欠けている) がIANAにより登録されている。 マイクロソフトのWindowsコードページ874もタイ語版のApple Macintoshで使われるコードページもTIS-620の拡張である — しかしながら、互いに互換性はない。 ISO 8859の他の全種類と同様、下位128の符号はASCIIと等価である。追加の文字はUnicodeにも同じ順序で登録されており、A1からU+0E01へ (以下同様) シフトしているだけである。.

新しい!!: ISO/IEC 2022とISO/IEC 8859-11 · 続きを見る »

ISO/IEC 8859-6

ISO/IEC 8859-6:1999 ISO 8859の第6部であり、ラテン文字とアラビア文字用の文字コードの標準である。1987年に初版が制定された。アラビア語以外の、ペルシャ語やウルドゥー語用の文字は含まれておらず、実質アラビア語以外の言語を記すことは出来ない。.

新しい!!: ISO/IEC 2022とISO/IEC 8859-6 · 続きを見る »

ITU-T

ITU-T(International Telecommunication Union Telecommunication Standardization Sector) は、国際電気通信連合の部門の一つで、通信分野の標準策定を担当する「電気通信標準化部門」。旧CCITT(Comite Consultatif International Telegraphique et Telephonique、国際電信電話諮問委員会)。 勧告という形が標準となる。4年に1回開催される世界電気通信標準化会議(World Telecommunication Standardization Assembly、WTSA)で活動が決められる。 以前はTSS、ITU-TSまたはITU-TSSとも言った。.

新しい!!: ISO/IEC 2022とITU-T · 続きを見る »

JIS X 0201

JIS X 0201は、日本工業規格 (JIS) の制定している文字コード規格で、初版は1969年6月1日の制定であり、現存のJISにおける最も古い文字コードである。規格名称は7ビット及び8ビットの情報交換用符号化文字集合。名称が示す通り、7ビット符号と8ビット符号での運用が予定されている。図形文字の集合を規定するための規格であり、JIS X 0211 (ISO/IEC 6429) で規定される制御文字集合と組み合わせて使用する。現在の規格番号は日本工業規格の部門X(情報処理)の新設に伴って1987年3月1日に変更されたもので、旧規格番号はJIS C 6220。俗称はANKコードで、'ANK'はこのコードの主要構成文字であるアルファベット (Alphabet)、数字 (Numerical digit)、片仮名 (Katakana) の頭文字より来ている。 JIS X 0201はラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合よりなっている。このうちラテン文字用図形文字集合はAmerican Standard Code for Information Interchange (ASCII) と同様ISO/IEC 646の版の1つとなっている。ASCIIと比較すると2文字が異なっており、92番の文字にバックスラッシュ ('') の替わりに円記号 ('¥') が、126番にチルダ ('~') の替わりにオーバーライン ('‾') が割り当てられている。片仮名用図形文字集合は片仮名と日本語用の約物よりなっており、最後の31文字分は未定義となっている。また、単独の濁点と半濁点のみ収録されており濁点付き片仮名と半濁点付き片仮名は収録されていない。 全体的な構造はJIS X 0202 (ISO/IEC 2022) に従った構造となっており、8ビット符号では16進で21から7Eにラテン文字を、A1からFEに片仮名を割り当てる。7ビット符号では21から7Eの領域を、SHIFT-INとSHIFT-OUTでラテン文字と片仮名を切り替えながら使用する。このとき、SO(0E)以降は片仮名、SI(0F)以降はラテン文字となる。 現在では主にShift_JISおよびEUC-JPの一部として用いられており、単独で用いられることはほとんどない。これらの文字コードは JIS X 0208の文字も含んでおり、JIS X 0208にはJIS X 0201にあるほぼすべての文字があるため文字が重複することとなる。この区別のため、JIS X 0201の文字をJIS X 0208の文字の半分の幅で表示することが多い。このため、これらの文字を俗に半角文字、特に片仮名を半角カナとよぶ事が多い。また、Shift_JISのアルファベット部分はASCIIとJIS X 0201との区別が曖昧なまま使われることが多いため、円記号とバックスラッシュの区別においてしばしば混乱が起きる。.

新しい!!: ISO/IEC 2022とJIS X 0201 · 続きを見る »

JIS X 0208

JIS X 0208(ジス X 0208)は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.

新しい!!: ISO/IEC 2022とJIS X 0208 · 続きを見る »

JIS X 0212

JIS X 0212(ジス X 0212)は、JIS X 0208:1983に含まれない文字を集めた、6067字の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「情報交換用漢字符号-補助漢字」である。1990年10月1日に制定され、JIS X 0208と組み合わせて利用される。JIS補助漢字の通称がある。.

新しい!!: ISO/IEC 2022とJIS X 0212 · 続きを見る »

JIS X 0213

JIS X 0213(ジス X 0213)はJIS X 0208:1997を拡張した、日本語用の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である。 2000年に制定、2004年、2012年に改正された。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。 JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。.

新しい!!: ISO/IEC 2022とJIS X 0213 · 続きを見る »

JUNET

JUNET(ジェイユゥネット、Japan University NETwork)は、1984年から1991年に存在した日本の学術組織を結んだ研究用のコンピュータネットワーク。今日インターネットと呼ばれているネットワークの日本における実質的な起源。.

新しい!!: ISO/IEC 2022とJUNET · 続きを見る »

KOI8

KOIは数種類のキリル文字用8ビット文字コード族で、KOI8、KOI 8およびKOI-8とも呼ばれる。名前はロシア語で "情報交換用符号" を意味するKod Obmena Informatsiey の略である。 文字コード族の構成員は以下の通り.

新しい!!: ISO/IEC 2022とKOI8 · 続きを見る »

KOI8-R

KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。 KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはWindows-1251である。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。 KOI8はロシア語で の略であり、「情報交換用符号、8ビット」という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、主に発音の対応するASCIIのラテン文字の符号位置の順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは一見して不自然に見えるが、8ビット目が欠落する文字化けに対処できるという利点がある。たとえば、KOI8-Rで表現した"" (ラテン文字転写例)は8ビット目を落とすと"rUSSKIJ tEKST"になる。大文字と小文字が逆になることで文字化けが発生したことが分かり、文字の発音も近いため、そのまま読めるか、少なくとも復元することはできる。また、これは正しいKOI-7として解釈できる。ASCII文字列"rUSSKIJ tEKST"をKOI-7(КОИ-7 Н1)として解釈すれば""である。一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。.

新しい!!: ISO/IEC 2022とKOI8-R · 続きを見る »

KOI8-U

KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはWindows-1251である。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、ASCIIのラテン文字と対応する符号位置に疑似ローマ字順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは不自然に見えるかもしれないが、8ビット目が落ちて文字化けしても、、大文字小文字を入れ替えた翻字をすることで通常のASCII端末上で文章をまだ読める (もしくは少なくとも解読できる) という役に立つ特性である。たとえば、KOI8-Uの "Русский Текст"(ルスキー・テクスト、ロシア語のテキストの意) は8ビット目を落とすと rUSSKIJ tEKSTになる。その一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。.

新しい!!: ISO/IEC 2022とKOI8-U · 続きを見る »

KS X 1001

KS X 1001は、韓国でハングルや漢字をあらわすのに用いられている文字コード(符号化文字集合)の規格。以前はKS C 5601といい、現在でもこの名称で呼ばれることが多い。単にKSコードとも呼ばれる。 現代韓国でUnicodeと並んで用いられるほぼ唯一の文字コードである。.

新しい!!: ISO/IEC 2022とKS X 1001 · 続きを見る »

Microsoft Windows

Microsoft Windows(マイクロソフト ウィンドウズ)は、マイクロソフトが開発・販売するオペレーティングシステム (OS) の製品群。グラフィカルユーザインタフェース (GUI)を採用している。.

新しい!!: ISO/IEC 2022とMicrosoft Windows · 続きを見る »

MS-DOS

MS-DOS(エムエス-ディーオーエス、エムエスドス)は、マイクロソフトが開発・販売していた、8086系マイクロプロセッサをCPUとする、IBM PCおよびそれに似た構成の(たとえばPC-98など)パーソナルコンピュータ向けのオペレーティングシステム(OS)である。IBMへのOEM供給品であった PC DOS (IBM DOS)を自社製品として供給・販売したもので、バージョン6以降はPC DOSから完全に独立して開発された。.

新しい!!: ISO/IEC 2022とMS-DOS · 続きを見る »

Multipurpose Internet Mail Extensions

Multipurpose Internet Mail Extension(多目的インターネットメール拡張)は、規格上US-ASCIIのテキストしか使用できないインターネットの電子メールでさまざまなフォーマット(書式)を扱えるようにする規格である。通常はMIME(マイム)と略される。RFC 2045、RFC 2046、RFC 2047、RFC 4288、RFC 4289、RFC 2049 で規定されている。.

新しい!!: ISO/IEC 2022とMultipurpose Internet Mail Extensions · 続きを見る »

PASCII

PASCII は、文字コードに関するインドの国家規格のひとつで、ウルドゥー語、シンド語、カシミール語のためのアラビア文字による書記系の符号化を定めている。.

新しい!!: ISO/IEC 2022とPASCII · 続きを見る »

Request for Comments

Request for Comments(リクエスト フォー コメンツ、略称:RFC)はIETF(Internet Engineering Task Force)による技術仕様の保存、公開形式である。内容には特に制限はないが、プロトコルやファイルフォーマットが主に扱われる。RFCとは「コメント募集」を意味する英語の略語であり、もともとは技術仕様を公開し、それについての意見を広く募集してより良いものにしていく観点から始められたようである。全てのRFCはインターネット上で公開されており、誰でも閲覧することができる。.

新しい!!: ISO/IEC 2022とRequest for Comments · 続きを見る »

Shift JIS

Shift_JIS(シフトジス)は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、現在は標準化文書JIS X 0213の附属書1で規定されている(Shift JIS-2004)。「Shift_JIS」はIANAにおける登録名である 。 マイクロソフトなどの各ベンダーが実装するShift_JISの亜種については「Microsoftコードページ932」を参照。Mac OSが実装する亜種については「MacJapanese」を参照。.

新しい!!: ISO/IEC 2022とShift JIS · 続きを見る »

TIS-620

Thai Industrial Standard 620-2533 (タイ工業規格、通称TIS-620) はタイ語でもっともよく使われる文字集合および文字符号化方式である。この規格はタイ王国政府工業省の機関タイ工業規格協会 (Thai Industrial Standards Institute; TISI) によって発行され、タイ王国においてタイ語を符号化するための唯一の公的規格である。規格の記述的な名称は "Standard for Thai Character Codes for Computers" (รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์) である。"2533" は現在の規格が発行されたタイ暦2533年 (1990年) を指す。以前の版である TIS 620-2529 (1986年) は、廃止された。.

新しい!!: ISO/IEC 2022とTIS-620 · 続きを見る »

TSCII

TSCII (Tamil Script Code for Information Interchange、情報交換用タミル文字符号) はタミル文字を表現するための符号化方式である。下位128個の符号位置は純粋なASCIIで、上位128個の符号位置はTSCII特有である。インターネットでは長い間私的な合意にのみ基づいて使われていたが、2007年にIANAへの登録に成功した。 TSCIIはタミル文字タイプライタを使うときと同様、文字を視覚的な (書かれる) 順序で符号化する。 UnicodeはISCIIに従い、タミル文字の符号化戦略に論理順序を使ってきた。これはTIS-620が採用していた視覚順序の符号化を引き継いだタイ文字の場合とは対照的である。 タミル・ナードゥ州政府は8ビット文字コードとその他のために独自のTAB/TAM規格を推進しているが、他の符号化方式もまだWWW上に見られる。 フリーな電子テキストの収集計画であるはTSCII符号化を使っているが、すでにUnicode版の提供を開始した。.

新しい!!: ISO/IEC 2022とTSCII · 続きを見る »

UNIX

UNIX (ユニックス、Unix、)は、コンピュータ用のマルチタスク・マルチユーザーのオペレーティングシステムの一種である。公式な商標は「UNIX」だが、商標以外の意味として「Unix」、またはスモールキャピタルを使用して「Unix」などとも書かれる。Unixは1969年、AT&Tのベル研究所にて、ケン・トンプソン、デニス・リッチーらが開発を開始した。 当初はアセンブリ言語のみで開発されたが、1973年にほぼ全体をC言語で書き直した。このため、Unixは歴史上、初めて高水準言語で書かれたOSであると言われる。 1973年の段階ではPDP-11に依存したコードが多く、移植性は低かったが、その後徐々にPDP-11に依存したコードを減少させ、1978年にInterdata 8/32への移植に成功して以降、徐々に他のプラットフォームにも移植されていった。 現在では「Unix」という語は、Unix標準に準拠するあらゆるオペレーティングシステムの総称でもある。現在ではUnixシステムは多数の系統に分かれており、AT&Tの開発停止後も、多数の商用ベンダーや非営利組織などによって開発が続けられている。 1970年代から1980年代の初期にかけて、Unixは大学や研究所などの教育機関で広範囲に採用され、特にカリフォルニア大学バークレー校をオリジナルとするBSD系統が誕生した。また Version 7 Unix や UNIX System V の特徴を持つオペレーティングシステムは「伝統的なUNIX」(traditional Unix)とも呼ばれる。 2007年に、「UNIX」の商標の所有者である標準化団体のThe Open Groupは、Single UNIX Specificationを完全に満たすと認証を受けたシステムのみが「UNIX」の商標を得られるとした。このためそれ以外のシステムは(ずっと以前から、AT&T版およびBSD以外を指して使われていた用語だが)「Unixシステムライク」または「Unixライク(Unix系)」と呼ばれるようになった。ただし The Open Groupはその呼称を気に入っていない。 現在では多く使われているUnixとしてはmacOS、AIX、HP-UX、Solarisなどがある(いずれも商用)。また認証を受けていないUnix系としてはLinux(派生OSにAndroid他)やMINIX、BSDの派生OS(FreeBSD、NetBSD、OpenBSD、DragonFly BSDなど)がある。.

新しい!!: ISO/IEC 2022とUNIX · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

新しい!!: ISO/IEC 2022とUTF-8 · 続きを見る »

VISCII

Vietnamese Standard Code for Information Interchange (情報交換用ベトナム語標準符号、VISCII) はベトナム語アルファベット、約物、およびその他の書記素からなる文字コードである。ベトナム語は伝統的な拡張ASCII文字コードを作るには多少多い (134文字) 文字とダイアクリティカルマークの組み合わせを必要とする。この解決策は本質的に3通り存在する。.

新しい!!: ISO/IEC 2022とVISCII · 続きを見る »

X Window System

GNOME 2.28 KDE 4.x Xfce 4.6 X Window System(エックスウィンドウシステム、別称:「X11」・「X」など→名称については後述)とは、ビットマップディスプレイ上でウィンドウシステムを提供する表示プロトコルである。リファレンス実装として X.Org Server があり、標準ツールキットとプロトコルを提供し、Unix系オペレーティングシステム (OS) やOpenVMSなどでのグラフィカルユーザインタフェース (GUI) を構築するのに使われる。他の多くの汎用OSにも移植されている。.

新しい!!: ISO/IEC 2022とX Window System · 続きを見る »

東アジア

東アジア(ひがしアジア)は、ユーラシア大陸の東部にあたるアジア地域の一部を指す地理学的な名称である。北西からモンゴル高原、中国大陸、朝鮮半島、台湾列島、琉球諸島、日本列島などを含む。北東アジア(東北アジア)、極東、東亜などと呼ぶ場合もある。.

新しい!!: ISO/IEC 2022と東アジア · 続きを見る »

漢字

漢字(かんじ)は、中国古代の黄河文明で発祥した表語文字。四大文明で使用された古代文字のうち、現用される唯一の文字体系である。また史上最も文字数が多い文字体系であり、その数は10万字を超え、他の文字体系を圧倒する。古代から周辺諸国家や地域に伝播して漢字文化圏を形成し、言語のみならず文化上の大きな影響を与えた。 現代では中国語、日本語、朝鮮語の記述に使われる。20世紀に入り、漢字文化圏内でも日本語と中国語以外は漢字表記をほとんど廃止したが、なお約15億人が使用し、約50億人が使うラテン文字についで、世界で2番目に使用者数が多い。.

新しい!!: ISO/IEC 2022と漢字 · 続きを見る »

朝鮮語

朝鮮語(ちょうせんご)または韓国語(かんこくご)は、主に朝鮮民族が使う言語で、朝鮮半島の大韓民国(韓国)、朝鮮民主主義人民共和国(北朝鮮)および中華人民共和国吉林省延辺朝鮮族自治州・長白朝鮮族自治県の公用語。 韓国での政府呼称は「韓国語」、北朝鮮での政府呼称は「朝鮮語」である。日本において「韓国語」は、専ら韓国の言語を指す呼称として用いられ、南北を区別しない呼称としては、言語学・音韻論など学術的にも、標準表記として「朝鮮語」が用いられるので、ここでは言語名を全て朝鮮語に統一して記述する。.

新しい!!: ISO/IEC 2022と朝鮮語 · 続きを見る »

最上位ビット

最上位ビット(さいじょういビット、most significant bitまたはhigh-order bit、MSBと略記)は、コンピュータにおいて二進数で最も大きな値を意味するビット位置のことである。MSBは左端ビットとも言われる。 二進数の特定のビットを示すために、各ビットにはゼロからn(その数値のビット数に依存)までのビット番号が割り当てられる。 従来、エンディアンによってゼロ番のビットがMSBに対応していたり、LSB(最下位ビット)に対応していたりしていたが、最近ではゼロ番はLSBとされていることが多い。(訳注:これが関係してくるのはビット番号を指定する形式のビット操作命令が存在する命令セットだけである。) 負の整数を2の補数で表すとMSBは必ず 1 になり、符号付正の整数では必ず 0 になるので、MSBは符号の判別に使われる。 これを拡張すると、MSBs(複数)はMSB側のいくつかのビットを意味する。 MSBが最上位バイトを意味する場合もある。この場合、MSB First はビックエンディアンを意味する。この曖昧さを回避するため、MSBit、MSByteと表記されることもある。.

新しい!!: ISO/IEC 2022と最上位ビット · 続きを見る »

情報処理学会

一般社団法人情報処理学会(じょうほうしょりがっかい、英称:Information Processing Society of Japan、略称:IPSJ)は、情報処理分野を取り扱っている学会である。日本学術会議協力学術研究団体。1960年に設立され、2010年7月1日に社団法人から一般社団法人へ移行した。.

新しい!!: ISO/IEC 2022と情報処理学会 · 続きを見る »

文字

文字(もじ)とは、言葉・言語を伝達し記録するために線や点を使って形作られた記号のこと。文字の起源は、多くの場合ものごとを簡略化して描いた絵文字(ピクトグラム)であり、それが転用されたり変形、簡略化されたりして文字となったと見られる。.

新しい!!: ISO/IEC 2022と文字 · 続きを見る »

文字化け

文字化け(もじばけ)とは、コンピュータで文字を表示する際に、正しく表示されない現象のこと。.

新しい!!: ISO/IEC 2022と文字化け · 続きを見る »

文字符号化方式

文字符号化方式(もじふごうかほうしき、character encoding scheme、CES)とは、符号化文字集合で文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換する符号化方式。 文字符号化体系、文字符号化スキーム (character coding scheme) とも言う。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 (encoding scheme) などとも言う。 この用語はUnicodeやIETFの標準などで用いているが、ISO/IECやJISの標準では用いず「符号化文字集合の構造」あるいは「'''文字符号の構造及び拡張法'''」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。.

新しい!!: ISO/IEC 2022と文字符号化方式 · 続きを見る »

文字集合

文字集合(もじしゅうごう、character set)は、文字(キャラクタ (コンピュータ))をその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.

新しい!!: ISO/IEC 2022と文字集合 · 続きを見る »

日本工業規格

鉱工業品用) 日本工業規格(にほんこうぎょうきかく、Japanese Industrial Standards)は、工業標準化法に基づき、日本工業標準調査会の答申を受けて、主務大臣が制定する工業標準であり、日本の国家標準の一つである。JIS(ジス)またはJIS規格(ジスきかく)と通称されている。JISのSは英語 Standards の頭文字であって規格を意味するので、「JIS規格」という表現は冗長であり、これを誤りとする人もある。ただし、この表現は、日本工業標準調査会、日本規格協会およびNHKのサイトでも一部用いられている。.

新しい!!: ISO/IEC 2022と日本工業規格 · 続きを見る »

日本工業標準調査会

日本工業標準調査会(にほんこうぎょうひょうじゅんちょうさかい、英称:Japanese Industrial Standards Committee、略称:JISC)は、工業標準化法(昭和24年6月1日法律第185号)第3条第1項の規定により経済産業省に設置される審議会。.

新しい!!: ISO/IEC 2022と日本工業標準調査会 · 続きを見る »

日本語

日本語(にほんご、にっぽんご「にっぽんご」を見出し語に立てている国語辞典は日本国語大辞典など少数にとどまる。)は、主に日本国内や日本人同士の間で使用されている言語である。 日本は法令によって公用語を規定していないが、法令その他の公用文は全て日本語で記述され、各種法令において日本語を用いることが規定され、学校教育においては「国語」として学習を課されるなど、事実上、唯一の公用語となっている。 使用人口について正確な統計はないが、日本国内の人口、および日本国外に住む日本人や日系人、日本がかつて統治した地域の一部住民など、約1億3千万人以上と考えられている。統計によって前後する場合もあるが、この数は世界の母語話者数で上位10位以内に入る人数である。 日本で生まれ育ったほとんどの人は、日本語を母語とする多くの場合、外国籍であっても日本で生まれ育てば日本語が一番話しやすい。しかし日本語以外を母語として育つ場合もあり、また琉球語を日本語と別の言語とする立場を採る考え方などもあるため、一概に「全て」と言い切れるわけではない。。日本語の文法体系や音韻体系を反映する手話として日本語対応手話がある。 2017年4月現在、インターネット上の言語使用者数は、英語、中国語、スペイン語、アラビア語、ポルトガル語、マレー語に次いで7番目に多い。.

新しい!!: ISO/IEC 2022と日本語 · 続きを見る »

拡張ASCII

拡張ASCII(extended ASCII もしくは high ASCII)は、他のものに加えて標準の7ビットASCIIを含み、8ビットかそれより大きい文字コードを表す用語である。この用語の使用は批判されることがある。ASCII標準が128個より多くの文字を含むように更新されたとか、この用語は単一の符号化方式を曖昧さなしに識別するというような (どちらも真実ではない) 誤解を招きかねないためである。.

新しい!!: ISO/IEC 2022と拡張ASCII · 続きを見る »

1978年

記載なし。

新しい!!: ISO/IEC 2022と1978年 · 続きを見る »

1980年代

1980年代(せんきゅうひゃくはちじゅうねんだい)は、西暦(グレゴリオ暦)1980年から1989年までの10年間を指す十年紀。この項目では、国際的な視点に基づいた1980年代について記載する。.

新しい!!: ISO/IEC 2022と1980年代 · 続きを見る »

1983年

この項目では、国際的な視点に基づいた1983年について記載する。.

新しい!!: ISO/IEC 2022と1983年 · 続きを見る »

1990年

この項目では、国際的な視点に基づいた1990年について記載する。.

新しい!!: ISO/IEC 2022と1990年 · 続きを見る »

2000年

400年ぶりの世紀末閏年(20世紀および2千年紀最後の年)である100で割り切れるが、400でも割り切れる年であるため、閏年のままとなる(グレゴリオ暦の規定による)。。Y2Kと表記されることもある(“Year 2000 ”の略。“2000”を“2K ”で表す)。また、ミレニアムとも呼ばれる。 この項目では、国際的な視点に基づいた2000年について記載する。.

新しい!!: ISO/IEC 2022と2000年 · 続きを見る »

2004年

この項目では、国際的な視点に基づいた2004年について記載する。.

新しい!!: ISO/IEC 2022と2004年 · 続きを見る »

ここにリダイレクトされます:

ECMA-35ISO 2022ISO-2022ISO2022JIS C 6228JIS X 0202符号拡張法

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »