ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
無料
ブラウザよりも高速アクセス!
 

文字コード

索引 文字コード

文字コード(もじコード)とはコンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.

137 関係: A-VXACOS-2ACOS-4ACOS-6ARIB外字ASCII大漢和辞典外字字体富士通中国語三菱電機五十音今昔文字鏡仮名住民基本台帳ネットワークシステムミニコンピュータマルチバイト文字マイクロソフトバロースバイト (情報)メインフレームモールス符号プロプライエタリ・ソフトウェアパーソナルコンピュータテレックステキストディジタル・イクイップメント・コーポレーション和集合アルファベットアップル (企業)アドビシステムズインターネットインターネットアーキテクチャ委員会オペレーティングシステムオフィスコンピュータキャラクタ (コンピュータ)コンピュータコード会コードページシリアライズソフトウェアサン・マイクロシステムズ写像国際化と地域化国際電気標準会議国際標準化機構Baudot CodeBig5CID (文字コード)...CNS 11643CO-59筆まめEBCDICEUC-JIS-2004EUC-JPExtended Unix CodeExtensible Markup Language英語電子メールGB 18030GB 2312GBKIBMIBM漢字システムInternet Assigned Numbers AuthorityInternet Engineering Task ForceISO-2022-JPISO-2022-JP-2004ISO/IEC 10646ISO/IEC 2022ISO/IEC 646ISO/IEC 8859ISO/IEC 8859-1ISO/IEC 8859-11ISO/IEC 8859-15ISO/IEC 8859-5ISO/IEC 8859-6ISO/IEC 8859-7ITOSJavaJEF漢字コードJIPSJIS X 0201JIS X 0208JIS X 0212JIS X 0213JIS X 0221JTBKOI8-RKOI8-UKS X 1001MacJapaneseMacOSMELCOMMicrosoft WindowsMicrosoftコードページ932Multipurpose Internet Mail ExtensionsPOSIXPunycodeRubyShift JISShift JIS-2004System iSystem/360TIS-620TRIPSTRONコードU-PRESSUnicodeUNIVACUTF-16UTF-32UTF-7UTF-8UTF-EBCDICVAXVMSWindows-1252World Wide WebWorld Wide Web Consortium機種依存文字朝鮮語戸籍統一文字新潮文庫の100冊文字文字化け文字符号化方式文字集合日立製作所日本工業規格日本ユニシス日本アイ・ビー・エム日本語日本電気拡張漢字8ビット インデックスを展開 (87 もっと) »

A-VX

A-VXは、日本電気(NEC)のオフィスコンピュータ用オペレーティングシステム(OS)。大別して以下の3種類のものがある。.

新しい!!: 文字コードとA-VX · 続きを見る »

ACOS-2

ACOS-2(エイコスツー)は、日本電気のメインフレームおよびそのOSであるACOSの一系列である。.

新しい!!: 文字コードとACOS-2 · 続きを見る »

ACOS-4

ACOS-4(エイコスフォー)は、日本電気のメインフレームおよびそのOSであるACOSの一系列である。.

新しい!!: 文字コードとACOS-4 · 続きを見る »

ACOS-6

ACOS-6(エイコスシックス)は日本電気のメインフレーム及びOSであるACOSの一系列である。同社のメインフレーム事業草創期にハネウェル社から導入した技術が元となっている。ただし、元にしたハネウェルの技術の内訳には、ハネウェルがGEから買収したコンピュータ部門の所有していたものが多く含まれている(たとえば、GEのマシンを使用してMITの開発していたMulticsの技術の一部を含む)。 2003年現在の名称はACOS-6/NVX PX、対象となるハードウェアはパラレルACOS PX7900である。.

新しい!!: 文字コードとACOS-6 · 続きを見る »

ARIB外字

ARIB外字(アライブがいじ)は、社団法人電波産業会(ARIB)により、FM文字多重放送や、字幕放送などで使用する文字として、JIS X 0208以外に必要とされる文字を集めた外字文字集合である。ARIB STD-B24「デジタル放送におけるデータ放送符号化方式と伝送方式」およびARIB STD-B3「FM多重放送の運用上の標準規格」およびARIB STD-B62「デジタル放送におけるマルチメディア符号化方式(第2世代)」で規格化されている。 ここでは、ARIB外字のほか、ARIB外字を含む文字集合およびARIB外字を含む文字集合の伝送についても記載する。.

新しい!!: 文字コードとARIB外字 · 続きを見る »

ASCII

ASCII(アスキー、American Standard Code for Information Interchange)は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.

新しい!!: 文字コードとASCII · 続きを見る »

大漢和辞典

『大漢和辭典』(だいかんわじてん)は、大修館書店で出版されている世界最大の漢和辞典。諸橋轍次を代表とし、数十年に及ぶ歳月(鈴木一平の依頼があった1925年から補巻が刊行された2000年までだと75年)を費やし完成。諸橋大漢和と称されることもある。.

新しい!!: 文字コードと大漢和辞典 · 続きを見る »

外字

外字(がいじ)とは、.

新しい!!: 文字コードと外字 · 続きを見る »

字体

図1(刀) 図2(刃) 図3 字体(じたい)とは、図形を一定の文字体系の一字と視覚的に認識する概念、すなわち文字の骨格となる「抽象的な」概念のことである。.

新しい!!: 文字コードと字体 · 続きを見る »

富士通

富士通株式会社(ふじつう、Fujitsu Limited)は、日本の総合エレクトロニクスメーカーであり、総合ITベンダーである。ITサービス提供企業として収益で国内1位、世界4位(2015年)ITサービスを提供する世界の企業の収益(revenue)順位、1位「IBM」、2位「HP」、3位「アクセンチュア」、4位「富士通」「」HfS Research 2015。通信システム、情報処理システムおよび電子デバイスの製造・販売ならびにそれらに関するサービスの提供を行っている。.

新しい!!: 文字コードと富士通 · 続きを見る »

中国語

記載なし。

新しい!!: 文字コードと中国語 · 続きを見る »

三菱電機

三菱電機株式会社(みつびしでんき、)は、日本の大手総合電機メーカーであり、三菱電機グループの中核企業。 同社は、1921年1月15日、三菱造船(後の三菱重工業)より分離独立するかたちで設立され、三菱財閥の流れを汲む三菱グループに属する。.

新しい!!: 文字コードと三菱電機 · 続きを見る »

五十音

五十音(ごじゅうおん)または五十音図(ごじゅうおんず)とは、日本語の仮名文字(平仮名、片仮名)を母音に基づき縦に五字、子音に基づき横に十字ずつ並べたもの。また北原白秋による詩『五十音』が存在するが、これについては後述する。.

新しい!!: 文字コードと五十音 · 続きを見る »

今昔文字鏡

今昔文字鏡(こんじゃくもじきょう)は、エーアイ・ネットが開発し、販売する(単漢字15万字版までの商品・インデックスフォントについては紀伊國屋書店が販売)、Windows用の漢字検索ソフトと印字用フォントを組み合わせた入力、印字用アプリケーションソフトウェア。最新版の収録字数は17万字以上である。.

新しい!!: 文字コードと今昔文字鏡 · 続きを見る »

仮名

仮名(かな、けめょう、かめい、かりな).

新しい!!: 文字コードと仮名 · 続きを見る »

住民基本台帳ネットワークシステム

住民基本台帳ネットワークシステム(じゅうみんきほんだいちょうネットワークシステム)、通称住基ネット(じゅうきネット)とは、日本において、地方公共団体と行政機関で個々の日本国民を特定する情報を共有・利用することを目的として構築され稼働したシステム。市区町村の住民基本台帳に記録されている者(.

新しい!!: 文字コードと住民基本台帳ネットワークシステム · 続きを見る »

ミニコンピュータ

ミニコンピュータ (mini computer) は、コンピュータの種類の一つ。略称として「ミニコン」とも呼ばれた。.

新しい!!: 文字コードとミニコンピュータ · 続きを見る »

マルチバイト文字

マルチバイト文字(マルチバイトもじ)とは、.

新しい!!: 文字コードとマルチバイト文字 · 続きを見る »

マイクロソフト

マイクロソフト()は、アメリカ合衆国ワシントン州に本社を置く、ソフトウェアを開発・販売する会社である。1975年4月4日にビル・ゲイツとポール・アレンらによって設立された。.

新しい!!: 文字コードとマイクロソフト · 続きを見る »

バロース

バロース社 は、アメリカ合衆国の計算機・コンピュータ企業。1886年、アメリカン・アリスモメータとして創業。1986年に同じくアメリカの企業であったスペリーを買収・合併し、ユニシスとなった。当初は機械式を製造から始まり、その後プログラム可能な帳簿作成機を製造、さらにコンピュータへと移行した。メインフレーム製造のかたわら、タイプライターやプリンターも製造していた。.

新しい!!: 文字コードとバロース · 続きを見る »

バイト (情報)

バイト (byte) は、「複数ビット」を意味する、データ量あるいは情報量の単位である。 1980年頃から1バイトは8ビット (bit) であることが一般的であったが、 正式に定義されたのは2008年発行のIEC_80000-13である。 8ビットは、256個の異なる値(たとえば整数であれば、符号無しで0から255、符号付きで−128から+127、など)を表すことができる。.

新しい!!: 文字コードとバイト (情報) · 続きを見る »

メインフレーム

IBM 704 メインフレーム メインフレーム(mainframe)は、主に企業など巨大な組織の基幹業務用などに使用される、大型コンピュータを指す用語。汎用コンピュータ、汎用機、汎用大型コンピュータ、大型汎用コンピュータ、ホストコンピュータ、大型汎用計算機 などとも呼ばれる。対比語は時代にもより専用機、分散コンピュータ(オープン系システム)など。.

新しい!!: 文字コードとメインフレーム · 続きを見る »

モールス符号

SOS」のモールス符号 モールス符号(モールスふごう、Morse code)は、電信で用いられている可変長符号化された文字コードである。モールス符号を使った信号はモールス信号と呼ばれる。 モールス符号を打つための電鍵.

新しい!!: 文字コードとモールス符号 · 続きを見る »

プロプライエタリ・ソフトウェア

プロプライエタリ・ソフトウェア(英: proprietary software)または私有ソフトウェア(しゆう-)とは、ソフトウェアの入手、使用、改変、複製などに関する権利を議論する文脈で用いられるソフトウェアの種類についての用語。プロプライエタリ・ソフトウェアとは、ソフトウェアの配布者が、利用者の持つ権利を制限的にすることで自身や利用者の利益およびセキュリティを保持しようとするソフトウェアを指す。制限には法的手法や技術的手法など様々な方法がある。技術的制限手法としては、バイナリ実行コードのみを使用者に提供し、ソースコードは公開しないというソフトウェア流通の方法がある。法的制限手法としては、著作権や特許権、不正競争防止法、国家機密及びそれに基づくソフトウェアライセンス許諾といった方法がある。.

新しい!!: 文字コードとプロプライエタリ・ソフトウェア · 続きを見る »

パーソナルコンピュータ

パーソナルコンピュータ(personal computer)とは、個人によって占有されて使用されるコンピュータのことである。 略称はパソコン日本独自の略語である。(著書『インターネットの秘密』より)またはPC(ピーシー)ただし「PC」という略称は、特にPC/AT互換機を指す場合もある。「Mac対PC」のような用法。。.

新しい!!: 文字コードとパーソナルコンピュータ · 続きを見る »

テレックス

テレックス端末 テレックス(、)は、テレタイプ端末を使用した、不特定の相手方との文字による通信方式である。1930年代に確立し、2000年代前半頃まで商業通信手段として用いられた。 標準的なテレタイプは専用回線(又は特定回線)による特定地点間の通信であるが、テレックスは選択信号により通信相手を通信の都度に指定することができた。.

新しい!!: 文字コードとテレックス · 続きを見る »

テキスト

テキスト(text、Text、texte、テクスト)は、文章や文献のひとまとまりを指して呼ぶ呼称。 言葉によって編まれたもの、という含みを持つ語で、textile(テキスタイル、「織物」)と同じくラテン語の「織る」が語源である。.

新しい!!: 文字コードとテキスト · 続きを見る »

ディジタル・イクイップメント・コーポレーション

ディジタル・イクイップメント・コーポレーション (Digital Equipment Corporation) は、かつて存在した、アメリカ合衆国を代表するコンピュータ企業のひとつである。1957年、ケン・オルセンによってマサチューセッツ州メイナードに設立された。通称 DEC(デック)ディジタル・イクイップメント・コーポレーション自身が "DEC" を使った例: PDP11 Processor Handbook (1973): page 8, "DEC, PDP, UNIBUS are registered trademarks of Digital Equipment Corporation;" page 1-4, "Digital Equipment Corporation (DEC) designs and manufactures many of the peripheral devices offered with PDP-11's.

新しい!!: 文字コードとディジタル・イクイップメント・コーポレーション · 続きを見る »

和集合

数学において、集合族の和集合(わしゅうごう)、あるいは合併集合(がっぺいしゅうごう)、合併(がっぺい、)、あるいは演算的に集合の和(わ、sum)、もしくは'''結び'''(むすび、)とは、集合の集まり(集合族)に対して、それらの集合のいずれか少なくとも一つに含まれているような要素を全て集めることにより得られる集合のことである。.

新しい!!: 文字コードと和集合 · 続きを見る »

アルファベット

アルファベット(alphabet)は、ひとつひとつの文字が原則としてひとつの子音または母音という音素をあらわす表音文字の一種であり、また、それを伝統的な配列で並べたものをいう。「アルファベット」という語は、ギリシア文字の最初の2文字 α, β の読み方である「アルファ」(ἄλφα)、「ベータ」(βήτα)に由来する。 日常語において「アルファベット」という単語は主にヨーロッパ系の言語の文字一覧を表すが、学術的には後述する定義を満たしさえすればヨーロッパ系の言語でなくともよい。また、文字一覧はどの言語習得においても初期に学ぶことであるから、「学習の初歩」を意味することもある。 なお、英語の「alphabet」という単語は日常語においてもヨーロッパ系言語に限らない文字一覧を表す。たとえばハングルはKorean alphabetと呼ばれる。 日本においては「アルファベット」の語は、世界でもっとも広く通用している代表的なアルファベットであるラテン文字(ローマ字)の代名詞としても定着しており、一方で(歴史的経緯により)「ローマ字」の語を日本語のラテン文字化に限定する用法も一般的である。 形式言語とオートマトンの理論の用語では、その対象とする文字列や文などに現れる要素(終端記号)を「アルファベット」という。これは、一般的な用語のアルファベットとだいたい同様に文字のことを指すこともあるが、文字というよりは語にあたる「トークン」のことである場合もある。詳細は、アルファベット (計算機科学) の記事を参照。.

新しい!!: 文字コードとアルファベット · 続きを見る »

アップル (企業)

アップル()は、アメリカ合衆国カリフォルニア州に本社を置く、インターネット関連製品・デジタル家庭電化製品および同製品に関連するソフトウェア製品を開発・販売する多国籍企業である。2007年1月9日に、アップルコンピュータ (Apple Computer, Inc.) から改称した。.

新しい!!: 文字コードとアップル (企業) · 続きを見る »

アドビシステムズ

アドビシステムズ()は、ジョン・ワーノックとチャールズ・ゲシキによって1982年12月に設立された、アメリカ合衆国カリフォルニア州サンノゼ市に本社を置くコンピュータ・ソフトウェア会社である。 日本法人であるアドビシステムズ株式会社は、東京都品川区大崎に所在。.

新しい!!: 文字コードとアドビシステムズ · 続きを見る »

インターネット

インターネット(internet)は、インターネット・プロトコル・スイートを使用し、複数のコンピュータネットワークを相互接続した、グローバルな情報通信網のことである。 インターネットは、光ファイバーや無線を含む幅広い通信技術により結合された、地域からグローバルまでの範囲を持つ、個人・公共・教育機関・商用・政府などの各ネットワークから構成された「ネットワークのネットワーク」であり、ウェブのハイパーテキスト文書やアプリケーション、電子メール、音声通信、ファイル共有のピア・トゥ・ピアなどを含む、広範な情報とサービスの基盤となっている。.

新しい!!: 文字コードとインターネット · 続きを見る »

インターネットアーキテクチャ委員会

インターネットアーキテクチャ委員会(インターネットアーキテクチャいいんかい、Internet Architecture Board、IAB)とは、インターネットソサエティ(ISOC)がインターネットの技術的・工学的開発を監督するために設置した委員会である。 配下には多くのタスクフォースがあり、最も重要なものとしてInternet Engineering Task Force(IETF)とInternet Research Task Force(IRTF)がある。 IAB の母体となったのは、アメリカ国防総省の国防高等研究計画局が1979年に設立した Internet Configuration Control Board である。同委員会は1984年に Internet Advisory Board となり、1986年5月には Internet Activity Board となった。その後、1992年1月、インターネットがアメリカ政府の管理下から徐々に国際的な公共物となってきたことを受けて、ISOC 管理下のインターネットアーキテクチャ委員会となった。.

新しい!!: 文字コードとインターネットアーキテクチャ委員会 · 続きを見る »

オペレーティングシステム

ペレーティングシステム(Operating System、OS、オーエス)とは、コンピュータのオペレーション(操作・運用・運転)のために、ソフトウェアの中でも基本的、中核的位置づけのシステムソフトウェアである。通常、OSメーカーが組み上げたコンピュータプログラムの集合として、作成され提供されている。 オペレーティングシステムは通常、ユーザーやアプリケーションプログラムとハードウェアの中間に位置し、ユーザーやアプリケーションプログラムに対して標準的なインターフェースを提供すると同時に、ハードウェアなどの各リソースに対して効率的な管理を行う。現代のオペレーティングシステムの主な機能は、ファイルシステムなどの補助記憶装置管理、仮想記憶などのメモリ管理、マルチタスクなどのプロセス管理、更にはGUIなどのユーザインタフェース、TCP/IPなどのネットワーク、などがある。オペレーティングシステムは、パーソナルコンピュータからスーパーコンピュータまでの各種のコンピュータや、更にはスマートフォンやゲーム機などを含む各種の組み込みシステムで、内部的に使用されている。 製品としてのOSには、デスクトップ環境やウィンドウシステムなど、あるいはデータベース管理システム (DBMS) などのミドルウェア、ファイル管理ソフトウェアやエディタや各種設定ツールなどのユーティリティ、基本的なアプリケーションソフトウェア(ウェブブラウザや時計などのアクセサリ)が、マーケティング上の理由などから一緒に含められていることもある。 OSの中で、タスク管理やメモリ管理など特に中核的な機能の部分をカーネル、カーネル以外の部分(シェルなど)をユーザランドと呼ぶ事もある。 現代の主なOSには、Microsoft Windows、Windows Phone、IBM z/OS、Android、macOS(OS X)、iOS、Linux、FreeBSD などがある。.

新しい!!: 文字コードとオペレーティングシステム · 続きを見る »

オフィスコンピュータ

フィスコンピュータ(略称:オフコン)は、主に中小企業等での事務処理を行うために設計された、比較的小型のコンピュータ。主に日本のみで使われる呼称で、海外ではミニコンピュータ、ワークステーション、ミッドレンジコンピュータなどと呼ばれるコンピュータの一形態で、各メーカーによる独自設計が用いられていることが特徴である。.

新しい!!: 文字コードとオフィスコンピュータ · 続きを見る »

キャラクタ (コンピュータ)

ャラクタ (character) は、文字のことであるが、情報処理においては「文字コード」で表される「文字集合」という集合の要素(「元」)のことである。.

新しい!!: 文字コードとキャラクタ (コンピュータ) · 続きを見る »

コンピュータ

ンピュータ(Computer)とは、自動計算機、とくに計算開始後は人手を介さずに計算終了まで動作する電子式汎用計算機。実際の対象は文字の置き換えなど数値計算に限らず、情報処理やコンピューティングと呼ばれる幅広い分野で応用される。現代ではプログラム内蔵方式のディジタルコンピュータを指す場合が多く、特にパーソナルコンピュータやメインフレーム、スーパーコンピュータなどを含めた汎用的なシステムを指すことが多いが、ディジタルコンピュータは特定の機能を実現するために機械や装置等に組み込まれる組み込みシステムとしても広く用いられる。電卓・機械式計算機・アナログ計算機については各項を参照。.

新しい!!: 文字コードとコンピュータ · 続きを見る »

コード会

ード会(こーどかい)とは、かつて存在した日本の文字コードについての勉強会である。1958年10月に和田弘によって作られた。.

新しい!!: 文字コードとコード会 · 続きを見る »

コードページ

ードページとは、特定の符号化文字集合を指定するための数字、またはその数字で指定された符号化文字集合、あるいはそのような方法で符号化文字集合を指定するためのシステムのことである。cpと表示されることもある。それぞれの符号化文字集合は「コードページ○○(○○は2桁から5桁の数字)」という形で管理される。 コードページという用語は、システムベンダ各社が管理している符号化文字集合を指す時にしか用いられず、ISO等の公的な規格の文字集合を「コードページ○○」などということはない。IBMおよび、マイクロソフトは各自、コードページを定めて管理している。マイクロソフトのコードページ群はMS-DOSやWindowsなどで利用されている。IBMのコードページはSystem iやDB2等の文字データ表現体系(CDRA: "Character Data Representation Architecture")をサポートするIBMシステムで利用されている。.

新しい!!: 文字コードとコードページ · 続きを見る »

シリアライズ

ンピュータプログラミングにおいて、シリアライズ、もしくはシリアル化 (serialize) という用語は、次のような異なる2つの意味を有する。.

新しい!!: 文字コードとシリアライズ · 続きを見る »

ソフトウェア

フトウェア(software)は、コンピューター分野でハードウェア(物理的な機械)と対比される用語で、何らかの処理を行うコンピュータ・プログラムや、更には関連する文書などを指す。ソフトウェアは、一般的にはワープロソフトなど特定の作業や業務を目的としたアプリケーションソフトウェア(応用ソフトウェア、アプリ)と、ハードウェアの管理や基本的な処理をアプリケーションソフトウェアやユーザーに提供するオペレーティングシステム (OS) などのシステムソフトウェアに分類される。.

新しい!!: 文字コードとソフトウェア · 続きを見る »

サン・マイクロシステムズ

ン・マイクロシステムズ本社 サン・マイクロシステムズ(Sun Microsystems)は、アメリカ合衆国カリフォルニア州サンタクララに本社を置いていたコンピュータの製造・ソフトウェア開発・ITサービス企業である。2010年1月27日にオラクルにより吸収合併され、独立企業・法人としては消滅した。.

新しい!!: 文字コードとサン・マイクロシステムズ · 続きを見る »

写像

写像(しゃぞう、mapping, map)とは、二つの集合が与えられたときに、一方の集合の各元に対し、他方の集合のただひとつの元を指定して結びつける対応のことである。函数(関数)、変換、作用素、射などが写像の同義語として用いられることもある。 ブルバキに見られるように、写像は集合とともに現代数学の基礎となる道具の一つである。現代的な立場では、「写像」と(一価の)「函数」は論理的におなじ概念を表すものと理解されているが、歴史的には「函数」の語は解析学に出自を持つものであり、一部には必ずしも写像でないものも函数の名の下におなじ範疇に扱われる(多価函数参照)。文献によっては「数の集合(大抵の場合実数体 または複素数体 の部分集合)を終域に持つ写像」をして特に「函数」と呼び、「写像」はより一般の場合に用いる。函数、二項関係、対応の各項も参照のこと。.

新しい!!: 文字コードと写像 · 続きを見る »

国際化と地域化

情報処理における国際化と地域化(こくさいか と ちいきか)は、ソフトウェアを開発した環境とは異なる環境、特に外国や異文化に適合させる手段である。 国際化(internationalization internationalisation、i18n) は、ソフトウェアに技術的な変更を加えることなく多様な言語や地域に適合できるようにする、ソフトウェア設計の工程である。 地域化(localization localisation、L10N)は、地域固有の構成部品や翻訳テキストを追加することによって、ソフトウェアを特定の地域や言語に適合させる工程である。 かつては、ソフトウェアの地域化や多言語化のために必要に応じて技術的な変更が行われてきた。しかし、このようなやり方ではソフトウェアの規模拡大や対応する言語が多くなるに従い、開発や保守に多くの時間と費用がかかるため対応が難しい。1990年代にプログラミング言語やオペレーティングシステムの国際化対応が標準化されると、ソフトウェアを予め国際化することにより、地域固有データの追加や最小限の変更で地域化が行われるようになった。 両者の概念は時々集合的にグローバライゼーション (globalization、G11N) と呼ばれる。ただし、この言葉はソフトウェア工学の範囲を越えて社会的な国際化の意味で使われることも多い。.

新しい!!: 文字コードと国際化と地域化 · 続きを見る »

国際電気標準会議

国際電気標準会議(こくさいでんきひょうじゅんかいぎ、International Electrotechnical Commission、IEC)は、電気工学、電子工学、および関連した技術を扱う国際的な標準化団体である。国際規格作成のための規則群(Directives)、規格適合(ISO/IEC 17000シリーズ)、IT技術(ISO/IEC JTC1)など一部は国際標準化機構(ISO)と共同で開発している。公用語は、英語とフランス語。.

新しい!!: 文字コードと国際電気標準会議 · 続きを見る »

国際標準化機構

国際標準化機構(こくさいひょうじゅんかきこう、International Organization for Standardization)、略称 ISO(アイエスオー、イソ、アイソ)は、各国の国家標準化団体で構成される非政府組織である。 スイス・ジュネーヴに本部を置く、スイス民法による非営利法人である。1947年2月23日に設立された。国際的な標準である国際規格(IS: international standard)を策定している。 国際連合経済社会理事会に総合協議資格(general consultative status)を有する機関に認定された最初の組織の1つである。.

新しい!!: 文字コードと国際標準化機構 · 続きを見る »

Baudot Code

Baudot code(ボーコードあるいはボドーコード)は国際テレックス網の標準文字コードである。が1905年2月にジャーナル・オブ・インスティテューション・オブ・エレクトリカル・エンジニアーズ 誌上で発表し、1931年5月にスイスのベルンで開催された第3回CCIT において国際電信アルファベット No.2 として承認された。フランス電信公社の技術者が1876年3月に特許を取得(フランス特許第111719号)した文字コード後の国際テレグラフ・アルファベット No.

新しい!!: 文字コードとBaudot Code · 続きを見る »

Big5

Big5(ビッグファイブ、中国語名:大五碼あるいは五大碼)は、繁体字中国語の文字コード(文字集合)で、台湾・香港・マカオといった繁体字圏で最も一般的に使われている。.

新しい!!: 文字コードとBig5 · 続きを見る »

CID (文字コード)

CIDは、アドビ社のCIDフォントが内蔵するすべての文字(文字コレクション)を識別するため、文字ごとに振られる一連の番号。 文字コレクションは言語ごとに定義され、その言語の主要な文字集合をサポートするために必要な文字をすべて含む。文字コレクションには「登録者-配列(-追補番号)」の形式で名前が付けられる。たとえばアドビ社が定めた日本語の表記に使われる文字コレクションの名称はAdobe-Japan1である。 Adobe-Japan1は、JIS X 0208やISO/IEC 10646(≒Unicode)などの公的な文字コード規格では(異体字セレクタを使わない限り)同じコードが与えられている異体字の字形1つ1つに別々のCIDを割り当てている。実際のOS・アプリケーションとのやりとりは通常フォントに内蔵されている CMAPテーブル(CIDとUnicodeを相互に関連付けた対応表)を参照して行われるが、Acrobat・InDesign(いずれもアドビシステムズ社製品)・日本語LaTeX(フリーソフト)などのソフトはCID番号を直接利用することがある。 Adobe-Japan1の追補ごとの詳細は以下の通り。;Adobe-Japan1-0: 1993年6月11日発表。8,284グリフ。JIS X 0208-1983まで、OCFフォントで利用。Adobe-Japan1-4でJIS X 0208-1983の規格票字形が追加されたことに伴いAdobe-Japan1-0の範囲にはJIS X 0208-1990の規格票字形を実装することになったが、当初は厳密な規格票字形の実装を求められていなかった。このためAdobe-Japan1-4以前から存在するフォントで互換性の問題が生じる場合がある。;Adobe-Japan1-1: 1994年10月4日発表。8,359グリフ。富士通やNECのJIS X 0208実装に使われていた字体(おおむねJIS C 6226-1978に基づく)の拡張およびJIS X 0208-1990で追加された漢字の追加。;Adobe-Japan1-2: 1994年10月4日発表。8,720グリフ(CIDフォント)。IBM外字などの拡張によりマイクロソフト標準キャラクタセットをサポートした。;Adobe-Japan1-3: 2000年3月31日発表。9,354グリフ (OpenType Std / StdN)。縦書き字形の拡張。漢字の追加はない。;Adobe-Japan1-4: 2000年3月31日発表。15,444グリフ (OpenType Pro / ProN)ヒラギノのPro(バージョン7.11以降)/ ProNは、Adobe-Japan1-5(Pr5 / Pr5N)に対応する。より。。Mac OS X v10.0で利用可。過去のJIS X 0208の規格票字形すべてや、JIS X 0221 附属書1の追加漢字集合に対応。;Adobe-Japan1-5: 2002年9月20日発表。20,317グリフ (Opentype Pr5 / Pr5N)。Apple拡張(APGS)の取込み、JIS X 0213:2000、国語審議会「表外漢字字体表」など対応。Mac OS X v10.2, 10.3, 10.4で利用可。;Adobe-Japan1-6: 2004年6月11日発表。23,058グリフ (Opentype Pr6 / Pr6N)。JIS X 0213:2004およびJIS X 0212への対応。U-PRESSの文字を追加。Mac OS X v10.5で利用可。 Adobe-Japan1-4 と Adobe-Japan1-5 の間に Apple が Mac OS X (10.1) で JIS X 0213 文字を拡張した Apple Publishing Glyph Set(APGS) もあるが、Adobe-Japan1-5 と同じものということになっている(実際にはAdobe-Japan1-5との間には僅かに違いがある)。 古いものでAdobe-Japan2もある。Adobe-Japan2-0はJIS X 0212に相当するが、Adobe-Japan1-6に統合され廃止された。 Adobe-GB1(簡体字中国語)・Adobe-CNS1(繁体字中国語)・Adobe-Korea1(朝鮮語)など日本語以外のCJK圏で使われる文字コレクションもあるが、Adobe-Japan1以外はおおむね公的な文字コード規格の文字をそのまま含んでいるだけであるため、Adobe-Japan1に比べると、さほど注目されていない(最新版はそれぞれAdobe-GB1-5(30,284グリフ)・Adobe-CNS1-6(19,156グリフ)・Adobe-Korea1-2(18,352グリフ))。.

新しい!!: 文字コードとCID (文字コード) · 続きを見る »

CNS 11643

CNS 11643は、中華民国(台湾)の文字コード(文字集合)の規格。 1983年にまず試用版が発行され、2年間の試用期間を経た後に漢字の重複や排列順序の間違いを正し、1986年に最初の正式版が発行された。約13000字をISO/IEC 2022に適合するよう94×94文字集合2個に編成し、それぞれ第一字面・第二字面と呼ぶ。この他、初期には第十四字面があったが廃止され、後に第三~第七字面と第十五字面が追加された。符号空間としては第十六字面まで想定されている。 CNS 11643をEUCで符号化したものを、繁体字中国語EUC (EUC-TW) という。 公的規格であり、体系としてはBig5より整っているが、正式版が発行された時点ではBig5がすでに広く普及していたこと、文字集合を複数の字面に分割したことから1文字が2バイトに収まらない場合があること、重複や排列を正したために試用版をベースとしたBig5との変換が単純な計算でできないことなどの理由により、.

新しい!!: 文字コードとCNS 11643 · 続きを見る »

CO-59

CO-59、六社協定新聞社用文字コード(ろくしゃきょうていしんぶんしゃようもじこーど) とは、1959年に新聞社間などでの記事などの交換を目的として定められた文字コードである。.

新しい!!: 文字コードとCO-59 · 続きを見る »

筆まめ

まめ(ふでまめ)は、ソフトウェアの開発・販売会社およびそこが販売するはがき作成ソフトウェアである。 本項では、株式会社筆まめ、はがき作成ソフトウェアの「筆まめ」の双方を扱う。.

新しい!!: 文字コードと筆まめ · 続きを見る »

EBCDIC

EBCDIC (Extended Binary Coded Decimal Interchange Code、エビシディック、拡張二進化十進コード) はIBMにより定義された8ビットのコード化文字セットである。ASCII普及前の1963年に、'''BCD'''(Binary-coded decimal、二進化十進コード)を拡張する形で作られ、主にIBM系のメインフレームやオフィスコンピュータなどで使用されている。 IBMのCDRA(文字データ表現体系)では、EBCDICは符号化方法(Encoding Scheme)の1つと位置づけられている。各国語などの文字集合であるコードページを、EBCDICなどの符号化方式で符号化するが、EBCDICの符号化にもシングルバイト、ダブルバイト、マルチバイトの構造がある。これらの組み合わせがCCSIDとして定義されており、例えば日本用のEBCDICのCCSIDは、ひらがなや漢字を含まない組み合わせも含めると、10以上定義されている。 この他、IBM以外の互換メーカーなどのEBCDICをベースとした各種の文字コードまたは符号化方法も、EBCDICまたはEBCDIC系と呼ばれる場合がある。.

新しい!!: 文字コードとEBCDIC · 続きを見る »

EUC-JIS-2004

EUC-JIS-2004は、日本の文字を符号化するために使われる文字コードである。JIS X 0213の符号化方式のひとつである。JIS X 0213:2004の附属書3で定義されている。 以下のようなコード値の割り当てによって、ASCIIとJIS X 0213、およびJIS X 0201片仮名を混在させる符号化方式である。.

新しい!!: 文字コードとEUC-JIS-2004 · 続きを見る »

EUC-JP

EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつである。UNIX以外のOS上で使われることもある。 1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。 EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。 日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPやShift_JISと異なり制御文字SS2(シングルシフトツー、0x8E)に続けて現れるので都合2バイト、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので都合3バイトを要する。 JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。 UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年ではUTF-8を使用したシステムも普及している。.

新しい!!: 文字コードとEUC-JP · 続きを見る »

Extended Unix Code

Extended Unix Code(EUC)は、UNIX上で使われてきた文字コードの符号化方式である。.

新しい!!: 文字コードとExtended Unix Code · 続きを見る »

Extensible Markup Language

Extensible Markup Language(エクステンシブル マークアップ ランゲージ)は、基本的な構文規則を共通とすることで、任意の用途向けの言語に拡張することを容易としたことが特徴のマークアップ言語の総称である。一般的にXML(エックスエムエル)と略称で呼ばれる。JISによる訳語は「拡張可能なマーク付け言語」。 SGMLからの移行を目的として開発された。文法はSGMLの構文解析器と互換性を保つようにSGMLのサブセットに定められシンプルになり、機能はSGMLに無いものが追加されている。 XML の仕様は、World Wide Web Consortium (W3C) により策定・勧告されている。1998年2月に XML 1.0 が勧告された。2010年4月現在、XML 1.0 と XML 1.1 の2つのバージョンが勧告されている(#バージョン)。 ちなみに、「eXtensible Markup Language の略である」と書かれることがあるが、これは間違いであり、XはExの発音を表している。.

新しい!!: 文字コードとExtensible Markup Language · 続きを見る »

英語

アメリカ英語とイギリス英語は特徴がある 英語(えいご、)は、イ・ヨーロッパ語族のゲルマン語派に属し、イギリス・イングランド地方を発祥とする言語である。.

新しい!!: 文字コードと英語 · 続きを見る »

電子メール

電子メール(でんしメール、英: Electronic mail、E-mail、Eメール)は、コンピュータネットワークを使用して、郵便のように情報等を交換する手段である。電子郵便(でんしゆうびん)とも言う。.

新しい!!: 文字コードと電子メール · 続きを見る »

GB 18030

GB 18030は、中華人民共和国(中国)が制定した文字コード(文字セット)の国家規格である。規格名は現在《GB 18030-2005 信息技术 中文编码字符集》 (Information technology -- Chinese coded character set) といい、当初は《GB 18030-2000 信息交换用汉字编码字符集基本集的扩充》 (Information Technology -- Chinese ideograms coded character set for information interchange -- Extension for the basic set) といった。IANA登録名はGB18030である。.

新しい!!: 文字コードとGB 18030 · 続きを見る »

GB 2312

GB 2312-80(あるいはGB 2312-1980)は、中華人民共和国の国家規格として定められた簡体字中国語の符号化文字集合(いわゆる文字コード)で、主に中国大陸などで使われる。規格名は《信息交换用汉字编码字符集・基本集》という。GB0とも呼ばれ、GBコードといったときには、多くの場合この規格を指す。漢字を含む文字集合規格の基本となっていることや構造など、日本のJIS X 0208と共通点が多い。.

新しい!!: 文字コードとGB 2312 · 続きを見る »

GBK

GBK は、中華人民共和国で使われている簡体字用の文字コード GB 2312 の拡張である。 GB は国家規格 (Guójiā Biāozhǔn, 国家标准) を、K が拡張 (Kuòzhǎn, 扩展) を表す。GBK は古い規格 GB 2312 に繁体字のみならず 1981年に GB 2312 が制定された後で簡化された漢字も拡張している。GBK の登場によって、中国の元首相朱鎔基(朱镕基)の名前に含まれる「镕」の文字など、かつては表現不可能だった一部の人名が表現可能になった。.

新しい!!: 文字コードとGBK · 続きを見る »

IBM

IBM(アイビーエム、正式社名: International Business Machines Corporation)は、民間法人や公的機関を対象とするコンピュータ関連製品およびサービスを提供する企業である。本社はアメリカ合衆国ニューヨーク州アーモンクに所在する。世界170カ国以上で事業を展開している。.

新しい!!: 文字コードとIBM · 続きを見る »

IBM漢字システム

IBM漢字情報処理システム(アイビーエムかんじじょうほうしょりシステム)はIBMメインフレームで日本語を処理するためのシステム。初版は1971年に発表され、その後中型機IBM System/34や、IBM 5550、DOS/Vなどに拡張された。IBM漢字コードはIBMのメインフレームで使われる漢字コードで、後にIBM 5550、DOS/Vでも使用された。.

新しい!!: 文字コードとIBM漢字システム · 続きを見る »

Internet Assigned Numbers Authority

Internet Assigned Numbers Authority(IANA、アイアナ)とはインターネットに関連する番号を管理する組織である。IPアドレス・ドメイン名・ポート番号等の標準化・割り当て・管理などを行う。アメリカの南カリフォルニア大学のISI(Information Sciences Institute)にある。 ジョン・ポステルが中心となって始めた組織。運営費用の一部がアメリカ政府により援助されていたが国際的な機関となるために1999年、ICANNの援助によって活動する組織に変更された。現在、ICANNの下部組織。 XML宣言に記述するエンコーディングの名前は、IANAに登録されたキャラクタセット名が使用される。.

新しい!!: 文字コードとInternet Assigned Numbers Authority · 続きを見る »

Internet Engineering Task Force

The Internet Engineering Task Force(IETF、インターネット技術タスクフォース) はインターネットで利用される技術の標準を策定する組織である。 極めてオープンな組織で、実際の作業を行っている作業部会 (Working group; WG) のメーリングリストに参加することで、誰でも議論に参加することが可能となっている。 通常はメーリングリスト上で議論が進むが、年に3回(2回はアメリカ国内、1回はそれ以外の国)会議が開催される。この会議も参加費を払うことでだれでも参加が可能である。日本国内では2002年に横浜(パシフィコ横浜)で開催され、2009年11月には広島で開催された。また、2015年11月に再び横浜で開催されることが決定している。会議では、最終的に何か決定を下さなければならない場合にハミング(鼻歌)による表決(ラフコンセンサス)を取るという特徴がある。 策定された標準仕様は最終的にはRFCなどとして発行する。.

新しい!!: 文字コードとInternet Engineering Task Force · 続きを見る »

ISO-2022-JP

ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする (アナウンス機能のエスケープシーケンスは省略される)。俗に「JISコード」と呼ばれることもある。.

新しい!!: 文字コードとISO-2022-JP · 続きを見る »

ISO-2022-JP-2004

ISO-2022-JP-2004は、日本の文字を符号化するために使われる文字コードである。JIS X 0213の符号化方式のひとつである。JIS X 0213:2004の附属書2で定義されている。 コード値として0x20から0x7Fまでの範囲を使い、エスケープシーケンスによってASCIIの1バイト文字とJIS X 0213の2バイト文字とを切り替えて運用する符号化方式である。最上位ビットを全く使わないため、7ビットの環境 (インターネットのメールなど) に適する。一方、状態を持つ符号化方式であるため、プログラムの内部コードとして用いるのは一般的に困難が伴う。 エスケープシーケンスとそれによって指示される文字集合は以下の通り。.

新しい!!: 文字コードとISO-2022-JP-2004 · 続きを見る »

ISO/IEC 10646

ISO/IEC 10646 (UCS; Universal Coded Character Set) は、符号化文字集合や文字符号化方式などを定めた、文字コードの国際標準のひとつで、業界規格のUnicodeと概ね互換であることが特徴である。日本の対応規格はJIS X 0221(国際符号化文字集合)。 UCSの文字空間は0 - 10FFFFである。古い規格では21ビットのUnicodeをベースにして文字空間を31ビットに拡張したものとされ、Unicodeの最大値であるU+10FFFFより大きなコードも使用できるという点でUnicodeに対して上位互換であったが、2006年の改訂によりUnicodeで使用できない領域には文字が「永久に定義されない」こととされ下位互換を持つことになった。2011年の改訂では明確に0 - 10FFFFと定義された。 符号化方式は、Unicodeと同じUTF-8やUTF-16が使われることが多い。ただし、Unicodeの『UTF』が『Unicode Transformation Format』を意味するのに対して、ISO/IEC 10646の『UTF』は『UCS Transformation Format』を意味する点が違う。 面 (plane)、区 (row)、点 (cell) として分けられ、Unicodeと同じ第0面の基本多言語面 (BMP; Basic Multilingual Plane) と追加面の第1 - 16面までの範囲で文字が定義されている。古い規格では群 (group) という分類もあったが2011年の改訂で廃止された。.

新しい!!: 文字コードとISO/IEC 10646 · 続きを見る »

ISO/IEC 2022

ISO/IEC 2022(旧称 ISO 2022)は、.

新しい!!: 文字コードとISO/IEC 2022 · 続きを見る »

ISO/IEC 646

ISO/IEC 646は7ビットの文字コードを規定する国際標準化機構 (ISO) 標準であり、これを元に各国語版の文字コードが規定される。 アメリカの規格であるASCIIを国際化した体裁となっている。ラテンアルファベット(ISO基本ラテンアルファベット)と数字を中心とした共通部分と、ASCIIでは記号となっている各国規格で自由に割り当てられる部分に分かれており、ヨーロッパ各国ではこの部分にダイアクリティカルマークつき文字を割り当てることにより自国語の文章を符号化できるようになっている。 現在ではヨーロッパでは8ビットコードであるISO/IEC 8859が主流となっており、この規格はあまり使われていない。なお、UnicodeのISO規格であるISO/IEC 10646の規格番号は、この規格の番号にちょうど10000を加えた値となっている。.

新しい!!: 文字コードとISO/IEC 646 · 続きを見る »

ISO/IEC 8859

ISO 8859(より正式にはISO/IEC 8859)はコンピュータでの利用を目的とした8ビット文字コードの標準である。ISOとIECが合同で定めた。この標準は複数の部(英: part)に分かれており、それぞれがISO/IEC 8859-1、ISO/IEC 8859-2などのように番号付きで出版されている。それぞれの部自体を、非公式に標準として参照することがある。2009年現在、15の部(破棄されたISO/IEC 8859-12標準を除く)が存在する。.

新しい!!: 文字コードとISO/IEC 8859 · 続きを見る »

ISO/IEC 8859-1

ISO 8859-1(より正式にはISO/IEC 8859-1)はISO/IEC 8859の第一部であり、ラテンアルファベットの文字コード標準である。よりくだけた言い方ではLatin-1と呼ばれる。最初はISOによって開発されたが、後にISOとIECによって合同で保守されている。この標準に追加の文字を(16進符号0x00-0x1Fの「C0領域」と、0x80-0x9F「C1領域」の範囲に)割り当てたものは、2つの広く使われているキャラクタセットの基となる。ISO-8859-1(余分なハイフンに注意)とWindows-1252と呼ばれるものである。 2004年6月、8ビット符号化文字集合の整備を担当するISO/IECの作業部会は、国際符号化文字集合 (UCS) とUnicodeの開発に専念するために解散し、ISO 8859-1を含むすべてのISO 8859の整備を中止した。コンピュータアプリケーションにおいては、(UTF-8やUTF-16のような)完全なUCSサポートを提供するエンコーディングが、ISO 8859-1に基づくエンコーディングよりもますます多く使われるようになりつつある。.

新しい!!: 文字コードとISO/IEC 8859-1 · 続きを見る »

ISO/IEC 8859-11

ISO 8859-11は8ビットの文字コードで、ISO 8859標準の一部である。タイ語で使われる文字をカバーする。1999年にISO 8859標準へ追加された。タイの国家標準TIS-620 (1990年) とほとんど同じであり、ISO 8859-11は16進値 A0 にノーブレークスペースを定義しているのに対し、TIS-620は未定義のまま残しているという点のみが違う (現実には、この小さな違いは通常無視される)。 ISO-8859-11はISO 8859シリーズに基づくIANAキャラクタセットの通常のパターンに従っているが、登録されたIANAキャラクタセット名ではない。しかしながら、同等に近いTIS-620 (ノーブレークスペースが欠けている) がIANAにより登録されている。 マイクロソフトのWindowsコードページ874もタイ語版のApple Macintoshで使われるコードページもTIS-620の拡張である — しかしながら、互いに互換性はない。 ISO 8859の他の全種類と同様、下位128の符号はASCIIと等価である。追加の文字はUnicodeにも同じ順序で登録されており、A1からU+0E01へ (以下同様) シフトしているだけである。.

新しい!!: 文字コードとISO/IEC 8859-11 · 続きを見る »

ISO/IEC 8859-15

ISO/IEC 8859-15:1999 は、ISO/IEC 8859 の第15部である。ISO/IEC 8859-1と同様、西ヨーロッパ諸言語のためのラテンアルファベットの文字コードの標準である。1999年に初版が制定された。公式の名称ではないが、Latin-9 と呼ばれることがある。 ISO/IEC 8859-15 は ISO/IEC 8859-1 に似ているが、ユーロ記号、および 8859-1 の対象言語で使用される文字のうち 8859-1 で定義されていなかった文字を追加し、かわりに一部の記号を除いている。もともと 8859-1 を置きかえるものとして作られたが、あまり普及はしていない。.

新しい!!: 文字コードとISO/IEC 8859-15 · 続きを見る »

ISO/IEC 8859-5

ISO/IEC 8859-5:1999 は、ISO/IEC 8859 の第5部であり、ラテン文字とキリル文字用の文字コードの標準である。1988年に初版が制定された。 推奨MIME名は ISO-8859-5。.

新しい!!: 文字コードとISO/IEC 8859-5 · 続きを見る »

ISO/IEC 8859-6

ISO/IEC 8859-6:1999 ISO 8859の第6部であり、ラテン文字とアラビア文字用の文字コードの標準である。1987年に初版が制定された。アラビア語以外の、ペルシャ語やウルドゥー語用の文字は含まれておらず、実質アラビア語以外の言語を記すことは出来ない。.

新しい!!: 文字コードとISO/IEC 8859-6 · 続きを見る »

ISO/IEC 8859-7

ISO 8859-7 (別名Greek) は8ビットの文字コードで、ISO 8859標準の一部である。当初は現代ギリシア語と、ギリシア語から派生した数学記号をカバーするために設計された。 最初の1987年版の標準は、1986年に発行されたギリシアの国家標準ELOT 928と文字割り当てが同じだった。本項目の表では、ユーロ記号を含む3つの文字が追加されて、更新された2003年版を示す。 推奨MIME名であるISO-8859-7 (余分なハイフンに注意)のほうがよく知られているISO_8859-7:1987は、1987年版のこの標準を C0 (0x00–0x1F) と C1 (0x80–0x9F) 部分に使われるISO/IEC 6429からの制御符号と組み合わせて構成されたIANAキャラクタセットである。エスケープシーケンス (ISO/IEC 6429やISO/IEC 2022からの) は解釈されない。このキャラクタセットには以下の別名もある。iso-ir-126, ISO_8859-7, ELOT_928, ECMA-118, greek, greek8 および csISOLatinGreek.

新しい!!: 文字コードとISO/IEC 8859-7 · 続きを見る »

ITOS

ITOS(Interactive Tutorial Operating System)は、日本国内初の対話指導型OSでNECのオフコン用のOSである。.

新しい!!: 文字コードとITOS · 続きを見る »

Java

Java(ジャバ)は、狭義ではプログラミング言語Javaを指す。広義では言語仕様以外にも、仕様が与えられているJavaクラスライブラリやJava仮想マシン、さらにはJDKやJREなどの公式のものをはじめとする、場合によってはサードパーティのものなどを含め曖昧にJavaプラットフォームと総称されるようなものなどのエコシステムなどを指すこともある。構文についてはJavaの文法の記事を参照。.

新しい!!: 文字コードとJava · 続きを見る »

JEF漢字コード

JEF漢字コード(ジェフかんじこーど、Japanese processing Extended Feature)は、1979年に富士通が策定した文字コード。同社のメインフレーム『GSシリーズ』、及び、ビジネスサーバ『PRIMERGY 6000シリーズ』において用いられる。 JIS C 6226-1978をGR表現し、その上方に拡張文字を登録した符号化文字集合である。1983年のJIS X 0208-1983策定に伴い、1984年に若干の修正を加えるも、22組の入れ替え字についてはそのままにした。 主にEBCDICと併用される。 PCの文字体系との連携には、富士通製『Interstage Charset Manager』が必要となる。また、文字変換については、富士通ビー・エス・シー製『F*TRANシリーズ』にて行える。 Category:日本語用の文字コード Category:日本の漢字.

新しい!!: 文字コードとJEF漢字コード · 続きを見る »

JIPS

JIPS(ジップス Japanese Information Processing System)はNECが開発した日本語処理システムの名前である。実際上は、『JIPS』という用語は、そのシステム上で使われる漢字コードの事を指していることが多いため、本稿ではその漢字コードについて説明する。 『JIPS」にて使われる漢字コードは、JIS C 6226-1978をベースに拡張文字を9区〜13区に登録し、さらにGR域に『G1集合』と呼ばれる拡張文字群を登録した符号化文字集合である。.

新しい!!: 文字コードとJIPS · 続きを見る »

JIS X 0201

JIS X 0201は、日本工業規格 (JIS) の制定している文字コード規格で、初版は1969年6月1日の制定であり、現存のJISにおける最も古い文字コードである。規格名称は7ビット及び8ビットの情報交換用符号化文字集合。名称が示す通り、7ビット符号と8ビット符号での運用が予定されている。図形文字の集合を規定するための規格であり、JIS X 0211 (ISO/IEC 6429) で規定される制御文字集合と組み合わせて使用する。現在の規格番号は日本工業規格の部門X(情報処理)の新設に伴って1987年3月1日に変更されたもので、旧規格番号はJIS C 6220。俗称はANKコードで、'ANK'はこのコードの主要構成文字であるアルファベット (Alphabet)、数字 (Numerical digit)、片仮名 (Katakana) の頭文字より来ている。 JIS X 0201はラテン文字用図形文字集合と片仮名用図形文字集合のふたつの文字集合よりなっている。このうちラテン文字用図形文字集合はAmerican Standard Code for Information Interchange (ASCII) と同様ISO/IEC 646の版の1つとなっている。ASCIIと比較すると2文字が異なっており、92番の文字にバックスラッシュ ('') の替わりに円記号 ('¥') が、126番にチルダ ('~') の替わりにオーバーライン ('‾') が割り当てられている。片仮名用図形文字集合は片仮名と日本語用の約物よりなっており、最後の31文字分は未定義となっている。また、単独の濁点と半濁点のみ収録されており濁点付き片仮名と半濁点付き片仮名は収録されていない。 全体的な構造はJIS X 0202 (ISO/IEC 2022) に従った構造となっており、8ビット符号では16進で21から7Eにラテン文字を、A1からFEに片仮名を割り当てる。7ビット符号では21から7Eの領域を、SHIFT-INとSHIFT-OUTでラテン文字と片仮名を切り替えながら使用する。このとき、SO(0E)以降は片仮名、SI(0F)以降はラテン文字となる。 現在では主にShift_JISおよびEUC-JPの一部として用いられており、単独で用いられることはほとんどない。これらの文字コードは JIS X 0208の文字も含んでおり、JIS X 0208にはJIS X 0201にあるほぼすべての文字があるため文字が重複することとなる。この区別のため、JIS X 0201の文字をJIS X 0208の文字の半分の幅で表示することが多い。このため、これらの文字を俗に半角文字、特に片仮名を半角カナとよぶ事が多い。また、Shift_JISのアルファベット部分はASCIIとJIS X 0201との区別が曖昧なまま使われることが多いため、円記号とバックスラッシュの区別においてしばしば混乱が起きる。.

新しい!!: 文字コードとJIS X 0201 · 続きを見る »

JIS X 0208

JIS X 0208(ジス X 0208)は、日本語表記、地名、人名などで用いられる6,879図形文字を含む、主として情報交換用の2バイト符号化文字集合を規定する日本工業規格である。現行の規格名称は7ビット及び8ビットの2バイト情報交換用符号化漢字集合 (7-bit and 8-bit double byte coded KANJI sets for information interchange) である。1978年にJIS C 6226として制定され、1983年、1990年および1997年に改正された。JIS漢字コード、JIS漢字、JIS第1第2水準漢字、JIS基本漢字などの通称がある。.

新しい!!: 文字コードとJIS X 0208 · 続きを見る »

JIS X 0212

JIS X 0212(ジス X 0212)は、JIS X 0208:1983に含まれない文字を集めた、6067字の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「情報交換用漢字符号-補助漢字」である。1990年10月1日に制定され、JIS X 0208と組み合わせて利用される。JIS補助漢字の通称がある。.

新しい!!: 文字コードとJIS X 0212 · 続きを見る »

JIS X 0213

JIS X 0213(ジス X 0213)はJIS X 0208:1997を拡張した、日本語用の符号化文字集合を規定する日本工業規格 (JIS) である。規格名称は「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」である。 2000年に制定、2004年、2012年に改正された。2000年に制定されたJIS X 0213:2000は通称「JIS2000」と呼ばれている。2004年に改正されたJIS X 0213:2004は通称「JIS2004」と呼ばれている。 JIS X 0208を拡張した規格で、JIS X 0208が規定する6879字の図形文字の集合に対して、日本語の文字コードで運用する必要性の高い4354字が追加され、計1万1233字の図形文字を規定する。JIS X 0208を拡張する点においてJIS X 0212:1990と同目的であるが、JIS X 0212とJIS X 0213との間に互換性はない。JIS X 0212がJIS X 0208にない文字を集めた文字集合であるのに対し、JIS X 0213はJIS X 0208を包含し更に第三・第四水準漢字などを加えた上位集合である。.

新しい!!: 文字コードとJIS X 0213 · 続きを見る »

JIS X 0221

JIS X 0221は、日本工業規格(JIS)の制定している文字コード規格の一つで規格の名称は「国際符号化文字集合(UCS)」、ISO/IEC 10646の国際一致規格である。.

新しい!!: 文字コードとJIS X 0221 · 続きを見る »

JTB

JR北海道) 株式会社JTB(JTB Corporation)は、日本の旅行会社で、JTBグループを統括する持株会社である。本社は東京都品川区にある。.

新しい!!: 文字コードとJTB · 続きを見る »

KOI8-R

KOI8-Rはロシア語のキリル文字を扱うよう設計された、8ビットの文字コードである。ブルガリア語も扱える。ここから派生したKOI8-Uには、ウクライナ語の文字が追加されている。最初のKOI-8符号はソビエト当局により1974年に設計された。 KOI8はISO 8859-5よりもはるかに広く使われ続けている。ISO 8859-5が人気だったことはない。他のよく知られたキリル語文字コードはWindows-1251である。キリル語を他の非ラテン言語と一緒に表現する方法としてUnicodeがある。 KOI8はロシア語で の略であり、「情報交換用符号、8ビット」という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、主に発音の対応するASCIIのラテン文字の符号位置の順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは一見して不自然に見えるが、8ビット目が欠落する文字化けに対処できるという利点がある。たとえば、KOI8-Rで表現した"" (ラテン文字転写例)は8ビット目を落とすと"rUSSKIJ tEKST"になる。大文字と小文字が逆になることで文字化けが発生したことが分かり、文字の発音も近いため、そのまま読めるか、少なくとも復元することはできる。また、これは正しいKOI-7として解釈できる。ASCII文字列"rUSSKIJ tEKST"をKOI-7(КОИ-7 Н1)として解釈すれば""である。一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。.

新しい!!: 文字コードとKOI8-R · 続きを見る »

KOI8-U

KOI8-Uは、キリル文字を使う言語であるウクライナ語をカバーするように設計された、8ビットの文字コードである。ロシア語とブルガリア語をカバーするKOI8-Rに基づくが、8つの図形文字を4つのウクライナ文字Ґ、Є、І、Їの大文字と小文字双方に置き換えている。 有名にならなかったISO 8859-5より、KOI8ははるかに広く使われ続けている。もう1つの広く使われているキリル文字コードはWindows-1251である。将来は、最終的にどちらもUnicodeに取って代わられるかもしれない。 ロシア語で、KOI8は Kod Obmena Informatsiey, 8 bit (Код Обмена Информацией, 8 бит) の略で、"情報交換用符号、8ビット" という意味である。 KOIシリーズの文字集合におけるロシア語のキリル文字は、ISO 8859-5のような自然なキリル文字のアルファベット順ではなく、ASCIIのラテン文字と対応する符号位置に疑似ローマ字順で並べられているという特性を持つ。さらに、大文字と小文字の符号位置は逆になっている。これは不自然に見えるかもしれないが、8ビット目が落ちて文字化けしても、、大文字小文字を入れ替えた翻字をすることで通常のASCII端末上で文章をまだ読める (もしくは少なくとも解読できる) という役に立つ特性である。たとえば、KOI8-Uの "Русский Текст"(ルスキー・テクスト、ロシア語のテキストの意) は8ビット目を落とすと rUSSKIJ tEKSTになる。その一方で、文字コードでソートしても正しいキリル文字の順序にならないという欠点もある。.

新しい!!: 文字コードとKOI8-U · 続きを見る »

KS X 1001

KS X 1001は、韓国でハングルや漢字をあらわすのに用いられている文字コード(符号化文字集合)の規格。以前はKS C 5601といい、現在でもこの名称で呼ばれることが多い。単にKSコードとも呼ばれる。 現代韓国でUnicodeと並んで用いられるほぼ唯一の文字コードである。.

新しい!!: 文字コードとKS X 1001 · 続きを見る »

MacJapanese

MacJapanese または Mac OS Japanese は、アップルが Shift_JIS を独自に拡張した文字コードである。 主にClassic Mac OSのバージョン 7.1からバージョン 9.xまでの間で利用された。.

新しい!!: 文字コードとMacJapanese · 続きを見る »

MacOS

macOS(マックオーエス)は、アップルが開発・販売する、Macのオペレーティングシステムである。かつての名称はOS X、Mac OS Xであった(後述)。 技術的に直系ではないが、Classic Mac OS (Mac OS、System) の後継として、新たにBSD系UNIXをベースに開発された。.

新しい!!: 文字コードとMacOS · 続きを見る »

MELCOM

MELCOMとは、三菱電機が自社製コンピュータに使用していた商標。"Mitsubishi ELectronic COMputer"から。.

新しい!!: 文字コードとMELCOM · 続きを見る »

Microsoft Windows

Microsoft Windows(マイクロソフト ウィンドウズ)は、マイクロソフトが開発・販売するオペレーティングシステム (OS) の製品群。グラフィカルユーザインタフェース (GUI)を採用している。.

新しい!!: 文字コードとMicrosoft Windows · 続きを見る »

Microsoftコードページ932

Microsoft コードページ 932(以下 CP932)は、マイクロソフト及び、MS-DOSのOEMベンダがShift_JISを独自に拡張した文字コードである。また同時に、CP932はShift_JISのWindowsアプリケーションにおける「実装」を指す用語であるとも言える。 この項では、主にShift_JISにおけるマイクロソフトおよび各ベンダの独自拡張部分について言及する。ベンダ独自拡張部分以外の内容については、Shift_JISを参照されたい。 また、マイクロソフト標準キャラクタセットの項目も併せて参照されたい。.

新しい!!: 文字コードとMicrosoftコードページ932 · 続きを見る »

Multipurpose Internet Mail Extensions

Multipurpose Internet Mail Extension(多目的インターネットメール拡張)は、規格上US-ASCIIのテキストしか使用できないインターネットの電子メールでさまざまなフォーマット(書式)を扱えるようにする規格である。通常はMIME(マイム)と略される。RFC 2045、RFC 2046、RFC 2047、RFC 4288、RFC 4289、RFC 2049 で規定されている。.

新しい!!: 文字コードとMultipurpose Internet Mail Extensions · 続きを見る »

POSIX

POSIX(ポシックス、ポジックス、Portable operating system interface)は、各種UNIXを始めとする異なるオペレーティングシステム (OS) 実装に共通のアプリケーションプログラミングインタフェース (API) を定め、移植性の高いアプリケーションソフトウェアの開発を容易にすることを目的としてIEEEが策定したAPI規格である。POSIXという名前はリチャード・ストールマンがIEEEに提案したものである。末尾の「」はUNIX互換OSに「」の字がつく名前が多いことからつけられた。ISO/IEC JTC 1/SC 22でISO/IEC 9945として国際規格になっている。.

新しい!!: 文字コードとPOSIX · 続きを見る »

Punycode

Punycode(ピュニコード、プニコード)とは、国際化ドメイン名で使われる文字符号化方式で、RFC 3492 で定義されている。Unicode で書かれた文字列をDNS内の制限された文字コード空間でも使えるようにするための方式で、ユーザーエージェントの実装に依存する。.

新しい!!: 文字コードとPunycode · 続きを見る »

Ruby

Ruby(ルビー)は、まつもとゆきひろ(通称 Matz)により開発されたオブジェクト指向スクリプト言語であり、スクリプト言語が用いられてきた領域でのオブジェクト指向プログラミングを実現する。 また日本で開発されたプログラミング言語としては初めて国際電気標準会議で国際規格に認証された事例となった。.

新しい!!: 文字コードとRuby · 続きを見る »

Shift JIS

Shift_JIS(シフトジス)は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、現在は標準化文書JIS X 0213の附属書1で規定されている(Shift JIS-2004)。「Shift_JIS」はIANAにおける登録名である 。 マイクロソフトなどの各ベンダーが実装するShift_JISの亜種については「Microsoftコードページ932」を参照。Mac OSが実装する亜種については「MacJapanese」を参照。.

新しい!!: 文字コードとShift JIS · 続きを見る »

Shift JIS-2004

Shift_JIS-2004は、日本の文字を符号化するのに使われる文字コードである。JIS X 0213の符号化方式のひとつである。JIS X 0213:2004の附属書1で定義されている。 JIS X 0208の符号化方式のひとつであるShift_JISと同様に、JIS X 0201の1バイト文字とJIS X 0213の2バイト文字とを組み合わせて運用する符号化方式である。Shift_JISの上位互換となっている。 JIS X 0213には94文字×94文字の面が2つあるが、JIS X 0208の上位互換である第1面はShift_JISの第1バイト0xEFまでの範囲に収まる。面区点番号からShift_JIS-2004のバイト値を求める際、この範囲までの計算方法はShift_JISと同じである。Shift_JIS-2004ではさらに、第2面 (第4水準漢字) を収録するために、第1バイト0xF0から0xFCまでの範囲を用いる。2面で、区番号が1, 3, 4, 5, 8, 12, 13, 14, 15 のときは、第1バイトは (区番号 + 0x1DF) ÷ 2 − (区番号 ÷ 8) × 3 となる。区番号が78から94までのときは、第1バイトは (区番号 + 0x19B) ÷ 2 となる。こうしてJIS X 0213の11,233文字全てを2バイトで表現する。 なお、JIS X 0213の初版 (2000年) では、この符号化方式はShift_JISX0213と命名されていた。2004年改正で追加されたUCS互換漢字10文字の有無だけが異なるが、大きな違いではないためShift_JIS-2004と同一視されることもある。.

新しい!!: 文字コードとShift JIS-2004 · 続きを見る »

System i

AS/400 i5 モデル570(2006年) System iは、IBMのミッドレンジコンピュータシステムのシリーズである。日本ではオフィスコンピュータと分類される場合が多い。 従来のAS/400 (Application System/400)、iSeriesの後継である。2008年4月に後継の Power Systems が発表された。.

新しい!!: 文字コードとSystem i · 続きを見る »

System/360

フォルクスワーゲンで使われているSystem/360 System/360(S/360、システム/360、システムさんろくまる)は、IBMが1964年4月7日(日本では翌4月8日)に発表したメインフレーム コンピュータのシリーズである。1965年から1977年まで出荷された。あらゆる用途をカバーするファミリを形成し、小型から大型まで、商用から科学技術計算まで使われた。コンピュータ・アーキテクチャの確立により、IBMは互換性のある設計で様々な価格のシステムをリリースすることができた。最上位機種以外は命令セットをマイクロプログラム方式で実装しており、8ビットのバイト単位のアドレス指定、十進数計算、浮動小数点数計算などを備えている。.

新しい!!: 文字コードとSystem/360 · 続きを見る »

TIS-620

Thai Industrial Standard 620-2533 (タイ工業規格、通称TIS-620) はタイ語でもっともよく使われる文字集合および文字符号化方式である。この規格はタイ王国政府工業省の機関タイ工業規格協会 (Thai Industrial Standards Institute; TISI) によって発行され、タイ王国においてタイ語を符号化するための唯一の公的規格である。規格の記述的な名称は "Standard for Thai Character Codes for Computers" (รหัสสำหรับอักขระไทยที่ใช้กับคอมพิวเตอร์) である。"2533" は現在の規格が発行されたタイ暦2533年 (1990年) を指す。以前の版である TIS 620-2529 (1986年) は、廃止された。.

新しい!!: 文字コードとTIS-620 · 続きを見る »

TRIPS

TRIPS.

新しい!!: 文字コードとTRIPS · 続きを見る »

TRONコード

TRONコード(トロンコード)とは、TRONプロジェクトで使用されている文字コードである。TRON多国語言語環境の初期論文は1987年に発表され(「TAD言語環境と多国語対応」)、以来主にBTRONで利用されてきた。.

新しい!!: 文字コードとTRONコード · 続きを見る »

U-PRESS

U-PRESS (ゆーぷれす) とは共同通信社が独自に策定した文字コード(文字符号化方式および文字セット)。Unicode2.1をベースに基本多言語面 (BMP) の私用領域に新聞独特の外字を配置したもので、総収録文字数は15,269文字である。.

新しい!!: 文字コードとU-PRESS · 続きを見る »

Unicode

200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

新しい!!: 文字コードとUnicode · 続きを見る »

UNIVAC

UNIVAC(ユニバック)は、アメリカのコンピュータ企業。 1950年、エッカート・モークリ社(ENIACを開発した2人の技術者が設立した会社)を買収したレミントンランド社が商用コンピュータ部門として発足させたのが始まりである。 UNIVACという名称は、UNIVersal Automatic Computer の略。.

新しい!!: 文字コードとUNIVAC · 続きを見る »

UTF-16

UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。.

新しい!!: 文字コードとUTF-16 · 続きを見る »

UTF-32

UTF-32(およびUCS-4、#歴史を参照)は、Unicodeの各符号位置に32ビット符号単位一つだけを使う、固定長のUnicodeの符号化形式及び符号化スキーム(文字符号化方式#文字符号化形式と文字符号化スキーム)である。他のUTF(Unicode transformation format)はすべて符号位置によって符号単位列の長さが変化する可変長であるため、UTF-32はもっとも単純なUTFであるとみなせる。 UTF-32は、テキストファイルで使用されることは少なく、主にシステムのメモリ上での管理や、符号位置の数で管理するデータベースなどで使用される。.

新しい!!: 文字コードとUTF-32 · 続きを見る »

UTF-7

UTF-7(ユーティーエフなな、ユーティーエフセブン)はISO/IEC 10646(UCS)とUnicodeで使える7ビット符号単位の文字符号化形式及び文字符号化スキーム。 7ビットでしか送信できない制限があるプロトコル上のメールやニュースなどの環境で、その体系上でUnicodeのメールを送信可能にするために作られた規格である。 現在では正しく実装されていないアプリケーション上でセキュリティー上の脆弱性を発生させることがあることから、あまり使われなくなっている。 IMAP4では、UTF-7を変更した規格である修正UTF-7の規格があり、この規格は2010年代現在においては頻繁に使用される。.

新しい!!: 文字コードとUTF-7 · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

新しい!!: 文字コードとUTF-8 · 続きを見る »

UTF-EBCDIC

UTF-EBCDICはUnicode文字の表現に使われる文字コードである。EBCDICと親和性があり、メインフレーム上で動作する従来のEBCDICアプリケーションが大きな困難なしに文字を処理できるようにすることを意図している。既存のEBCDICベースのシステムにとっての利点は、既存のASCIIベースシステムにとってのUTF-8の利点に類似する。UTF-EBCDICの詳細はUnicode技術報告 #16で定義されている。 UTF-EBCDICで符号化されたUnicode符号位置の並びを得るには、UTF-8に基づいた符号化 (UTF-8-Modと呼ばれる仕様) をまず適用する。この符号化がUTF-8と主に異なる点は、Unicode符号位置の0080からU+009Fまで (C1制御文字) を、後で対応するEBCDICの制御文字へマップするため1バイトで表現できるようにしている点である。これを達成するため、10XXXXXXの代わりに101XXXXXがマルチバイトシーケンスにおける後続バイトの形式として使われる。これは1バイトあたり6ビット保持できるUTF-8と異なり5ビットしか保持できないため、一般にUTF-EBCDICは同じ入力データに対してUTF-8よりも大きな出力を生成する。 この変換ではデータはまだASCIIベースの形式であるため、表索引を用いて可逆なバイト単位の変換をこのデータに適用し、可能な限り通常のEBCDICコードページに近づける。これらの手順を逆にたどることにより容易にUnicode符号位置へ復元できる。 一般に、設計対象であったEBCDICベースのメインフレームにおいてさえ、この符号化形式は滅多に使われない。z/OSのような、IBM製のEBCDICベースのメインフレームのオペレーティングシステムは、通常完全なUnicodeサポートにUTF-16を使用する。たとえば、DB2 UDB、COBOL、PL/I、JavaおよびIBM XMLツールキットはIBMのメインフレーム上でUTF-16をサポートする。.

新しい!!: 文字コードとUTF-EBCDIC · 続きを見る »

VAX

VAX (バックス) は、1970年代中ごろディジタル・イクイップメント・コーポレーション (DEC) が開発し販売した32ビットのミニコンピュータのシリーズ、及び同シリーズの命令セットアーキテクチャ (ISA) を指すこともある。前述のように32ビットアーキテクチャだが、同時に16ビット時代の最も人気のあったモデルであるPDP-11の後継ないし代替を意識した互換命令などを持っている点では、PDP-11の拡張という面もあるアーキテチャでもある。 直交性の高い命令セット(機械語)とページング方式の仮想記憶が特徴である。VAXには、キュー挿入/削除命令や多項式計算命令などといった複雑な処理をする命令があり、豊富なアドレッシングモードとの組み合わせ-->といった特徴がある。 後の64ビット化では、RISCマイクロプロセッサのAlphaがデザインされた。OSのVMSはOpenVMSという名称となっている。.

新しい!!: 文字コードとVAX · 続きを見る »

VMS

VMS.

新しい!!: 文字コードとVMS · 続きを見る »

Windows-1252

Windows-1252またはコードページ1252 (Code Page 1252, CP1252) は、Microsoft Windowsの英語版および他の数種の西欧言語版で従来のコンポーネントが既定で使用するラテン文字の文字コードである。.

新しい!!: 文字コードとWindows-1252 · 続きを見る »

World Wide Web

World Wide Web(ワールド・ワイド・ウェブ、略名:WWW)とは、インターネット上で提供されるハイパーテキストシステム。Web、ウェブ、W3(ダブリュー スリー)とも呼ばれる。俗には「インターネット」という表現がワールド・ワイド・ウェブを指す場合もある。.

新しい!!: 文字コードとWorld Wide Web · 続きを見る »

World Wide Web Consortium

World Wide Web Consortium(ワールド・ワイド・ウェブ・コンソーシアム)は、World Wide Webで使用される各種技術の標準化を推進する為に設立された標準化団体、非営利団体。略称はW3C(ダブリュースリーシー)。 ティム・バーナーズ=リーが創設し、率いている 。このコンソーシアムには企業や団体が会員として加入し、専任スタッフと共にWorld Wide Webの標準策定を行っている。2014年1月26日現在、388の組織が会員として加入している。 W3Cはまた教育活動も行っており、ソフトウェアを開発してWebに関するオープンな議論の場を提供している。 HTML、XML、MathML、DOM等の規格を勧告。HTMLは、従来IETFでRFCとして標準化されていたが、HTML 3.2以降はW3Cへと引き継がれた。 XHTMLの規格に不満を持った企業等はW3Cに対抗するWHATWGという対抗団体を立ち上げているが、両団体はHTML5の策定にあたって協力関係にあり、WHATWGによって2004年に定められたWeb Applications 1.0にWeb Forms 2.0を取り入れたものがW3Cの専門委員会に採用され、W3Cより2008年1月22日にドラフト(草案)が発表された。.

新しい!!: 文字コードとWorld Wide Web Consortium · 続きを見る »

機種依存文字

機種依存文字(きしゅいぞんもじ)または環境依存文字(かんきょういぞんもじ)とは、電子的に扱う文字データのうち、処理系(ソフトウェアおよびハードウェア)によって違う文字に表示されたり、全く表示印刷できなかったりするものの慣用的な総称である。JEFやJIPS等のようなメインフレーム/汎用機用の符号化文字集合については、文字コード体系そのものが機種依存するという前提があるため、本項では扱わない。 不特定多数との情報通信で機種依存文字を使用すると文字化けの原因にもなる。.

新しい!!: 文字コードと機種依存文字 · 続きを見る »

朝鮮語

朝鮮語(ちょうせんご)または韓国語(かんこくご)は、主に朝鮮民族が使う言語で、朝鮮半島の大韓民国(韓国)、朝鮮民主主義人民共和国(北朝鮮)および中華人民共和国吉林省延辺朝鮮族自治州・長白朝鮮族自治県の公用語。 韓国での政府呼称は「韓国語」、北朝鮮での政府呼称は「朝鮮語」である。日本において「韓国語」は、専ら韓国の言語を指す呼称として用いられ、南北を区別しない呼称としては、言語学・音韻論など学術的にも、標準表記として「朝鮮語」が用いられるので、ここでは言語名を全て朝鮮語に統一して記述する。.

新しい!!: 文字コードと朝鮮語 · 続きを見る »

戸籍統一文字

戸籍統一文字(こせきとういつもじ)とは、日本の戸籍システムにおいて戸籍に記載できる文字、すなわち戸籍システムが取り扱う必要がある文字のことであり、戸籍統一文字番号とは、戸籍統一文字に付された番号のことである。.

新しい!!: 文字コードと戸籍統一文字 · 続きを見る »

新潮文庫の100冊

新潮文庫の100冊(しんちょうぶんこのひゃくさつ)は、新潮社が1976年から毎年夏に行っている新潮文庫のキャンペーン、もしくは1995年発行のCD-ROMによる電子書籍。また、2000年には「新潮文庫20世紀の100冊」という企画も行われた。 いずれも「100冊」と銘打っているが、新潮文庫で上下巻などに分かれている作品でも1冊としているため、実際は100冊以上となる。.

新しい!!: 文字コードと新潮文庫の100冊 · 続きを見る »

文字

文字(もじ)とは、言葉・言語を伝達し記録するために線や点を使って形作られた記号のこと。文字の起源は、多くの場合ものごとを簡略化して描いた絵文字(ピクトグラム)であり、それが転用されたり変形、簡略化されたりして文字となったと見られる。.

新しい!!: 文字コードと文字 · 続きを見る »

文字化け

文字化け(もじばけ)とは、コンピュータで文字を表示する際に、正しく表示されない現象のこと。.

新しい!!: 文字コードと文字化け · 続きを見る »

文字符号化方式

文字符号化方式(もじふごうかほうしき、character encoding scheme、CES)とは、符号化文字集合で文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換する符号化方式。 文字符号化体系、文字符号化スキーム (character coding scheme) とも言う。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 (encoding scheme) などとも言う。 この用語はUnicodeやIETFの標準などで用いているが、ISO/IECやJISの標準では用いず「符号化文字集合の構造」あるいは「'''文字符号の構造及び拡張法'''」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。.

新しい!!: 文字コードと文字符号化方式 · 続きを見る »

文字集合

文字集合(もじしゅうごう、character set)は、文字(キャラクタ (コンピュータ))をその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.

新しい!!: 文字コードと文字集合 · 続きを見る »

日立製作所

株式会社日立製作所(ひたちせいさくしょ、Hitachi, Ltd.)は、日本の電機メーカーであり、日立グループの中核企業。国内最大の電気機器メーカー。 通称は日立やHITACHIなど。特に創業の地であり、主力工場を抱える茨城県日立市などでは、行政機関の日立市や他の日立グループ各社などと区別するため日立製作所の略称で日製(にっせい)とも呼ばれている(後述参照)。 前身は、現在の茨城県日立市にあった銅と硫化鉄鉱を産出する久原鉱業所日立鉱山である。日立鉱山を母体として久原財閥が誕生し、久原財閥の流れを受けて日産コンツェルンが形成された。また、日立鉱山で使用する機械の修理製造部門が、1910年に国産初の5馬力誘導電動機(モーター)を完成させて、日立製作所が設立された。やがて日本最大規模の総合電機メーカー、そして世界有数の大手電機メーカーとして発展することとなる。.

新しい!!: 文字コードと日立製作所 · 続きを見る »

日本工業規格

鉱工業品用) 日本工業規格(にほんこうぎょうきかく、Japanese Industrial Standards)は、工業標準化法に基づき、日本工業標準調査会の答申を受けて、主務大臣が制定する工業標準であり、日本の国家標準の一つである。JIS(ジス)またはJIS規格(ジスきかく)と通称されている。JISのSは英語 Standards の頭文字であって規格を意味するので、「JIS規格」という表現は冗長であり、これを誤りとする人もある。ただし、この表現は、日本工業標準調査会、日本規格協会およびNHKのサイトでも一部用いられている。.

新しい!!: 文字コードと日本工業規格 · 続きを見る »

日本ユニシス

日本ユニシス株式会社(にほんユニシス、英文社名:Nihon Unisys, Ltd.)は、大日本印刷の関連会社であり、東京都江東区豊洲に本社を置く、ビジネスソリューションを提供するITサービス企業。また、グループ企業であるユニアデックスなどと、ICT(情報通信技術)サービスの提供や情報システム構築を行うシステムインテグレーターでもある。.

新しい!!: 文字コードと日本ユニシス · 続きを見る »

日本アイ・ビー・エム

日本アイ・ビー・エム株式会社(にほんアイ・ビー・エム、日本IBM、英文表記:IBM Japan, Ltd.)は、米IBM(IBM Corporation)の日本法人。米IBMの100%子会社である有限会社アイ・ビー・エム・エーピー・ホールディングス(APH。後述のIBM APとは別の日本法人)の100%子会社であり、米IBMの孫会社にあたる。.

新しい!!: 文字コードと日本アイ・ビー・エム · 続きを見る »

日本語

日本語(にほんご、にっぽんご「にっぽんご」を見出し語に立てている国語辞典は日本国語大辞典など少数にとどまる。)は、主に日本国内や日本人同士の間で使用されている言語である。 日本は法令によって公用語を規定していないが、法令その他の公用文は全て日本語で記述され、各種法令において日本語を用いることが規定され、学校教育においては「国語」として学習を課されるなど、事実上、唯一の公用語となっている。 使用人口について正確な統計はないが、日本国内の人口、および日本国外に住む日本人や日系人、日本がかつて統治した地域の一部住民など、約1億3千万人以上と考えられている。統計によって前後する場合もあるが、この数は世界の母語話者数で上位10位以内に入る人数である。 日本で生まれ育ったほとんどの人は、日本語を母語とする多くの場合、外国籍であっても日本で生まれ育てば日本語が一番話しやすい。しかし日本語以外を母語として育つ場合もあり、また琉球語を日本語と別の言語とする立場を採る考え方などもあるため、一概に「全て」と言い切れるわけではない。。日本語の文法体系や音韻体系を反映する手話として日本語対応手話がある。 2017年4月現在、インターネット上の言語使用者数は、英語、中国語、スペイン語、アラビア語、ポルトガル語、マレー語に次いで7番目に多い。.

新しい!!: 文字コードと日本語 · 続きを見る »

日本電気

日本電気株式会社(にっぽんでんき、NEC Corporation、略称:NEC(エヌ・イー・シー)、旧英社名 の略)は、東京都港区芝五丁目(元・東京都港区芝三田四国町)に本社を置く住友グループの電機メーカー。 日電(にちでん)と略されることも稀にあるが、一般的には略称の『NEC』が使われ、ロゴマークや関連会社の名前などにも「NEC」が用いられている。 住友電気工業と兄弟会社で、同社及び住友商事とともに住友新御三家の一角であるが、住友の象徴である井桁マークは使用していない。.

新しい!!: 文字コードと日本電気 · 続きを見る »

拡張漢字

拡張漢字(かくちょうかんじ)とは、文字コード(漢字コード)において何らかの形でもとから含まれていた漢字に追加された漢字をいう。.

新しい!!: 文字コードと拡張漢字 · 続きを見る »

8ビット

CPUは一つの命令で操作できるデータによって分類することができる。16ビットプロセッサが一つの命令で16ビットのデータを操作できるのに対して、8ビットプロセッサは一つの命令で8ビットしか操作できない。 8ビットプロセッサの例.

新しい!!: 文字コードと8ビット · 続きを見る »

ここにリダイレクトされます:

8ビットクリーン漢字コード文字符号

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »