ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
インストール
ブラウザよりも高速アクセス!
 

テキストファイル

索引 テキストファイル

テキストファイル (Text File) は、文字など文字コードによって表されるデータだけが含まれるファイルのことで、ファイルフォーマットの一種と見なすこともできる。互換性が高く幅広い環境でデータを利用できる利点がある一方、単純な文字だけしか扱えないという制限がある。対義語はバイナリファイル。.

56 関係: ASCII一太郎互換性マルチメディアバイナリメインフレームレコードプリンタープレーンテキストパーソナルコンピュータテキストテキストエディタデータ圧縮ディスプレイ (コンピュータ)ファイル (コンピュータ)ファイルフォーマット制御文字アラビア文字アプリケーションソフトウェアインターネットウェブブラウザオペレーティングシステムコンピュータタブキー動画CP/M画像EBCDICEnd Of FileEUC-JPExtensible Markup Language音声行 (コンピュータ)英数字電子メールHyperText Markup LanguageISO-2022-JPLaTeXMac OSMicrosoft ExcelMicrosoft WindowsMicrosoft WordMS-DOSPerlPortable Document FormatSed (コンピュータ)Shift JISUnicodeUNIXUTF-16...UTF-8標準化文字文字コード文字符号化方式文字集合 インデックスを展開 (6 もっと) »

ASCII

ASCII(アスキー、American Standard Code for Information Interchange)は、現代英語や西ヨーロッパ言語で使われるラテン文字を中心とした文字コード。これはコンピュータその他の通信機器において最もよく使われているものである。.

新しい!!: テキストファイルとASCII · 続きを見る »

一太郎

一太郎(いちたろう)は、ジャストシステムが販売する日本語ワープロソフトの名称であり、同社の看板製品である。また、同社の登録商標となっている。.

新しい!!: テキストファイルと一太郎 · 続きを見る »

互換性

互換性(ごかんせい、)とは、ある部品やコンポーネント(構成要素)などを置き換えても同様に動作させることができる性質のこと。 特に工業製品では、互換性を確保することで新たなシステムを用意する必要がなくなり、設計や部品の再利用性が高まることでコストカットを見込めることや、過去の製品からの買い替えなどを進めることができたりする。ただし、古い基準に縛られてしまうために技術革新の妨げとなるという側面もある。互換性を確保するために余計なコストがかかる場合は軽視されることがあるほか、メーカー間の互換性はベンダーロックインを狙うため、あえて削ぐものもある。.

新しい!!: テキストファイルと互換性 · 続きを見る »

マルチメディア

マルチメディア(英語:multimedia)とは、複数の種類の情報をひとまとめにして扱うメディアのことである。一般的には映像や音楽など動的コンテンツを含むイメージで捉えられることが多い。複合媒体と訳す。.

新しい!!: テキストファイルとマルチメディア · 続きを見る »

バイナリ

バイナリ (binary) とは二進法のことであるが、コンピュータが処理・記憶するために2進化されたファイルまたはその内部表現の形式(バイナリデータ)のことを指して用いることが多い。 コンピュータが扱うすべてのデータはバイナリデータ(バイトの並び)であり、プレーンテキスト(または単にテキスト)もバイナリデータの一種ではあるが、通常バイナリとテキストは対比して用いられる。テキストとはデータの内容すべてを人間が読んで理解できる (human-readable) もの、バイナリとはそうでないものを指す。human-readableに対する語はmachine-readableだが、これは(機械的に読むことが可能であるように)フォーマットが定められているもの、という意味である。バイナリフォーマットではエンディアンなどに互換性・移植性の上で注意が必要であり、それを避けてテキスト形式で記録することも少なくない(UNIX哲学も参照。なお浮動小数点数やループした構造の表現など、テキスト形式にも注意が必要な点は多い)。バイナリエディタを用いると、バイナリファイルを1バイトずつの(16進法での)数値の並びとして表示・編集を行うことができる。バイナリのファイルでも多くは部分的にテキストとして読み取れる箇所が存在するため、そういった箇所のみを抜き出すstringsというユーティリティもある。 バイナリファイルにはたとえば画像ファイルや音声ファイル、圧縮されたファイルなどがある。バイナリファイルの中にはファイルの先頭にメタ情報(ヘッダ)を持っているものがある。たとえばGIFファイルは複数の画像を持つことができ、ファイルの先頭でそれぞれの画像を区別する情報が記述されている。そのようなメタ情報を持たないファイルはフラットバイナリファイルと呼ばれる。コンピュータプログラム関係では、テキストであるソースコードとの対比からコンパイルされたコード(オブジェクトファイルや実行ファイルなど。またそのような機械語(ネイティブバイナリ)に限らず、WebAssemblyやJavaなどのバイトコード類なども含む)のファイル等を指してバイナリと呼ばれることがしばしばある。プロプライエタリのソフトウェアは、バイナリの形態でさらに難読化を掛けて、販売されることが多い。 バイナリ形式でのデータの表現方法はさまざまなものがある。例えば、数値であれば0~9までの数をパターン化して記録するBCD、ゾーンビットと実際の数値、正の数か負の数かを記録する符号ビットからなるアンパック10進数(ゾーン10進数)や、実際の数値と符号ビットだけからなるパック10進数などがある。文字列の扱いとしては、ナル文字('\0')で終端する方法や、長さ(オクテット数、あるいは文字(符号点)の個数)を別に保持する、といった方式がある。前者では、'\0' を含むようなバイナリを「文字列」として扱うことができない。.

新しい!!: テキストファイルとバイナリ · 続きを見る »

メインフレーム

IBM 704 メインフレーム メインフレーム(mainframe)は、主に企業など巨大な組織の基幹業務用などに使用される、大型コンピュータを指す用語。汎用コンピュータ、汎用機、汎用大型コンピュータ、大型汎用コンピュータ、ホストコンピュータ、大型汎用計算機 などとも呼ばれる。対比語は時代にもより専用機、分散コンピュータ(オープン系システム)など。.

新しい!!: テキストファイルとメインフレーム · 続きを見る »

レコード

ングルレコード盤(ドーナツ盤ともいわれる) レコード (record, vinyl record, 英語版ではgramophone record)とは、音声記録を意味し、主に樹脂などでできた円盤(最初期には円筒状の蝋管レコードを含む)に音楽や音声などの音響情報を刻み込み記録したメディアの一種を示すことが多い。音盤などその他の呼び方で呼ばれることもある。 音の再生の方法は信号としての振幅の情報の読み取り方と情報の増幅により異なる。針で読み取った振幅の情報を、機械的に増幅する蓄音機の時代、電気信号に変えて増幅するレコードプレーヤーの時代、そして針を使わずレーザーを用いて非接触再生するレーザーターンテーブルの時代(レコード末期以降から近年にかけての特殊な時代)に大まかに分類することができる。.

新しい!!: テキストファイルとレコード · 続きを見る »

プリンター

プソン・PM-700C(1996年〈平成8年〉11月発売) プリンター()は、印刷用の機器の総称である。印刷機(いんさつき)などとも呼ばれる。 本稿では特にコンピュータからの情報の出力に用いられる機械について説明する。その他のプリンター、印刷機については、印刷を参照。.

新しい!!: テキストファイルとプリンター · 続きを見る »

プレーンテキスト

プレーンテキスト (plain text) とは、コンピュータ上で文章を扱うための一般的なファイルフォーマット、または文字列の形式である。厳密にはASCIIのみ、さらに厳密には7ビットASCIIで構成された文書だけを指すが、パソコンが多言語化し様々な文字コードが扱われている現在では、特定の文字コードに準拠したバイナリファイルだと定義できる。ワープロで作成した文章とは違い、文字ごとの色や形状、文章に含まれる図などといった情報を含まない。プレーンテキストに対して、文字ごとの色や形状、文章に含まれる図などといった情報を含む文章のことをマルチスタイルテキストと呼ぶ。しかし、マルチスタイルテキストの一部もファイルフォーマットとしてはプレーンテキストのみで構成されているものもある。 プレーンテキストには文字情報以外の情報は一切含まず、テキストデータのみで構成されている。バイナリデータや文字の整形情報を持たないので、最低限の機能しか持たないテキストエディタや表示用のソフトウェアで扱えると言う点で利便性が高い。その反面、格納できる情報が純粋にテキストのみに限定される為、文字の強調や加工や言語情報、フォント情報を持つことが出来ない。これらの情報を格納する場合は、HTMLのような工夫が必要になる。 MS-DOS、Windowsでは、EDLINやメモ帳、UNIXやLinuxの場合はviやEmacs、Mac OSの場合はSimpleText、macOSの場合はテキストエディットなどといったOSに標準的に付属するソフトウェアで編集することが出来る。 なお、テキストエディタを使うことで、プログラミング言語のソースコードやHTML、XML、TeXといった純粋なテキストのみで構成されているファイルを編集する事も可能である。.

新しい!!: テキストファイルとプレーンテキスト · 続きを見る »

パーソナルコンピュータ

パーソナルコンピュータ(personal computer)とは、個人によって占有されて使用されるコンピュータのことである。 略称はパソコン日本独自の略語である。(著書『インターネットの秘密』より)またはPC(ピーシー)ただし「PC」という略称は、特にPC/AT互換機を指す場合もある。「Mac対PC」のような用法。。.

新しい!!: テキストファイルとパーソナルコンピュータ · 続きを見る »

テキスト

テキスト(text、Text、texte、テクスト)は、文章や文献のひとまとまりを指して呼ぶ呼称。 言葉によって編まれたもの、という含みを持つ語で、textile(テキスタイル、「織物」)と同じくラテン語の「織る」が語源である。.

新しい!!: テキストファイルとテキスト · 続きを見る »

テキストエディタ

テキストエディタ(text editor)とはコンピュータで文字情報(テキスト)のみのファイル、すなわちテキストファイルを作成、編集、保存するためのソフトウェア(プログラム)である。一般的に、文字情報の入力、削除、コピー、貼り付け、検索、置換、整形などの機能を備えている。Windowsのメモ帳や、macOSのテキストエディット、UNIXのvi、Emacsなど、多くのオペレーティングシステム (OS) やデスクトップ環境に最初から装備されている。.

新しい!!: テキストファイルとテキストエディタ · 続きを見る »

データ圧縮

データ圧縮(データあっしゅく)とは、あるデータをそのデータの実質的な性質(専門用語では「情報量」)を保ったまま、データ量を減らした別のデータに変換すること。高効率符号化ともいう-->。アナログ技術を用いた通信技術においては通信路の帯域幅を削減する効果を得るための圧縮ということで帯域圧縮ともいわれた。デジタル技術では、情報を元の表現よりも少ないビット数で符号化することを意味する。 データ圧縮には大きく分けて可逆圧縮と非可逆圧縮がある。というより正確には非可逆圧縮はデータ圧縮ではない。可逆圧縮は統計的冗長性を特定・除去することでビット数を削減する。可逆圧縮では情報が失われない。非可逆圧縮は不必要な情報を特定・除去することでビット数を削減する。しかしここで「不必要な」とは、例えばMP3オーディオの場合「ヒトの聴覚では通常は識別できない」という意味であり、冒頭の「情報量を保ったまま」という定義を破っている。データファイルのサイズを小さくする処理は一般にデータ圧縮と呼ばれるが、データを記録または転送する前に符号化するという意味では情報源符号化である。 圧縮は、データ転送におけるトラフィックやデータ蓄積に必要な記憶容量の削減といった面で有効である。しかし圧縮されたデータは、利用する前に伸長(解凍)するという追加の処理を必要とする。つまりデータ圧縮は、空間計算量を時間計算量に変換することに他ならない。例えば映像の圧縮においては、それをスムースに再生するために高速に伸長(解凍)する高価なハードウェアが必要となるかもしれないが、圧縮しなければ大容量の記憶装置を必要とするかもしれない。データ圧縮方式の設計には様々な要因のトレードオフがからんでおり、圧縮率をどうするか、(非可逆圧縮の場合)歪みをどの程度許容するか、データの圧縮伸長に必要とされる計算リソースの量などを考慮する。 新たな代替技法として、圧縮センシングの原理を使ったリソース効率のよい技法が登場している。圧縮センシング技法は注意深くサンプリングすることでデータ圧縮の必要性を避けることができる。.

新しい!!: テキストファイルとデータ圧縮 · 続きを見る »

ディスプレイ (コンピュータ)

ディスプレイ(display) はモニタ (monitor) ともいい、コンピュータなどの機器から出力される静止画または動画の映像信号を表示する機器である。.

新しい!!: テキストファイルとディスプレイ (コンピュータ) · 続きを見る »

ファイル (コンピュータ)

ンピュータにおけるファイル(file)は、コンピュータでデータを扱いやすくするための仕組み。場合によってはデータセット(data set)とも呼ばれる。.

新しい!!: テキストファイルとファイル (コンピュータ) · 続きを見る »

ファイルフォーマット

ファイルフォーマットはコンピュータなどの情報機器で利用するファイルの保存形式である。コンピュータで扱う文書、音声、画像、動画などのさまざまなメディアのファイルを特定の利用方法やアプリケーションソフトウェアで共通に扱うための形式や規格のこと。.

新しい!!: テキストファイルとファイルフォーマット · 続きを見る »

制御文字

ンピューティングと電気通信において、制御文字(せいぎょもじ、control character)とは、文字コードの規格で定義される文字のうち、ディスプレイ・プリンター・通信装置などに対して、特別な動作(制御)をさせるために使う文字である。制御キャラクタともいい、情報処理用語規格では「制御機能文字」と呼ばれている。 「文字」という名前であるがディスプレイやプリンターには表示されない。そのため、非表示文字(ひひょうじもじ、non-printing character、印字不可文字)とも言う。それに対し、制御文字以外の表示可能な文字を図形文字(graphic character)という。図形文字と制御文字は電気信号上は区別がなく、同じデータストリーム上に現われる。これをという。 制御文字にどのような文字コードを割り当てるかは、ASCII、EBCDICなどの文字コード体系により異なる。ASCIIでは0から31および127が制御文字に割り当てられている(技術的にはこれをという)。ISO 8859で定義される拡張ASCIIでは、これに128から159までの制御文字を追加した。これはと呼ばれる。 これらの65個の制御文字はUnicodeに引き継がれた。Unicodeではさらに制御文字を追加しているが、これはゼロ幅非接合子のようなフォーマット用文字とは区別される。 EBCDICには、ASCIIの65個の制御文字全てのほか、主としてIBMの周辺機器を制御するための追加の制御文字が含まれている。.

新しい!!: テキストファイルと制御文字 · 続きを見る »

アラビア文字

アラビア文字(アラビアもじ)は、アラビア語をはじめ、世界中のイスラム文化圏に属する諸言語を記述するのに使われる文字。ラテン文字、漢字に次いで、世界で三番目に使用者数が多い文字体系である。.

新しい!!: テキストファイルとアラビア文字 · 続きを見る »

アプリケーションソフトウェア

アプリケーションスイートである。 アプリケーションソフトウェア(application software, 応用ソフトウェア)は、アプリケーション(応用)プログラムともいい、ワープロや表計算などといった、コンピュータを「応用」する目的に応じた、コンピュータ・プログラムである。なお、それに対してシステムプログラムは、アプリケーションプログラムに対して処理実行のための計算機資源を抽象化して提供する、などのインフラとしての役割のプログラムであり、ユーザーが要求する情報処理を直接実行するものではなく、ユーザーが普段は意識することはない裏方的な存在がシステムプログラムである。.

新しい!!: テキストファイルとアプリケーションソフトウェア · 続きを見る »

インターネット

インターネット(internet)は、インターネット・プロトコル・スイートを使用し、複数のコンピュータネットワークを相互接続した、グローバルな情報通信網のことである。 インターネットは、光ファイバーや無線を含む幅広い通信技術により結合された、地域からグローバルまでの範囲を持つ、個人・公共・教育機関・商用・政府などの各ネットワークから構成された「ネットワークのネットワーク」であり、ウェブのハイパーテキスト文書やアプリケーション、電子メール、音声通信、ファイル共有のピア・トゥ・ピアなどを含む、広範な情報とサービスの基盤となっている。.

新しい!!: テキストファイルとインターネット · 続きを見る »

ウェブブラウザ

情報なし ウィキメディア財団のサーバにアクセスしたウェブブラウザの割合(2012年12月) ウェブブラウザ(インターネットブラウザ、web browser)とは、 World Wide Web (WWW) の利用に供するブラウザであり、ユーザエージェント (UA) である。具体的には、ウェブページを画面や印刷機に出力したり、ハイパーリンクをたどったりするなどの機能がある。単にブラウザ(ブラウザー)と呼んだ場合、多くはウェブブラウザのことを指す。 WWW 上の情報リソースを扱うアプリケーションであり、ウェブページ・画像・動画・音声等の情報リソースの識別には Uniform Resource Identifier (URI) を使用する。 ウェブブラウザは WWW への接続を第一の目的としているが、プライベートネットワーク内の Web サーバやファイルシステム内のファイルが提供する情報への接続にも利用できる。主なウェブブラウザとして、Internet Explorer, Microsoft Edge, Mozilla Firefox, Google Chrome, Opera, Safari 等がある。.

新しい!!: テキストファイルとウェブブラウザ · 続きを見る »

オペレーティングシステム

ペレーティングシステム(Operating System、OS、オーエス)とは、コンピュータのオペレーション(操作・運用・運転)のために、ソフトウェアの中でも基本的、中核的位置づけのシステムソフトウェアである。通常、OSメーカーが組み上げたコンピュータプログラムの集合として、作成され提供されている。 オペレーティングシステムは通常、ユーザーやアプリケーションプログラムとハードウェアの中間に位置し、ユーザーやアプリケーションプログラムに対して標準的なインターフェースを提供すると同時に、ハードウェアなどの各リソースに対して効率的な管理を行う。現代のオペレーティングシステムの主な機能は、ファイルシステムなどの補助記憶装置管理、仮想記憶などのメモリ管理、マルチタスクなどのプロセス管理、更にはGUIなどのユーザインタフェース、TCP/IPなどのネットワーク、などがある。オペレーティングシステムは、パーソナルコンピュータからスーパーコンピュータまでの各種のコンピュータや、更にはスマートフォンやゲーム機などを含む各種の組み込みシステムで、内部的に使用されている。 製品としてのOSには、デスクトップ環境やウィンドウシステムなど、あるいはデータベース管理システム (DBMS) などのミドルウェア、ファイル管理ソフトウェアやエディタや各種設定ツールなどのユーティリティ、基本的なアプリケーションソフトウェア(ウェブブラウザや時計などのアクセサリ)が、マーケティング上の理由などから一緒に含められていることもある。 OSの中で、タスク管理やメモリ管理など特に中核的な機能の部分をカーネル、カーネル以外の部分(シェルなど)をユーザランドと呼ぶ事もある。 現代の主なOSには、Microsoft Windows、Windows Phone、IBM z/OS、Android、macOS(OS X)、iOS、Linux、FreeBSD などがある。.

新しい!!: テキストファイルとオペレーティングシステム · 続きを見る »

コンピュータ

ンピュータ(Computer)とは、自動計算機、とくに計算開始後は人手を介さずに計算終了まで動作する電子式汎用計算機。実際の対象は文字の置き換えなど数値計算に限らず、情報処理やコンピューティングと呼ばれる幅広い分野で応用される。現代ではプログラム内蔵方式のディジタルコンピュータを指す場合が多く、特にパーソナルコンピュータやメインフレーム、スーパーコンピュータなどを含めた汎用的なシステムを指すことが多いが、ディジタルコンピュータは特定の機能を実現するために機械や装置等に組み込まれる組み込みシステムとしても広く用いられる。電卓・機械式計算機・アナログ計算機については各項を参照。.

新しい!!: テキストファイルとコンピュータ · 続きを見る »

タブキー

タブキー() は、タイプライターやワードプロセッサ専用機あるいはコンピュータ用のキーボードのキーの一つで、カーソルを次のまで移動させるキーである。元々はタイプライターにおける図表作成機能のために使用された。.

新しい!!: テキストファイルとタブキー · 続きを見る »

動画

動画(どうが、video、movie)とは、動く画像(動画像、videograph)のことで、映像と呼称されることも多い。アニメーション(animation)の日本語訳でもある。 静止画と対極の語であり、狭い定義では「動く画像」、広い定義では時間軸に同期させた音声・音楽と共に提供されるメディアパッケージを指す場合もある。選択した静止画を順次切り替える「スライドショー」「紙芝居」とは異なり、連続して変化する静止画像を高速に切り替え続けると人間の視覚の錯覚として静止画が動いているように見えるを利用した表現様式(メディア)である。 日本語の「動画」は、アニメーター・映像作家の政岡憲三が「アニメーション」の訳語として考案・提唱したものが最初とされ、「〜動画」という社名のアニメ会社も複数設立されるなど実際にその意味で使われてきたが、2000年代以降はアニメーションのみにとどまらず、上記のような性質を持った表現様式も含むより広範囲な映像物を指す言葉としても使用されている。.

新しい!!: テキストファイルと動画 · 続きを見る »

CP/M

CP/M(Control Program for Microcomputer、シーピーエム)は1970年代にデジタルリサーチ (Digital Research Inc.) の創業者ゲイリー・キルドールによって開発、1976年に発売された、パソコン用のシングルユーザー・シングルタスクのオペレーティングシステム (OS) である。 最初は8ビットのCPUであるインテルの8080プロセッサ用に作られ、8ビットのパソコン用OSとしては最も代表的な存在だった。初期に普及したバージョンはCP/M 1.4で、そののち改訂されたCP/M 2.2が広く普及した。さらに、より洗練されたCP/M 3.0 (CP/M Plus) が登場したが、既に16ビットマシンへの移行が始まっていた時期でもあり普及することはなかった。 他のプロセッサに移植されたバージョンも存在するが、単にCP/Mといえば8080プロセッサ用のもの(中でもバージョン2.2)を指す。なおマイクロソフトによってOEMされたIBMのPC DOS(及び、のちにマイクロソフト自らが直販したMS-DOS)は、CP/Mをモデルに開発されたシアトル・コンピュータ・プロダクツの86-DOS(後に "QDOS" と改名)を前身としている。.

新しい!!: テキストファイルとCP/M · 続きを見る »

画像

画像(がぞう)とは、事象を視覚的に媒体に定着させたもので、そこから発展した文字は含まない(例:文字と画像、書画)。定着される媒体は主に2次元平面の紙であるが、金属、石、木、竹、布、樹脂や、モニター・プロジェクター等の出力装置がある。また、3次元の貼り絵、ホログラフィー等も含まれる。.

新しい!!: テキストファイルと画像 · 続きを見る »

EBCDIC

EBCDIC (Extended Binary Coded Decimal Interchange Code、エビシディック、拡張二進化十進コード) はIBMにより定義された8ビットのコード化文字セットである。ASCII普及前の1963年に、'''BCD'''(Binary-coded decimal、二進化十進コード)を拡張する形で作られ、主にIBM系のメインフレームやオフィスコンピュータなどで使用されている。 IBMのCDRA(文字データ表現体系)では、EBCDICは符号化方法(Encoding Scheme)の1つと位置づけられている。各国語などの文字集合であるコードページを、EBCDICなどの符号化方式で符号化するが、EBCDICの符号化にもシングルバイト、ダブルバイト、マルチバイトの構造がある。これらの組み合わせがCCSIDとして定義されており、例えば日本用のEBCDICのCCSIDは、ひらがなや漢字を含まない組み合わせも含めると、10以上定義されている。 この他、IBM以外の互換メーカーなどのEBCDICをベースとした各種の文字コードまたは符号化方法も、EBCDICまたはEBCDIC系と呼ばれる場合がある。.

新しい!!: テキストファイルとEBCDIC · 続きを見る »

End Of File

End Of File(略称EOF)とはファイルの終端のこと。使い方にはいくつかの種類がある。.

新しい!!: テキストファイルとEnd Of File · 続きを見る »

EUC-JP

EUC-JP(Extended UNIX Code Packed Format for Japanese、日本語EUC)はUNIX上で日本語の文字を扱う場合にもっとも多く利用されている文字コード(符号化方式)のひとつである。UNIX以外のOS上で使われることもある。 1980年代前半、日本語UNIXシステム諮問委員会がUNIXで日本語を扱うための文字コードについて議論を行い、議論の結果をもとに1985年4月に同委員会から報告書がAT&Tに出され、AT&Tにより定められたのがEUC-JPの起こりである。AT&Tから、EUC(Extended UNIX Codeの略)として日本語に限らず多言語に対応できるように定められ、EUCのうち日本語を扱うものを特にEUC-JPなどと呼ぶ。他に、EUC-KR(韓国語)、EUC-CN(簡体中国語)等がある。 EUCのエンコード方式上にASCIIとJIS X 0208文字集合を配置したもので、半角カナ (JIS X 0201) とJIS補助漢字 (JIS X 0212) も含むことができる。半角カナと補助漢字を使用しない場合は、JIS X 0208で規定されている符号化方式「国際基準版・漢字用8ビット符号」と同一となる。ISO/IEC 2022に適合する。 日本語文字はJIS X 0208をGR領域に表現したものを基本としており、2バイトで表現され、1バイト目、2バイト目ともに0x80 - 0xFFの範囲内にある。このため英数字と日本語文字の区別がしやすく、プログラム上での扱いが楽である。ただし、半角カナはISO-2022-JPやShift_JISと異なり制御文字SS2(シングルシフトツー、0x8E)に続けて現れるので都合2バイト、補助漢字は制御文字SS3(シングルシフトスリー、0x8F)に続けて現れるので都合3バイトを要する。 JIS X 0213:2004に対応するEUCコードはEUC-JIS-2004(2000年初版時はEUC-JISX0213)。 UNIX系OSの標準的な文字エンコードとして広く使用されてきたが、近年ではUTF-8を使用したシステムも普及している。.

新しい!!: テキストファイルとEUC-JP · 続きを見る »

Extensible Markup Language

Extensible Markup Language(エクステンシブル マークアップ ランゲージ)は、基本的な構文規則を共通とすることで、任意の用途向けの言語に拡張することを容易としたことが特徴のマークアップ言語の総称である。一般的にXML(エックスエムエル)と略称で呼ばれる。JISによる訳語は「拡張可能なマーク付け言語」。 SGMLからの移行を目的として開発された。文法はSGMLの構文解析器と互換性を保つようにSGMLのサブセットに定められシンプルになり、機能はSGMLに無いものが追加されている。 XML の仕様は、World Wide Web Consortium (W3C) により策定・勧告されている。1998年2月に XML 1.0 が勧告された。2010年4月現在、XML 1.0 と XML 1.1 の2つのバージョンが勧告されている(#バージョン)。 ちなみに、「eXtensible Markup Language の略である」と書かれることがあるが、これは間違いであり、XはExの発音を表している。.

新しい!!: テキストファイルとExtensible Markup Language · 続きを見る »

音声

音声(おんせい)とは人の声、すなわち人が発声器官を通じて発する音である。 基本要素として母音と子音がある。さらに、これらを細かく分類して、特定の言語で意味の違いを弁別・認識する音声の基本単位を音素といい、特定の言語に依存せずに、音声学で分類・定義する音声の基本単位を単音という。.

新しい!!: テキストファイルと音声 · 続きを見る »

行 (コンピュータ)

ンピューティングにおいて、行(ぎょう、line)とは、テキストファイルを構成する単位である。1つの行はゼロまたは1以上のキャラクタ(文字)が連続したものであり、通常、行ごとに単独の水平の列として表示される。 ファイルシステムやオペレーティングシステムによって、行の文字数が固定の場合と、行の長さが行ごとに異なっている場合とがある。 固定長の行は「レコード」と呼ばれることもある。通常、可変長の行では、各行の終わりは改行コード(ラインフィード(LF)・キャリッジリターン(CR))などの1つ以上の特殊な行末文字(EOL: end-of-line)によって示される。 0文字(行末文字を含めず)からなる行を空行(くうぎょう)という。制御文字などの非表示文字やだけからなる行も空行に含める場合がある。 テキストファイルを操作するツール(テキストエディタなど)の中には、行番号で行を参照する仕組みを提供するものがある。一部のプログラミング言語では行番号はプログラムの位置を特定するのに使われる。.

新しい!!: テキストファイルと行 (コンピュータ) · 続きを見る »

英数字

英数字(英: alphanumeric)とは、アルファベット (alphabetic) と数字 (numeric) をまとめた概念であり、通常西洋でよく使われるラテン文字とアラビア数字の集合を指す。大文字・小文字を区別しない場合は36文字、区別する場合は62文字が含まれる。英数字は 0 から 9 の数字と、A から Z の文字から成る。 日本では、さらにいわゆる半角カナを加えた英数カナあるいは ANK (Alpha-Numeric Kana) という言葉もある。.

新しい!!: テキストファイルと英数字 · 続きを見る »

電子メール

電子メール(でんしメール、英: Electronic mail、E-mail、Eメール)は、コンピュータネットワークを使用して、郵便のように情報等を交換する手段である。電子郵便(でんしゆうびん)とも言う。.

新しい!!: テキストファイルと電子メール · 続きを見る »

HyperText Markup Language

HyperText Markup Language(ハイパーテキスト マークアップ ランゲージ、HTML(エイチティーエムエル))は、ハイパーテキストを記述するためのマークアップ言語の1つである。World Wide Web (WWW)において、ウェブページ(1990年代後半頃からはコンテンツという語も利用されている。「中身」という意味の語であり、大層な意味は無い)を表現するために用いられる。ハイパーリンクや画像等のマルチメディアを埋め込むハイパーテキストとしての機能、見出しや段落といったドキュメントの抽象構造、フォントや文字色の指定などの見た目の指定、などといった機能がある。 2012年7月以降、WHATWG により仕様が作られ、それを元に W3C により勧告が行われるという流れになっている。W3C は、XML ベースの規格である XHTML の勧告も行っている。.

新しい!!: テキストファイルとHyperText Markup Language · 続きを見る »

ISO-2022-JP

ISO-2022-JPは、インターネット上(特に電子メール)などで使われる日本の文字用の文字符号化方式。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする (アナウンス機能のエスケープシーケンスは省略される)。俗に「JISコード」と呼ばれることもある。.

新しい!!: テキストファイルとISO-2022-JP · 続きを見る »

LaTeX

(ラテック、ラテフ)とは、レスリー・ランポートによって開発されたテキストベースの組版処理システムである。電子組版ソフトウェア TeX にマクロパッケージを組み込むことによって構築されており、単体の に比べて、より手軽に組版を行うことができるようになっている。\LaTeX と表記できない場合は“LaTeX”と表記する。 なお、 を基にアスキーが日本語処理に対応させたものとして日本語 が、さらに縦組み処理にも対応させたものとして pLaTeX がある。 専門分野にもよるが、学術機関においては標準的な論文執筆ツールとして扱われている。.

新しい!!: テキストファイルとLaTeX · 続きを見る »

Mac OS

Mac OSは、アップルが開発・販売する、Macintoshのオペレーティングシステムである。.

新しい!!: テキストファイルとMac OS · 続きを見る »

Microsoft Excel

Microsoft Excel(マイクロソフト・エクセル)は、マイクロソフトがWindows、macOS、iOSおよびAndroid向けに開発・販売している表計算ソフトである。Microsoft Wordとともに、同社のオフィススイート「Microsoft Office」の中核をなすアプリケーションである。.

新しい!!: テキストファイルとMicrosoft Excel · 続きを見る »

Microsoft Windows

Microsoft Windows(マイクロソフト ウィンドウズ)は、マイクロソフトが開発・販売するオペレーティングシステム (OS) の製品群。グラフィカルユーザインタフェース (GUI)を採用している。.

新しい!!: テキストファイルとMicrosoft Windows · 続きを見る »

Microsoft Word

Microsoft Word(マイクロソフト・ワード)は、マイクロソフトがWindows、macOS及びiOS向けに販売している文書作成ソフトウェア。 Microsoft Excelとともに、同社のオフィススイート、Microsoft Officeの中核をなすアプリケーションである。一般的にはワード(WordまたはMS-Wordとも)と呼ばれることが多いが、「ワード」と名称が付く商品名や商標名は他にもある。.

新しい!!: テキストファイルとMicrosoft Word · 続きを見る »

MS-DOS

MS-DOS(エムエス-ディーオーエス、エムエスドス)は、マイクロソフトが開発・販売していた、8086系マイクロプロセッサをCPUとする、IBM PCおよびそれに似た構成の(たとえばPC-98など)パーソナルコンピュータ向けのオペレーティングシステム(OS)である。IBMへのOEM供給品であった PC DOS (IBM DOS)を自社製品として供給・販売したもので、バージョン6以降はPC DOSから完全に独立して開発された。.

新しい!!: テキストファイルとMS-DOS · 続きを見る »

Perl

Perl(パール)とは、ラリー・ウォールによって開発されたプログラミング言語である。実用性と多様性を重視しており、C言語やsed、awk、シェルスクリプトなど他のプログラミング言語の優れた機能を取り入れている。ウェブ・アプリケーション、システム管理、テキスト処理などのプログラムを書くのに広く用いられている。 言語処理系としてのperlはフリーソフトウェアである。Artistic LicenseおよびGPLのもとで配布されており、誰でもどちらかのライセンスを選択して利用することができる。UNIXやWindowsなど多くのプラットフォーム上で動作する。.

新しい!!: テキストファイルとPerl · 続きを見る »

Portable Document Format

Portable Document Format(ポータブル・ドキュメント・フォーマット、略称:PDF)は、アドビシステムズが開発および提唱する、電子上の文書に関するファイルフォーマットである。1993年に発売されたAdobe Acrobatで採用された。 特定の環境に左右されずに全ての環境でほぼ同様の状態で文章や画像等を閲覧できる特性を持っている。 アドビシステムズはPDF仕様を1993年より無償で公開していたが、それでもPDF規格はAdobeが策定するプロプライエタリなフォーマットであった。2008年7月には国際標準化機構によってISO 32000-1として標準化された。アドビはISO 32000-1 についての特許を無償で利用できるようにしたが、XFA (Adobe XML Forms Architecture) やAdobe JavaScriptなどはアドビのプロプライエタリな部分として残っている。.

新しい!!: テキストファイルとPortable Document Format · 続きを見る »

Sed (コンピュータ)

sed(セド)は、入力ストリーム(ファイルまたはパイプラインからの入力)に対してテキスト変換などのデータ処理をおこなうために使用されるプログラムである。名称「sed」は「ストリームエディタ」を意味する英語「stream editor」に由来する。 sedは、入力を行単位で読み取り、sedスクリプトと呼ばれるシンプルな命令文に従ってテキスト変換などの編集をおこない、また行単位で出力する。基本的には照合ルールに従い場合分けをおこなうフィルタと捉えることができる。オリジナル版のsedはベル研究所のマクマホンによって1973年前後に開発されたUNIXユーティリティで、現在ではコマンドラインをサポートするさまざまなオペレーティングシステムに搭載されている。 大量のテキストファイルに対して一括で定形の処理をおこなう場合に大きな威力を発揮する。正規表現に対応しており、ある条件の範囲内の文字列を探し出して処理することができる。特定の条件に合った文字列を検索し置換するなどの用途に用いる。.

新しい!!: テキストファイルとSed (コンピュータ) · 続きを見る »

Shift JIS

Shift_JIS(シフトジス)は、コンピュータ上で日本語を含む文字列を表現するために用いられる文字コードの一つ。かつてはベンダーによる独自拡張を含む文字コード群を指した曖昧な名称であったが、現在は標準化文書JIS X 0213の附属書1で規定されている(Shift JIS-2004)。「Shift_JIS」はIANAにおける登録名である 。 マイクロソフトなどの各ベンダーが実装するShift_JISの亜種については「Microsoftコードページ932」を参照。Mac OSが実装する亜種については「MacJapanese」を参照。.

新しい!!: テキストファイルとShift JIS · 続きを見る »

Unicode

200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

新しい!!: テキストファイルとUnicode · 続きを見る »

UNIX

UNIX (ユニックス、Unix、)は、コンピュータ用のマルチタスク・マルチユーザーのオペレーティングシステムの一種である。公式な商標は「UNIX」だが、商標以外の意味として「Unix」、またはスモールキャピタルを使用して「Unix」などとも書かれる。Unixは1969年、AT&Tのベル研究所にて、ケン・トンプソン、デニス・リッチーらが開発を開始した。 当初はアセンブリ言語のみで開発されたが、1973年にほぼ全体をC言語で書き直した。このため、Unixは歴史上、初めて高水準言語で書かれたOSであると言われる。 1973年の段階ではPDP-11に依存したコードが多く、移植性は低かったが、その後徐々にPDP-11に依存したコードを減少させ、1978年にInterdata 8/32への移植に成功して以降、徐々に他のプラットフォームにも移植されていった。 現在では「Unix」という語は、Unix標準に準拠するあらゆるオペレーティングシステムの総称でもある。現在ではUnixシステムは多数の系統に分かれており、AT&Tの開発停止後も、多数の商用ベンダーや非営利組織などによって開発が続けられている。 1970年代から1980年代の初期にかけて、Unixは大学や研究所などの教育機関で広範囲に採用され、特にカリフォルニア大学バークレー校をオリジナルとするBSD系統が誕生した。また Version 7 Unix や UNIX System V の特徴を持つオペレーティングシステムは「伝統的なUNIX」(traditional Unix)とも呼ばれる。 2007年に、「UNIX」の商標の所有者である標準化団体のThe Open Groupは、Single UNIX Specificationを完全に満たすと認証を受けたシステムのみが「UNIX」の商標を得られるとした。このためそれ以外のシステムは(ずっと以前から、AT&T版およびBSD以外を指して使われていた用語だが)「Unixシステムライク」または「Unixライク(Unix系)」と呼ばれるようになった。ただし The Open Groupはその呼称を気に入っていない。 現在では多く使われているUnixとしてはmacOS、AIX、HP-UX、Solarisなどがある(いずれも商用)。また認証を受けていないUnix系としてはLinux(派生OSにAndroid他)やMINIX、BSDの派生OS(FreeBSD、NetBSD、OpenBSD、DragonFly BSDなど)がある。.

新しい!!: テキストファイルとUNIX · 続きを見る »

UTF-16

UTF-16 (UCS/Unicode Transformation Format 16) とは、UnicodeおよびISO/IEC 10646の、符号化形式および符号化スキーム(文字符号化方式を参照)のひとつである。UTFは、UnicodeではUnicode Transformation Formatの略、ISO/IEC 10646ではUCS Transformation Formatの略とされる。ISO/IEC 10646での正式名称はUCS Transformation Format for 16 Planes of Group 00である。Unicodeでは、UTF-16が正式名称である。 UTF-16では、1文字が、16ビットの符号単位が1つまたは2つで符号化される。これが「-16」の名の由来である。基本多言語面(BMP)内の文字は、符号単位1つの16ビットで表される(ビッグエンディアンならISO/IEC 10646のUCS-2と互換である)。BMP以外の文字は、符号単位2つの32ビットで表される。なお、UTF-16は2バイトコードだと誤解されることがあるが、このように4バイトのこともあるため間違いである。 Unicodeにおいては、厳密には、文字符号化形式(Character Encoding Form)の1つの名称であり、かつ、UTF-16符号化形式のための文字符号化スキーム(Character Encoding Scheme)の1つの名称でもある。UTF-16符号化形式のための文字符号化スキームには、UTF-16の他にUTF-16BE、UTF-16LEがある。.

新しい!!: テキストファイルとUTF-16 · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

新しい!!: テキストファイルとUTF-8 · 続きを見る »

標準化

標準化(ひょうじゅんか、英語:standardization(スタンダーダイゼーション))という用語は、文脈によって様々な意味を持つ。「標準(standard)」という用語には、相互運用のための広く合意されたガイドラインという意味が含まれ、「標準化」はそのような標準を確立する過程を指すのが一般的である。 社会科学や経済学では、「標準化」の考え方は協調ゲームの解法と近い。それぞれの利害関係者がそれぞれに何らかの利益を得つつ、全体として一貫した決定に到達する。「標準化」は、よりよい選択をし、その選択結果を標準として批准する過程である。 なお、JISにおける「標準」の定義は次のとおりである。 「関係する人々の間で利益又は利便が公正に得られるように、統一し、単純化を図る目的で、もの(生産活動の産出物)及びもの以外(組織、責任権限、システム、方法など)について定めた取決め。 」 (JIS Z 8002:2006).

新しい!!: テキストファイルと標準化 · 続きを見る »

文字

文字(もじ)とは、言葉・言語を伝達し記録するために線や点を使って形作られた記号のこと。文字の起源は、多くの場合ものごとを簡略化して描いた絵文字(ピクトグラム)であり、それが転用されたり変形、簡略化されたりして文字となったと見られる。.

新しい!!: テキストファイルと文字 · 続きを見る »

文字コード

文字コード(もじコード)とはコンピュータ上で文字(キャラクタ (コンピュータ))を利用する目的で各文字に割り当てられるバイト表現。もしくは、バイト表現と文字の対応関係(文字コード体系)のことを指して「文字コード」と呼ぶことも多い。本記事では主に後者について記述する。.

新しい!!: テキストファイルと文字コード · 続きを見る »

文字符号化方式

文字符号化方式(もじふごうかほうしき、character encoding scheme、CES)とは、符号化文字集合で文字に対応付けた非負整数値を、実際にコンピュータが利用できるデータ列(通常、バイト列)に変換する符号化方式。 文字符号化体系、文字符号化スキーム (character coding scheme) とも言う。文字について述べていることが明確なときは、単に符号化方式、またIBMの用語ではコード化体系 (encoding scheme) などとも言う。 この用語はUnicodeやIETFの標準などで用いているが、ISO/IECやJISの標準では用いず「符号化文字集合の構造」あるいは「'''文字符号の構造及び拡張法'''」として扱われている。この用語の定義は、世界の文字コード規格とは必ずしも合致しないことがある。.

新しい!!: テキストファイルと文字符号化方式 · 続きを見る »

文字集合

文字集合(もじしゅうごう、character set)は、文字(キャラクタ (コンピュータ))をその要素(「元」)とする集合である。文字セットという場合もある。 例えば、「全てのアルファベット」(a, b, c,..., z, A, B, C,..., Z)というのもひとつの文字集合であるし、「全てのひらがな」(あ, い, う,..., ん)というのもまた、ひとつの文字集合である。.

新しい!!: テキストファイルと文字集合 · 続きを見る »

ここにリダイレクトされます:

.txt

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »