ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
ダウンロード
ブラウザよりも高速アクセス!
 

正規表現

索引 正規表現

正規表現(せいきひょうげん、regular expression)とは、文字列の集合を一つの文字列で表現する方法の一つである。正則表現(せいそくひょうげん)とも呼ばれ、形式言語理論の分野では比較的こちらの訳語の方が使われる。まれに正規式と呼ばれることもある。 もともと正規表現は形式言語理論において正規言語を表すための手段として導入された。形式言語理論では、形式言語が正規言語であることと正規表現によって表せることは同値である。 その後正規表現はテキストエディタ、ワードプロセッサなどのアプリケーションで(ないし、そもそもそれ以前に単機能の文字列探索ツールの)、マッチさせるべき対象を表すために使用されるようになり、表せるパターンの種類を増やすために本来の正規表現にはないさまざまな記法が新たに付け加えられた。このような拡張された正規表現には正規言語ではない文字列も表せるものも多く、ゆえに正規表現という名前は実態に即していない面もあるが、伝統的に正規表現と呼ばれ続けている。 この記事では主にこのような正規表現を用いたパターンマッチングについて説明している。以下、誤解のない限り、アプリケーションやプログラミングにおいて正規表現を用いた文字列のパターンマッチングを行う機能のことを、単に正規表現という。 ほとんどのプログラミング言語では、ライブラリによって正規表現を使うことができる他、一部の言語では正規表現のリテラルもある。「正規表現によるマッチ」を意味する(専用の)演算子がある言語なども一部ある。具体例として、grep、AWK、sed、Perl、Tcl、lexなどがある。 それぞれの言語やアプリケーションで細部の仕様が異なっている、といったように思われることも多いが(また、古い実装では実際にそういうことも多いが)、近年は同じライブラリを使っていれば同じということも多い。またPOSIXなど標準もある。.

62 関係: Apache HTTP ServerAWK同値形式言語ハルペン・ジャックライブラリリテラルレガシーシステムワードプロセッサプラス記号とマイナス記号プログラミング (コンピュータ)プログラミング言語パターンマッチングテキストエディタ制御文字和集合アプリケーションソフトウェアアスタリスクエストニア語オートマトンクラス (コンピュータ)ケン・トンプソンコマンドラインインタプリタスティーヴン・コール・クリーネBoostC++11理論計算機科学符号点疑問符ECMAScriptEdEmacsEximExpr言語学識別子GNU CライブラリGoogleGrepJavaLexMacOSParsing Expression GrammarPerlPerl 6Perl Compatible Regular ExpressionsPHP (プログラミング言語)POSIXPostfixPython...QED (テキストエディタ)RubySed (コンピュータ)Tcl/TkUNIXUnix系Vi正規言語歌代和正演算子文字列文字列探索 インデックスを展開 (12 もっと) »

Apache HTTP Server

Apache HTTP Server(アパッチ エイチティーティーピー サーバ)は、世界中でもっとも多く使われているWebサーバソフトウェアであり、大規模な商用サイトから自宅サーバまで幅広く利用されている。単にApacheとも称されている。 開発は、Apacheソフトウェア財団のApache HTTPサーバプロジェクトで行われている。Apache Licenseの下でソースコードが公開および配布されており、代表的なオープンソースソフトウェアの一つである。.

新しい!!: 正規表現とApache HTTP Server · 続きを見る »

AWK

AWK(オーク)は、プログラミング言語の一つ。テキストファイル、特に空白類(スペースの他、タブなど)やカンマなどで区切られたデータファイルの処理を念頭に置いた仕様となっているが、一般的なプログラミングに用いることも可能である。UNIX 上で開発された。.

新しい!!: 正規表現とAWK · 続きを見る »

同値

同値(どうち)または等価(とうか)とは、2つの命題が共に真または共に偽のときに真となる論理演算である。 英語ではequivalence (EQ)。「if and only if」を略して、iff ともいう。否定排他的論理和 (XNOR) に等しい。 演算子記号は ⇔、↔、≡、.

新しい!!: 正規表現と同値 · 続きを見る »

形式言語

形式言語(けいしきげんご、formal language)は、その文法(構文、統語論)が、場合によっては意味(意味論)も、形式的に与えられている(形式体系を参照)言語である。形式的でないために、しばしば曖昧さが曖昧なまま残されたり、話者集団という不特定多数によってうつろいゆくような自然言語のそれに対して、一部の人工言語や、いわゆる機械可読な(機械可読目録を参照)ドキュメント類などは形式言語である。この記事では形式的な統語論すなわち構文の形式的な定義と形式文法について述べる。形式的な意味論については形式意味論の記事を参照。.

新しい!!: 正規表現と形式言語 · 続きを見る »

ハルペン・ジャック

ハルペン・ジャック(日本語:春遍雀來、英語:Jack Halpern)は日本を拠点に活動する漢字を中心とした辞書編纂家、日中韓辞典研究所(CJKI)代表。講談社漢英学習辞典の編集長、および漢字検索法SKIPシステムの開発者として知られる。国際一輪車連盟の創立者。埼玉県さいたま市在住。.

新しい!!: 正規表現とハルペン・ジャック · 続きを見る »

ライブラリ

ライブラリ()は、汎用性の高い複数のプログラムを再利用可能な形でひとまとまりにしたものである。ライブラリと呼ぶ時は、それ単体ではプログラムとして作動させることはできない実行ファイルではない場合がある。ライブラリは他のプログラムに何らかの機能を提供するコードの集まりと言うことができる。ソースコードの場合と、オブジェクトコード、あるいは専用の形式を用いる場合とがある。たとえば、UNIXのライブラリはオブジェクトコードをarと呼ばれるアーカイバでひとまとめにして利用する。図書館()と同様にプログラム(算譜)の書庫であるので、索引方法が重要である。 また、ソフトウェア以外の再利用可能なものの集合について使われることもある。.

新しい!!: 正規表現とライブラリ · 続きを見る »

リテラル

リテラル(literal)は、「文字どおり」「字義どおり」を意味する語で、 と同じくラテン語の (文字)に由来する。数理論理学とコンピュータプログラミングで異なる意味の専門用語として使われる。.

新しい!!: 正規表現とリテラル · 続きを見る »

レガシーシステム

レガシーシステムとは、主にコンピュータの分野で、代替すべき新しい技術などのために古くなったコンピュータのシステムや技術などのことである。そのようなデバイスをレガシーデバイス、そのようなオペレーティングシステムを、レガシーOSなどともいう。.

新しい!!: 正規表現とレガシーシステム · 続きを見る »

ワードプロセッサ

東芝Rupo JW05H(1992年11月発売) 東芝Rupo JW05Hの上面 ワードプロセッサ(Word processor)または文書作成編集機(ぶんしょさくせいへんしゅうき)は、コンピュータで文章を入力、編集、印刷できるシステムである。一般的な略称は「ワープロ」。ワープロ機能をROM化して組み込んである「ワープロ専用機」と、汎用的なパーソナルコンピュータで動作する「ワープロソフト」(Microsoft Word、一太郎など)がある。この記事では主に前者の「ワープロ専用機」を扱う。.

新しい!!: 正規表現とワードプロセッサ · 続きを見る »

プラス記号とマイナス記号

プラス記号 (+) とマイナス記号 (&minus) は、正負や加法および減法の表記に使われる数学記号である。これらの記号は多かれ少なかれ類似点のある他のいろいろな意味にも拡張されて使われてきた。プラス (plus) とマイナス (minus) は、それぞれ「より多い」と「より少ない」を意味するラテン語の表現である。日本語においては、プラス記号については、加算記号として用いる場合には足す(たす)と読み、マイナス記号については、減算記号として用いる場合には引く(ひく)と読む。プラスとマイナスを合わせて「プラスマイナス」「プラマイ」と呼ぶこともある。.

新しい!!: 正規表現とプラス記号とマイナス記号 · 続きを見る »

プログラミング (コンピュータ)

ンピュータのプログラミング(programming)とは、コンピュータプログラムを作成することにより、人間の意図した処理を行うようにコンピュータに指示を与える行為である。.

新しい!!: 正規表現とプログラミング (コンピュータ) · 続きを見る »

プログラミング言語

プログラミング言語(プログラミングげんご、programming language)とは、コンピュータプログラムを記述するための形式言語である。なお、コンピュータ以外にもプログラマブルなものがあることを考慮するならば、この記事で扱っている内容については、「コンピュータプログラミング言語」(computer programming language)に限定されている。.

新しい!!: 正規表現とプログラミング言語 · 続きを見る »

パターンマッチング

パターンマッチング (Pattern matching、パターン照合) とは、データを検索する場合に、特定のパターンが出現するかどうか、またどこに出現するかを特定する手法のことである。 文字列のパターンマッチングには、固定されたパターンの検索ではKMP法やBM法など各種の文字列探索アルゴリズムがある。また正規表現を利用する手法も多数提案されている。 画像や動画に対するパターンマッチングの研究も行われている。だが、パターンマッチングはあらかじめ人が打っておかなくてはいけないため人工知能とは別で機械が自分で考えているわけではない(そもそも「考える」ということを形式的に定義することは不可能なので、この段落の後半の「だが、」以降は、単にどこかの誰かの考える「人工知能」という語に関する主観の表明に過ぎず、意味があることを何も述べてはいない)。 いくつかの高水準プログラミング言語には、多分岐の一種で、場合分けと同時に構成要素の取り出しのできる言語機能があり、パターンマッチと呼ばれている。Haskellでの例を示す。 listSumCase lst.

新しい!!: 正規表現とパターンマッチング · 続きを見る »

テキストエディタ

テキストエディタ(text editor)とはコンピュータで文字情報(テキスト)のみのファイル、すなわちテキストファイルを作成、編集、保存するためのソフトウェア(プログラム)である。一般的に、文字情報の入力、削除、コピー、貼り付け、検索、置換、整形などの機能を備えている。Windowsのメモ帳や、macOSのテキストエディット、UNIXのvi、Emacsなど、多くのオペレーティングシステム (OS) やデスクトップ環境に最初から装備されている。.

新しい!!: 正規表現とテキストエディタ · 続きを見る »

制御文字

ンピューティングと電気通信において、制御文字(せいぎょもじ、control character)とは、文字コードの規格で定義される文字のうち、ディスプレイ・プリンター・通信装置などに対して、特別な動作(制御)をさせるために使う文字である。制御キャラクタともいい、情報処理用語規格では「制御機能文字」と呼ばれている。 「文字」という名前であるがディスプレイやプリンターには表示されない。そのため、非表示文字(ひひょうじもじ、non-printing character、印字不可文字)とも言う。それに対し、制御文字以外の表示可能な文字を図形文字(graphic character)という。図形文字と制御文字は電気信号上は区別がなく、同じデータストリーム上に現われる。これをという。 制御文字にどのような文字コードを割り当てるかは、ASCII、EBCDICなどの文字コード体系により異なる。ASCIIでは0から31および127が制御文字に割り当てられている(技術的にはこれをという)。ISO 8859で定義される拡張ASCIIでは、これに128から159までの制御文字を追加した。これはと呼ばれる。 これらの65個の制御文字はUnicodeに引き継がれた。Unicodeではさらに制御文字を追加しているが、これはゼロ幅非接合子のようなフォーマット用文字とは区別される。 EBCDICには、ASCIIの65個の制御文字全てのほか、主としてIBMの周辺機器を制御するための追加の制御文字が含まれている。.

新しい!!: 正規表現と制御文字 · 続きを見る »

和集合

数学において、集合族の和集合(わしゅうごう)、あるいは合併集合(がっぺいしゅうごう)、合併(がっぺい、)、あるいは演算的に集合の和(わ、sum)、もしくは'''結び'''(むすび、)とは、集合の集まり(集合族)に対して、それらの集合のいずれか少なくとも一つに含まれているような要素を全て集めることにより得られる集合のことである。.

新しい!!: 正規表現と和集合 · 続きを見る »

アプリケーションソフトウェア

アプリケーションスイートである。 アプリケーションソフトウェア(application software, 応用ソフトウェア)は、アプリケーション(応用)プログラムともいい、ワープロや表計算などといった、コンピュータを「応用」する目的に応じた、コンピュータ・プログラムである。なお、それに対してシステムプログラムは、アプリケーションプログラムに対して処理実行のための計算機資源を抽象化して提供する、などのインフラとしての役割のプログラムであり、ユーザーが要求する情報処理を直接実行するものではなく、ユーザーが普段は意識することはない裏方的な存在がシステムプログラムである。.

新しい!!: 正規表現とアプリケーションソフトウェア · 続きを見る »

アスタリスク

アスタリスク またはアステリスク(asterisk)は、約物のひとつで、右のような放射線である。原語の意味は「小さい星」(ラテン語経由の古代ギリシア語)で、日本語でも星号、星印、星、アスタとも呼ばれる。.

新しい!!: 正規表現とアスタリスク · 続きを見る »

エストニア語

トニア語(エストニアご、eesti keel )は、ウラル語族・フィン・ウゴル語派・バルト・フィン諸語に属する言語。話者は約110万人で、エストニアの主要言語であり、また公用語となっている。フィンランド語に近く、ハンガリー語とも系統を同じくする。 南エストニア方言とタリン周辺で使われる北エストニア方言の2つの方言があり、うち後者が現在の標準語の元となっている。.

新しい!!: 正規表現とエストニア語 · 続きを見る »

オートマトン

ートマトン (単数形: automaton, 複数形: オートマタ(automata )) とは、自動人形などとも呼ばれる「オートマタ」と同じ語であるが、計算理論において、計算モデルに関して有限オートマトンなどの総称として使われる。また特に「オートマトン理論」と呼ばれる分野では、計算機械のうち計算可能性の点でチューリングマシンよりも制限されているものを特に指して言うこともある。.

新しい!!: 正規表現とオートマトン · 続きを見る »

クラス (コンピュータ)

ラス()は、クラスベースのオブジェクト指向においてオブジェクトの設計図にあたるもの。抽象データ型の一つ。クラスから生成したオブジェクトのことをインスタンスという。 クラスには、インスタンスの保持するデータ(メンバ変数、フィールド(UMLでは「属性」ともいう))と操作(メソッド、メンバ関数)が記述される。 クラスは、継承・ポリモーフィズム・カプセル化などの、オブジェクト指向プログラミングにおける重要な概念を実現する強力な手段である。.

新しい!!: 正規表現とクラス (コンピュータ) · 続きを見る »

ケン・トンプソン

ネス・レイン・トンプソン(Kenneth Lane Thompson、1943年2月4日 - )は、アメリカの計算機科学者。ハッカー仲間からはケン・トンプソン (Ken Thompson) と呼ばれている。長くベル研究所に勤め、B言語(Multicsプロジェクトに関わっていたころ、UNIX開発に使ったBCPLをベースとしている)とC言語の開発で知られ、UNIXのオリジナル開発者の一人である。 他にも、正規表現、初期のテキストエディタQEDとedの開発、コンピュータチェス、Goといった業績がある.

新しい!!: 正規表現とケン・トンプソン · 続きを見る »

コマンドラインインタプリタ

マンドラインインタプリタ は、コンピュータのコマンドライン、すなわち、ユーザによりキーボードなどから入力される文字列の行(ライン)のコマンドを解釈し、オペレーティングシステム(以下、OS)やプログラミング言語処理系などに渡す、コマンドラインインタフェースであり、キャラクタユーザインタフェースを構成する要素である。OSの標準ユーティリティとしてはコマンドラインシェルがあり、いくつかのプログラミング言語処理系が持つそれに関しては:en:Read–eval–print loopも参照。.

新しい!!: 正規表現とコマンドラインインタプリタ · 続きを見る »

スティーヴン・コール・クリーネ

ティーヴン・コール・クリーネ(Stephen Cole Kleene, 1909年1月5日 - 1994年1月25日)は、アメリカの数学者。ウィスコンシン大学マディソン校に勤め、その業績は計算機科学の理論的な基礎を築くのに貢献した。クリーネは、正規表現の発明や、アロンゾ・チャーチ、クルト・ゲーデル、アラン・チューリング、エミール・ポストらと共に帰納的関数論という数理論理学の一分野を創始したことで知られる。クリーネ代数、クリーネ閉包、クリーネの再帰定理、クリーネ不動点定理の由来になっている。クリーネはまたライツェン・エヒベルトゥス・ヤン・ブラウワーが創始した数学的直観主義に貢献した。 クリーネは自分の姓をクレーニ((IPA))と発音していた。英語圏ではクリーニ()、クリーン()などと誤読されることが多く、日本ではクリーネの表記が一般的になってしまっている。 その数理論理学における傑出した業績は、英語圏の論理学者の間に、"Cleanliness is next to godliness"「清潔さは信心深さに次ぐ」をもじって"Kleeneliness is next to Gödeliness"という格言があることにも表れている。.

新しい!!: 正規表現とスティーヴン・コール・クリーネ · 続きを見る »

Boost

Boost (ブースト)とは、C++の先駆的な開発者のコミュニティ、およびそのコミュニティによって公開されているオープンソースライブラリのことを指す。コミュニティとしてのBoostはC++標準化委員会の委員により設立されており、現在でもその多くが構成員として留まっている。このような経緯もあり、BoostコミュニティはC++の標準化において大きな影響力を有している。実際に標準化委員会が発表した「TR1」の2/3以上がBoostライブラリを基にしている。Random, Regex, ThreadなどはいずれもC++11規格の標準ライブラリとして正式に導入・標準化されている。このことから、Boostは考案された新機能を標準化させる前の試験運用の場であるとも言える。 Boostで公開されるライブラリはコミュニティの公開レビューによって精選されている。Boostを使用して作成したプログラムは、商用、非商用を問わず無償のの下でライセンスされる。 Boostはテンプレートなどを活用して積極的にメタプログラミングやジェネリックプログラミングの技法を取り入れて行く傾向がある。そのためBoostライブラリの利用者にはC++の現代的な記述に慣れていることを要求される。 。.

新しい!!: 正規表現とBoost · 続きを見る »

C++11

C++11は、プログラミング言語 C++ のISO標準 ISO/IEC 14882:2011 の略称である。規格の策定中は2009年中の標準化を目指していたため、C++0x という仮称で呼ばれていた。 ISO/IEC 14882:2003 (C++03) に代わるものとして、2011年8月12日にISOによって承認された。後継のC++14が2014年8月18日に承認されている。 コア言語への機能追加や標準C++ライブラリの拡張を施し、C++TR1ライブラリの大部分を(数学的特殊関数ライブラリを除いて)取り込んでいる。.

新しい!!: 正規表現とC++11 · 続きを見る »

理論計算機科学

論計算機科学(りろんけいさんきかがく、英語:theoretical computer science)は計算機を理論的に研究する学問で、計算機科学の一分野である。計算機を数理モデル化して数学的に研究することを特徴としている。「数学的」という言葉は広義には公理的に扱えるもの全てを指すので、理論計算機科学は広義の数学の一分野でもある。理論計算機科学では、現実のコンピュータを扱うことも多いが、チューリングマシンなどの計算モデルを扱うことも多い。 理論計算機科学の代表的な分野として以下のものがある。.

新しい!!: 正規表現と理論計算機科学 · 続きを見る »

符号点

号点(ふごうてん)は、符号化文字集合内の、文字を割り当てうる個々の点。コードポイント (code point)。Unicodeでは符号位置(ふごういち)と訳す。文脈によっては単に点(てん、point)ともいう。 符号点は文字を割り当て「うる」点であり、規格によっては、実際に文字を割り当てる以外に、エスケープなどの目的の文字以外の何かが割り当てられることもある。.

新しい!!: 正規表現と符号点 · 続きを見る »

疑問符

疑問符(ぎもんふ)は約物のひとつで、「?」のように書かれる。疑問を表し、疑問を表す対象の後に置かれる。なお、耳垂れ(みみだれ)、クエスチョンマーク(question mark、クエッションマーク)、インテロゲーションマーク(interrogation mark)また、俗にははてなマークなどとも呼ばれる。 一般には、疑問文の最後に、終止符(マルやピリオド)に換えて置かれる。このため、疑問符は文の終わりをも示す。ただし、しばしば文の途中の疑問を表したい単語(不明確なことなど)の直後に置かれる。この場合、括弧で囲むことが多い。 俗に、疑問の度合いを増して表したいとき、??、???と重ねて書くことがある。また、(!?)のように感嘆符(!)を左に書いた感嘆符疑問符や、(?!)のように感嘆符を右につけた疑問符感嘆符もある。なお、この用途には、?と!を重ねた「(インテロバング)」という記号もある。 視覚的な表現として、マニュアルなどでヘルプの用途で疑問符を使用した記号が用いられる。また、質問を受け付ける案内所などの標識としても用いられる。.

新しい!!: 正規表現と疑問符 · 続きを見る »

ECMAScript

ECMAScript(エクマスクリプト)は、JavaScriptの標準であり、Ecma Internationalのもとで標準化手続きなどが行われている。 Ecma Internationalのほか、ISO/IEC JTC 1からもISO/IEC 16262として標準化されている。日本もJIS X 3060としてJIS化している。.

新しい!!: 正規表現とECMAScript · 続きを見る »

Ed

ed(イーディー)は、UNIXオペレーティングシステム上の標準的なテキストエディタである。オリジナルの作者はケン・トンプソンで、世界初の正規表現の実装のひとつでもある(それ以前には正規表現は数学の論文に出ていただけであった)。edはケン・トンプソンの出身校であるカリフォルニア大学バークレー校のQEDから影響を受け、その後およびそこから派生したviに影響を及ぼした。UNIXコマンドgrepとsedはedのよく使われる使い方に影響されており(例えば使用例の置換コマンドはsedの使用法にそっくりである)、これらの影響はプログラミング言語AWKの中にもよく見て取れる。.

新しい!!: 正規表現とEd · 続きを見る »

Emacs

Emacs (イーマックス、)は、その拡張性を特徴としたテキストエディタのファミリーである。Emacsの中で最も広く使われている派生物はGNU Emacsであるが、そのマニュアルにはEmacsを「the extensible, customizable, self-documenting, real-time display editor」(拡張およびカスタマイズが可能で、自己文書化を行い、リアルタイム表示を行うエディタ)であると説明されている。最初のEmacs開発が1970年代中盤に開始されてから、その直系の子孫であるGNU Emacsが製作され、その開発がも続いている。 Emacsはユーザインタフェースと10,000を超える組み込みコマンドを持ち、ユーザーは作業自動化のためにこれらのコマンドをマクロと組み合わせることができる。さらに深い拡張性を提供するLISPプログラミング言語の方言であるEmacs Lisp (ELisp) はEmacs実装の主な特徴であり、ELispでユーザーや開発者はEmacs用の新しいコマンドやアプリケーションを書くことができる。Emacsの拡張機能として電子メール、ファイル、アウトライン、およびRSSフィードが書かれており、それ以外にもELIZA、ポン、ライフゲーム、ヘビゲーム、およびテトリスのクローンもある。ユーザーの中にはEmacs内部からテキスト編集だけでなくほとんど全ての作業を行うことができることに気づいた者もいる。 原典であるEMACSは1972年にCarl Mikkelson、、およびガイ・L・スティール・ジュニアらによりTECOエディタ用のEditor MACroSのセットとして書かれたものであり、TECOマクロエディタの概念にインスパイアされている。 最も有名かつ最も移植されたEmacsは、ストールマンによってGNUプロジェクトのために作成されたGNU Emacsである。XEmacsは1991年にGNU Emacsからフォークされた派生物である。GNU EmacsとXEmacsは類似のLISP方言を使い、互いに互換性のある部分が大半である。 Emacsはvi (Vim) と並びUNIX文化における伝統的なエディタ戦争の主要な当事者の2つである。Emacsは未だ開発中であるオープンソースプロジェクトの中で最古のものである。.

新しい!!: 正規表現とEmacs · 続きを見る »

Exim

Exim(いくしむ)はPhilip Hazelによって開発が始まったメール転送エージェント (MTA) の一種である。.

新しい!!: 正規表現とExim · 続きを見る »

Expr

exprは、Unixのコマンドの一つで、引数として与えられた数式を評価し、結果を標準出力に書き出す。Version 7 Unixより追加された。 exprは整数や文字列の数式(正規表現によるパターンマッチングを含む)を評価する。exprでは以下の操作ができる。.

新しい!!: 正規表現とExpr · 続きを見る »

言語学

言語学(げんごがく)は、ヒトが使用する言語の構造や意味を科学的に研究する学問である。.

新しい!!: 正規表現と言語学 · 続きを見る »

識別子

識別子(しきべつし、identifier)とは、ある実体の集合の中で、特定の元を他の元から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことをいう。ほぼすべての情報処理システムで何らかの識別子が使われており、識別子を利用することで機械的な処理が可能になる。.

新しい!!: 正規表現と識別子 · 続きを見る »

GNU Cライブラリ

GNU Cライブラリ(グニュー・シーライブラリ、glibc、ジーリブシー)は、GNUプロジェクトによる標準Cライブラリ実装。元々はGNUオペレーティングシステム向けにフリーソフトウェア財団 (FSF) が作成したもので、2001年からは主要なコントリビュータでメンテナーでもあるレッドハットのウルリッヒ・ドレッパーらからなる委員会が開発を監督していたが、2012年3月にコミュニティ主導の開発プロセスへの移行のために委員会の解散が決定した。 GNU Lesser General Public Licenseでリリースされているフリーソフトウェアである。.

新しい!!: 正規表現とGNU Cライブラリ · 続きを見る »

Google

Google LLC(グーグル)は、インターネット関連のサービスと製品に特化したアメリカの多国籍テクノロジー企業である。検索エンジン、オンライン広告、クラウドコンピューティング、ソフトウェア、ハードウェア関連の事業がある。.

新しい!!: 正規表現とGoogle · 続きを見る »

Grep

grep(グレップ、グレプ)は、UNIXおよびUnixオペレーティングシステムにおけるコマンド。テキストファイル中から、正規表現に一致する行を検索して出力する。.

新しい!!: 正規表現とGrep · 続きを見る »

Java

Java(ジャバ)は、狭義ではプログラミング言語Javaを指す。広義では言語仕様以外にも、仕様が与えられているJavaクラスライブラリやJava仮想マシン、さらにはJDKやJREなどの公式のものをはじめとする、場合によってはサードパーティのものなどを含め曖昧にJavaプラットフォームと総称されるようなものなどのエコシステムなどを指すこともある。構文についてはJavaの文法の記事を参照。.

新しい!!: 正規表現とJava · 続きを見る »

Lex

Lex(レック、レックス)はレキシカルアナライザ(字句解析プログラム、字句解析器)を生成するプログラムである。コンパイラの作成のためにパーサジェネレータのyaccとともに使用されることも多い。Lexはエリック・シュミットとマイク・レスクによって書かれunixにおける標準のレキシカルアナライザとなっており、POSIX標準ともなっている。Lexと同等の機能を有し性能が改善されているFlex(英語版)がある。.

新しい!!: 正規表現とLex · 続きを見る »

MacOS

macOS(マックオーエス)は、アップルが開発・販売する、Macのオペレーティングシステムである。かつての名称はOS X、Mac OS Xであった(後述)。 技術的に直系ではないが、Classic Mac OS (Mac OS、System) の後継として、新たにBSD系UNIXをベースに開発された。.

新しい!!: 正規表現とMacOS · 続きを見る »

Parsing Expression Grammar

Parsing Expression Grammar (PEG, Parsing Expression Grammar) は、分析的形式文法の一種であり、形式言語をその言語に含まれる文字列を認識するための一連の規則を使って表したものである。PEGは再帰下降構文解析を文法を示すためだけに純粋に図式的に表現したものと見ることもでき、具体的な構文解析器の実装やその用途とは独立している。 PEGにおける構文(文法)の定義は文脈自由文法のバッカス・ナウア記法によるそれに似ているが、文脈自由文法では一般に「|」(縦棒、バーティカルバー)で表される「これらのうちどれか」ではなく、「最初の解析がうまくいったらそれを、失敗なら次を順に試してゆき、成功したものを採用」(「/」であらわす)という意味を使う。 このため、文脈自由文法とは異なり、PEGには曖昧さは存在しない。文字列を構文解析する場合、正しい構文木は常に1つしかない。このためPEGはコンピュータ言語の構文解析に向いており、一方、自然言語の多義性を、そのまま複数の構文木が可能である、という形で形式化するのには向かない。.

新しい!!: 正規表現とParsing Expression Grammar · 続きを見る »

Perl

Perl(パール)とは、ラリー・ウォールによって開発されたプログラミング言語である。実用性と多様性を重視しており、C言語やsed、awk、シェルスクリプトなど他のプログラミング言語の優れた機能を取り入れている。ウェブ・アプリケーション、システム管理、テキスト処理などのプログラムを書くのに広く用いられている。 言語処理系としてのperlはフリーソフトウェアである。Artistic LicenseおよびGPLのもとで配布されており、誰でもどちらかのライセンスを選択して利用することができる。UNIXやWindowsなど多くのプラットフォーム上で動作する。.

新しい!!: 正規表現とPerl · 続きを見る »

Perl 6

Perl 6(パールシックス)は、ラリー・ウォールにより設計されたオブジェクト指向スクリプト言語である。 Perl 6は、2000年にPerlの次期メジャーバージョンとして設計が始められ、2015年12月25日に公式のPerl 6正式安定版がリリースされた。しかし、言語仕様は現在のPerl (Perl 5)と互換性がなく、既存のPerl 5のソフトウェアをPerl 6用に「アップグレード」するのは極めて困難である。したがって現在はPerl 5とPerl 6は別の言語であると考えられており、Perl 6はPerl 5の次期バージョンではないとされている。換言すれば、Perl 6はPerl 5から移行対象とはみなされていない。 Perl 6は言語仕様であり、言語仕様と処理系は別のプロジェクトとして管理されている。これは言語の作者自身が開発した処理系が言語仕様に準ずるものとされてきたPerl 5やRubyとは異なっている。2015年12月25日に言語仕様としての公式のPerl 6正式安定版がリリースされた。公式の処理系としてはRakudoがあり、2010年8月に最初の「使用可能な」バージョンがリリースされた。Haskellで書かれたPugsは活発ではなく、もはや歴史的な実装とされている。 Perl 5は動的型付け言語であったのに対し、Perl 6は静的な型指定も行える言語となった(動的な型付けも可能)。また、Perl 6では仮引数定義も可能となっている(Perl 5でも可能ではあったが不完全であった)。さらに、Perl 5の様に展開を行うことも可能であり、例えばJavaであればReflectionクラスを必要とする仮引数の取得をいわゆるマジックを用いずとも可能な設計となっている。 Perl 6ではPerl 5と比較してさらに柔軟かつ強力な記法を可能としている。例えば、配列要素毎の演算や、Lisp等に代表されるポーランド記法も可能にするなどPerl 5をより一層強力にした記述である。.

新しい!!: 正規表現とPerl 6 · 続きを見る »

Perl Compatible Regular Expressions

PCRE(Perl Compatible Regular Expressions)は、Perl 5 互換の正規表現をC言語で実装したライブラリである。BSDライセンスで配布されている。 元は、メール転送エージェントの Exim のために書かれたものであったが、現在では、Apache、Postfix、Nmap、Safari、Maildropなどをはじめとした多数のソフトウェアに組み込まれている。.

新しい!!: 正規表現とPerl Compatible Regular Expressions · 続きを見る »

PHP (プログラミング言語)

PHP(ピー・エイチ・ピー)は "The PHP Group" によってコミュニティベースで開発されているオープンソースの汎用プログラミング言語およびその公式の処理系であり、特にサーバーサイドで動的なウェブページ作成するための機能を多く備えていることを特徴とする。 名称の PHP は再帰的頭字語として、 "PHP: Hypertext Preprocessor" を意味するとされており、「PHPはHTMLのプリプロセッサである」とPHP自身を再帰的に説明している。.

新しい!!: 正規表現とPHP (プログラミング言語) · 続きを見る »

POSIX

POSIX(ポシックス、ポジックス、Portable operating system interface)は、各種UNIXを始めとする異なるオペレーティングシステム (OS) 実装に共通のアプリケーションプログラミングインタフェース (API) を定め、移植性の高いアプリケーションソフトウェアの開発を容易にすることを目的としてIEEEが策定したAPI規格である。POSIXという名前はリチャード・ストールマンがIEEEに提案したものである。末尾の「」はUNIX互換OSに「」の字がつく名前が多いことからつけられた。ISO/IEC JTC 1/SC 22でISO/IEC 9945として国際規格になっている。.

新しい!!: 正規表現とPOSIX · 続きを見る »

Postfix

Postfix(ポストフィックス)はフリーソフトウェア・オープンソースソフトウェアのメール転送エージェント(MTA)である。Sendmailとの操作上の互換性を確保しつつ、管理・設定が容易で、高速・安全であることを指向して開発されている。完全にUNIX用のMTAシステムとして設計されているため、UNIX上の他の多くのソフトウェアと連携が必要となる場合がある。 NetBSD、macOS Serverなど、いくつかのUNIX / Unix系OSで標準のMTAとして採用されている。 ライセンスはIBM Public License 1.0またはEclipse Public License 2.0(バージョン3.3以降)である。これはフリーソフトウェアライセンスではあるが、GPLとは矛盾する。 Postfixシステムは一つのプログラムではなく、複数のコアプログラムから成り立っている。 かつてはVMailerおよびIBM Secure Mailerという名前であった。がIBM トーマス・J・ワトソン研究所で開発を開始し、現在も活発に開発が行われている。Postfixの最初のリリースは1999年中頃に行われた。.

新しい!!: 正規表現とPostfix · 続きを見る »

Python

Python(パイソン)は、汎用のプログラミング言語である。コードがシンプルで扱いやすく設計されており、C言語などに比べて、さまざまなプログラムを分かりやすく、少ないコード行数で書けるといった特徴がある。.

新しい!!: 正規表現とPython · 続きを見る »

QED (テキストエディタ)

QEDはUnixオペレーティングシステムのテキストエディタ edやexの祖となったラインエディタである。.

新しい!!: 正規表現とQED (テキストエディタ) · 続きを見る »

Ruby

Ruby(ルビー)は、まつもとゆきひろ(通称 Matz)により開発されたオブジェクト指向スクリプト言語であり、スクリプト言語が用いられてきた領域でのオブジェクト指向プログラミングを実現する。 また日本で開発されたプログラミング言語としては初めて国際電気標準会議で国際規格に認証された事例となった。.

新しい!!: 正規表現とRuby · 続きを見る »

Sed (コンピュータ)

sed(セド)は、入力ストリーム(ファイルまたはパイプラインからの入力)に対してテキスト変換などのデータ処理をおこなうために使用されるプログラムである。名称「sed」は「ストリームエディタ」を意味する英語「stream editor」に由来する。 sedは、入力を行単位で読み取り、sedスクリプトと呼ばれるシンプルな命令文に従ってテキスト変換などの編集をおこない、また行単位で出力する。基本的には照合ルールに従い場合分けをおこなうフィルタと捉えることができる。オリジナル版のsedはベル研究所のマクマホンによって1973年前後に開発されたUNIXユーティリティで、現在ではコマンドラインをサポートするさまざまなオペレーティングシステムに搭載されている。 大量のテキストファイルに対して一括で定形の処理をおこなう場合に大きな威力を発揮する。正規表現に対応しており、ある条件の範囲内の文字列を探し出して処理することができる。特定の条件に合った文字列を検索し置換するなどの用途に用いる。.

新しい!!: 正規表現とSed (コンピュータ) · 続きを見る »

Tcl/Tk

は、スクリプト言語 Tcl と、その GUIツールキット Tk を指す。非常に強力な GUI ツールキットと、シンプルな文法をもつ言語により、GUI ツールを素早く作り上げるのに適した強力なスクリプティング環境である。.

新しい!!: 正規表現とTcl/Tk · 続きを見る »

UNIX

UNIX (ユニックス、Unix、)は、コンピュータ用のマルチタスク・マルチユーザーのオペレーティングシステムの一種である。公式な商標は「UNIX」だが、商標以外の意味として「Unix」、またはスモールキャピタルを使用して「Unix」などとも書かれる。Unixは1969年、AT&Tのベル研究所にて、ケン・トンプソン、デニス・リッチーらが開発を開始した。 当初はアセンブリ言語のみで開発されたが、1973年にほぼ全体をC言語で書き直した。このため、Unixは歴史上、初めて高水準言語で書かれたOSであると言われる。 1973年の段階ではPDP-11に依存したコードが多く、移植性は低かったが、その後徐々にPDP-11に依存したコードを減少させ、1978年にInterdata 8/32への移植に成功して以降、徐々に他のプラットフォームにも移植されていった。 現在では「Unix」という語は、Unix標準に準拠するあらゆるオペレーティングシステムの総称でもある。現在ではUnixシステムは多数の系統に分かれており、AT&Tの開発停止後も、多数の商用ベンダーや非営利組織などによって開発が続けられている。 1970年代から1980年代の初期にかけて、Unixは大学や研究所などの教育機関で広範囲に採用され、特にカリフォルニア大学バークレー校をオリジナルとするBSD系統が誕生した。また Version 7 Unix や UNIX System V の特徴を持つオペレーティングシステムは「伝統的なUNIX」(traditional Unix)とも呼ばれる。 2007年に、「UNIX」の商標の所有者である標準化団体のThe Open Groupは、Single UNIX Specificationを完全に満たすと認証を受けたシステムのみが「UNIX」の商標を得られるとした。このためそれ以外のシステムは(ずっと以前から、AT&T版およびBSD以外を指して使われていた用語だが)「Unixシステムライク」または「Unixライク(Unix系)」と呼ばれるようになった。ただし The Open Groupはその呼称を気に入っていない。 現在では多く使われているUnixとしてはmacOS、AIX、HP-UX、Solarisなどがある(いずれも商用)。また認証を受けていないUnix系としてはLinux(派生OSにAndroid他)やMINIX、BSDの派生OS(FreeBSD、NetBSD、OpenBSD、DragonFly BSDなど)がある。.

新しい!!: 正規表現とUNIX · 続きを見る »

Unix系

複数のUnix系システム間の関連図 Unix系(ユニックスけい、ユニックスライク)とは、Unixに類似した振る舞いをするオペレーティングシステム (OS) を指す用語である。その判断基準や範囲には複数の議論がある。.

新しい!!: 正規表現とUnix系 · 続きを見る »

Vi

vi(ヴィーアイ)は、Emacsと共にUNIX環境で人気があるテキストエディタ。ビル・ジョイによって開発された。名の由来はVIsual editorないしVisual Interfaceとされる。後発のUnix系OSに搭載されているviは、上位互換のVimやnviであることが多い(viコマンドでvimやnviが起動する)。.

新しい!!: 正規表現とVi · 続きを見る »

正規言語

正規言語(せいきげんご)または正則言語(せいそくげんご)は、以下に示す性質(いずれも等価)を満たす形式言語である。.

新しい!!: 正規表現と正規言語 · 続きを見る »

歌代和正

歌代 和正(うたしろ かずまさ、1960年 - )は、日本の翻訳家。 埼玉県出身。2004年5月より有限責任中間法人JPCERTコーディネーションセンター(JPCERT/CC) 代表理事。 2006年4月現在、インターネットイニシアティブ特別研究員、WIDEプロジェクト会員、セキュアスカイ・テクノロジー顧問。.

新しい!!: 正規表現と歌代和正 · 続きを見る »

演算子

演算子(えんざんし、operator symbol, operator name)は、数式やコンピュータプログラミング言語などで、各種の演算を表わす記号・シンボルである。普通は、演算子は単なる記号ないし記号列であって構文論的なものであり、それに対応する演算は意味論の側にある。たとえばJavaにおいて、演算子 + を使った a + b という式は、構文論上は単にそういう式だというだけである。意味論的には数値の加算であったり、文字列の連結であったりするが、それは a と b の型に依って決まる(理論的には項書き換えのように、構文論的に意味論も与えられた演算子といったものもある)。 演算が作用する対象のことを被演算子(operand; オペランド、被演算数、引数)という。たとえば、n と 3 との和を表す式 "n + 3" において、"+" は演算子であり、その被演算子は "n" と "3" である。また、数式として一般的な被演算子と被演算子の間に演算子を記述する構文は中置記法と呼ばれる。 数学的には、基本的には、関数(単項演算子では1引数の関数、2項演算子は2引数の関数)をあらわすある種の糖衣構文のようなものに過ぎない。しかし、汎函数計算など、演算子を操作するような手法もある。.

新しい!!: 正規表現と演算子 · 続きを見る »

文字列

文字列(もじれつ)は、単語や文章のような、文字の連なったもの。ストリング (string)、テキスト (text) という場合もある。コンピュータ、特にプログラミングの分野で用いることが多い。.

新しい!!: 正規表現と文字列 · 続きを見る »

文字列探索

文字列探索 (もじれつたんさく) とは、ある文字列の中から、別のある文字列を探索することである。テキストエディタ等で必須の機能であり、これまでさまざまなアルゴリズムが考案されている。 ここでいう文字列とは、ある定まった文字集合の要素を任意に並べた系列のことである。通常、文字はアルファベット等の言語に依拠した文字セットを指すことが多いが、生物情報学における染色体の塩基配列A, T, G, Cの4文字を対象とするもののように、特定の領域に特化した応用も行われている。 正規表現にマッチする文字列の探索、と類似した問題だが、正規表現で可能なパターンに比べ検索対象を絞ることで、より高速に探索するものとして研究されている(ユーザの使うプログラムでは、検索するパターンに応じて、アルゴリズムを切り替えるものもある)。正規表現による探索については正規表現の記事を参照のこと。 近年は、暗号化された文字列を復号せずに探索する秘匿検索、圧縮テキスト中の文字列探索の研究、多国語文字列のバイト列表現に対する探索の研究、なども行われている。.

新しい!!: 正規表現と文字列探索 · 続きを見る »

ここにリダイレクトされます:

RegexRegexp

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »