ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
ダウンロード
ブラウザよりも高速アクセス!
 

全文検索

索引 全文検索

全文検索(ぜんぶんけんさく、Full text search)とは、コンピュータにおいて、複数の文書(ファイル)から特定の文字列を検索すること。「ファイル名検索」や「単一ファイル内の文字列検索」と異なり、「複数文書にまたがって、文書に含まれる全文を対象とした検索」という意味で使用される。.

86 関係: Apache Lucene富士ゼロックス二分探索形態素解析ページランクマイクロソフトバイナリワードプロセッサプラグインプレーンテキストパターン認識ビレッジセンターテーブル (情報)テキストファイルファイル (コンピュータ)ファイルサーバファストサーチ & トランスファわかち書きアルゴリズムアップル (企業)アプリケーションソフトウェアエンタープライズサーチオペレーティングシステムオートノミーオフィススイートグラフィカルユーザインタフェースコンピュータシグネチャ法ジャストシステムスペースソートサーチクロスBeagleBingButterfly search索引DocuWorks転置インデックス辞典GoogleGoogleデスクトップGrepHTML要素Hyper EstraierHyperText Markup LanguageInfoBee/iSLinuxLudiaMac OS X v10.4MacOS...MetaTrackerMicrosoft ExcelMicrosoft OfficeMicrosoft Office 365Microsoft SharePointMicrosoft Windows 2000Microsoft Windows VistaMicrosoft Windows XPMicrosoft WordMySQLNamazuPerlPHP (プログラミング言語)Portable Document FormatPostgreSQLPythonQuickSolutionRubySennaSherlock (ソフトウェア)SpotlightTf-idfUnicodeUNIXUnix系UTF-8Windows サーチXpdf接尾辞配列束縛 (情報工学)検索検索エンジン概念検索情報検索文字列文字列探索 インデックスを展開 (36 もっと) »

Apache Lucene

Apache Lucene(アパッチ ルシーン)は、Javaで記述された全文検索ソフトウェアである。あらかじめ蓄積した大量のデータから、指定したキーワードを探し出す機能を持つ。Javaのクラスライブラリとして提供される。.

新しい!!: 全文検索とApache Lucene · 続きを見る »

富士ゼロックス

富士ゼロックス株式会社(ふじゼロックス、英語:Fuji Xerox Co., Ltd.)は、富士写真フイルム株式会社(現: 富士フイルムホールディングス)とイギリスの現地法人であるランク・ゼロックス(現: ゼロックス・リミテッド)社との合弁会社として1962年 (昭和37年)に誕生した日本の機械メーカーである。本社所在地は東京都港区(東京ミッドタウン)。 本社に相当するアメリカ合衆国のゼロックス・コーポレーションとの合弁会社とならなかったのは、当時はアジア地域がランク・ゼロックス社の商圏だったことによるものだった。なおランクゼロックスは1997年にアメリカ本部の100%完全子会社になったため、後年は事実上、ゼロックスコーポレーションと富士写真フイルムとの合弁会社だった。現在は後述のとおり経営統合された持ち株会社である富士フイルムホールディングスの連結子会社であるが、ゼロックスリミテッド社も25%の株を保有している。.

新しい!!: 全文検索と富士ゼロックス · 続きを見る »

二分探索

二分探索(にぶんたんさく、binary search、BS)や二分検索やバイナリサーチとは、ソート済み配列に対する探索アルゴリズムの一つ。.

新しい!!: 全文検索と二分探索 · 続きを見る »

形態素解析

形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。 自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。 もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上の自然言語処理としてコンピュータでの扱いやすさに主眼を置いた解析もある。以下は後者のためのツールを用いた例で、「お待ちしております」という文を形態素解析した例である (「茶筌」を使用した)。 自然言語以外の場合では、プログラミング言語などの場合は字句解析が相当する。.

新しい!!: 全文検索と形態素解析 · 続きを見る »

ページランク

ページランク (PageRank) は、ウェブページの重要度を決定するためのアルゴリズムであり、検索エンジンのGoogleにおいて、検索語に対する適切な結果を得るために用いられている中心的な技術。Googleの創設者のうちラリー・ペイジとセルゲイ・ブリンによって1998年に発明された。名称の由来は、ウェブページの"ページ"とラリー・ペイジの姓をかけたものである。 PageRankはGoogleの商標であり、またPageRankの処理は特許が取得されている。ただし、特許はGoogleではなくスタンフォード大学に帰属しており、Googleはスタンフォード大学から同特許の権利を独占的にライセンスされている。なお、同大学は特許の使用権と交換にGoogleから180万株を譲渡されているが、その株式は2005年に3億3,600万ドルで売却された。.

新しい!!: 全文検索とページランク · 続きを見る »

マイクロソフト

マイクロソフト()は、アメリカ合衆国ワシントン州に本社を置く、ソフトウェアを開発・販売する会社である。1975年4月4日にビル・ゲイツとポール・アレンらによって設立された。.

新しい!!: 全文検索とマイクロソフト · 続きを見る »

バイナリ

バイナリ (binary) とは二進法のことであるが、コンピュータが処理・記憶するために2進化されたファイルまたはその内部表現の形式(バイナリデータ)のことを指して用いることが多い。 コンピュータが扱うすべてのデータはバイナリデータ(バイトの並び)であり、プレーンテキスト(または単にテキスト)もバイナリデータの一種ではあるが、通常バイナリとテキストは対比して用いられる。テキストとはデータの内容すべてを人間が読んで理解できる (human-readable) もの、バイナリとはそうでないものを指す。human-readableに対する語はmachine-readableだが、これは(機械的に読むことが可能であるように)フォーマットが定められているもの、という意味である。バイナリフォーマットではエンディアンなどに互換性・移植性の上で注意が必要であり、それを避けてテキスト形式で記録することも少なくない(UNIX哲学も参照。なお浮動小数点数やループした構造の表現など、テキスト形式にも注意が必要な点は多い)。バイナリエディタを用いると、バイナリファイルを1バイトずつの(16進法での)数値の並びとして表示・編集を行うことができる。バイナリのファイルでも多くは部分的にテキストとして読み取れる箇所が存在するため、そういった箇所のみを抜き出すstringsというユーティリティもある。 バイナリファイルにはたとえば画像ファイルや音声ファイル、圧縮されたファイルなどがある。バイナリファイルの中にはファイルの先頭にメタ情報(ヘッダ)を持っているものがある。たとえばGIFファイルは複数の画像を持つことができ、ファイルの先頭でそれぞれの画像を区別する情報が記述されている。そのようなメタ情報を持たないファイルはフラットバイナリファイルと呼ばれる。コンピュータプログラム関係では、テキストであるソースコードとの対比からコンパイルされたコード(オブジェクトファイルや実行ファイルなど。またそのような機械語(ネイティブバイナリ)に限らず、WebAssemblyやJavaなどのバイトコード類なども含む)のファイル等を指してバイナリと呼ばれることがしばしばある。プロプライエタリのソフトウェアは、バイナリの形態でさらに難読化を掛けて、販売されることが多い。 バイナリ形式でのデータの表現方法はさまざまなものがある。例えば、数値であれば0~9までの数をパターン化して記録するBCD、ゾーンビットと実際の数値、正の数か負の数かを記録する符号ビットからなるアンパック10進数(ゾーン10進数)や、実際の数値と符号ビットだけからなるパック10進数などがある。文字列の扱いとしては、ナル文字('\0')で終端する方法や、長さ(オクテット数、あるいは文字(符号点)の個数)を別に保持する、といった方式がある。前者では、'\0' を含むようなバイナリを「文字列」として扱うことができない。.

新しい!!: 全文検索とバイナリ · 続きを見る »

ワードプロセッサ

東芝Rupo JW05H(1992年11月発売) 東芝Rupo JW05Hの上面 ワードプロセッサ(Word processor)または文書作成編集機(ぶんしょさくせいへんしゅうき)は、コンピュータで文章を入力、編集、印刷できるシステムである。一般的な略称は「ワープロ」。ワープロ機能をROM化して組み込んである「ワープロ専用機」と、汎用的なパーソナルコンピュータで動作する「ワープロソフト」(Microsoft Word、一太郎など)がある。この記事では主に前者の「ワープロ専用機」を扱う。.

新しい!!: 全文検索とワードプロセッサ · 続きを見る »

プラグイン

プラグイン (plug-in).

新しい!!: 全文検索とプラグイン · 続きを見る »

プレーンテキスト

プレーンテキスト (plain text) とは、コンピュータ上で文章を扱うための一般的なファイルフォーマット、または文字列の形式である。厳密にはASCIIのみ、さらに厳密には7ビットASCIIで構成された文書だけを指すが、パソコンが多言語化し様々な文字コードが扱われている現在では、特定の文字コードに準拠したバイナリファイルだと定義できる。ワープロで作成した文章とは違い、文字ごとの色や形状、文章に含まれる図などといった情報を含まない。プレーンテキストに対して、文字ごとの色や形状、文章に含まれる図などといった情報を含む文章のことをマルチスタイルテキストと呼ぶ。しかし、マルチスタイルテキストの一部もファイルフォーマットとしてはプレーンテキストのみで構成されているものもある。 プレーンテキストには文字情報以外の情報は一切含まず、テキストデータのみで構成されている。バイナリデータや文字の整形情報を持たないので、最低限の機能しか持たないテキストエディタや表示用のソフトウェアで扱えると言う点で利便性が高い。その反面、格納できる情報が純粋にテキストのみに限定される為、文字の強調や加工や言語情報、フォント情報を持つことが出来ない。これらの情報を格納する場合は、HTMLのような工夫が必要になる。 MS-DOS、Windowsでは、EDLINやメモ帳、UNIXやLinuxの場合はviやEmacs、Mac OSの場合はSimpleText、macOSの場合はテキストエディットなどといったOSに標準的に付属するソフトウェアで編集することが出来る。 なお、テキストエディタを使うことで、プログラミング言語のソースコードやHTML、XML、TeXといった純粋なテキストのみで構成されているファイルを編集する事も可能である。.

新しい!!: 全文検索とプレーンテキスト · 続きを見る »

パターン認識

パターン認識(パターンにんしき、Pattern recognition)は自然情報処理のひとつ。画像・音声などの雑多な情報を含むデータの中から、一定の規則や意味を持つ対象を選別して取り出す処理である。.

新しい!!: 全文検索とパターン認識 · 続きを見る »

ビレッジセンター

株式会社ビレッジセンター( Village Center, Inc.)は、かつて存在していた日本のソフトウェア開発会社、出版社、広告代理店。 技術評論社の広告部門が独立する形で創業。以後、出版やソフトウェアの開発・販売を手がける。特にソフトウェア部門ではMS-DOS用テキストエディタ「VZ Editor」で一躍名を馳せる事になる。 フジテレビのテレビ番組「ウゴウゴルーガ」「ガチャガチャポン!」に登場する「ミカンせいじん」をマスコットキャラクターにしている。.

新しい!!: 全文検索とビレッジセンター · 続きを見る »

テーブル (情報)

HTMLを使ってウェブブラウザで描画したテーブルの例 テーブル(table)または表は、ビジュアルコミュニケーションの一形態であり、データを並べる手段である。テーブルはコミュニケーション、研究、データ解析など様々な分野で使われている。 印刷物、手書きのノート、コンピュータソフトウェア、建築装飾、交通標識など様々なところでテーブルを見つけることができる。テーブルについての正確な規定や用語は文脈によって異なる。さらに、テーブルの構造、柔軟性、記法、表現、用途も非常に多彩である。書籍や技術文書ではよく表番号と表タイトル付きの回り込みブロックとしてレイアウトされる。 テーブルは、階層型マトリックスの中にデータの集合の論理的構造をマッピングする視覚的情報伝達法の一種でもある。テーブル内のデータは離散的データの場合もあるし変数の場合もある。例えば、数表、真理値表、周期表、HTMLの表(table)などがある。しばしば、グラフなどとまとめられて「統計図表」という言われ方をすることがある。.

新しい!!: 全文検索とテーブル (情報) · 続きを見る »

テキストファイル

テキストファイル (Text File) は、文字など文字コードによって表されるデータだけが含まれるファイルのことで、ファイルフォーマットの一種と見なすこともできる。互換性が高く幅広い環境でデータを利用できる利点がある一方、単純な文字だけしか扱えないという制限がある。対義語はバイナリファイル。.

新しい!!: 全文検索とテキストファイル · 続きを見る »

ファイル (コンピュータ)

ンピュータにおけるファイル(file)は、コンピュータでデータを扱いやすくするための仕組み。場合によってはデータセット(data set)とも呼ばれる。.

新しい!!: 全文検索とファイル (コンピュータ) · 続きを見る »

ファイルサーバ

ファイルサーバは、LANやWANなどのネットワーク上で、ファイルを共有するために設置されるサーバである。.

新しい!!: 全文検索とファイルサーバ · 続きを見る »

ファストサーチ & トランスファ

ファストサーチ&トランスファ ASA(Fast Search & Transfer ASA)は、ノルウェー・オスロに本社を置く検索エンジン企業。略称 FAST。日本法人はファストサーチ&トランスファ株式会社(Fast Search & Transfer Co.,Ltd.)。 ノルウェー科学技術大学(Norwegian University of Science and Technology)で開発された検索技術を元に、1997年に設立された。2001年6月にオスロ証券取引所に上場。2003年に自社開発の検索エンジン AlltheWeb を売却してからは、主に企業向け検索システムの開発に注力している。日本では2001年から営業開始。同社の主力製品である「FAST ESP」は日本市場のトップシェアを占めるエンタープライズサーチ製品である。 2008年4月25日に米マイクロソフトによってFast Search & Transferが買収され、完全子会社となっている。.

新しい!!: 全文検索とファストサーチ & トランスファ · 続きを見る »

わかち書き

わかち書き(わかちがき)とは、文章において語の区切りに空白を挟んで記述することである。分かち書き・別ち書きとも表記する。.

新しい!!: 全文検索とわかち書き · 続きを見る »

アルゴリズム

フローチャートはアルゴリズムの視覚的表現としてよく使われる。これはランプがつかない時のフローチャート。 アルゴリズム(algorithm )とは、数学、コンピューティング、言語学、あるいは関連する分野において、問題を解くための手順を定式化した形で表現したものを言う。算法と訳されることもある。 「問題」はその「解」を持っているが、アルゴリズムは正しくその解を得るための具体的手順および根拠を与える。さらに多くの場合において効率性が重要となる。 コンピュータにアルゴリズムをソフトウェア的に実装するものがコンピュータプログラムである。人間より速く大量に計算ができるのがコンピュータの強みであるが、その計算が正しく効率的であるためには、正しく効率的なアルゴリズムに基づいたものでなければならない。.

新しい!!: 全文検索とアルゴリズム · 続きを見る »

アップル (企業)

アップル()は、アメリカ合衆国カリフォルニア州に本社を置く、インターネット関連製品・デジタル家庭電化製品および同製品に関連するソフトウェア製品を開発・販売する多国籍企業である。2007年1月9日に、アップルコンピュータ (Apple Computer, Inc.) から改称した。.

新しい!!: 全文検索とアップル (企業) · 続きを見る »

アプリケーションソフトウェア

アプリケーションスイートである。 アプリケーションソフトウェア(application software, 応用ソフトウェア)は、アプリケーション(応用)プログラムともいい、ワープロや表計算などといった、コンピュータを「応用」する目的に応じた、コンピュータ・プログラムである。なお、それに対してシステムプログラムは、アプリケーションプログラムに対して処理実行のための計算機資源を抽象化して提供する、などのインフラとしての役割のプログラムであり、ユーザーが要求する情報処理を直接実行するものではなく、ユーザーが普段は意識することはない裏方的な存在がシステムプログラムである。.

新しい!!: 全文検索とアプリケーションソフトウェア · 続きを見る »

エンタープライズサーチ

ンタープライズサーチ(Enterprise Search、エンタープライズ検索、企業内検索)は、内外のウェブサイトも含め、企業内、社内、部署内の書類、人事、経営情報等を統合し、検索できるようにするためのシステム、またはそのコンセプトのことである。エンタープライズサーチエンジン、企業向け検索エンジンと呼ばれることもある。Gartnerでは、エンタープライズサーチを、情報アクセス技術(Information access technology)という一般的な呼称で呼んでいる。インデックスを活用したデータベース(Index-based data management)として分類されることもあり、高速なデータアクセス手段の一つでもある。.

新しい!!: 全文検索とエンタープライズサーチ · 続きを見る »

オペレーティングシステム

ペレーティングシステム(Operating System、OS、オーエス)とは、コンピュータのオペレーション(操作・運用・運転)のために、ソフトウェアの中でも基本的、中核的位置づけのシステムソフトウェアである。通常、OSメーカーが組み上げたコンピュータプログラムの集合として、作成され提供されている。 オペレーティングシステムは通常、ユーザーやアプリケーションプログラムとハードウェアの中間に位置し、ユーザーやアプリケーションプログラムに対して標準的なインターフェースを提供すると同時に、ハードウェアなどの各リソースに対して効率的な管理を行う。現代のオペレーティングシステムの主な機能は、ファイルシステムなどの補助記憶装置管理、仮想記憶などのメモリ管理、マルチタスクなどのプロセス管理、更にはGUIなどのユーザインタフェース、TCP/IPなどのネットワーク、などがある。オペレーティングシステムは、パーソナルコンピュータからスーパーコンピュータまでの各種のコンピュータや、更にはスマートフォンやゲーム機などを含む各種の組み込みシステムで、内部的に使用されている。 製品としてのOSには、デスクトップ環境やウィンドウシステムなど、あるいはデータベース管理システム (DBMS) などのミドルウェア、ファイル管理ソフトウェアやエディタや各種設定ツールなどのユーティリティ、基本的なアプリケーションソフトウェア(ウェブブラウザや時計などのアクセサリ)が、マーケティング上の理由などから一緒に含められていることもある。 OSの中で、タスク管理やメモリ管理など特に中核的な機能の部分をカーネル、カーネル以外の部分(シェルなど)をユーザランドと呼ぶ事もある。 現代の主なOSには、Microsoft Windows、Windows Phone、IBM z/OS、Android、macOS(OS X)、iOS、Linux、FreeBSD などがある。.

新しい!!: 全文検索とオペレーティングシステム · 続きを見る »

オートノミー

ートノミー (Autonomy Corporation) は、アメリカ合衆国のサンフランシスコとイギリスのケンブリッジに本拠を置く、エンタープライズソフトウェア企業である。オートノミーは、ケンブリッジ大学の研究により開発された独自に組み合わされたテクノロジを駆使し、ベイズ推定をベースにしたパターン認識技術を応用したエンタープライズサーチやナレッジマネジメントなどの様々なアプリケーションを開発している。ロンドン証券取引所に上場しており、FTSE100種総合株価指数の構成銘柄の1つである。日本法人はオートノミー株式会社。以前は独立した企業だったが、2011年10月にヒューレット・パッカードに買収されている。.

新しい!!: 全文検索とオートノミー · 続きを見る »

オフィススイート

フィススイート(Office suite)とは、デスクトップパソコン、ノートパソコン、タブレット、スマートフォンにインストールされて使用、または、クラウドサービスで使用する、オフィス業務に必要なソフトウェアをセットにした、ソフトウェアスイートの一種。スイートとは、「ひと揃え」という意味。より一般的にはオフィスソフトとも呼ばれる。ワープロ、表計算、プレゼンテーション、メールクライアント、個人情報管理、パブリッシング、データベースなどのアプリケーションが組み合わされる。.

新しい!!: 全文検索とオフィススイート · 続きを見る »

グラフィカルユーザインタフェース

GUIを提供するソフトウェアの1つ、GNOME グラフィカルユーザインタフェース('''G'''raphical '''U'''ser '''I'''nterface、GUI)は、コンピュータグラフィックスとポインティングデバイスなどを用いる、グラフィカル(ビジュアル)であることを特徴とするユーザインタフェース。キャラクタユーザインタフェース (CUI) やテキストユーザインタフェース (TUI) と対比して語られることが多い。.

新しい!!: 全文検索とグラフィカルユーザインタフェース · 続きを見る »

コンピュータ

ンピュータ(Computer)とは、自動計算機、とくに計算開始後は人手を介さずに計算終了まで動作する電子式汎用計算機。実際の対象は文字の置き換えなど数値計算に限らず、情報処理やコンピューティングと呼ばれる幅広い分野で応用される。現代ではプログラム内蔵方式のディジタルコンピュータを指す場合が多く、特にパーソナルコンピュータやメインフレーム、スーパーコンピュータなどを含めた汎用的なシステムを指すことが多いが、ディジタルコンピュータは特定の機能を実現するために機械や装置等に組み込まれる組み込みシステムとしても広く用いられる。電卓・機械式計算機・アナログ計算機については各項を参照。.

新しい!!: 全文検索とコンピュータ · 続きを見る »

シグネチャ法

ネチャ法( - ほう)とは全文検索システムにおけるインデックス作成手法のひとつ。全文検索用インデックスとしてもっとも利用されている転置ファイル方式と比べると、検索速度、機能性こそ引けを取るが、「原理が単純で実装が容易」「grepのような逐次検索よりは高速」といった利点がある。シグネチャ (signature) とは英語で「署名」の意味である。.

新しい!!: 全文検索とシグネチャ法 · 続きを見る »

ジャストシステム

株式会社ジャストシステム()は東京都新宿区西新宿6-8-1に東京本社(実際の本社機能)、徳島県徳島市川内町平石若松108番地4に徳島本社(登記上の本店)を置くソフトウェア開発会社。通称「ジャスト」。.

新しい!!: 全文検索とジャストシステム · 続きを見る »

スペース

ペース(space)は、ラテン文字、ギリシア文字、キリル文字などにおいて、語と語の区切りを表すために空ける空白、またその他の字間の空白のことである。 ヘブライ語やアラブ語においては、早い時期から単語の区切りを表すのに空白が置かれていた。ラテン文字で最初に使われたのはアイルランド語で、時期は600年から800年頃と考えられている。それまでラテン文字では中黒が使われていた。.

新しい!!: 全文検索とスペース · 続きを見る »

ソート

ート は、データの集合を一定の規則に従って並べること。日本語では整列(せいれつ)と訳される。(以前はその原義から分類という訳語が充てられていたが、もう使われていない) 主にコンピュータソフトにおけるリストに表示するデータに対し、全順序関係によって一列に並べることを指す。また、単に「ソート」といった場合、値の小さい方から大きい方へ順に並べる昇順(しょうじゅん、)を指すことが多い。その反対に値を大きい方から小さい方へ順に並べることを降順(こうじゅん、)という。 対象となるデータのデータ構造や必要な出力によって、使われるアルゴリズムは異なる。.

新しい!!: 全文検索とソート · 続きを見る »

サーチクロス

ーチクロス (SEARCH X) は、株式会社ビレッジセンターが販売していたWindows上で動作するデスクトップ検索ツールである。.

新しい!!: 全文検索とサーチクロス · 続きを見る »

Beagle

Beagle(ビーグル)は、Monoプラットフォーム上で動作するデスクトップ検索ツール。 主にLinuxでの動作を想定しているが、その他のMono対応プラットフォーム上でも動作する。 ドキュメント、チャットのログ、電子メールなど様々なものを検索出来る(後述)。 WindowsでのGoogleデスクトップや、macOSでのSpotlightに類似したものである。.

新しい!!: 全文検索とBeagle · 続きを見る »

Bing

Bing(ビング)は、Microsoftが提供する検索エンジンである。「意思決定エンジン」というコンセプトを掲げ、他の検索エンジンとの差別化を図っている。 旧名称はMSN サーチ、Windows Live サーチ、Live サーチがあり、Windows Live サーチは、Windows Liveサービスの一つでもあった。.

新しい!!: 全文検索とBing · 続きを見る »

Butterfly search

butterfly_search (バタフライサーチ) は、Microsoft Windows向けのデスクトップ検索ツールである。.

新しい!!: 全文検索とButterfly search · 続きを見る »

索引

索引(さくいん)とは、百科事典・学術書などの書籍や雑誌・新聞などの記事、統計、コンピュータのデータにおいて、特定の項目を素早く参照できるよう、見出し語を特定の配列に並べ、その所在をまとめたもの。(加えて凡例や相互参照、限定詞のあることもある。)コンピュータで用いられる際にはインデックス (index (pl. indice))と呼ばれることもある。 インターネット上のWorld Wide Webの索引集のことを、ウェブディレクトリという。.

新しい!!: 全文検索と索引 · 続きを見る »

DocuWorks

DocuWorks(ドキュワークス)は、富士ゼロックス社製の、電子文書と電子化した紙文書を一元管理するオフィス向けドキュメント・ハンドリング・ソフトウェアである。.

新しい!!: 全文検索とDocuWorks · 続きを見る »

転置インデックス

転置インデックス(てんちインデックス、Inverted index)とは、全文検索を行う対象となる文書群から単語の位置情報を格納するための索引構造をいう。転置索引、転置ファイル、逆引き索引などとも呼ばれる。.

新しい!!: 全文検索と転置インデックス · 続きを見る »

辞典

ラーツ大学図書館のラテン語辞書 辞典(じてん)とは、言葉や物事、漢字などを集め、その品詞・意味・背景(語源等)・使用法(用例)・派生語・等を解説した書籍。辞書(じしょ)・字引(じびき)とも言う。 なお、「辞典」「辞書」という単語は、主に言葉について書かれたもの(国語辞典、英和辞典、漢和辞典など)について用いるもので、文字について書かれた辞典は「字典」、事物に就いて詳細に書かれた辞典(百科事典など)については「事典」という表記を用いて区別される。「辞典」「字典」「事典」はいずれも「じてん」で発話においては区別できないため、それぞれ「ことばてん」(言葉典)、「もじてん」(文字典)、「ことてん」(事典)と言い換えられることもある。 辞書に関する学問分野として辞書学がある。.

新しい!!: 全文検索と辞典 · 続きを見る »

Google

Google LLC(グーグル)は、インターネット関連のサービスと製品に特化したアメリカの多国籍テクノロジー企業である。検索エンジン、オンライン広告、クラウドコンピューティング、ソフトウェア、ハードウェア関連の事業がある。.

新しい!!: 全文検索とGoogle · 続きを見る »

Googleデスクトップ

Googleデスクトップ(グーグル デスクトップ)とは、Windows、Mac OS X、Linux向けに Googleが開発したデスクトップ検索ソフトウェア。ローカルディスクおよび指定したネットワークディスク上にあるファイルに対するテキスト検索が行える。検索対象には、閲覧ウェブページや電子メール、チャットの履歴なども含まれる。また、Googleデスクトップには、Googleガジェットと呼ばれるウィジェットエンジンが含まれている。 2011年9月2日、GoogleはGoogleデスクトップのサービス終了を発表した。終了の理由としてGoogleでは、データの保存がローカルからクラウドへ移行しつつあることや、モダンなOSに同等の検索機能が統合されたことなどを挙げ、当初の目標を達成したとしている。.

新しい!!: 全文検索とGoogleデスクトップ · 続きを見る »

Grep

grep(グレップ、グレプ)は、UNIXおよびUnixオペレーティングシステムにおけるコマンド。テキストファイル中から、正規表現に一致する行を検索して出力する。.

新しい!!: 全文検索とGrep · 続きを見る »

HTML要素

HTML要素(HTMLようそ、HTML element)の記事では、HTML文書を構成する各種の要素を解説する。なお、一般に「HTML要素」と言った場合、HTML文書において「html」というタグ名のルート要素を指すことが多い。.

新しい!!: 全文検索とHTML要素 · 続きを見る »

Hyper Estraier

Hyper Estraier(はいぱー・えすとれいや)は、日本で開発された全文検索エンジンのライブラリである。ライセンスはLGPLで提供されている。.

新しい!!: 全文検索とHyper Estraier · 続きを見る »

HyperText Markup Language

HyperText Markup Language(ハイパーテキスト マークアップ ランゲージ、HTML(エイチティーエムエル))は、ハイパーテキストを記述するためのマークアップ言語の1つである。World Wide Web (WWW)において、ウェブページ(1990年代後半頃からはコンテンツという語も利用されている。「中身」という意味の語であり、大層な意味は無い)を表現するために用いられる。ハイパーリンクや画像等のマルチメディアを埋め込むハイパーテキストとしての機能、見出しや段落といったドキュメントの抽象構造、フォントや文字色の指定などの見た目の指定、などといった機能がある。 2012年7月以降、WHATWG により仕様が作られ、それを元に W3C により勧告が行われるという流れになっている。W3C は、XML ベースの規格である XHTML の勧告も行っている。.

新しい!!: 全文検索とHyperText Markup Language · 続きを見る »

InfoBee/iS

InfoBee/iS(インフォビーアイエス)は、NTTヒューマンインタフェース研究所で開発された全文検索エンジンInfoBeeをもとに、NTTアイティによって開発・販売されている全文検索エンジンである。 NTT研究所にて開発された形態素解析技術を用いて転置インデックスを作成し、高速・高精度な検索を行うことができる。.

新しい!!: 全文検索とInfoBee/iS · 続きを見る »

Linux

Linux(リナックス、他の読みは後述)とは、Unix系オペレーティングシステムカーネルであるLinuxカーネル、およびそれをカーネルとして周辺を整備したシステム(GNU/Linuxシステムも参照)である。.

新しい!!: 全文検索とLinux · 続きを見る »

Ludia

Ludia(るでぃあ)は、PostgreSQLに全文検索機能を追加する拡張モジュールでオープンソースソフトウェアである。 LudiaはSennaを利用することにより、全文検索インデックスを作成する。この全文検索インデックスは、PostgreSQLの通常のインデックスと同様にSQLクエリの際に利用可能であり、高速で高精度(Sennaと同様)な全文検索が可能となる。株式会社NTTデータにより開発され、2006年10月11日にLGPLライセンスのオープンソースソフトウェアとしてバージョン0.8.0が公開された。 Linux・FreeBSDなどのUNIX系OS、Windowsで動作する。PostgreSQL 8.1以降で利用可能。 PostgreSQL 8.3以降に組み込まれた全文検索エンジンをベースとした日本語検索()が形態素解析による検索のみをサポートするのに対し、Ludiaは形態素解析以外にSennaによるN-gram検索にも対応するのが特徴である。ただしPostgreSQL 8.4以降では、同じくN-gram検索に対応したが登場している。 2007年12月にバージョン1.5.0をリリースして以降、バグ修正以外の実質的なバージョンアップが停止した状態にあり、PostgreSQL 8.3以降の環境では後述するような運用上の制限を受けることから、最近はtextsearch_jaもしくはtextsearch_sennaを必要に応じて使い分けるケースが増えてきている。.

新しい!!: 全文検索とLudia · 続きを見る »

Mac OS X v10.4

Mac OS X v10.4 Tiger(マック オーエス テン バージョンじってんよん タイガー)は、アップルが開発・販売していた、Mac OS Xの5番目のバージョンである。バージョンナンバーは10.4。愛称は、コードネームでもある“Tiger”(タイガー)。Mac OS X v10.3の後継であり、PowerPC版でClassic環境が使える最後のOSとなった。 2005年4月12日公式発表され、同年4月29日に発売開始された。最終セキュリティアップデートは、2009年9月10日にリリースされた Security Update 2009-005である。対応するSafariのセキュリティアップデートは、2010年11月のSafari 4.1.3まで提供された。.

新しい!!: 全文検索とMac OS X v10.4 · 続きを見る »

MacOS

macOS(マックオーエス)は、アップルが開発・販売する、Macのオペレーティングシステムである。かつての名称はOS X、Mac OS Xであった(後述)。 技術的に直系ではないが、Classic Mac OS (Mac OS、System) の後継として、新たにBSD系UNIXをベースに開発された。.

新しい!!: 全文検索とMacOS · 続きを見る »

MetaTracker

MetaTracker (または単にTracker) は、LinuxやUnix系システム用の検索システムである。MetaTrackerはC言語で記述されている。 GNOMEのファイルはTrackerをサポートする。 Conduitアプリケーションの開発者の一人は「メタデータ対応のGNOME」を作るためにMetaTrackerを使うことを提案した。これはKDE Software Compilation 4においてStrigiをメタデータフレームワークのインデクサに使うことに似ている。.

新しい!!: 全文検索とMetaTracker · 続きを見る »

Microsoft Excel

Microsoft Excel(マイクロソフト・エクセル)は、マイクロソフトがWindows、macOS、iOSおよびAndroid向けに開発・販売している表計算ソフトである。Microsoft Wordとともに、同社のオフィススイート「Microsoft Office」の中核をなすアプリケーションである。.

新しい!!: 全文検索とMicrosoft Excel · 続きを見る »

Microsoft Office

Microsoft Office(マイクロソフト オフィス)は、マイクロソフトのオフィススイートである。 Microsoft Office は、単体ソフトウェアとしては1983年5月に Multi-Tool Word の名前で XENIX 向けに発売されたのが最初で、オフィススイートとして複数のソフトウェアがセットになった状態で発売されたのは1989年6月に Macintosh (Mac) 向けが最初である。この時点で Word, Excel, PowerPoint が含まれていた。Windows 向けに発売したのは1990年10月である。日本語版が用意されたのは、Office for Mac 4.2 と Office 3.0(日本ではOffice 1.0として発売)からである。.

新しい!!: 全文検索とMicrosoft Office · 続きを見る »

Microsoft Office 365

Microsoft Office 365はマイクロソフトから提供される商用のSaaS(Software as a Service)型クラウドサービスで、Officeのデスクトップアプリケーション版およびウェブアプリケーション版、Exchange Online、SharePoint Online、Skype for Businessで構成される。.

新しい!!: 全文検索とMicrosoft Office 365 · 続きを見る »

Microsoft SharePoint

Microsoft SharePointとは、マイクロソフトが提供する、ウェブブラウザをベースとしたコラボレーションやドキュメント管理を行うプラットフォームの総称である。共有されたワークスペースやドキュメントに対してウェブブラウザからアクセスできるほか、Wikiやブログなどのようなアプリケーションもホストすることができる。SharePointの機能の多くは、Webパーツと呼ばれるものによって構成されている。たとえばタスクリストや電子会議室などをWebパーツとして作成することができる。SharePointはIISをベースとし、Microsoft SQL ServerをデータベースとするASP.NET2.0Webアプリケーションである。 Microsoft SharePointは3種類のエディションで提供されている。.

新しい!!: 全文検索とMicrosoft SharePoint · 続きを見る »

Microsoft Windows 2000

Windows 2000(ウィンドウズ にせん)はマイクロソフトがWindows NT 4.0の後継バージョンとして発表したWindows NT系のオペレーティング システムである。略称はWin2000、Win2k、W2K。コードネームはCairo(カイロ)。.

新しい!!: 全文検索とMicrosoft Windows 2000 · 続きを見る »

Microsoft Windows Vista

Windows Vista (ウィンドウズ ビスタ)は、マイクロソフトが2006年にリリースした、Windowsシリーズに属するパーソナルコンピュータ用のオペレーティングシステム(OS)である。.

新しい!!: 全文検索とMicrosoft Windows Vista · 続きを見る »

Microsoft Windows XP

Windows XP(ウィンドウズ エックスピー)は、マイクロソフトが2001年に発表したWindowsシリーズに属するオペレーティングシステム(OS)である。 XPは「経験、体験」を意味するexperienceに由来する。開発時のコードネームはWhistler(ウィスラー)と呼ばれていた。.

新しい!!: 全文検索とMicrosoft Windows XP · 続きを見る »

Microsoft Word

Microsoft Word(マイクロソフト・ワード)は、マイクロソフトがWindows、macOS及びiOS向けに販売している文書作成ソフトウェア。 Microsoft Excelとともに、同社のオフィススイート、Microsoft Officeの中核をなすアプリケーションである。一般的にはワード(WordまたはMS-Wordとも)と呼ばれることが多いが、「ワード」と名称が付く商品名や商標名は他にもある。.

新しい!!: 全文検索とMicrosoft Word · 続きを見る »

MySQL

MySQL(まい・えすきゅーえる)は、オープンソースで公開されている関係データベース管理システム (RDBMS) の一つである。.

新しい!!: 全文検索とMySQL · 続きを見る »

Namazu

Namazu(なまず)は、オープンソースの全文検索システム。UNIX系OS及びWindowsで動作する。.

新しい!!: 全文検索とNamazu · 続きを見る »

Perl

Perl(パール)とは、ラリー・ウォールによって開発されたプログラミング言語である。実用性と多様性を重視しており、C言語やsed、awk、シェルスクリプトなど他のプログラミング言語の優れた機能を取り入れている。ウェブ・アプリケーション、システム管理、テキスト処理などのプログラムを書くのに広く用いられている。 言語処理系としてのperlはフリーソフトウェアである。Artistic LicenseおよびGPLのもとで配布されており、誰でもどちらかのライセンスを選択して利用することができる。UNIXやWindowsなど多くのプラットフォーム上で動作する。.

新しい!!: 全文検索とPerl · 続きを見る »

PHP (プログラミング言語)

PHP(ピー・エイチ・ピー)は "The PHP Group" によってコミュニティベースで開発されているオープンソースの汎用プログラミング言語およびその公式の処理系であり、特にサーバーサイドで動的なウェブページ作成するための機能を多く備えていることを特徴とする。 名称の PHP は再帰的頭字語として、 "PHP: Hypertext Preprocessor" を意味するとされており、「PHPはHTMLのプリプロセッサである」とPHP自身を再帰的に説明している。.

新しい!!: 全文検索とPHP (プログラミング言語) · 続きを見る »

Portable Document Format

Portable Document Format(ポータブル・ドキュメント・フォーマット、略称:PDF)は、アドビシステムズが開発および提唱する、電子上の文書に関するファイルフォーマットである。1993年に発売されたAdobe Acrobatで採用された。 特定の環境に左右されずに全ての環境でほぼ同様の状態で文章や画像等を閲覧できる特性を持っている。 アドビシステムズはPDF仕様を1993年より無償で公開していたが、それでもPDF規格はAdobeが策定するプロプライエタリなフォーマットであった。2008年7月には国際標準化機構によってISO 32000-1として標準化された。アドビはISO 32000-1 についての特許を無償で利用できるようにしたが、XFA (Adobe XML Forms Architecture) やAdobe JavaScriptなどはアドビのプロプライエタリな部分として残っている。.

新しい!!: 全文検索とPortable Document Format · 続きを見る »

PostgreSQL

PostgreSQL(ぽすとぐれすきゅーえる: )はオープンソースのオブジェクト関係データベース管理システム (ORDBMS) である。その名称は Ingres の後継を意味する「Post-Ingres」に由来している。「Postgres」や「ポスグレ」と呼ばれることも多い。.

新しい!!: 全文検索とPostgreSQL · 続きを見る »

Python

Python(パイソン)は、汎用のプログラミング言語である。コードがシンプルで扱いやすく設計されており、C言語などに比べて、さまざまなプログラムを分かりやすく、少ないコード行数で書けるといった特徴がある。.

新しい!!: 全文検索とPython · 続きを見る »

QuickSolution

QuickSolutionは、N-Gramと形態素の技術要素を持つ商用全文検索エンジン。あいまい検索(類似検索)、完全一致検索(キーワード検索)、属性検索の3つを組合せた検索が可能。.

新しい!!: 全文検索とQuickSolution · 続きを見る »

Ruby

Ruby(ルビー)は、まつもとゆきひろ(通称 Matz)により開発されたオブジェクト指向スクリプト言語であり、スクリプト言語が用いられてきた領域でのオブジェクト指向プログラミングを実現する。 また日本で開発されたプログラミング言語としては初めて国際電気標準会議で国際規格に認証された事例となった。.

新しい!!: 全文検索とRuby · 続きを見る »

Senna

Senna(せな、Senna: An Embeddable Fulltext Search Engine)は、未来検索ブラジルによって開発されているオープンソースの全文検索エンジンである。検索速度が高速なことから、「音速の貴公子」と呼ばれたアイルトン・セナにちなんで名づけられた。.

新しい!!: 全文検索とSenna · 続きを見る »

Sherlock (ソフトウェア)

Sherlock(シャーロック)とは、アップルがかつて開発していたインターネットおよびローカルディスクの検索ソフトウェアである。.

新しい!!: 全文検索とSherlock (ソフトウェア) · 続きを見る »

Spotlight

Spotlight(スポットライト)とは、Mac OS X v10.4 Tigerから搭載されたSQLiteをベースとしたデスクトップ検索機能、およびその基盤技術のことである。検索フィールドに欲しい情報のキーワードを入力するだけで関連する全ての対象を検索できる。2004年のWWDCで同OSと同時に発表され、その高速性が大いにアピールされた。.

新しい!!: 全文検索とSpotlight · 続きを見る »

Tf-idf

tf-idfは、文書中に含まれる単語の重要度を評価する手法の1つであり、主に情報検索やトピック分析などの分野で用いられている。 tf-idfは、tf(Term Frequency、単語の出現頻度)とidf(Inverse Document Frequency、逆文書頻度)の二つの指標に基づいて計算される。 \mathrm.

新しい!!: 全文検索とTf-idf · 続きを見る »

Unicode

200px Unicode(ユニコード)は、符号化文字集合や文字符号化方式などを定めた、文字コードの業界規格である。文字集合(文字セット)が単一の大規模文字セットであること(「Uni」という名はそれに由来する)などが特徴である。 1980年代に、Starワークステーションの日本語化 (J-Star) などを行ったゼロックス社が提唱し、マイクロソフト、アップル、IBM、サン・マイクロシステムズ、ヒューレット・パッカード、ジャストシステムなどが参加するユニコードコンソーシアムにより作られた。1993年に、国際標準との一致が図られ、DIS 10646の当初案から大幅に変更されて、Unicodeと概ね相違点のいくつかはDIS 10646に由来する互換のISO/IEC 10646が制定された。.

新しい!!: 全文検索とUnicode · 続きを見る »

UNIX

UNIX (ユニックス、Unix、)は、コンピュータ用のマルチタスク・マルチユーザーのオペレーティングシステムの一種である。公式な商標は「UNIX」だが、商標以外の意味として「Unix」、またはスモールキャピタルを使用して「Unix」などとも書かれる。Unixは1969年、AT&Tのベル研究所にて、ケン・トンプソン、デニス・リッチーらが開発を開始した。 当初はアセンブリ言語のみで開発されたが、1973年にほぼ全体をC言語で書き直した。このため、Unixは歴史上、初めて高水準言語で書かれたOSであると言われる。 1973年の段階ではPDP-11に依存したコードが多く、移植性は低かったが、その後徐々にPDP-11に依存したコードを減少させ、1978年にInterdata 8/32への移植に成功して以降、徐々に他のプラットフォームにも移植されていった。 現在では「Unix」という語は、Unix標準に準拠するあらゆるオペレーティングシステムの総称でもある。現在ではUnixシステムは多数の系統に分かれており、AT&Tの開発停止後も、多数の商用ベンダーや非営利組織などによって開発が続けられている。 1970年代から1980年代の初期にかけて、Unixは大学や研究所などの教育機関で広範囲に採用され、特にカリフォルニア大学バークレー校をオリジナルとするBSD系統が誕生した。また Version 7 Unix や UNIX System V の特徴を持つオペレーティングシステムは「伝統的なUNIX」(traditional Unix)とも呼ばれる。 2007年に、「UNIX」の商標の所有者である標準化団体のThe Open Groupは、Single UNIX Specificationを完全に満たすと認証を受けたシステムのみが「UNIX」の商標を得られるとした。このためそれ以外のシステムは(ずっと以前から、AT&T版およびBSD以外を指して使われていた用語だが)「Unixシステムライク」または「Unixライク(Unix系)」と呼ばれるようになった。ただし The Open Groupはその呼称を気に入っていない。 現在では多く使われているUnixとしてはmacOS、AIX、HP-UX、Solarisなどがある(いずれも商用)。また認証を受けていないUnix系としてはLinux(派生OSにAndroid他)やMINIX、BSDの派生OS(FreeBSD、NetBSD、OpenBSD、DragonFly BSDなど)がある。.

新しい!!: 全文検索とUNIX · 続きを見る »

Unix系

複数のUnix系システム間の関連図 Unix系(ユニックスけい、ユニックスライク)とは、Unixに類似した振る舞いをするオペレーティングシステム (OS) を指す用語である。その判断基準や範囲には複数の議論がある。.

新しい!!: 全文検索とUnix系 · 続きを見る »

UTF-8

UTF-8(ユーティーエフはち、ユーティーエフエイト)はISO/IEC 10646 (UCS) とUnicodeで使える8ビット符号単位の文字符号化形式及び文字符号化スキーム。 正式名称は、ISO/IEC 10646では “UCS Transformation Format 8”、Unicodeでは “Unicode Transformation Format-8” という。両者はISO/IEC 10646とUnicodeのコード重複範囲で互換性がある。RFCにも仕様がある。 2バイト目以降に「/」などのASCII文字が現れないように工夫されていることから、UTF-FSS (File System Safe) ともいわれる。旧名称はUTF-2。 UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。 当初は、ベル研究所においてPlan 9で用いるエンコードとして、ロブ・パイクによる設計指針のもと、ケン・トンプソンによって考案された。.

新しい!!: 全文検索とUTF-8 · 続きを見る »

Windows サーチ

Windows サーチ(ウィンドウズ -, Windows Search)はマイクロソフトから無償提供されているWindows向けのデスクトップ検索ツール、およびWindows Vista以降、同ツールが標準で搭載された検索機能。公式リリース前から「MSN デスクトップサーチ」として知られており「MSNサーチツールバー」の付属ツールという位置づけだった。その後、Windowsデスクトップサーチ (WDS) と名称を変えた。2005年リリースのバージョン2はWindows 2000、Windows XPおよびWindows Server 2003で利用可能だったが、2006年のバージョン3はXPとServer 2003のみで利用可能となった。 バージョン3.0以降、インデクサはWindowsサービスとして稼働するようになったため、1つのインデックスを(Windowsサービスのインスタンスと同様)複数のユーザーで共有可能となり、パフォーマンスが改善された。 Windows VistaではWDS 3.0と互換性を持つAPIで動作する機能を「Windows Search」という名称で実装した。同じように、Windows 2000からWindows 2003 Serverまでは、ハードディスクのファイルをインデックス化して検索に寄与する「インデックスサービス」という機能を備えていた。しかし、それには適切なUIが備わっておらず、エクスプローラの検索機能や、MMCスナップインによって間接的に利用されなければいけなかった。またインクリメンタルサーチも出来なかった。 2008年6月にはVistaでの名称にあわせ「Windows Search」としてバージョン4.0がリリースされた。対応OSはWindows XP/Server 2003/Vista/Server 2008/XP x64/Server 2003 x64/Vista x64/Server 2008 x64。このバージョンではリモートPCで作成されたインデックスを使用して検索が出来るようになり、EFS暗号機能を使った暗号化ファイルの検索にも対応した。.

新しい!!: 全文検索とWindows サーチ · 続きを見る »

Xpdf

Xpdf(エックスピーディエフ)は、X Window SystemとMotif用のオープンソースのPDFビューアーである。Xpdfは暗号化されたPDFも読み込める。公式なバージョンはPDFのDRMに従い、コピーや印刷やPDFファイルの変換を防ぐことが出来る。しかし、これらのDRMによる制限を無効にするパッチも存在する。 XpdfはX Window Systemを必要としない幾つかのプログラムを含んでおり、PDFファイルから画像を取り出したり、PDFを PostScriptあるいはテキストファイルへ変換することができる。 XpdfはKPDFのような他のPDFリーダーのバックエンドとしても用いられている。また、XpdfのレンダリングエンジンはBeOS上のBePDFやRISCOS上の!PDFなどのPDFビューアーに用いられている。 Xpdfの多くのセキュリティホールのこともあり、Xpdf 3.0 のレンダリングライブラリはPopplerへとフォークされた。Xpdfを含む多くのプログラムはバックエンドのレンダラとしてPopplerを使用できる。.

新しい!!: 全文検索とXpdf · 続きを見る »

接尾辞配列

接尾辞配列(せつびじはいれつ)やサフィックス・アレイ(suffix array)とは、文字列の接尾辞(開始位置を異にし終端位置を元の文字列と同じくする部分文字列)の文字列中の開始位置を要素とする配列を、接尾辞に関して辞書順に並べ替えて得られる配列である。接尾辞木の配列版。主に文字列探索、全文検索などに利用される。1990年に Udi Manber と Gene Myers が発表した。.

新しい!!: 全文検索と接尾辞配列 · 続きを見る »

束縛 (情報工学)

束縛またはバインディング(Binding)は一般に、参照 (情報工学) の集合である。コンピュータ関連で「束縛」という語が使われるものはいくつかあり、それぞれ具体的な内容は異なるので、以下いくつかの例を示す。.

新しい!!: 全文検索と束縛 (情報工学) · 続きを見る »

検索

検索(けんさく、search)とは、データの集合の中から目的とするデータを探し出すことである。古くは図書館の所蔵物を探し出したり、辞書の項目を引いたりといった人手で行うのが主だったが、コンピューターの発達により、テキスト文字列の検索(文書検索、文字列探索)、画像データの検索(画像検索)、音声データの検索(音声検索)など、大規模かつマルチメディアの情報に関する検索技術が発展した。さらにデータベースの発展とインターネットの普及に伴い、分散保管されているデータに対する検索技術が研究されている。ファイルの内容に対して文字列探索を行う機能も検索と呼ばれる。.

新しい!!: 全文検索と検索 · 続きを見る »

検索エンジン

検索エンジン(けんさくエンジン、)は、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能およびそのプログラム。インターネットの普及初期には、検索としての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んだが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索をサービスの一つとして提供するウェブサイトを単に検索サイトと呼ぶことはなくなっている。広義には、インターネットに限定せず情報を検索するシステム全般を含む。 狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類される。広義の検索エンジンとしては、ある特定のウェブサイト内に登録されているテキスト情報の全文検索機能を備えたソフトウェア(全文検索システム)等がある。 検索エンジンは、検索窓と呼ばれるボックスにキーワードを入力して検索をかけるもので、全文検索が可能なものと不可能なものとがある。検索サイトを一般に「検索エンジン」と呼ぶことはあるが、厳密には検索サイト自体は検索エンジンでない。.

新しい!!: 全文検索と検索エンジン · 続きを見る »

概念検索

概念検索(Concept Search、コンセプトサーチ、コンセプト検索、自然文検索、自然言語文検索、類似文書検索、連想検索)は、自動化された情報検索の手法で、蓄積された非構造化データ(電子アーカイブ、電子メール、科学文献など)から、検索クエリに対して、概念が類似する情報を検索するのに用いられる。特定の文字列やキーワードで検索を想定した全文検索をさらに拡張したもので、自然言語検索や言語横断検索もパターン認識技術などとの組み合わせで実現される。.

新しい!!: 全文検索と概念検索 · 続きを見る »

情報検索

情報検索(じょうほうけんさく)とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索するためのコンピュータ側における仕組みを記述している。 情報検索に対するコンピュータ側における技術は情報を人間が直接管理するのに比べ、データの量的な制約やデータの取り扱いの一貫性を保つ困難さという制約を受けることなく、高速で安定なシステムにより利用者に適切なデータを提供する機能と位置付けることができる。.

新しい!!: 全文検索と情報検索 · 続きを見る »

文字列

文字列(もじれつ)は、単語や文章のような、文字の連なったもの。ストリング (string)、テキスト (text) という場合もある。コンピュータ、特にプログラミングの分野で用いることが多い。.

新しい!!: 全文検索と文字列 · 続きを見る »

文字列探索

文字列探索 (もじれつたんさく) とは、ある文字列の中から、別のある文字列を探索することである。テキストエディタ等で必須の機能であり、これまでさまざまなアルゴリズムが考案されている。 ここでいう文字列とは、ある定まった文字集合の要素を任意に並べた系列のことである。通常、文字はアルファベット等の言語に依拠した文字セットを指すことが多いが、生物情報学における染色体の塩基配列A, T, G, Cの4文字を対象とするもののように、特定の領域に特化した応用も行われている。 正規表現にマッチする文字列の探索、と類似した問題だが、正規表現で可能なパターンに比べ検索対象を絞ることで、より高速に探索するものとして研究されている(ユーザの使うプログラムでは、検索するパターンに応じて、アルゴリズムを切り替えるものもある)。正規表現による探索については正規表現の記事を参照のこと。 近年は、暗号化された文字列を復号せずに探索する秘匿検索、圧縮テキスト中の文字列探索の研究、多国語文字列のバイト列表現に対する探索の研究、なども行われている。.

新しい!!: 全文検索と文字列探索 · 続きを見る »

ここにリダイレクトされます:

N-Gramデスクトップ検索デスクトップ検索ツール全文検索エンジン

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »