ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
インストール
ブラウザよりも高速アクセス!
 

自然言語処理

索引 自然言語処理

自然言語処理(しぜんげんごしょり、natural language processing、略称:NLP)は、人間が日常的に使っている自然言語をコンピュータに処理させる一連の技術であり、人工知能と言語学の一分野である。「計算言語学」()との類似もあるが、自然言語処理は工学的な視点からの言語処理をさすのに対して、計算言語学は言語学的視点を重視する手法をさす事が多い。データベース内の情報を自然言語に変換したり、自然言語の文章をより形式的な(コンピュータが理解しやすい)表現に変換するといった処理が含まれる。応用例としては予測変換、IMEなどの文字変換が挙げられる。 自然言語の理解をコンピュータにさせることは、自然言語理解とされている。自然言語理解と、自然言語処理の差は、意味を扱うか、扱わないかという説もあったが、最近は数理的な言語解析手法(統計や確率など)が広められた為、パーサ(統語解析器)などが一段と精度や速度が上がり、その意味合いは違ってきている。もともと自然言語の意味論的側面を全く無視して達成できることは非常に限られている。このため、自然言語処理には形態素解析と構文解析、文脈解析、意味解析などをなど表層的な観点から解析をする学問であるが、自然言語理解は、意味をどのように理解するかという個々人の理解と推論部分が主な研究の課題になってきており、両者の境界は意思や意図が含まれるかどうかになってきている。.

58 関係: AI完全句構造規則中国語人工知能人工無脳形式文法形態素解析マルコフ連鎖マンマシンインタフェースデータマイニングデータベースわかち書きインプット メソッド エディタインターグループコンピュータコーパス言語学スペルチェッカタイム (雑誌)タイ語入力予測光学文字認識固有表現抽出確率論翻訳ソフト統計学照応解析音声合成音声認識計算言語学言語学言語行為語義の曖昧性解消質問応答システム転義法自動要約自然言語自然言語理解自然言語生成英語コーパス学会Modular Audio Recognition FrameworkSHRDLUTREC校正検索エンジン概念検索構文解析構文解析器構文木機械学習機械翻訳...潜在意味解析情報抽出情報検索日本語日本語入力システム意味論曖昧時間 インデックスを展開 (8 もっと) »

AI完全

AI完全(英: AI-complete)とは、人工知能のテーマの中でも最も困難なものを指す学術的でない用語である。AI完全とされる計算問題を解くことは人工知能の中心的課題を解決するのと同義であり、人間と同程度に知的なコンピュータを生み出すことになる。この用語は計算複雑性理論のNP完全問題などのアナロジーであり、計算複雑性理論における「完全性」とは、その複雑性クラスで最も難しい問題を指す。1988年、John Mallery はこの用語を生み出したのが Fanya S. Montalvo であると述べた。初期の用例としては、1987年に Erik Mueller の学位論文で使われ、1991年にはエリック・レイモンドのジャーゴンファイルに収録されている。 ある問題をAI完全であると呼ぶ場合、ELIZAのような単純なアルゴリズムを使った手法では解決されないだろうという姿勢が背景にある。一般にAI完全と言われる問題としては、次のものがある。.

新しい!!: 自然言語処理とAI完全 · 続きを見る »

句構造規則

句構造規則(くこうぞうきそく、英: phrase structure rules )は、統語論において、文の構成素構造を産み出す規則、およびそれについての研究を指す。1950年代にノーム・チョムスキーによって提唱された。 句構造規則は、自然言語の文を構成素に分解し、隣接する語句同士の意味的および機能的関係(句構造)を表そうとする方法論である。これは句構造文法という枠組の基本であり、単語同士の依存関係を探る依存文法とは異なる考え方である。また、たとえば「名詞句の前に限定詞が付いたものがまた名詞句になる」というような再帰性は、日本(日本語)では橋本文法の連文節や時枝誠記(時枝文法)の「入れ子」がこれに類似している。 句構造規則を補佐する形で変形生成文法が発展し、句構造規則そのものはXバー理論に発展した。Xバー理論は1970年代から1980年代にかけて生成文法の中核を成したが、それも1990年代にチョムスキー自身が提唱したChomsky (1995).

新しい!!: 自然言語処理と句構造規則 · 続きを見る »

中国語

記載なし。

新しい!!: 自然言語処理と中国語 · 続きを見る »

人工知能

250px 人工知能(じんこうちのう、artificial intelligence、AI)とは、「計算機(コンピュータ)による知的な情報処理システムの設計や実現に関する研究分野」を指す。.

新しい!!: 自然言語処理と人工知能 · 続きを見る »

人工無脳

人工無脳(じんこうむのう)は、英語圏ではchatterbotもしくはchatbotと呼ばれる会話ボットあるいはおしゃべりボットなどのコンピュータプログラムで、「人工知能」ないし「人工頭脳」から派生した語句である。 人工知能の観点からは、通常の科学・技術・工学的なボトムアップなアプローチではある種の目標であるチューリング・テストなどいわゆる「人らしさ」に到達するまでの道のりが遠く、トップダウン的に「人らしさ」のモデルを作りこむことで「人らしさ」を作り出そうとする立場やその立場で作られたシステム・モデル・ソフトウェアを指す。 具体的には、1人以上の人間とテキストまたは音声で知的な会話をすることをシミュレートするコンピュータプログラムである。人間の入力を知的に解釈した応答にも見えるが、大半は収集したキーワードを内部のデータベースとマッチングさせて応答を返している。.

新しい!!: 自然言語処理と人工無脳 · 続きを見る »

形式文法

形式文法(けいしきぶんぽう、Formal Grammar)は、形式的に与えられた(形式体系を参照)文法である。「言語」をその言語における文の集合として与えるものとして、ここでは、(有限の)文字群上の有限長の文字列の(通常無限な)集合が、形式的に記述される。 形式文法にはふたつの捉えかたがある。それは「生成」と「分析」である。#チョムスキー階層の節および単独記事に詳細があるが、両者は対応するので、ある意味では同じものをそれぞれ逆の側から見たものにすぎない。 以下で「文法の規則(構文規則)の集まり」と呼んでいるのは、具体的には、句構造規則#基本モデルにあるようなものである。また終端記号と非終端記号の記事も参照のこと。.

新しい!!: 自然言語処理と形式文法 · 続きを見る »

形態素解析

形態素解析(けいたいそかいせき、Morphological Analysis)とは、文法的な情報の注記の無い自然言語のテキストデータ(文)から、対象言語の文法や、辞書と呼ばれる単語の品詞等の情報にもとづき、形態素(Morpheme, おおまかにいえば、言語で意味を持つ最小単位)の列に分割し、それぞれの形態素の品詞等を判別する作業である。 自然言語処理の分野における主要なテーマのひとつであり、機械翻訳やかな漢字変換など応用も多い(もちろん、かな漢字変換の場合は入力が通常の文と異なり全てひらがなであり、その先に続く文章もその時点では存在しないなどの理由で、内容は機械翻訳の場合とは異なったものになる)。 もっぱら言語学的な観点を主として言語学で研究されている文法にもとづく解析もあれば、コンピュータ上の自然言語処理としてコンピュータでの扱いやすさに主眼を置いた解析もある。以下は後者のためのツールを用いた例で、「お待ちしております」という文を形態素解析した例である (「茶筌」を使用した)。 自然言語以外の場合では、プログラミング言語などの場合は字句解析が相当する。.

新しい!!: 自然言語処理と形態素解析 · 続きを見る »

マルコフ連鎖

マルコフ連鎖(マルコフれんさ、Markov chain)とは、確率過程の一種であるマルコフ過程のうち、とりうる状態が離散的(有限または可算)なもの(離散状態マルコフ過程)をいう。また特に、時間が離散的なもの(時刻は添え字で表される)を指すことが多い(他に連続時間マルコフ過程というものもあり、これは時刻が連続である)。マルコフ連鎖は、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である(マルコフ性)。各時刻において起こる状態変化(遷移または推移)に関して、マルコフ連鎖は遷移確率が過去の状態によらず、現在の状態のみによる系列である。特に重要な確率過程として、様々な分野に応用される。.

新しい!!: 自然言語処理とマルコフ連鎖 · 続きを見る »

マンマシンインタフェース

マンマシンインタフェース(man machine interface、日本以外では現在では human machine interface(ヒューマンマシンインタフェース、HMI)とするほうが普通)は、人間と機械の間の伝達を行う、機器やコンピュータプログラム等といったインタフェースの総称である。.

新しい!!: 自然言語処理とマンマシンインタフェース · 続きを見る »

データマイニング

データマイニング(Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク(heuristic、発見的)な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"Data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。.

新しい!!: 自然言語処理とデータマイニング · 続きを見る »

データベース

データベース(database, DB)とは、検索や蓄積が容易にできるよう整理された情報の集まり。 通常はコンピュータによって実現されたものを指すが、紙の住所録などをデータベースと呼ぶ場合もある。コンピュータを使用したデータベース・システムでは、データベース管理用のソフトウェアであるデータベース管理システムを使用する場合も多い。.

新しい!!: 自然言語処理とデータベース · 続きを見る »

わかち書き

わかち書き(わかちがき)とは、文章において語の区切りに空白を挟んで記述することである。分かち書き・別ち書きとも表記する。.

新しい!!: 自然言語処理とわかち書き · 続きを見る »

インプット メソッド エディタ

インプット メソッド エディタ(input method editor、IME)、訳して入力方式エディタ とは、パーソナルコンピュータをはじめとした情報機器で、キーボード上にあるキーの組み合わせ(またはスマートフォン画面上にある限られたキーの組み合わせで)で、漢字、ハングル文字、かな文字などキーボード上には無い文字を入力するためのソフトウェアである。通常は言語種ごとに別個に用意され、中国語対応版、朝鮮語対応版、日本語対応版などがある。.

新しい!!: 自然言語処理とインプット メソッド エディタ · 続きを見る »

インターグループ

株式会社インターグループ(インターグループ、英名 INTER GROUP )は、1966年に同時通訳者の養成機関として創立したコミュニケーション・サービスのプロフェッショナル企業。異文化コミュニケーションサービスを提供。国際社会の発展と調和、世界の国々とのより良き関係の構築と相互理解への貢献を目指している。 本社を大阪府大阪市北区豊崎3-20-1インターグループビルに置いている。.

新しい!!: 自然言語処理とインターグループ · 続きを見る »

コンピュータ

ンピュータ(Computer)とは、自動計算機、とくに計算開始後は人手を介さずに計算終了まで動作する電子式汎用計算機。実際の対象は文字の置き換えなど数値計算に限らず、情報処理やコンピューティングと呼ばれる幅広い分野で応用される。現代ではプログラム内蔵方式のディジタルコンピュータを指す場合が多く、特にパーソナルコンピュータやメインフレーム、スーパーコンピュータなどを含めた汎用的なシステムを指すことが多いが、ディジタルコンピュータは特定の機能を実現するために機械や装置等に組み込まれる組み込みシステムとしても広く用いられる。電卓・機械式計算機・アナログ計算機については各項を参照。.

新しい!!: 自然言語処理とコンピュータ · 続きを見る »

コーパス言語学

ーパス言語学(コーパスげんごがく、corpus linguistics)とは、言語学の一分野で、計算言語学と関連がある。.

新しい!!: 自然言語処理とコーパス言語学 · 続きを見る »

スペルチェッカ

ペルチェッカ (spell checker) は、コンピュータ上で書かれた文書に対して、各単語が正しく綴られているかを検証するソフトウェアである。基本的には表音文字を用いる言語に対して使われる。多くのスペルチェッカは、綴りの間違いを検出するだけでなく、綴りの訂正候補をユーザに提示する機能も持っている。スペルチェッカは、ワードプロセッサ・電子メールクライアント・電子辞書・検索エンジンといった大きなアプリケーションにおいて機能の1つとして組込まれていることもあれば、単独のアプリケーションとして提供されているものもある。.

新しい!!: 自然言語処理とスペルチェッカ · 続きを見る »

タイム (雑誌)

『タイム』 (Time) は、1923年に創刊したアメリカ合衆国のニュース雑誌。世界初のニュース雑誌としても知られている。.

新しい!!: 自然言語処理とタイム (雑誌) · 続きを見る »

タイ語

タイ語(タイご、 )はタイ王国の公用語。短縮形は「ไทย(タイ)」。タイ・カダイ語族カム・タイ語派に属する。 タイ・カダイ語族はシナ・チベット語族に属するとされてきたが、独立した語族であるとするのが通説である。欧米の学者を中心に、タイ・カダイ語族をオーストロネシア語族と合わせる説(オーストロ・タイ語族)や、さらにオーストロアジア語族およびミャオ・ヤオ語族とも合わせる説(オーストリック大語族)もある。.

新しい!!: 自然言語処理とタイ語 · 続きを見る »

入力予測

入力予測(にゅうりょくよそく、あるいは予測入力)は、コンピュータで文字を入力する際、入力したい語をソフトウェアが予測・提示する機能である。主に携帯電話での文字入力に使用される。.

新しい!!: 自然言語処理と入力予測 · 続きを見る »

光学文字認識

光学文字認識(こうがくもじにんしき、Optical character recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)を文字コードの列に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することで機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。 (鏡やレンズといった光学技術を使った)光学文字認識と(スキャナーとアルゴリズムによる)デジタル文字認識は本来別の領域と考えられていた。光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。 初期のシステムは特定の書体を読むための「トレーニング」が必要であった(事前にその書体のサンプルを読ませることを意味する)。現在では、ほとんどの書体を高い識字率で変換することが可能である。いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力(例えばワードプロセッサのファイルのようなもの)を生成することが可能であり、中には画像などの文書以外の部分が含まれていても正しく認識するものもある。.

新しい!!: 自然言語処理と光学文字認識 · 続きを見る »

固有表現抽出

固有表現抽出(こゆうひょうげんちゅうしゅつ、、)とは、計算機を用いた自然言語処理技術の一つであり、固有名詞(人名、地名など)や日付、時間表現などを抽出する技術である。情報抽出の一分野であるとされる。.

新しい!!: 自然言語処理と固有表現抽出 · 続きを見る »

確率論

率論(かくりつろん、,, )とは、偶然現象に対して数学的な模型(モデル)を与え、解析する数学の一分野である。 もともとサイコロ賭博といった賭博の研究として始まった。現在でも保険や投資などの分野で基礎論として使われる。 なお、確率の計算を問題とする分野を指して「確率論」と呼ぶ用例もあるが、本稿では取り扱わない。.

新しい!!: 自然言語処理と確率論 · 続きを見る »

翻訳ソフト

翻訳ソフト(ほんやくソフト)とは、機械翻訳ソフトウェアである。.

新しい!!: 自然言語処理と翻訳ソフト · 続きを見る »

統計学

統計学(とうけいがく、statistics、Statistik)とは、統計に関する研究を行う学問である。 統計学は、経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。統計的手法は、実験計画、データの要約や解釈を行う上での根拠を提供する学問であり、幅広い分野で応用されている。 現在では、医学(疫学、EBM)、薬学、経済学、社会学、心理学、言語学など、自然科学・社会科学・人文科学の実証分析を伴う分野について、必須の学問となっている。また、統計学は哲学の一分科である科学哲学においても重要な一つのトピックになっている。.

新しい!!: 自然言語処理と統計学 · 続きを見る »

照応解析

照応解析(しょうおうかいせき、)とは、照応詞(代名詞や指示詞など)の指示対象を推定したり、省略された名詞句(ゼロ代名詞)を補完する処理のこと。照応は文と文の間にまたがった構造なので、照応解析は談話解析の一種である。 たとえば、日本語では主語の省略が頻繁に起こるため、照応解析をせずに日本語から他の言語への機械翻訳をすると、意味の通らない文に翻訳されてしまうことがある。このように照応解析は自然言語処理における重要な課題の一つであるが、意味に踏み込まない処理には限界があるため、構文解析に比べて高精度な解析の実現が困難である。.

新しい!!: 自然言語処理と照応解析 · 続きを見る »

音声合成

音声合成(おんせいごうせい、Speech synthesis)とは、人間の音声を人工的に作り出すことである。これを行うシステムをスピーチ・シンセサイザー(Speech synthesizer)、これにより生成した音声を合成音声(ごうせいおんせい)と呼ぶ。 人工的に人の声を合成するシステムであり、テキスト(文章)を音声に変換できることから、しばしばテキスト読み上げ(text-to-speech、略してTTS)システムとも呼ばれる。また、発音記号を音声に変換するシステムもある。.

新しい!!: 自然言語処理と音声合成 · 続きを見る »

音声認識

音声認識(おんせいにんしき、speech recognition)とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す大辞泉。.

新しい!!: 自然言語処理と音声認識 · 続きを見る »

計算言語学

計算言語学(けいさんげんごがく、computational linguistics)とは、形式性を重視する言語学の一分野である。自然言語処理と共に「理科系言語学」と称される。 類似名称の言語学分野に計量言語学があるが、計量言語学は統計的な手法により自然言語を研究する分野であり計算言語学とは異なる。.

新しい!!: 自然言語処理と計算言語学 · 続きを見る »

言語学

言語学(げんごがく)は、ヒトが使用する言語の構造や意味を科学的に研究する学問である。.

新しい!!: 自然言語処理と言語学 · 続きを見る »

言語行為

言語行為(げんごこうい、Speech act)は、言語学および言語哲学における専門用語である。「言語行為」の正確な意味はいくつかある。.

新しい!!: 自然言語処理と言語行為 · 続きを見る »

語義の曖昧性解消

語義の曖昧性解消(ごぎのあいまいせいかいしょう、Word-sense disambiguation)とは自然言語処理において、文中のある単語に出会ったとき、その単語がどの語義をあらわしているのかを判断する過程のこと。語義識別、語義判別、語義確定などともいう。 自然言語の単語には複数の語義が存在する場合がある。たとえば動詞「やる」には以下のような異なった語義が存在する.

新しい!!: 自然言語処理と語義の曖昧性解消 · 続きを見る »

質問応答システム

質問応答システム(しつもんおうとうシステム、question answering system)は、自然言語の質問をユーザから自然言語で受けつけ、その解答を返すようなコンピュータソフトウェアのこと。質問応答(question answering、略称:QA)といえば自然言語処理や情報検索における質問応答システムに関する研究分野を指す。解答は基本的に文章や単語の形式で答えることが多い。 質問応答の中で最も基本的なタイプであるFactoid型質問応答システムは、質問文に対して単語で答えるシステムのことを指す。例えば、「マイケルジャクソンは何と呼ばれていた?」という質問に対して「King of Pop」と答えるようなシステムのことである。システムが解答を得るため、検索エンジンや百科辞典などを用いたり、データベースを基にして検索を行うシステムもある。 Factoid型質問応答の基本的な処理の流れは、以下のようになる。.

新しい!!: 自然言語処理と質問応答システム · 続きを見る »

転義法

転義法(てんぎほう)あるいは転義(てんぎ)(英:trope)とは、修辞学の修辞技法の一種で、例えば、言葉を文字通りの使い方あるいは標準的な使い方とは別の方法で用いることを指すための学術的な用語。 日本語で通常「比喩」「比喩的用法」あるいは「喩」などと呼ばれているものは、およそこれに相当する。洒落も転義法に含まれる。.

新しい!!: 自然言語処理と転義法 · 続きを見る »

自動要約

自動要約(じどうようやく)は、コンピュータプログラムを用いて、文書からその要約を作成する処理である。 作成される要約は、要約の対象となる文書の最も重要な要素のみを残しているべきであり、いわゆる情報のオーバーロードに伴い自動要約に対する関心も増している。首尾一貫した要約を作成するためには要約の長さや書き方のスタイル、文法などといった点が考慮されなければならない。自動要約の応用先の1つはGoogleなどの検索エンジンであるが、もちろん独立した1つの要約プログラムといったものもありうる。.

新しい!!: 自然言語処理と自動要約 · 続きを見る »

自然言語

自然言語(しぜんげんご、natural language)とは、人間によって日常の意思疎通のために用いられる、文化的背景を持って自然に発展してきた言語である。分類として、音声言語と文字言語、口頭言語と書記言語、口語と文語といったような分類があるが、いずれも似ているようだが着目点や対比軸が異なる分類であり、混同してはならない。また、以上のような分類がいずれも当たらない言語もあり、例えば日本手話(「日本語対応手話」とは異なる)がそうである。.

新しい!!: 自然言語処理と自然言語 · 続きを見る »

自然言語理解

自然言語理解(しぜんげんごりかい、Natural language understanding, NLU)は人工知能の自然言語処理の一分野であり、コンピュータに自然言語を理解(読解)または意図を抽出させるという試みである。 ニュース収集、テキスト分類、音声アクティベーション、アーカイブなどの大規模コンテンツ解析といった様々な応用があるため、商業化の面でも関心が強い分野である。.

新しい!!: 自然言語処理と自然言語理解 · 続きを見る »

自然言語生成

自然言語生成(英: Natural language generation)とは、自然言語処理の一種で知識ベースや論理形式などの機械表現系から自然言語を生成することを言う。 自然言語理解の逆と言われることもある。自然言語理解が入力文を明確化して機械表現言語を生成するのに対して、自然言語生成は概念を如何にして言葉で表すかについて判断を必要とする。.

新しい!!: 自然言語処理と自然言語生成 · 続きを見る »

英語コーパス学会

英語コーパス学会(えいごコーパスがっかい、英名 Japan Association for English Corpus Studies、略称JAECS)は、コンピュータを利用した英語英文学研究の促進を目的として1993年に設立された学会 。 事務局を広島県東広島市鏡山1-7-1広島大学大学院総合科学研究科井上永幸研究室内に置いている。.

新しい!!: 自然言語処理と英語コーパス学会 · 続きを見る »

Modular Audio Recognition Framework

Modular Audio Recognition Framework (MARF) はオープンソースの研究プラットフォームであり、音声および筆記の各種自然言語処理 (NLP) アルゴリズムをJavaでモジュール式に実装し、新たなアルゴリズムの追加も可能な拡張性のあるソフトウェアフレームワークとしたものである。アプリケーションソフトウェアのライブラリやプラグインとして利用できる。使用例を示すためのアプリケーションの具体例がいくつか付属している。詳細なマニュアルとjavadoc形式のAPIリファレンスもあり、比較的文書が揃っている。MARFと関連する技術文書はBSDライセンスでリリースされている。.

新しい!!: 自然言語処理とModular Audio Recognition Framework · 続きを見る »

SHRDLU

SHRDLUとは、自然言語処理を行う初期のプログラムである。1968年から1970年にかけて、テリー・ウィノグラードによって開発された。プログラミング言語LispとPlannerを用いて記述され、DEC社のコンピュータ・PDP-6および同社のグラフィック端末上で動作した。後にユタ大学のコンピュータグラフィックス研究所によって改良され、SHRDLUの「世界」はフル3Dで描画されるようになった。 SHRDLUの名称はETAOIN SHRDLUに由来している。.

新しい!!: 自然言語処理とSHRDLU · 続きを見る »

TREC

Text REtrieval Conference (TREC) はいくつかの情報検索関連の研究分野に着目し開催されているワークショップの一つである。個々の研究部門はトラック (track)と呼ばれている。主催はアメリカ国立標準技術研究所 (NIST) とアメリカ国防総省内の研究部門の一つであるARDA (Advanced Research and Development Activity) による。1992年にTIPSTER Textプログラムの一部として始まったものが発展しながら継続してきている。ワークショップの目的は、大規模データによるテキスト検索手法の評価研究、評価手法を開発、提供して、情報検索の研究コミュニティを支援し前進させ、研究室において構築された先端的技術の産業界への技術移転を目指している。 個々のトラックにおいて、NISTは参加者にデータセットとテスト用の課題集合を渡し、それをうまく解決する手法の開発、適用を行うよう促す。トラックによって、テスト用の課題集合は「質問」であったり、「検索課題」であったり、「パターン認識用の特徴素」であったりする。参加者の返してきた結果を元に、参加者システム群の性能を測るための定量的なスコア付けを行う。結果の評価が出た後、参加者が一堂に会して集まり、アイデアの交換、研究活動の方向性について議論するための国際会議を行う。.

新しい!!: 自然言語処理とTREC · 続きを見る »

校正

校正(こうせい、)は、印刷物等の字句や内容、体裁、色彩の誤りや不具合を、あらかじめ修正すること。校合(きょうごう)ともいう。 出版にあたっては、印刷に先立って仮刷りを行い、それと原稿の内容を突き合わせ、誤植や体裁上の不備を正す。文字や数字ばかりでなく、デザインや発色の確認も行い、特に発色の確認を行う校正を色校正(色校)という。 かつて「校正」の語は古典作品の写本(原文が存在している場合は原文)と別の写本(異本)を照合する「校訂」の意味でも使われた。 なお、修正後の原稿を二校と呼ぶことがあるが、二稿という語は誤りであるので注意を要する。.

新しい!!: 自然言語処理と校正 · 続きを見る »

検索エンジン

検索エンジン(けんさくエンジン、)は、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能およびそのプログラム。インターネットの普及初期には、検索としての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んだが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索をサービスの一つとして提供するウェブサイトを単に検索サイトと呼ぶことはなくなっている。広義には、インターネットに限定せず情報を検索するシステム全般を含む。 狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類される。広義の検索エンジンとしては、ある特定のウェブサイト内に登録されているテキスト情報の全文検索機能を備えたソフトウェア(全文検索システム)等がある。 検索エンジンは、検索窓と呼ばれるボックスにキーワードを入力して検索をかけるもので、全文検索が可能なものと不可能なものとがある。検索サイトを一般に「検索エンジン」と呼ぶことはあるが、厳密には検索サイト自体は検索エンジンでない。.

新しい!!: 自然言語処理と検索エンジン · 続きを見る »

概念検索

概念検索(Concept Search、コンセプトサーチ、コンセプト検索、自然文検索、自然言語文検索、類似文書検索、連想検索)は、自動化された情報検索の手法で、蓄積された非構造化データ(電子アーカイブ、電子メール、科学文献など)から、検索クエリに対して、概念が類似する情報を検索するのに用いられる。特定の文字列やキーワードで検索を想定した全文検索をさらに拡張したもので、自然言語検索や言語横断検索もパターン認識技術などとの組み合わせで実現される。.

新しい!!: 自然言語処理と概念検索 · 続きを見る »

構文解析

構文解析(こうぶんかいせき、syntactic analysis あるいは parse)とは、文章、具体的にはマークアップなどの注記の入っていないベタの文字列を、自然言語であれば形態素に切分け、さらにその間の関連(修飾-被修飾など)といったような、統語論的(構文論的)な関係を図式化するなどして明確にする(解析する)手続きである。自然言語については自然言語処理における要点のひとつであり、プログラミング言語など形式言語の場合は、形式文法に従い構文木を得る。構文解析を行う機構を構文解析器(parser)と呼ぶ。.

新しい!!: 自然言語処理と構文解析 · 続きを見る »

構文解析器

構文解析器(こうぶんかいせきき)とは、構文解析をおこなうプログラム。パーサ (parser)とも。プログラミング言語処理系の入力部分が代表的であるが、それに限らず設定ファイルの読み込みなど、構造を持った入力テキストの処理を行う。自然言語処理でも使われる。 構文解析のアルゴリズムには複雑なものも多いが、パーサジェネレータの研究は盛んであり、そういったものを使用zすれば、構文規則を記述するだけで構文解析器を自動的に生成できる(プログラムのソースコードが出力される)。.

新しい!!: 自然言語処理と構文解析器 · 続きを見る »

構文木

構文木(こうぶんぎ)とは、構文解析の経過や結果(またはそれら両方)を木構造で表したもの。.

新しい!!: 自然言語処理と構文木 · 続きを見る »

機械学習

機械学習(きかいがくしゅう、machine learning)とは、人工知能における研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のことである。.

新しい!!: 自然言語処理と機械学習 · 続きを見る »

機械翻訳

機械翻訳(きかいほんやく、)とは、ある自然言語を別の自然言語に翻訳する変換を、コンピュータを利用して全て(ないし、可能な限り全て)自動的に行おうとするものである。 近年のコンピュータの速度と容量の拡大にもとづく「力業による解決」が進んだことなどにより、急速に成長している分野である。.

新しい!!: 自然言語処理と機械翻訳 · 続きを見る »

潜在意味解析

潜在意味解析(Latent Semantic Analysis, LSA)は、ベクトル空間モデルを利用した自然言語処理の技法の1つで、文書群とそこに含まれる用語群について、それらに関連した概念の集合を生成することで、その関係を分析する技術である。潜在的意味解析とも。 1988年、アメリカ合衆国でLSAの特許が取得されている。情報検索の分野では、潜在的意味索引または潜在意味インデックス(Latent Semantic Indexing, LSI)とも呼ばれている。.

新しい!!: 自然言語処理と潜在意味解析 · 続きを見る »

情報抽出

情報抽出 (Information Extraction; IE) は非構造化文書と機械が読み取れる (machine-readableな) 半構造化文書の両方またはいずれから自動的に構造化データを抽出するタスクである。 多くの場合、この作業は人間の言葉で書かれた文書を自然言語処理 (Natural Language Processing; NLP) の手法を用いて処理することを指す。画像・音楽・動画の自動アノテーションやコンテンツ抽出のような、近年のマルチメディア文書の処理もまた情報抽出として捉えられる。 その問題の難しさから、IEに対する現在のアプローチは狭く制限されたドメインに焦点を当てている。例として、ニュースサービスの企業合併についての報道からの情報抽出があり、次のようなフォーマルな関係による情報 を次のようなニュース文 から抜き出す。 IEの広い目標は、蓄積された非構造化データのうえで処理を行えるようにすることである。より具体的な目標は、入力データの論理的内容に基づいて推論を行う論理的推論を可能にすることである。 category:検索.

新しい!!: 自然言語処理と情報抽出 · 続きを見る »

情報検索

情報検索(じょうほうけんさく)とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索するためのコンピュータ側における仕組みを記述している。 情報検索に対するコンピュータ側における技術は情報を人間が直接管理するのに比べ、データの量的な制約やデータの取り扱いの一貫性を保つ困難さという制約を受けることなく、高速で安定なシステムにより利用者に適切なデータを提供する機能と位置付けることができる。.

新しい!!: 自然言語処理と情報検索 · 続きを見る »

日本語

日本語(にほんご、にっぽんご「にっぽんご」を見出し語に立てている国語辞典は日本国語大辞典など少数にとどまる。)は、主に日本国内や日本人同士の間で使用されている言語である。 日本は法令によって公用語を規定していないが、法令その他の公用文は全て日本語で記述され、各種法令において日本語を用いることが規定され、学校教育においては「国語」として学習を課されるなど、事実上、唯一の公用語となっている。 使用人口について正確な統計はないが、日本国内の人口、および日本国外に住む日本人や日系人、日本がかつて統治した地域の一部住民など、約1億3千万人以上と考えられている。統計によって前後する場合もあるが、この数は世界の母語話者数で上位10位以内に入る人数である。 日本で生まれ育ったほとんどの人は、日本語を母語とする多くの場合、外国籍であっても日本で生まれ育てば日本語が一番話しやすい。しかし日本語以外を母語として育つ場合もあり、また琉球語を日本語と別の言語とする立場を採る考え方などもあるため、一概に「全て」と言い切れるわけではない。。日本語の文法体系や音韻体系を反映する手話として日本語対応手話がある。 2017年4月現在、インターネット上の言語使用者数は、英語、中国語、スペイン語、アラビア語、ポルトガル語、マレー語に次いで7番目に多い。.

新しい!!: 自然言語処理と日本語 · 続きを見る »

日本語入力システム

日本語入力システムはインプットメソッドのうち、特にパソコンやワープロ、携帯電話などに日本語を入力するためのものを指す。キー入力をソフトウェアで制御して実現するものが一般的であるが、ポインティングデバイスを利用して手書き入力した漢字混じりの文を変換するものも存在する。特にキーボードでかなを入力した後に漢字交じり文へ変換するものをかな漢字変換と呼ぶ。.

新しい!!: 自然言語処理と日本語入力システム · 続きを見る »

意味論

意味論(いみろん、英: semantics)とは、言語学では統語論に対置される分野、数学(とくに数理論理学)では証明論に対置される分野で、それらが中身(意味)に関与せず記号の操作によって対象を扱うのに対し、その意味について扱う分野である。なお、一般意味論というものもあるが、言語の使用に関する倫理を扱うものであり、ありていに言って無関係である。.

新しい!!: 自然言語処理と意味論 · 続きを見る »

曖昧

曖昧(あいまい)とは、1つの表現や文字列、項目などが2つ以上の意味にとれること、もしくは、周辺が不明瞭なことである。.

新しい!!: 自然言語処理と曖昧 · 続きを見る »

時間

人類にとって、もともとは太陽や月の動きが時間そのものであった。 アイ・ハヌム(紀元前4世紀~紀元前1世紀の古代都市)で使われていた日時計。人々は日時計の時間で生きていた。 砂時計で砂の流れを利用して時間を計ることも行われるようになった。また砂時計は、現在というものが未来と過去の間にあることを象徴している。くびれた部分(現在)を見つめる。すると時間というのは上(未来)から流れてきて下(過去)へと流れてゆく流れ、と感じられることになる。 時間(じかん)は、出来事や変化を認識するための基礎的な概念である。芸術、哲学、自然科学、心理学などの重要なテーマとなっている。それぞれの分野で異なった定義がなされる。.

新しい!!: 自然言語処理と時間 · 続きを見る »

ここにリダイレクトされます:

言語処理自然言語検索

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »