ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
無料
ブラウザよりも高速アクセス!
 

分類 (統計学)

索引 分類 (統計学)

分類(ぶんるい、classification)や統計的分類や統計的識別とは、統計学において、データを複数のクラス(グループ)に分類すること。2つのクラスに分ける事を二項分類や二値分類、多数のクラスに分ける事を多クラス分類という。Y.

42 関係: 単純ベイズ分類器二項分類事後確率地球統計学医用画像処理ノーフリーランチ定理ロジスティック回帰ブースティングパーセプトロンパターン認識データマイニングデータ・クラスタリングファジィ論理ニューラルネットワークベイジアンネットワークベイズの定理ベイズ推定ベクトル空間判別分析分類コンピュータビジョンサポートベクターマシン入学試験光学文字認識回帰分析線形分類器群集生態学統計学生体認証特徴選択隠れマルコフモデル音声認識電子メールK近傍法条件付き確率検索エンジン機械学習決定木情報検索文書分類教師なし学習手書き文字認識

単純ベイズ分類器

単純ベイズ分類器(たんじゅんベイズぶんるいき、Naive Bayes classifier)は、単純な確率的分類器である。.

新しい!!: 分類 (統計学)と単純ベイズ分類器 · 続きを見る »

二項分類

二項分類(にこうぶんるい、Binary classification)は、オブジェクトの集合を個々のオブジェクトがある特定の属性を持つかどうかで2種類にグループ分けする分類作業である。二値分類(にちぶんるい)、2クラス分類とも呼ばれ、多クラス分類において分類先のクラス数が2の場合と考えることができる。.

新しい!!: 分類 (統計学)と二項分類 · 続きを見る »

事後確率

事後確率(じごかくりつ、Posterior probability)は条件付確率の一種で、アポステリオリ確率ともいう。 ある証拠(データあるいは情報)を考慮に入れた条件で、ある変数について知られている度合を確率として表現する主観確率の一種である。 対になる用語が事前確率で、これは証拠となるデータがない条件下での不確かな量の条件付確率である。ベイズの定理により、事前確率に尤度関数の出力値を掛けると事後確率が得られる。 なお本項では「変数」という用語を、観測できる確率変数のほかに、観測できない(隠れた)変数、母数あるいは仮説も含めて用いている。たとえば、「土星の質量」を変数xとして、観測結果に基づいた事後確率「xが定数αからβの間にある確率」を求めることができる(主観確率を認めない頻度主義ではこのような言い方は意味がない)。.

新しい!!: 分類 (統計学)と事後確率 · 続きを見る »

地球統計学

地球統計学は3-4次元データを扱う統計分野である。 採掘現場にて鉱石品位の確率分布を予測するために独自に開発された。 現在は、石油地質学、水文地質学、水文学、気象学、海洋学、地球化学、地理学、林業、空気調和、景観生態学、土壌学、農業(特に精密農業)を含む多様な分野で採用されているほか、疫学、物流兵站、効率的な空間ネットワーク開発など地理関連の諸分野に適用されている。 地球統計アルゴリズムは、地理情報システムやR言語など多くのソフトウェアに組み込まれている。.

新しい!!: 分類 (統計学)と地球統計学 · 続きを見る »

医用画像処理

医用画像処理はMedical image processingを意味し、Medical imagingと同意ではない。 以降、医用画像処理を医用イメージングに替えて記述する。 医用イメージング(いよういめーじんぐ、Medical imaging)は、臨床(病気の診断および検査)や医学(解剖学的研究)のために人体(およびその部分)の画像を生成する技法およびプロセスを指す。人間に限らない「生体画像処理」の一部であり、放射線医学、内視鏡検査、サーモグラフィー、医用写真撮影、顕微鏡検査などとも密接に関連する。本来、画像を生成するよう設計されていなかった測定手法や記録手法(脳波や脳磁図)も一種の地図のように表せるデータを生成することから、医用イメージングの一形態と見ることもできる。 画像診断学(放射線診断学)において扱う医用画像には、単純X線画像、CT、MRI、超音波断層画像(US)、血管造影(血管撮影)などがある。画像を(時には撮影も行い)医学的に解釈する医師を放射線診断医あるいは画像診断医と呼び、医師の専門分野のひとつである。診療放射線技師は診断用医用画像の撮影を行う。 撮影された画像に対し必要に応じた画像処理を施すことは、医用イメージングの一分野であり、医療施設内では特にラジオロジストあるいは診療放射線技師がその行為を行うことが多い。 科学的研究としては、その観点に応じて医用生体工学、医用物理学、医学などの一分野に位置づけられる。撮影機器や画像生成機器の研究開発は医用生体工学、医用物理学、情報工学の領域である。そういった機器の利用や画像の解釈は、放射線診断学や撮影部位に対応した医学の下位分野(脳科学、循環器学、精神医学、心理学など)の領域である。医用イメージングのために開発された様々な技術は、他の科学や産業にも応用されている。 医用イメージングは、人体内部を可視化した画像を生成する技法であると見なされることが多い。例えば、超音波検査の場合、超音波を発することで組織内のエコーから内部構造を知ることができる。X線の場合、骨や脂肪などでX線の吸収率が異なることを利用して画像を得る。.

新しい!!: 分類 (統計学)と医用画像処理 · 続きを見る »

ノーフリーランチ定理

ノーフリーランチ定理(ノーフリーランチていり、、)は、物理学者 David H. Wolpert と William G. Macready が生み出した組合せ最適化の領域の定理である。その定義は以下のようになる。 この定理の名称は、ハインラインのSF小説『月は無慈悲な夜の女王』(1966年)で有名になった格言のに由来する。数学的にありうべき全ての問題の集合について、どの探索アルゴリズムも同じ平均性能を示すことを説明したものである。これは、探索アルゴリズムに必ず何らかの偏向があるため、そのアルゴリズムが前提としている事が問題に当てはまらないことがあるからである。 右の図はノーフリーランチ定理を視覚化した例である。 一方、この定理は「あらゆる問題で性能の良い汎用最適化戦略は理論上不可能であり、ある戦略が他の戦略より性能がよいのは、現に解こうとしている特定の問題に対して特殊化(専門化)されている場合のみである」ということを立証している(Ho and Pepyne、2002年)。 この定理は、問題領域に関する知識を使わずに遺伝的アルゴリズムや焼きなまし法などの汎用探索アルゴリズムを使うことに反対する論拠として使われる。他の汎用アルゴリズムにも適用されてきたが、一般にノーフリーランチ定理でカバーできない実世界の大きなサブセットを構築することも可能である。ノーフリーランチ定理は全てのコスト関数を対象として成立するものである。このため、コスト関数の真部分集合には適用できない。実際の問題解決への適用には、この点での制限をうける。 工学者や最適化の専門家にとって、この定理は、問題領域の知識を可能な限り使用して最適化すべきだということを示しており、領域を限定して特殊な最適化ルーチンを作成すべきであることを示している。.

新しい!!: 分類 (統計学)とノーフリーランチ定理 · 続きを見る »

ロジスティック回帰

ティック回帰(ロジスティックかいき、Logistic regression)は、ベルヌーイ分布に従う変数の統計的回帰モデルの一種である。連結関数としてロジットを使用する一般化線形モデル (GLM) の一種でもある。1958年に David Cox が発表した。確率の回帰であり、統計学の分類に主に使われる。医学や社会科学でもよく使われる。 モデルは同じく1958年に発表された単純パーセプトロンと等価であるが、scikit-learn などでは、パラメータを決める最適化問題で確率的勾配降下法を使用する物をパーセプトロンと呼び、座標降下法や準ニュートン法などを使用する物をロジスティック回帰と呼んでいる。.

新しい!!: 分類 (統計学)とロジスティック回帰 · 続きを見る »

ブースティング

ブースティング(Boosting)とは、教師あり学習を実行するための機械学習メタアルゴリズムの一種。ブースティングは、Michael Kearns の提示した「一連の弱い学習機をまとめることで強い学習機を生成できるか?」という疑問に基づいている Unpublished manuscript.

新しい!!: 分類 (統計学)とブースティング · 続きを見る »

パーセプトロン

パーセプトロン(Perceptron)は、人工ニューロンやニューラルネットワークの一種である。心理学者・計算機科学者のフランク・ローゼンブラットが1957年に考案し、1958年に論文を発表した。モデルは同じく1958年に発表されたロジスティック回帰と等価である。.

新しい!!: 分類 (統計学)とパーセプトロン · 続きを見る »

パターン認識

パターン認識(パターンにんしき、Pattern recognition)は自然情報処理のひとつ。画像・音声などの雑多な情報を含むデータの中から、一定の規則や意味を持つ対象を選別して取り出す処理である。.

新しい!!: 分類 (統計学)とパターン認識 · 続きを見る »

データマイニング

データマイニング(Data mining)とは、統計学、パターン認識、人工知能等のデータ解析の技法を大量のデータに網羅的に適用することで知識を取り出す技術のことである。DMと略して呼ばれる事もある。通常のデータの扱い方からは想像が及びにくい、ヒューリスティク(heuristic、発見的)な知識獲得が可能であるという期待を含意していることが多い。とくにテキストを対象とするものをテキストマイニング、そのなかでもウェブページを対象にしたものをウェブマイニングと呼ぶ。英語では"Data mining"の語の直接の起源となった研究分野であるknowledge-discovery in databases(データベースからの知識発見)の頭文字をとってKDDとも呼ばれる。.

新しい!!: 分類 (統計学)とデータマイニング · 続きを見る »

データ・クラスタリング

ラスタリング (clustering)、クラスタ解析(クラスタかいせき)、クラスター分析(クラスターぶんせき)は、データ解析手法(特に多変量解析手法)の一種。教師なしデータ分類手法、つまり与えられたデータを外的基準なしに自動的に分類する手法。また、そのアルゴリズム。 さまざまな手法が提案されているが、大きく分けるとデータの分類が階層的になされる階層型手法と、特定のクラスタ数に分類する非階層的手法とがある。それぞれの代表的な手法としてウォード法、K平均法などがある。.

新しい!!: 分類 (統計学)とデータ・クラスタリング · 続きを見る »

ファジィ論理

ファジィ論理(ファジィろんり、Fuzzy logic)は、1965年、カリフォルニア大学バークレー校のロトフィ・ザデーが生み出したファジィ集合から派生した多値論理の一種で、真理値が0から1までの範囲の値をとり、古典論理のように「真」と「偽」という2つの値に限定されないことが特徴である。さらにlinguistic variablesは、「ちょっと暑い」というような、言語学的(linguistic)な(と、ファジィの研究者は表現する)ものを表す変数(variables)である(その内容自体は、「気温が摂氏30度の時は 0.2(30度は「ちょっと」ではないから)」「気温が摂氏25度の時は 0.8」「気温が摂氏20度の時は 0.3」といったように、至って定量的なものであり、「言語学的な値」という何かよくわからないフワフワしたものを扱ってくれる魔法ではない)。ファジィ論理は制御理論(ファジィ制御)から人工知能まで様々な分野に応用されている。.

新しい!!: 分類 (統計学)とファジィ論理 · 続きを見る »

ニューラルネットワーク

ニューラルネットワーク(神経回路網、neural network、略称: NN)は、脳機能に見られるいくつかの特性を計算機上のシミュレーションによって表現することを目指した数学モデルである。研究の源流は生体の脳のモデル化であるが、神経科学の知見の改定などにより次第に脳モデルとは乖離が著しくなり、生物学や神経科学との区別のため、人工ニューラルネットワーク(artificial neural network、ANN)とも呼ばれる。.

新しい!!: 分類 (統計学)とニューラルネットワーク · 続きを見る »

ベイジアンネットワーク

ベイジアンネットワーク(Bayesian network)は、因果関係を確率により記述するグラフィカルモデルの1つで、複雑な因果関係の推論を有向非巡回グラフ構造により表すとともに、個々の変数の関係を条件つき確率で表す確率推論のモデルである。ネットワークとは重み付けグラフのこと。 ジューディア・パールが1985年に命名した。ジューディア・パールはこの研究の功績によりチューリング賞を受賞した。 人工知能の分野では、ベイジアンネットワークを確率推論アルゴリズムとして1980年頃から研究が進められ、既に長い研究と実用化の歴史がある。.

新しい!!: 分類 (統計学)とベイジアンネットワーク · 続きを見る »

ベイズの定理

ベイズの定理(ベイズのていり、Bayes' theorem)とは、条件付き確率に関して成り立つ定理で、 なおベイズ統計学においては基礎として利用され、いくつかの未観測要素を含む推論等に応用される。.

新しい!!: 分類 (統計学)とベイズの定理 · 続きを見る »

ベイズ推定

ベイズ推定(ベイズすいてい、Bayesian inference)とは、ベイズ確率の考え方に基づき、観測事象(観測された事実)から、推定したい事柄(それの起因である原因事象)を、確率的な意味で推論することを指す。 ベイズの定理が基本的な方法論として用いられ、名前の由来となっている。統計学に応用されてベイズ統計学の代表的な方法となっている。 ベイズ推定においては、パラメータ\,\thetaの点推定を求めることは、ベイズ確率(分布関数)を求めた後に、決められた汎関数:\,p(\theta)\rightarrow\hatの値(平均値もしくは中央値など)を派生的に計算することと見做される。.

新しい!!: 分類 (統計学)とベイズ推定 · 続きを見る »

ベクトル空間

数学、特に線型代数学におけるベクトル空間(ベクトルくうかん、vector space)、または、線型空間(せんけいくうかん、linear space)は、ベクトルと呼ばれる元からなる集まりの成す数学的構造である。ベクトルには和が定義され、またスカラーと呼ばれる数による積(「スケール変換」)を行える。スカラーは実数とすることも多いが、複素数や有理数あるいは一般の体の元によるスカラー乗法を持つベクトル空間もある。ベクトルの和とスカラー倍の演算は、「ベクトル空間の公理」と呼ばれる特定の条件(後述)を満足するものでなければならない。ベクトル空間の一つの例は、力のような物理量を表現するのに用いられる幾何ベクトルの全体である(同じ種類の任意の二つの力は、加え合わせて力の合成と呼ばれる第三の力のベクトルを与える。また、力のベクトルを実数倍したものはまた別の力のベクトルを表す)。同じ調子で、ただしより幾何学的な意味において、平面や空間での変位を表すベクトルの全体もやはりベクトル空間を成す。 ベクトル空間は線型代数学における主題であり、ベクトル空間はその次元(大雑把にいえばその空間の独立な方向の数を決めるもの)によって特徴づけられるから、その観点からはよく知られている。ベクトル空間は、さらにノルムや内積などの追加の構造を持つこともあり、そのようなベクトル空間は解析学において主に函数をベクトルとする無限次元の函数空間の形で自然に生じてくる。解析学的な問題では、ベクトルの列が与えられたベクトルに収束するか否かを決定することもできなければならないが、これはベクトル空間に追加の構造を考えることで実現される。そのような空間のほとんどは適当な位相を備えており、それによって近さや連続性といったことを考えることができる。こういた位相線型空間、特にバナッハ空間やヒルベルト空間については、豊かな理論が存在する。 歴史的な視点では、ベクトル空間の概念の萌芽は17世紀の解析幾何学、行列論、連立一次方程式の理論、幾何ベクトルの概念などにまで遡れる。現代的な、より抽象的な取扱いが初めて定式化されるのは、19世紀後半、ペアノによるもので、それはユークリッド空間よりも一般の対象が範疇に含まれるものであったが、理論の大半は(直線や平面あるいはそれらの高次元での対応物といったような)古典的な幾何学的概念を拡張することに割かれていた。 今日では、ベクトル空間は数学のみならず科学や工学においても広く応用される。ベクトル空間は線型方程式系を扱うための適当な線型代数学的概念であり、例えば画像圧縮ルーチンで使われるフーリエ展開のための枠組みを提示したり、あるいは偏微分方程式の解法に用いることのできる環境を提供する。さらには、テンソルのような幾何学的および物理学的な対象を、抽象的に座標に依らない で扱う方法を与えてくれるので、そこからさらに線型化の手法を用いて、多様体の局所的性質を説明することもできるようになる。 ベクトル空間の概念は様々な方法で一般化され、幾何学や抽象代数学のより進んだ概念が導かれる。.

新しい!!: 分類 (統計学)とベクトル空間 · 続きを見る »

判別分析

判別分析(はんべつぶんせき、discriminant analysis)は、事前に与えられているデータが異なるグループに分かれる場合、新しいデータが得られた際に、どちらのグループに入るのかを判別するための基準(判別関数)を得るための正規分布を前提とした分類の手法。英語では線形判別分析をLDA、二次判別分析をQDA、混合判別分析をMDAと略す。1936年にロナルド・フィッシャーが線形判別分析を発表しCohen et al.

新しい!!: 分類 (統計学)と判別分析 · 続きを見る »

分類

分類(ぶんるい)とは、複数の事物や現象を、何らかの基準に従って区分することによって体系づけることである。そうして作られたグループをカテゴリという。.

新しい!!: 分類 (統計学)と分類 · 続きを見る »

コンピュータビジョン

ンピュータビジョン()は大雑把に言って、「ロボットの目」を作る研究分野である。 この分野はコンピュータが実世界の情報を取得する全ての過程を扱うため、画像センシングのためのハードウェアから情報を認識するための人工知能的理論まで幅広く研究されている。また、ではコンピュータグラフィックスとコンピュータビジョンの融合が注目を集めている。 研究対象を大別すると、.

新しい!!: 分類 (統計学)とコンピュータビジョン · 続きを見る »

サポートベクターマシン

ポートベクターマシン(support vector machine, SVM)は、教師あり学習を用いるパターン認識モデルの一つである。分類や回帰へ適用できる。1963年に Vladimir N. Vapnik, Alexey Ya.

新しい!!: 分類 (統計学)とサポートベクターマシン · 続きを見る »

入学試験

入学試験(にゅうがくしけん)とは、学校が入学志願者の中から有資格者を選別するために課す試験のことである。.

新しい!!: 分類 (統計学)と入学試験 · 続きを見る »

光学文字認識

光学文字認識(こうがくもじにんしき、Optical character recognition)は、活字の文書の画像(通常イメージスキャナーで取り込まれる)を文字コードの列に変換するソフトウェアである。一般にOCRと略記される。OCRは、人工知能やマシンビジョンの研究分野として始まった。研究は続けられているが、OCRの中心はその実装と応用に移っている。紙に印刷された文書をデジタイズし、よりコンパクトな形で記録するのに必要とされる。さらに、文字コードに変換することで機械翻訳や音声合成の入力にも使えるようになり、テキストマイニングも可能となる。研究分野としては、パターン認識、人工知能、コンピュータビジョンが対応する。 (鏡やレンズといった光学技術を使った)光学文字認識と(スキャナーとアルゴリズムによる)デジタル文字認識は本来別の領域と考えられていた。光学技術として生き残った部分が非常に少ないため、光学文字認識という言葉は現在ではデジタル文字認識を含むものとみなされている。 初期のシステムは特定の書体を読むための「トレーニング」が必要であった(事前にその書体のサンプルを読ませることを意味する)。現在では、ほとんどの書体を高い識字率で変換することが可能である。いくつかのシステムでは読み込まれた画像からそれとほぼ同じになるようフォーマットされた出力(例えばワードプロセッサのファイルのようなもの)を生成することが可能であり、中には画像などの文書以外の部分が含まれていても正しく認識するものもある。.

新しい!!: 分類 (統計学)と光学文字認識 · 続きを見る »

回帰分析

線形回帰の例 回帰(かいき、)とは、統計学において、Y が連続値の時にデータに Y.

新しい!!: 分類 (統計学)と回帰分析 · 続きを見る »

線形分類器

線形分類器(Linear classifier)は、特徴の線形結合の値に基づいて分類を行う確率的分類器である。機械学習において、分類は項目群を特徴値に基づいてグループに分類することを目的とする。.

新しい!!: 分類 (統計学)と線形分類器 · 続きを見る »

群集生態学

群集生態学(ぐんしゅうせいたいがく、)とは生態学の一分野。生物の群集における複数種の組み合わせの示す規則性などを理解することを目的とする学問。synecologyともいう。これに対し、単一種の個体数の変動などを研究する個体群生態学や個体の行動や生理について研究する行動生態学、生理生態学などをautecologyということもある。 群集生態学は、群集をその対象とする生態学の分野である。群集とは、同一地域の生息する他種類の生物のまとまりであるから、群集生態学は、同一地域に生息する生物間の関係(種間関係)を明らかにし、あるいはそのしくみや働き(群集構造)を知ることを目的とする。 なお、個々の種についての研究は個体群生態学の対象であるが、個々の種の間の関係も、その延長として個体群生態学の側から論じられる場合がある。その意味では種間関係論は両者の領域にまたがる。 群集生態学は、まず植物を対象として進んだ。植物群落は肉眼的にもまとまりとして捕らえやすく、その構造を直接に把握しやすい。この分野は一方では群集の型を分類して体系化するという、植物社会学へと発展した。また、植物群集の変遷から遷移の考えが生まれ、これに動物群集を結びつけたところから生態系の概念が生み出された。 動物の場合には、そのまとまりが見た目で把握しづらいこともあり、遅れて始まったが、チャールズ・エルトンが種間の関係において食う食われるの関係が重要であることを指摘し、食物連鎖を群集の構造の基本であると見なしたところから発展が始まった。 また、1959年に森下正明により論文発表がされたCλ指数は、群集生態学における指数で生物の群集の類似度を表す指数のひとつで、個体群における分布様式に関する指数であるIδ指数の研究を群集に応用したものである。.

新しい!!: 分類 (統計学)と群集生態学 · 続きを見る »

統計学

統計学(とうけいがく、statistics、Statistik)とは、統計に関する研究を行う学問である。 統計学は、経験的に得られたバラツキのあるデータから、応用数学の手法を用いて数値上の性質や規則性あるいは不規則性を見いだす。統計的手法は、実験計画、データの要約や解釈を行う上での根拠を提供する学問であり、幅広い分野で応用されている。 現在では、医学(疫学、EBM)、薬学、経済学、社会学、心理学、言語学など、自然科学・社会科学・人文科学の実証分析を伴う分野について、必須の学問となっている。また、統計学は哲学の一分科である科学哲学においても重要な一つのトピックになっている。.

新しい!!: 分類 (統計学)と統計学 · 続きを見る »

生体認証

生体認証(せいたいにんしょう)とは、バイオメトリック(biometric)認証あるいはバイオメトリクス(biometrics)認証とも呼ばれ、人間の身体的特徴(生体器官)や行動的特徴(癖)の情報を用いて行う個人認証の技術やプロセスである。.

新しい!!: 分類 (統計学)と生体認証 · 続きを見る »

特徴選択

特徴選択(とくちょうせんたく、feature selection)とは、機械学習と統計学の用語であり、頑健な学習モデルの構築のため、特徴集合のうち意味のある部分集合だけを選択する手法のことを指す。特徴量選択、変数選択、特徴削減、属性選択、素性選択、変数部分集合選択などとも呼ばれる。生物学の文脈では、DNAマイクロアレイの実験に基づいて影響力のある遺伝子を検出する手法を指す場合もある。不要で冗長な特徴量をデータから除去することによって、特徴選択は学習モデルを次の点で改善する:.

新しい!!: 分類 (統計学)と特徴選択 · 続きを見る »

隠れマルコフモデル

れマルコフモデル(かくれマルコフモデル、Hidden Markov Model)は確率モデルのひとつであり、観測されない(隠れた)状態をもつマルコフ過程である。.

新しい!!: 分類 (統計学)と隠れマルコフモデル · 続きを見る »

音声認識

音声認識(おんせいにんしき、speech recognition)とは、人間の声などをコンピューターに認識させることであり、話し言葉を文字列に変換したり、あるいは音声の特徴をとらえて声を出している人を識別する機能を指す大辞泉。.

新しい!!: 分類 (統計学)と音声認識 · 続きを見る »

電子メール

電子メール(でんしメール、英: Electronic mail、E-mail、Eメール)は、コンピュータネットワークを使用して、郵便のように情報等を交換する手段である。電子郵便(でんしゆうびん)とも言う。.

新しい!!: 分類 (統計学)と電子メール · 続きを見る »

K近傍法

k近傍法(ケイきんぼうほう、k-nearest neighbor algorithm, k-NN)は、特徴空間における最も近い訓練例に基づいた分類の手法であり、パターン認識でよく使われる。最近傍探索問題の一つ。k近傍法は、インスタンスに基づく学習の一種であり、怠惰学習 (lazy learning) の一種である。その関数は局所的な近似に過ぎず、全ての計算は分類時まで後回しにされる。また、回帰分析にも使われる。.

新しい!!: 分類 (統計学)とK近傍法 · 続きを見る »

条件付き確率

条件付き確率(じょうけんつきかくりつ、conditional probability)は、ある が起こるという条件下での別の事象 の確率のことをいう。条件付き確率は または のように表される。条件付き確率 はしばしば「 が起こったときの の(条件付き)確率」「条件 の下での の確率」などと表現される。なお英文においては通例、 または と表現される。.

新しい!!: 分類 (統計学)と条件付き確率 · 続きを見る »

検索エンジン

検索エンジン(けんさくエンジン、)は、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能およびそのプログラム。インターネットの普及初期には、検索としての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んだが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索をサービスの一つとして提供するウェブサイトを単に検索サイトと呼ぶことはなくなっている。広義には、インターネットに限定せず情報を検索するシステム全般を含む。 狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類される。広義の検索エンジンとしては、ある特定のウェブサイト内に登録されているテキスト情報の全文検索機能を備えたソフトウェア(全文検索システム)等がある。 検索エンジンは、検索窓と呼ばれるボックスにキーワードを入力して検索をかけるもので、全文検索が可能なものと不可能なものとがある。検索サイトを一般に「検索エンジン」と呼ぶことはあるが、厳密には検索サイト自体は検索エンジンでない。.

新しい!!: 分類 (統計学)と検索エンジン · 続きを見る »

機械学習

機械学習(きかいがくしゅう、machine learning)とは、人工知能における研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法のことである。.

新しい!!: 分類 (統計学)と機械学習 · 続きを見る »

決定木

決定木(けっていぎ、decision tree)は、(リスクマネジメントなどの)決定理論の分野において、 決定を行う為のグラフであり、計画を立案して目標に到達するために用いられる。 決定木は、意志決定を助けることを目的として作られる。 決定木は木構造の特別な形である。.

新しい!!: 分類 (統計学)と決定木 · 続きを見る »

情報検索

情報検索(じょうほうけんさく)とは、コンピュータを用いて大量のデータ群から目的に合致したものを取り出すこと。検索の対象となるデータには文書や画像、音声、映像、その他さまざまなメディアやその組み合わせとして記録されたデータなどが含まれる。インターネットの発達により検索はインターネットを介して行われることも多いが、ここでは情報を検索するためのコンピュータ側における仕組みを記述している。 情報検索に対するコンピュータ側における技術は情報を人間が直接管理するのに比べ、データの量的な制約やデータの取り扱いの一貫性を保つ困難さという制約を受けることなく、高速で安定なシステムにより利用者に適切なデータを提供する機能と位置付けることができる。.

新しい!!: 分類 (統計学)と情報検索 · 続きを見る »

文書分類

文書分類(ぶんしょぶんるい、Document classification/categorization)は、情報科学における問題である。電子文書をその内容に基づいて、1つ以上に分類する。文書分類には、外部から(例えば人間が)正しい分類に関する情報を与える教師あり文書分類と、外部の情報を参照せずに分類する教師なし文書分類がある。.

新しい!!: 分類 (統計学)と文書分類 · 続きを見る »

教師なし学習

教師なし学習(きょうしなしがくしゅう, Unsupervised Learning)とは、機械学習の手法の一つである。「出力すべきもの」があらかじめ決まっていないという点で教師あり学習とは大きく異なる。データの背後に存在する本質的な構造を抽出するために用いられる。 教師あり学習は、その「出力すべきもの」も入力として与える手法であり、データの背後に存在する本質的な構造を抽出するよりむしろ、思い通りの出力を再現する機械の構成に用いられる。 具体的な例として以下のようなものがある。.

新しい!!: 分類 (統計学)と教師なし学習 · 続きを見る »

手書き文字認識

手書き文字認識(Handwriting recognition)とは、認識可能な手書き入力を受け取るコンピュータの機能である。入力元としては、紙に手書きされた文書、写真、タッチパネルなどの機器がある。事前に「オフライン」で書かれた文書を光学スキャンして入力する「オフライン手書き文字認識」と、「オンライン」で手書き文字入力する「オンライン手書き文字認識」に区別される。 手書き文字認識は基本的に光学文字認識の技術の上に成り立っている。しかし、オンライン手書き文字認識の場合は筆順や線を描く方向なども考慮し、最もそれらしい文字または単語を探すという技術も必要になる。.

新しい!!: 分類 (統計学)と手書き文字認識 · 続きを見る »

ここにリダイレクトされます:

Statistical classification統計分類統計的識別

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »