ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
無料
ブラウザよりも高速アクセス!
 

Apache Mahout

索引 Apache Mahout

Apache Mahoutは、Apache Software Foundationが管理する機械学習アルゴリズムのオープンソース・ソフトウェアである。Apache Mahoutは、協調フィルタリングやクラスタリング、クラス分類に特化されたスケーラブルなアルゴリズムを実装している。これらの実装の多くは、Apache Hadoopのプラットフォームが使用されている。Mahoutでは、一般的な線形代数や統計などの数学操作のためのJavaライブラリやプリミティブ型を提供している。Mahoutは現在開発中であり、実装されたアルゴリズムの数は急速に増えている。しかし、アルゴリズムの種類は未だ満たされたものとは言えない。 Mahoutのコアとなるクラスタリング、クラス分類のアルゴリズムは、Apache HadoopのMapReduceのパラダイム上に実装されているが、これによってHadoopを利用しないと実装が制限されるわけではない。したがって、単一ノード、もしくはHadoopクラスタ以外での実行も推奨されている。 例えば、Mahoutを使う上でメインディッシュとなる、協調フィルタリングによるレコメンダシステムコンポーネントは、Hadoopを使わない環境でも実行することができる。 Pregel(Google社で開発)ライクなGiraphなどの開発途上のプロジェクトとの統合も積極的に議論されている。.

9 関係: Apache HadoopApache LicenseApacheソフトウェア財団協調フィルタリングレコメンダシステムプリミティブ型クラスタリングクロスプラットフォームMapReduce

Apache Hadoop

Apache Hadoopは大規模データの分散処理を支えるオープンソースのソフトウェアフレームワークであり、Javaで書かれている。Hadoopはアプリケーションが数千ノードおよびペタバイト級のデータを処理することを可能としている。HadoopはGoogleのMapReduceおよびGoogle File System(GFS)論文に触発されたものである。 HadoopはApacheのトップレベルプロジェクトの1つであり、世界規模の開発貢献者コミュニティによって開発され、使用されている。 to the project and uses Hadoop extensively in its web search and advertising businesses.

新しい!!: Apache MahoutとApache Hadoop · 続きを見る »

Apache License

Apache License(アパッチ・ライセンス)は、Apacheソフトウェア財団 (ASF) によるソフトウェア向けライセンス規定。1.1以前は、Apache Software License(ASL)と称していた。著作権表示と免責事項表示の保持を求めている。1.1以降のバージョンはOpen Source Initiativeがオープンソースライセンスと承認している。GNUプロジェクトは、1.1以前のバージョンをGPL非互換で非コピーレフトのフリーソフトウェアライセンス、バージョン2.0をGPLバージョン3互換(GPL2以前とは非互換)のフリーソフトウェアライセンスと判断している。ソースコードはフリーソフトウェアやオープンソースプロジェクトでの開発にも使え、プロプライエタリ・ソフトウェアやクローズドソースの開発にも使える。BSDライセンスをベースに作成されたBSDスタイルのライセンスの一つである。 ASFやそのサブプロジェクトが作成するソフトウェアは、すべてApache Licenseで提供されている。ASF以外のソフトウェアでもApache Licenseを使っているものがある。2010年6月現在、SourceForge.netにある5000以上のASF以外のプロジェクトがApache Licenseでリリースされている。.

新しい!!: Apache MahoutとApache License · 続きを見る »

Apacheソフトウェア財団

Apacheソフトウェア財団(アパッチ ソフトウェアざいだん、Apache Software Foundation;以下ASF)は、オープンソースのソフトウェアプロジェクトを支援する団体であり、アメリカ合衆国で登録された非営利団体である。当初はWebサーバソフトウェアであるApache HTTP Server (Apache httpd) の開発のために発足したが、現在は多くのプロジェクトを抱え、ソフトウェアブランドとしてのApacheを保持している。名実ともに世界で成功しているオープンソースソフトウェア・コミュニティの一つである。.

新しい!!: Apache MahoutとApacheソフトウェア財団 · 続きを見る »

協調フィルタリング

協調フィルタリング(きょうちょうフィルタリング、Collaborative Filtering、CF)は、多くのユーザの嗜好情報を蓄積し、あるユーザと嗜好の類似した他のユーザの情報を用いて自動的に推論を行う方法論である。趣味の似た人からの意見を参考にするという口コミの原理に例えられることが多い。 例えば、ユーザAがアイテムXを好むとすると、アイテムXを好む別のユーザBが好むアイテムYを探し出し、ユーザAもアイテムYを好むのではないか、という推論をコンピュータによって自動的に行う。実装にはユーザ同士の類似度を、同じアイテムにつけた評価の相関係数などによって表して類推に利用することが多い。 協調フィルタリングはリコメンデーション(推薦)やパーソナライゼーションに利用されている。実際にAmazon.comの「おすすめの商品」や、はてなアンテナの「おとなりアンテナ」などに応用されており、Web 2.0においてロングテールを支える要素技術として捉えることができる。 協調フィルタリングにはユーザの評価付けによる明示的なものと、システムの操作履歴(例えばブラウザの閲覧履歴)などを利用した暗黙的なものがある。 推薦システムを実現するものとしては協調フィルタリング以外にもコンテンツベースの方法があるが、たとえば本であればユーザが好む本と同じ著者の本を推薦するなどというもので、コンテンツ自体が似ているかどうかを判別するための情報(ここでは著者の情報)が必要となる。協調フィルタリングはコンテンツが何であれ、ユーザによる評価が与えられれば利用できる。.

新しい!!: Apache Mahoutと協調フィルタリング · 続きを見る »

レコメンダシステム

レコメンダシステム(recommender system)は、情報フィルタリング (IF) 技法の一種で、特定ユーザーが興味を持つと思われる情報(映画、音楽、本、ニュース、画像、ウェブページなど)、すなわち「おすすめ」を提示するものである。通常のレコメンダシステムは、ユーザーのプロファイルを何らかのデータ収集基準と比較検討し、ユーザーが個々のアイテムにつけるであろう評価を予測する。基準は情報アイテム側から形成する場合(コンテンツベースの手法)とユーザーの社会環境から形成する場合(協調フィルタリングの手法)がある。.

新しい!!: Apache Mahoutとレコメンダシステム · 続きを見る »

プリミティブ型

プリミティブ型(プリミティブがた primitive data type、プリミティブデータ型)は、データ型の1分類である。理論計算機科学的に代数的データ型によって考えれば「そのデータ型の定義の中に部分として他の型を含まないような型」がプリミティブ型であるが、Javaにおいて型が「primitive types(プリミティブ型)とreference type(参照型)」に二分される。 この記事におけるここから先の説明は、最初に説明した理論的な分類に従ったものではなく、よく信じられているらしい「プログラミング言語によって提供されるデータ型であり基本的な要素である。対する語は複合型という。言語やその実装に依存して、プリミティブ型がコンピュータメモリ上のオブジェクトと一対一対応のときもあれば、そうでないときもある。組み込み型もしくは基本型とも呼ぶ。」という解釈に従ったものである。 代表的なプリミティブ型を一部列挙.

新しい!!: Apache Mahoutとプリミティブ型 · 続きを見る »

クラスタリング

ラスタリン.

新しい!!: Apache Mahoutとクラスタリング · 続きを見る »

クロスプラットフォーム

プラットフォーム(cross-platform)とは、異なるプラットフォーム(例えばPC/AT互換機とMacintosh、あるいはWindows・macOS・FreeBSD・Linuxなどのように、仕様が全く異なる機械(ハードウェア)またはオペレーティングシステム)上で、同じ仕様のものを動かすことが出来るプログラム(ソフトウェア)のことを言う。同様の呼称にマルチプラットフォームがある。 また、家庭用ゲームにおいては「クロスプラットフォーム」と「マルチプラットフォーム」で意味が異なる場合がある。本項ではこのケースについても後述する。.

新しい!!: Apache Mahoutとクロスプラットフォーム · 続きを見る »

MapReduce

MapReduce(マップリデュース)は、コンピュータ機器のクラスター上での巨大なデータセットに対する分散コンピューティングを支援する目的で、Googleによって2004年に導入されたプログラミングモデルである。 このフレームワークは関数型言語でよく使われるMap関数とReduce関数からヒントを得て作られているが、フレームワークにおけるそれらの用いられ方は元々のものと同じではない。 MapReduceのライブラリ群は、C++、C#、Erlang、Java、OCaml、Perl、Python、PHP、Ruby、F#、R言語、MATLAB等のプログラミング言語で実装されている。.

新しい!!: Apache MahoutとMapReduce · 続きを見る »

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »