ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
無料
ブラウザよりも高速アクセス!
 

Extract/Transform/Load

索引 Extract/Transform/Load

Extract/Transform/Load(略称:ETL)とは、データウェアハウスにおける以下のような工程を指す。.

36 関係: Apache Cocoon並列計算代理キーマージバッチ処理メッセージキューメタデータプログラミング言語プロセスパイプ (コンピュータ)ビジネスインテリジェンスデータマートデータベースデータウェアハウスデータ品質データ移行フラットファイルデータベースファイルフォーマットエンタープライズ・サービス・バススキーマ (データベース)スケーラビリティソートサービス水準合意Comma-Separated ValuesEnterprise application integration転置行列関係データベースIMSIndexed Sequential Access MethodJasperReportsJava Web StartNullOLAPVirtual Storage Access Method構文解析情報抽出

Apache Cocoon

Apache Cocoon(アパッチ・コクーン)は、ウェブアプリケーションフレームワークであり、パイプ、関心の分離、コンポーネントベースのウェブアプリケーション開発といった概念に基づいたものである。単に Cocoon と呼ばれることが多い。CocoonフレームワークはXMLとXSLTによる出版に焦点をおいており、Javaで開発されている。 XML技術を基盤としてXML技術を積極的に活用することにより高い柔軟性を持っており、XHTML、PDF、WMLなどさまざまな形式での迅速な文書 (コンテンツ) の出版が可能である。コンテンツ管理システムである Apache Lenya と Daisy は、Apache Cocoon を基盤として開発されている。Cocoonはまた、データウェアハウスのETL (抽出: Extract、変換: Transform、ロード: Load) のツールとしても使われており、情報システム間のデータ転送のためのミドルウェアとしても使われている。.

新しい!!: Extract/Transform/LoadとApache Cocoon · 続きを見る »

並列計算

並列計算(へいれつけいさん、parallel computing)は、コンピュータにおいて複数のプロセッサで1つのタスクを動作させること。並列コンピューティングや並列処理とも呼ばれる。問題を解く過程はより小さなタスクに分割できることが多い、という事実を利用して処理効率の向上を図る手法である。また、このために設計されたコンピュータを並列コンピュータという。ディープ・ブルーなどが有名。 関連する概念に並行計算(へいこうけいさん)があるが、並行計算は一つのタスクの計算を並列化することにとどまらず、複数の相互作用しうるタスクをスレッドなどをもちいて複数の計算資源にスケジューリングするといった、より汎用性の高い処理をさす。 特に、並列計算専用に設計されたコンピュータを用いずに、複数のパーソナルコンピュータやサーバ、スーパーコンピュータを接続することで並列計算を実現するものをコンピュータ・クラスターと呼ぶ。このクラスターをインターネットなどの広域ネットワーク上に分散させるものも、広義には並列計算に属すが、分散コンピューティングあるいはグリッド・コンピューティングと呼び、並列計算とは区別することが多い。.

新しい!!: Extract/Transform/Loadと並列計算 · 続きを見る »

代理キー

代理キー(だいりキー、alternate key)は、コンピュータの関係データベースの関係モデルにおいて、関係の候補キーのうち主キーとして選ばれなかったキーをいう。 例えば、関係データベースで社員関係変数 (社員テーブル) があり、社員関係変数は「社員番号」「社会保障番号」などの属性をもつとする。 この場合、「社員番号」と「社会保障番号」はともにある社員の一意識別子となる。 このため「社員番号」もしくは「社会保障番号」はいずれも主キーとして使うことができる。 したがって、「社員番号」および「社会保障番号」の2つはともに候補キーである。 例えば、「社会保障番号」を主キーとして選んだ場合、「社員番号」は代理キーとなる。 なお、自然キーと対比される代替キー (サロゲートキー、surrogate key) が代理キーと呼ばれている場合もある(自然キーおよび代替キーについては、主キーの項を参照)。.

新しい!!: Extract/Transform/Loadと代理キー · 続きを見る »

マージ

マージ(merge)とは「併合する」、「合併する」という意味であり、情報工学の用語としてよく用いられる。 広義には複数のデータベースやファイル、プログラムなどを一つにまとめる行為を意味する。 狭義には以下で述べる二つの線形リストを一つにまとめるアルゴリズムのことである。.

新しい!!: Extract/Transform/Loadとマージ · 続きを見る »

バッチ処理

バッチ処理(バッチしょり)とは、.

新しい!!: Extract/Transform/Loadとバッチ処理 · 続きを見る »

メッセージキュー

メッセージキュー(Message queue)は、プロセス間通信や同一プロセス内のスレッド間通信に使われるソフトウェアコンポーネントである。制御やデータを伝達するメッセージのキューである。.

新しい!!: Extract/Transform/Loadとメッセージキュー · 続きを見る »

メタデータ

メタデータ(metadata)、メタ情報とは、メタなデータ、すなわちデータについてのデータという意味で、あるデータが付随して持つそのデータ自身についての付加的なデータを指す。.

新しい!!: Extract/Transform/Loadとメタデータ · 続きを見る »

プログラミング言語

プログラミング言語(プログラミングげんご、programming language)とは、コンピュータプログラムを記述するための形式言語である。なお、コンピュータ以外にもプログラマブルなものがあることを考慮するならば、この記事で扱っている内容については、「コンピュータプログラミング言語」(computer programming language)に限定されている。.

新しい!!: Extract/Transform/Loadとプログラミング言語 · 続きを見る »

プロセス

プロセスとは、情報処理においてプログラムの動作中のインスタンスを意味し、プログラムのコードおよび全ての変数やその他の状態を含む。オペレーティングシステム (OS) によっては、プロセスが複数のスレッドで構成される場合があり、命令を同時並行して実行する。.

新しい!!: Extract/Transform/Loadとプロセス · 続きを見る »

パイプ (コンピュータ)

ある端末上で3つのパイプで繋いだプログラムを実行する際の入出力の流れ Unix系オペレーティングシステムにおけるパイプ(pipe)、もしくはパイプライン (pipeline) とは、複数のプログラムの入出力をつなぐための仕組み(プロセス間通信)の一つである。大変便利であることからUnix系以外でも同様の実装や、あるいは擬似的な実装によって似たようなことができるものも多い。直接の親子関係にあるプロセス間で通信をおこなうためfork前にあらかじめ共有しておく「無名パイプ」と、親子関係などにないプロセス間で一時ファイルなどを通して接続する(接続を確立するためにファイルを経由するだけで、接続自体はファイルを経由するわけではない)「名前付きパイプ」がある。ダグラス・マキルロイがUnixシェル向けに考案したことから始まり、パイプライン輸送からの連想で名付けられた。 特に、シェルなどでは縦棒( | )の記号を使って無名パイプを簡単に利用でき、それを指して「パイプ」と言うことも多い。プロセス群の標準ストリームを連鎖的に相互接続するもので、あるプロセスの標準出力 (stdout) を直接別のプロセスの標準入力 (stdin) に接続する。 「1つだけの仕事をうまくやる、道具のようなソフトウェア」(Software Tools)をパイプラインによって組み合わせる、というアイデアはUNIXやUnix系のOS以外にも、MS-DOS をはじめとする様々なOSやアプリケーションに、動作に多少の違いはあるものの受け継がれている。パイプで連結することを前提とした構成のプログラムをフィルタと呼ぶ。 前述のシェルのコマンドラインにおけるパイプは、中置記法で結合法則を満たす演算子と見ることができる(その時、演算子(オペレータ)のオペランドにあたるのは、各プログラムである)。これを一種の「合成」と見ることもできる。一般に数学で、f, g, h という関数があるとして h(g(f(x))) というような計算をすることを考える時、関数を関数合成の演算子 ∘ で合成した (h∘g∘f)(x) というものを考えることがあるが、パイプの演算子 | はこれに似ており (progF あるいは (progF | progG | progH) といったような感じになる。.

新しい!!: Extract/Transform/Loadとパイプ (コンピュータ) · 続きを見る »

ビジネスインテリジェンス

ビジネスインテリジェンス(、)は、経営・会計・情報処理などの用語で、企業などの組織のデータを、収集・蓄積・分析・報告することで、経営上などの意思決定に役立てる手法や技術のこと。 ビジネスインテリジェンスの技術は、経営判断上の過去・現在・未来予測などの視点を提供する。ビジネスインテリジェンス技術で使われる一般的な機能には、OLAP、データ分析、データマイニング、プロセスマイニング(en)、テキストマイニング、複合イベント処理(CEP、en)、ビジネス業績管理(BPM)、ベンチマーキング、予測分析(en)、規範分析(en)などがある。 ビジネスインテリジェンスの対象データには、累積データを蓄積するデータウェアハウス、特定目的に合わせて抜き出したデータマートなどがあり、これらを作成更新する技術にはETLなどがある。 ビジネスインテリジェンスの目的はビジネス上の意思決定の支援であるため、意思決定支援システム(DSS)の1つとも呼ばれている (D. J. Power, 2007) 。また市場競争上で優位獲得を目的とした意思決定の支援システムであるため、コンペディティブインテリジェンス(en)と呼ばれる事もある。.

新しい!!: Extract/Transform/Loadとビジネスインテリジェンス · 続きを見る »

データマート

データマート (Data Mart) は、データウェアハウスの中から特定の目的に合わせた部分を取り出したもの。通常は利用部門が利用目的に合ったデータのみを所持するものである。.

新しい!!: Extract/Transform/Loadとデータマート · 続きを見る »

データベース

データベース(database, DB)とは、検索や蓄積が容易にできるよう整理された情報の集まり。 通常はコンピュータによって実現されたものを指すが、紙の住所録などをデータベースと呼ぶ場合もある。コンピュータを使用したデータベース・システムでは、データベース管理用のソフトウェアであるデータベース管理システムを使用する場合も多い。.

新しい!!: Extract/Transform/Loadとデータベース · 続きを見る »

データウェアハウス

データウェアハウスとは、直訳すれば「データの倉庫」である。利用者により定義範囲は異なるが、一般に時系列に整理された大量の統合業務データ、もしくはその管理システムを指す。.

新しい!!: Extract/Transform/Loadとデータウェアハウス · 続きを見る »

データ品質

データ品質(Data quality)は、データの品質である。データが高品質であるとは「オペレーション、意思決定、計画などの目的に適っていること」を指す(J.M. Juran)。これとは別に、実世界の対応実体を正しく表しているデータを高品質とする見方もある。これら2つの見方は、同じ目的の同じデータに対しても必ずしも一致しない。.

新しい!!: Extract/Transform/Loadとデータ品質 · 続きを見る »

データ移行

データ移行(データいこう)またはデータマイグレーション(data migration)は、異なる種類のストレージ、フォーマット、コンピュータなどの間でデータを転送するプロセスである。現在ではデータ移行は一般に自動的に行われる。組織や個人がコンピュータを替えたり新しいものにアップグレードするとき、あるいはシステムを統合するとき(企業が合併してシステムを1つにする場合)などに必要となる。 効率的にデータ移行を行うため、古いシステム上のデータを新しいシステムにマッピングし、データの抽出とロードを行う。しかし、最も重要なのは古いシステムでのデータがそのままでは新しいシステムで使えない場合で、何らかの変換や加工を必要とする。データ移行はこれら全体を指すが、その大部分は変換・加工の自動化である。 新システムにデータをロードしたら、転送が正しく行われたか(そのデータを使って新システムが正しく動作するか)検証する必要がある。この際に新旧のシステムを並行して動作させ、結果を照合するなどの作業が必要な場合もある。 自動または手動で移行時にデータをきれいにし(データクレンジング)、品質を向上させるのが一般的である。冗長な情報やもはや使われなくなった情報を除去し、新たなシステムの要求仕様にあわせてデータを変換する。 データ移行の工程(設計、抽出、クレンジング、ロード、検証)は、新システムが実際に稼動するまでに何度か行われるのが普通である。.

新しい!!: Extract/Transform/Loadとデータ移行 · 続きを見る »

フラットファイルデータベース

フラットファイルデータベース(英: flat file database)は、データベースの各種データモデル(特に表)をプレーンテキストのファイルで表す何らかの手段である。 date.

新しい!!: Extract/Transform/Loadとフラットファイルデータベース · 続きを見る »

ファイルフォーマット

ファイルフォーマットはコンピュータなどの情報機器で利用するファイルの保存形式である。コンピュータで扱う文書、音声、画像、動画などのさまざまなメディアのファイルを特定の利用方法やアプリケーションソフトウェアで共通に扱うための形式や規格のこと。.

新しい!!: Extract/Transform/Loadとファイルフォーマット · 続きを見る »

エンタープライズ・サービス・バス

ンタープライズ・サービス・バス(Enterprise service bus, ESB)は、一般に標準に基づくミドルウェアインフラストラクチャー製品で実装されるソフトウェアアーキテクチャの構成要素であり、上位のより複雑なアーキテクチャの基盤となるサービスを提供するイベント駆動型で標準ベースのメッセージングエンジン(バス)である。 ESB は一般に Enterprise Messaging System の実装の上の抽象化層を提供し、コードを書かずにメッセージングの利点を活用できるようにする。一方、以前からあるエンタープライズアプリケーション統合 (EAI) はハブ・アンド・スポーク型アーキテクチャによるモノリシックな構成であり、ESB ではその構成要素を機能単位に分割し、必要に応じて協調動作するよう分散配置される。 ESB 自体はサービス指向アーキテクチャ (SOA) の実装ではないが、SOA 実装のための機能を提供する。ESB は必ずしも Webサービスに基づいてはいない。例えば、ESB Muleは従来のシステムとの連携を容易に行えるようにするためにFTP, SMTP, POP3, RESTなどの非Webサービス技術にも対応している。ESB は標準ベースで柔軟であり、各種転送媒体をサポートしている。呼び出されるサービスと転送媒体の結合度を弱めるのは、SOA の特徴ではなく、ESB の特徴である。 ESB 製品の多くは SOA での利用を第一に考えられており、それにより利用が広がりを見せている(BPELなど)。.

新しい!!: Extract/Transform/Loadとエンタープライズ・サービス・バス · 続きを見る »

スキーマ (データベース)

ーマ(schema)とは、データベースの構造であり、データベース管理システム (DBMS) でサポートされている形式言語で記述される。関係データベースでは、スキーマは関係 (表) と関係内の属性 (フィールド) 、属性や関係の関連の定義である。 スキーマは一般にデータ辞書に格納される。スキーマはテキストによるデータベース言語のデータ定義言語 (DDL) で定義されるが、グラフィカルにデータベース構造を表したものをスキーマと呼ぶことも多い。 用途によって属性 (フィールド) をカスタマイズして作られる。 例えばひとつの実体にA~Eまでの属性が定義されていて、スキーマ1にはA、C、Eの属性を定義、スキーマ2にはB、D、Eを定義し、2種類のデータベースで運用しているようなことも実現できる。.

新しい!!: Extract/Transform/Loadとスキーマ (データベース) · 続きを見る »

スケーラビリティ

ーラビリティ(scalability)とは利用者や仕事の増大に適応できる能力・度合いのこと。電気通信やソフトウェア工学において、システムまたはネットワークまたはアルゴリズムの、持つべき望ましい特性の1つで、一種の拡張性である。より具体的には、小規模なシステムを大規模にする場合に、システム全体を交換する方法(建物で例えると大きな物件に引っ越すこと)では無く、リソース(特にハードウェア)の追加によって大規模なものへと透過的に規模拡張できる能力(建物で例えると、増築や別棟を建てること)はスケーラビリティの一種だといえる。リソースの量に比例して全体のスループットが向上するシステムはスケーラブルな(scalable)システムまたはスケーラビリティのあるシステムと呼ばれる。 システムの特性としてのスケーラビリティに一般的な定義を与えるのは難しい。具体的な事例においては、問題としている領域でスケーラビリティを確保するための条件を特定することが必要である。これはデータベース、ルータ、ネットワークなど情報工学の分野において非常に重要なことである。スケーラビリティは分散処理の'''透過性'''の概念と密接なつながりがある。 スケーラビリティの高さは様々な尺度で評価される。例として;規模透過性;位置透過性;異種透過性 がある。スケーラビリティについて議論する際には規模透過性のみを問題にすることも多い。 例えば、スケーラブルなデータベース管理システムではプロセッサやストレージを追加することでより多くのトランザクションを処理できるようにアップグレードでき、またアップグレードをシャットダウンなしに実行できる。 ルーティングプロトコルがネットワークの規模に関してスケーラブルであると言われるのは、Nをネットワーク内のノード数としたときに、各ノードに必要なルーティングテーブルのサイズが O(log N) に従って増大するときである。.

新しい!!: Extract/Transform/Loadとスケーラビリティ · 続きを見る »

ソート

ート は、データの集合を一定の規則に従って並べること。日本語では整列(せいれつ)と訳される。(以前はその原義から分類という訳語が充てられていたが、もう使われていない) 主にコンピュータソフトにおけるリストに表示するデータに対し、全順序関係によって一列に並べることを指す。また、単に「ソート」といった場合、値の小さい方から大きい方へ順に並べる昇順(しょうじゅん、)を指すことが多い。その反対に値を大きい方から小さい方へ順に並べることを降順(こうじゅん、)という。 対象となるデータのデータ構造や必要な出力によって、使われるアルゴリズムは異なる。.

新しい!!: Extract/Transform/Loadとソート · 続きを見る »

サービス水準合意

ービス水準合意 (Service Level Agreement, SLA) とは、サービスの提供者とその利用者の間で結ばれるサービス水準に関する合意である。 サービスレベル契約と言われることもある。.

新しい!!: Extract/Transform/Loadとサービス水準合意 · 続きを見る »

Comma-Separated Values

comma-separated values(略称:CSV)は、いくつかのフィールド(項目)を区切り文字であるカンマ「,」で区切ったテキストデータおよびテキストファイル。拡張子は.csv、MIMEタイプは text/csv。 「comma-separated variables」とも言う。広く普及した訳語はないが、「カンマ区切り」などとも呼ばれる。Microsoft Excelでは「CSV (カンマ区切り)」としている。 データ交換用のデファクトスタンダードとして、古くから多くの表計算ソフトやデータベースソフトで使われているが、細部の実装はソフトによって異なる。それらを追認する形で、2005年10月、RFC 4180 で Informational(IESGの外部で決定された有用な情報の提供)として仕様が成文化された。 類似したフォーマットとして、タブで区切られた tab-separated values (TSV)や、欧文間隔 (いわゆる半角スペース) で区切られた space-separated values (SSV) などがあり、これらをまとめて character-separated values (CSV)、delimiter-separated values (DSV) とも呼ばれることも多い。.

新しい!!: Extract/Transform/LoadとComma-Separated Values · 続きを見る »

Enterprise application integration

Enterprise Application Integration(以下、EAI)とは、企業内における多種多様なコンピュータシステム群や各種ビジネスパッケージ群を有機的に連携/統合(例えば、営業支援サービスと財務システム、顧客管理システムを連携させ、CRMシステムの機能を拡充させるなど)させ再構築し、より戦略的な機能や情報として提供する機能及びミドルウェア / アプリケーションパッケージや統合技術のこと。 基幹システムと電子商取引システムの接続や、企業間の合併に伴うシステム統合手段としても活用される。.

新しい!!: Extract/Transform/LoadとEnterprise application integration · 続きを見る »

転置行列

転置行列(てんちぎょうれつ、transpose, transposed matrix)とは 行 列の行列 に対して の 要素と 要素を入れ替えた 行 列の行列、つまり対角線で成分を折り返した行列のことである。転置行列は などと示される。行列の転置行列を与える操作のことを転置(てんち、transpose)といい、「 を転置する」などと表現する。.

新しい!!: Extract/Transform/Loadと転置行列 · 続きを見る »

関係データベース

関係データベース(かんけいデータベース、リレーショナルデータベース、英: relational database)は関係モデル(リレーショナルデータモデル、後述)にもとづいて設計、開発されるデータベースである。関係データベースを管理するデータベース管理システム (DBMS) を関係データベース管理システム (RDBMS) と呼ぶ。 Oracle Database、Microsoft SQL Server、MySQL、PostgreSQL、DB2、FileMaker、H2 Database などがRDBMSである関係データベースに含まれないデータベースは、NoSQL などを参照。 。.

新しい!!: Extract/Transform/Loadと関係データベース · 続きを見る »

IMS

IMS (Information Management System、アイエムエス)は、IBMが開発・販売する、メインフレーム専用のデータ管理システム。最新版の名称は「IMS Transaction and Database Servers」。IMSはトランザクション処理システムであるIMS TM(IMS Transaction Manager)と、階層型のデータベース管理システム (DBMS) であるIMS DB(IMS Database Manager)から構成される。.

新しい!!: Extract/Transform/LoadとIMS · 続きを見る »

Indexed Sequential Access Method

Indexed Sequential Access Method(索引付き順次アクセス方式、さくいんつきじゅんじあくせすほうしき、一般にISAM)とは高速にアクセスが可能なデータの格納方法 (ファイル編成法) の一つである。IBMで開発され、今日では関係データベース管理システム (RDBMS、関係データベース) をはじめとするほとんど全てのデータベース管理システム (DBMS) でのデータの格納に用いられている。 ISAMを用いたシステムではデータは固定長のレコードとして格納される。当時の設計思想は磁気テープの記憶装置に高速で書き込むためにレコードを連続的に格納していくものだった。もう一つのデータとしてテーブルの内容へのポインタを格納したハッシュテーブルを索引として用いることで、全データを検索することなく目的のデータを取り出すことを可能とした。 ISAMの実現は他のデータへのポインタがレコード内に格納されていたナビゲーショナルデータベースからの脱却を実現した。ISAMによる主要な利点は索引のサイズが小さく、高速な検索が可能で、必要なデータのみに直接アクセス可能としたことにある。それに加えてデータの変更が行われた場合にも、該当するデータのみの変更で済ますことが可能であり、関連する他のデータまで波及して変更を加える必要がないことも利点となった。 関係データベースはテーブル同士のリンクを正常に維持するロジックが追加されるISAM方式と組み合わせての実装が行いやすい。代表的な例として、外部キーとして使われるフィールドの高速な検索のために索引が用いられる。 これは関連するデータへのポインタをレコードに直接格納する方法よりも遅い処理となるが、データの物理的な構成の変更があった場合でもリンクが正常に保たれるため、ポインタを書き換える必要がない。 ISAMはファイルへの直接の、順番に従ったアクセス方式であり,非常にわかりやすく実装も容易である。また、非常に高速なアクセス方式でもある。逆にISAMの欠点はそれぞれのクライアントマシンがアクセスしているファイルへの自身の接続状態を管理しなければならないことにある。これは一方で複数のデータの追加動作が衝突し、データが矛盾した状態に陥る可能性につながっている。一般的にこの問題はクライアントサーバモデルの導入によってサーバがクライアントの要求を直列化して扱うことによって解決されている。これは格納されたデータに対してクライアント側のレイヤーに存在しているSQLのトランザクション概念の基礎となっている。 IBMではISAMの代わりにVSAM (Virtual Storage Access Method; 仮想記憶アクセス方式)と呼ばれる技術を用いるようになった。 Category:データベース Category:データ構造 Category:OSのファイルシステム Category:IBM.

新しい!!: Extract/Transform/LoadとIndexed Sequential Access Method · 続きを見る »

JasperReports

JasperReports (ジャスパーレポート)とは、米Jaspersoft社が開発/販売しているオープンソースの帳票及びビジネスインテリジェンスソフトウエアである。短時間かつ安価でグラフを含む帳票を作成することができるのでデファクトスタンダードのオープンソース帳票ツールとされている。 JasperReportsは、帳票をレイアウトとデータに分離している。レイアウトとは、空白の帳票用紙のようなものです。用紙の大きさ、枠線など用紙に固定表示する物、データを表示する位置、計算式などを定義する。データとはデータベース、CSVファイル、Excel xlsファイル、Java Beansなど帳票に表す値の元になるものである。レイアウトとデータを分離することで、一つのレイアウトを使って複数種類のデータから帳票を作成することができる。作成した帳票をPDF、 HTML、 Microsoft Excel、 RTF、 ODT、 CSV やXMLなど多くの形式に出力することができる。 JasperReports用のレポートレイアウトはjrxml (JasperReports XML) と言うXML形式のファイルで定義される。テキストエディタでこのXMLファイルを作成することもできるが、多くの場合はJaspersoft StudioのようなGUIエディタを使ってレポートレイアウトの定義を行う。 豊富なグラフの種類を描くことができる。分析結果を色々なグラフで表示することができるため、海外などからBIツールとしても注目されている。また、海外ではデファクトスタンダードの帳票作成ツールとなっているため、海外ユーザとレイアウトを共有できる。 Jaspersoft Studioで作成したグラフの例.

新しい!!: Extract/Transform/LoadとJasperReports · 続きを見る »

Java Web Start

Java Web Start(ジャバウェブスタート)はJava製アプリケーションをウェブサーバなどから自動ダウンロード、自動インストール、自動アップデートして、サンドボックス上にて実行可能な仕組み。Java 5にて搭載され、Java 9にて廃止予定(deprecated)となった。Swing APIなどで記述されたGUIアプリケーションを実行できる。問題点が多いためにFlashよりも劣ると言われるJavaアプレットの代替リッチクライアントと言われている。 たとえば、ウェブブラウザでJava Web Startに対応したJavaアプリケーションへのリンクをクリックすると、Javaアプレットのようなブラウザ埋め込み型ではなくメディアプレーヤーなどの外部アプリケーションのようにJava Web Startが起動する。Java Web Startがインストールされていないときは、Java Web Startソフトウェア(Java Web Startの管理・実行ソフトウェア)が自動ダウンロード、自動インストールされる。JREがインストールされていないときは、それも自動的にインストールされる。さらに、JRE、Java Web Startそれぞれのバージョンが古いときは自動的にアップデートされる。また、Java Web Start対応Javaアプリケーションが古く、最新バージョンがサーバにアップロードされている場合は、実行前の事前確認により自動的にアップデートされる。 なお、Java Web Start対応Javaアプリケーションはローカルマシンに保存される。よって、二回目以降の起動は、ダウンロードなどが不要となり高速に起動できる。 現在のJava Web Start はOSとの協調動作も行なわれる。たとえば、Windowsにおいて「プログラムの追加と削除」を利用したJava Web Startアプリケーションのアンインストールが可能である。また、プログラムメニューやデスクトップへのショートカットアイコンの作成なども行なわれる。.

新しい!!: Extract/Transform/LoadとJava Web Start · 続きを見る »

Null

Null(ヌル、ナル)は、何もない、という意味で、プログラミング言語などコンピュータ関係では、「何も示さないもの」を表すのに使われる。同様のものに、nil が使われることもある。他の名前のこともある。 本来 はドイツ語において数値の0(ゼロ)を意味する単語であり、ドイツ語における発音は である。一方、英語においては と発音される。実際の発音はを参照のこと。 日本においては原語に近い「ヌル」という発音が定着しているが、英語読みに近い「ナル」という発音で呼ばれる場合もある(専門書、国家試験など)。 プログラミング言語などにおいて、nullやnilといった予約語や定数名のものなどの意味がどういったものかは言語により、場合によっては実装ごとに違う。ポインタや参照のある言語では、ヌルポインタなどと呼ばれる何も指さない特別なポインタであることもあるし、Pythonのようにオブジェクトのこともある。古典的なLISPのように真理値の偽(の代表)や空リスト「()」を兼ねたもの(それらと同じもの)だったりすることもある。.

新しい!!: Extract/Transform/LoadとNull · 続きを見る »

OLAP

OLAPはonline analytical processingの略であり、複雑で分析的な問い合わせに素早く回答を行う方法の事である。 ビジネスインテリジェンスと呼ばれるより大きなカテゴリに属し、ビジネスインテリジェンスとはOLAP・ETL・リレーショナルレポーティング・データマイニングを含む概念である。 OLAPの典型的な用途は売上報告、市場分析、経営報告、ビジネス業績管理(BPM)、予算作成、計画作成、財務諸表作成などである。 OLAPの主な特徴は以下の点にある。.

新しい!!: Extract/Transform/LoadとOLAP · 続きを見る »

Virtual Storage Access Method

Virtual Storage Access Method (VSAM、ぶいさむ、仮想記憶アクセス方式) は、オペレーティングシステム OS/VS2 で初めて使われ、後に MVS 、z/OSで使われ続けている IBM が提案したディスクファイルストレージの方式 (ファイル編成法) である。 VSAMは当初からトランザクショナルファイルとしてメインフレームのデフォルトの Resource Manager(RM)を構成していた。IBMメインフレームでは Transaction Manager(TM)さえ付加すれば VSAM でトランザクション処理が可能だった。そのためにz/OSは非常に高価なライセンス料だった。IBMは2002年にz/OSの低価格版z/OS.eをリリースするに当たって、わざわざUNIX系OSと同じように、TMとしてCICS、IMSを RMとして直接にVSAMを利用できない仕様を作った。 VSAM は、次のアクセス方式を含む:.

新しい!!: Extract/Transform/LoadとVirtual Storage Access Method · 続きを見る »

構文解析

構文解析(こうぶんかいせき、syntactic analysis あるいは parse)とは、文章、具体的にはマークアップなどの注記の入っていないベタの文字列を、自然言語であれば形態素に切分け、さらにその間の関連(修飾-被修飾など)といったような、統語論的(構文論的)な関係を図式化するなどして明確にする(解析する)手続きである。自然言語については自然言語処理における要点のひとつであり、プログラミング言語など形式言語の場合は、形式文法に従い構文木を得る。構文解析を行う機構を構文解析器(parser)と呼ぶ。.

新しい!!: Extract/Transform/Loadと構文解析 · 続きを見る »

情報抽出

情報抽出 (Information Extraction; IE) は非構造化文書と機械が読み取れる (machine-readableな) 半構造化文書の両方またはいずれから自動的に構造化データを抽出するタスクである。 多くの場合、この作業は人間の言葉で書かれた文書を自然言語処理 (Natural Language Processing; NLP) の手法を用いて処理することを指す。画像・音楽・動画の自動アノテーションやコンテンツ抽出のような、近年のマルチメディア文書の処理もまた情報抽出として捉えられる。 その問題の難しさから、IEに対する現在のアプローチは狭く制限されたドメインに焦点を当てている。例として、ニュースサービスの企業合併についての報道からの情報抽出があり、次のようなフォーマルな関係による情報 を次のようなニュース文 から抜き出す。 IEの広い目標は、蓄積された非構造化データのうえで処理を行えるようにすることである。より具体的な目標は、入力データの論理的内容に基づいて推論を行う論理的推論を可能にすることである。 category:検索.

新しい!!: Extract/Transform/Loadと情報抽出 · 続きを見る »

ここにリダイレクトされます:

ETL

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »