ロゴ
ユニオンペディア
コミュニケーション
Google Play で手に入れよう
新しい! あなたのAndroid™デバイスでユニオンペディアをダウンロードしてください!
ダウンロード
ブラウザよりも高速アクセス!
 

ウェブアーカイブ

索引 ウェブアーカイブ

ウェブアーカイブ (web archive) は、WWW(web、ウェブ)全体もしくはその一部を収集し、そのコレクションを後世の研究者、歴史家、一般大衆のために保存して、アーカイブとしたもの。 ウェブのサイズは膨大であるため、ウェブアーカイブではクローラを使って自動収集を行う。最大規模のウェブアーカイブ機関は、ウェブ全体のアーカイブ作成を自動・手動の両面で行っている「インターネットアーカイブ」(Internet Archive) である。 各国の国立図書館もまた文化的に重要なウェブコンテンツを保存しようとしており、フランスでは2001年にウェブページのウェブアーカイブ化を義務化する法律が成立した。2003年7月には、世界各国の国立図書館等が連携してウェブアーカイブの技術開発を行うための国際コンソーシアムとして、国際インターネット保存コンソーシアム (IIPC) が設立されている。 2004年には、日本でもこの方面のアーカイブを検討するという方向が小泉内閣で打ち出され、国立国会図書館による事業が始まった。.

39 関係: Archive.is同一性大衆学者保存信頼性メディアタイプメタデータブラウザビデオフランスダウンロードアーカイブインターネットアーカイブウェブページウェブスクレイピングウェブ魚拓クローラコレクションコンソーシアムコーネル大学スタイルシート国立図書館国立国会図書館国際インターネット保存コンソーシアム画像自動HeritrixHyperText Markup LanguageJavaScriptRobots Exclusion StandardSafariUniform Resource LocatorWorld Wide Web歴史家深層Web文化手動2004年

Archive.is

archive.is(アーカイブ イズ)は、WWW上のウェブサイト(ウェブページ)をキャッシュとして取得保存する、無料のウェブアーカイブサービス。ただし、PDFファイルの保存には対応していない。2018年1月以降はサイト名が archive.today(アーカイブ トゥデイ)となっている(#変遷も参照)。 アドレスをトップページの上段赤枠に入力もしくはペーストすると、短縮URLが生成される。下段青枠では、アドレスから過去に取得保存されたページの検索もできる。 なお、キャッシュページ(snapshotsと称している)の上部には、Linked fromとして、ウィキペディアなどのリンクされているページへのハイパーリンクが表示されることもある)-->。.

新しい!!: ウェブアーカイブとArchive.is · 続きを見る »

同一性

同一性(どういつせい、identity、アイデンティティ)は、他のものから対立区分されていることで変わらずに等しくある個の性質をいう。そのような対立区分される個がないという意味での差異性の対語。このときの差異性とは従って万物斉同性とも無とも言える。区分としての差異性との間を区分しておかないと正しく理解できない。古代ギリシャが確立した論理学には同一律があるが、それは同一性の律なのである。その同一性は常に個の同一性なのである。従って、西洋的に論理的であると必然的に(個の存在と連動する)同一性志向になる。インドや東アジアの伝統はこの、同一性と一体の論理を志向しない。 特に自己同一性(self-identity)というとき、あるものがそれ自身(self、ギリシア語のautosに由来)と等しくある性質をいう。 同一性は西洋の伝統としての哲学上、もっとも重要な概念のひとつであり、同一性によって、あるものは存在ないし定在として把握される、あるいは定立される。.

新しい!!: ウェブアーカイブと同一性 · 続きを見る »

大衆

大衆(たいしゅう)とは、社会を占める「大多数の・大勢を占める」とされる人々、またはそれに属する個人を指す言葉である。類義語には主に政治用語として使用する民衆(みんしゅう)、危機管理の対象としては群衆(ぐんしゅう)などがある。また国家という単位に於いては、国民も同語に類される。政治学、社会学などの社会科学分野においては大衆は匿名性を帯びた無責任な集団としての意味合いを持ち、顕名性をもつ市民との対比で用いられる。仏教用語における大衆とは、仏法によって調和のとれた人々の集まりの意。.

新しい!!: ウェブアーカイブと大衆 · 続きを見る »

学者

学者(がくしゃ)とは、何らかの学問の研究や教授を専門職とする人、およびその職業人の総称である。研究者(けんきゅうしゃ)とも言う。学問の専門家。.

新しい!!: ウェブアーカイブと学者 · 続きを見る »

保存

記載なし。

新しい!!: ウェブアーカイブと保存 · 続きを見る »

信頼性

信頼性(しんらいせい、 reliability)は、JIS-Z8115:2000『信頼性用語 (Glossary of Terms Used in Reliablity)』 において、「アイテムが与えられた条件で規定の期間中、要求された機能を果たすことができる性質」と定義される。「一定の条件下で、安定して期待される役割を果たすことのできる能力」と定義されることもある。 同様に信頼度についても定義されており、そちらは「アイテムが与えられた期間与えられた条件下で機能を発揮する確率」とある。 JISにおいては定量的な「信頼度」と定性的な「信頼性」という二つの用語を使い分けされているが、NASAの定義 (SSP 30000 S.9) では、 Reliability: A characteristic of a system or an element thereof expressed as a probability that it will perform its required function under condition at designated times for specified operating periods.

新しい!!: ウェブアーカイブと信頼性 · 続きを見る »

メディアタイプ

メディアタイプは、ファイルやインターネット上で転送されるコンテンツの形式を表現する識別子である。MIMEタイプや要素タイプ (Content type)とも表記される。text/plainのように、スラッシュで区切る表記が特徴的である。 公式には、IANAがメディアタイプを管理している。 メディアタイプは、RFC 2045 のMIMEの仕様の一部として定義されたことが起源である。RFC 2045 では、電子メールの本文や添付ファイルの種類の記述に使用しており、MIMEタイプと呼称された。その後、HTTPなどその他のインターネットプロトコルや、HTMLのようなファイル形式でも同様の目的に使用されるようになっていった。.

新しい!!: ウェブアーカイブとメディアタイプ · 続きを見る »

メタデータ

メタデータ(metadata)、メタ情報とは、メタなデータ、すなわちデータについてのデータという意味で、あるデータが付随して持つそのデータ自身についての付加的なデータを指す。.

新しい!!: ウェブアーカイブとメタデータ · 続きを見る »

ブラウザ

ブラウザもしくはブラウザー()は、コンピュータ上の情報を一定の目的に沿って表示し閲覧に供するソフトウェア一般を指す語。ブラウザーを利用し情報を閲覧することをブラウジング()、ブラウズ()する、のように言う。 原義は興味のあるものを流し読みすること、草食動物が植物の特定の部分を選択的に食べること。 ブラウジングのことを「拾い読み調査」と呼ぶこともある。.

新しい!!: ウェブアーカイブとブラウザ · 続きを見る »

ビデオ

ビデオ(Video)とは、狭義にはテレビジョン技術において、電気信号を用いた映像(映像信号またはビデオ信号)の処理技術と、それを利用した周辺技術全般に関わる用語である。広義では、コンピュータのディスプレイ装置など、テレビジョンで用いられるビデオ信号によらない画像を利用する機器全般に用いられる。基本的には、動画を扱う場合が多い。 通常、次のように修飾的に用いる。.

新しい!!: ウェブアーカイブとビデオ · 続きを見る »

フランス

フランス共和国(フランスきょうわこく、République française)、通称フランス(France)は、西ヨーロッパの領土並びに複数の海外地域および領土から成る単一主権国家である。フランス・メトロポリテーヌ(本土)は地中海からイギリス海峡および北海へ、ライン川から大西洋へと広がる。 2、人口は6,6600000人である。-->.

新しい!!: ウェブアーカイブとフランス · 続きを見る »

ダウンロード

ダウンロード(Download)は接続されたコンピュータ間に存在するデータ(ファイルなど)を上流ノードから下流ノードへ転送することを指す。日本語では「落とす」という言い換え方もある。また、受信とも言われるが、上流ノードの指示で下流ノードへ転送する場合は送信となる。対義語としてはアップロードが挙げられる。.

新しい!!: ウェブアーカイブとダウンロード · 続きを見る »

アーカイブ

アーカイブ (archive) とは、重要記録を保存・活用し、未来に伝達することをいう。日本では一般的に書庫や保存記録と訳されることが多いが、元来は公記録保管所、または公文書の保存所、履歴などを意味し、記録を保存しておく場所である(公文書館も参照のこと)。 国立国語研究所による「外来語」言い換え提案では、「アーカイブ」の言い換え語として「保存記録」や「記録保存館」とされている。.

新しい!!: ウェブアーカイブとアーカイブ · 続きを見る »

インターネットアーカイブ

旧インターネットアーカイブ本部(1996年 - 2009年11月) インターネットアーカイブ (The Internet Archive) は、WWW・マルチメディア資料のアーカイブ閲覧サービスとして有名なウェイバックマシン (Wayback Machine)を運営している団体である。本部はカリフォルニア州サンフランシスコのリッチモンド地区に置かれている。 アーカイブにはプログラムが自動で、または利用者が手動で収集したウェブページのコピー(ウェブアーカイブ)が混在しており、これは「WWWのスナップショット」と呼ばれる。ほか、ソフトウェア・映画・本・録音データ(音楽バンドなどの許可によるライブ公演の録音も含む)などがある。アーカイブは、それらの資料を無償で提供している。.

新しい!!: ウェブアーカイブとインターネットアーカイブ · 続きを見る »

ウェブページ

ウェブページ (Web page, webpage) は、ウェブ上にあり、ウェブブラウザで閲覧可能な、ページ単位の文書のこと。ホームページと表記することもあるが、誤用であるという主張もある(詳しくはホームページの項を参照)。.

新しい!!: ウェブアーカイブとウェブページ · 続きを見る »

ウェブスクレイピング

ウェブスクレイピング(Web scraping)とは、ウェブサイトから情報を抽出するコンピュータソフトウェア技術のこと。ウェブ・クローラーあるいはウェブ・スパイダーとも呼ばれる。 通常このようなソフトウェアプログラムは低レベルのHTTPを実装することで、もしくはウェブブラウザを埋め込むことによって、WWWのコンテンツを取得する。 ウェブスクレイピングは多くの検索エンジンによって採用されている、ボットを利用してウェブ上の情報にインデックス付けを行うウェブインデクシングと密接な関係がある。ウェブスクレイピングではウェブ上の非構造化データの変換、一般的にはHTMLフォーマットからデータベースやスプレッドシートに格納・分析可能な構造化データへの変換に、より焦点が当てられている。また、コンピュータソフトウェアを利用して人間のブラウジングをシミュレートするウェブオートメーションとも関係が深い。ウェブスクレイピングの用途は、オンラインでの価格比較、気象データ監視、ウェブサイトの変更検出、研究、ウェブマッシュアップやウェブデータの統合等である。.

新しい!!: ウェブアーカイブとウェブスクレイピング · 続きを見る »

ウェブ魚拓

ウェブ魚拓(ウェブぎょたく)とは、WWW上のウェブサイト(ウェブページ)をキャッシュとして保存する無料のサービスである。日本の株式会社アフィリティーが2006年より運営している。 一種のスナップショットによるウェブアーカイブである。.

新しい!!: ウェブアーカイブとウェブ魚拓 · 続きを見る »

クローラ

ーラ(Crawler)とは、ウェブ上の文書や画像などを周期的に取得し、自動的にデータベース化するプログラムである。「ボット(Bot)」、「スパイダー」、「ロボット」などとも呼ばれる。 主に検索エンジンのデータベース、インデックス作成に用いられているほか、統計調査などの目的にも利用される。近年では電子メールアドレス収集業者などもクローラを利用して、スパムの送信効率を上げている。 一般にクローラは、既知のHTML文書の新しいコピーを要求し、文書中に含まれるリンクをたどり別の文書を収集するという動作を繰り返す。新しい文書を見つけた場合はデータベースに登録する。また、既知のファイルが存在しないことを検出した場合はデータベースから削除する。.

新しい!!: ウェブアーカイブとクローラ · 続きを見る »

コレクション

驚異の部屋の一隅を描いた絵画 コレクション(Collection)は、ものを広く集めること、また集められたもの。収集、収集物、所蔵品。「収集」は「蒐集」とも書く。趣味としての収集活動に対して使われることが多いが、博物館や美術館等の所蔵作品群や、近年では作家の著作集などに対しても用いられている。 服飾においてはファッションデザイナーや服飾ブランドが開催する展示会及びその作品群を指す。ただし英語ではファッションウィーク(fashion week)と呼ぶのが一般的である(詳細はファッションショーを参照)。また日本では一般的ではないが、英語圏では募金、寄付金、献金、集金などのこともコレクションと呼ぶ。.

新しい!!: ウェブアーカイブとコレクション · 続きを見る »

コンソーシアム

ンソーシアム(Consortium)あるいは共同事業体(きょうどうじぎょうたい)は、2つ以上の個人、企業、団体、政府(あるいはこれらの任意の組合せ)から成る団体であり、共同で何らかの目的に沿った活動を行ったり、共通の目標に向かって資源を蓄える目的で結成される。 Consortium はラテン語で「提携、共同、団体」を意味する。語の成り立ちは、consors(パートナー)が語源であり、さらに consors は con-(一緒に)と sors(運命)から成る単語で、「同志」を意味する。.

新しい!!: ウェブアーカイブとコンソーシアム · 続きを見る »

コーネル大学

ーネル大学(Cornell University)は、米国の私立大学でありアイビー・リーグを構成する一校である。特に機械工学、生命科学、物理学、建築学、造園学、コンピュータ工学、経営学、医学、農学分野は著名である。世界における大学ランキングでは、Webometrics Ranking of World Universitiesで2015年度は5位にランクされ:en、またノーベル賞の全部門で受賞者を輩出する等、研究・教育の両面において世界最高水準を保持している。 大自然に恵まれたキャンパス内には湖や滝があり、全米一美しいと言われている。またバラエティに富んだ高い品質の学食を提供することでも知られ、Princeton Reviewで2016年には全米3位にランクインされた。.

新しい!!: ウェブアーカイブとコーネル大学 · 続きを見る »

スタイルシート

タイルシート (style sheet) とは、構造化文書などにおける表示形式を制御するしくみ。見栄えと構造を分離するという目的で提唱された。HTML、XML、SGMLといったマークアップ文書や、オフィスソフトにおいて広く使用されている。 Web上で広く使われているHTML文書にスタイルシートを適用する場合には、一般的にCSSが利用される。CSSが圧倒的に普及しているので、単にスタイルシートといえばCSSを指すことがある。.

新しい!!: ウェブアーカイブとスタイルシート · 続きを見る »

国立図書館

イギリスの国立図書館である大英図書館 国立図書館(こくりつとしょかん)は、国家やそれに準ずる機関により設置、運営される図書館である。対応する英語のナショナル・ライブラリー()とほぼ同義である。.

新しい!!: ウェブアーカイブと国立図書館 · 続きを見る »

国立国会図書館

国立国会図書館(こくりつこっかいとしょかん、英称:)は、日本の国会議員の調査研究、行政、ならびに日本国民のために奉仕する図書館である。また、納本制度に基づいて、日本国内で出版されたすべての出版物を収集・保存する日本唯一の法定納本図書館である。設置根拠は国会法第130条及び国立国会図書館法第1条。 国立国会図書館は、日本の立法府である国会に属する国の機関であり、国会の立法行為を補佐することを第一の目的とする議会図書館である。同時に、納本図書館として日本で唯一の国立図書館としての機能を兼ねており、行政・司法の各部門および日本国民に対するサービスも行っている。バーチャル国際典拠ファイルに参加している。 施設は、中央の図書館と、国立国会図書館法3条に定められた支部図書館からなる。中央の図書館として東京本館(東京都千代田区永田町)および関西館(京都府相楽郡精華町精華台)が置かれ、また東京本館に付属して国会分館がある。 支部図書館としては国際子ども図書館(東京都台東区上野公園)のほか、司法機関に1館(最高裁判所図書館)、国立国会図書館法の規定により行政各部門に置かれる支部図書館及びその職員に関する法律(昭和24年法律第101号。支部図書館法)に基づいて行政機関に26館が置かれる。.

新しい!!: ウェブアーカイブと国立国会図書館 · 続きを見る »

国際インターネット保存コンソーシアム

国際インターネット保存コンソーシアム(こくさいインターネットほぞんコンソーシアム、International Internet Preservation Consortium; IIPC) とは、各国の国立図書館等が国際的に連携して、ウェブアーカイブを主とするインターネット情報の収集・保存・提供に係る技術的、運用上の課題の解決を図るとともに、世界各国にインターネット情報の収集・保存・提供の取り組みを普及するために、協力して活動するための組織である。.

新しい!!: ウェブアーカイブと国際インターネット保存コンソーシアム · 続きを見る »

画像

画像(がぞう)とは、事象を視覚的に媒体に定着させたもので、そこから発展した文字は含まない(例:文字と画像、書画)。定着される媒体は主に2次元平面の紙であるが、金属、石、木、竹、布、樹脂や、モニター・プロジェクター等の出力装置がある。また、3次元の貼り絵、ホログラフィー等も含まれる。.

新しい!!: ウェブアーカイブと画像 · 続きを見る »

自動

自動(じどう)とは、機械装置が人間などの他の力を必要としないで、能動的に作動することをいう。.

新しい!!: ウェブアーカイブと自動 · 続きを見る »

Heritrix

Heritrix はインターネット・アーカイブが開発したWeウェブアーカイブのためのWebクローラーの一種。Java言語で実装され、フリーソフトウェアライセンスにより自由に利用できる。主にウェブブラウザを使って操作するが、コマンドラインツールを使ってクロールを開始するなどの操作も可能である。名前は「(女性の)相続人」を意味するheiressの古語に由来する。 Heritrixの開発は、2003年にまとめられた仕様に基づいて、インターネット・アーカイブとNordic National Librariesの共同で行われた。最初のリリースは2004年1月で、その後インターネット・アーカイブの従業員や外部のウェブアーカイブに関心を持つ人々によって継続的に改良が続けられている。 もっともHeritrixがインターネット・アーカイブ自身のウェブ収集に使われるようになったのはかなり後のことである。かつてはアーカイブの大半はアレクサ・インターネット社から提供されていた。アレクサ社は自身の業務に供するため独自のia_archiverと呼ばれるクローラーを使ってウェブ収集を行っており、収集したデータをインターネット・アーカイブに寄贈している。当初インターネット・アーカイブ自身もHeritrixを使って収集を行ってはいたが、小規模なものに留まっていた。 2008年からインターネット・アーカイブは自身の全ウェブ規模のクローリングの性能を向上させ、現在では自身で収集したものが大半を占めるようになっている。.

新しい!!: ウェブアーカイブとHeritrix · 続きを見る »

HyperText Markup Language

HyperText Markup Language(ハイパーテキスト マークアップ ランゲージ、HTML(エイチティーエムエル))は、ハイパーテキストを記述するためのマークアップ言語の1つである。World Wide Web (WWW)において、ウェブページ(1990年代後半頃からはコンテンツという語も利用されている。「中身」という意味の語であり、大層な意味は無い)を表現するために用いられる。ハイパーリンクや画像等のマルチメディアを埋め込むハイパーテキストとしての機能、見出しや段落といったドキュメントの抽象構造、フォントや文字色の指定などの見た目の指定、などといった機能がある。 2012年7月以降、WHATWG により仕様が作られ、それを元に W3C により勧告が行われるという流れになっている。W3C は、XML ベースの規格である XHTML の勧告も行っている。.

新しい!!: ウェブアーカイブとHyperText Markup Language · 続きを見る »

JavaScript

JavaScript(ジャバスクリプト)とは、プログラミング言語のひとつである。Javaと名前が似ているが、全く異なるプログラミング言語である(後述の#歴史を参照)。 JavaScriptはプロトタイプベースのオブジェクト指向スクリプト言語であるが、クラスなどのクラスベースに見られる機能も取り込んでいる。 ウェブブラウザ上で動作し動的なウェブサイト構築やリッチインターネットアプリケーションの開発に用いられる。また、2010年以降はnode.jsなどのサーバサイドJavaScript実行環境や各種ライブラリの充実により、MEANに代表されるように、Web開発の全ての領域で活用されるようになってきている。.

新しい!!: ウェブアーカイブとJavaScript · 続きを見る »

Robots Exclusion Standard

Robots Exclusion Standard(RES) または Robots Exclusion Protocol は、クローラやボットがウェブサイト全体またはその一部を走査することを防ぐ規約である。ロボット排除規約、robots.txt プロトコルとも呼ばれる。こういったボットは検索エンジンがウェブサイトの内容を分類しアーカイブするために主に使ったり、ウェブマスターがソースコードを校正するために使ったりする。直接の関係はないが、逆にボットを案内する目的のSitemapsと組み合わせて使うこともできる。.

新しい!!: ウェブアーカイブとRobots Exclusion Standard · 続きを見る »

Safari

Safari(サファリ)は、アップルにより開発されているウェブブラウザ。macOS標準のウェブブラウザとしてMac OS X v10.3より搭載されている。iPhone、iPod touch、iPadのiOSプラットフォーム向けにmacOS用からカスタマイズされたSafariが標準ウェブブラウザとして搭載されている。.

新しい!!: ウェブアーカイブとSafari · 続きを見る »

Uniform Resource Locator

Uniform Resource Locator(ユニフォーム リソース ロケータ、URL)または、統一資源位置指定子(とういつしげんいちしていし)とは、インターネット上のリソース(資源)を特定するための形式的な記号の並び。WWWをはじめとするインターネットアプリケーションにおいて提供されるリソースを、主にその所在を表記することで特定する。なお、ここでいう、「リソース」とは、(主にインターネット上の)データやサービスを指し、例えばウェブページの保存場所や電子メールの宛先といったものがそうである。 ティム・バーナーズ=リーが1991年に発表した論文でUniversal Resource Locatorと命名し、初期はその名が使われたが、現在の正式名称は、「Uniform Resource Locator」である。 URLを含む一般概念としてURIがある。 URLはリソースの場所を特定する「住所」のようなものだと例えられることがある。また、日本ではURLのことを「アドレス」と呼ぶことがあるが、これは、MACアドレスやIPアドレスなどと紛らわしく、技術用語としては、好まれてはいない。.

新しい!!: ウェブアーカイブとUniform Resource Locator · 続きを見る »

World Wide Web

World Wide Web(ワールド・ワイド・ウェブ、略名:WWW)とは、インターネット上で提供されるハイパーテキストシステム。Web、ウェブ、W3(ダブリュー スリー)とも呼ばれる。俗には「インターネット」という表現がワールド・ワイド・ウェブを指す場合もある。.

新しい!!: ウェブアーカイブとWorld Wide Web · 続きを見る »

歴史家

歴史学者(れきしがくしゃ)は、歴史を後世に残すべく、叙述(文章化)する人のことである。また、残された史料を元に歴史を研究し、その成果を論文や著作として著す人の事も指す。.

新しい!!: ウェブアーカイブと歴史家 · 続きを見る »

深層Web

深層Web(しんそうウェブ)、または、ディープWeb(ディープ・ウェブ、deep Web)は、World Wide Web上にある情報のうちで、通常の検索エンジンが収集することができない情報である。インビジブルWeb(インビジブル・ウェブ、invisible Web)とも呼ばれる。.

新しい!!: ウェブアーカイブと深層Web · 続きを見る »

文化

文化(ぶんか、)にはいくつかの定義が存在するが、総じていうと人間が社会の成員として獲得する振る舞いの複合された総体のことである。社会組織(年齢別グループ、地域社会、血縁組織などを含む)ごとに固有の文化があるとされ、組織の成員になるということは、その文化を身につける(身体化)ということでもある。人は同時に複数の組織に所属することが可能であり、異なる組織に共通する文化が存在することもある。もっとも文化は、次の意味で使われることも多い。.

新しい!!: ウェブアーカイブと文化 · 続きを見る »

手動

手動(しゅどう)は、何らかの機械ないし装置を、これを人間が操作することで動作させることの様式、あるいはそういった操作で作動する機械装置の機能である。主に自動に対比させる概念である。.

新しい!!: ウェブアーカイブと手動 · 続きを見る »

2004年

この項目では、国際的な視点に基づいた2004年について記載する。.

新しい!!: ウェブアーカイブと2004年 · 続きを見る »

ここにリダイレクトされます:

Web archiveWeb archivingWebpage archiveウェブ・アーカーブウェブ・アーカイブキャッシュページ

出ていきます入ってきます
ヘイ!私たちは今、Facebook上です! »