メインメニューを開く

歴史編集

2001年、インターネットアーカイブの創設者であるブリュースター・ケールブルース・ギリアット英語版がウェブサイトのコンテンツが閉鎖やサイトリニューアルなどで消失する問題に対処するために立ち上げた[4]。このサービスでユーザーは「three dimensional index」と呼ばれる時間別のウェブページアーカイブを閲覧することができる[5]。ケールとギリアットはインターネットの全てをアーカイブすることと「全ての知識へのユニバーサルアクセス」を提供することを目標にWayback Machineを開発した[6]

「Wayback Machine」の名はアニメーション作品「ロッキー・アンド・ブルウィンクル英語版」に登場するキャラクターのミスター・ピーボディ英語版とシャーマンが使用する「WABACマシン英語版」(WABACはウェイバックと発音)というタイムトラベルマシンが由来である[7][8]。シリーズ作品の1つである「Peabody's Improbable History」では日常的にWABACマシンを使って度々有名な歴史上の出来事を目の当たりにするだけでなく直接的に関与し改変したりしている。

ウェブページのキャッシュをアーカイブする作業は5年後に一般公開することを目標に1996年から始まっている。 1996年から2001年まで、集められた情報は不完全ながらデータベースとしてデジタルテープで保存されていて、ケールは研究者や科学者がアクセスできるようにしていた[9]。アーカイブが5周年を迎えた2001年に一般公開を迎え、カリフォルニア大学バークレー校にて記念式典が行われた[10]。サービス開始時点で既にアーカイブページが10億ページ以上に及んでいた[11]

データはインターネットアーカイブが所有するLinuxノードの大規模クラスタに保存されているが[6]、時折ウェブページに再アクセスし新しいバージョンをアーカイブしている(下部の技術的詳細参照)[12]。また、Wayback Machine側がウェブサイトを「クロール」して保存できる場合に手動で検索ボックスにウェブサイトのURLを入力してキャプチャーすることができる。

技術的詳細編集

ウェブをクロールし、一般にアクセスできるWorld Wide Webページの全て、Gopherヒエラルキー、ネットニュース(Usenet)掲示板システム、ダウンロード可能なソフトウェアを収集するために開発されたソフトウェアが「クローラー」である[13]。「クローラー」によって収集された情報はインターネット上にある情報が全て含まれているわけではなく公開者によって制限されているかアクセスできないデータベースに保存されているデータがある。部分的にキャッシュされたウェブサイトの矛盾を解決するために、2005年にインターネットアーカイブがArchive-It.orgという機関やコンテンツ制作者がデジタルコンテンツコレクションを収集して保存しデジタルアーカイブを作成するシステムを開発した[14]

クロールは様々なソースで構築されていて一部は第三者から移入されたものやアーカイブによって内部生成されたものもある[12]。例として、アルフレッド・P・スローン財団アレクサ・インターネットが構築したクロールやアメリカ国立公文書記録管理局インターネット・メモリー財団英語版の代理としてインターネットアーカイブが運用しているクロールや、コモン・クロール英語版のミラーがある[12]。2010年より「Worldwide Web Crawls」が作動していて世界中のウェブをキャプチャーしている[15][12]

スナップショットの取得頻度はウェブサイトによって異なっていて[12]、「Worldwide Web Crawls」内のウェブサイトはクロール毎に一回アーカイブされたサイトがある「クロールリスト」に含まれている[12]。例として、「Wide Crawl Number 13」は2015年1月9日に始まり、2016年7月11日に完成した[16]。しかし、複数のクロールがある時点で同時進行していることがあり、また特定のサイトが複数のクロールリストに含まれるため、サイトのクロール頻度が大きく異なることが多い[12]

ストレージ容量と成長編集

長年に渡る技術発展のように、Wayback Machineのストレージ容量は増大している。一般公開から2年後の2003年時点で、Wayback Machineの容量は月に12テラバイト増加している。データはインターネットアーカイブ職員がカスタムデザインしたPetaBox英語版ラックシステムに保存されている。最初の100テラバイトのラックは2004年6月に本格稼働したが、間もなくさらなる容量のストレージが必要になることが判明した[17][18]

2009年にインターネットアーカイブは自身のカスタマイズしたストレージアーキテクチャをSun Open Storage英語版に移行し、サン・マイクロシステムズのカリフォルニアキャンパスにあるSun Modular Datacenterの新たなデータセンターで管理することになった[19]。2009年時点で、Wayback Machineは約3ペタバイトのデータで構成されていて、毎月100テラバイトの割合で増加していた[20]

2011年、インターフェイスやアーカイブされたコンテンツの索引が更新されたWayback Machineの新しいかつ改善されたバージョンの公開テストが行われた[21]。同年3月、Wayback Machineフォーラムにて「Wayback Machine新バージョンのベータ版は2010年に全てのクロールされたデータのインデックスが更新されより完全なものとなり、定期的に更新を続けている。古いWayback Machineには2008年になっても僅かなデータしかなく、これ以上インデックスを更新する予定もなく、今年運用終了する予定である。」と発表された[22]。また2011年、インターネットアーカイブは6組のPetaBoxラックを導入したことで、Wayback Machineのストレージ容量は700テラバイト増加した[23]

2013年1月、URLが2,400億に達したと発表した[24]。同年10月、ユーザーがURLを入力するだけでウェブサイトをアーカイブできる「Save a Page」機能を発表したが[25]、この機能は悪意あるバイナリをダウンロードさせる手口に悪用される脅威となった[26][27]

2014年12月時点で、Wayback Machineはウェブページが4,350億に及びデータ容量が約9ペタバイトとなり、週で20テラバイト増える割合になった[28][11][29]

2016年7月、データ容量が約15ペタバイトに達したと発表した[30]

2018年9月、データ容量が25ペタバイト以上に達した[31][32]

成長編集

2013年10月から2015年3月の間、アレクサの全世界ランクは163[33]から208[34]に推移している。

Wayback Machineの成長 [35][36]
Wayback Machineの年別 アーカイブページ数 (10億)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

ウェブサイト除外規定編集

歴史的に、Wayback MachineはRobots Exclusion Standard (robots.txt)の設定でウェブサイトをクロールできるかできないか、既にクロールされているか、そのウェブサイトのアーカイブが一般向けに閲覧できるかを判断している。ウェブサイト管理者は任意でrobots.txtを使ってWayback Machineをオプトアウトするか設定できる。robots.txtの設定を遡及的に適用していて、もしインターネットアーカイブをブロックしている場合、そのドメインから過去にアーカイブされたページも直ちに利用できなくなる。加えて、インターネットアーカイブは「時々ウェブサイト管理者が、我々に直接連絡したり、サイトのクロールやアーカイブを止めるように求めることがあり、この要求に我々は従っている。」と声明している[37]。さらに、「インターネットアーカイブは自身の資料をコレクションに追加することを望まない人のウェブサイトやその他インターネットドキュメントを保存したり提供することは考えていない。」とも述べている[38][39]

Oakland Archiveの規定編集

Waybackの遡及的除外規定は2002年にカリフォルニア大学バークレー校の情報管理学部が出した、ウェブサイト管理者がサイトのアーカイブへのアクセスを阻止する権利について書かれている「Recommendations for Managing Removal Requests and Preserving Archival Integrity」の一部に基づいている[40]。Waybackは高額訴訟を避けるためにこの規定を遵守している[41]

しかし、2017年にWaybackの遡及的除外規定が緩和され、アメリカ合衆国の政府や軍のウェブサイト両方のrobots.txtの設定に従わずクロールを行いウェブページを閲覧できるようにした。2017年4月時点で、robots.txtの無視は拡大し米国政府のウェブサイトに留まらなくなっている[42][43][44][45]

利用編集

一般向けに利用開始された2001年以降、Wayback Machineによるデータの収集と保存方法やアーカイブにある現行のページに関して学者によって研究されている。2013年時点で、Wayback Machineに関する論文は約350件ありほとんどは情報技術、図書館科学、社会科学の分野で著されている。社会科学学者は1990年代から現在までの間のウェブサイト開発が企業の成長に与えた影響を分析するためにWayback Machineを活用している[11]

Wayback Machineがページをアーカイブした時、通常ほとんどのハイパーリンクが収集されておりネットの不安定性さが原因で壊れている可能性があってもそれらのリンクは保持される。インドの研究者はオンライン学術出版のハイパーリンクを保存するためのWayback Machineの能力の有効性を研究していて、実際保存されていたのはほぼ半分という結果を得た[46]

ジャーナリストも削除されたウェブサイトや日にちの経った報道記事を閲覧したりウェブサイトコンテンツに変えるためにWayback Machineを使用している。得られたコンテンツは政治家に説明責任を求め、論争の場での嘘を暴くことに活用されている[47]。2014年、ウクライナからの分離独立を目指す組織のトップであるイゴール・ストレルコフ英語版は自身のソーシャルメディアページでの投稿で、実際は民間のマレーシア航空機だったことが判明する前にウクライナ軍機と疑われる軍用機を自軍が撃墜したことを自慢していたものの、後にその投稿を削除しウクライナ軍が撃墜したと非難したがその削除した投稿がアーカイブに残っていた[47][48]。2017年、ホワイトハウスのウェブサイトから気候変動に関する全ての参照文献が削除されたことがArchive.orgの閲覧を通して発覚しこれがredditで議論になったことが科学のための行進英語版の原因となった。「科学者はワシントンでデモを起こす必要がある。」というユーザーのレスポンスがあった[49][50][51]

制限編集

Wayback Machineは多機能であるがいくつかの制限も存在する。2014年、ウェブサイトがクロールされてWayback Machineで閲覧できるようになるまで6ヶ月ものタイムラグがあった[52]。2018年時点ではタイムラグは3時間から10時間である[53]。Wayback Machineは「歴史的なGoogle」ではなくユーザーがウェブサイトを閲覧するためにはURLを把握する必要がある[54]

またWayback Machineはウェブクローラーの制限により常に作成されたウェブページが全て収録されるわけではない上、FlashプラットフォームやJavaScriptで書かれたフォームといったインタラクティブ機能はホストウェブサイトとの対話が必要なため完全にアーカイブできない。ウェブクローラーはHTML(またその派生の一種)でコードされていないものを取り出すのが困難なため結果的にハイパーリンクが壊れたり画像が失われることも多い。さらに、ウェブクローラーは他のどのサイトからもリンクされていない「孤立ページ」をアーカイブすることもできない[55][54]。Wayback Machineの運用を定めた特定の規則によって設定されているハイパーリンクの深さ制限により全てのページの全ハイパーリンクをアーカイブすることもできない[15]

一部の管理者は自身のウェブサイトにrobot.txtというファイルを置くことでWayback Machineが発見しアーカイブすることを防いでいる。さらに、ウェブサイト管理者はインターネットアーカイブに直接問い合わせたりアーカイブからのページの削除を求めることもできる[55]

法的根拠編集

民事訴訟編集

Netbula LLC v. Chordiant Software Inc.編集

2009年の訴訟である「Netbula, LLC v. Chordiant Software Inc.」では被告のChordiantはNetbulaにWayback Machineが遡ってNetbulaのサイトのアーカイブページの過去版へのアクセスを不能にしているとしてウェブサイトに置かれたrobots.txtの強制的な撤去を求めた。そのページにはChordiantがこの訴訟で有利になる材料があると考えていた[56]

Netbulaは自社のウェブサイトを改ざんしようとしているとして申立に反対し、インターネットアーカイブを直接呼び出さなければならないと主張した[57]。インターネットアーカイブの職員はChordiantの申立を支持する意見書を提出したが、「著しい負担や費用、業務の中断無し」に他の手段でウェブページを作成することはできないとも述べている[56]

カリフォルニア州北地区サンノゼ管区のハワード・ロイド判事はNetbulaの申立は退けたものの、ChordiantにNetbulaが求めるアーカイブページにアクセスできるように一時的にrobots.txtの無効化を求めた[56]

ポーランド・テレビ編集

2004年10月の訴訟である、「Telewizja Polska USA, Inc. v. Echostar Satellite」, No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004)は、訴訟の当事者がWayback Machineのアーカイブを有効な証拠の典拠とした初めての裁判とされている。Telewizja PolskaはTVPポロニア英語版のプロバイダでエコースター英語版ディッシュ・ネットワークを運営している。裁判の手続きの前に、エコースターはTelewizja Polskaウェブサイトの過去のコンテンツの証拠になるWayback Machineのスナップショットを提出しようとしたが、Telewizja Polskaは伝聞証拠禁止の原則や認証されていない典拠であることを理由にスナップショットを採用しないように予備的申し立て英語版を行ったが、アランダー・キーズ判事はTelewizja Polskaによる伝聞証拠禁止の原則の主張を退け、TVPの裁判での証拠としての除外を求める予備的申し立てを認めなかった[58][59]

特許法編集

いくつかの追加要件(例として記録保管者の正式な声明を提供)が満たされていることを条件に、米国特許商標庁欧州特許庁は提供されたウェブページが公にアクセスできていたことを示す証拠となるインターネットアーカイブからのデータ印を承認している。これらの日付は例として特許出願審査で、ウェブページが先行技術英語版として利用可能かどうかを決定するのに活用される[60]

実用性の制限編集

ウェブサイトのアーカイブには技術的制限があり、その結果として、訴訟相手がウェブサイトのアーカイブによってもたらされた結果を悪用することがある。この問題は基礎となるリンクが公開されていない故にエラーを含んでいる可能性がある場合において、ウェブページのスクリーンショットが問題、回答や専門家の証人の報告として提出してしまうことで悪化することもある。例として、Wayback Machineなどのアーカイブはフォームに書き込みしないゆえに、アーカイブにおいて非RESTful英語版電子商取引データベースは含まれない[61]

法的地位編集

欧州では、Wayback Machineは著作権法に違反する可能性があると言われている。コンテンツの公開や複製を決めることができるのはそのコンテンツの作成者のみであり、インターネットアーカイブは作成者から削除要求が来たら削除しなければならないとされる[62]。Wayback Machineの除外規定は公式サイトのFAQページに書かれている[63]

アーカイブされたコンテンツの法的問題編集

Wayback Machineのアーカイブ活動に関してインターネットアーカイブに対する訴訟が数多く起こされている。

サイエントロジー編集

2002年後半、インターネットアーカイブはWayback Machineから新興宗教 サイエントロジーを批判する複数のサイトを削除した[64]。この時サイト所有者の要求により削除した旨のエラーメッセージが表示されたが[65]、その後実際に削除を要求したのはサイエントロジー教会 (enの弁護士でありサイト所有者は削除を望んでいなかったことが明らかになった[66]

Healthcare Advocates, Inc.編集

2003年、Harding Earley Follmer & FraileyはWayback Machineを活用して商標問題からクライアントを弁護した。弁護士は数年前のウェブサイトの内容によって原告の主張は無効であることを論証することに成功した。原告のHealthcare Advocatesはデジタルミレニアム著作権法コンピュータ犯罪取締法英語版違反を含む著作権侵害を糾弾するために申し立ての相手にインターネットアーカイブを含む修正を申告した。また、Healthcare Advocatesは自身のウェブサイトにrobots.txtを導入して以降、最初の訴訟が提起された後もインターネットアーカイブはWayback Machineから自身のウェブサイトの過去のコピーを全て削除するべきなのに一部は未だに閲覧可能であると主張した[67]。この訴訟は法廷外で解決していて、その後Wayback Machineで問題が修正された[68]

スザンヌ・シェル編集

活動家のスザンヌ・シェル英語版は2005年12月、1999年から2004年まで自身のウェブサイトの profane-justice.org をアーカイブしていたとして10万ドルの賠償を求めインターネットアーカイブを提訴した[69][70]。インターネットアーカイブは2006年1月20日、カリフォルニア北部地区連邦地方裁判所英語版にシェルの著作権を侵害していないという判決を求める確認訴訟英語版を起こした。これに対してシェルは自身の利用規約英語版に違反していると主張する形でインターネットアーカイブを反訴した[71]。2007年2月13日、コロラド州連邦地方裁判所英語版裁判官は契約違反を除き全ての反訴を退けた[70]。インターネットアーカイブはコピー行為により著作権侵害が生じたというシェルの主張を退けることは望まなかった[72]

2007年4月25日、インターネットアーカイブとスザンヌ・シェルは共同で和解を発表した[69]。インターネットアーカイブは「…自身のウェブコンテンツをアーカイブされたくない人の資料をWayback Machineに入れようとは考えていない。我々はシェル氏が自身のウェブサイトに関する有効かつ法的効力のある著作権を有することを認識しており、Wayback Machineに彼女のウェブサイトのコンテンツを収集したことによって訴訟になってしまったことを遺憾に思う。」と、シェルは「私はインターネットアーカイブの目標の歴史的価値に敬意を表しており、その目標を阻害したり損害を与えるつもりはなかった。」と述べた[73]

検閲とその他の問題編集

Archive.orgは現在中国でブロックされている[74][75]。暗号化されたHTTPSプロトコルに対応した後、2015年にインターネットアーカイブはロシア全域でブロックされた英語版[76][77][47]

Library Freedom Projectのアリソン・マクリーナ長官は「図書館員は個人のプライバシーは重視しているものの、検閲には強く反対している。」と述べている[47]

他の脅威には自然災害[78]、アーカイブ内容の変更(サイバー攻撃バックアップ)、欠陥のある著作権法[79]、サイトのユーザーに対する監視がある[80]

ケヴィン・ヴォーンは「我々の技術的文明に継続性がある場合」に「何も手を加えられていないデータの多くが検索可能」なら「何もない」世代の長期利用において有効な方法で生き残れると考えるとしている[81]

インターネットアーカイブには、長期的なインフラストラクチャが無くてもデータが消失する前に熱心にキャプチャーするために[82]長期間構築し続けていると記述されているとされる[83]

関連項目編集

脚注編集

  1. ^ Archive.org Traffic, Demographics and Competitors - Alexa”. www.alexa.com. 2019年2月4日閲覧。
  2. ^ WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools”. WHOIS. 2016年3月13日閲覧。
  3. ^ InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools”. WHOIS. 2016年3月13日閲覧。
  4. ^ Notess, Greg R. (March–April 2002). “The Wayback Machine: The Web's Archive”. Online 26: 59–61. 
  5. ^ “The Wayback Machine”, Frequently Asked Questions, https://archive.org/about/faqs.php#The_Wayback_Machine 2018年9月18日閲覧。 
  6. ^ a b 20,000 Hard Drives on a Mission | Internet Archive Blogs” (英語). blog.archive.org. 2018年10月15日閲覧。
  7. ^ Green, Heather (2002年2月28日). “A Library as Big as the World”. BusinessWeek. http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm 
  8. ^ Tong, Judy (2002年9月8日). “Responsible Party – Brewster Kahle; A Library Of the Web, On the Web”. New York Times. オリジナルの2011年2月20日時点によるアーカイブ。. https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html 2011年8月15日閲覧。 
  9. ^ Cook, John (2001年11月1日). “Web site takes you way back in Internet history”. Seattle Post-Intelligencer. オリジナルの2014年8月12日時点によるアーカイブ。. https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php 2011年8月15日閲覧。 
  10. ^ “Wayback Goes Way Back on Web”. Wired. (October 28, 2001). オリジナルのOctober 16, 2017時点によるアーカイブ。. https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ 2017年10月16日閲覧。. 
  11. ^ a b c Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (May 5, 2015). “Using the wayback machine to mine websites in the social sciences: A methodological resource” (英語). Journal of the Association for Information Science and Technology 67 (8): 1904–1915. doi:10.1002/asi.23503. ISSN 2330-1635. 
  12. ^ a b c d e f g Kalev Leetaru (2016年1月28日). “The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web”. Forbes. 2017年10月16日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
  13. ^ Kahle, Brewster. “Archiving the Internet”. Scientific American – March 1997 Issue. 2012年4月3日時点のオリジナルよりアーカイブ。2011年8月19日閲覧。
  14. ^ Jeff Kaplan (2014年10月27日). “Archive-It: Crawling the Web Together”. Internet Archive Blogs. 2017年10月12日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
  15. ^ a b Worldwide Web Crawls”. Internet Archive. 2017年10月19日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
  16. ^ Wide Crawl Number 13”. Internet Archive. 2017年10月19日時点のオリジナルよりアーカイブ。2017年10月16日閲覧。
  17. ^ Internet Archive: Petabox” (英語). archive.org. 2018年10月25日閲覧。
  18. ^ Kanellos, Michael (2005年7月29日). “Big storage on the cheap”. CNET News.com. オリジナルの2007年4月3日時点によるアーカイブ。. https://web.archive.org/web/20070403030705/http://news.zdnet.com/2100-9584_22-5808754.html 2007年7月29日閲覧。 
  19. ^ Internet Archive and Sun Microsystems Create Living History of the Internet”. サン・マイクロシステムズ (2009年3月25日). 2009年3月26日時点のオリジナルよりアーカイブ。2009年3月27日閲覧。
  20. ^ Mearian, Lucas (2009年3月19日). “Internet Archive to unveil massive Wayback Machine data center”. Computerworld.com. http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top 2009年3月22日閲覧。 
  21. ^ Updated Wayback Machine in Beta Testing”. Archive.org. 2011年8月23日時点のオリジナルよりアーカイブ。2011年8月19日閲覧。
  22. ^ Beta Wayback Machine, in forum”. Archive.org. 2014年4月17日時点のオリジナルよりアーカイブ。2014年4月16日閲覧。
  23. ^ Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used” (英語). archive.org. 2018年10月25日閲覧。
  24. ^ Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs”. Blog.archive.org (2013年1月9日). 2014年4月14日時点のオリジナルよりアーカイブ。2014年4月16日閲覧。
  25. ^ Rossi, Alexis (2013年10月25日). “Fixing Broken Links on the Internet”. archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. 2015年3月25日閲覧。 “We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.”
  26. ^ The VirusTotal Team (2015年3月25日). “207.241.226.190 IP address information”. virustotal.com. Dublin 2, Ireland: VirusTotal. 2015年3月25日閲覧。 “2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe”
  27. ^ Advisory provided by Google (2015年3月25日). “Safe Browsing Diagnostic page for archive.org”. google.com/safebrowsing. Mountain View, CA, US: Google. 2015年4月6日時点のオリジナルよりアーカイブ。2015年3月25日閲覧。 “2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).”
  28. ^ Internet Archive Frequently Asked Questions”. 2009年10月21日時点のオリジナルよりアーカイブ。2015年1月17日閲覧。
  29. ^ Internet Archive Frequently Asked Questions” (2014年12月18日). 2018年12月13日閲覧。
  30. ^ Can the manipulation of big data change the way the world thinks?”. The National. 2017年1月12日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  31. ^ Crockett, Zachary (2018年9月28日). “Inside Wayback Machine, the internet’s time capsule” (英語). The Hustle. https://thehustle.co/inside-wayback-machine-internet-archive 2018年10月26日閲覧。 
  32. ^ Heffernan, Virginia (2018年9月18日). “Things Break and Decay on the Internet—That's a Good Thing” (英語). WIRED. https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/ 2018年10月26日閲覧。 
  33. ^ Archive.org Site Info”. Alexa Internet. 2013年10月29日閲覧。
  34. ^ Archive.org Site Overview”. Alexa Internet. 2015年4月9日閲覧。
  35. ^ michelle (2014年5月9日). “Wayback Machine Hits 400,000,000,000!”. Internet Archive. 2015年3月25日閲覧。
  36. ^ Internet Archive Wayback Machine”. Internet Archive. 2015年3月25日閲覧。
  37. ^ Some sites are not available because of Robots.txt or other exclusions Archived April 15, 2011, at the Wayback Machine.
  38. ^ How can I remove my site's pages from the Wayback Machine? Archived April 17, 2014, at the Wayback Machine.
  39. ^ Cox, Joseph (2018年5月22日). “The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers”. https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy 2018年5月23日閲覧。 
  40. ^ Recommendations for Managing Removal Requests And Preserving Archival Integrity”. University of California (2002年12月14日). 2017年9月18日時点のオリジナルよりアーカイブ。2017年9月14日閲覧。
  41. ^ Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy”. Internet Archive (2014年7月7日). 2017年10月10日時点のオリジナルよりアーカイブ。2017年9月14日閲覧。
  42. ^ Mark Graham (2017年4月17日). “Robots.txt meant for search engines don't work well for web archives”. Internet Archive Blogs. 2017年4月17日時点のオリジナルよりアーカイブ。2017年4月16日閲覧。
  43. ^ Archivierung des Internets: Internet Archive ignoriert künftig robots.txt” (ドイツ語). heise online. 2017年4月27日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  44. ^ Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de” (ドイツ語). 2017年6月19日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  45. ^ Internet Archive will ignore robots.txt files to keep historical record accurate”. Digital Trends (2017年4月24日). 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  46. ^ Sampath Kumar, B.T.; Prithviraj, K.R. (October 21, 2014). “Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs” (英語). Journal of Information Science 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. 
  47. ^ a b c d Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed”. 2017年1月6日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  48. ^ What the Web Said Yesterday”. The New Yorker. 2015年1月25日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  49. ^ The March for Science began with this person's 'throwaway line' on Reddit”. Washington Post. 2017年4月23日時点のオリジナルよりアーカイブ。2017年4月23日閲覧。
  50. ^ Are scientists going to march on Washington?”. The Washington Post. 2017年1月31日時点のオリジナルよりアーカイブ。2017年1月31日閲覧。
  51. ^ The global March for Science started with a single Reddit thread”. Quartz. 2017年4月24日時点のオリジナルよりアーカイブ。2017年4月23日閲覧。
  52. ^ Internet Archive Frequently Asked Questions”. Internet Archive (2014年4月2日). 2018年11月23日閲覧。
  53. ^ Internet Archive Frequently Asked Questions” (英語). archive.org. 2018年11月23日閲覧。
  54. ^ a b Bates, Mary Ellen (2002). “The Wayback Machine”. Online 26: 80. 
  55. ^ a b Internet Archive Frequently Asked Questions” (英語). archive.org. 2018年10月18日閲覧。
  56. ^ a b c Lloyd, Howard (2009年10月). “Order to Disable Robots.txt (PDF)”. 2009年10月15日閲覧。
  57. ^ Cortes, Antonio (2009年10月). “Motion Opposing Removal of Robots.txt”. 2010年10月27日時点のオリジナルよりアーカイブ。2009年10月15日閲覧。
  58. ^ Gelman, Lauren (November 17, 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets. 2 (3). Archived from the original on April 30, 2011. Retrieved January 4, 2007.
  59. ^ Howell, Beryl A. (February 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 3–9. Archived from the original (PDF) on July 5, 2010. Retrieved August 6, 2008.
  60. ^ Wynn W. Coggins (Fall 2002). "Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?". USPTO. Archived from the original on September 21, 2012.
  61. ^ "Debunking the Wayback Machine". Archived from the original on June 29, 2010.
  62. ^ Bahr, Martin (2002). "The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (in German). doi:10.7328/jurpcb/20021719. Archived from the original on August 23, 2009.
  63. ^ Internet Archive FAQ”. Archive.org. 2014年4月17日時点のオリジナルよりアーカイブ。2014年4月16日閲覧。
  64. ^ Bowman, Lisa M (2002年9月24日). “Net archive silences Scientology critic”. CNET News.com. オリジナルの2012年5月15日時点によるアーカイブ。. https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html 2007年1月4日閲覧。 
  65. ^ Jeff (2002年9月23日). “exclusions from the Wayback Machine (Blog)”. Wayback Machine Forum. Internet Archive. 2007年2月11日時点のオリジナルよりアーカイブ。2007年1月4日閲覧。 Author and Date indicate initiation of forum thread.
  66. ^ Miller, Ernest. “Sherman, Set the Wayback Machine for Scientology (Blog)”. LawMeme. Yale Law School. 2007年1月4日閲覧。
  67. ^ Dye, Jessica (2005). “Website Sued for Controversial Trip into Internet Past”. EContent. 28 (11): 8–9. 
  68. ^ Bangeman, Eric (August 31, 2006). “Internet Archive Settles Suit Over Wayback Machine”. Ars technica. オリジナルのNovember 5, 2007時点によるアーカイブ。. https://arstechnica.com/news.ars/post/20060831-7634.html 2007年11月29日閲覧。. 
  69. ^ a b Internet Archive v. Shell, 505 F.Supp.2d 755 at justia.com, 1:2006cv01726 (Colorado District Court August 31, 2006) (“'April 25, 2007 Settlement agreement announced.' Filing 65, 2007-04-30: '...therefore ORDERED that this matter shall be DISMISSED WITH PREJUDICE...'”).
  70. ^ a b Babcock, Lewis T., Chief Judge (2007年2月13日). “Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS (PDF)”. 2015年3月25日閲覧。 “1) Internet Archive's motion to dismiss Shell's counterclaim for conversion and civil theft (Second Cause of Action) is GRANTED, 2) Internet Archive's motion to dismiss Shell's counterclaim for breach of contract (Third Cause of Action) is DENIED; 3) Internet Archive's motion to dismiss Shell's counterclaim for Racketeering under RICO and COCCA (Fourth Cause of Action) is GRANTED.”
  71. ^ Claburn, Thomas (2007年3月16日). “Colorado Woman Sues To Hold Web Crawlers To Contracts”. New York, NY, US: InformationWeek, UBM Tech, UBM LLC. http://www.informationweek.com/colorado-woman-sues-to-hold-web-crawlers-to-contracts/d/d-id/1053075 2015年3月25日閲覧. "Computers can enter into contracts on behalf of people. The Uniform Electronic Transactions Act (UETA) says that a 'contract may be formed by the interaction of electronic agents of the parties, even if no individual was aware of or reviewed the electronic agents' actions or the resulting terms and agreements.'" 
  72. ^ Samson, Martin H., Phillips Nizer LLP (2007年). “Internet Archive v. Suzanne Shell”. internetlibrary.com. Internet Library of Law and Court Decisions. 2015年3月25日閲覧。 “More importantly, held the court, Internet Archive's mere copying of Shell's site, and display thereof in its database, did not constitute the requisite exercise of dominion and control over defendant's property. Importantly, noted the court, the defendant at all times owned and operated her own site. Said the Court: 'Shell has failed to allege facts showing that Internet Archive exercised dominion or control over her website, since Shell's complaint states explicitly that she continued to own and operate the website while it was archived on the Wayback machine. Shell identifies no authority supporting the notion that copying documents is by itself enough of a deprivation of use to support conversion. Conversely, numerous circuits have determined that it is not.'”
  73. ^ brewster (2007年4月25日). “Internet Archive and Suzanne Shell Settle Lawsuit”. archive.org. Denver, CO, USA: Internet Archive. 2015年3月25日閲覧。 “Both parties sincerely regret any turmoil that the lawsuit may have caused for the other. Neither Internet Archive nor Ms Shell condones any conduct which may have caused harm to either party arising out of the public attention to this lawsuit. The parties have not engaged in such conduct and request that the public response to the amicable resolution of this litigation be consistent with their wishes that no further harm or turmoil be caused to either party.”
  74. ^ Backing up the history of the internet in Canada to save it from Trump”. TechCrunch. 2016年12月27日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  75. ^ Where to find what's disappeared online, and a whole lot more: the Internet Archive”. Public Radio International. 2017年3月28日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  76. ^ There's no Wayback in Russia: Putin blocks Archive.org”. 2016年10月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  77. ^ Russia won’t go Wayback, blocks the Internet Archive”. Digital Trends (2015年6月26日). 2016年4月17日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  78. ^ Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs”. 2017年5月21日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  79. ^ Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"”. Consumerist (2016年6月7日). 2016年11月11日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  80. ^ Die Trump-Angst grassiert” (ドイツ語). heise online. 2016年12月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  81. ^ The Internet's Dark Ages”. The Atlantic. 2017年5月7日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  82. ^ The Human Fear of Total Knowledge”. The Atlantic. 2016年12月2日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。
  83. ^ The Entire Internet Will Be Archived In Canada to Protect It From Trump” (英語). Motherboard. 2017年5月16日時点のオリジナルよりアーカイブ。2017年5月14日閲覧。

外部リンク編集