Wayback Machine

Wayback Machine
Выява лагатыпа
Стартавая старонка партала
Стартавая старонка партала
URL web.archive.org/
Тып сайта вэб-архіў
Мова(-ы) англійская
Мова праграмавання Java, Python
Уладальнік Архіў Інтэрнэту
Пачатак працы 24 кастрычніка 2001
Рэйтынг Alexa 173
Лагатып Вікісховішча Медыяфайлы на Вікісховішчы

Wayback Machine (з англ. — «Машына часу») — бясплатны анлайн-архіў некамерцыйнай бібліятэкі «Архіў Інтэрнэту». З дапамогай пошукавых робатаў «Wayback Machine» архівуе і робіць агульнадаступнай большую частку «адкрытага» інтэрнэту.

Сэрвіс быў запушчаны ў 1996 годзе, аднак стаў даступны для грамадскасці толькі ў 2001 годзе.

За першыя 20 гадоў існавання Wayback Machine каталагізаваў і захаваў калекцыю з больш як 286 млрд вэб-старонак. Архіўныя здымкі адлюстроўваюцца ў фармаце HTML, JavaScript і CSS. Дзякуючы захаваным у Wayback Machine дакументам карыстальнікі могуць адсочваць змены, якія адбываюцца на сайтах, і параўноўваць розныя версіі правак. Станам на студзень 2023 года Wayback Machine дае доступ да больш як 767 мільярдаў захаваных вэб-старонак.

Стварэнне

Серверы «Архіва Інтэрнэту», 2008 год
Брустэр Кейл у 2009 годзе

У 1989 годзе англійскі навуковец Цім Бернерс-Лі стварыў сусветнае павуцінне — сістэму, якая дазваляе перадаваць даныя праз падключаныя да інтэрнэту камп’ютары. Аднак з распаўсюджваннем сусветнага павуціння былі выяўлены дзве асноўныя праблемы. Першая складалася ў недахопе месца для захоўвання ўсіх даных, праз што многія дакументы і вэб-старонкі выдаляліся. Іншая праблема складалася ў тым, што пасля рэдагавання вэб-старонкі (напрыклад, з юрыдычных прычын) карыстальнікі не маглі паглядзець яе першапачатковую версію. Вырашыць гэтыя недахопы імкнулася амерыканская лічбавая бібліятэка «Архіў Інтэрнэту» — некамерцыйная арганізацыя, створаная праграмістамі Брустэрам Кейлам і Брусам Галіятам у 1996 годзе. Пры супрацоўніцтве з Alexa Internet (даччынай кампаніяй Amazon, якая займаецца вэб-індэксаваннем). «Архіў» ініцыяваў стварэнне і захоўванне копій існых сайтаў для развіцця «ўніверсальнага доступу да ведаў». Арганізацыя давала бясплатны публічны доступ да алічбаваных матэрыялаў, такіх як вэб-старонкі, кнігі, аўдыёзапісы, уключаючы жывыя канцэрты, відэа, выявы і праграмнае забеспячэнне. На 2021 год штаб-кватэра «Архіва Інтэрнэту» знаходзіцца ў Сан-Францыска, у будынку былой хрысціянскай царквы, размешчанай у раёне Рычманд. Журналіст мясцовай радыёстанцыі Kawl у 2019 годзе параўноўваў офіс «Архіва» з рымскім храмам. Арганізацыя ставіць сабе за мэту выратаваць інтэрнэт ад знікнення.

«Wayback Machine» стаў самым вядомым праектам «Архіва». Анлайн-сэрвіс быў названы ў гонар машыны часу з мультсерыяла 1960-х гадоў «Шоу Рокі і Булвінкля». Ён дае доступ да лічбавай калекцыі з больш як 550 млрд вэб-старонак. Праект Wayback Machine быў задуманы як рашэнне праблемы памылкі 404, якая азначае, што сервер не можа знайсці даныя па запытаным адрасе. Гэта звязана з так званым выміраннем спасылак — нарастаючай недаступнасцю некалі апублікаваных даных. Так, у 1997 годзе сярэдняя працягласць жыцця вэб-старонкі складала 44 дня. У 2003 годзе гэты паказчык склаў 100 дзён.

Праведзены ў 2008 годзе аналіз спасылак на 2700 лічбавых рэсурсах, большасць з якіх не мае друкаваных аналагаў, паказаў, што каля 8 працэнтаў спасылак пераставалі працаваць праз год. Да 2011 года, то бок праз тры гады, 30 працэнтаў спасылак у калекцыі былі непрацуючымі. Дзякуючы інтэграцыі з Alexa, карыстальнік, які сутыкнуўся з паведамленнем пра памылку, мог атрымаць доступ да заархіваванай версіі старонкі праз укаранёную ў браўзер панэль інструментаў. Калі копія недаступнай старонкі прысутнічала ў базе даных Wayback Machine, то загаралася спецыяльная кнопка. Пры гэтым карыстальнікі маглі даць браўзеру дазвол на прагляд і рэгістрацыю актыўнасці — у такім разе ўсе сайты, што карыстальнік наведаў, архіваваліся на партале.

Wayback Machine быў запушчаны ў маі 1996 года, аднак стаў даступным для грамадскасці толькі ў 2001 г. — да гэтага ўся запісаная на лічбавых магнітных стужках інфармацыя была адкрыта толькі для абмежаванай колькасці навукоўцаў і даследчыкаў. Да моманту «адкрыцця» архіў утрымліваў звыш 10 млрд заархіваваных старонак. Да снежня 2014 года кіраўніцтва Wayback Machine паведаміла, што захавала 435 млрд вэб-старонак па ўсім свеце. З тэхнічнага пункта гледжання праграмнае забеспячэнне Wayback Machine не з’яўляецца архівам, а хутчэй агульнадаступным інтэрфейсам да абмежаванага падмноства ўсіх сховішчаў. Так, Wayback Machine нельга лічыць пошукавай сістэмай калекцыі арганізацыі, бо яна не ажыццяўляе пошук па базе даных іншай буйной віртуальнай бібліятэкі — Open Library, якая дазваляе карыстальнікам бясплатна атрымліваць доступ да лічбавых копій кніг, якія загружаюцца і архівуюцца ў рамках праекта.

Характарыстыка

З запускам «Wayback Machine» «Архіў Інтэрнэту» стаў адным з самых папулярных і вядомых анлайн-парталаў і галоўным сэрвісам вэб-архівавання.

У 1999 годзе «Архіў» пачаў пашыраць калекцыю за межы архіўнага вэб-кантэнту, каб забяспечыць доступ як да алічбаваных, так і першапачаткова лічбавых рэсурсаў, у тым ліку кніг, аўдыя, фільмаў, відарысаў, дакументаў, праграмнага забеспячэння і відэагульняў. Некаторыя сканіраванні выконваюцца пошукавымі робатамі самога архіва, а іншыя — партнёрскімі арганізацыямі. Асобныя базы даных могуць набывацца за кошт ахвяраванняў карыстальнікаў і мэтавых набыццяў. Самі стваральнікі арганізацыі параўноўвалі сваю калекцыю з Александрыйскай бібліятэкай.

На 2021 год Wayback Machine змяшчаў звыш 424 млрд вэб-старонак — больш, чым дакументаў у Бібліятэцы Кангрэса.

Зноскі

  1. Overview (англ.). alexa.com. Архівавана з першакрыніцы 18 мая 2020. Праверана 8 снежня 2021.
  2. а б Arora 2015.
  3. Lerner 2017, pp. 1741–1755.
  4. а б в г Michael Bryant. What is the Wayback Machine and Why is it Useful? (англ.). Groovy Post (22 красавіка 2021). Архівавана з першакрыніцы 18 мая 2021. Праверана 29 мая 2021.
  5. Wayback Machine (англ.). Wayback Machine. Праверана 7 чэрвеня 2021.
  6. Dominic Cummings: how the internet knows when you’ve updated your blog (англ.). The Conversation (28 мая 2020). Архівавана з першакрыніцы 25 ліпеня 2021. Праверана 3 чэрвеня 2021.
  7. а б в г Odgen 2017.
  8. In An Old Church, The Internet Archive Stores Our Digital History (англ.). Kalw. San Francisco local public radio (11 верасня 2019). Архівавана з першакрыніцы 6 мая 2021. Праверана 3 чэрвеня 2021.
  9. а б Price 2011.
  10. Jack Schofield. The Time Machine (англ.). The Guardian (19 лістапада 2007). Архівавана з першакрыніцы 19 красавіка 2021. Праверана 1 чэрвеня 2021.
  11. Jenni McKinnon. Using the Wayback Machine to Archive (and Backup) WordPress (англ.). WPMudev (25 мая 2017). Архівавана з першакрыніцы 13 красавіка 2021. Праверана 29 мая 2021.
  12. Adrienne LaFrance. Raiders of the Lost Web (англ.). The Atlantic (14 кастрычніка 2015). Архівавана з першакрыніцы 7 мая 2017. Праверана 7 чэрвеня 2021.
  13. Rogers 2017, pp. 160–172.
  14. Hartelius 2020, p. 378.
  15. а б Bowyer 2021, pp. 43–57.
  16. Aja Romano. A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard (англ.). Vox (23 студзеня 2020). Архівавана з першакрыніцы 18 жніўня 2021. Праверана 29 мая 2021.
  17. а б в Kalev Leetaru. The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web (англ.). Forbes (18 студзеня 2016). Архівавана з першакрыніцы 15 жніўня 2021. Праверана 5 чэрвеня 2021.
  18. O'Connor 2008, p. 64.

Літаратура

  • Acker, A., & Chaiet, M. The weaponization of web archives: Data craft and COVID-19 publics.(англ.) // Harvard Kennedy School (HKS) Misinformation Review. — 2020. — DOI:10.37016/mr-2020-41
  • Anat Ben-David, Adam Amram The Internet Archive and the socio-technical construction of historical facts(англ.) // Internet Histories. — 2018. — DOI:10.1080/24701475.2018.1455412
  • Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource(англ.). — 2015. — В. 8. — Т. 67. — С. 1904—1915. — DOI:10.1002/asi.23503
  • Bowyer S. The Wayback Machine: notes on a re-enchantment(англ.) // Archival Science. — 2021. — Т. 21. — С. 43—57.
  • Deborah R. Eltgroth Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence(англ.) // Fordham L. Rev.. — 2009. — В. 181. — Т. 78.
  • Greg R. Notess The Wayback Machine: The Web's Archive(англ.) // Online. — 2002. — В. 2. — Т. 26.
  • Hartelius J. The anxious flaneur: Digital archiving and the Wayback Machine(англ.) // Quarterly Journal of Speech. — 2020. — В. 4. — Т. 106. — С. 377—398.
  • James L. Quarles III and Richard A. Crudo Back to the Future: Using the Wayback Machine in Patent Litigation(англ.) // Landslide. — 2014. — В. 3. — Т. 6.
  • Lerner A., Kohno T., Roesner F. Rewriting History: Changing the Archived Web from the Present(англ.) // Association for Computing Machinery. — 2017. — DOI:10.1145/3133956.3134042
  • Maemura E., Worby N., Milligan I., Becker C. If These Crawls Could Talk: Studying and Documenting Web Archives Provenance(англ.) // Journal of the association for information science and technology. — 2018. — В. 10. — Т. 69. — С. 1223—1233.
  • Milligan I. Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives(англ.) // International Journal of Humanities and Arts Computing. — 2016.
  • Murphy J., Hashim N., O’Connor P. Take Me Back: Validating the Wayback Machine(англ.) // Journal of Computer-Mediated Communication. — 2008. — В. 13. — С. 60—75.
  • Odgen J., Halford S., Carr L. Observing Web Archives(англ.) // WebSci. — 2017. — С. 299—308.
  • Pearce D., Charlton B. Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org)(англ.) // Medical Hypothesis. — 2009. — С. 875.
  • Price Internet Archiving — The Wayback machine(англ.) // MLA Commons. — 2011.
  • Phyllis Holman Weisbard Oldies but Goodies: Archiving WebBased Information(англ.) // Feminist Collections. — 2011. — В. 2. — Т. 32.
  • Rogers R. Doing Web history with the Internet Archive: screencast documentaries(англ.) // Internet Histories. — 2017. — В. 1—2. — Т. 1. — С. 160—172. — DOI:10.1080/24701475.2017.1307542