Wayback Machine

Wayback Machine () — бесплатный онлайн-архив некоммерческой библиотеки «Архив Интернета». С помощью поисковых роботов Wayback Machine архивирует и делает общедоступной бо́льшую часть «открытого» интернетаЗа первые 20 лет существования Wayback Machine каталогизировал и сохранил коллекцию из более чем 286 млрд веб-страниц..
Сервис был запущен в 1996 году, однако стал доступен для общественности только в 2001 году. Архивные снимки отображаются в формате HTML, JavaScript и CSS. Благодаря сохранённым в Wayback Machine документам пользователи могут отслеживать происходящие на сайтах изменения и сравнивать разные версии правок. По состоянию на октябрь 2025 года Wayback Machine предоставляет доступ к более чем 1 триллиону сохранённых веб-страниц.
На момент 10 октября 2024 года в связи с начавшейся 9 октября DDoS атакой сервис оказался недоступен. По заявлению основателя Брюстера Кейла сервис был отключён дабы сохранить данные в ущерб доступности сервиса. 11 октября он также заявил, что данные сервиса повреждены не были, а в настоящее время идут работы по модернизации их внутренних систем. Кейл предполагает, что это займёт дни, а не недели. 14 октября сервис восстановил работу, временно приостановив возможность сохранять страницы, а 28 декабря — вернулся к полноценной работе.
Создание
В 1989 году английский учёный Тим Бернерс-Ли создал всемирную паутину — систему, позволяющую передавать данные через подключённые к интернету компьютеры. Однако с распространением всемирной паутины были выявлены две базовые проблемы. Первая состояла в нехватке мест для хранения всех данных, из-за чего многие документы и веб-страницы удалялись. Решить эти недостатки стремилась американская цифровая библиотека « Другая проблема заключалась в том, что после редактирования веб-страницы (например, по юридическим причинам) пользователи не могли посмотреть её изначальную версию.Архив Интернета» — некоммерческая организация, созданная программистами Брюстером Кейлом и в 1996 году. При сотрудничестве с Alexa Internet (дочерней компанией Amazon, занимающейся веб-индексированием) «Архив» инициировал создание и хранение копий существующих сайтов для развития «универсального доступа к знанию». Организация предоставляла бесплатный публичный доступ к оцифрованным материалам, таким как веб-страницы, книги, аудиозаписи, включая живые концерты, видео, изображения и программное обеспечение. На 2021 год штаб-квартира «Архива Интернета» находится в Сан-Франциско, в здании бывшей христианской церкви, расположенной в районе Ричмонд. Журналист местной радиостанции в 2019 году сравнивал офис «Архива» с римским храмом. Организация ставит перед собой цель спасти интернет от исчезновения.
Wayback Machine стал самым популярным проектом «Архива». Онлайн-сервис был назван в честь машины времени из мультсериала 1960-х годов «Шоу Рокки и Буллвинкля». Он предоставляет доступ к цифровой коллекции из более чем 800 млрд различных веб-страниц. Проект Wayback Machine был задуман как решение проблемы ошибки 404, означающей, что сервер не может найти данные по запрошенному адресу. Это ассоциировалось с так называемым вымиранием ссылок — нарастающей недоступностью некогда опубликованных данных. В 2003 году этот показатель составил 100 дней. Так, в 1997 году средняя продолжительность жизни веб-страницы составляла 44 дня. Проведённый в 2008 году анализ ссылок на 2700 цифровых ресурсов, большинство из которых не имеет печатных аналогов, показал, что около 8 процентов ссылок переставали работать через год. К 2011 году, по прошествии трёх лет, 30 процентов ссылок в коллекции были неработающими. Благодаря интеграции с Alexa, столкнувшийся с сообщением об ошибке пользователь мог получить доступ к заархивированной версии страницы через внедрённую в браузер панель инструментов. Если копия недоступной страницы присутствовала в базе данных Wayback Machine, то загоралась специальная кнопка. Одновременно пользователи могли предоставить браузеру разрешение на просмотр и регистрацию активности — в таком случае все посещаемые сайты архивировались на портале.
Wayback Machine был запущен в мае 1996 года, однако стал доступным для общественности только в 2001 г. — до этого вся записанная на цифровых магнитных лентах информация была открыта только для ограниченного числа учёных и исследователей. К моменту «открытия» архив содержал более 10 млрд заархивированных страниц. К декабрю 2014 года руководство Wayback Machine сообщило, что сохранило 435 млрд веб-страниц по всему миру. С технической точки зрения программное обеспечение Wayback Machine не является архивом, а скорее общедоступным интерфейсом к ограниченному подмножеству всех хранилищ. Так, Wayback Machine нельзя считать поисковой системой коллекции организации, так как она не осуществляет поиск по базе данных другой крупной виртуальной библиотеки — Open Library, позволяющей пользователям бесплатно получать доступ к цифровым копиям книг, которые загружаются и архивируются в формате проекта.
Характеристика
С запуском Wayback Machine «Архив Интернета» стал одним из самых популярных и узнаваемых онлайн-порталов и главным сервисом веб-архивирования.
В 1999 году «Архив» начал расширять коллекцию за пределы архивного веб-контента, чтобы обеспечить статус как к оцифрованным, так и изначально цифровым ресурсам, в том числе книгам, аудио, фильмам, изображениям, документам, программному обеспечению и видеоиграм. Некоторые сканирования выполняются поисковыми роботами самого архива, а другие — партнёрскими организациями. Отдельные базы данных могут приобретаться за счёт пожертвований пользователей и целевых приобретений. Сами создатели организации сравнивали свою коллекцию с Александрийской библиотекой.
На 2021 год Wayback Machine содержал около 424 млрд веб-страниц — больше, чем документов в Библиотеке Конгресса.
Принцип работы
Платформа Wayback Machine функционирует за счёт двух основных элементов — поисковых роботов (или веб-краулеров) и интерфейса. Веб-краулеры занимаются посещением, извлечением, загрузкой и архивацией веб-страниц. В свою очередь, через интерфейс пользователи получают доступ к онлайн-коллекциям.
Поисковые роботы
Изначально коллекция архива пополнялась за счёт браузерного Плагина от Alexa Internet, который автоматически фиксировал и сохранял каждую веб-страницу по мере её посещения, затем передавая всю собранную информацию в «Архив Интернета». Пользователи также могли установить бесплатную панель инструментов, позволявшую проверять статус архивирования выбранного веб-сайта.
В 2002 году «Архив» запустил собственного поискового робота с открытым исходным кодом —. Коды краулеров записаны с помощью комбинации программных языков Си и Perl. Помимо этого, «Архив Интернета» также принимает данные сканирования от других доноров. Отсканированные копии веб-сайтов автоматически конвертируются в файлы размером около 100 МБ, которые затем сохраняются на серверах. В 2002 году общая скорость пополнения архива составляла около 10 Терабайт в месяц.
Веб-краулеры запечатляют версию сайта такой, какой она была сохранена на момент доступа к ней через URL. Роботы регулярно сканируют большое количество веб-страниц, рекурсивно загружая, анализируя и отображая HTML-, JavaScript- и CSS-страницыНа момент создания «Архива Интернета» всемирная сеть была настолько маленькой, что веб-краулеры могли совершить обход всех сайтов за один сеанс.. Механизм работы краулеров похож на работу поисковых систем — роботы самостоятельно ищут порталы для архивирования через систему поиска путей, сканируя страницы и связанные с ними сайты, следовательно формируя сеть порталов. Однако со временем постоянный рост онлайн-порталов и их изменчивость сделали полный обход всей сети практически невозможным. Таким образом, не все изменения на сайтах зафиксированы в Wayback MachineСканер начинает с веб-страницы, а затем следует по каждой гиперссылке на этой веб-странице, чтобы перейти на новые сайты.. Руководство «Архива Интернета» не уточняет то, как роботы находят и выбирают страницы для сканирования, однако заявляет, что чаще всего краулеры направляются на те сайты, которые имеют перекрёстные ссылки с других порталов и находятся в открытом доступе. На каждой из новых веб-страниц поисковый робот повторяет процесс. Он будет продолжаться до того момента, пока архивация не будет остановлена или не достигнет установленного скриптом лимита. Помимо этого, каждый пользователь может использовать специальную форму на портале и вызвать краулер, который сохранит страницу в текущем состоянии. Wayback Machine сканирует только общедоступные веб-страницы и не может получить доступ к контенту, защищённому паролем или расположенному на частном сервере.
Интерфейс
Интерфейс Wayback Machine позволяет пользователям осуществить два основных действия — получить доступ к истории изменений сайта и просмотреть все сделанные на порталах правки. Также доступна функция сравнения разных версий сайтовЗвёздочка после некоторых дат применяется для обозначения обнаруженных на странице изменений.. Для этого в специальное окно поиска вводится URL интересующего портала, после чего Wayback Machine выдаёт список дат архивации. URL-адрес заархивированной страницы начинается с web.archive.org.
Любой пользователь может сохранить URL-адреса для архивирования, а с бесплатной учётной записью в архиве можно создать и заархивировать любые исходящие или внешние ссылки на исходной странице и получить обзорный отчёт.
Хранение
На 2018 год коллекция «Архива Интернета» составляла более 40 Петабайт, или 40 тыс. терабайт данных, Wayback Machine предоставлял доступ к примерно 63 % всех имеющихся материалов. На февраль 2020 года в архиве Wayback Machine числилось более 900 млрд URL-адресов и более 400 млрд веб-страниц. На июнь 2021 года Wayback Machine предоставлял доступ к более чем 581 млрд сохранённых веб-страниц. В октябре 2025 года сервис достиг 1 триллиона сохранённых страниц.
Использование
Портал Wayback Machine зачастую применяют в правовой сфере — юристы используют сервис для поиска информации по гражданским искам, уголовным делам, в административном делопроизводстве и патентных процессах. Полученные через Wayback Machine архивные версии сайтов могут использоваться для решения вопросов о патентном праве или установлении наказания за публикацию материалов, которые позднее были удалены из сети. Несмотря на широкое использование коллекции «Архива Интернета» для предоставления доказательств, некоторые суды США отказывались принимать скриншоты веб-страниц, ссылаясь на юридическую сложность отождествления оригинала документа и его заархивированной версии. В 2018 году Апелляционный суд США по второму федеральному апелляционному округу постановил, что скрины с архива веб-страниц Wayback Machine относятся к законным доказательствам, которые могут быть использованы в судебных разбирательствах; ранее аналогичное решение вынес Апелляционный суд США по третьему федеральному апелляционному округу; позднее Апелляционный суд США по седьмому федеральному апелляционному округу также признал скриншоты веб-архивов допустимыми электронными доказательствами.
Благодаря архивированным в Wayback Machine статьям авторы могут устанавливать право на открытие или на публикацию. Для социологов и историков Wayback Machine предлагает ценный крупномасштабный источник данных для анализа поведения компаний, стратегий продаж, социальных практик. Также Wayback Machine позволяет получать доступ к журналам открытого доступа. Так, с начала 2000-х годов из интернета исчезло 84 журнала ОД по естественным наукам и ещё около 100 — по социальным и гуманитарным.
Активисты и исследователи используют портал для борьбы с дезинформацией, особенно усилившейся после избрания президента Дональда Трампа в США. В ответ на участившиеся противоречивые заявления со стороны администрации президента «Архив» создал отдельную коллекцию под названием «Архив Трампа», содержащую выступления президента на телевидении и твиты. «Архив» надеется, что его хранилище поможет другим выявлять ложную информацию и проверять подозрительный контент. Однако в некоторых случаях отдельные активисты утверждали, что заархивированные Wayback Machine ресурсы наоборот способствовали распространению дезинформации. Так, с началом пандемии коронавируса сторонники конспиративных теорий использовали сохранённые порталом скриншоты для распространения ложной информации о коронавирусе. В качестве контрмер в ноябре 2020 года «Архив» внедрил в Wayback Machine инструменты проверки информации на достоверность. Для этого некоммерческая организация начала сотрудничать с различными компаниями, занимающимися проверкой фактов, чтобы предоставлять пользователям причины удаления той или иной страницы из коллекции. При открытии заархивированной версии сайта Wayback Machine предоставляет пользователям сведения о причине её удаления в виде жёлтого баннера вверху экрана. При подозрении на причастность веб-страницы к кампании по дезинформации Wayback Machine предоставляет данные об организации, проводившей проверку на достоверность, и ссылку на её отчёт.
В отдельных случаях полученная через Wayback Machine информация фигурировала в крупных скандалах. Так, Wayback Machine хранит копию удалённого сообщения со страницы, озаглавленной «Сводки от Стрелкова Игоря Ивановича» в социальной сети «ВКонтакте», о сбитом самолёте АН-26, который в действительности оказался пассажирским Boeing 777. В мае 2021 года издание Bellingcat Из-за неправильно установленных настроек приватности другие пользователи получили доступ к секретной информации. выяснило, что находящиеся в Европе американские военные использовали для хранения засекреченных данных детские мобильные приложения для запоминания информации. После обнаружения утечки информации военные удалили все карточки, но они остались в сервисе Wayback Machine.
Правовой статус
«Архив Интернета» не запрашивает разрешения на копирование веб-сайтов перед удалённым сбором данных, однако удаляет или ограничивает доступ к архивным материалам по запросу. Ранее владельцам веб-сайтов предоставлялась возможность «отказаться» от архивирования через стандартный файл robots.txt, который исключает веб-сайты или их отдельные страницы, каталоги, из списка порталов для веб-краулеров. По состоянию на 2022 год заявки на удаление сайтов или их страниц из архива принимаются только после прямого запроса от администрации удаляемого сайта. Однако из-за сохранения других данных «Архив Интернета» находится в уязвимом юридическом положении. Так, в 2005 году Wayback Machine оказался втянутым в спор о товарных знаках между компаниями Healthcare Advocates и Health Advocate. Последняя использовала Wayback Machine для доступа к веб-страницам Healthcare Advocates, датируемым 1999 годом, в попытке найти информацию, которая поддержала бы дело. В ответ Healthcare Advocates подала в суд как на Health Advocate, так и на «Архив», утверждая что архив нарушил Закон об авторском праве в цифровую эпоху. В дальнейшем дело было урегулировано в досудебном порядке.
В 2002 году «Архив» удалил из своей системы ссылки на архивные копии портала Xenu.net, принадлежащего критику церкви Андреасу Хельдал-Лунду. Удаление произошло по требованию юристов Церкви саентологии, заявивших, что владеют правом собственности на выдержки из документов Церкви, опубликованные на сайте.
Ограничения
Исследователи и активисты критикуют Wayback Machine и деятельность «Архива Интернета» за попытку сохранить все онлайн-материалы, многие из которых не представляют должной ценности. Согласно мнению отдельных исследователей, это ассоциировалось с устаревшей политикой «Архива», который был основан в конце 1990-х годов — тогда, на заре создания интернет-архивов, считалось, что данные интернета должны сохраняться в полном объёме. Однако с созданием множества однодневных сайтов многие исследователи и активисты поменяли своё мнение. Другие критические замечания относятся к техническим ограничениям сервиса — Wayback Machine не позволяет сохранять и обрабатывать определённые элементы JavaScript, а также может создавать заархивированные страницы, содержащие неработающие ссылки, отсутствующую графику или являющиеся неполными по иным причинам. Сканеры захватывают только статический снимок сайта — функции порталов на основе Java или Flash работать не будут. Это означает, что бо́льшая часть функциональных возможностей исходной веб-страницы теряется.
Блокировки
В 2015 году Роскомнадзор принял решение заблокировать Wayback Machine за копию страницы текста «Одиночный джихад в России», содержащего информацию о «теории и практике партизанского сопротивления». Соответствующая страница в «Архиве Интернета» была добавлена в официальный реестр запрещённых веб-сайтов в России 23 июня 2015 года, из-за чего некоторые российские интернет-провайдеры были вынуждены полностью заблокировать сайт «Архива». Доступ к Wayback Machine был заново открыт в 2016 году, после того как запрещённые ролики удалили с портала.
В 2019 году представители «Ассоциации по защите авторских прав в интернете» (АЗАПИ) подали серию исков против сервиса Wayback Machine за нарушение авторских прав. Представители АЗАПИ запросили Мосгорсуд вынести решение о вечной блокировке портала на территории России, однако на август 2020 года «Архив Интернета» по-прежнему продолжал свою работу.
В 2017 году портал был заблокирован в Индии и Кыргызстане за содержание «экстремистских материалов». По информации на 2021 год, сайт заблокирован в Китае.
В июне 2022 года Таганский райсуд Москвы оштрафовал «Архив Интернета» на 800 тыс. рублей за неудаление из WayBack Machine видео о способах изготовления коктейля Молотова.
Примечания
- Overview — https://www.alexa.com/siteinfo/archive.org
- https://www.alexa.com/siteinfo/archive.org
- https://web.archive.org/web/20200518192525/https://www.alexa.com/siteinfo/archive.org
- Michael Bryant: What is the Wayback Machine and Why is it Useful? — https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
- https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
- https://web.archive.org/web/20210518200214/https://www.groovypost.com/explaier/what-is-the-wayback-machine-and-why-is-it-useful/
- 30 years on, Internet Archive hits 1-trillion preserved pages — https://www.techradar.com/pro/internet-archive-reaches-new-1-trillion-page-landmark-almost-30-years-after-it-started-backing-up-the-www-and-more-than-100-000tb-of-files-have-been-safeguarded-since
- https://www.techradar.com/pro/internet-archive-reaches-new-1-trillion-page-landmark-almost-30-years-after-it-started-backing-up-the-www-and-more-than-100-000tb-of-files-have-been-safeguarded-since
- Заявление основателя сервиса о DDoS атаке — https://x.com/brewster_kahle/status/1843761077798220253
- https://x.com/brewster_kahle/status/1843761077798220253
- https://web.archive.org/web/20241009220927/https://x.com/brewster_kahle/status/1843761077798220253
- Сервис отключен дабы сохранить данные — https://x.com/brewster_kahle/status/1844326137499177312
- https://x.com/brewster_kahle/status/1844326137499177312
- https://web.archive.org/web/20241224022328/https://x.com/brewster_kahle/status/1844326137499177312
- Данные после атаки повреждены не были — https://x.com/brewster_kahle/status/1844485102312751421
- https://x.com/brewster_kahle/status/1844485102312751421
- https://web.archive.org/web/20241022061508/https://x.com/brewster_kahle/status/1844485102312751421
- Информация о сроках восстановления — https://x.com/brewster_kahle/status/1844790609573277792
- https://x.com/brewster_kahle/status/1844790609573277792
- https://web.archive.org/web/20241105110101/https://x.com/brewster_kahle/status/1844790609573277792
- Сервис частично восстановил работу — https://x.com/brewster_kahle/status/1845688309085065571
- https://x.com/brewster_kahle/status/1845688309085065571
- https://web.archive.org/web/20241104120617/https://x.com/brewster_kahle/status/1845688309085065571
- Jack Schofield: The Time Machine — https://www.theguardian.com/technology/2007/nov/19/archive.internet
- https://www.theguardian.com/technology/2007/nov/19/archive.internet
- https://web.archive.org/web/20210419133845/https://www.theguardian.com/technology/2007/nov/19/archive.internet
- Dominic Cummings: how the internet knows when you’ve updated your blog — https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
- https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
- https://web.archive.org/web/20210725222234/https://theconversation.com/dominic-cummings-how-the-internet-knows-when-youve-updated-your-blog-139517
- In An Old Church, The Internet Archive Stores Our Digital History — https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
- https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
- https://web.archive.org/web/20210506120243/https://www.kalw.org/show/crosscurrents/2019-09-11/in-an-old-church-the-internet-archive-stores-our-digital-history
- Jenni McKinnon: Using the Wayback Machine to Archive (and Backup) WordPress — https://wpmudev.com/blog/archiving-with-wayback-machine/
- https://wpmudev.com/blog/archiving-with-wayback-machine/
- https://web.archive.org/web/20210413234350/https://wpmudev.com/blog/archiving-with-wayback-machine/
- Adrienne LaFrance: Raiders of the Lost Web — https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
- https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
- https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/
- Aja Romano: A lawsuit is threatening the Internet Archive — but it’s not as dire as you may have heard — https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
- https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
- https://web.archive.org/web/20210818211013/https://www.vox.com/2020/6/23/21293875/internet-archive-website-lawsuit-open-library-wayback-machine-controversy-copyright
- Kalev Leetaru: The Internet Archive Turns 20: A Behind The Scenes Look At Archiving The Web — https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
- https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
- https://web.archive.org/web/20210815171017/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/?sh=533ba6e282e0
- michelle: Wayback Machine Hits 400,000,000,000! — https://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000
- https://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000
- https://web.archive.org/web/20140826191225/http://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000/
- Richard Koman: How the Wayback Machine Works — https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
- https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
- https://web.archive.org/web/20210528134057/https://www.xml.com/pub/a/ws/2002/01/18/brewster.html
- A. Rossi: Worldwide Web Crawls — https://archive.org/details/widecrawl&tab=about
- https://archive.org/details/widecrawl&tab=about
- Laura Bohannon: Wayback Machine archives websites for over 20 years — https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
- https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
- https://web.archive.org/web/20210624202004/https://news.jrn.msu.edu/2017/12/wayback-machine-archives-websites-for-over-20-years/
- Mark Graham: Tips for Using the Internet Archive’s Wayback Machine in Your Next Investigation — https://gijn.org/2021/05/05/tips-for-using-the-internet-archives-wayback-machine-in-your-next-investigation/
- https://gijn.org/2021/05/05/tips-for-using-the-internet-archives-wayback-machine-in-your-next-investigation/
- https://web.archive.org/web/20210529020740/https://gijn.org/2021/05/05/tips-for-using-the-internet-archives-wayback-machine-in-your-next-investigation/
- Zachary Crockett: Inside Wayback Machine, the internet’s time capsule — https://thehustle.co/inside-wayback-machine-internet-archive
- https://thehustle.co/inside-wayback-machine-internet-archive
- https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive
- Евгений Делюкин: Браузер Brave от сооснователя Mozilla стал предлагать копии из «архива интернета» вместо удалённых веб-страниц — https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic
- https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic
- https://web.archive.org/web/20210624201130/https://vc.ru/services/109219-brauzer-brave-ot-soosnovatelya-mozilla-stal-predlagat-kopii-iz-arhiva-interneta-vmesto-udalennyh-veb-stranic
- Wayback Machine — https://archive.org/web/
- https://archive.org/web/
- Kieren McCarthy: Archive.org's Wayback Machine is legit legal evidence, US appeals court judges rule — https://www.theregister.com/2018/09/04/wayback_machine_legit/
- https://www.theregister.com/2018/09/04/wayback_machine_legit/
- https://web.archive.org/web/20210602231920/https://www.theregister.com/2018/09/04/wayback_machine_legit/
- Маргарита Сазонова: Электронные доказательства в спорах в сфере интеллектуальной собственности — http://www.garant.ru/news/1418353/
- http://www.garant.ru/news/1418353/
- https://web.archive.org/web/20210624202716/http://www.garant.ru/news/1418353/
- Jeffrey Brainard: Dozens of scientific journals have vanished from the internet, and no one preserved them — https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
- https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
- https://web.archive.org/web/20201015230626/https://www.sciencemag.org/news/2020/09/dozens-scientific-journals-have-vanished-internet-and-no-one-preserved-them
- Diana Kwon: More than 100 scientific journals have disappeared from the Internet — https://www.nature.com/articles/d41586-020-02610-z
- https://www.nature.com/articles/d41586-020-02610-z
- https://web.archive.org/web/20201003135120/https://www.nature.com/articles/d41586-020-02610-z
- avouner: Десятки научных журналов исчезли из интернета за последние 20 лет и никто их не сохранил — https://habr.com/ru/news/t/518594/
- https://habr.com/ru/news/t/518594/
- https://web.archive.org/web/20210624203211/https://habr.com/ru/news/t/518594/
- Camilla Hodgson: How the Internet Archive is waging war on misinformation — https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
- https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
- https://web.archive.org/web/20210628083500/https://www.ft.com/content/5be1f2ee-d60b-11e9-a0bd-ab8ec6435630
- Mary Kay Magistad: Where to find what's disappeared online, and a whole lot more: the Internet Archive — https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive
- https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive
- https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive
- Wayback Machine теперь проверяет информацию на достоверность для архивных веб-страниц — https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking
- https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking
- https://web.archive.org/web/20210624203219/https://trashbox.ru/link/2020-11-02-wayback-machine-fact-checking
- Did the Wayback Machine Catch Russian-Backed Rebels Claiming Responsibility for Malaysian Airlines Flight MH17? — https://www.openculture.com/2014/07/did-the-wayback-machine-catch-russian-backed-rebels.html
- https://www.openculture.com/2014/07/did-the-wayback-machine-catch-russian-backed-rebels.html
- https://web.archive.org/web/20210624205440/https://www.openculture.com/2014/07/did-the-wayback-machine-catch-russian-backed-rebels.html
- Jil Lepore: The Cobweb — https://www.newyorker.com/magazine/2015/01/26/cobweb
- https://www.newyorker.com/magazine/2015/01/26/cobweb
- https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb
- Дамир Камалетдинов: В сеть попали секретные данные об американском ядерном оружии — военные записывали их в школьных приложениях — https://tjournal.ru/news/389570-v-set-popali-sekretnye-dannye-ob-amerikanskom-yadernom-oruzhii-voennye-zapisyvali-ih-v-shkolnyh-prilozheniyah
- https://tjournal.ru/news/389570-v-set-popali-sekretnye-dannye-ob-amerikanskom-yadernom-oruzhii-voennye-zapisyvali-ih-v-shkolnyh-prilozheniyah
- https://web.archive.org/web/20210624201326/https://tjournal.ru/news/389570-v-set-popali-sekretnye-dannye-ob-amerikanskom-yadernom-oruzhii-voennye-zapisyvali-ih-v-shkolnyh-prilozheniyah
- Carolyn Wimbly Martin: Internet Archive’s Open Library and Copyright Law — https://www.lutzker.com/internet-archives-open-library-and-copyright-law/
- https://www.lutzker.com/internet-archives-open-library-and-copyright-law/
- https://web.archive.org/web/20210624201547/https://www.lutzker.com/internet-archives-open-library-and-copyright-law/
- Nate Anderson: Copy some webpages, owe more than the national debt — https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
- https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
- https://web.archive.org/web/20210624203555/https://arstechnica.com/tech-policy/2011/01/copy-some-web-pages-owe-more-than-the-national-debt/
- Eric Bangeman: Internet Archive settles suit over Wayback Machine — https://arstechnica.com/uncategorized/2006/08/7634/
- https://arstechnica.com/uncategorized/2006/08/7634/
- https://web.archive.org/web/20071105205430/http://arstechnica.com/news.ars/post/20060831-7634.html
- Lisa M. Bowman: Net archive silences Scientology critic — http://news.cnet.com/2100-1023-959236.html
- http://news.cnet.com/2100-1023-959236.html
- https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html
- Ernest Miller: Features: Sherman, Set the Wayback Machine for Scientology — http://lawmeme.research.yale.edu/modules.php?name=News&file=article&sid=350
- http://lawmeme.research.yale.edu/modules.php?name=News&file=article&sid=350
- https://web.archive.org/web/20121116072812/http://lawmeme.research.yale.edu/modules.php?name=News&file=article&sid=350
- Nora Caplan-Bricker: Preservation Acts — https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/
- https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/
- https://web.archive.org/web/20210505235528/https://harpers.org/archive/2018/12/preservation-acts-archiving-twitter-social-media-movements/
- Mike Masnick: Russia Blocks The Internet Archive's Wayback Machine Over A Single Page — https://www.techdirt.com/articles/20150626/11213631474/russia-blocks-internet-archives-wayback-machine-over-single-page.shtml
- https://www.techdirt.com/articles/20150626/11213631474/russia-blocks-internet-archives-wayback-machine-over-single-page.shtml
- https://web.archive.org/web/20210604213725/https://www.techdirt.com/articles/20150626/11213631474/russia-blocks-internet-archives-wayback-machine-over-single-page.shtml
- Роскомнадзор заблокировал архив интернета из-за "Одиночного джихада" — https://www.mk.ru/social/2015/06/25/roskomnadzor-zablokiroval-arkhiv-interneta-izza-odinochnogo-dzhikhada.html
- https://www.mk.ru/social/2015/06/25/roskomnadzor-zablokiroval-arkhiv-interneta-izza-odinochnogo-dzhikhada.html
- https://web.archive.org/web/20210624201601/https://www.mk.ru/social/2015/06/25/roskomnadzor-zablokiroval-arkhiv-interneta-izza-odinochnogo-dzhikhada.html
- Роскомнадзор заблокировал страницу «архива интернета» за экстремизм — https://lenta.ru/news/2015/06/25/rkn/
- https://lenta.ru/news/2015/06/25/rkn/
- https://web.archive.org/web/20210922150736/https://lenta.ru/news/2015/06/25/rkn/
- Дмитрий Шестоперов, Анастасия Евтушенко: «Архив интернета» снова в сети — https://www.gazeta.ru/tech/2016/04/18/8183321/archive_is_back.shtml
- https://www.gazeta.ru/tech/2016/04/18/8183321/archive_is_back.shtml
- https://web.archive.org/web/20210503055621/https://www.gazeta.ru/tech/2016/04/18/8183321/archive_is_back.shtml
- АЗАПИ хочет навечно заблокировать «Архив Интернета» — https://roskomsvoboda.org/49067/
- https://roskomsvoboda.org/49067/
- https://web.archive.org/web/20210604024806/https://roskomsvoboda.org/49067/
- «Архив интернета» могут навечно заблокировать в России — https://www.cnews.ru/news/top/2019-08-23_arhiv_interneta_mogut
- https://www.cnews.ru/news/top/2019-08-23_arhiv_interneta_mogut
- https://web.archive.org/web/20210624202847/https://www.cnews.ru/news/top/2019-08-23_arhiv_interneta_mogut
- Россияне потребовали запретить в Европе Telegram, YouTube и Mail.ru — https://www.cnews.ru/news/top/2020-08-19_rossijskie_izdatelstva
- https://www.cnews.ru/news/top/2020-08-19_rossijskie_izdatelstva
- https://web.archive.org/web/20210624211239/https://www.cnews.ru/news/top/2020-08-19_rossijskie_izdatelstva
- Американские издатели книг подали в суд на Internet Archive — https://www.vedomosti.ru/media/news/2020/06/02/831699-internet-archive
- https://www.vedomosti.ru/media/news/2020/06/02/831699-internet-archive
- https://web.archive.org/web/20210624203346/https://www.vedomosti.ru/media/news/2020/06/02/831699-internet-archive
- Access to Internet Archive’s Wayback Machine Blocked in India — https://thewire.in/tech/access-internet-archives-wayback-machine-blocked
- https://thewire.in/tech/access-internet-archives-wayback-machine-blocked
- https://web.archive.org/web/20210624202300/https://thewire.in/tech/access-internet-archives-wayback-machine-blocked
- Wayback Machine has been blocked in India — https://www.theverge.com/2017/8/9/16117578/wayback-machine-blocked-india-internet-archive
- https://www.theverge.com/2017/8/9/16117578/wayback-machine-blocked-india-internet-archive
- https://web.archive.org/web/20210624202435/https://www.theverge.com/2017/8/9/16117578/wayback-machine-blocked-india-internet-archive
- Kyrgyzstan Blocks Archive.org on ‘Extremism’ Grounds — https://advox.globalvoices.org/2017/07/21/kyrgyzstan-blocks-archive-org-on-extremism-grounds/
- https://advox.globalvoices.org/2017/07/21/kyrgyzstan-blocks-archive-org-on-extremism-grounds/
- https://web.archive.org/web/20210518164919/https://advox.globalvoices.org/2017/07/21/kyrgyzstan-blocks-archive-org-on-extremism-grounds/
- Anna Kramer: The internet is splitting apart. The Internet Archive wants to save it all forever — https://www.protocol.com/internet-archive-preserving-future
- https://www.protocol.com/internet-archive-preserving-future
- https://web.archive.org/web/20210601200035/https://www.protocol.com/internet-archive-preserving-future
- Машину времени увезли на штрафстоянку — https://www.kommersant.ru/doc/5435373
- https://www.kommersant.ru/doc/5435373
Литература
- Acker, A., & Chaiet, M.: The weaponization of web archives: Data craft and COVID-19 publics. — https://misinforeview.hks.harvard.edu/article/the-weaponization-of-web-archives-data-craft-and-covid-19-publics/
- Anat Ben-David, Adam Amram: The Internet Archive and the socio-technical construction of historical facts
- Arora S., Li Y., Youtie J., Shapira P.: Using the wayback machine to mine websites in the social sciences: A methodological resource
- Bowyer S.: The Wayback Machine: notes on a re‑enchantment
- Deborah R. Eltgroth: Best Evidence and the Wayback Machine: Toward a Workable Authentication Standard for Archived Internet Evidence — https://ir.lawnet.fordham.edu/flr/vol78/iss1/5
- Greg R. Notess: The Wayback Machine: The Web's Archive — https://www.infotoday.com/online/mar02/OnTheNet.htm
- Hartelius J.: The anxious flâneur: Digital archiving and the Wayback Machine
- James L. Quarles III and Richard A. Crudo: [Way]Back to the Future: Using the Wayback Machine in Patent Litigation
- Lerner A., Kohno T., Roesner F.: Rewriting History: Changing the Archived Web from the Present — https://acmccs.github.io/papers/p1741-lernerAT3.pdf
- Maemura E., Worby N., Milligan I., Becker C.: If These Crawls Could Talk: Studying and Documenting Web Archives Provenance
- Milligan I.: Lost in the Infinite Archive: The Promise and Pitfalls of Web Archives
- Murphy J., Hashim N., O’Connor P.: Take Me Back: Validating the Wayback Machine
- Odgen J., Halford S., Carr L.: Observing Web Archives
- Pearce D., Charlton B.: Plagiarism of online material may be proven using the Internet Archive Wayback Machine (archive.org)
- Price: Internet Archiving – The Wayback machine — https://mla.hcommons.org/deposits/item/hc:16755/
- Phyllis Holman Weisbard: Oldies but Goodies: Archiving WebBased Information
- Rogers R.: Doing Web history with the Internet Archive: screencast documentaries
- https://misinforeview.hks.harvard.edu/article/the-weaponization-of-web-archives-data-craft-and-covid-19-publics/
- https://ir.lawnet.fordham.edu/flr/vol78/iss1/5
- https://www.infotoday.com/online/mar02/OnTheNet.htm
- https://acmccs.github.io/papers/p1741-lernerAT3.pdf
- https://mla.hcommons.org/deposits/item/hc:16755/