Archive.today

Материал из Wikibrand

archive.today (ранее archive.is) — бесплатный сервис по архивированию веб-страниц, запущенный в 2012 году. Archive.today сохраняет содержание страниц, включая изображения, однако не поддерживает динамический контент. В отличие от портала Wayback Machine (WB) archive.today архивирует страницы по запросу пользователей и не использует поисковых роботов.

Принцип работы

Сервис archive.is был сформирован в мае 2012 года. Спустя три года после создания, в мае 2015-го, портал изменил название на archive.today. На 2021-й все Дата-центры расположены в странах Европейского союза, а финансирование осуществляется за счёт частных спонсоров.

Расходы на функционирование архиватора оплачиваются его владельцем. По состоянию на июль 2021 года расходы только на сервера и домены составляли 2600 долларов в месяц.

В отличие от аналогичного проекта Wayback Machine, использующего поисковых роботов для сканирования и архивирования интернета, archive.today сохраняет веб-страницы только по запросу пользователей. При отправке URL через специальную строку на сайте сервис автоматически архивирует содержимое HTML-страницы, включая растровые изображения и другие материалы, сохраняя CSS-стили и отдельные скрипты JavaScript. Аудио и видеофайлы, контент Adobe Flash, PDF, RSS и другие форматы XML не сохраняются. Затем портал размещает в открытом доступе функциональную копию веб-страницы и Снимок экрана, представляющий статичную визуализацию страницы в формате PNG.

Archive.today не сохраняет страницы, для доступа к которым требуется аутентификация, однако игнорирует Стандарт исключений для роботов и за счёт этого имеет доступ ко многим «закрытым» сайтам. Размер заархивированной страницы со всеми изображениями не должен превышать 50 МБ. Все данные хранятся в формате HDFS.

С 2013 года archive.today включён в агрегаторы, поддерживаемого Лос-Аламосской национальной лабораторией и.

Создатели archive.today запустили специальное Расширение браузера Mozilla Firefox, которое автоматически сохраняет и выкладывает в общий доступ копии каждой веб-страницы, добавляемой пользователем в закладки.

Использование

Сервис использовали такие хактивисты, как Джулиан Ассанж и Сирийская электронная армия, для архивирования ранее выложенных в интернет документов, используемых в качестве доказательств коррупции и военных преступлений.

В отдельных случаях активисты архивируют с помощью archive.today материалы тех веб-сайтов, против которых они выступают, следовательно препятствуя получению ими прибыли от просмотров рекламы. Например, в 2014 году сторонники Геймергейта нередко использовали archive.today для распространения страниц новостных порталов Kotaku, IGN и Motherboard — по данным Alexa Internet, в этот период 13 % трафика портала поступало с Треда Геймергейта на Reddit.

Портал не несёт юридической ответственности за архивируемые пользователями материалы, однако при появлении жалоб на незаконный контент создатели сотрудничают с правоохранительными органами для его удаления.

Блокировки

В январе 2016 года Федеральная служба Российской Федерации по контролю за оборотом наркотиков заблокировала сервис, предположительно, за сохранение памятки по посещению Крыма, согласно которой туристы должны спрашивать разрешение на посещение у украинских властей.

В 2019 году портал archive.today был заблокирован в Австралии за архивацию страницы, содержащей видео стрельбы в новозеландских мечетях Крайстчерча.

В 2019 году зеркало archive.today было заблокировано на Фарерских островах. На 2021 год портал заблокирован в Казахстане, Китае, Иране за хранение запрещённых материалов.

Глобальные блокировки

OpenDNS блокирует сайт, считая его разновидностью прокси-Анонимайзера.

В феврале 2016 доменный регистратор OnlineNIC заблокировал старый домен сайта «archive.today», последние месяцы перенаправлявший на «archive.is».

Владельцы

Владельцы архиватора официально неизвестны и сохраняют анонимность. Согласно данным, указанным при регистрации доменного имени archive.is, владельцем архиватора может быть Денис Петров из Праги, Чехия. Анализ официального блога архиватора показывает, что владелец архиватора владеет русским языком и скорее всего живёт в России.

Юридические проблемы

30 октября 2025 года ФБР запросило у регистратора доменных имён Tucows информацию о клиенте, который владеет доменом archive.today, и дало срок до 29 ноября, заявив, что это действие — часть уголовного расследования, которое проводится бюро; повестка в тот же день была опубликована в Твиттере, с официального аккаунта сервиса.

Конфликт с Яни Патокаллио

В 2023 году Яни Патокаллио написал в своём блоге статью с целью раскрыть идентичность владельцев archive.today; в новостных репортажах о давлении со стороны ФБР на сервис среди источников информации числился его пост. 8 января 2026 года владельцы сервиса послали хостеру блога Патокаллио Automattic требование удалить статью, ссылаясь на нарушение им GDPR. Спустя 2 дня, 10 января, письмо с просьбой удалить статью было послано на личную почту Патокаллио. 11 января 2026 года на страницу капчи сервиса был добавлен вредоносный код, автоматически посылающий каждые 300 миллисекунд поисковые запросы к блогу. В переписке об удалении статьи со стороны владельцев сервиса также прозвучали угрозы диффамации в сторону Патокаллио. В конечном счете конфликта, сообщество англоязычной Википедии приняло решение о немедленном выводе архива из эксплуатации.

Примечания

Литература

  • Brunelle J., Kelly M., Weigle M., Nelson M.: The impact of JavaScript on archivability
  • Garg K., Jayanetti H., Alam S., Weigle M., Nelson M.: Replaying Archived Twitter: When your bird is broken, will it bring you down?

Ссылки

  • Официальный сайт архиватора — https://archive.today
  • Официальный блог архиватора — https://blog.archive.today/
  • Официальный сайт архиватора
  • Официальный блог архиватора