Archive.today
archive.today (ранее archive.is) — бесплатный сервис по архивированию веб-страниц, запущенный в 2012 году. Archive.today сохраняет содержание страниц, включая изображения, однако не поддерживает динамический контент. В отличие от портала Wayback Machine (WB) archive.today архивирует страницы по запросу пользователей и не использует поисковых роботов.
Принцип работы
Сервис archive.is был сформирован в мае 2012 года. Спустя три года после создания, в мае 2015-го, портал изменил название на archive.today. На 2021-й все Дата-центры расположены в странах Европейского союза, а финансирование осуществляется за счёт частных спонсоров.
Расходы на функционирование архиватора оплачиваются его владельцем. По состоянию на июль 2021 года расходы только на сервера и домены составляли 2600 долларов в месяц.
В отличие от аналогичного проекта Wayback Machine, использующего поисковых роботов для сканирования и архивирования интернета, archive.today сохраняет веб-страницы только по запросу пользователей. При отправке URL через специальную строку на сайте сервис автоматически архивирует содержимое HTML-страницы, включая растровые изображения и другие материалы, сохраняя CSS-стили и отдельные скрипты JavaScript. Аудио и видеофайлы, контент Adobe Flash, PDF, RSS и другие форматы XML не сохраняются. Затем портал размещает в открытом доступе функциональную копию веб-страницы и Снимок экрана, представляющий статичную визуализацию страницы в формате PNG.
Archive.today не сохраняет страницы, для доступа к которым требуется аутентификация, однако игнорирует Стандарт исключений для роботов и за счёт этого имеет доступ ко многим «закрытым» сайтам. Размер заархивированной страницы со всеми изображениями не должен превышать 50 МБ. Все данные хранятся в формате HDFS.
С 2013 года archive.today включён в агрегаторы, поддерживаемого Лос-Аламосской национальной лабораторией и.
Создатели archive.today запустили специальное Расширение браузера Mozilla Firefox, которое автоматически сохраняет и выкладывает в общий доступ копии каждой веб-страницы, добавляемой пользователем в закладки.
Использование
Сервис использовали такие хактивисты, как Джулиан Ассанж и Сирийская электронная армия, для архивирования ранее выложенных в интернет документов, используемых в качестве доказательств коррупции и военных преступлений.
В отдельных случаях активисты архивируют с помощью archive.today материалы тех веб-сайтов, против которых они выступают, следовательно препятствуя получению ими прибыли от просмотров рекламы. Например, в 2014 году сторонники Геймергейта нередко использовали archive.today для распространения страниц новостных порталов Kotaku, IGN и Motherboard — по данным Alexa Internet, в этот период 13 % трафика портала поступало с Треда Геймергейта на Reddit.
Портал не несёт юридической ответственности за архивируемые пользователями материалы, однако при появлении жалоб на незаконный контент создатели сотрудничают с правоохранительными органами для его удаления.
Блокировки
В январе 2016 года Федеральная служба Российской Федерации по контролю за оборотом наркотиков заблокировала сервис, предположительно, за сохранение памятки по посещению Крыма, согласно которой туристы должны спрашивать разрешение на посещение у украинских властей.
В 2019 году портал archive.today был заблокирован в Австралии за архивацию страницы, содержащей видео стрельбы в новозеландских мечетях Крайстчерча.
В 2019 году зеркало archive.today было заблокировано на Фарерских островах. На 2021 год портал заблокирован в Казахстане, Китае, Иране за хранение запрещённых материалов.
Глобальные блокировки
OpenDNS блокирует сайт, считая его разновидностью прокси-Анонимайзера.
В феврале 2016 доменный регистратор OnlineNIC заблокировал старый домен сайта «archive.today», последние месяцы перенаправлявший на «archive.is».
Владельцы
Владельцы архиватора официально неизвестны и сохраняют анонимность. Согласно данным, указанным при регистрации доменного имени archive.is, владельцем архиватора может быть Денис Петров из Праги, Чехия. Анализ официального блога архиватора показывает, что владелец архиватора владеет русским языком и скорее всего живёт в России.
Юридические проблемы
30 октября 2025 года ФБР запросило у регистратора доменных имён Tucows информацию о клиенте, который владеет доменом archive.today, и дало срок до 29 ноября, заявив, что это действие — часть уголовного расследования, которое проводится бюро; повестка в тот же день была опубликована в Твиттере, с официального аккаунта сервиса.
Конфликт с Яни Патокаллио
В 2023 году Яни Патокаллио написал в своём блоге статью с целью раскрыть идентичность владельцев archive.today; в новостных репортажах о давлении со стороны ФБР на сервис среди источников информации числился его пост. 8 января 2026 года владельцы сервиса послали хостеру блога Патокаллио Automattic требование удалить статью, ссылаясь на нарушение им GDPR. Спустя 2 дня, 10 января, письмо с просьбой удалить статью было послано на личную почту Патокаллио. 11 января 2026 года на страницу капчи сервиса был добавлен вредоносный код, автоматически посылающий каждые 300 миллисекунд поисковые запросы к блогу. В переписке об удалении статьи со стороны владельцев сервиса также прозвучали угрозы диффамации в сторону Патокаллио. В конечном счете конфликта, сообщество англоязычной Википедии приняло решение о немедленном выводе архива из эксплуатации.
Примечания
- The registry of blocked websites — https://reestr.rublacklist.net/en/?q=archive.li
- https://reestr.rublacklist.net/en/?q=archive.li
- Archive.is blog — https://blog.archive.today/post/118010496181/why-did-you-change-the-url-back-from-archive-today
- https://blog.archive.today/post/118010496181/why-did-you-change-the-url-back-from-archive-today
- https://web.archive.org/web/20211027204209/https://blog.archive.today/post/118010496181/why-did-you-change-the-url-back-from-archive-today
- Comparison of web archiving services — http://wiki.dandascalescu.com/reviews/online_services/web_page_archiving
- http://wiki.dandascalescu.com/reviews/online_services/web_page_archiving
- https://web.archive.org/web/20130922192354/http://wiki.dandascalescu.com/reviews/online_services/web_page_archiving
- Archive.is blog — You said that before you die of old age you would... — https://blog.archive.today/post/657695036319907840/you-said-that-before-you-die-of-old-age-you-would
- https://blog.archive.today/post/657695036319907840/you-said-that-before-you-die-of-old-age-you-would
- https://web.archive.org/web/20240605123729/https://blog.archive.today/post/657695036319907840/you-said-that-before-you-die-of-old-age-you-would
- Salman Ravoof: How to Archive a Website: Our Mammoth Guide to Saving Your Site — https://kinsta.com/blog/archive-a-website/
- https://kinsta.com/blog/archive-a-website/
- https://web.archive.org/web/20211105022352/https://kinsta.com/blog/archive-a-website/
- Jason Koebler: Dear GamerGate: Please Stop Stealing Our Shit — https://www.vice.com/en/article/ypw5mj/dear-gamergate-please-stop-stealing-our-shit
- https://www.vice.com/en/article/ypw5mj/dear-gamergate-please-stop-stealing-our-shit
- https://web.archive.org/web/20211127120327/https://www.vice.com/en/article/ypw5mj/dear-gamergate-please-stop-stealing-our-shit
- Martin Brinkmann: Create publicly available web page archives with Archive.is — https://www.ghacks.net/2015/04/22/create-publicly-available-web-page-archives-with-archive-is/
- https://www.ghacks.net/2015/04/22/create-publicly-available-web-page-archives-with-archive-is/
- https://web.archive.org/web/20180723152553/https://www.ghacks.net/2015/04/22/create-publicly-available-web-page-archives-with-archive-is/
- KritikaGarg: 2020-07-15: Twitter Was Already Difficult To Archive, Now It's Worse! — https://ws-dl.blogspot.com/2020/07/2020-07-15-twitter-was-already.html
- https://ws-dl.blogspot.com/2020/07/2020-07-15-twitter-was-already.html
- https://web.archive.org/web/20211028031645/https://ws-dl.blogspot.com/2020/07/2020-07-15-twitter-was-already.html
- FAQ — https://archive.ph/faq
- https://archive.ph/faq
- https://web.archive.org/web/20211027201506/https://archive.ph/faq
- Michael Nelson: 2013-07-09: Archive.is Supports Memento — https://ws-dl.blogspot.com/2013/07/2013-07-09-archiveis-supports-memento.html
- https://ws-dl.blogspot.com/2013/07/2013-07-09-archiveis-supports-memento.html
- https://web.archive.org/web/20211106044144/https://ws-dl.blogspot.com/2013/07/2013-07-09-archiveis-supports-memento.html
- archive.is — https://mementoweb.org/depot/native/archiveis/
- https://mementoweb.org/depot/native/archiveis/
- https://web.archive.org/web/20130915191950/https://mementoweb.org/depot/native/archiveis/
- View Julian Assange - When Google Met WikiLeaks.pdf — https://pdf.yt/d/iZiFQpms8I1pKFs7
- https://pdf.yt/d/iZiFQpms8I1pKFs7
- https://web.archive.org/web/20150721012534/https://pdf.yt/d/iZiFQpms8I1pKFs7
- Julian Assange - Google Is Not What It Seems — https://wikileaks.org/google-is-not-what-it-seems/
- https://wikileaks.org/google-is-not-what-it-seems/
- https://web.archive.org/web/20160114232601/https://wikileaks.org/google-is-not-what-it-seems/
- US Army Official Website Hacked — Syrian Electronic Army — http://sea.sy/article/id/2083/en
- http://sea.sy/article/id/2083/en
- https://web.archive.org/web/20150611183944/http://sea.sy/article/id/2083/en
- Didi Rankovic: Archive.today domain mirror suspended by Faroe Islands council — https://reclaimthenet.org/archive-today-domain-mirror-suspended-by-faroe-islands-council/
- https://reclaimthenet.org/archive-today-domain-mirror-suspended-by-faroe-islands-council/
- https://web.archive.org/web/20211127120517/https://reclaimthenet.org/archive-today-domain-mirror-suspended-by-faroe-islands-council/
- Вадим Елистратов: Роскомнадзор заблокировал сервис archive.is, хранящий копии веб-сайтов — https://tjournal.ru/flood/21966-roskomnadzor-zablokiroval-servis-archive-is-hranyashchiy-kopii-veb-saytov
- https://tjournal.ru/flood/21966-roskomnadzor-zablokiroval-servis-archive-is-hranyashchiy-kopii-veb-saytov
- https://web.archive.org/web/20211127120552/https://tjournal.ru/flood/21966-roskomnadzor-zablokiroval-servis-archive-is-hranyashchiy-kopii-veb-saytov
- Сервис, сохраняющий копии сайтов, признали запрещённым — https://www.m24.ru/articles/svyaz/29012016/95920
- https://www.m24.ru/articles/svyaz/29012016/95920
- https://web.archive.org/web/20211127120552/https://www.m24.ru/articles/svyaz/29012016/95920
- Bryan Menegus: New Zealand ISPs Say They’re Blocking Sites That Fail To Remove Christchurch Shooting Video — https://www.gizmodo.com.au/2019/03/new-zealand-isps-say-theyre-blocking-sites-that-fail-to-remove-christchurch-shooting-video/
- https://www.gizmodo.com.au/2019/03/new-zealand-isps-say-theyre-blocking-sites-that-fail-to-remove-christchurch-shooting-video/
- https://web.archive.org/web/20190518223849/https://www.gizmodo.com.au/2019/03/new-zealand-isps-say-theyre-blocking-sites-that-fail-to-remove-christchurch-shooting-video/
- Методика. Как архивировать открытые данные — https://factcheck.kz/glavnoe/kak-arxivirovat-otkrytye-dannye/
- https://factcheck.kz/glavnoe/kak-arxivirovat-otkrytye-dannye/
- https://web.archive.org/web/20211127120553/https://factcheck.kz/glavnoe/kak-arxivirovat-otkrytye-dannye/
- Jared: rylor — https://twitter.com/rylorjs/status/624587735982944256
- https://twitter.com/rylorjs/status/624587735982944256
- https://web.archive.org/web/20151012120746/https://twitter.com/rylorjs/status/624587735982944256
- Domain problems again — https://blog.archive.today/post/138982909006/domain-problems-again
- https://blog.archive.today/post/138982909006/domain-problems-again
- https://web.archive.org/web/20211127122554/https://blog.archive.today/post/138982909006/domain-problems-again
- archive.today: On the trail of the mysterious guerrilla archivist of the Internet — https://gyrovague.com/2023/08/05/archive-today-on-the-trail-of-the-mysterious-guerrilla-archivist-of-the-internet/
- https://gyrovague.com/2023/08/05/archive-today-on-the-trail-of-the-mysterious-guerrilla-archivist-of-the-internet/
- https://web.archive.org/web/20250824135042/https://gyrovague.com/2023/08/05/archive-today-on-the-trail-of-the-mysterious-guerrilla-archivist-of-the-internet/
- Jon Brodkin: FBI orders domain registrar to reveal who runs mysterious Archive.is site — https://arstechnica.com/tech-policy/2025/11/fbi-subpoena-tries-to-unmask-mysterious-founder-of-archive-today/
- https://arstechnica.com/tech-policy/2025/11/fbi-subpoena-tries-to-unmask-mysterious-founder-of-archive-today/
- https://web.archive.org/web/20251107193919/https://arstechnica.com/tech-policy/2025/11/fbi-subpoena-tries-to-unmask-mysterious-founder-of-archive-today/
- Notorious 'Archive Today' website allegedly leads bizarre DDoS campaign against security blogger — Wikipedia considers removing all links to the Archive — https://www.tomshardware.com/software/search-engines/archive-today-allegedly-leads-bizarre-ddos-campaign-against-security-blogger-wikipedia-considers-removing-all-links-to-the-archive
- https://www.tomshardware.com/software/search-engines/archive-today-allegedly-leads-bizarre-ddos-campaign-against-security-blogger-wikipedia-considers-removing-all-links-to-the-archive
- https://web.archive.org/web/20260215202146/https://www.tomshardware.com/software/search-engines/archive-today-allegedly-leads-bizarre-ddos-campaign-against-security-blogger-wikipedia-considers-removing-all-links-to-the-archive
- Archive.today CAPTCHA page executes DDoS; Wikipedia considers banning site — https://arstechnica.com/tech-policy/2026/02/wikipedia-might-blacklist-archive-today-after-site-maintainer-ddosed-a-blog/
- https://arstechnica.com/tech-policy/2026/02/wikipedia-might-blacklist-archive-today-after-site-maintainer-ddosed-a-blog/
- https://web.archive.org/web/20260215200906/https://arstechnica.com/tech-policy/2026/02/wikipedia-might-blacklist-archive-today-after-site-maintainer-ddosed-a-blog/
- Brodkin: Wikipedia blacklists Archive.today, starts removing 695,000 archive links — https://arstechnica.com/tech-policy/2026/02/wikipedia-bans-archive-today-after-site-executed-ddos-and-altered-web-captures/
- https://arstechnica.com/tech-policy/2026/02/wikipedia-bans-archive-today-after-site-executed-ddos-and-altered-web-captures/
- Wikipedia:Requests for comment/Archive.is RFC 5 — https://en.wikipedia.org/w/index.php?title=Wikipedia:Requests_for_comment/Archive.is_RFC_5&oldid=1339428084
- https://en.wikipedia.org/w/index.php?title=Wikipedia:Requests_for_comment/Archive.is_RFC_5&oldid=1339428084
Литература
- Brunelle J., Kelly M., Weigle M., Nelson M.: The impact of JavaScript on archivability
- Garg K., Jayanetti H., Alam S., Weigle M., Nelson M.: Replaying Archived Twitter: When your bird is broken, will it bring you down?
Ссылки
- Официальный сайт архиватора — https://archive.today
- Официальный блог архиватора — https://blog.archive.today/
- Официальный сайт архиватора
- Официальный блог архиватора