Perma.cc

Perma.cc (Perma) — некоммерческий сервис по архивированию интернет-источников, цитируемых в научных работах и в области правосудия. Портал был создан в 2013 году в формате сотрудничества между Library Innovation Lab и библиотекой Гарвардской школы права. Предпосылкой создания Perma.cc послужило проведённое профессорами юридического факультета Гарвардского университета исследование вымирания ссылок в документах правовой сферы. Оно показало, что более 50 % используемых в судебных решениях электронных ссылок больше не ведут на исходный материал. Для научных журналов аналогичный показатель составил более 60 %. Perma.cc архивирует документы и осуществляет дальнейшее долгосрочное хранение архивированных материалов в партнёрстве с широкой сетью институциональных партнёров, каждый из которых имеет доступ к зеркалам базы данных. К 2019 году на портале было зарегистрировано около пользователей, которые заархивировали более 1 млн ссылок. На 2022 год в сеть Perma.сс входили более 150 учреждений, в том числе, Бостонский колледж, Техасский университет в Остине, «Архив Интернета», «Цифровая публичная библиотека Америки», Библиотека Конгресса, Министерство юстиции США, а также суды штатов Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана и других.
История
Сервис Perma.cc был сформирован в 2013 году в рамках сотрудничества библиотеки Гарвардской школы права и Library Innovation Lab. Предпосылкой для его создания стало проведённое профессорами юридического факультета Гарвардского университета исследование распространённости вымирания ссылок в области юриспруденции. Авторы проанализировали судебные решения Верховного суда США и статьи трёх основных юридических журналов Гарвардского университета — (HLR), (HJLT) и Harvard Human Rights Journal (HRJ). Согласно результатам исследования, более 50 % ссылок в судебных решениях и более 60 % ссылок в научных статьях больше не вели на исходный материал. Исследование согласовало результаты проводимого ранее анализа решений Верховного суда США за 2009—2010 год, согласно которому 29 % цитируемых онлайн-материалов перестали быть доступными.
Авторы опубликованного исследования —, Лоуренс Лессиг и Кендра Альберт — предложили учёным и специалистам в сфере юриспруденции архивировать цитируемые веб-страницы и, в итоге, предотвратить вымирание ссылок. Решить поставленную задачу был призван сервис Perma.cc или Perma, над созданием которого работали исследователи Гарвардского университета и разработчики ПО. Ведущим исполнителем проекта стал Мэтт Филлипс. В обсуждении Perma.cc принимали участие представители более шестидесяти библиотек юридических факультетов, а также, «Архива Интернета» и «Цифровой публичной библиотеки Америки». Проект был задуман как некоммерческий, с финансированием за счёт бюджетов партнёрских библиотек и грантов.
Perma.cc обеспечивает долгосрочное хранение архивированных материалов благодаря широкой сети институциональных партнёров, каждый из которых воспроизводит и пополняет зеркало основной базы данных. На момент запуска у Perma.cc были заключены соглашения с 26 научными учреждениями и некоммерческими организациями, включая, Бостонский колледж, Техасский университет в Остине, «Архив Интернета» и «Цифровую публичную библиотеку Америки». Спустя два года после запуска коллекция Perma.cc включала более 104 тыс. заархивированных страниц, а количество партнёрских организаций увеличилось до 90. К 2019 году на портале зарегистрировались около пользователей, которые в общей сложности заархивировали более 1 млн ссылок. На 2022 год в сеть Perma.сс входили более 150 учреждений, включая Библиотеку Конгресса, Министерство юстиции США, суды штата Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана.
В 2015 году сервис стал победителем международной профессиональной интернет-премии Webby Awards и завоевал награду как лучший веб-проект в области права.
В 2016 году выделил Гарвардской Library Innovation Lab грант размером долларов США на расширение деятельности сервиса на все области науки. Средства были вложены в техническое сопровождение расширения базы пользователей, работу по внедрению Perma.cc в национальные академические библиотеки, а также на разработку системы коммерческих подписок.
В августе 2021 года портал подвергся критике за несовершенную систему хранения материалов — опубликованное в New Scientist исследование статей, заархивированных 17 европейскими и американскими организациями, показало, что некоторые генерируемые Perma.cc ссылки больше не работают.
Принцип работы
Для научных учреждений, журналов и судов доступ к Perma.сс предоставляется бесплатно. Организации-члены могут зарегистрировать для своих сотрудников неограниченное количество учётных записей с безлимитным доступом к архивации веб-материалов. Для каждого члена сети Perma.cc создаётся отдельное пространство, где все аффилированные с организацией пользователи могут совместно работать. В 2017-м портал добавил возможность создания бесплатных учётных записей с возможностью сохранения 10 веб-страниц ежемесячно, а также внедрил систему коммерческих подписок для не связанных с наукой или судебной системой учреждений (таких как частные юридические фирмы). С 2019 года лимит ссылок на архивацию для бесплатных учётных записей был ограничен десятью, без возможности продления ежемесячной подписки.
В отличие от другого крупного сервиса веб-архивирования — Wayback Machine — Perma.cc не использует поисковых роботов для сохранения интернет-страниц, пользователи сервиса самостоятельно архивируют необходимые источники. После получения запроса на архивацию Perma.cc добавляет веб-страницу в формате в Хостинг Amazon S3. Через несколько секунд после этого этапа копия файла WARC автоматически сохраняется на расположенный в Германии сервер. Архивированные версии веб-страниц содержат дополнительные Метаданные, такие как время и дата архивации. Также Perma.cc сохраняет список архиваций каждой отдельной учётной записи.
В результате пользователи получают так называемую perma link — постоянную ссылку на исходный материал, действующую даже в том случае, если первоисточник был удалён. Перейдя по perma link пользователь получает доступ к снимку экрана в формате PNG, сделанному в момент архивирования страницы, а также к сохранённой HTML-версии страницы. В дальнейшем авторы могут использовать данную ссылку в цитировании, вставляя её либо вместо оригинального URL-адреса, либо в дополнении к нему.
Большинство заархивированных через Perma.cc документов находится в открытом доступе. Сервис не архивирует защищённые Пейволлом материалы. Например, при попытке создать perma link на статью в The Wall Street Journal пользователь увидит баннер с просьбой приобрести подписку, а не текст статьи. Однако у сервиса есть и так называемый dark archive («тёмный архив») — коллекция архивированных сайтов, закрытых от публичного доступа по желанию пользователей. Туда сохраняются и веб-страницы, владельцы которых включили в код сайта Стандарт исключений для роботов. Для получения доступа к таким материалам пользователь может оставить запрос через любую партнёрскую организацию.
Perma.cc не несёт ответственности за содержание архивируемых материалов. Согласно правилам сервиса, пользователи могут использовать коллекцию Perma.cc только для некоммерческих целей, не нарушающих чьи-либо авторские и другие права.
Примечания
- Ian Chant: Perma.cc Aims to Bring Staying Power to Online Legal Citations — https://www.libraryjournal.com/?detailStory=perma-cc-aims-to-bring-staying-power-to-online-legal-citations#_
- https://www.libraryjournal.com/?detailStory=perma-cc-aims-to-bring-staying-power-to-online-legal-citations#_
- https://web.archive.org/web/20211203072407/https://www.libraryjournal.com/?detailStory=perma-cc-aims-to-bring-staying-power-to-online-legal-citations#_
- Adam Liptak: In Supreme Court Opinions, Web Links to Nowhere — https://www.nytimes.com/2013/09/24/us/politics/in-supreme-court-opinions-clicks-that-lead-nowhere.html
- https://www.nytimes.com/2013/09/24/us/politics/in-supreme-court-opinions-clicks-that-lead-nowhere.html
- https://web.archive.org/web/20211020052757/https://www.nytimes.com/2013/09/24/us/politics/in-supreme-court-opinions-clicks-that-lead-nowhere.html
- Lepore, J.: The Cobweb — https://www.newyorker.com/magazine/2015/01/26/cobweb
- https://www.newyorker.com/magazine/2015/01/26/cobweb
- https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb
- Jefrey Perkel: The Trouble with Reference Rot — https://www.nature.com/articles/521111a.pdf
- https://www.nature.com/articles/521111a.pdf
- https://web.archive.org/web/20211203080841/https://www.nature.com/articles/521111a.pdf
- Jonathan Zittrain: Fighting ‘link rot’ in court opinions and legal scholarship — https://www.abajournal.com/legalrebels/article/jonathan_zittrain_profile
- https://www.abajournal.com/legalrebels/article/jonathan_zittrain_profile
- https://web.archive.org/web/20211203072456/https://www.abajournal.com/legalrebels/article/jonathan_zittrain_profile
- Aaron Gustafson: Avoiding Link Rot in Print with the Help of Perma.cc — https://medium.com/@AaronGustafson/avoiding-link-rot-in-print-with-the-help-of-perma-cc-412d93d818a2
- https://medium.com/@AaronGustafson/avoiding-link-rot-in-print-with-the-help-of-perma-cc-412d93d818a2
- https://web.archive.org/web/20211124153926/https://medium.com/@AaronGustafson/avoiding-link-rot-in-print-with-the-help-of-perma-cc-412d93d818a2
- Pausing the Internet — https://thepractice.law.harvard.edu/article/pausing-the-internet/
- https://thepractice.law.harvard.edu/article/pausing-the-internet/
- https://web.archive.org/web/20211201135024/https://thepractice.law.harvard.edu/article/pausing-the-internet/
- About — https://perma.cc/
- https://perma.cc/
- https://web.archive.org/web/20211117201248/https://perma.cc/
- Meg Kribble: Congrats to the Webby Award-winning Perma.cc! — https://etseq.law.harvard.edu/2015/04/congrats-to-the-webby-winning-perma-cc/
- https://etseq.law.harvard.edu/2015/04/congrats-to-the-webby-winning-perma-cc/
- https://web.archive.org/web/20211203071936/https://etseq.law.harvard.edu/2015/04/congrats-to-the-webby-winning-perma-cc/
- Webby Awards, Winners 2015 — https://www.webbyawards.com/winners/2015/
- https://www.webbyawards.com/winners/2015/
- https://web.archive.org/web/20200623105315/https://www.webbyawards.com/winners/2015/
- Harvard’s Perma.cc receives grant to expand its tools for saving sources on the Web — https://today.law.harvard.edu/harvards-perma-cc-receives-grant-expand-tools-saving-sources-web-2/
- https://today.law.harvard.edu/harvards-perma-cc-receives-grant-expand-tools-saving-sources-web-2/
- https://web.archive.org/web/20211203071936/https://today.law.harvard.edu/harvards-perma-cc-receives-grant-expand-tools-saving-sources-web-2/
- Leif Johnson: The Million Dollar Homepage is a Million Dollar Graveyard — https://www.vice.com/en/article/59pew5/the-million-dollar-homepage-is-a-million-dollar-graveyard
- https://www.vice.com/en/article/59pew5/the-million-dollar-homepage-is-a-million-dollar-graveyard
- https://web.archive.org/web/20211203071937/https://www.vice.com/en/article/59pew5/the-million-dollar-homepage-is-a-million-dollar-graveyard
- Chris Stokel-Walker: Digital archives meant to be permanent seem to be lost on the web — https://www.newscientist.com/article/2288653-digital-archives-meant-to-be-permanent-seem-to-be-lost-on-the-web/
- https://www.newscientist.com/article/2288653-digital-archives-meant-to-be-permanent-seem-to-be-lost-on-the-web/
- https://web.archive.org/web/20211203071936/https://www.newscientist.com/article/2288653-digital-archives-meant-to-be-permanent-seem-to-be-lost-on-the-web/
- Веб-архивы не гарантируют сохранности данных — американские ученые
- https://web.archive.org/web/20211203071936/rossaprimavera.ru/news/fe9e416c
- Евгения Ударцева: Вечная жизнь для ссылок — https://nag.ru/news/22292
- https://nag.ru/news/22292
- https://web.archive.org/web/20211203072024/https://nag.ru/news/22292
- Death To “Link Rot”: Here’s Where The Internet Goes To Live Forever — https://www.fastcompany.com/3028321/death-to-link-rot-heres-where-the-internet-goes-to-live-forever
- https://www.fastcompany.com/3028321/death-to-link-rot-heres-where-the-internet-goes-to-live-forever
- https://web.archive.org/web/20211203072023/https://www.fastcompany.com/3028321/death-to-link-rot-heres-where-the-internet-goes-to-live-forever
- Jacob Kastrenakes: Supreme Court citations are falling apart as web links begin to change and disappear — https://www.theverge.com/2013/9/23/4763646/half-of-supreme-court-web-citations-have-changed-or-disappeared
- https://www.theverge.com/2013/9/23/4763646/half-of-supreme-court-web-citations-have-changed-or-disappeared
- https://web.archive.org/web/20211123215826/https://www.theverge.com/2013/9/23/4763646/half-of-supreme-court-web-citations-have-changed-or-disappeared
- About — https://perma.cc/about
- https://perma.cc/about
- https://web.archive.org/web/20211124175155/https://perma.cc/about
- How should we guard against link rot? — https://www.thomaswhitley.com/blog/how-should-we-guard-against-link-rot
- https://www.thomaswhitley.com/blog/how-should-we-guard-against-link-rot
- https://web.archive.org/web/20211203072026/https://www.thomaswhitley.com/blog/how-should-we-guard-against-link-rot
- Introducing Individual Account Subscription Tiers for Perma — https://blogs.harvard.edu/perma/2019/01/07/introducing-individual-account-subscription-tiers-for-perma/
- https://blogs.harvard.edu/perma/2019/01/07/introducing-individual-account-subscription-tiers-for-perma/
- https://web.archive.org/web/20211028032223/https://blogs.harvard.edu/perma/2019/01/07/introducing-individual-account-subscription-tiers-for-perma/
- Ben Steinberg — https://lil.law.harvard.edu/blog/2019/03/27/some-thoughts-on-digital-preservation/
- https://lil.law.harvard.edu/blog/2019/03/27/some-thoughts-on-digital-preservation/
- https://web.archive.org/web/20211203072054/https://lil.law.harvard.edu/blog/2019/03/27/some-thoughts-on-digital-preservation/
- Joseph Cox: Motherboard Made a Tool That Archives Websites on Demand — https://www.vice.com/en/article/wj7mkb/mass-archive-tool-python-wayback-machine-perma-achiveis
- https://www.vice.com/en/article/wj7mkb/mass-archive-tool-python-wayback-machine-perma-achiveis
- https://web.archive.org/web/20211203072044/https://www.vice.com/en/article/wj7mkb/mass-archive-tool-python-wayback-machine-perma-achiveis
- Новый сервис сделает интернет-ссылки «вечными» — https://lenta.ru/news/2013/10/16/perma/
- https://lenta.ru/news/2013/10/16/perma/
- https://web.archive.org/web/20211204084946/https://lenta.ru/news/2013/10/16/perma/
- Библиотекари США разработали новый сервис, который позволит создавать "вечные" интернет-ссылки — https://focus.ua/lifestyle/286384
- https://focus.ua/lifestyle/286384
- https://web.archive.org/web/20211204084945/https://focus.ua/lifestyle/286384
Литература
- Callister P.G.: Perma.cc and Web Archival Dissonance with Copyright Law
- Craigle V.: Adopting DOI in Legal Citation: A Roadmap for the Legal Academy
- Dulin K., Ziegler A.: Scaling Up Perma.cc: Ensuring the Integrity of the Digital Scholarly Record — http://www.dlib.org/dlib/may17/dulin/05dulin.html
- Flyntz M.: Ever Onward: Expanding the Use of Perma.cc
- Gertler A., Bullock J.: Reference Rot: An Emerging Threat to Transparency in Political Science
- Klein M., Sompel H., Sanderson R., Shankar H., Balakireva L., Zhou K., Tobin R.: Scholarly Context Not Found: One in Five Articles Suffers from Reference Rot
- Lepore J.: The Cobweb
- Probst S.: Available At?: The Tenuous Nature of Online Authority Cited in Arkansas Judicial Opinion — https://ssrn.com/abstract=3561728
- Riss P.: Reference rot: does it matter?
- Stanton C.: Perma and Citation at the Modern Law Firm
- , Albert K., Lawrence Lessig L.: Perma: scoping and addressing the problem of link and reference rot in legal citations
- http://www.dlib.org/dlib/may17/dulin/05dulin.html
- https://ssrn.com/abstract=3561728
Ссылки
- Официальный сайт — https://perma.cc/
- Официальный сайт