Perma.cc
Perma.cc | |
---|---|
Perma.cc | |
URL | perma.cc |
Коммерческий | Нет |
Тип сайта | Веб-архив |
Язык (-и) | Английский |
Начало работы | 2013 год |
Текущий статус | работает |
Perma.cc (Perma) — некоммерческий сервис по архивированию интернет-источников, цитируемых в научных работах и в области правосудия. Портал был создан в 2013 году в рамках сотрудничества между Library Innovation Lab и библиотекой Гарвардской школы права. Предпосылкой создания Perma.cc послужило проведённое профессорами юридического факультета Гарвардского университета исследование вымирания ссылок в документах правовой сферы. Оно показало, что более 50 % используемых в судебных решениях электронных ссылок больше не ведут на исходный материал. Для научных журналов аналогичный показатель составил более 60 %.
Perma.cc архивирует документы и осуществляет дальнейшее долгосрочное хранение архивированных материалов в партнёрстве с широкой сетью институциональных партнёров, каждый из которых имеет доступ к зеркалам базы данных. К 2019 году на портале было зарегистрировано около 25 000 пользователей, которые заархивировали более 1 млн ссылок. На 2022 год в сеть Perma.сс входили более 150 учреждений, в том числе Библиотеки Стэнфордского университета[англ.], Бостонский колледж, Техасский университет в Остине, «Архив Интернета», «Цифровая публичная библиотека Америки», Библиотека Конгресса, Министерство юстиции США, а также суды штатов Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана и других.
История
[править | править код]Сервис Perma.cc был создан в 2013 году в рамках сотрудничества библиотеки Гарвардской школы права и Library Innovation Lab[1][2]. Предпосылкой для его создания стало проведённое профессорами юридического факультета Гарвардского университета исследование распространённости вымирания ссылок в области юриспруденции. Авторы проанализировали судебные решения Верховного суда США и статьи трёх основных юридических журналов Гарвардского университета — Harvard Law Review[англ.] (HLR), Harvard Journal of Law & Technology[англ.] (HJLT) и Harvard Human Rights Journal (HRJ). Согласно результатам исследования, более 50 % ссылок в судебных решениях и более 60 % ссылок в научных статьях больше не вели на исходный материал[3][4][1][3]. Исследование согласовало результаты проводимого ранее анализа решений Верховного суда США за 2009—2010 год, согласно которому 29 % цитируемых онлайн-материалов перестали быть доступными[3][5][6].
Авторы опубликованного исследования — Джонатан Зиттрейн[англ.], Лоуренс Лессиг и Кендра Альберт — предложили учёным и специалистам в сфере юриспруденции архивировать цитируемые веб-страницы и, таким образом, предотвратить вымирание ссылок. Решить поставленную задачу был призван сервис Perma.cc или Perma, над созданием которого работали исследователи Гарвардского университета и разработчики ПО. Ведущим исполнителем проекта стал Мэтт Филлипс[1][2]. В обсуждении Perma.cc принимали участие представители более шестидесяти библиотек юридических факультетов, а также Центра Беркмана по изучению Интернета и общества[англ.], «Архива Интернета» и «Цифровой публичной библиотеки Америки»[7][8][1]. Проект был задуман как некоммерческий, с финансированием за счёт бюджетов партнёрских библиотек и грантов[9][10].
Perma.cc обеспечивает долгосрочное хранение архивированных материалов благодаря широкой сети институциональных партнёров, каждый из которых воспроизводит и пополняет зеркало основной базы данных[1]. На момент запуска у Perma.cc были заключены соглашения с 26 научными учреждениями и некоммерческими организациями, включая Библиотеки Стэнфордского университета[англ.], Бостонский колледж, Техасский университет в Остине, «Архив Интернета» и «Цифровую публичную библиотеку Америки». Спустя два года после запуска коллекция Perma.cc включала более 104 тыс. заархивированных страниц[11], а количество партнёрских организаций увеличилось до 90[12][6]. К 2019 году на портале зарегистрировались около 25 000 пользователей, которые в общей сложности заархивировали более 1 млн ссылок[2]. На 2022 год в сеть Perma.сс входили более 150 учреждений[13], включая Библиотеку Конгресса, Министерство юстиции США, суды штата Теннесси, Аризоны, Висконсина, Вермонта, Вашингтона, Массачусетса, Монтаны, Индианы, Мичигана[14][6].
В 2015 году сервис стал победителем международной профессиональной интернет-премии Webby Awards и получил награду как лучший веб-проект в области права[15][16].
В 2016 году Институт музейного и библиотечного обслуживания США[англ.] выделил Гарвардской Library Innovation Lab грант размером 700 000 долларов США на расширение деятельности сервиса на все области науки[17][18]. Средства были вложены в техническое сопровождение расширения базы пользователей, работу по внедрению Perma.cc в национальные академические библиотеки, а также на разработку системы коммерческих подписок[19].
В августе 2021 года портал подвергся критике за несовершенную систему хранения материалов — опубликованное в New Scientist исследование 16 627 статей, заархивированных 17 европейскими и американскими организациями, показало, что некоторые генерируемые Perma.cc ссылки больше не работают[20][21].
Принцип работы
[править | править код]Для научных учреждений, журналов и судов доступ к Perma.сс предоставляется бесплатно. Организации-члены могут зарегистрировать для своих сотрудников неограниченное количество учётных записей с безлимитным доступом к архивации веб-материалов[22][14][23][5]. Для каждого члена сети Perma.cc создаётся отдельное пространство, где все аффилированные с организацией пользователи могут совместно работать[24]. В 2017-м портал добавил возможность создания бесплатных учётных записей с возможностью сохранения 10 веб-страниц ежемесячно, а также внедрил систему коммерческих подписок для не связанных с наукой или судебной системой учреждений (таких как частные юридические фирмы)[22][10][25][26][6][27]. С 2019 года лимит ссылок на архивацию для бесплатных учётных записей был ограничен десятью, без возможности продления ежемесячной подписки[28].
В отличие от другого крупного сервиса веб-архивирования — Wayback Machine — Perma.cc не использует поисковых роботов для сохранения интернет-страниц, пользователи сервиса самостоятельно архивируют необходимые источники. После получения запроса на архивацию Perma.cc добавляет веб-страницу в формате WARC[англ.] в хостинг Amazon S3. Через несколько секунд после этого копия файла WARC автоматически сохраняется на расположенный в Германии сервер[29][14][6]. Архивированные версии веб-страниц содержат дополнительные метаданные, такие как время и дата архивации[24]. Также Perma.cc сохраняет список архиваций каждой отдельной учётной записи[30].
В результате пользователи получают так называемую perma link — постоянную ссылку на исходный материал, действующую даже в том случае, если первоисточник был удалён[31][22][32][33]. Перейдя по perma link пользователь получает доступ к снимку экрана в формате PNG, сделанному в момент архивирования страницы, а также к сохранённой HTML-версии страницы[11][9]. Впоследствии авторы могут использовать данную ссылку в цитировании, вставляя её либо вместо оригинального URL-адреса, либо в дополнении к нему[31][24][34].
Большинство заархивированных через Perma.cc документов находится в открытом доступе[24]. Сервис не архивирует защищённые пейволлом материалы. Например, при попытке создать perma link на статью в The Wall Street Journal пользователь увидит баннер с просьбой приобрести подписку, а не текст статьи[1]. Однако у сервиса есть и так называемый dark archive («тёмный архив») — коллекция архивированных сайтов, закрытых от публичного доступа по желанию пользователей. Туда сохраняются и веб-страницы, владельцы которых включили в код сайта стандарт исключений для роботов. Для получения доступа к таким материалам пользователь может оставить запрос через любую партнёрскую организацию[11][8][35].
Perma.cc не несёт ответственности за содержание архивируемых материалов. Согласно правилам сервиса, пользователи могут использовать коллекцию Perma.cc только для некоммерческих целей, не нарушающих чьи-либо авторские и другие права[22].
Примечания
[править | править код]- ↑ 1 2 3 4 5 6 Ian Chant. Perma.cc Aims to Bring Staying Power to Online Legal Citations . Library Journal (2 октября 2013). Дата обращения: 12 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ 1 2 3 Pausing the Internet . The Practice (март 2019). Дата обращения: 15 ноября 2021. Архивировано 1 декабря 2021 года.
- ↑ 1 2 3 Flyntz, 2015, с. 39—59.
- ↑ Adam Liptak. In Supreme Court Opinions, Web Links to Nowhere . The New York Times (23 сентября 2013). Дата обращения: 10 ноября 2021. Архивировано 20 октября 2021 года.
- ↑ 1 2 Евгения Ударцева. Вечная жизнь для ссылок . Nag News (18 октября 2010). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ 1 2 3 4 5 Stanton, 2019, с. 14—15.
- ↑ Jill Lepore. The Cobweb . New Yorker (19 января 2015). Дата обращения: 12 ноября 2021. Архивировано 25 января 2015 года.
- ↑ 1 2 Jefrey Perkel. The Trouble with Reference Rot . Nature. Дата обращения: 13 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ 1 2 Flyntz, 2015, с. 39=59.
- ↑ 1 2 Death To “Link Rot”: Here’s Where The Internet Goes To Live Forever . Fast Company (28 марта 2014). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ 1 2 3 Jonathan Zittrain: Fighting ‘link rot’ in court opinions and legal scholarship . ABA Journal (24 сентября 2014). Дата обращения: 16 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Aaron Gustafson. Avoiding Link Rot in Print with the Help of Perma.cc . Medium (3 декабря 2015). Дата обращения: 13 ноября 2021. Архивировано 24 ноября 2021 года.
- ↑ About . Perma.cc. Дата обращения: 17 ноября 2021. Архивировано 17 ноября 2021 года.
- ↑ 1 2 3 Probst, 2020, с. 35—59.
- ↑ Meg Kribble. Congrats to the Webby Award-winning Perma.cc! HLSL. Дата обращения: 8 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Webby Awards, Winners 2015 . Webby Awards. Дата обращения: 17 ноября 2021. Архивировано 23 июня 2020 года.
- ↑ Harvard’s Perma.cc receives grant to expand its tools for saving sources on the Web . Harvard Law Today (14 апреля 2016). Дата обращения: 12 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Leif Johnson. The Million Dollar Homepage is a Million Dollar Graveyard . Vice (24 июля 2017). Дата обращения: 11 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Dulin, 2017.
- ↑ Chris Stokel-Walker. Digital archives meant to be permanent seem to be lost on the web . New Scientist (30 августа 2021). Дата обращения: 18 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Веб-архивы не гарантируют сохранности данных — американские ученые . Красная Весна. Дата обращения: 18 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ 1 2 3 4 Callister, 2021, с. 1—57.
- ↑ Lepore, 2015.
- ↑ 1 2 3 4 Zittrain, 2014, с. 165—188.
- ↑ Jacob Kastrenakes. Supreme Court citations are falling apart as web links begin to change and disappear . The Verge (23 сентября 2013). Дата обращения: 13 ноября 2021. Архивировано 23 ноября 2021 года.
- ↑ About . Perma.cc. Дата обращения: 16 ноября 2021. Архивировано 24 ноября 2021 года.
- ↑ How should we guard against link rot? Thomas Whitley (13 марта 2015). Дата обращения: 15 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Introducing Individual Account Subscription Tiers for Perma . Harvard Blogs (7 января 2019). Дата обращения: 10 ноября 2021. Архивировано 28 октября 2021 года.
- ↑ Ben Steinberg . Library Innovation Lab. Дата обращения: 17 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ Joseph Cox. Motherboard Made a Tool That Archives Websites on Demand . Vice (1 мая 2018). Дата обращения: 6 ноября 2021. Архивировано 3 декабря 2021 года.
- ↑ 1 2 Riss, 2015, с. 1251—1252.
- ↑ Новый сервис сделает интернет-ссылки «вечными» . Lenta.ru (16 октября 2013). Дата обращения: 15 ноября 2021. Архивировано 4 декабря 2021 года.
- ↑ Библиотекари США разработали новый сервис, который позволит создавать "вечные" интернет-ссылки . Фокус (17 октября 2013). Дата обращения: 18 ноября 2021. Архивировано 4 декабря 2021 года.
- ↑ Craigle, 2021.
- ↑ Craigle, 2021, с. 1—13.
Литература
[править | править код]- Callister P.G. Perma.cc and Web Archival Dissonance with Copyright Law // Legal Reference Services Quarterly. — 2021. — Т. 40, вып. 1. — С. 1—57. — doi:10.1080/0270319X.2021.1886785.
- Craigle V. Adopting DOI in Legal Citation: A Roadmap for the Legal Academy // Virtual Symposium on Citation and the Law, University of Utah College of Law Research Paper. — 2021. — С. 1—13.
- Dulin K., Ziegler A. Scaling Up Perma.cc: Ensuring the Integrity of the Digital Scholarly Record // D-Lib Magazine. — 2017. — Т. 23, вып. 6. — doi:10.1045/may2017-dulin.
- Flyntz M. Ever Onward: Expanding the Use of Perma.cc // Legal Reference Services Quarterly. — 2015. — Т. 34, вып. 1. — С. 39—59.
- Gertler A., Bullock J. Reference Rot: An Emerging Threat to Transparency in Political Science // American Political Science Association. — 2017. — С. 166—171.
- Klein M., Sompel H., Sanderson R., Shankar H., Balakireva L., Zhou K., Tobin R. Scholarly Context Not Found: One in Five Articles Suffers from Reference Rot // PLoS One. — 2014. — Т. 9, вып. 12. — doi:10.1371/journal.pone.0115253.
- Lepore J. The Cobweb // Annals of Technology. — 2015. — С. 1—13.
- Probst S. Available At?: The Tenuous Nature of Online Authority Cited in Arkansas Judicial Opinion // Arkansas Law Notes. — 2020. — Вып. 35. — С. 25—39.
- Riss P. Reference rot: does it matter? // Int Urogynecol J. — 2015. — Вып. 26. — С. 1251—1252. — doi:10.1007/s00192-015-2707-8.
- Stanton C. Perma and Citation at the Modern Law Firm // Michigan Bar Journal. — 2019. — С. 14—15.
- Zittrain J., Albert K., Lawrence Lessig L. Perma: scoping and addressing the problem of link and reference rot in legal citations // Harvard Law Review Forum. — 2014. — Т. 125, вып. 165. — С. 165—188.