Interested Article - Цифровой тёмный век


- 2020-01-08
- 1
Цифрово́й тёмный век — понятие, описывающее потенциальное исчезновение исторических данных в информационную эру из-за потери доступа к электронным документам. К этому сценарию могут привести отсутствие практик электронного архивирования , устаревание форматов файлов и носителей информации . Понятие «цифровой тёмный век» является отсылкой к термину « Тёмные века », часто используемому для описания Средневековья .
Проблему начали обсуждать уже в конце 1990-х годов, когда сохранённые в старых форматах файлы перестали быть доступными, а магнитные ленты и диски начали портиться, что привело к исчезновению многих крупных баз данных. Со временем был утерян доступ и к постепенно вышедшим из оборота накопителям и носителям информации, включая дискеты , zip-накопители и компакт-диски . Для обозначения исчезновения информации в 1997 году на конференции Международной федерации библиотечных ассоциаций и учреждений было предложено использовать термин «цифровой тёмный век».
Для предотвращения наступления «тёмного века» исследователи предлагают развивать практики электронного архивирования и создавать бумажные копии цифровых данных.
Характеристика
Традиционно архивированием и сохранением информации занимались монахи и монастыри. Их работа обеспечила сохранность информации о наследии греческих , римских и арабских культур . С распространением книгопечатания в XV веке эти обязанности постепенно перешли к библиотекарям и архивариусам частных и публичных библиотек , отслеживающих информацию об имущественных правах, налоговых документах, импорте и экспорте . Вплоть до начала информационной эры в конце XX столетия подавляющее большинство материалов хранилось на бумажных носителях. Несмотря на существующую опасность пожелтения страниц и потенциальную уязвимость перед огнём, водой и разрушением из-за времени, такие документы были универсально доступны .
С наступлением « информационной эры » обмен данными стал преимущественно цифровым . Поэтому всё больше исследователей стали задаваться вопросом, что произойдёт в случае полного перехода на электронный формат при одновременном отсутствии физических копий, вроде печатных документов и фотографий. По их мнению, существует риск, что многие данные будут однажды утеряны и будущие поколения не смогут получить к ним доступ .
Уже к концу 1990-х годов стали очевидны недостатки архивирования электронных документов. Так, сохранённые в старых форматах файлы перестали быть доступными, а магнитные ленты и диски начали портиться, что привело к исчезновению многих крупных баз данных . Со временем был утерян доступ к постепенно вышедшим из оборота накопителям и носителям информации, включая дискеты , zip-накопители и компакт-диски .
В 1997 году на конференции Международной федерации библиотечных ассоциаций и учреждений исследователи впервые предложили использовать термин Digital Dark Age или «цифровой тёмный век» для описания этой проблемы. Словосочетание «тёмный век» является отсылкой к эпохе средних веков — периоду, который характеризовался практически полным отсутствием письменных свидетельств . Другие эксперты называют XXI век «информационной чёрной дырой» из опасения, что программное обеспечение и компьютеры будущего не смогут воспроизвести созданные в наше время данные . В 2015 году американский учёный и вице-президент Google Винтон Серф выступил с заявлением, что человечество движется к «цифровому тёмному веку». В своём выступлении в он выразил обеспокоенность общим состоянием сохранения электронных материалов и выступил за разработку практик архивирования электронной информации в соответствии с законодательством об авторском праве .
Причины
С архивированием цифровых данных в XXI веке связаны две основные проблемы. Первая — это необходимость сохранения физического носителя в рабочем состоянии. Политические кризисы, а также природные катастрофы, вроде наводнений и землетрясений, могут помешать обслуживанию оборудования и поддержанию его в рабочем состоянии .
Вторая причина связана с устареванием форматов — многие из них в будущем могут оказаться нечитаемыми. Это связано с развитием программного обеспечения, появлением новых форматов файлов и окончанием поддержки старых .
Примеры

В 1986 году BBC запустил проект BBC Domesday Project (или «Судный день») в честь 900-летия Книги Страшного суда — свода материалов, созданных в 1086 году по приказу Вильгельма Завоевателя . Король заказал подробное исследование земельных владений своего королевства и объединил полученные данные в пятитомное издание, в настоящее время хранящееся в . В проекте BBC приняло участие более миллиона человек, включая детей примерно из 9000 школ по всей Великобритании, которых попросили задокументировать их родные города. Собранная с помощью краудсорсинга информация была объединена с профессиональными фотографиями, картами, видео-турами по историческим местам и всей переписью населения 1981 года. Впоследствии все данные были загружены на несколько лазерных дисков. Однако к началу 2000-х годов оказалось, что почти все физические носители проекта Domesday были сломаны или утеряны, а данные — безвозвратно потеряны .
Другим примером является программа НАСА Lunar Or , в рамках которой были сделаны подробные фотографии лунной поверхности . Все изображения были записаны на магнитные ленты , которые могли быть прочитаны только с помощью редкой модели LTO . По этой причине доступ к материалам был потерян на несколько десятилетий, его возобновили только после долгосрочного анализа данных и изучения механизма работы машин, записывающих информацию на магнитные ленты .
В 1995 году правительство США чуть не потеряло доступ к части данных национальной переписи населения из-за устаревшей технологии поиска данных .
В 2019 году стало известно, что социальная сеть Myspace удалила всю музыку, загруженную на сайт в период с 2003 по 2015 год. Были удалены примерно 53 млн файлов. Безвозвратная потеря данных вызвала широкую общественную реакцию .
В декабре 2018 года правительство штата Мэн сообщило о потере большого количества документации, произведённой за 2005—2011 годы администрацией губернаторов Ангуса Кинга и Джона Бальдаччи . В число утерянных данных вошла бо́льшая часть электронных писем, отправленных от лица правительства штата до 2008 года .
В 2019 году социальная сеть Google+ прекратила свою работу, удалив профили основателей и ведущих сотрудников компании — Сундара Пичаи , Эрика Шмидта , Сергея Брина и Ларри Пейджа . Это привело к потере данных о принятии некоторых ключевых решений в истории Google, например, разъяснений политики компании в отношении программы PRISM в 2013 году .
Предотвращение
Создание общих стандартов
Одним из главных условий повсеместного внедрения практик электронного архивирования является развитие общих стандартов по сохранению цифровых материалов. Так, впервые опубликованный в 1997 году международный стандарт (OAIS) определяет подходы и решения в области электронного архивирования . OAIS содержит описание «архивного пакета» и «цифровых объектов». Впоследствии стандарт стал прототипом для будущих инициатив по созданию электронных репозиториев , доступу к существующим базам данных и метаданным . В 2003 году OAIS утвердили в качестве международного стандарта IISO 14721:2003 «Базовая модель открытой архивной информационной системы» (Open Archival Information System) l (OAIS) .
Другим основополагающим стандартом является DOD 5015.2, созданный в результате серии международных коллабораций , инициированных в 1994—1997 годах Университетом Британской Колумбии совместно с Министерством обороны США и Национальным управлением архивов и документации США .
Технические стратегии
«Цифровой тёмный век» можно предотвратить при внедрении ряда технических стратегий по сохранению электронных документов. Одной из таких стратегий является консервация — работа с материалами в оригинальных форматах и на оригинальных носителях. В результате исходная информация доступна в первозданном формате .
К другим способам архивирования относят эмуляцию (воспроизведение функциональной системы для обеспечения доступа к устаревшим файлам и форматам) , инкапсуляцию (включение технического описания документа в состав самого цифрового объекта, благодаря чему уменьшается его зависимость от внешней среды) , а также миграцию (перенос электронных документов на другие носители или же в другую операционную систему, например, с магнитной ленты на компакт-диск). Последний способ является одним из самых популярных, поскольку позволяет сохранить целостность цифрового материала и способность пользователей находить и использовать информацию и не зависеть от устаревания технологий . В отдельных случаях применяют археологию данных или спасение электронных объектов, которые стали недоступными из-за технологического устаревания и/или физической деградации. Однако ввиду высокой стоимости и отсутствия гарантий на восстановление использование подобного метода обычно считается вынужденной мерой .
Архивирование интернета
В 1996 году в Сан-Франциско американский программист Брюстер Кейл основал некоммерческую организацию Архив Интернета . Деятельность «Архива» направлена на архивирование всей когда-либо опубликованной в интернете информации. Коллекция состоит из множества архивированных веб-сайтов, оцифрованных книг, аудио и видео файлов, игр, программного обеспечения. В 2001 году Кейл запустил отдельный сервис Wayback Machine , занимающийся сохранением веб-страниц с помощью поисковых роботов или веб-краулеров . Архивные снимки отображаются в формате HTML , JavaScript и CSS . На июль 2021 года Wayback Machine предоставлял доступ к более чем 591 млрд сохранённых веб-страниц .
К другим аналогичным проектам относят созданный Библиотекой Гарвардской школы права портал Perma.cc , сайт archive.today , а также WebCite .
Проекты
В 2007 году Национальные архивы Великобритании и Microsoft объявили о начале сотрудничества в сфере архивирования данных. В рамках совместного проекта компания работала с Британской библиотекой над установкой Virtual PC — программного пакета визуализации, позволяющим пользователем запускать сразу несколько операционных систем одновременно и получать доступ к устаревшим форматом Microsoft Office . Так, только в архивах Великобритании хранится около 580 терабайт данных, записанных на старых версиях Office .
В 2018 году по результатам ежегодного Всемирного экономического форума в Давосе было принято решение запустить Global Centre for Cybersecurity. Деятельность центра направлена на предотвращение наступления цифрового тёмного века . Над долгосрочным контролем и поддержанием электронных материалов работают службы цифрового хранения, такие как , HathiTrust и .
В рамках борьбы с проблемой потери цифровых данных многие издания архивируют собственные выпуски. Так, The Economist предоставляет электронные копии каждого номера, начиная с первого выпуска в 1843 году , а The New York Times инициировала проект по сохранению онлайн-контента. На официальном сайте газеты размещена копия HTML -страниц с момента их первой публикации, с сохранением дизайна .
Одними из первых организаций, начавших разрабатывать практики по сохранению электронных писем, стали Архивы Смитсоновского института . В своих коллекциях Архивы хранят записи электронной почты, относящиеся к 1980-м годам и созданные с помощью ELM . Под руководством Библиотеки Конгресса действовала архивная программа , занимающаяся распространением информации о проблемах сохранения цифровых данных .
Архивированием научных работ занимаются такие проекты как , DSpace , arXiv.org , JSTOR , Public Library of Science (PLoS), . По состоянию на октябрь 2021 года насчитывает более 16 900 журналов открытого доступа и более 5 млн статей .
Критика
Отдельные исследователи и журналисты указывают на то, что повседневные цифровые данные не нуждаются в дополнительном архивировании по причине того, что интернет и так переполнен информацией, которую люди добавляют в свои аккаунты в социальных сетях. Поэтому у следующих поколений не будет проблем с доступом к информации . Другие критикуют термин за его предполагаемый «алармистский» характер. По мнению сторонников этой теории, в области сохранения данных уже был достигнут значительный прогресс и использование такой риторики только преувеличивает проблему и намеренно искажает ситуацию .
См. также
Примечания
- Tim Harford. . BBC (13 марта 2017). Дата обращения: 2 октября 2021. 7 октября 2021 года.
- ↑ .
- ↑ Richard Ovenden. . The Economist (21 февраля 2019). Дата обращения: 28 сентября 2021. 19 октября 2021 года.
- ↑ .
- ↑ . The Guardian (3 марта 2002). Дата обращения: 27 сентября 2021. 20 января 2013 года.
- ↑ Veronique Greenwood. . Yale Alumni Magazine (июнь 2020). Дата обращения: 27 сентября 2021. 15 октября 2021 года.
- Dan Greene. . Vox (21 апреля 2021). Дата обращения: 28 сентября 2021. 26 сентября 2021 года.
- .
- Adam Wernick. . The World (1 января 2018). Дата обращения: 26 сентября 2021. 16 августа 2021 года.
- . The Times of India (17 сентября 2020). Дата обращения: 27 сентября 2021. 8 сентября 2021 года.
- Lauren Maffeo. . The Guardian (29 мая 2015). Дата обращения: 27 сентября 2021. 19 ноября 2021 года.
- Dave Smith. . Business Insider (20 февраля 2015). Дата обращения: 28 сентября 2021. 19 ноября 2021 года.
- Николай Удинцев. . Look at Me (13 февраля 2015). Дата обращения: 28 сентября 2021. 19 ноября 2021 года.
- , с. 553—570.
- Kurt Bollacker. . American Scientist. Дата обращения: 26 сентября 2021. 1 августа 2020 года.
- .
- Damon Krukowski. . Pitchfork (19 марта 2019). Дата обращения: 28 сентября 2021. 21 октября 2021 года.
- Zoe Klenman. . BBC News (18 марта 2019). Дата обращения: 28 сентября 2021. 4 октября 2021 года.
- Molly Wood. . WHYY PBS (9 апреля 2019). Дата обращения: 28 сентября 2021. 20 ноября 2021 года.
- Daniel Van Boo,. . C Net (3 апреля 2019). Дата обращения: 28 сентября 2021. 9 августа 2021 года.
- ↑ Баласанян В.Э. . Отечественные архивы (2019). Дата обращения: 5 августа 2021. 25 августа 2021 года.
- , с. 6—7.
- , с. 68—78.
- , с. 387—297.
- . InterPARES Project. Дата обращения: 7 августа 2021. 12 мая 2021 года.
- , с. 7—8.
- .
- ↑ , с. 93—106.
- . PADI. Дата обращения: 23 июля 2021. 24 августа 2011 года.
- .
- ↑ , с. 1—26.
- .
- , с. 1741—1755.
- Michael Bryant. Groovy Post (22 апреля 2021). Дата обращения: 29 мая 2021. 18 мая 2021 года.
- . Wayback Machine. Дата обращения: 7 июня 2021.
- , с. 343—347.
- , с. 111—112.
- Martin Brinkmann. . G Hacks (22 апреля 2015). Дата обращения: 2 ноября 2021. 12 апреля 2019 года.
- . WebCite. Дата обращения: 4 ноября 2021. 29 сентября 2011 года.
- Maev Kennedy. . The Guardian (4 июля 2007). Дата обращения: 26 сентября 2021. 17 июля 2010 года.
- . The Conversation (6 февраля 2018). Дата обращения: 28 сентября 2021. 22 ноября 2021 года.
- The Deakin Library blog (15 января 2019). Дата обращения: 27 сентября 2021. 22 ноября 2021 года.
- . The Economist. Дата обращения: 28 сентября 2021. 17 октября 2021 года.
- Shan Wang. . NiemanLab (12 апреля 2018). Дата обращения: 8 февраля 2021. 22 января 2021 года.
- . Smithsonian Institution Archives. Дата обращения: 4 августа 2021. 27 августа 2021 года.
- . Library of Congress. Дата обращения: 4 августа 2021. 4 августа 2021 года.
- .
- , с. 423—432.
- . DOAJ. Дата обращения: 3 октября 2021. 27 августа 2016 года.
- Larry Cebula. . Slate (22 июля 2013). Дата обращения: 28 сентября 2021. 22 ноября 2021 года.
- .
Литература
- Arora S., Li Y., Youtie J., Shapira P. Using the wayback machine to mine websites in the social sciences: A methodological resource. — 2015. — Т. 67 , вып. 8 . — С. 1904—1915 . — doi : .
- Baucom E. A Brief History of Digital Preservation // University of Montana. — 2019. — С. 3—19 .
- D. Bollacker K. Computing Science: Avoiding a Digital Dark Age // American Scientist. — 2010. — Т. 98 , вып. 2 . — С. 106—110 .
- Giaretta D. Avoiding a Digital Dark Age for data: why publishers shoudl care about digital preservation // Learned Publishing. — 2011. — С. 1—18 .
- Jeffrey S. A new Digital Dark Age? Collaborative web tools, social media and long-term preservation // Open Archeology. — 2012. — Т. 44 , вып. 4 . — С. 553—570 . — doi : .
- Kuny T. A Digital Dark Ages? Challenges in the Preservation of Electronic Information // 63RD IFLA Council and General Conference. — 1997.
- Panos P. // Journal of Social Work Education. — 2003. — Т. 39 , вып. 2 . — С. 343—347 . — doi : .
- Rosenzweig R. carcity or Abundance? Preserving the Past in a Digital Era // American Historical Review. — 2003. — Т. 103 , вып. 3 . — С. 735—762 .
- Fan G. Making Better out of Technologies: Responses of Interpares to Digital Records Management Challenges // FR-HT 2018 - Special Session on Managing Digital Data, Information and Records: Firm Responses to Hard Technologies. — 2018. — С. 387—397 .
- Duranti L., Preston R. International Research on Permanent Authentic Records in Electronic Systems (InterPARES) 2: Experiential, Interactive and Dynamic Records. — Associazione Nazionale Archivistica Italiana. — Padova, Italy, 2008.
- Lee K., Slattery O., Lu R., Tang X., McCrary V. The State of the Art and Practice in Digital Preservation // Journal of Research of the National Institute of Standards and Technology. — 2002. — Т. 107 , вып. 1 . — С. 93—106 .
- Samiei M. Digital preservation: Concepts and strategies // Journal of Advanced Pharmacy Education and Research. — 2020. — Т. 10 , вып. S4 . — С. 127—135 .
- Formenton D., Luciana de Souza Gracioso. Digital Preservation challenges, requirements, strategies and scientific output // Digital Journal of Library and Infromation Science. — 2020. — Т. 18 . — doi : .
- Rackley M. Internet Archive // Encyclopedia of Library and Information Sciences. — 2010. — Т. 1 , вып. 1 . — С. 2966—2976 .
- Lerner A., Kohno T., Roesner F. // Association for Computing Machinery. — 2017. — doi : .
- Liesegang T. Perspectives. The continued movement for open access to peer-reviewed literature // American Journal of Ophtalmology. — 2013. — Т. 156 , вып. 3 . — С. 423—432 . — doi : .
- Perkel J. The trouble with reference rot // Nature. — 2015. — Т. 521 . — С. 111—112 .
- Smith M., Bass M., McClellan G., Tansley R., Barton M., Branschofsky M. DSpace. An Open Source Dynamic Digital Repository // D-Lib Magazine. — 2003. — Т. 9 , вып. 1 . — ISSN .
- Harvey R. Preserving Digital Materials. — Rowman & Littlefield. — Lanham, MD, 2018. — 25 с. — ISBN 9781538102961 .
- Храмцовская Н. Разработка концепции электронного архива // Делопроизводство и документооборот на предприятии. — 2012. — Вып. 4 . — С. 68—78 .
Ссылки

- 2020-01-08
- 1