Якшо би ви задалися ціллю зберегти щось на століття, то як би ви то могли зробити?

Дуже кайфонув з цієї велетенської статті If you had to store something for 100 years, how would you do it?, тож щиро вважаю, що це має бути українською, отже запрошую напочитати, вам має понравиця🧡

Будівля біля сливового саду

На північній стороні центру міста Сан-Хосе, притулившись до пологих вигинів Каліфорнійської траси 87 та річки Гуадалупе, що протікає вздовж неї, стоїть непримітна одноповерхова будівля кремового кольору з тонованими вікнами. На момент написання цієї статті вивіски повідомляють, що будинок за адресою 99 Notre Dame Avenue здається в оренду. Дві сусідні ділянки також порожні і використовуються як парковки, переважно для автомобілів, що не вміщаються на парковці муніципального суду, розташованого за кілька кварталів звідси. На протилежному боці вулиці починаються багатоквартирні будинки — скляні та стандартизовані: один блідо-червоно-кремовий, а наступний — поєднання блакитного та сріблястого кольорів, що тягнуться до неба на кілька кварталів на схід у бік мерії та на південь, аж до величної штаб-квартири Adobe Inc. Єдиним активним сусідом цієї невисокої будівлі є зал для важкої атлетики та бойових мистецтв у сусідньому складі, який нічим не нагадує про те, що тут було раніше. В іншому вона собі стоїть самотиною.

ibm west coast lab
Reprint Courtesy of IBM Corporation © 2024

У 1950-х роках за адресою 99 Notre Dame Avenue розміщувалася перша лабораторія IBM на Західному узбережжі. Тоді звідти відкривався вид на сливовий сад. Між 1952 і 1956 роками команда інженерів під керівництвом колишнього вчителя природничих наук у середній школі спроектувала та побудувала дисковий накопичувач IBM 350, що був частиною IBM 305 RAMAC — першої комп’ютерної системи, яка містила щось схоже на жорсткий диск.

До появи RAMAC зберігання даних та доступ до них були трудомістким процесом, що вимагав подачі стосів перфокарт у машини. Інші ранні рішення, такі як зберігання даних на магнітній стрічці, були ефективними, але повільними. Команда IBM створила обертові алюмінієві диски, які зчитувалися магнітним маніпулятором, що дозволяло отримувати дані буквально за мить. 24-дюймові диски укладалися по 50 штук у циліндр. Вони оберталися зі швидкістю близько 1200 обертів на хвилину. Навіть у 1950-х роках, коли консоль розміром з кімнату могла зберігати лише 3,75 мегабайта і важила понад тонну, ця машина могла витягувати дані за 800 мілісекунд.

Революційним елементом жорсткого диска було не те, що він зберігав дані для комп’ютерів — для цього існувало безліч інших методів — а те, що можна було зберігати дані, до яких потім можна було отримати доступ майже миттєво. Ваш накопичувач міг бути постійно підключений до вашої системи, стаючи її невід’ємною складовою, що означало колосальний зсув як у технічному, так і в концептуальному розумінні того, чим взагалі може бути комп’ютер.

RAMAC — це прабатько кожного жорсткого диска, кожного сервера, кожної реляційної бази даних, кожного хмарного сховища. 99 Notre Dame Avenue — це місце його народження. Для цифрового зберігання даних це — полігон «Трініті», центр, з якого почалося все інше.

Масивні алюмінієві диски RAMAC були вкриті шаром оксиду заліза і мали невеликі магнітні прорізи для даних, які зчитувалися під час обертання. Спочатку ці системи позиціонувалися виключно для бухгалтерів: компанія IBM виготовила та здала в оренду близько 1000 систем RAMAC 305 підприємствам, що до цього використовували перфокарткові системи. Однак уже за шість років накопичувач IBM 350 повністю застарів і був замінений новими моделями та конструкціями. Повернені пристрої один за одним відправляли на металобрухт. Прагнення створити щось меншого розміру, швидше, щільніше та дешевше витіснило їх з ринку менш ніж за десятиліття.

ramac
RAMAC actuator and disk stack
Courtesy of the Computer History Museum

Наразі відомо лише про три системи RAMAC 305 та сім окремих дискових накопичувачів 350 у різних конфігураціях, що збереглися до наших днів. У 2002 році було відновлено повний механічний вузол накопичувача 350, який зараз зберігається у колекції Музею історії комп’ютерів. Згідно з повідомленням журналу Wired за 2014 рік, під час реставрації дослідники виявили на накопичувачі 350 дані, що все ще були присутні та читалися, від канадської страхової компанії, від автовиробників та про Світову серію 1963 року. «Дані RAMAC є термодинамічно стабільними довше, ніж очікуваний термін існування Всесвіту», — сказав Джо Фенг, один з інженерів, які працювали над реставрацією.

Якщо розглядати це виключно з технічної та інженерної точки зору, компанія IBM з першої ж спроби створила носій інформації, здатний прослужити значно довше, ніж сто років, — навіть набагато довше, ніж це можна було б розумно визначити як «вічність», — причому це навіть не було метою цієї розробки. Оскільки команда лабораторії на Західному узбережжі досліджувала нову конструкцію та технологічний процес, вона використовувала надзвичайно міцні матеріали та механізми, зосередившись насамперед на функціональній надійності. Однак сьогодні, через 78 років, деталі для RAMAC більше не виробляються, а машини, які їх виготовляли, вже не існують. Потрібна була співпраця кількох установ, щоб відновити необхідне обладнання, яке дозволило б витягти дані з єдиного збереженого пристрою. Багато інших накопичувачів RAMAC не витримали випробування часом. Теоретична довговічність, забезпечена міцними матеріалами та надійною механічною конструкцією, не змогла гарантувати їхнього тривалого використання.

Сьогодні наші записи, артефакти, публікації та твори мистецтва вже не існують лише у фізичному світі. Інтелектуальний та культурний доробок, на який ми покладаємося і який споживаємо, переважно існує на екранах, зберігається у вигляді бітів за допомогою електромагнітних сигналів і передається через пакети даних та кабелі. Протягом останніх двох десятиліть музеї та архіви зібрали й витратили мільярди доларів на оцифрування своїх фондів, не кажучи вже про зусилля незліченних окремих громадян-архіваріусів, які ретельно збирають цифрові колекції самостійно. Наша апаратна та програмна інфраструктура не створена для цієї реальності. Вона пристосована до короткострокової перспективи, без будь-якої турботи про її довгострокову стійкість.

Ця стаття присвячена лише одному питанню. Якби ви зараз поставили собі за мету зберегти щось у цифровому вигляді протягом 100 років, з чого б вам слід було почати, щоб це здійснити? Як слід зберігати дані, що перебувають під вашим наглядом, з огляду на таку мету? Як виглядають наші методи та платформи, якщо розглядати їх у світлі геть невідомих обставин, що чекають на нас через століття? Існує безліч важливих суміжних тем та дискусій, яких ця стаття взагалі не торкається. Ця стаття не про величезний обсяг даних, які ми створюємо щодня, і про те, як ми могли б все це зберігати. Вона також не про надзвичайно складний кураторський процес прийняття рішень щодо того, що варто зберігати, а що ні. Вона про довговічність, про потенційні методи збереження того, що ми створюємо, для майбутніх поколінь, про те, як ми можемо забезпечити довговічність бітів. Якби вам довелося зберігати щось протягом 100 років, як би ви це зробили? Ось і все.

Навіть з урахуванням людської схильності до гарних круглих чисел і десяткової системи (10 пальців на руках, 10 пальців на ногах), 100 років — це довільний термін. Але саме 100 років є нашим мірилом саме тому, що це досяжна мета. Це масштаб, який лежить у межах досяжних можливостей одного людського життя, але не однієї людської кар’єри. Це тяглість, якої неможливо досягти силою волі однієї людини. Вона вимагає планування та організації, що охоплюють принаймні одну зміну поколінь. Це достатньо широкий часовий проміжок, щоб ймовірність соціальних, економічних та технологічних змін була абсолютною, але й водночас достатньо короткий, щоб не зруйнувати весь контекст. Це збереженість від кінця Наполеонівських воєн до початку Першої світової війни, від винаходу короткохвильового радіо до епохи Facebook, від правління короля Генріха V до опублікування Мартіном Лютером своїх «95 тез», від першої постановки «Весни священної» Ігоря Стравінського до виходу останнього альбому Daft Punk, від битви під Геттісбергом до підписання Договору про часткову заборону ядерних випробувань, від патентування телефону до випуску Apple I. Ми обрали столітній масштаб, оскільки більшість фізичних об’єктів можуть проіснувати 100 років за умови належного догляду. Це досяжно, і все ж ми вибрали саме це, оскільки конструкція основних цифрових носіїв інформації навіть близько не наближається до цього рубежу.

Жодна з методологій, які ми розглядаємо, не дає однозначної відповіді на це питання, і це цілком нормально, особливо з огляду на те, що професійні архівісти рекомендують за найкращу практику створювати та зберігати кілька копій будь-яких матеріалів у різних форматах. Наприклад, Смітсонівський інститут підтримує «правило 3-2-1» щодо зберігання даних: «3 копії даних, збережені на 2 різних носіях, причому принаймні 1 — поза приміщенням або в хмарі». Або, як висловлюється архівіст Тревор Оуенс у своїй фундаментальній праці «Теорія та практика цифрового збереження», «У цифровому збереженні ми покладаємося на наявність декількох копій. Ми не можемо довіряти довговічності цифрових носіїв, тому нам потрібно створювати декілька копій». При зберіганні цифрових даних архівісти рекомендують використовувати формати файлів, які є широко поширеними і не залежать від жодної комерційної організації — за словами Смітсонівського інституту, «непропрієтарні, незалежні від платформи, незашифровані, без втрат, нестиснені [та] загальновживані». Але в масштабі століття навіть наші найпоширеніші формати файлів є абсолютно неперевіреними(бентежний хех на flash форматі). Цифрова історія ще не настільки довга, щоб остаточно визначитися з найкращими практиками.

У сфері цифрового зберігання завжди слід враховувати два окремі, але рівнозначні напрямки технічного обслуговування: обслуговування цифрових фондів та програмних середовищ, у яких вони функціонують, а також просте фізичне обслуговування апаратного забезпечення та архітектури, що їх містять. Усі технології та методології, які ми обговорюємо, враховують ці принципи, а саме те, що рішення ніколи не є єдиними (і не повинні ними бути). Але ми все одно намагаємося проаналізувати, як їхня конструкція та природа витримують випробування століттям. Як кожна з них може впоратися з жорстокими загрозами, які може принести століття.

0101

Жорсткі диски

Зберігання даних на жорсткий диск — це процес, акт запису. Це запис за допомогою електромагнітних полів, який за умови наявності відповідного підключеного обладнання та програмного забезпечення дозволяє здійснювати практично миттєве зчитування.

Спокусливо сказати, що жорсткі диски вже не роблять такими, як раніше, і до певної міри це правда. Протягом семи десятиліть розробки жорстких дисків спостерігався невпинний поступ у напрямку підвищення швидкості, ємності, щільності, ефективності та короткострокової надійності, при цьому фізичні розміри та вага зменшувалися. Довгострокова надійність є другорядною проблемою. Виробники жорстких дисків припускають, що кожен, хто серйозно ставиться до своїх даних, замінюватиме свої системи зберігання принаймні раз на десятиліття у міру розвитку технологій.

laptop hard drive exposed
500GB Western Digital Scorpio Blue hard drive, 2013
Photo by Evans-Amos, licensed under GNU Free Documentation License

Сучасні жорсткі диски бувають двох основних типів: жорсткі диски, в яких дані зберігаються на обертовому металевому диску з магнітним покриттям, та твердотільні накопичувачі, в яких дані зберігаються у взаємопов’язаних напівпровідникових комірках, побудованих за принципом логічних вентилів. Основна конструкція та принципи роботи сучасних жорстких дисків не надто відрізняються від принципу роботи RAMAC. Жорсткий диск, як тоді, так і зараз, працює за допомогою електромагнетизму для зберігання бітів у двох станах, +M або -M, так або ні, 1 або 0, записаних на електромагнітний диск.

Основна проблема жорстких дисків полягає в тому, що вони є механічними пристроями. Диск обертається. Зчитувальний привід зчитує дані. У їхній конструкції використовуються двигуни та приводи. Механізми. Усі вони невеликі та недоступні для регулярного технічного обслуговування. Механічні деталі, як правило, виходять з ладу. Коли щось рухається, воно ламається. Навіть попри це обмеження, жорсткі диски, що зберігаються в належних умовах, теоретично можуть служити довго. Магнітні диски, на яких фактично зберігаються дані, можуть бути міцними. Їхні виробничі форм-фактори, здається, стабілізувалися протягом останнього десятиліття, оскільки гонка за легкістю та компактністю перейшла у сферу твердотільних накопичувачів.

Натомість SSD мають ту перевагу, що не містять рухомих деталей і забезпечують високу швидкість читання та запису. Вони домінують у навколишньому світі: їх можна знайти в наших кишенях, вони є стандартом у наших комп’ютерах, а також використовуються в усіх видах серверів та систем, де важлива швидкість. У повсякденному короткостроковому використанні відсутність рухомих деталей означає, що вони витримують переміщення та фізичні удари без механічних пошкоджень. Однак така конструкція має свою ціну. Твердотільні накопичувачі мають обмежений термін служби, обмежену кількість циклів запису на кожну комірку, перш ніж ізоляція, що утримує заряджені електрони всередині мініатюрних транзисторів, погіршиться. Хоча ці межі високі і продовжують зростати, вони все ж існують, і при роботі в масштабі століття вони одразу стають проблемою, особливо у випадках, коли дані зберігаються безперервно. SSD-накопичувачі також з часом втрачають здатність зберігати та утримувати дані, якщо їх залишити без живлення та не використовувати протягом занадто довгого часу. Хоча точні терміни залежать від апаратного забезпечення, будь-яке рішення для довгострокового зберігання на базі SSD вимагатиме регулярного копіювання та перекопіювання, а також ретельного управління та розміщення накопичувачів в оптимальних умовах, особливо температури. Навіть без механічних деталей SSD-накопичувачі з часом виходять з ладу. Вони мають термін придатності.

ssd
1TB Patriot P210 Internal SSD, 2023
Photo by Jacek Halicki, licensed under CC BY-SA 4.0

Ті, хто серйозно ставиться до довгострокового зберігання даних, ніколи не використовують окремі жорсткі диски поодинці. У 1988 році вчені-інформатики Гарет Гібсон, Ренді Кац і Девід Паттерсон запропонували концепцію масивів з надлишковими недорогими дисками (RAID(англ. Redundant Array of Independent Disks)), висунувши гіпотезу, що декілька стандартних комерційних дисків можуть бути надійнішими, ніж централізовані дискові накопичувачі мейнфреймів попередньої епохи. RAID базується на усвідомленні того, що замінити один невеликий елемент великого масиву може бути дешевше, простіше та надійніше, ніж замінити один дорогий елемент складного обладнання. Це складова того, що можна назвати цифровим фордизмом — цифровим порядком, що характеризується масовим виробництвом стандартизованих апаратних продуктів, призначених для стандартизованого програмного забезпечення, яке використовують як широкі маси, так і фахівці.

Варіанти RAID еволюціонували протягом наступних десятиліть з моменту виникнення, що дозволило створювати різні оптимальні конфігурації залежно від поставленої мети — чи то швидкість, ємність, чи надійність у порівнянні з вартістю. Наприклад, RAID 6, що складається з двох парних блоків, може витримати вихід з ладу двох дисків, і це все одно не призведе до втрати даних. Навіть RAMAC, ще багато років тому, містив біт парності — систему виявлення помилок. Один біт, встановлений на нуль або одиницю, непарний або парний, призначений для підрахунку кількості нулів або одиниць у наборі бітів. Якщо біт парності змінився, це означає, що сталася помилка. Системи RAID вищого рівня забезпечують екстремальну версію цього — парність на рівні диска, яка може не тільки витримати кілька відмов, але й виявити та виправити пошкоджені дані.

Масиви RAID потребують технічного обслуговування, перевірок та фізичних оглядів під час тривалої експлуатації. Створення систем зберігання даних, розрахованих на століття, за допомогою жорстких дисків — це не стільки питання технології, скільки питання інституційного розвитку, фінансування, нерухомості, логістики, культури та відданості ідеї цифрового збереження всього, що оточує вашу систему зберігання даних і взаємодіє з нею.

Уявімо, що ви встановили кілька найсучасніших серверів з масивом RAID 6 у десятці бункерів з ідеальним клімат-контролем по всьому світу. Щоб забезпечити збереження даних протягом століття, вам доведеться створити, фінансувати та гарантувати існування установи, яка буде їх обслуговувати, фінансово підтримувати та зберігати в пам’яті. Ця установа також мала б зберігати формати файлів, програмне забезпечення, апаратне забезпечення, операційну систему та всі інші цифрові елементи, від яких залежать дані, що ви зберігаєте, і продовжувати розробляти засоби доступу до них. (Це буде повторюваною темою в цій статті: збереження цифрових даних також вимагає збереження засобів доступу до цих даних, так само як збереження книги вимагає збереження мови, якою вона написана.)

Якщо вийти за межі людського життя, технологічні рішення можуть виявитися непевними, а іноді й шокуюче суперечливими інтуїції. Наприклад, легко було б сказати, що сучасні SSD слід повністю виключити як варіант для зберігання даних у масштабі століття, з огляду на те, наскільки ретельного догляду вони потребують. Але той факт, що система довгострокового зберігання на базі SSD вимагатиме надзвичайно пильного догляду та обслуговування, а також формування відповідної практики, можна, мабуть, розглядати як перевагу саме в контексті зберігання даних у масштабі століття. Однією з причин, чому книги здатні проіснувати понад століття або навіть тисячоліття, є те, що зрештою їх доводиться перевидавати. Крихкість і культура, яку вона створює, можуть стати перевагою, що надихає на той вид дбайливості, який необхідний для довгострокового зберігання. Система, що прагне до незнищенності або бездоганності, може сприяти надмірній впевненості, байдужості та головному ворогу всіх архівів — недбалості.

Ще одна важлива перевага жорсткого диска — швидкість доступу — також заслуговує на увагу як фактор при виборі рішення для зберігання даних у масштабі століття. Немає потреби замінювати записи, касети чи котушки. Немає потреби покладатися на підключення до глобальної мережі чи на незалежну компанію, яка може припинити свою діяльність. Будь-які дані, які вам потрібні, доступні миттєво. Ваші фонди можна ділити та демонструвати, не покладаючись на будь-яку іншу сторону. Якщо колекція, яку ви зберігаєте, призначена не виключно для використання через 100 років, а буде використовуватися протягом наступних 100 років, швидкість доступу до неї має бути певною мірою збалансована з іншими факторами, зокрема з безпекою зберігання. Це те, що архівісти, фахівці зі збереження та куратори постійно зважують у професійному управлінні фізичними інституційними колекціями. Проте доступність може бути надзвичайним надбанням у побудові такого типу спільноти, яка зможе вижити у довгостроковій перспективі. Належний догляд та обслуговування вимагають ресурсів, фінансування та праці. Важко залучити їх, одночасно ховаючись від світу.

Якщо жорсткі диски використовуються для будь-яких цілей, схожих на «холодне» зберігання — тобто зберігання, яке не передбачає легкого доступу і може залишатися під замком протягом десятиліть, — вони становлять ризик. Пожежа, вода, фізичні удари, висока температура, волога та статична електрика є постійними загрозами. Як показує приклад RAMAC, навіть якщо дані вціліють, жорсткі диски є лише одним із компонентів усієї комп’ютерної системи, яку також потрібно зберегти.

RAMAC також демонструє, що нестійкість апаратного забезпечення — це результат певного вибору. За умови іншої системи стимулів виробники апаратного забезпечення могли б створювати набагато надійніші продукти. Як і у випадку з програмним забезпеченням, що містить помилки, проблема полягає не у відсутності інженерних знань, а в тиску з боку акціонерів та орієнтації на короткострокове зростання. Наразі самі жорсткі диски коштують дешево і стають дедалі дешевшими. Ви можете купити жорсткий диск на 24 ТБ за 439 доларів, що на понад сто доларів дешевше, ніж вартість одного місяця зберігання 24 ТБ на хмарній платформі Amazon S3. Ми могли б мати набагато міцніші жорсткі диски, але це, ймовірно, потребувало б більших фінансових витрат або повної переорієнтації інженерних процесів.

За наявності відповідних ресурсів розміщення та використання власних систем на жорстких дисках і серверів може стати доцільним елементом стратегії довгострокового зберігання даних. Вони доступні, завжди готові до копіювання на інші диски та носії і, в певному сенсі, створені з урахуванням можливості модернізації до майбутніх версій як апаратного, так і програмного забезпечення. Наявність локальної резервної копії цифрового архіву, яка повністю перебуває під вашим контролем, може стати надійним запобіжним заходом, якщо ви в основному покладаєтеся на розподілені або хмарні рішення. Наявність системи жорстких дисків як частини такої конструкції, призначеної для модернізації або оновлення кожні кілька років, є цілком розумною, за умови, що необхідність майбутньої адаптації є зрозумілою та належним чином профінансованою. Сам факт того, що жорсткі диски призначені для заміни, спонукає нас ретельно продумати планування на майбутнє. Чи реагуємо ми раціонально на цей стимул — це вже інша історія.

горщикі

Хмара

У 2018 році кількість користувачів Google Drive перевищила мільярд. Наразі Dropbox налічує 700 мільйонів зареєстрованих користувачів(десь там і мій десяток юзерів, яких я заводив під різне сміття час від часу). Згідно з фінансовим звітом 10-K за 2022 рік, Amazon Web Services орендує 14 мільйонів квадратних футів нерухомості та володіє ще майже 12 мільйонами квадратних футів. Ми живемо та працюємо у світі хмари. Хмара є домінуючим методом зберігання даних та запуску програмного забезпечення, яке їх отримує. Програмні платформи, які не намагаються нав’язати хмару як опцію зберігання за замовчуванням, стають видом, що зникає. З 39 архівів, бібліотек та колекціонерів, яких я опитав для цього проєкту, 27 використовують хмарний сервіс зберігання даних як основне місце для своїх цифрових колекцій. З них 18 використовують окремий хмарний сервіс зберігання даних як спосіб додаткового резервного копіювання, а ще чотири, які мають основне сховище локально або за децентралізованою схемою, використовують хмарний сервіс зберігання даних як спосіб резервного копіювання.

the dalles
Google Data Center, The Dalles, Oregon
Map data ©2024 Google

Хмара — це сукупність центрів обробки даних. У цих центрах працюють сервери, які використовують величезні масиви та комбінації обчислювальних технологій і технологій твердотільних накопичувачів, про які ми вже говорили, для зберігання величезних обсягів даних для мільйонів клієнтів. Зберігати дані в хмарі означає передати це зберігання на аутсорсинг, доручити його зберігачу, охоронцю, чиєю єдиною метою є отримання, захист і надання цих даних будь-кому, хто готовий за це заплатити. Ця послуга виявилася прибутковою для компаній, які вирішили її надавати. Хоча найбільші гравці часто володіють і керують власними центрами обробки даних, існують десятки тисяч менших підприємств, які пропонують хмарні послуги будь-якій кількості клієнтів, включаючи самі великі сервіси.

За даними Amazon, S3 «містить понад 280 трильйонів об’єктів і обробляє в середньому понад 100 мільйонів запитів на секунду. Для забезпечення цілісності даних Amazon S3 виконує понад чотири мільярди обчислень контрольних сум на секунду». Загальний обсяг даних, що генеруються людьми, що знаходяться на сервісах під управлінням Amazon S3, Microsoft Azure та Google Cloud, є незбагненним. Це чорна діра — і вона стає дедалі важчою.

Переваги використання хмарного сховища очевидні. Тягар оновлення апаратного та програмного забезпечення перекладається на фахівців. Фізичні вимоги до архітектури та фізичного захисту від стихійних явищ більше не є проблемою для клієнта. Хмара доступна за наявності інтернет-з’єднання і є частиною величезної існуючої інфраструктури, до якої входять багато інших зацікавлених сторін. Цей мережевий ефект, зумовлений великою кількістю клієнтів, сам по собі створює відчуття безпеки, подібне до банківської культури «занадто великий, щоб впасти». Якщо ви зберігаєте свій скарб з даних у тому ж місці, що й величезні інвестиційні банки та ЦРУ, легко уявити, що масштабність і впливовість ваших колег-зацікавлених сторін матиме певний вплив на надійність та постійну доступність продукту.

Нинішня система роботи хмарних центрів обробки даних розрахована лише на умови абсолютної стабільності. Фізичні загрози для центрів обробки даних не відрізняються від загроз, з якими стикаються традиційні бібліотеки, за винятком кількох додаткових факторів: пожежі, затоплення, фізичне руйнування, нехтування технічним обслуговуванням, перебої в електропостачанні, збої зв’язку, крадіжки, вандалізм та постійна потреба у програмному забезпеченні, що працює. Під час написання цієї статті, у липні 2024 року, помилка в оновленні Crowdstrike призвела до того, що архіви, які використовували хмарні служби зберігання даних Microsoft Azure, втратили доступ до своїх фондів. Природні катаклізми, війни та політичні потрясіння здатні спричинити негайні та безповоротні втрати. Незважаючи на основоположну мрію творців Інтернету, його ідеал що закладався разом з народженням мережі — бути телекомунікаційною мережею, здатною вижити після ядерного удару, — цілком очевидно, що будь-який серйозний обмін ядерними ударами зробить хмару непридатною для використання(воно то да, але з іншого боку я бачив, як працюють ДТЕКівці чи працівники Київстару чи Водафону чи локальних провайдерів під бомбами, тому це твердження таке трошки сумнівне, але лишимо його для unbombed people). Навіть не враховуючи такі кошмарні сценарії, хмара існує завдяки відносно невеликій кількості підводних кабелів, які потребують постійного технічного обслуговування. Будь-яка морська держава вже має вогневу потужність і можливості, щоб серйозно пошкодити глобальний доступ до Інтернету, а отже, і до хмари. Глобальний географічний розподіл центрів обробки даних сильно схиляється на користь США та Європи. Хмара є досить централізованою, оскільки компанії, які нею керують, є досить централізованими.

Хмарне сховище вимагає оплати послуг сторонній організації протягом усього часу, поки ви зберігаєте дані. Це може виявитися дорожчим, ніж інші методи (вартість опції «Standard» у S3 станом на листопад 2024 року становить 23 долари за ТБ), особливо протягом дуже тривалих періодів. Amazon S3 намагається вирішити цю проблему, пропонуючи тариф зберігання «Glacier» для повільнішого, але більш постійного зберігання, розроблений для конкуренції з офлайн-варіантами холодного зберігання, шляхом відокремлення вартості зберігання від вартості вилучення даних (вартість опції «Flexible Retrieval» становить 3,60 доларів за ТБ станом на листопад 2024 року). Але ви все одно мусите їм платити. Щомісяця або щороку. ПОСТІЙНО. Ви можете на деякий час вимкнути свої машини, а потім знову увімкнути їх, і все, що ви зберегли, все ще буде там, але якщо ви перестанете платити за хмарне зберігання, дані зникнуть, ймовірно, назавжди.

Хмарні технології вимагають довіри. Оцінка хмарних технологій з точки зору зберігання даних у масштабі століття стосується не стільки технічних можливостей та конфігурацій, скільки організаційних структур і навіть цінностей. Наразі провідні хмарні сховища даних перебувають виключно під управлінням компаній. У листопаді 2018 року на загальних зборах у Сіетлі співробітник Amazon запитав генерального директора та засновника Джеффа Безоса, що він виніс із недавнього банкрутства Sears. «Amazon не є занадто великою, щоб збанкрутувати… Насправді, я передбачаю, що одного дня Amazon збанкрутує. Amazon збанкрутує. Якщо подивитися на великі компанії, їхній час існування зазвичай становить понад 30 років, а не понад 100 років», — відповів Безос. Безос мав рацію. Більшість компаній не існують справді довго. Їх або поглинають, або дроблять на частини, або вони банкрутують, або перетворюються на щось набагато менше, чи й взагалі їх руйнують катастрофічні геополітичні події.

У 2012 році Річард Фостер, професор Єльської школи менеджменту, виявив, що середня тривалість існування компаній, що входять до індексу S&P 500, різко скоротилася. Вона зменшилася з 67 років у 1920-х роках до всього 15 років. Більшість компаній, навіть надзвичайно успішні гіганти, не проіснують і 50 років, не кажучи вже про сто.

Можливо, компанії, що надають послуги зі зберігання даних, не підпадають під цю тенденцію. Серед найстаріших компаній у Сполучених Штатах, які не є фермами, пабами, пивоварнями чи готелями, є кілька страхових компаній. «The Philadelphia Contributorship» (1752), «Insurance Company of North America» (нині відома як «Chubb», 1792) та «Baltimore Equitable» (1794) вже більше двох століть ведуть свою діяльність. Це також справедливо в глобальному масштабі (Bilsener Gilde з Німеччини, 1642; Hamburger Feuerkasse з Німеччини, 1676; Lloyd’s of London, 1688). Це компанії, що займаються довгостроковим управлінням активами та добре розуміються на ризиках. Можна уявити собі, що сервіс зберігання даних або дата-центр перейме культуру, яка може привести до подібної довговічності, але хмара поки що залишається сферою діяльності переважно неспеціалізованих компаній, культура яких зосереджена на стимулюванні стрімких змін парадигм, що сприяють зростанню, а не на стабільності.

У довгостроковій перспективі існує серйозний ризик того, що три домінуючі гравці на ринку хмарних сховищ або інші нові компанії, які прагнуть піти їхнім шляхом, припинять надання своїх послуг через необхідність, власні уподобання чи оптимізацію, перейшовши до чергової «нової зірки», яка, на їхню думку, зможе забезпечити зростання. Google особливо винен у такій поведінці, закриваючи власні продукти з такою регулярністю, що це стало вічно живим жартом серед тих з нас, хто постійно перебуває в мережі. Під час написання цієї статті Google оголосив, що припиняє роботу свого сервісу скорочення URL-адрес, активно сприяючи зникненню посилань та погіршенню стану Всесвітньої мережі.

Щоб довіряти компаніям, які пропонують хмарне сховище на століття вперед, знадобиться зміна їхньої етики, культури, умов та договорів, але ми можемо уявити, як би така зміна могла виглядати.

Кожного разу, коли я розмовляв із охоронцем у художньому музеї, я помічав, що вони відчувають глибоку повагу та відповідальність за колекції, які перебувають під їхнім наглядом. Це неодноразово відбивалося як у журналістських матеріалах про людей, які виконують цю роботу, так і в їхніх власних розповідях.

Вони стійко стоять на своєму там, день за днем, маючи справу з самовпевненими туристами, шаленими малюками, відвідувачами, що вирішили на мишу піджерти якоїсь їжі, шастаючими шкільними групами та деякими з найбільш дратівливих проявів людської поведінки, і, здається, вони не втрачають відчуття важливості своєї роботи. Навіть коли установи, в яких вони працюють, не платять їм достатньо, це почуття поваги зберігається. Кожен день вони роблять все можливе, щоб захистити те, що знаходиться під їхньою опікою. Вони відчувають почуття обов’язку, перебуваючи в цих приміщеннях.

Мені не вдалося виявити такого ж почуття обов’язку та поваги під час інтерв’ю зі співробітниками великих технологічних компаній, які працюють над продуктами для зберігання даних, але немає жодних підстав вважати, що цього не може бути. Я, безумовно, помітив їхнє прагнення дбати про особисте, відчуття того, що вони повинні створювати щось, що працює, аби люди не втрачали свої дорогоцінні спогади. Вони також прагнуть забезпечити надійність для своїх корпоративних клієнтів, розуміючи, що, наприклад, магазину пончиків життєво важливо, щоб його бухгалтерські записи працювали, інакше він може збанкрутувати. Але, за винятком рідкісних випадків маркетингу та кількох моментів риторики, я сміливо можу узагальнити, що культура відповідальності, усвідомлення важливості справи, не є поширеною в технологічних компаніях, і її створення не є для них пріоритетом.

На веб-сторінках та в маркетингових матеріалах Microsoft Azure та Google Cloud ніде не згадується про збереження культурної та історичної спадщини. Лише Amazon S3 торкається цієї теми, наводячи приклад міграції 100-річного архіву BBC до своєї системи Glacier між прикладами використання озер даних Salesforce та генеративної ШІ.

Саме зараз усі ці сервіси (дуже часто) згадують про ШІ та про те, як вона змінить усе. «Чи готова ваша інфраструктура до ШІ?» — запитує головна сторінка Microsoft Azure. Google Cloud закликає вас «створювати майбутнє генеративного ШІ». Два роки тому їхні маркетингові матеріали згадували web3 та метавсесвіт (дуже часто) і те, як це все змінить, а також те, що якщо ваш бізнес не адаптується, ви залишитеся позаду — проте ці заклики більше не з’являються.

«Я навіть не знала, що у нас є такі клієнти», — сказала мені менеджерка з продуктів Microsoft, коли я запитала, що вона думає про захист архівів. «Мені важко переконати когось, що це має значення», — сказав інженер Amazon. «Є деякі керівники, які, здається, справді більше переймаються цим, але це не доходить до нижчих рівнів на втілення».

Хмара не існує у вакуумі. Вона залежить від розгалуженої мережі взаємодій, телекомунікаційних компаній, інтернет-провайдерів та виробників обладнання, діяльність яких визначається часовими рамками, що далекі від століття (часто це щоденні примхи ринку та фідуціарна відповідальність перед акціонерами щодо максимізації прибутку щокварталу). Школа Джека Велча, що проповідує верховенство акціонерів, є абсолютно несумісною з тими цінностями, які гарантували б надійне існування постачальника хмарного сховища протягом століття.

З огляду на мережевий ефект масового використання хмарних технологій, хотілося б сподіватися, що існує корпоративна культура відповідальності за безпеку та серйозність покладених на них обов’язків. Але такі корпоративні культури, навіть якщо вони й існують, є вразливими.

Іншим проявом хмари є те, що вона є засобом, за допомогою якого цифрові продукти зараз пропонуються, продаються та споживаються. Цифрові копії книг, фільмів, музики, ігор та журналістики, деякі з яких випускаються за моделями передплати, а деякі доступні на цифрових ринках, — все це є частиною нашого хмарного середовища. Протягом останнього десятиліття бюджети на формування колекцій більшості бібліотек поступово переорієнтовувалися з фізичних книг на хмарні цифрові передплати.

Одним із можливих підходів до збереження будь-яких опублікованих літературних, наукових, мистецьких чи наукових творів протягом століть було б просто довіритися правовласникам та розробникам інтелектуальної власності, що вони збережуть усе, що вони пропонують, у безпеці, доки це не перейде у суспільний надбання, але за нинішніх умов така довіра є неможливою. Публічній акціонерній корпорації, як суб’єкту господарювання, що діє в сучасній парадигмі верховенства акціонерів та в рамках сучасного законодавства про авторське право, не можна довіряти як партнеру у справі збереження будь-чого. Ми бачили, як компанії-розробники відеоігор не змогли зберегти власну інтелектуальну власність, а потім безжально переслідували в суді фанатів, які намагалися заповнити цю прогалину; кіностудії відмовляються випускати цілі фільми та відкладають телевізійні шоу, щоб заявити про списання та уникнути виплати роялті, цифрові ринки блокують контент, який споживачі вже придбали, ціле покоління веб-мистецтва стає нефункціональним, а незліченні пісні, книги, шоу, ігри, програмне забезпечення та навіть цілі формати просто зникають без попередження, навіть якщо вони містяться в «бібліотеках» клієнтів, які нібито «володіють» ними(а я вам напамʼятаю, що якщо покупка це не володіння, то й піратство не крадіжка).

Цей процес є постійним і безперервним. За той короткий час, поки писалася ця стаття, компанія Paramount несподівано видалила весь архів MTV News, включаючи матеріали, які, судячи з усього, не були збережені сервісом Wayback Machine від Internet Archive; GameStop раптово закрив Game Informer і знищив його архіви, хоча ще в 2011 році це був один із трьох журналів із найбільшим тиражем у США; а журналістські розслідування виявили, що частину архівів деяких із найвідоміших місцевих газет країни, зокрема Village Voice, заполонили клікбейти, згенеровані LLM(і клікбейт це ще не найгірше, бо так само “звільнені” домени сквотять або шахраї, або срана гембла, хай буде вічна срачка в тих хто не гнушається в ній працювати). Це може здаватися дрібницями. Але це не так. У випадку з MTV News два десятиліття документування, що містило деякі з найважливіших моментів в історії музики, опинилися під загрозою втрати.

Хоча з XIX століття існують різні нормативно-правові рамки міжнародного права, спрямовані на захист культурної та інтелектуальної спадщини під час воєн, аналогічних механізмів для мирного часу не існує. Якби вони були, це могло б кардинально змінити нашу здатність довіряти як операторам хмарних сервісів, так і корпоративним правовласникам. Інший правовий та громадянський лад вплинув би на весь цей аналіз. Але наразі хмарні сервіси регулюються лише самими собою.

🟠 Донат? Донат!

Доки ми тут, то принагідно нагадую, що задонатити це не тільки чудова ідея, що береже сон, покращує травлення і робить волосся блискучим, а ще й наш обовʼязок, бо в нас є тільки ми.

Ну, а вдруг ти вже задонатив, то завжди можеш закинути кілька грибнів на підтримку проекту

10101012001

Знімні носії

Найстаріша вінілова платівка в моїй колекції — це видання 1951 року з «Першим фортепіанним концертом сі-бемоль мінор» Чайковського у виконанні Володимира Горовиця та Симфонічного оркестру NBC у Карнегі-холі(на відміну від автора в мене в колекції найстаріша платівка здається десь з 1956 і це всерівно кожного разу виносить, бо це на 20 років раніше ніж початок паспортизації в совочку, коли селян нарешті хоч почали за людей рахувати, а не за скот безвольний). На червоній обкладинці зображено пару безтілесних рук, що грають на клавіатурі, розміщеній під кутом. Наразі її вартість становить від 3 до 12 доларів. Ця платівка є перевиданням, оскільки запис було зроблено у 1943 році (за нотами, вперше опублікованими у 1875 році та доопрацьованими до остаточного вигляду у 1890 році). Записи цього концерту також існують на YouTube, імпортовані у цифровий формат з різних аналогових версій.

Відтворити

Платівка на моїй полиці ще все ж не є успішною реалізацією зберігання даних у масштабі століття, залежно від вашого визначення, але вона наближається до цього. Якщо ви зайдете на Discogs, краудсорсинговий інструмент для каталогізації музичних релізів, який також функціонує як глобальний ринок, ви зможете придбати тисячі платівок, яким понад століття.

image
ще й доволі по божескім цінам, дешевше за свіжі релізи

Щоб їх відтворити, вам знадобиться програвач, здатний обертатися зі швидкістю 78 обертів на хвилину, але якщо він у вас є, ви зможете прослухати запис, зроблений понад сто років тому, збережений на аналоговій шелаковій платівці.

Найвідоміші приклади віри у стабільність грамплатівок як носія інформації наразі знаходяться на відстані 15,2 млрд миль та 12,7 млрд миль від Землі відповідно. Вони рухаються зі швидкістю 38 026,77 миль/год та 34 390,98 миль/год відносно Землі, за межами геліосфери у міжзоряному просторі. «Золоті платівки» Voyager(люблю іноді згадувати про золотий диск вояджера, на якому іспанською записано “ола і салюдос а тодос”, на івриті просто “шалом”, японською “конічіва о генкі десу ка”, а українською “пересилаємо привіт із нашого світу, бажаємо щастя, здоров’я і многая літа, що знаходяться на космічних зондах Voyager, виготовлені з міді, покритої золотом і нікелем, а не з вінілу. Вони містять привітання 55 мовами людства; 26 музичних записів, включаючи твори Блінда Віллі Джонсона, Чака Беррі та Йогана Себастьяна Баха; записи звуків природи; та 116 закодованих зображень життя. Кожна платівка розрахована на термін служби понад мільярд років.

«Золота платівка» — це винятковий випадок, невеликий зразок того, чого можна було б досягти, якби суспільство виділило реальні ресурси на збереження та кураторство культурної продукції. Більшість знімних носіїв інформації не призначені для подорожей космосом і не розраховані на термін служби понад мільярд років. Проте навіть у своїх менш довговічних версіях платівки, касети та оптичні диски представляють систему зберігання, яка є як відтворюваною, так і розповсюджуваною, а також достатньо стандартизованою, щоб споживче обладнання могло отримати до неї доступ і негайно відобразити її. Ці формати за своєю природою ізольовані від мережі, захищені від кібератак, помилкових оновлень програмного забезпечення та випадкового видалення.

golden record
The Golden Record, 1977
Public domain, NASA/JPL

Зовні пристосовані до суворих умов минулої епохи фізичної торгівлі, всі формати знімних носіїв мають певний рівень стійкості до зберігання, але, як і все інше, вони зношуються під тиском часу. Вінілові платівки не переносять спеку і зношуються з кожним прослуховуванням. Касетні стрічки повільно втрачають свій оксидний шар, особливо в умовах високої температури та вологості, тоді як магнітні поля, навіть ті, що створюються невеликими побутовими електронними приладами, завдають серйозної шкоди магнітним частинкам стрічки. Касети VHS страждають від подібних проблем. Грибки атакують дискети. Кіноплівки страждають від цілої низки недуг. Відомо, що нітратна целюлозна основа плівки, яка використовувалася у першій половині 20 століття, розпадається на пил, якщо, звичайно, не вибухає у вражаючому полум’ї. Ацетат целюлози, який прийшов їй на зміну, страждає від «оцтового синдрому», коли його ацетатна основа розкладається, виділяючи різкий запах. Поліестерна плівка страждає від вицвітання кольорів. Зараз кіноархіви зберігають багато котушок у заморожених сховищах з контрольованою вологістю, щоб уповільнити ці реакції.

Цифрові знімні носії, такі як CD, DVD та інші оптичні диски, страждають від хаотичних і непередбачуваних хімічних руйнувань, що погіршують їхню здатність до відтворення. Не існує єдиної думки щодо єдиної причини «розкладання дисків», оскільки стандарти виробництва CD та DVD були настільки різноманітними, що неможливо визначити універсальний фактор, який прискорює цей процес. Деякі диски виглядають цілком нормально і готові прослужити сотні років. Інші ж здаються такими, ніби їх було створено для того, щоб зіпсуватися за жахливо короткий проміжок часу, ніби це не «Найкращі хіти Селін Діон», а навмисно самознищувані повідомлення з фільму «Місія нездійсненна». Деякі диски бронзують або покриваються плямами. Деякі втрачають невеликі смужки свого відбиваючого шару. Деякі стають дивно прозорими, наче за допомогою фокусу, ніби їхнє попереднє існування було ілюзією.

Вологість, шкідники, світло, магнітне поле та тепло можуть знищити майже все. Захист від цих факторів може допомогти зберегти майже все.

За належних умов та належного догляду будь-який із цих носіїв може прослужити надзвичайно довго, але в такому разі вони стають артефактами, як і будь-які інші фізичні унікальні твори, відібрані для збереження. Це скульптури, гобелени, костюми чи картини. Носій інформації є таким самим цінним об’єктом, як і вміст, який він зберігає. Також необхідно зберегти можливість відтворення або доступу до медіа, що містяться на них.

unicorn defends himself
The Unicorn Defends Itself, from the Unicorn Tapestries c.1495-1505
Public domain, part of The Met’s Open Access Initiative

Якщо ви не плануєте зберігати не тільки колекцію платівок, а й сам програвач, вам краще вміти його зібрати. Саме в цьому полягає потенційна довгострокова перевага аналогових форматів над цифровими. Творці «Золотої платівки» «Вояджера» вважали, що майбутньому слухачеві простіше передати інструкції щодо складання програвача, ніж щодо складання комп’ютера. Не враховуючи антропоморфні проблеми при теоретичному обґрунтуванні взаємодії з інопланетянами через мільярд років, безперечно, здається правдивим, що побудувати простий механічний пристрій простіше, ніж побудувати багаторівневу апаратно-програмну систему.

З точки зору зберігання інформації протягом століть, недоліком цих форматів може бути те, що як масові споживчі товари вони вже значною мірою застаріли, поступившись місцем розгалуженій інфраструктурі стрімінгу, яка безперешкодно передає контент із хмари. Проте, навіть залишаючись у меншості, багато з них продовжують існувати як товари. Вінілові платівки вже понад десять років як повністю відродилися, навіть перевершивши за обсягами продажів компакт-диски — формат, який, як вважалося, ознаменував їхній занепад. Колекціонери покоління Z купують касетні стрічки у величезних кількостях. Навіть якщо ці формати продаються, виробляються або підтримуються як нішеві пропозиції, вони мають серйозний потенціал, який заслуговує на серйозну увагу.

У 1998 році японський парламент ухвалив Закон про збереження електронних документів, який передбачав обов’язкове зберігання певних податкових та бухгалтерських даних у цифровому форматі протягом 100 років. Уряд створив і затвердив стандарт якості для оптичних дисків, які могли б відповідати цим вимогам. Компанія Pioneer розробила оптичний привід BDR-WX01DM та диски архівного рівня, що відповідають цьому стандарту. Не менш перспективними є M-DISC — дещо товстіші диски Blu-ray, що випускаються компаніями Ritek та Verbatim, які заявляють про термін служби 1000 років за умови належного зберігання. M-DISC пройшли випробування як за стандартами ECMA, так і ISO/IEC з оцінкою в кілька сотень років, а різні випробування на міцність та навантаження підтвердили високий рівень стійкості M-DISC залежно від умов(реально задумуюся над тим, щоб купити десяток таких болванок, щоб нарешті заархівувати туди всі свої фоточкі на збереження, як резервний бекап). Але обидва формати є новими, і ці твердження не перевірені в часовій реальності. І, як і всі інші знімні носії, вони потребують фізичного простору для зберігання, захисту та збереження.

ampex recorder
Internals of Ampex Fine Line F-44, a 3-head Ampex home-use audio tape recorder, c. 1965
Photo by Gregory F. Maxwell, licensed under GNU Free Documentation License

Ще однією перевагою стрічкових носіїв є їхня відносна дешевизна: у середньостроковій перспективі вони виходять набагато дешевше, ніж хмарні рішення або постійне оновлення власного серверного обладнання чи жорстких дисків. У 2021 році IBM оцінила свої власні стрічкові рішення LTO-9 у 5,89 долара за терабайт. Не випадково стрічкові накопичувачі є стандартом для більшості великих систем холодного зберігання. Більшість кінокомпаній та кінотеків, банків, страхових агентств, юридичних фірм та національних архівів зберігають копії принаймні частини своїх даних на магнітній стрічці.

Однак системи стрічкових накопичувачів, залежно від їхньої складності, можуть мати високі початкові витрати на налаштування. Наразі вони не випускаються, не продаються і не рекламуються для індивідуальних споживачів. Залежно від конкретного обладнання, запис на стрічкові накопичувачі може бути повільним — настільки повільним, що неправильне оновлення може навіть поставити під загрозу цілісність даних, що зберігаються. Накопичувачі, які записують на стрічки, не призначені для регулярного переміщення. Самі стрічки в першу чергу призначені для зберігання в ідеальному місці, яке ви для них створили. Вони вразливі до будь-чого, що може загрожувати фізичному місцю, в якому вони зберігаються. Вони також майже повністю призначені для використання в окремій системі і не можуть претендувати на переваги природної децентралізації, яка виникає при розробці продуктів для споживчого використання.

Якщо розглядати стрічкові системи зберігання даних у відриві від організаційних, фінансових, архітектурних та соціальних структур, що їх оточують, то, ймовірно, це найкращий варіант для зберігання великого цифрового масиву даних на одному майданчику протягом кількох десятиліть — за умови, що цей масив ніколи не потребуватиме оновлення. Але термін служби стрічки все ще вимірюється максимум у десятиліттях, і вона розроблена так, щоб її замінили на наступну систему задовго до того, як ми досягнемо 100-річного рубежу. Виробники стрічкових накопичувачів, як правило, все ще рекламують свої конкурентні цінові переваги лише на п’яти- або десятирічну перспективу. А стрічка все ще вимагає фізичного догляду, місця та пильного нагляду.

Хоча дорожчі стрічкові системи забезпечують швидкий доступ до даних, саме те, що вони не є легкодоступними, є однією з їхніх характерних рис, що гарантує захист від цифрових загроз завдяки «повітряному проміжку». Ця недоступність є одночасно і сильною стороною, і слабкістю. Як зазначалося раніше, миттєвий доступ до власних фондів може бути позитивним фактором для збереження матеріалів у масштабі століття. Будь-яке рішення, найкраще розроблене для прихованого бункера, місця, яке має бути захищене від світу, від громадськості, від суспільства, несе ризик того, що не зможе створити соціальні, політичні та фінансові умови для забезпечення належного догляду та обслуговування.

Ми об’єднали в рамках одного аналізу аналогові та цифрові засоби знімного зберігання даних — як ті, що призначені для масового споживання, так і ті, що призначені для одноразового інституційного зберігання, — оскільки всі вони мають спільну особливість: можливість перенесення та копіювання незалежно від систем, що їх зчитують. Цілком можливо закодувати Google Chrome на вініловій платівці, так само як ми можемо закодувати тисячолітні музичні композиції Хільдегарди з Бінгена у цифрових форматах файлів, так само як «Золота платівка» «Вояджера» закодувала візуальні зображення Землі у своїх канавках.

Уявімо світ, у якому через півроку вся цифрова музика якимось чином зникне. Spotify, Apple Music, Tidal та всі інші сервіси цифрової музики втратять свої колекції. Усі жорсткі диски у світі, на яких зберігається музика, будуть стерті. Резервні копії лейблів зникнуть. Уявімо, що цифрова копія альбому Сабріни Карпентер «Short n’ Sweet» випадково збереглася як на єдиному касетному накопичувачі в бібліотеці, так і на тисячах платівок, касет та компакт-дисків, проданих шанувальникам. Навіть як продукти ери стрімінгу, де фізичні копії становлять лише частку того, як люди слухають музику, якщо б ви попросили мене зробити ставку на те, що витримає століття в цьому уявному сценарії, я б поставив на платівки, касети та CD — і на фанатів, їхніх спадкоємців та наступних фанатів. Я б поставив на будь-який сервіс на кшталт Discogs, що існуватиме у 2124 році.

10001202001

Зробіть це матеріальним: друкуйте чи вибийте на камені

Якби цей проєкт називався «Зберігання в масштабі тисячоліть», історичні дані вказували б на два особливо успішні методи забезпечення збереження письмових та візуальних носіїв — різьблення по каменю або нанесення написів на глиняні таблички.

Люди малювали, гравірували та обробляли камінь протягом десятків тисяч років до появи чогось схожого на цивілізацію чи писемну історію. Багато з цих творів збереглися, припинивши своє існування лише внаслідок насильницьких змін або знищення, чи то з вини людини, чи то внаслідок дії природних сил.

Тисячі років потому — починаючи вже з 9000 року до н. е. з простих невеликих лічильних жетонів і досягнувши широкого поширення близько 3000 року до н. е. — стародавні шумери, вавилоняни, мінойці, мікенці та хетти писали гострими стилусами на шматках вологої глини, які потім залишали висихати на сонці або випалювали в печі. Ці практики поширилися відносно швидко. Сьогодні ми маємо понад півмільйона таких табличок, і їхня кількість продовжує зростати завдяки новим знахідкам та розкопкам. Ці писання бронзової та залізної доби перебувають у надзвичайному стані, витримавши багато потенційних способів знищення. Вони охоплюють урядові архіви, комерційні документи, списки битв, квитанції, листи, дебати, гімни, есе, закони, оповідання, математичні теореми, рецепти та медичні тексти. У колекції є відома в Інтернеті «платівка зі скаргою до Еа-насіра» — скарга клієнта (щодо неякісних мідних злитків, за які вже було сплачено), яка чудово збереглася на відрізку в понад 3700 років.

Ea nāṣir

У нас є 1800 років астрономічних записів, «Епос про Гільгамеша» та 382 дипломатичні листи від Ахенатона, фараона Єгипту, до сусідніх великих держав. Глиняні таблички охоплюють незбагненний проміжок часу з майже дивовижною легкістю.

Короткий огляд історичних пам’яток у всьому світі демонструє можливості не лише втілення цінних цифрових архівів у матеріальній формі, а й перетворення їх на архітектурні об’єкти або використання навколишньої архітектури таким чином, щоб збільшити шанси на збереження протягом століть. Адже комп’ютери, зрештою, виготовляються з каменю. Можливо, нам слід змінити цей процес на протилежний і записувати вихідний код на камені, викарбовуючи наші найважливіші функції на стінах.

Причини, через які ми не відновлюємо ці процеси, очевидні. І нанесення написів на камені, і запис на глиняних табличках — надзвичайно трудомісткі, повільні, незмінні, обмежені та нестерпно важкі. Навіть лазерне гравіювання на стандартних поверхнях коштує сотні доларів за відносно короткі фрази, не кажучи вже про вартість самого каменю. Нинішня типова вартість надгробка, на якому зазвичай вказується лише ім’я та деякі дати, становить 1 000–3 000 доларів. Щоб закодувати всі 4,7 мільярда слів англійської Вікіпедії (станом на 20 жовтня 2024 року) у камені, знадобилися б десятки тисяч людей і десятки мільярдів доларів. Будь-яке виправлення або оновлення може змусити почати все спочатку. Щоб закодувати цифрові зображення, потрібно не тільки включити мільярди символів коду, але й інструкції щодо побудови комп’ютера, операційної системи та програмного забезпечення, здатних інтерпретувати цей величезний набір закодованих символів, а потім ввести їх без жодних помилок — завдання, яке само по собі може зайняти у людських команд століття.

Пам’ятники — це об’єкти, які потребують захисту. Кожна війна — це війна проти архітектури. Фізичні пам’ятники, особливо сучасні, не завжди користуються перевагами національної та культурної безпеки. Без постійної охорони та професійності сил безпеки навіть найважчий камінь можна легко зруйнувати, навіть силами, що не мають доступу до сучасного озброєння. «Скрижалі Джорджії» — це загадковий гранітний пам’ятник висотою 19 футів і вагою 118 тонн, створений у 1980 році анонімними приватними громадянами, який містив набір ідеологічних заповідей вісьмома мовами, покликаних направляти людство після апокаліпсису. За 808 слів їх будівництво коштувало понад 400 000 доларів у сьогоднішніх цінах. У липні 2022 року вони були підірвані й знищені невідомими вандалами. Призначені для далекого майбутнього, вони проіснували лише 42 роки.

georgia guidestones
The Georgia Guidestones in 2020
Public domain

Сучасніші методи збереження письменності мають свою особливу привабливість. На моїх книжкових полицях стоїть чимало творів, яким понад 100 років: шумерські тексти, що розповідають історію давньомесопотамської богині Інанни, твори Гомера, Сафо та Евріпіда, а також Марко Поло, Мігеля де Сервантеса та Мері Шеллі. Ці книги збереглися протягом століть завдяки тому, що їх друкували й перевидавали, копіювали, захищали, перекладали та адаптували до нових форматів, а ці турботи розподілялися між століттями зберігачів. Навіть як окремі предмети книги можуть прослужити досить довго, якщо їх зберігати й доглядати в належних умовах. У мене є кілька десятків примірників, які спокійно перетнули сторічну межу. Найстаріша книга, що належить мені, — це том «Оратора» Цицерона, надрукований у Венеції 1554 року. Цей конкретний предмет не є цінним чи важливим (я купив його за 40 фунтів у Лондоні в 2014 році), і все ж він подорожував у просторі й часі, долаючи століття, родини та континенти, без жодних свідчень того, що він потрапляв під опіку професійного архівіста чи установи. Це досі функціональна книга. Сторінки перегортаються. Бліда палітурка з пергаменту стоїть рівно. Вона вижила.

Ця стаття мала бути присвячена найкращим способам збереження цифрових носіїв інформації протягом століття чи й довше, з неявним акцентом на передових технологіях зберігання та інноваційних схемах архівування. Але навіть сьогодні, якщо наша мета — зберегти інформацію на століття, не варто недооцінювати силу друкованих видань.

Друковані книги у фізичній формі природно децентралізуються до крайнього ступеня, потрапляючи не тільки до інституцій, а й до колекцій приватних осіб. Вони подібні до рослин, насіння яких пристосувалося плавати й поширюватися з вітром, спроектоване так, щоб опинитися саме там, де ви найменше цього очікуєте, і вижити. Навіть невеликі самопубліковані тиражі художніх зінів можуть опинитися в Музеї сучасного мистецтва або Національному архіві.

На відміну від цифрових носіїв, для збереження друкованих видань необхідні фізичні бібліотеки, навіть якщо це просто полиці в оселі окремої людини. Це вимагає захисту таких бібліотек від вогню, води та шкідників. Хоча папір із довгими волокнами, змішаний з бавовною та льоном, який використовувався століттями, є надзвичайно міцним і довговічним, механічний папір із деревної целюлози має коротші волокна і схильний до підкислення з часом.

page 42
Les Singuliers et Nouveaux Portraicts by Federico de Vinciolo, 1588
Public domain, part of The Met’s Open Access Initiative

Перевага друкованої продукції полягає в тому, що вона може стати “традицією”. Те, що було надруковано раніше, можна надрукувати знову. Недолік полягає в тому, що для того, щоб повною мірою скористатися збережувальними можливостями друку, те, що ви зберігаєте й друкуєте, має цінуватися громадськістю. Друкарський верстат — це породження ринку, створене для тиражування відповідно до попиту. Проте, як і у випадку з фізичними копіями музики та фільмів, мультиплікативний масштаб навіть невеликих тиражів значно перевершує те, що ви бачите у більшості методів цифрового резервного копіювання. Навіть невеликі незалежні видавці авангардної літератури зазвичай друкують 5 000 книг як початковий тираж(сумненький хех українського книговидавничого ринку, де сучасні автори добре якщо отримають тираж в тисячу примірників). Невеликі видавництва поезії регулярно друкують 1 000–2 000 примірників. У нашу сучасну еру стрімінгу, як часто тисячі людей добровільно зберігають один і той самий цифровий об’єкт на своїх жорстких дисках? Все рідше. Фізичні бібліотеки та читачі роблять це щодня, з великим успіхом.

Проблема з книгами полягає в їхній кількості. Їх уже дуже багато. Обсяг книг перевищує людські можливості щодо догляду за ними. У 2010 році компанія Google спробувала підрахувати загальну кількість книг, які коли-небудь були написані та опубліковані, і отримала цифру 129 864 880. Оцінки різняться, але щороку видається від одного до чотирьох мільйонів нових книг. Станом на 2022 рік Бібліотека Конгресу, найбагатша бібліотека на Землі, має лише 25 мільйонів книг. З огляду на фізичний простір, необхідний для зберігання друкованих видань, масштаби людського книговидавництва вимагають кураторства та відбору. Мільйони томів тексту можна зберігати в цифровому вигляді на жорсткому диску розміром з кінчик пальця, тоді як у фізичній формі для цього знадобилося б кілька будівель. Найбільшим викликом для потенціалу зберігання друкованих книг у масштабі століття є те, що коли книзі виповнюється 100 років, немає гарантії, що хтось буде достатньо цікавитися її змістом, щоб взяти на себе обов’язки з її збереження.

🟠 Донат? Донат!

Доки ми тут, то принагідно нагадую, що задонатити це не тільки чудова ідея, що береже сон, покращує травлення і робить волосся блискучим, а ще й наш обовʼязок, бо в нас є тільки ми.

Ну, а вдруг ти вже задонатив, то завжди можеш закинути кілька грибнів на підтримку проекту

1010001010101020210

Розподіл

Одним із рішень проблеми зберігання даних у масштабі століть є розподіл ваших ресурсів — розміщення копії за копією по всьому світу, щоб жодна катастрофа, війна чи раптова втрата фінансування не могли загрожувати виживанню цифрової колекції. Наразі інтернет не є децентралізованими. Як зазначив Янус Копфштейн у журналі «New Yorker» у 2013 році, «приголомшливий відсоток комунікацій проходить через невелику групу корпорацій — і, отже, перебуває під значним впливом цих компаній та інших інституцій». Ця концентрація лише прискорилася за останнє десятиліття. Наш доступ до Інтернету контролюється телекомунікаційними компаніями, які відкрито застосовують антиконкурентні практики без серйозних наслідків, часто уникаючи конкуренції між собою, оскільки пряма конкуренція обмежила б їхні можливості отримання ренти та прибутку. Лише кілька операційних систем для комп’ютерів мають хоч якесь наближення до широкого поширення. Чіпи, відеокарти і, звичайно, жорсткі диски виробляються відносно невеликою кількістю компаній, і це ще більше стосується деталей, з яких вони складаються. AMD, Apple, ARM, Broadcom, Marvell, MediaTek, Qualcomm і Nvidia — всі вони є клієнтами Taiwan Semiconductor Manufacturing Company у сфері напівпровідників. Цього року міністр торгівлі США Джина Раймондо заявила, що Сполучені Штати купують 92% своїх чіпів у TSMC.

Незважаючи на періодичні обіцянки, легкі кивки головою та гучні заяви про протилежне, великі компанії так і не перевели свої продукти на відкриті протоколи. Повідомлення в iMessage, як і раніше, сині, а всі інші — зелені. Продукти Meta сумісні лише з іншими продуктами Meta. X (колишній Twitter) не сумісний ні з чим. Спроби повернути Інтернету децентралізований характер, такі як платформа для самостійного хостингу arkOS, регулярно стикалися з нестачею ресурсів і зрештою припинялися.

Проте деякі спроби децентралізації виявилися більш успішними. LOCKSS (Lots of Copies Keep Stuff Safe) — це стратегія, протокол і програмне забезпечення для цифрового збереження, розроблені Вікторією Райх і Девідом Розенталем у 1999 році в бібліотеках Стенфордського університету. Розенталь десятиліттями працював над питаннями довгострокового цифрового зберігання та писав про його можливості й підводні камені (ця стаття, безсумнівно, не існувала б без його роботи).

У системі LOCKSS численні копії наукових журналів зберігаються у розподіленій мережі; кожна копія в системі періодично перевіряє себе на наявність пошкоджень та розбіжностей у порівнянні з іншими копіями — це процес опитування та відновлення. Вони «шепочуться» між собою, обмінюючись контрольними сумами, гарантуючи, що їхні копії залишаються неушкодженими. Якщо вузол виявляє розбіжність, пошкодження, він надсилає тихий сигнал SOS, і інший вузол, цифровий самаритянин, приходить йому на допомогу, пропонуючи бездоганну копію, щоб вилікувати рану. Але кожен вузол є автономним, індивідуально відповідальним за догляд за своїми копіями та оплату підписки.

Проект LOCKSS — це спроба створити децентралізовану та надійну систему зберігання даних, яка перебуватиме під контролем спільноти. Результатом стала мережа з 80 наукових та публічних бібліотек, які спільно «зберігають наукові матеріали на власних серверах, а не в хмарі». Члени LOCKSS сплачують внески відповідно до своїх бюджетів, що дозволяє розподілити фінансове навантаження між різними установами.

LOCKSS діє обережно. Система має вузьку спрямованість і створена з повагою до власників авторських прав та адміністрацій установ. Вона обмежена 13 200 журналами та 23 600 книгами відповідно до низки ретельно опрацьованих угод з видавцями. Розвиток системи обмежується суворим дотриманням прав інтелектуальної власності та витратами, пов’язаними з підтриманням місця в мережі. Ці витрати є постійними та тривалими, і на відміну від окремих творів, які з часом стають надбанням громадськості, нинішня політика академічних видавців журналів та періодичних видань передбачає постійне опублікування нових матеріалів, що підлягають авторському праву, та постійного стягнення плати за них. Те, що LOCKSS досягла такого масштабу в умовах нинішньої системи авторського права, є незвичайним.

Основна ідея LOCKSS — взаємне децентралізоване управління — нагадує набагато давніші форми обміну файлами в Інтернеті. Як тільки комп’ютери отримали можливість взаємодіяти між собою, люди почали використовувати такі платформи, як дошки оголошень, Usenet та IRC, щоб обмінюватися даними з усіма, хто був підключений до мережі. Протягом короткого періоду наприкінці 1990-х та у 2000-х роках обмін файлами (а згодом і торрент-системи) безкарно поширювали величезні обсяги музичних та відеофайлів, незважаючи на обмежену пропускну здатність. Такі структури, звісно, дозволяли безкарно ігнорувати права інтелектуальної власності. Копії товарів, які на той час продавалися, можна було швидко отримати безкоштовно. І були й інші проблеми. Шкідливе програмне забезпечення було поширеним явищем, трудомісткий тягар управління колекціями перекладався на окремих осіб, а те, що було доступним, повністю залежало від примх тих, хто завантажував файли. Найголовніше, що всі ці платформи працювали на централізованих серверах, а це означало, що як тільки суди та держави на них нападали, вони зникали. Якщо децентралізоване зберігання мало мати майбутнє, то це мало бути таке, де жоден користувач не міг отримати доступ до файлів будь-якого іншого користувача, де колекції були захищені стінами.

Нащадки цих платформ досі існують, а в деяких випадках навіть процвітають, хоча вже не є домінуючим засобом поширення медіа. Sci-Hub, Library Genesis та Z-Library пропонують статті з наукових журналів безкоштовно всім, хто хоче їх завантажити, ігноруючи закони про інтелектуальну власність та посилаючись на право на науку та культуру згідно зі статтею 27 Загальної декларації прав людини. Ці платформи, по суті, є незаконним, децентралізованим дзеркалом таких ініціатив, як LOCKSS, піратством, яке також виконує функцію страхування на випадок майбутнього глобального колапсу. Унікальні та чітко визначені місії цих ініціатив сприяють їхній популярності та виживанню, незважаючи на їхній неясний правовий статус та величезні сили, спрямовані проти них. Їхня надзвичайна наративна сила — просування універсалістських ідей попри величезні перешкоди, не кажучи вже про міфічну привабливість статусу поза законом — призвела до запеклого захисту з боку прихильників та стимулювала турботу й опіку з боку цієї лояльної спільноти.

Варто замислитися над ефективністю піратства та навмисного порушення законодавства про інтелектуальну власність як тактики довгострокового збереження. Абігейл Де Коснік, професорка Центру нових медіа в Берклі, стверджує, що, з огляду на природу цифрових культурних надбань та нездатність сучасних корпоративних та інституційних структур належним чином дбати про них, зусилля зі збереження медіа на основі піратства мають більше шансів вистояти під час катастрофічних подій у майбутньому, ніж традиційні інституції. З іншого боку, як демонструють гучний судовий процес над Аароном Сварцем або судові справи проти Інтернет-архіву, порушення авторських прав у великих масштабах пов’язане з постійним ризиком санкцій та закриття з боку державних органів.

Повністю децентралізовані системи є більш важкодоступною мішенню для таких дій. InterPlanetary File System — це децентралізований протокол, призначений для створення однорангової мережі для зберігання та обміну файлами в розподіленій структурі. Замість того, щоб покладатися на централізовані сервери, IPFS використовує адресацію за змістом, де кожен файл ідентифікується за допомогою унікального хешу, отриманого з його вмісту. Це дозволяє отримати конкретний файл з будь-якого вузла в мережі, який зберігає відповідний хеш, і все це в глобальній мережі, побудованій для розпізнавання та обміну даними між декількома екземплярами одного й того ж файлу. IPFS функціонує як один величезний торрент, але дозволяє користувачам завантажувати або роздавати лише частину цілого.

У 2017 році, коли турецькі суди заборонили Вікіпедію, IPFS дозволила розповсюдити повну копію, щоб обійти заборону. Після репресій проти згаданих вище Library Genesis та Z-Library їхні колекції були перенесені на IPFS. Довгостроковий успіх колекцій, що зберігаються в IPFS, залежить від практик цифрового архівування кожного окремого учасника та від рівня участі, який, як може підтвердити будь-який розробник відкритого програмного забезпечення, може бути нестабільним.

У 2017 році компанія Protocol Labs, розробники IPFS, запустила Filecoin — систему цифрового зберігання даних на основі криптовалюти, частково засновану на архітектурі IPFS. Вона прагне стимулювати участь у проекті, виплачуючи винагороду у вигляді криптовалюти тим, хто надає місце для зберігання даних. Filecoin — не єдиний такий проект. Arweave, Storj, Sia, BitTorrent Token та Safecoin — це варіації на одну тему, нові спроби втілити давню мрію: створити ринкову систему, яка зможе з’єднати всі невикористані цифрові сховища, розкидані по всій планеті, з тими, хто може їх потребувати. У нас завжди був величезний надлишок невикористаного цифрового сховища і не було життєздатного ринку, щоб використати цей надлишок, що могло б дозволити тим, хто має додаткове сховище, отримувати прибуток, а тим, хто хоче зберігати дані, — отримати доступ до дешевого розподіленого ринку.

Системи, повністю засновані на блокчейні, де кожен новий фрагмент даних додається в кінець ланцюга, який потім реплікується в кожному екземплярі та кожному вузлі, мають повноцінний «механізм збереження даних». Весь масив даних зберігається у незмінному, децентралізованому реєстрі, розподіленому між численними вузлами, що забезпечує прозорість, але вимагає значних обсягів пам’яті, оскільки повна історія транзакцій зберігається в кожній точці. Оскільки цей механізм не підходить для зберігання великих обсягів даних, більшість рішень для зберігання на основі криптовалют покладаються на механізми збереження на основі контрактів, які часто використовуються в так званих «розумних контрактах», і, таким чином, зберігають лише найважливіші дані безпосередньо в контракті. Такий підхід дозволяє уникнути реплікації всієї історії блокчейну.

Системи зберігання даних на основі криптовалюти працюють за рахунок стимулювання користувачів зберігати довірені їм дані. Вони розроблені для постійної перевірки того, що постачальники послуг зберігання зберігають незмінену та неушкоджену копію довірених їм даних, а також для підтвердження безперервності цього зберігання з плином часу. До честі Filecoin слід зазначити, що замість того, щоб ізолювати свою систему, вони пропонують рішення для зберігання даних, сумісні з Amazon S3. Вони, здається, щиро зацікавлені у зберіганні архівних даних та співпраці з архівними та освітніми установами. Їхня пов’язана благодійна організація, Filecoin Foundation for the Decentralized Web, надала фінансову підтримку Лабораторії бібліотечних інновацій Гарвардської школи права, що дозволило створити цю статтю.

У 2018 році фахівець із цифрової консервації та співзасновник LOCKSS Девід Розенталь стверджував, що децентралізовані мережі зберігання даних на основі криптовалют ніколи не зможуть зрівнятися з централізованими хмарними сервісами за показниками надійності, ціни, швидкості та умов доступу. Необхідність шифрування всіх ресурсів зберігання з міркувань безпеки, відсутність стабільної цінової політики та постійна потреба у ліквідності ринку зберігання даних створюють потенційні довгострокові проблеми. Нарешті, як зазначає також Розенталь, якщо надання місця для зберігання даних таким сервісам дійсно стане прибутковим, існує серйозний ризик централізації постачальників послуг зберігання: якщо надання місця для зберігання приносить дохід, цей дохід буде концентруватися, оскільки існують стимули до централізації, так само як і в разі інших нібито децентралізованих пропозицій в умовах нерегульованого ринку. Невизначений правовий статус цих систем також створює потенційні проблеми. Зберігання копій інтелектуальної власності, захищеної авторським правом, може призвести до проблем на самому ринку, якщо провайдерів у певних юрисдикціях змусять на законних підставах видалити дані, які вони зобов’язані зберігати згідно з договором. Жодна з цих моделей досі не довела своєї здатності функціонувати, не кажучи вже про успішне існування, як життєздатні ринкові майданчики протягом тривалого періоду, а також не продемонструвала, що може надійно стимулювати зберігання даних у періоди конфліктів чи дефіциту. З часу розвитку великих торговельних цивілізацій жоден регіон на Землі не прожив століття без значної економічної кризи, потрясіння або дефіциту. У масштабі століття ці події можуть бути серйозними, здатними повалити режими, знищити національні держави та спровокувати конфлікти, що призводять до загибелі мільйонів людей. Прямо прив’язувати метод архівного зберігання до ринкової системи, учасники якої живляться волатильністю, — це все одно, що закопувати свої жорсткі диски в зоні 100-річної повені. Якщо децентралізоване рішення для зберігання, підкріплене криптовалютою, має бути життєздатним у довгостроковій перспективі для культурних та інтелектуальних інституцій і колекціонерів — організацій та осіб, які, як правило, мають надзвичайно чутливі бюджетні практики, — вони мають знайти спосіб обмежити та пом’якшити вплив цих потрясінь на їхні ціни.

Реалізації на основі блокчейну також наражаються на ризик інтелектуального заперечення або навіть політичних атак з боку тих, кого відштовхує спекулятивне фінансове використання цієї технології та її заплямована історія, пов’язана з аферами, шахрайством, рентоорієнтованою діяльністю, жадібністю та антидержавницькими технолібертаріанськими фантазіями. Я знаю це, бо сам належу до тих, хто має такі інстинктивні негативні реакції. Навіть якщо ви вважаєте ці реакції несправедливими, вони є чудовим прикладом людської мінливості, яку слід враховувати при оцінці технології для зберігання даних у масштабі століть. Якщо ви будуєте свою схему зберігання, використовуючи культурно та політично мінливу технологію, це саме по собі становить ризик після того, як вас не стане. Як і у випадку з кожним іншим методом, описаним тут, цей метод має бути збережений разом із тим, що зберігається.

Спільноти криптовалют і блокчейнів, а також пов’язані з ними компанії, досі вкладали надто мало коштів у необхідну рутинну роботу з цифрового збереження, яка могла б забезпечити довговічність їхніх протоколів, а також програмного та апаратного забезпечення, на якому ці протоколи працюють. Криптокомпанії також не кинули жодного серйозного виклику централізованим апаратним і телекомунікаційним компаніям, які роблять їхні моделі можливими. Якщо вони серйозно прагнуть справді децентралізованих і стійких рішень для збереження культурної пам’яті людства, їм слід використовувати свої ресурси для атаки, підриву та заміни централізованих телекомунікаційних, апаратних і програмних гігантів, на яких вони зараз покладаються. Криптоспільнота, яка серйозно ставиться до децентралізованого інтернету, повинна вести тотальну війну з такими компаніями, як Verizon, AT&T, Comcast, Starlink та Spectrum, і ставитися до домінування таких компаній, як NVIDIA, з цілковитою ворожістю.

Але ці зауваження є другорядними. Ми можемо уявити альтернативну технологію децентралізованого зберігання даних, яка взагалі не пов’язана з криптовалютою, і все одно дійти до справжнього оціночного питання, що стоїть тут на порядку денному: питання протиставлення централізації та децентралізації в самій практиці архівування.

Книга Ендрю Петтегрі та Артура дер Ведувена «Бібліотека: крихка історія» починається з анекдоту про голландського вченого 16 століття, який прибув на зустріч до бібліотеки імператора Священної Римської імперії, щоб виявити її в стані повного занедбання та злиднів. Друкарський верстат існував лише близько століття, але за цей короткий час найбільший ворог архівів — занедбаність — вже завдав удару. Ми можемо хвилюватися з приводу всіляких драматичних катастроф. Глобальна термоядерна війна, падіння астероїдів, виверження кальдерних вулканів, екстремальні ризики, «Скайнет», культурні революції, друге пришестя, вторгнення інопланетян, мальтузіанські кризи, обвал народжуваності, пандемії, сонячні спалахи та наднові в Місцевій групі. Ми можемо намагатися розробити заходи проти всіх видів катастроф, що загрожують суспільству: киплячих морів, гуркоту землі та палаючих міст. Ми можемо уявити, як децентралізація могла б забезпечити захист від руйнівних сценаріїв, як вона захистила б архів у разі вторгнення, пожежі, бомбардування та кібератаки. Але ніщо з цього не є основною причиною знищення архівів. Архіви знищує звичайна і така нудна людська недбалість.

Найгостріше питання щодо децентралізованих сервісів зберігання даних полягає в тому: чи здатні вони спонукати до дбайливого ставлення?

Schlagwortkatalog
The subject catalog (“Schlagwortkatalog”) of the University Library of Graz
Photo by Dr. Marcus Gossler, licensed under GNU Free Documentation License

Безумовно, трапляються ситуації, коли централізація мала катастрофічні наслідки. У Боснії Національний архів у Сараєво зазнав серйозних пошкоджень під час серії демонстрацій та заворушень у 2014 році. У 1984 році Довідкова бібліотека сикхів в Амрітсарі (штат Пенджаб) стала об’єктом індійської військової операції, і весь її фонд було конфісковано. Досі його не повернули, і вважається, що він втрачено. Під час Боксерського повстання 1900 року була знищена бібліотека Академії Ханьлінь у Пекіні. Єдині відомі збережені рукописи «Беовульфа» та «Сіра Гавейна і Зеленого Лицаря» вціліли під час пожежі в Коттонівській бібліотеці в Лондоні 1731 року. Інші томи не були такими щасливими. Історія рясніє випадками знищення та втрати бібліотек і книг. Тільки під час Другої світової війни було знищено або пошкоджено мільйони бібліотечних томів.

Я досі уникав згадки про найвідоміше в історії знищення бібліотеки — легендарної Олександрійської бібліотеки — не в останню чергу тому, що час та обставини її знищень (у множині) достеменно не встановлені. Але я хотів би поділитися враженнями Річарда Овендена, автора книги «Спалення книг: історія навмисного знищення знань», який обговорює розповідь Едварда Гіббона про долю бібліотеки в праці «Історія занепаду та падіння Римської імперії»: «Для Гіббона Олександрійська бібліотека була одним із найбільших досягнень античного світу, а її руйнування — яке, на його думку, було наслідком тривалого й поступового процесу занедбання та зростаючої неосвіченості — стало символом варварства, що охопило Римську імперію, дозволивши цивілізації втратити давні знання, які в його час знову відкривали й цінували. Пожежі були серйозними подіями, в результаті яких було втрачено багато книг, але як інституція бібліотека зникла більш поступово — як через організаційну недбалість, так і через поступове старіння самих папірусних сувоїв».

Якщо ваша мета при зберіганні даних у масштабі століть полягає в тому, щоб уникнути кінетичних катастроф, гідних голлівудських фільмів, то децентралізовані рішення є ідеальними, але чи здатні вони протистояти недбалості — це вже не так очевидно. Якщо децентралізована система прагне досягти успіху в масштабі століть, саме цю проблему вона повинна і зобов’язана вирішувати.

Однією з небагатьох очевидних переваг централізації є те, що вона спонукає до дбайливого ставлення. Якщо люди знають, що щось є важливим, цінним, а можливо, навіть останнім у своєму роді, вони, як правило, щодня борються за його збереження. Історія воєн, конфліктів і катастроф — це також історія архівістів, кураторів, митців, науковців та пристрасних добрих самаритян, які рятують твори від неминучого знищення, йдучи на великий особистий ризик і жертви. Упередження виживання, присутнє в людському каноні, є лише відлунням тисяч героїчних вчинків.

Французька національна бібліотека, раніше відома як Королівська бібліотека, пережила 16 королів, двох імператорів, п’ять республік, шість повномасштабних революцій, Столітню війну, Громадянську війну у Франції, Італійські війни, Тридцятирічну війну, Франко-голландську війну, Дев’ятирічну війну, Війну за іспанську спадщину, Семирічну війну, Наполеонівські війни, Франко-прусську війну, Першу світову війну та Другу світову війну. Іноді вона зберігала твори, які не мали інших відомих зберігачів. Національна бібліотека Франції не є винятком чи випадком упередженості виживання, оскільки багато національних бібліотек досягають столітнього зберігання, навіть витримуючи бурхливі зміни в державах, яким вони служать.

Значна частина світової літератури, науки, мистецтва та музики збереглася саме завдяки тому, що була відносно централізованою. Незважаючи на очевидні ризики, пов’язані з тим, що «всі яйця кладуть в один кошик», не варто надто поспішно відкидати ідею централізації. Чи справді ми можемо бути впевнені, що анонімні учасники розподіленого сервісу зберігання даних, забезпеченого криптовалютою, будуть ставитися до своїх обов’язків з такою ж ретельністю, як професійні бібліотекарі в централізованій установі чи затяті приватні колекціонери? Чи можемо ми бути впевнені, що в разі катастрофи, зловмисних дій уряду або набігів грабіжників вони будуть боротися за захист своїх запасів? Або ж вони, навпаки, розслабляться, знаючи, що де інде є ще одна копія, що блокатори запису, контрольні суми для виправлення помилок та шифрування гарантують, що вони не самотні? У цьому полягає проблема розподілених систем: а що, якщо кожен інший вузол у розподіленій мережі також розраховує на таку безпеку?

Зрештою, через понад сто років настають лихоліття. Розподілена система наражається на ризик надмірної впевненості та відсутності індивідуальної відповідальності. Під час Другої світової війни бібліотекарі та куратори в централізованих установах таємно вивозили твори прямо з-під носа гестапо та СС. Деякі відмовилися тікати і продовжували працювати під окупацією, ризикуючи власним життям, навіть вдаючи, що співпрацюють з ворогом (тим самим наражаючись на небезпеку з боку сил опору), складаючи реєстри, що відстежували місцезнаходження розграбованих колекцій. Бібліотекарі в Литві ховали стародавні єврейські тексти в підвалах місцевих церков. У Польщі вони ховали монастирські рукописи XIII століття у банківських сховищах. Цілі архіви переправляли через кордон уночі, коли жорстока і неминуча смерть переслідувала кожного, кого могли спіймати на гарячому.

Тим не менш, існує безліч прикладів успішних розподілених або децентралізованих зусиль, які варто розглянути — деякі з найстаріших бібліотек світу — монастир Святої Катерини, Аль-Каравіїн, Університет Наланди, Бібліотека Ватикану або монастир Сак’я — можливо, є вузлами мережі, що збереглися, як зберігачі релігійних текстів. Вони стали можливими завдяки першому принципу друку — кодексу, сувою і навіть рукопису — що він існує для копіювання, для множинності. Це саме по собі є підтвердженням переваг децентралізації.

У світовому масштабі мистецтва, театр, танець і музика використовували децентралізацію як тактику збереження з приголомшливим успіхом. У випадку європейської барокової та класичної музики, тисячі оркестрів та музичних шкіл по всьому світу використовували та використовують акт колекціонування, копіювання, друку, вивчення та гри для захисту та передачі творів протягом століть. Навіть оригінальні інструменти, які зараз коштують статки та яким сотні років, — Страдіварі, Аматі, Гварнері, Руджері, Гваданьїні та інші — досі грають, зберігають, передають та зберігають для наступного покоління музикантів. Періоди воєн та потрясінь призводили до того, що невеликі групи музикантів разом грали камерну музику в будь-яких доступних їм просторах, дозволяючи музичним творам підкорювати час.

Децентралізована фанатська культура за своєю суттю є захисною. Окремі ентузіасти та цифрові пірати, що збираються на форумах та каналах Discord, виконали неймовірну роботу зі збереження літературної, музичної, відеоігрової та кіноісторії шляхом агрегації, емуляції та децентралізованого розповсюдження. Високоякісні версії оригінальних незмінених версій фільмів, таких як «Зоряні війни» (які більше не є комерційно доступними) зберігаються таким чином. Волонтерські команди «недобросовісних архівістів» десятиліттями займаються збереженням цифрових та веб-активів, яким загрожує забуття або знищення.

Особиста колекція предметів, наприклад, книги на вашій книжковій полиці, може легко породити суттєвий емоційний зв’язок. Ключовим для децентралізованих систем зберігання буде розробка подібних механік. Найуспішніший волонтерський проект децентралізованих обчислень в історії, проект SETI@home 1999–2020 років, який аналізував зібрані радіосигнали в пошуках ознак позаземного розуму, вказує на те, як така схема може бути можливою. Сотні тисяч користувачів комп’ютерів, включаючи тодішніх підлітків, таких як я, із задоволенням передали свої комп’ютери цьому завданню. Це було досягнуто не з обіцянкою фінансової компенсації, а завдяки зверненню до самого масштабу та грандіозності місії та щирому запрошенню взяти участь у чомусь, що може мати значення.

Що спільного в цих прикладах, так це те, що всі вони залучають небайдужі групи. Найстійкіші децентралізовані зусилля завдячують своїм успіхом не технологічним чи організаційним інноваціям, а радше залученню поколінь людей з емоційними та інтелектуальними інвестиціями у свою цінність. Як для хмарних сервісів зберігання даних, так і для розподілених схем зберігання даних питання полягає в тому, чи можуть вони викликати необхідний рівень пристрасті та пильності. Чи вони та їхні технології надають можливості тим, кому небайдужі, чи прирікають їх на провал? Чи можуть корпорації хмарного зберігання даних перетворитися на охоронців? Чи можуть розподілені системи зберігання даних перетворити кожен вузол на охоронця?

10001010100100121

Відповіді та невідповіді

Я здебільшого ходив навколо та довкола протягом 12 000 слів. Можна навести нормальний такий аргумент, що методи та носії зберігання значною мірою не мають значення для виживання даних протягом таких тривалих періодів. Успіх зберігання протягом століть зводиться до того ж, що й зберігання для будь-якої тривалості: до обслуговування того, що зберігаємо. Щоденна рутинна робота людини, яка піклується про щось. Якщо колекція належно обслуговується та доглядається протягом 400 років, є ймовірність, що ця колекція виживе й наступні 400 років. Спосіб її зберігання буде розвиватися або змінюватися в міру її обслуговування, але якщо є ті, хто її підтримує, вона збережеться.

Це твердження лишиться правдивим навіть з огляду на величезні потенційні досягнення в галузі носіїв інформації, які вже не за горами, — серед яких, перш за все, зберігання в ДНК з її неймовірною щільністю та здатністю до реплікації. Наразі цей метод обмежений надзвичайно низькою швидкістю читання/запису та кількома процесами, які ще не почали винаходити, але як тільки він з’явиться, цю технологію все одно доведеться підтримувати.

Цифрове зберігання залежить від програмного забезпечення. Усе програмне забезпечення та формати файлів залежать від обслуговування та збереження, оскільки технологічний прогрес робить апаратне та програмне забезпечення, що раніше використовувалося для читання та створення медіа, застарілим. Давнє програмне забезпечення є настільки рідкісним, що може стати об’єктом захоплення. У 2015 році автор MIT Technology Review Гленн Флейшман відповів на запитання читача про те, яка найстаріша комп’ютерна програма досі використовується. Він дійшов висновку, що найстарішою є система управління та відстеження контрактів Міністерства оборони, MOCAS, вперше створена в 1958 році. Вона досі використовується й по сьогодні, незважаючи на заплановану дату виведення з експлуатації на 1 жовтня 2002 року. Флейшман також згадав систему перфокарт IBM 402 1948 року для інвентаризації та обліку, яка досі використовувалася виробником пристроїв для фільтрації води з Техасу.

punchcard
An IBM punch card
Public domain, via Wikimedia Commons

Індивідуальний головний файл Податкового управління США (IRS), основна система для зберігання та обробки податкових декларацій та введення даних до них, спочатку був написаний на COBOL для мейнфреймів IBM System/360 та працює з 1960-х років. Існують частини кодової бази UNIX, які безперервно використовуються з моменту запуску операційної системи в 1969 році. Ймовірно, існують реалізації мови асемблера, які існують з 1950-х років.

Важко визначити найстаріший фрагмент безперервно збережених цифрових даних, який би не був самим програмним забезпеченням чи кодом і ніколи не був фізично перетворений та повторно оцифрований. Виходячи з того, хто були першими, хто використовував системи зберігання даних на жорстких дисках та стрічках, я б ризикнув припустити, що це фрагмент метеорологічних або сейсмографічних даних, записаних в університеті на Західному узбережжі Сполучених Штатів, але це лише здогадка. Той факт, що деякі з цих наборів даних також зберігалися в друкованих архівах, а пізніше повторно введені в цифрові бази даних, ускладнює точність твердження. Основна комп’ютерна система метеорологічних даних Національного управління океанічних і атмосферних досліджень та системи Data Buoy використовуються з 1970 року. Ці набори даних зберігаються завдяки пильності та наполегливій увазі поколінь вчених та їхніх студентів. Але жоден з них не наблизився до досягнення нашої 100-річної позначки.

Наші цифрові інструменти застарівають та стають нестерпними з вражаючою швидкістю. Окрім проблем, пов’язаних зі збереженням та зберіганням, ризики, пов’язані з нездатністю підтримувати програмне забезпечення, а також знання та можливості для його підтримки, є реальними та нагальними. Під час пандемії COVID-19 кілька державних та місцевих органів влади опинилися у скрутній потребі в програмістах на COBOL(місце для анекдоту про того тіпа, який володів чарівною флешечкою, і відповідав за підтримку системи на українській митниці), оскільки їхні системи страхування від безробіття та страхування все ще працювали на програмному забезпеченні, побудованому цією відносно давньою мовою. Якщо ви хочете зберігати щось протягом ста років, здатність читати та отримувати цей збережений елемент у майбутньому є критично важливою. І єдиний спосіб забезпечити цю здатність – це зберегти програмне забезпечення, яке дозволяє вам отримувати доступ до ваших даних, зберегти обладнання, яке може запускати це програмне забезпечення, та зберегти знання та навички, необхідні для обслуговування всієї системи.

Хоча багато вчених-інформатиків та мислителів, як-от співвинахідник інтернету Вінтон Серф, благородно пропонували або теоретизували схеми універсальних форматів файлів, які могли б змінити цю реальність, ці ідеї залишаються спекулятивною фантазією. Єдиний наразі життєздатний спосіб зберегти програмне забезпечення — це важка щоденна робота з обслуговування, адаптації та емуляції. Наразі немає жодного скороченого шляху чи чарівного формату. Немає жодного хака.

Але існують інструменти, зусилля та протоколи, які намагаються полегшити цей тягар. Формат файлів Web ARChive (WARC) – це стандарт для збереження веб-фондів, який вміщує всі види вторинного контенту. Fedora – це система управління цифровими ресурсами, побудована з нуля для збереження цифрових активів. CLOCKSS – це незалежна некомерційна реалізація технології LOCKSS, призначена для довгострокового темного(прихованого?) архіву журналів та книг. Rhizome, організація цифрового мистецтва та культури, що працює в Новому музеї в Нью-Йорку, має спеціальну команду зі збереження цифрових творів. ArchiveBox – це самостійне рішення для архівування веб-сторінок. Лабораторія медіаархеології в Університеті Колорадо в Боулдері зберігає та документує застарілі медіа. Джон Бауерс, Джек Кушман, Джейшрі Сараті та Джонатан Зіттрейн, які працюють у Лабораторії бібліотечних інновацій, запропонували «Сильні темні архіви» – протокол для цифрових запечатаних записів, що були створені вперше, які повинні бути захищені з міркувань безпеки або з юридичних міркувань. Існують десятки інших гідних проектів та прикладів. Бібліотекарі та архівісти всього світу десятиліттями вирішують проблеми цифрового збереження — проблема в тому, що ніхто інший цим не займається.

Справжнім рішенням проблеми зберігання даних у масштабі століття, особливо у великих масштабах, є зміна цієї реальності. Успішне зберігання даних у масштабі століття вимагатиме величезних інвестицій у цифрове збереження, суспільних зобов’язань. Політиків, уряди, компанії та інвесторів доведеться переконати, стимулювати або навіть залякувати.

Сполучені Штати виділяють мізерні ресурси на практику та вирішення проблем архівування та збереження загалом. Я спробував підрахувати, який відсоток ВВП США витрачається на бібліотеки та архіви — не лише на цифрове збереження, навіть не лише на збереження, а які ресурси виділяються на всю категорію. Я зібрав бюджетні звіти від національних, штатних та місцевих установ, некомерційних установ, галузевих груп та корпоративних архівів; оцінив виробничі потужності галузей, які обслуговують ці групи; поспілкувався з економістами, експертами та аналітиками UBS, Morgan Stanley та Бюджетного управління Конгресу — і так і не зміг наблизитися до оцінки, яка б перевищувала 0,1 відсотка ВВП. Згідно з опитуванням публічних бібліотек Інституту музейних та бібліотечних послуг (IMLS), публічні бібліотеки в Сполучених Штатах мали загальні операційні витрати близько 13 мільярдів доларів у 2018 фінансовому році. Національний архів запросив 481 мільйон доларів для свого бюджету на 2024 рік. Приватний сектор витрачає дуже мало на власні архівні зусилля. Навіть надзвичайно великі компанії, як правило, наймають одного корпоративного архівіста, якщо взагалі наймають. Порівняно з розміром будь-якої іншої частини нашого уряду чи економіки, ці цифри крихітні.

Програмне забезпечення керує нашим світом. Витрачати так мало коштів на спробу зберегти щось настільки важливе – це meh і стидоба.

Найкращим варіантом для забезпечення зберігання даних у масштабі століття є радикальна зміна цього порядку. Будь-який постачальник сховищ, який серйозно налаштований бути життєздатним варіантом довгострокового зберігання, повинен кричати про необхідність збереження програмного забезпечення за кожної нагоди. Якщо корпоративні зацікавлені сторони в цій сфері серйозно налаштовані на надання клієнтам довгострокового зберігання, вони повинні використовувати весь свій фінансовий, людський та політичний капітал, щоб зробити цифрове збереження більш пріоритетним.

Щоразу, коли медіакомпанія знищує архів, щоразу, коли компанія-виробник відеоігор переслідує тих, хто зберігав контент, який вона закинула, щоразу, коли технологічна компанія знищує добре використовуваний продукт без жодного плану щодо його збереження, на ці дії слід звернути увагу та спротив.

Ми знаходимося на межі темних віків, або вже вступили в них. Масштаби мистецтва, музики та літератури, які втрачаються щодня, коли Всесвітня мережа змінюється та деградує, представляють собою найбільшу втрату культурного виробництва людства з часів Другої світової війни. Моє покоління постійно отримувало попередження від вчителів, батьків та авторитетних осіб, що нам слід бути обережними в Інтернеті, тому що Інтернет все памʼятає, але виявилося, що все навпаки. Як зауважив письменник і дослідник Кевін Т. Бейкер: «В Інтернеті Александрія горить щодня».

alexandria
19th-century artistic rendering of The Library of Alexandria
Public domain, “The Great Library of Alexandria” by O. Von Corven

Для зберігання на столітній термін ви не боретеся зі звичайними смертними ворогами — ви ведете битву проти шалених і недобрих сил геології, фізики та хімії, не кажучи вже про невичерпну любов до дурощів людства як виду. Пощади не буде.

Якщо ви хочете зберегти щось протягом 100 років, які найкращі методи для забезпечення його виживання? Зберігати це в рамках соціальної або урядової структури, яка, найімовірніше, сприятиме обслуговуванню та догляду. Бути під захистом або бути пов’язаним з відповідною національною державою (наприклад, можна стверджувати, що фонди Бібліотеки Конгресу підкріплені всією потужністю ядерного арсеналу Сполучених Штатів). Бути частиною великої релігії. Бути частиною аристократії. Бути частиною видатної мистецької чи інтелектуальної сцени або учасником мистецької чи інтелектуальної традиції.

Однак, кожна з цих структур управління також створює ризики. «Немає політичної влади без влади над архівом», – писав Жак Дерріда у своїй книзі «Архівна лихоманка». Централізовані структури влади монархій, деспотичних держав, військових диктатур та однопартійного правління мають схильність до навмисного знищення артефактів та записів, щоб підтримувати контроль. Кланові системи регулярно знищують те, що підважує їх. Домінуючі ідеології вільного ринку активно стимулюють масову відмову від усього, що не має ринкової цінності для самопідтримки. Національні держави, навіть соціальні демократії, які займають високі місця за різними індексами свободи, мають вражаючу здатність до свідомої та випадкової цензури, вибіркового збереження та занедбання артефактів, що перебувають під їхньою опікою. Як пише Фернандо Баес у своїй книзі «Універсальна історія знищення книг»: «Поширеною помилкою є приписування знищення книг неосвіченим людям, які не усвідомлюють своєї ненависті. Після дванадцяти років дослідження я дійшов висновку, що чим культурніша нація чи людина, тим охочіше кожна з них знищує книги під тиском апокаліптичних міфів».

Щоб вижити, зберігач даних та розробники інструментів, які вони використовують, повинні бути готові зайняти скептичну та навіть зухвалу позицію щодо суспільств, у яких вони живуть. Вони повинні прийняти захист покровителя, водночас готуючись до можливості зради. Якщо вам цікаво, чому значна частина цього есе займає таку антагоністичну позицію щодо зовнішніх політичних та економічних гравців, водночас враховуючи плоди їхніх пропозицій, то це тому, що архівіст столітнього масштабу іноді повинен служити ідеології, яка відповідає лише самій собі — захисту зібраних артефактів будь-якою ціною. Ця ідеологія, «архівізм», передбачає віру в збереження того, що ми створюємо та думаємо, для майбутніх поколінь, за рахунок чогось іншого. Зберігання столітнього масштабу може охоплювати методи та платформи, бути забезпеченим урядами та титанами промисловості, підтримуватися релігіями, культурами, митцями, сценами, шанувальниками, колекціонерами, технократами та інженерами, але зрештою воно повинно зберігати свої цінності внутрішньо.

І тут, знову ж таки, єдиним справжнім рішенням є агресивні та масштабні інвестиції в архіви, бібліотеки, фахівців з цифрового збереження та фахівців з підтримки програмного та апаратного забезпечення на кожному рівні, в кожній формі практики та економічних обставинах. Це має статися не лише для держав, корпорацій та установ, а й для любителів та споживачів. Багато наших найцінніших мистецьких та інтелектуальних артефактів десятиліттями перебували в руках окремих людей задовго до того, як потрапили під опіку установ.

Стійкість у часі — це не те, що можна розробити в момент зародження, а потім забути. Зберігання інформації в масштабі століття вимагає пильної уваги, здатної адаптуватися до нових загроз, до нових парадигм, до того, що раніше неможливо було уявити. Метою зберігання інформації масштабу століття має бути збереження того, що ми створили, щоб інші, ті, кого ми ніколи не зустрінемо, могли відчути їхні тонкощі та екстази, свою здатність до просвітлення. Це слід робити будь-якими необхідними засобами, будь-яким методом чи рішенням, що забезпечує можливість такого майбутнього — день за днем ​​— і бути готовим змінюватися в будь-який момент, битися та драпати проти сил, що намагаються задушити світло.

Якщо ви компанія, яка пропонує продукт для зберігання даних, як ви можете допомогти довгостроковому цифровому зберіганню архівних матеріалів? Спробуйте знайти нову інвестиційну модель, яка дозволить вам будувати на довгострокову перспективу. Впроваджуйте відкриті протоколи. Підтримуйте закони про право на ремонт та створюйте обладнання, яке можна ремонтувати. Атакуйте фірми в інших частинах мережі та обчислювальних ланцюгах, які прагнуть централізації та монополії. Допоможіть фінансувати та впроваджувати абсолютно нову парадигму цифрового збереження програмного забезпечення.

І якщо ви, людина, яка читає це, хочете зберегти щось і забезпечити його існування протягом століття, що вам слід зробити? Більше ніж щось лише одне. Вам слід поєднати всі доступні вам методи, шари резервних копій, армії копій і, найголовніше, практики та сайти, які заохочують культуру пильності та турботи. Ви повинні боротися за суспільство, яке цінує науку та мистецтво та те, що вони створюють. А потім, щодня, ви повинні робити все можливе, щоб зберегти своє щось у безпеці, робити все можливе, щоб дати змогу наступному поколінню зробити те саме, а потім довірити цю битву їм, щоб вони повторювали її в майбутньому.

У 2009 році подружжя відремонтувало покинутий будинок у сонному місті Сент-Енн, штат Іллінойс. Будинок був у поганому стані, явно пошкоджений вандалами, розграбований, потрісканий та деформований. Вони знайшли папери, розкидані та складені всюди, з ім’ям «Флоренс Прайс», написаним знову і знову. Вони ненавмисно виявили колишній будинок для відпочинку композиторки через 56 років після її смерті та десяток творів, які вважалися давно втраченими, включаючи два концерти для скрипки та її четверту симфонію. У 2015 році редактор літературного журналу, нишпорячи в архіві рідкісних книг Принстонського університету, натрапив на неопубліковане оповідання Ф. Скотта Фіцджеральда, яке мало бути опубліковано, але так і не було опубліковано через конфлікт між автором та його агентом. Того ж року в Бібліотеці рідкісних книг та рукописів Бейнеке Єльського університету було знайдено неопубліковане оповідання Едіт Вортон. У 2010 році в тому ж архіві дочка Річарда Райта знайшла раніше неопублікований рукопис роману, захований серед його паперів. Якби ви зайшли до магазину платівок на початку 1950-х років і попросили їх примірник «Чотирьох пір року» Вівальді, який зараз є одним із найпоширеніших музичних творів у світі, швидше за все, вони б не мали уявлення, про що ви говорите. У 1920-х роках невелика група ентузіастів Вівальді в Італії обшукувала місцеві бібліотеки та сховища в пошуках творів і зрештою знайшла половину його партитур у монастирі в П’ємонті, а іншу половину зберігала заможна аристократична родина. Група знайшла фінансових спонсорів, придбала обидві колекції для Туринського університету та протягом наступних трьох десятиліть працювала над відродженням музичної репутації. До 1960-х років Вівальді був всюдисущим. Коли Чеський національний музей перекаталогізував та оцифровував свої архіви у 2015 році, вони знайшли давно втрачену співпрацю 1785 року між Вольфгангом Амадеєм Моцартом та Антоніо Сальєрі. Тільки цього року муніципальні бібліотеки Лейпцига повідомили, що в їхніх колекціях було знову виявлено ще одну композицію Моцарта. За кілька тижнів до публікації цієї статті газета «Нью-Йорк Таймс» повідомила, що куратор Бібліотеки та музею Моргана знайшов раніше невідомий вальс Шопена.

Усі ці твори були перевидані, перезаписані або повторно виконані з великим визнанням. Те, що було втрачено, було знайдено. Невеликі індивідуальні акти турботи, що поширювалися протягом поколінь, призвели до їхнього виживання та повторного відкриття. Цифрові версії цих чудес можуть статися і стануться. Одного дня хтось знайде флешку на розграбованій підлозі будинку, забутий сервер у руїнах центру обробки даних, файл у надрах бази даних. Це матиме значення. Навіть якщо їхній вміст був пошкоджений або забутий, турбота може принести плоди десятиліття потому. Вони є різницею між одужанням та відчаєм.

101010010100101202001

Про автора

Максвелл Нілі-Коен є науковим співробітником Лабораторії бібліотечних інновацій. Його документальні твори та есеї публікувалися в таких виданнях, як The New Republic, SSENSE та BOMB Magazine. Його неписьменницька робота охоплює театр, відеоігри, танці та музику. Його експерименти з технологіями були схвалені журналами The New York Times Magazine, Frieze та The Financial Times. До своєї літературної та мистецької кар’єри він працював аналітиком конфліктів, вивчаючи соціальні потрясіння, ядерну зброю та вплив асиметричної війни на суспільства та економіку. Він живе в Нью-Йорку.

Авторські права
Редактор:
Клер Стентон

Додаткове редагування:
Мег Міллер

Копірайтинг:
Джилліан Брассіл

Мистецтво та дизайн:
Шелбі Вілсон та Алекс Міллер

Веб-доступність:
Ребекка Кремона та Бен Штайнберг

Підтримку цього проекту надав Фонд Filecoin для децентралізованого Інтернету

Опубліковано Лабораторією бібліотечних інновацій Гарвардської школи права

На момент публікації в цій статті йшлося про запит 2021 року на відеозапис лекції адмірала Грейс Гоппер, що знаходиться в архівах Агентства національної безпеки, який було відхилено, оскільки агентство більше не мало машини, здатної відтворювати відеокасети AMPEX. У серпні 2024 року АНБ опублікувало оцифровану версію записів за допомогою Національного управління архівів та документації. Стаття була оновлена ​​відповідно до цієї публікації. Збережену копію попередньої версії можна переглянути на сайті Perma.cc.

🟠 Донат? Донат!

Доки ми тут, то принагідно нагадую, що задонатити це не тільки чудова ідея, що береже сон, покращує травлення і робить волосся блискучим, а ще й наш обовʼязок, бо в нас є тільки ми.

Ну, а вдруг ти вже задонатив, то завжди можеш закинути кілька грибнів на підтримку проекту

А тут от мої соціальні мережі, чуєш, підпишись!


Відкрийте більше з gallery21

Підпишіться, щоб отримувати найсвіжіші записи на вашу електронну пошту.

Залишити відповідь

Відкрийте більше з gallery21

Підпишіться зараз, щоб продовжити читання та отримати доступ до повного архіву.

Продовжити читання