Крихкість інтернетної пам’яті: чи надійно мережа зберігає наші знання

Суспільство
23 Травня 2024, 15:09

Нещодавно сайт Тижня пережив чергову серйозну хакерську атаку: нічого надзвичайного, вистояли майже без утрат. Утім, це вкотре не дає забути, наскільки наївним є сподівання знайти вже колись засвоєну інформацію на сайтах, де вона була розміщена кілька років тому. Навіть якщо сайт закриється, текст могли до цього поширити або ж він міг зберегтися на сервері. Однак ідеться про інше: чи буде змога так само швидко знайти певну потрібну інформацію в текстовому, відео- або аудіоформаті, якщо її не виявиться на звичному місці? Тобто, якщо конкретне посилання не працює, чи зможу я десь знайти саме те, що було на цій нині не доступній сторінці? Навряд чи. І якщо посиланню вже понад десять років, то шанси взагалі мізерні.

Нещодавно дослідницький центр Pew, проаналізувавши вебсторінки, створені 2013 року, виявив, що 38 % недоступні й не відкриваються. У середньому чверть вебсторінок, які з’явилися в інтернеті впродовж 2013–2023 років, уже не працюють (видалені чи перенесені на сайти, які не функціонують). Дослідники наводять таку кількість недоступних посилань за останні десять років:

  • 2013 — 38 %
  • 2014 — 35 %
  • 2015 — 31 %
  • 2016 — 30 %
  • 2017 — 26 %
  • 2018 — 31 %
  • 2019 — 32 %
  • 2020 — 27 %
  • 2021 — 22 %
  • 2022 — 15 %
  • 2023 — 8 %

Звісно, оптимісти скажуть, що не так багато з тих відсотків утраченого контенту справді були унікальні й цінні, але щодо цього в центрі Pew є серйозні заперечення.

Цей «цифровий розпад» відбувається в багатьох різних онлайн-просторах, але якщо звернутися до насправді «унікальних і цінних» сайтів та перевірити посилання на урядових, новинних ресурсах, а також у розділі «Посилання» на сторінках вікіпедії на весну 2023 року, то виявиться:

  • 23 % вебсторінок новин містять принаймні одне посилання, що не працює, як і 21 % вебсторінок урядових сайтів. Новинні сайти з високим і з низьким рівнями трафіку приблизно з однаковим рівнем імовірності містять посилання, які не відкриваються. І, зрозуміло, значно більше їх на вебсторінках органів місцевого самоврядування.
  • 54 % сторінок вікіпедії містять принаймні одне посилання в розділі «Посилання», яке вказує на сторінку, якої більше не існує.

Ситуація ж із соціальними мережами ще гірша. Зокрема, фахівці дослідницького центру Pew зібрали вибірку твітів у режимі реального часу впродовж весни 2023 року на платформі соціальної мережі X (колишній твіттер) і стежили за ними впродовж трьох місяців. З’ясувалося, що майже кожен п’ятий твіт більше не видно на сайті лише через кілька місяців після публікації. У 60 % цих випадків обліковий запис, який спочатку опублікував твіт, став приватним, призупинив свою роботу або був повністю видалений. В інших 40 % власник облікового запису видалив окремий твіт, але сам обліковий запис досі існував. Певні типи твітів зникають частіше, ніж інші. Понад 40 % твітів, написаних турецькою чи арабською мовами, більше не видно на сайті впродовж трьох місяців після публікації. Особливо ймовірно, що твіти з облікових записів з налаштуваннями профілю за замовчуванням не можна буде переглянути.

Якщо відсотки загубленого й недоступного видаються вам незначними, то варто нагадати, що натепер зафіксовано понад 1,09 мільярда сайтів, але лише 18 % активні (цікаво, що перший сайт, створений 6 серпня 1961 року, досі працює). Тоді як назвати кількість вебсторінок надзвичайно важко: називають кількість від 4,38 мільярда до 50 мільярдів залежно від того, як рахувати. І в цьому ракурсі втрата чверті чи третини це вже дуже велика частина всього, що накопичено людством. Крім того, через цю недоступність певних інтернетних першоджерел ми живемо в геть непевному інформаційному просторі, де фейк часом непросто відрізнити від правди, а ще складніше — від постправди. Із цими втраченими вебсторінками ми також частково позбуваємося здатності до перевірки інформації.

У якомусь сенсі інтернет — музей, адже це зібрання всього, що вдалося зберегти. З тією суттєвою відмінністю, що в музеї ми вже маємо справу з відібраним і безперечно важливим, тоді як у мережі часто розібратися в цінності наявного дуже непросто, зважаючи ще й на те, що старі сайти зникають, а колись надійні посилання не працюють. Ще й чомусь видається, що в інтернеті надійніше збережеться щось малосуттєве (кумедний мем чи безглузда цікавинка, які поширять більшість), аніж дійсно те, що має позачасову цінність і вимагатиме експертної оцінки, щоб визначити його важливість. Парадоксально, звісно, що ми можемо погортати книжку, якій уже кілька століть, але не можемо потрапити на певну вебсторінку, якій лише кілька років. Утім, ця крихкість інтернету врівноважується тим, що в повсякденні в нас рідко виникає потреба відвідати якісь старі сайти чи перейти за давніми посиланнями, ще й ми звикли вірити в те, що Вікіпедія чи подібні солідні джерела безперечно нікуди не зникнуть. І хоча ця віра, як подумати, не витримує жодної критики, проте про всяк випадок публічні бібліотеки існують і далі. Це дещо заспокоює: книжка лишиться функціональною і без електрики, хоч книжка — теж доволі крихкий носій.

І добровільно ніхто від зручного інтернету точно не відмовиться, та й незрозуміло, нащо це робити, проте про бекапи й зовнішні жорсткі диски з флешками теж не варто забувати. А найпотрібніше можна й у паперовому блокноті записати кульковою ручкою. І не тому, що це надійніше й стовідсотково не дасть зникнути найпотрібнішому, а просто тому, що важливе не гріх і «закарбувати» на різних носіях — як антикварних, так і ультрамодерних.

читати ще

показати ще