КолонкаПолитика

День беспамятства

Роскомнадзор заблокировал крупнейший архив интернета

Этот материал вышел в номере № 97 от 7 сентября 2015
Читать
Роскомнадзор заблокировал крупнейший архив интернета

На фоне многочисленных несуразностей, производимых российской властью в целом и ее отдельными представителями, весть о блокировке архива интернета, появившаяся накануне 1 сентября, могла пройти и незамеченной.

Это и понятно — сайт archive.org, конечно, не такой популярный, как сайт Википедии, и знает о нем значительно меньше пользователей. Хотя при примерно 45 млн посетителей в месяц сайт занимает 239-е место в рейтинге самых популярных сайтов Alexa, где-то между skype.com и wikimedia.org. Запросы из России занимают почетное третье место общего трафика сайта archive.org (5,7%, после запросов из США и Индии). То есть примерно 2,5 млн россиян каждый месяц пользуются archive.org. Зачем, вы спросите?

Internet Archive — американская некоммерческая организация, поддерживающая, наверное, самый крупный в мире цифровой архив. Архив состоит из двух частей: открытого архива веба (знаменитая Wayback Machine, которая хранит и показывает веб-страницы в том виде, в каком они были 5–10–15 лет назад) и библиотеки цифровых копий книг, фильмов, музыки, новостных телепрограмм, радиопередач, программ и т.д., находящихся в общественном достоянии.

Собственно, с архива копий веб-страниц архив интернета когда-то и начался. Брюстер Кале, специалист по компьютерным наукам и довольно удачливый интернет-предприниматель, создал сайт Wayback Machine в 1996 году, когда понял, что веб нуждается в точно таком же сохранении, как и, например, журналы и газеты, которые хранят в библиотеках. Сайты исчезают, домены меняют владельцев. Особенно недолговечна жизнь новостных страниц. Если верить специалистам из Университета в Норфолке, за год исчезает 11% всех новостных материалов в интернете, около 20% архивируется и тоже исчезает из открытого доступа. Через 30 месяцев умирает около 30% новостных страниц и 40% архивируется. Можно ли как-то сохранить и сделать доступным то, что было опубликовано, но исчезло? Ведь время от времени так хочется посмотреть, как выглядел тот или иной сайт в разное время?

Этим и занялся архив интернета. Какие-то сайты архив записывает чаще, какие-то реже. Сейчас на archive.org можно найти 434 млрд сохраненных веб-страниц с более чем 200 млн сайтов. Под влиянием и при непосредственном участии американского архива интернета аналогичные крупные сервисы и библиотеки, как правило, при государственной или академической поддержке, организуются по всему миру, а технология архивирования, разработанная в Сан-Франциско, где базируется архив интернета, Archive-It используется тысячами организаций и сотнями тысяч сайтов по всему миру, в том числе Международным консорциумом по сохранению интернета.

Постепенно к веб-страницам архив начал добавлять другие виды материалов. Сегодня коллекция оцифрованных старых фильмов, которые хранит и дает возможность посмотреть архив, — одна из самых больших в мире. Фильмы архив хранит не как YouTube, а с толком — классифицируя, комментируя, снабжая метаданными, создавая полезные подборки. Хотите посмотреть хроникальные и пропагандистские фильмы времен холодной войны? Пожалуйста! Тем более что по американскому закону произведения, созданные за счет налогоплательщиков, автоматически становятся общественным достоянием. Собираетесь разобраться в том, как события 11 сентября 2001 года отражали разные мировые медиа? Вот вам синхронизированные по времени теленовости той страшной недели.

Собирает архив интернета и программы. Они тоже нуждаются в сохранении, причем в программном окружении, которое позволяет их воспроизвести. В архиве работают живые люди, поэтому среди сотни тысяч программ на archive.org можно не только найти отличную подборку игр под MS-DOS, но и сыграть в «Принца Персии», «Дюну 2», «Замок Вольфенштайн» и еще в несколько тысяч компьютерных игр.

Архив интернета — проект уникальный: 20 тысяч терабайт цифрового контента, самые передовые технологии хранения и представления цифровой информации; золотое дно для ученых — исследователей интернета и журналистов, работающих в сфере расследований. И, конечно, полезное место для культурного отдыха. И все это бесплатно для пользователей. И никакой рекламы.

Пока я пишу этот текст, archive.org в России недоступен, если только не пользоваться какими-нибудь инструментами по обходу блокировок. Потому что Генпрокуратуре не понравилось какое-то исламистское видео в запасниках архива, а Роскомнадзор внес в реестр для блокировки IP-адрес всего архива. К тому же с 1 января 2016 года появится более подходящий повод для блокировки, когда вступит в силу очередной дурацкий российский закон — на этот раз о «праве на забвение». Вот тогда архива интернета нам и не видать. Ведь он про «помнить все», а не «забыть любой ценой», как это сейчас принято в России.

Владимир ХАРИТОНОВ, исполнительный директор Ассоциации интернет-издателей

shareprint
Добавьте в Конструктор подписки, приготовленные Редакцией, или свои любимые источники: сайты, телеграм- и youtube-каналы. Залогиньтесь, чтобы не терять свои подписки на разных устройствах
arrow