Главное

Сохранится всё: как возник Internet Archive и какова его дальнейшая судьба

МС
Мария Строителева
Сохранится всё: как возник Internet Archive и какова его дальнейшая судьба

Internet Archive или Архив интернета занимается поиском и хранением накопленной информации: будь то книги, видео или программное обеспечение. В 2024 году сервис подвергся хакерской атаке, что привело к утечке данных 31 млн пользователей. Также на организацию неоднократно подавали в суд из-за нарушений в сфере интеллектуальной собственности. Рассказываем в нашей статье историю взлетов и падений Архива.

Как возник сервис

 «Архив Интернета» создала одноименная американская некоммерческая организация с главным офисом в Сан-Франциско. Ее возглавляет программист Брюстер Кейл. Официально сервис был запущен в 2001 году, но данные хранятся с 1996 года. Миссия проекта — всеобщий доступ к информации. Архив призван бороться с монополией на предоставление данных как со стороны корпораций, так и государств. Когда он заходит на какой-то сайт, то делает его «снимок» и «кладет» в хранилище.  

К крупнейшим проектам Архива относят запущенный в 2001 году сервис Wayback Machine. Его пользователи могут отследить происходящие на сайтах изменения и сравнивать разные версии правок. Еще один проект — Open Library. Это открытая онлайн-библиотека, через которую пользователи могут брать на 2 недели оцифрованные версии книг. Есть у компании и Archive IT — служба веб-архивирования, помогающая собирать, создавать и сохранять коллекции цифрового контента. 

Суды и споры 

Из-за того, что сервис делает общедоступным контент, на котором другие зарабатывают миллиарды, иногда на него подают в суд. Например, Архив проиграл апелляцию, которую ресурс подавал в рамках иска от издателей. Те требовали удалить около 500 тысяч электронных книг. Суд постановил, что цифровая библиотека Архива интернета «позволяет осуществлять широкомасштабное копирование, которое лишает создателей компенсации и снижает стимул к созданию новых произведений».

Это не первый проигрыш организации. В 2020 году четыре крупных издателя (Hachette, Penguin Random House, Wiley и HarperCollins) подали в суд на Архив, заявив, что его цифровая библиотека поощряет «умышленное цифровое пиратство в промышленных масштабах». Суд встал на их сторону. В целом же организация удаляет данные из Wayback Machine по просьбам правообладателей.

Архив сейчас

Архив существует на пожертвования — как организаций и компаний, так и частных лиц. У него есть три дата-центра в США, а также запасные мощности. Они находятся в Египте и Амстердаме. Коллекция Архива интернета состоит из более чем 35 млн книг, 7,9 млн фильмов, видео и телепередач, 842 тыс. программ, 14 млн аудиофайлов, 4 млн изображений, 2,4 млн клипов, 237 тыс. концертов и более 682 млрд веб-страниц в Wayback Machine.

В 2024 году сервис подвергся хакерской атаке, что привело к утечке данных 31 млн пользователей. «Вам никогда не казалось, что Internet Archive работает на честном слове и постоянно находится на грани катастрофического нарушения безопасности? Именно это только что произошло», — было сказано в сообщении злоумышленников.

По состоянию на 3 января 2024 года Wayback Machine заархивировал более 860 миллиардов веб-страниц и более 99 петабайт данных. И гигантское хранилище продолжает пополняться.

МС
Мария Строителева
77
+1
77
Наши каналы

Хотите быть в курсе всего?
Подпишитесь на нашу рассылку

Спасибо за подписку! Замечательно, что вы с нами.

Лучшие идеи и технологии со всего мира — в вашей почте

Спасибо за подписку! Замечательно, что вы с нами.