Рубрика «Internet Archive»

Персональный интернет-архив без боли - 1

Каждый веб-разработчик, да и многие пользователи рано или поздно сталкиваются с Internet Archive и необходимостью сохранить или восстановить вид важного им сайта в определённое время. С каждым годом всё очевиднее, что поговорка «интернет помнит всё» ошибочна — форумы закрываются, старые сайты тихо исчезают, информация пропадает без следа (вот хорошая статья по теме). При этом пока не существует общепринятого способа на лету сохранять важный контент без лишних телодвижений (представьте, что будет с серверами archive.org, если, скажем, в следующем обновлении Chrome будет при загрузке страницы отправлять адрес на архивацию). Спасение утопающих — дело рук самих утопающих, поэтому в этой статье мы разберём инструмент, позволяющий не просто сохранять нужные сайты, но и встраивать этот процесс в повседневную работу.Читать полностью »

На каких серверах держится Архив Интернета? - 1
Фото 1. Один из дата-центров Internet Archive в Сан-Франциско

Internet Archive — некоммерческая организация, которая с 1996 года сохраняет копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Каждый может зайти в Wayback Machine и посмотреть, как выглядел Хабр в 2006 году или «Яндекс» в 1998 году, хотя загрузка архивных копий занимает около минуты (это не для реализма 90-х, а по техническим причинам, см. ниже).

Архив быстро растёт. Сейчас объём всех накопителей достиг 200 петабайт. Но Internet Archive принципиально не обращается к стороннему хостингу или облачному сервису вроде AWS. У некоммерческой организации собственные дата-центры, свои серверы и свои инженеры. Это гораздо дешевле, чем услуги AWS.
Читать полностью »

АЗАПИ хочет навечно заблокировать Internet Archive - 1

Ассоциация по защите авторских прав в интернете (АЗАПИ) подала серию исков в Мосгорсуд против американской организации «Архив интернета» (Internet Archive), оператора сервиса Wayback Machine. На последнем заседании 16 августа 2019 года они потребовали навсегда заблокировать сайт archive.org на территории России, пишет «Роскомсвобода».

Претензии правообладателей связаны с тем, что в «Архиве интернета» обнаружены копии аудиокниг по серии постапокалиптических романов Д. Глуховского «Метро 2033» и по детективу Дарьи Донцовой «Третий глаз алмаз». В данном процессе АЗАПИ действует в интересах издателя аудиокниг ООО «Аудиокнига».

К сожалению, процесс складывается таким образом, что Мосгорсуд может удовлетворить требования истца.
Читать полностью »

Еще в 2014 году Microsoft передала код MS-DOS 1.25 и 2.0 Музею компьютерной истории, а в начале октября этого года этот код был загружен на GitHub. Но не только Microsoft занимается сохранением исторического программного наследия. Есть несколько глобальных проектов, цель которых — сохранить старый софт. О них мы и расскажем в сегодняшнем материале.

«Спасти» старый софт — три проекта, которые делают это - 1Читать полностью »

Справочная: “Архив Интернета” — история создания, миссия и дочерние проекты - 1

Вероятно, на Хабре не так много пользователей, кто никогда не слышал об «Архиве Интернета» (Internet Archive), сервисе, который занимается поиском и сохранением важных для всего человечества цифровых данных, будь то интернет-странички, книги, видео или информация иного типа.

Кто управляет Интернет-архивом, когда он появился и какова его миссия? Об этом читайте в сегодняшней «Справочной».
Читать полностью »

«Некоторые называют нас «Плюшкиными» — мне нравится говорить, что мы архивисты.»

Директор Wayback Machine Марк Грэм изложил масштаб всеми любимого архива

image

Просматриваем Wayback Machine на конференции Online News Association 2018

Остин, Техас. Как бы сильно абонентские услуги не хотели вас в этом убедить, но не все можно найти на Amazon или Netflix. Хотите, например, прочитать книгу судьи Бретта Кавано (или даже их скандально известный ежегодник)? Любопытно посмотреть кучу винтажных рекламных постеров с курением? Как насчет просмотра самой большой коллекции тибетской буддийской литературы в мире? На сегодняшний день есть одно место, где вы можете все это сделать, и это не Google или какие-то пиратские сайты, которые вы наверняка (часто) посещаете.

«У меня есть правительственное видео о том, как мыть руки или готовиться к ядерной войне, — говорит Марк Грэм, директор Wayback Machine в Internet Archive. «Мы могли бы легко составить список .ppt-файлов на всех сайтах с доменом .mil, Military Industrial PowerPoint Complex».

Грэм недавно поговорил с несколькими небольшими группами участников конференции Online News Association 2018 и Ars Technica повезло быть там. Позже он сделал полную презентацию конференции, которая теперь доступна в аудиоформате. И основная мысль заключается в том, что масштаб Internet Archive сегодня может быть так же трудно понять, как масштаб самого интернета.
Читать полностью »

Internet Archive запустил проект по сохранению старых игр на портативных приставках - 1

У детей бывшего СССР огромной популярностью пользовалась портативная «консоль», где волк ловил яйца в корзину, не давая им разбиться. Не менее популярными были игровые устройства схожей конструкции у детей и взрослых из других стран. К сожалению, сейчас многие из них являются музейной редкостью, так что поностальгировать, играя, не получится.

Но проблему снимает Internet Archive. Команда этой организации, кроме старых игр под MS-DOS и консольные игры для Atari и ColecoVision решила добавить виртуальные копии приставок с ЖК-экраном. Например, это Mortal Kombat от Tiger Electronics, Burger Time от Bandaib и некоторые другие. Всего в базу планируется добавить около 200 таких приставок. Некоторые из них (на момент написания статьи — 74) есть уже сейчас, так что можно не ждать, а начать игру.
Читать полностью »

Internet Archive добился права сканировать книги, изданные с 1923 по 1941 - 1

Идея создания цифровой библиотеки, где вместо бумажных книг находились бы их цифровые копии имеет много положительных сторон. Электронные копии книг нельзя порвать, на них нельзя рисовать, копию редкой и дорогой книги невозможно украсть с цель продажи коллекционеру за большие деньги, к электронной копии в интернете могут получить доступ миллионы читателей. Но вот проблема — всеобщей цифровизации библиотек мешают правообладатели.

Так, например, в Европе книга становится доступной обществу (бесплатно) лишь в том случае, если автор этой книги умер, а с момента его смерти прошло 50 лет. Это достаточно неудобно, но в США и такой возможности нет. Здесь даже много лет не публикующиеся книги никто не имеет права опубликовать еще раз (в любом виде), если не решены вопросы правообладания с автором, его наследниками или издательством. Для Google это правило оказалось практически непреодолимым, корпорация при всем ее могуществе почти ничего не может поделать. Но то Google, а вот Internet Archive смог.
Читать полностью »

Internet Archive выпустил архив софта для первых Macintosh - 1

Организация Internet Archive занимается сохранением информации, которая может не иметь значения сейчас, но в будущем станет очень ценной. Сохраненные когда-то данные Internet Archive публикует с завидной регулярностью. И это касается не только текста или картинок архивированных сайтов, но и программного обеспечения, включая игры. Ранее на сайте организации выкладывались игры для старых игровых консолей, равно, как и ПК, а сейчас опубликован пакет ПО для первых моделей Macintosh.

Коллекция программного обеспечения включает софт, выпущенный с 1984 по 1989 годы. Сотрудники Internet Archive опубликовали пакет софта не просто так (запустить программы в этом случае смогли бы очень немногие пользователи, поскольку первые компьютеры Macintosh ушли в прошлое, и давно), а сделали эмулятор для браузера. Так что посмотреть и узнать (или вспомнить) как все работает, можно не отрываясь от дисплея современного десктопа или ПК.
Читать полностью »

Роскомнадзор удалил ресурс из реестра запрещенных сайтов

Internet Archive разблокирован в России - 1

Роскомнадзор удалил из списка запрещенных сайтов ресурс Internet Archive. Сейчас на сайт можно свободно зайти с российским IP, хотя есть и исключения: пока что не у всех российских пользователей есть доступ к «Архиву». Скорее всего, эти исключения связаны с обновлением протоколов DNS, и уже через сутки все интернет-пользователи из РФ смогут работать с указанным сайтом.

В реестре Internet Archive пробыл почти год. Роскомнадзор заблокировал ресурс в июне 2015 года, когда запись о блокировке домена и IP-адреса web.archive.org (207.241.224.26) была внесена в Реестр запрещённых сайтов.
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js