Рубрика «Архив Интернета»

Что находится внутри физического Архива Интернета - 1

Когда я был в Сан-Франциско на AI Engineer Summit, то воспользовался возможностью посетить Архив Интернета — физический архив в калифорнийском городе Ричмонде примерно в двадцати минутах езды от Сан-Франциско.

Я купил билет на «экскурсию по закулисью физического архива» 11 октября и прибыл прямо перед началом; я был рад, что не приехал раньше, потому что физический архив находится (вполне логично) на складе в промышленной части Ричмонда. Похоже, больше ничего интересного в окрестностях нет.

Я попросил водителя Uber подбросить меня до парковки со знаком Internet Archive. Но оглядевшись, я не смог найти публичного входа на склад. Рядом стояло ещё несколько озадаченных фанатов истории Интернета, мы неуклюже поздоровались и начали обсуждать, там ли находимся. Вскоре нас заметила пара людей в конце улицы и помахала нам.
Читать полностью »

На каких серверах держится Архив Интернета? - 1
Фото 1. Один из дата-центров Internet Archive в Сан-Франциско

Internet Archive — некоммерческая организация, которая с 1996 года сохраняет копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Каждый может зайти в Wayback Machine и посмотреть, как выглядел Хабр в 2006 году или «Яндекс» в 1998 году, хотя загрузка архивных копий занимает около минуты (это не для реализма 90-х, а по техническим причинам, см. ниже).

Архив быстро растёт. Сейчас объём всех накопителей достиг 200 петабайт. Но Internet Archive принципиально не обращается к стороннему хостингу или облачному сервису вроде AWS. У некоммерческой организации собственные дата-центры, свои серверы и свои инженеры. Это гораздо дешевле, чем услуги AWS.
Читать полностью »

Понадобилось найти старую версию одного сайта. В Wayback Machine (https://archive.org/web/) версии от нужной даты не оказалось, и я решил поискать альтернативные архивы интернетов. В основном находились сервисы, реализующие идею «вы нам дайте URL, а мы его заархивируем» (типа уважаемого мной http://archive.md), то есть совсем не то, что было нужно в данный момент.

И тут вдруг находится искомое — http://web-arhive.ru/ Сначала порадовался за соотечественников, сделавших полезный сервис, но через несколько минут меня начали терзать смутные сомнения…
Читать полностью »

Есть виды софта, без которого одни люди жить не могут, а другие даже не представляют, что такое существует и кому-то вообще нужно. Для меня долгие годы такой программой был Macropool WebResearch, позволявший сохранять, читать и организовывать интернет-страницы в некое подобие оффлайновой библиотеки. Уверен, многие из читателей прекрасно обходятся коллекцией ссылок или комбинацией браузера и папки с набором сохранённых документов. Мне же хотелось бы иметь возможность хотя бы отмечать документы как "прочитанные" или "избранные", быстро переходить от одного текста к другому и не зависеть от доступности интернета или конкретного сайта. Бывает, что читать есть время ровно тогда, когда интернета нет (в дороге, например), да и ссылки, к сожалению, нередко оказываются недолговечными.Читать полностью »

АЗАПИ хочет навечно заблокировать Internet Archive - 1

Ассоциация по защите авторских прав в интернете (АЗАПИ) подала серию исков в Мосгорсуд против американской организации «Архив интернета» (Internet Archive), оператора сервиса Wayback Machine. На последнем заседании 16 августа 2019 года они потребовали навсегда заблокировать сайт archive.org на территории России, пишет «Роскомсвобода».

Претензии правообладателей связаны с тем, что в «Архиве интернета» обнаружены копии аудиокниг по серии постапокалиптических романов Д. Глуховского «Метро 2033» и по детективу Дарьи Донцовой «Третий глаз алмаз». В данном процессе АЗАПИ действует в интересах издателя аудиокниг ООО «Аудиокнига».

К сожалению, процесс складывается таким образом, что Мосгорсуд может удовлетворить требования истца.
Читать полностью »

Справочная: “Архив Интернета” — история создания, миссия и дочерние проекты - 1

Вероятно, на Хабре не так много пользователей, кто никогда не слышал об «Архиве Интернета» (Internet Archive), сервисе, который занимается поиском и сохранением важных для всего человечества цифровых данных, будь то интернет-странички, книги, видео или информация иного типа.

Кто управляет Интернет-архивом, когда он появился и какова его миссия? Об этом читайте в сегодняшней «Справочной».
Читать полностью »

«Архив Интернета» оцифровал 25 000 шеллачных пластинок - 1

Вот уже почти год «Архив Интернета» занимается оцифровкой жёстких грампластинок на 78 оборотов в рамках проекта Great 78 Project. Патефонные шеллачные пластинки — это самый старый формат, который использовался до LP (микроканавки). Пластинки на 78 rpm покрыты шеллаком — природной смолой, экскретируемой самками некоторых насекомых-червецов. Это хрупкий материал. Поэтому они более всего нуждаются в сохранении, эти записи мы можем потерять навсегда.

К настоящему времени архив оцифрованных записей проекта Great 78 вырос до 25 989 пластинок. Они датируются 1902-2013 годами, а больше всего записей приходится на период расцвета шеллачных пластинок, то есть на 1939-1954 годы.
Читать полностью »

Новой жертвой блокировки в России, возможно, стал сервис Архив Интернета (Internet Archive) и расположенная на его серверах The Wayback Machine — архив копий веб-страниц.

Запись о блокировке домена и IP-адреса web.archive.org (207.241.224.26) внесена в Реестр запрещённых сайтов.

Агентство РБК сообщает, что Роскомнадзор ограничил доступ к странице archive.org/details/odinochniy, согласно решению Генпрокуратуры РФ от 16 июня на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации». Генпрокуратура посчитала, что в публикации содержатся «призывы в массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка».
Читать полностью »

Сейчас уже восстановлен доступ к некоторым из них

Ряд СМИ сообщает, что более 290 млн интернет-пользователей Индии потеряли доступ к 32 сайтам. Среди них есть важные и популярные проекты: GitHub, Pastebin, видеохостинг Vimeo, всемирно известный «Архив Интернета». Причина блокировок — использование этих сервисов пропагандой Исламского государства.

Пользователь «Твиттера» Пранеш Пракаш приводит список заблокированных ресурсов.

В Индии заблокировали более 30 сайтов - 1
Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js