Рубрика «wikipedia»

Аннотация. В данной статье рассматриваются методы создания социальных сетей, которые будут одновременно свободны от цензуры и спама согласно своей архитектуре. Предложенная архитектура универсальна: по выбору пользователя система может выглядеть для пользователя как соцсеть, блог, новостная лента, Википедия, или большой аннотированный каталог пригодный для поиска во всём интернете. В последующих текстах разбираются социологические метрики общения в различных коммуникационных системах и влияние коммуникационных систем на мышление человека.

 Соцсеть, и не только соцсеть, сочетание нескольких разных объектов:

Читать полностью »

imageФото: Frank Schulenburg

Основатель Wikipedia Джимми Уэйлс рассказал о проекте, который он запустил в октябре. Сервис WT: Social станет гибридом социальной сети и новостной ленты. Участники сообщества смогут делиться новостями и обсуждать их по типу новостной ленты Facebook.

Предполагается, что проект, как и «Википедия», будет существовать на пожертвования пользователей. Уэйлс уверен, что этот механизм избавит участников сообщества от погони за кликбейтом. Читать полностью »

image

Речь пойдёт об эссе американского инженера Вэнивара Буша «As We May Think», вышедшем в журнале The Atlantic в 1945 году. В нём Буш предсказал наступление информационной эпохи и появление некоторых её проявлений, например, персональных компьютеров, интернета. В статье описывается гипертекст реализованный «в железе».

Эта работа вдохновила и была ориентиром для первопроходцев информационных технологий Джозефа Ликлайдера (компьютерная сеть, разделение времени), Дугласа Энгельбарта (мышка, NLS, GUI, пруф), Теда Нельсона (гипертекст, Xanadu) и пр.

imageВ 1940 году Вэнивар Буш был назначен председателем Национального исследовательского комитета по вопросам обороны США, а с 1941 по 1947 год возглавлял организацию преемника комитета — Бюро научных исследований и развития, занимавшееся координацией усилий научного сообщества (6000 ведущих учёных страны) в целях военной обороны, разработкой ядерного оружия и Манхэттенским проектом.

Биография на Википедии.

  • Советник по науке при президенте Рузвельте.
  • Инициировал разработку дифференциального анализатора, аналогового компьютера, который мог решать дифференциальные уравнения с 18 независимыми переменными.
  • Научный руководитель Клода Шеннона (основатель теории информации) и Фредерика Термана («отец» кремниевой долины).

Читать полностью »

Всем привет.

Представляю вам коллективный (хабра-) перевод основного документа (282 000 знаков), дела всей жизни Дугласа Энгельбарта. (Подробнее: 50 лет спустя. The Mother of All Demos)

image

Я считаю, что:

  1. Первоисточники крайне важны, иначе появляются «трактователи», которые интерпретируют ради своей выгоды (если не тупости).
  2. Проект надо делать открыто, публично и коллективно, а не в втихомолку пилить продукт пару лет, чтоб «завоевывать рынки». И тем более что все «заморочки» закрытой организации наследуются в продукт.
  3. Проект должен быть бесплатным и даже радикальнее — приносить убытки множеству игроков отрасли (гудбай венчурные инвесторы).
  4. Проект должен создаваться вне капиталистической логики, копирайта, текущего права и морали.

Слово Дугласу Энгельбарту:

Augmenting Human Intellect: A Conceptual Framework

By Douglas C. Engelbart
October 1962

I. Введение

II. CONCEPTUAL FRAMEWORK

А. Общие сведения

Концептуальная структура, к которой мы стремимся, должна ориентировать нас на реальные возможности и проблемы, связанные с использованием современных технологий, чтобы оказывать непосредственную помощь человеку в понимании сложных ситуаций, выделении значимых факторов и решении проблем. Чтобы получить эту ориентацию, мы исследуем, как люди достигают своего нынешнего уровня эффективности, и ожидаем, что этот экзамен откроет возможности для улучшения.

Все воздействие человека на мир в основном связано с тем, что он может передавать миру через свои ограниченные моторные каналы. Это, в свою очередь, основано на информации, получаемой из внешнего мира по ограниченным сенсорным каналам; об информации, побуждениях и потребностях, возникающих в нем; и на его обработку.
Читать полностью »

С 18-м днём рождения, Википедия; празднуем совершеннолетие хорошего проекта - 1

Во вторник Википедии исполнилось 18 лет. Если бы этот массивный энциклопедический проект, работающий по принципу клаудсорсинга, был человеком, то в большинстве стран его считали бы юридически взрослым. Но на самом деле бесплатная онлайн-энциклопедия уже давно играет роль добросовестного интернетовского взрослого.

С начала своей работы Википедия неимоверно выросла. Она может похвастаться 5,7 млн статей на английском языке и 92 млрд просмотрами страниц за прошлый год.
Читать полностью »

Всем привет.

Представляю вам коллективный (хабра-) перевод основного документа (282 000 знаков), дела всей жизни Дугласа Энгельбарта. (Подробнее: 50 лет спустя. The Mother of All Demos)

image

Я считаю, что:

  1. Первоисточники крайне важны, иначе появляются «трактователи», которые интерпретируют ради своей выгоды (если не тупости).
  2. Проект надо делать открыто, публично и коллективно, а не в втихомолку пилить продукт пару лет, чтоб «завоевывать рынки». И тем более что все «заморочки» закрытой организации наследуются в продукт.
  3. Проект должен быть бесплатным и даже радикальнее — приносить убытки множеству игроков отрасли (гудбай венчурные инвесторы).
  4. Проект должен создаваться вне капиталистической логики, копирайта, текущего права и морали.

Слово Дугласу Энгельбарту:

Augmenting Human Intellect: A Conceptual Framework

By Douglas C. Engelbart
October 1962

1. Введение

А. Общие положения

Под «усилением человеческого интеллекта» мы подразумеваем/понимаем увеличение способности человека браться за сложные (complex) проблемные ситуации, достигать понимания с учетом своих потребностей, и находить решения. В данном контексте под увеличением (расширением) способности (возможностей) подразумевается совокупность следующих пунктов: ускоренное и улучшенное осмысление, возможность достигать полезного уровня понимания в ситуации, которая ранее была слишком сложна, принятие лучших решений с большей скоростью, а также возможность поиска решений для задач, которые раньше казались неразрешимыми. А под «сложными ситуациями» мы понимаем рабочие задачи дипломатов, руководителей, социологов, биологов, физиков, юристов и дизайнеров, т.е. существует ли данная ситуация на протяжении 20 минут или 20 лет. Мы не рассматриваем отдельные хитроумные трюки, которые помогают в определенных ситуациях.
Читать полностью »

image
Люди часто сравнивают работу Энгельбарта с современными технологиями, но это неправильно. Забудьте про сегодня, просто подумайте о том, что он делал, с точки зрения его целей.

Дуглас Энгельбарт умер сегодня (July 3, 2013). Его труды всегда было очень сложно интерпретировать и объяснять.

Многие эксперты, к сожалению, часто упускают суть его работы, потому что они рассматривают всё как техническую задачу. Энгельбарт посвятил свою жизнь проблемам человечества, технологии были лишь частью их решения. Когда я читаю интервью экспертов с Энгельбартом, я представляю, как они брали бы интервью у Джорджа Оруэлла, задавая глубокие вопросы про его пишущую машинку.
Читать полностью »

image

Сложность и срочность вопросов, стоящих перед лицом человечества, растут гораздо быстрее, чем наши способности совместного их понимания и решения. Это очень опасная проблема, но есть стратегические действия, которые мы можем предпринять, коллективно.

Введем «коллективный IQ» как показатель способности сообщества решать сложные вопросы: точно их понимать, выявлять наилучшие варианты решений, оценивать ресурсы и оперативные возможности, выбирать подходящее решение, эффективно организовывать и контролировать его исполнение, быстро и точно справляться с непредвиденными затруднениями.

Я утверждаю, что стратегия «содействия эволюции» коллективного IQ наших сообществ и есть наилучшая стратегия.

Гипертекст будет иметь принципиальное значение, а SIGWeb должна быть лидером.

«Коллективный IQ» – это сборка коллективных способностей из основных способностей человека, таких как ощущение, восприятие, познание, движение и т.д.
Читать полностью »

«Компьютерная революция еще не случилась.
(The computer revolution hasnt happened yet)»
— Алан Кей

image

Всем привет.
Сегодня 50 лет с исторического события, известного как "Мать всех демонстраций" (The Mother of All Demos). И я стартую проект «Энгельбарт» (чтобы это ни было и что бы это ни значило).

Я услышал про Энгельбарта от Данилы Медведева (очень радикальный футуролог, с большинством его идей я не согласен, но есть здравые жемчужины) в 2015 году. С тех пор я заразился. Мир стал иным, я увидел возможную точку приложения усилий. Именно благодаря этой лекции и появился перевод Ванневара Буша (As We May Think), и Энгельбарта, и копания истории ИТ, и исследование Palantir (серия статей на Хабре — палантириада) и хабраинтервью с Аланом Кеем, перевод книги «The Dream Machine». Идея стала определяющей в моей жизни.

Задача очень актуальна и волнует многих: Пост m1rko "Моё разочарование в софте" (+443, 263 000 прочтений, 2400 комментов). Это только в России. И с железом тоже все не оптимально: «Время отклика компьютеров: 1977−2017»

Невозможная задача для проекта «Энгельбарт» — «перезагрузить матрицу», «пересобрать» всю область информационных технологий, интернета и компьютерного железа, учитывая все ошибки первой (нынешней версии).

Ближайшие действия — переводы и сбор в одном месте ключевых концептуальных документов и поиск единомышленников (проснись, Нео! То что ты ищешь, тоже ищет тебя.) Под прицелом — Ванневар Буш, Джозеф Ликлайдер, Пол Отлет, Алан Кей, Дуглас Энгельбарт, Глушков, Лебедев, Ершов, WikiPedia, Web Archive, Knol, Quora, Cybersyn, Xanadu, DARPA, IARPA.
Читать полностью »

Суть

Оказывается для этого достаточно запуcтить всего лишь такой набор команд:

git clone https://github.com/attardi/wikiextractor.git
cd wikiextractor
wget http://dumps.wikimedia.org/ruwiki/latest/ruwiki-latest-pages-articles.xml.bz2
python3 WikiExtractor.py -o ../data/wiki/ --no-templates --processes 8 ../data/ruwiki-latest-pages-articles.xml.bz2

и потом немного отполировать скриптом для пост-процессинга

python3 process_wikipedia.py

Результат — готовый .csv файл с вашим корпусом.

Читать полностью »


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js