Продолжу цикл статей «Как развлечь себя при помощи частотного словаря Википедии и интерпретатора Питона, если ничего другого под рукой нет и в ближайшее время не предвидится».
Я попробую воссоздать тот замечательный вечер, когда мой парсер Википедии отработал, я получил вожделенный словарь, открыл Питон в интерактивном режиме и начал вводить различные запросы с целью получить слова со всякими необычными свойствами. Тот, двухлетней давности, сеанс работы с шеллом, к сожалению, не сохранился, поэтому сделаю всё заново.
Читать полностью »
Рубрика «wikipedia» - 11
Охота на слова
2013-08-06 в 21:26, admin, рубрики: python, wikipedia, ненормальное программирование, Питон, рекорды, слова, словари, метки: python, wikipedia, Питон, рекорды, слова, словариВернулся невод с тиной морскою…
2013-08-01 в 19:33, admin, рубрики: bash.org.ru, python, wikipedia, башорг, ненормальное программирование, словари, эксперименты, метки: bash.org.ru, python, wikipedia, башорг, словари, эксперименты Года полтора назад я решил провести небольшой эксперимент. Цель была посмотреть на концентрированный новояз. Сделал я следующее:
1) Распарсил bash.im (тогда ещё bash.org.ru) и создал частотный словарь встречающихся там слов
2) Распарсил Википедию и создал частотный словарь (точнее не совсем так, словарь Википедии у меня к тому моменту уже был, я его делал раньше для совсем других целей)
3) Рассортировал словарь Баша по встречаемости в порядке убывания, шёл по нему и печатал те слова, которые ни разу не встречались в Википедии.
Читать полностью »
Как я вычислял миллионную статью русской Википедии
2013-05-11 в 12:32, admin, рубрики: mediawiki, wikipedia, Википедия, миллион, счетчик, трансгуманизм, юбилей, метки: mediawiki, Википедия, миллион, счетчик, трансгуманизм, юбилейСегодня, 11 мая 2013 года, в 01:41:39.8 UTC (05:41:39.8 московского времени) в русском разделе Википедии появилась миллионная статья. По случайному совпадению, русский раздел именно сегодня отмечает своё 12-летие. Статью Life Extension Foundation создал участник UG72. Уже разгорелись споры о том, имеет ли статья право на жизнь, но тот факт, что рубеж взяла именно она, установлен однозначно.
Счётчик статей в Википедии показывает количество статей, в которых есть хотя бы одна ссылка (существуют и две другие настройки правил). Таким образом, на его значение может повлиять как создание и удаление статей, так и переименование и даже любая правка. Добавим к этому то, что в преддверии юбилея участники начинают массово заливать свои заготовки в надежде, что одна из них всё-таки окажется юбилейной статьёй, и то, что счётчик, как не очень важная обычно вещь, обновляется асинхронно. В итоге вычислить нужную статью становится очень непросто. Но всем же интересно!
Выкрутиться всё-таки можно.
Миллион статей в русской Википедии!
2013-05-11 в 11:50, admin, рубрики: wikipedia, Википедия, никто не читает теги, метки: Википедия, никто не читает теги 11 мая 2013 года в 01:43 по UTC русский раздел Википедии прошел психологический рубеж в 1 миллион статей! 1 000 000 статьей РВП стала статья о научно-исследовательской организации Life Extension Foundation, специализация которой — исследование и распространение информации о продлении жизни и здоровья. Автором «юбилейной» статьи является участник UG72.
Оригинальная новость на викиновостях.
Википедия не собирается подчиняться давлению «слабых и трусливых политиков»
2013-04-09 в 15:43, admin, рубрики: wikipedia, Википедия, единый реестр, Россия, цензура, метки: Википедия, единый реестр, Россия, цензура
Основатель Википедии Джимми Уэйлс прокомментировал попытки российских властей заблокировать отдельные страницы энциклопедии, заявив, что Википедия не будет подчиняться давлению слабых и трусливых политиков. Он также отметил, что блокировки всегда предпочтительнее, чем уступки цензорам, пишут Викиновости.
Ранее, 5 апреля, фонд «Викимедиа РУ» получил уведомление о внесении статьи «Курение каннабиса» в «Единый реестр запрещённых сайтов». Позже выяснилось, что на протяжении полугода в «Единый реестр» внесли 15 страниц Википедии, однако Роскомнадзор не уведомлял об этом ни фонд «Викимедиа РУ», ни провайдеров.
Читать полностью »
Французская разведка заставила сисопа Википедии удалить статью
2013-04-06 в 19:27, admin, рубрики: wikipedia, Медиа, разведка, Франция, цензура, метки: разведка, Франция, цензура
Штаб-квартира Центрального управления внутренней разведки Франции
Wikimedia France опубликовала заявление с решительным осуждением давления, которое оказывают сотрудники Центрального управления внутренней разведки (DCRI) на добровольца-сисопа Википедии.
Читать полностью »
Начато восстановление удалённых из Википедии статей
2013-01-16 в 13:59, admin, рубрики: Wiki-технология, wikipedia, вики, Википедия, Восстановление данных, статьи, Циклопедия, метки: вики, Википедия, статьи, ЦиклопедияВ сентябре прошлого года я сообщал о намерении сотрудников открытого вики-проекта «Циклопедия» начать восстановление данных, удалённых в русской Википедии. До того момента было произведено скачиывание удалённых статей, картинок, шаблонов и некоторых представляющих интерес страниц на независимые хранилища.
Поскольку Циклопедия — энциклопедический проект, мы сохраняем там не всякий спам или самопиар пользователей контакта, но статьи о реальных людях, событиях, компаниях. Для начала выборка статей была произведена определённому алгоритму.
Например, восстановлены многие статьи о вымышленной вселенной «Вавилон-5». Список всех залитых статей можете прочитать на специальной странице.
Читать полностью »
Wikipedia внедряет продвинутый open-source плеер на своем сайте
2012-11-09 в 15:46, admin, рубрики: mediawiki, open source, webm, Wiki-технология, wikipedia, метки: mediawiki, webm, wikipedia
Известная всем нам онлайн-энциклопедия «Википедия» вчера анонсировала новый плеер, который внедряется как на этом ресурсе, так и на прочих родственных сайтах. Плеер, по словам команды Wikipedia, создан для того, чтобы облегчить пользователям возможность добавления образовательных видео (и само собой, возможность просмотра этих видео другими пользователями). Это тот же HTML5-плеер, что используется в open-source видеоплатформе Kaltura.
«Википедия удалила статью об американском голодоморе и ГУЛАГе?» Нет, утка
2012-11-02 в 21:43, admin, рубрики: wiki, Wiki-технология, wikipedia, блогосфера, веб-аналитика, Википедия, политика, СМИ, США, утка, метки: wiki, блогосфера, Википедия, политика, СМИ, США, уткаВ блогосфере последние несколько дней распространяется информация, что, дескать, в русскоязычной Википедии удалили критическую статью об американских жертвах во время Великой Депрессии, которые её автор сравнивает с украинским голодомором и советским ГУЛАГом, по утверждениям в блогосфере из-за политической цензуры владельцев «Википедии».
На самом деле это «утка». Текст, которые сейчас копируют блоггеры, появился в журнале Василия Сергеева еще 29 ноября 2008 года, а 28 ноября, собственно, и была удалена статья из Википедии — из-за того, что текст ее был полностью скопирован со статьи исследователя, и написан был в откровенно неэцнкилопедическом стиле, что можно проверить на примере самой той статьи.
Читать полностью »