Выборы-2016. Часть 2 — удивительное рядом и оно разрешено

в 20:49, , рубрики: data mining, ggplot2, R, визуализация данных, выборы-2016, открытые данные, ЦИК РФ, метки: ,

В первой части статьи о выборах 2016 года шла речь о результатах в 225 избирательных округах. В этот раз рассмотрим данные о результатах голосования по участковым избирательным комиссиям (УИК), которых насчитывалось чуть менее 100 тысяч. Этот уровень детализации позволяет увидеть неожиданные явления и удивительные закономерности в результатах голосования.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 1

Данные

Мы будем рассматривать только результаты выборов по партийным спискам — пропорциональная составляющая голосования. Сведения о результатах голосования для каждого УИКа предоставляются Центризбиркомом в несколько разрозненном виде. В агрегированном виде данные собраны и распространяются Сергеем Шпилькиным (ссылка).
Общее число участков на этих выборах составило 96871. В этих данных для каждого УИКа приводятся данные о числе избирателей, проголосовавших за партии, участвовавших в выборах. Вместо числа избирателей переходим к процентному представлению результатов партий с точностью до 0.01 %. Сумма результатов в каждом УИКе по всем партиям, с учетом процента испорченных бюллетеней, должна быть равна в точности 100.00 %. Для округления процентных результатов используем метод наибольшего остатка — наиболее известный подход. ЦИК использует другой метод округления процентных результатов, сведения о котором я не нашел. И по крайней мере этот метод не совпадает ни с одним из алгоритмов представленных в библиотеке sfsmisc. Поэтому, в некоторых случаях, используемые процентные результаты могут отличаться от данных ЦИК на 0.01 %, но это не играет принципиальной роли. Результаты явки тоже выражены в процентах с точностью до 0.01 % (использовалось обычное округление).

Пятно

Отображаем полученные данные на диаграммах рассеяния, в которых точками являются — УИКи.
На графике ниже показаны результаты явки и партии "Единая Россия" по всем УИКам.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 2

На этой диаграмме обращает на себя внимание черная точка в районе явки с 65 процентами и результатом "Единой России" примерно в 60 процентов. Эта точка означает высокую концентрацию УИКов с очень близкими результатами по этим двум осям графика.

Для двух диаграмм с осями "Явка — КПРФ", "Явка — ЛДПР" по-прежнему наблюдаем черную точку с той же явкой.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 3

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 4

И даже для непарламентских партий, например, для "Коммунистов России" это точка продолжает сиять.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 5

Впрочем, и для остальных партий это явление можно также наблюдать. Дальше — больше, посмотрим что это за участки. Зададим диапазон более точно — явка в пределах от 64.26 % до 64.33 %, результат "Единой России" от 62 % до 62.5 %. В указанные границы попадает 60 УИКов. И, какое неожиданное совпадение, все они из Саратовской области!

Этот феномен был обнаружен еще до утверждение результатов выборов. К сожалению, представители ЦИК, в том числе и его председатель, поспешили заявить, что ничего удивительного в этом явлении нет. Поэтому проверка по этому случаю не проводилась.

Линейные зависимости

На графики с осями "КПРФ — ЛДПР" прослеживаются прямые вида y = x и y = 2*x.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 6

Более отчетливо линейные зависимости с целыми коэффициентами видны, например, для пары "Коммунисты России — Яблоко".

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 7

Нельзя сказать, что это вклад какого-либо определенного региона (точек на этих прямых слишком много). Но почувствовать некоторую разницу можно на примере Москвы и Московской области.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 8

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 9

Или вот график для пары "Коммунисты России — Справедливая Россия" в квадрате 10 % на 10 % с сериями y = x, y = 2x, y = 3x и x = 2*y

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 10

По какой причине выделяются эти линейные зависимости с целыми коэффициентами?
Мне не приходит на ум какого-либо логичного объяснения этим закономерностям в результатах голосования.

Бимодальность

Это характеристика результатов голосования в Госдуму хорошо известна и по предыдущим выборам. Высокая явка избирателей на участке, как правило, свидетельствует о высоком результате "Единой России". Особенно отчетливо это проявляется в районе точки (100 %, 100%). Такое уникальное сочетание гражданской ответственности и единомыслия избирателей на этих участках не перестает обращать на себя внимание.

Ниже два графика сглаженной плотности точек для партий "Единая Россия" и "ЛДПР"

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 11

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 12

"Красивые" цифры явки

На выборах 2011 года число УИКов с явкой в 60, 70, 80, процентов резко возрастало по сравнению с остальными участками (и явкой меньше 100 %). На выборах 2016 года таких резких перекосов не наблюдается, за исключением явки в 50%. На графике ниже бин равен 0.1%, результат 100% явки — 2813 участка, исключен для наглядности представления остальных данных.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 13

Как поработать с графиками самостоятельно

Все графики построены в R с использованием библиотек shiny и ggplot2. Это пример страницы приложения.

Выборы-2016. Часть 2 — удивительное рядом и оно разрешено - 14

Если у вас установлен R, то, загрузив библиотеки shiny и pacman, вы можете запустить приложение командой
shiny::runGitHub("e-chankov/elections_2016_uik").
Или же просто взять R-скрипты с GitHub.

Автор: jzha

Источник

* - обязательные к заполнению поля


https://ajax.googleapis.com/ajax/libs/jquery/3.4.1/jquery.min.js