Ayao "Alqualos" Kuroyuki (ayao) wrote,
Ayao "Alqualos" Kuroyuki
ayao

Пожизненный ЦИК с гвоздями, версия 0.1

Прошедшие выборы имели одну интересную особенность: кроме слов "жулики", "надули", "козлы" и "доколе" звучали также слова "распределение Гаусса" и прочий матан. Поглядев на пару таких графиков, я начал проявлять подозрительность и решил всё перепроверить. А то мало ли кто там чего насчитал. Откуда данные? Как они обрабатывались? Хрен его знает. Не исключена вероятность как ошибок, так и откровенной подтасовки уже со стороны "оппозиционеров". Тем более, что данные вытащить с сайта ЦИК оказалось не так уж просто - они там довольно разрозненны, и просто "wget -r" эту проблему не решит.

В результате родился пакет скриптов под кодовым названием "Пожизненный ЦИК с гвоздями". Скрипт таскает данные прямо с сайта ЦИК, коды открыты и прозрачны, хотя наличие багов не исключено. Но тем не менее результаты совпали с уже виденными картинками. Вот, например, по Москве:

Image and video hosting by TinyPic

По горизонтальной оси - процент голосов. По вертикальной оси - количество участков, набравших данный процент, плюс-минус 0,5%. Пик у 51% процентов, конечно, удручает. Приводимые много где графики по стране, конечно, подвержены разнородности - нормальное распределение там получаться не обязано, это всё-таки средняя температура по больнице. Хотя пики через каждые 5% выглядят довольно забавно, уж это-то никакой разнородностью не объяснишь - как так может быть, что 48-49% получилось на существенно меньшем числе участков, чем 50-51%, хотя вокруг кривая ровная? Но данные по стране я не перепроверял.

По Москве же эта двуглавая гидра ни на что вообще не похожа. Картина такова, как будто бы есть участки, где ЕР очень популярна, и наоборот - где она совсем не популярна. Это ещё можно себе представить. Но даже если бы это было так, это никак не объясняет дырки между 25% и 51%. Наоборот, она должна была сгладиться за счёт сложения угасающей половины "непопулярной" части и возрастающей половины "популярной" части. Вместо этого стремительный взлёт к 51%. К тому же, если посмотреть данные по отдельным районам, наблюдается явная чехарда. К примеру для Серверного Медведово: 27.84% 39.52% 25.95% 25.42% 48.62% 34.07% 26.21% 25.99% 28.50% 30.09% 52.77% 27.29% 28.88% 25.94% 26.38% 38.41% 29.80% 26.23% 49.34% 52.96% 20.95%... Конечно, можно сказать, что есть всякие там военные части, КПЗ, СИЗО и прочие психушки, но их просто не наберётся в Москве столько, чтобы создать такой огромный пик на 51%. Скорее они создают небольшие всплески в районе 90%, которые тоже заметны на графике, но вряд ли сильно влияют на результат. В таком хаотическом муравейнике как Москва довольно-таки естественным представляется именно нормальное распределение, а не эта хрень.

По Московской области картина не такая ужасная.

Image and video hosting by TinyPic

Но тем не менее есть явное расхождение. Пунктиром у меня отображены подсчитанные кальком нормальные распределения для получившихся среднего значения и отклонения. То есть пунктир отражает то распределение, которое было бы, если бы процент набранных голосов был тем же, но не было бы никаких подтасовок и голосовал бы исключительно сферический электорат в вакууме. Верхние точки пунктирных графиков - это как раз примерно средний процент голосов. Правда, тут он средний по участкам, без учёта того факта, что на разных участках разное количество людей голосовало. Но на самом деле он не сильно отличается от настоящего среднего - максимум на 2-3%. Более того, поскольку фактические данные на графике тоже построены по участкам, они должны более-менее совпадать. Что же мы имеем с гуся вместо этого?

У ЛДПР и КПРФ результат почти идеальный. У "Яблока" и СР пики немного смещены и кривые расходятся, но не сильно - вполне возможно, что в пределах погрешности или истинных отклонений. У ЕР пик где-то в районе 23-30%, у нормального распределения - в районе 30-35%. Разница не очень большая. Но настораживает то, что у реальных результатов пика как такового нет - он срезан. Как? Как будто сложены две кривые - одна с результатами в районе 22-23%, другая - с результатами в районе 30%.

Также у ЕР наблюдаются сильные расхождения в районе 10-15%, 21-30% и 35-45%. Первое - Хрен с ним, это лишь говорит о том, что участков, где ЕР набрала очень мало, почти не было. Охотно верится. Хотя тогда возникает вопрос, откуда такие взялись у КПРФ в довольно большом количестве. Коммунистов везде хватает, разве нет? Кстати, в Москве таких участков намного больше.

Второе отклонение (21-30%) как бы говорит нам "настолько до Хрена участков, где за ЕР проголосовало от 21% до 30%, что ни Хрена не понятно, как же они в конце концов набрали свои 35% или сколько там". Аналогично и третье отклонение - "подозрительно мало участков, набравших 35-45%, для такого хорошего результата их явно должно было быть больше". Но это всё чистой воды спекуляция. Во всяком случае хотя бы отдалённо эта картина особого недоумения не вызывает - ни тебе подозрительных пиков на "красивых" числах, ни тебе откровенного нарушения формы - так, лёгкая перекособоченность. Хотя если оценивать чисто визуально, то КПРФ и ЕР очень похожи, только КПРФ более-менее соответствует закону Гаусса, а у ЕР как будто отгрызли левый бок и вершину, и размазали отгрызенное справа.

Домашнее задание: постройте графики для Питера и Ярославской области. В Питере уже не помню что, но очень весело, и не только у ЕР. В Ярославской области сначала чёрт-те что, но если сообразить построить отдельно для Ярославля с Рыбинском и для остальных говен, то получаются очень красивые и честные картинки, причём в ярославских говнах ЕР более популярна, чем в крупных городах. То ли это отражает общую тенденцию недовольства ЕР в крупных городах, то ли в говнах проще подтасовать результаты. Но первый вариант более правдоподобен, так как иначе в говнах не было бы такой красивой картинки.
Tags: politics
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments