Venäjän vaalit 2011

Kohteesta Opasnet Suomi
Loikkaa: valikkoon, hakuun




Venäjän vaalit 2011 käsittelee duuman vaaleja 4.12.2011.

Pääviesti
Kysymys:

Mitä päätelmiä voidaan tehdä Venäjän duuman vaalien tuloksista?

Vastaus:

Hallitsevana piirteenä tuloksissa on vaalipiirien tasolla näkyvä vahva yhteys Yhtenäisen Venäjän kannatuksen ja äänestysaktiivisuuden välillä. Vaikka pientä korrelaatiota voi olla rehellisissäkin vaaleissa, näyttää näissä vaaleissa korrelaatio niin vahvalta, ettei sitä voi selittää muuten kuin sillä, että uurniin on lisätty ylimääräisiä äänestyslippuja Yhtenäisen Venäjän hyväksi D↷. Vaikutus näyttää huomattavan suurelta ja on se on lisännyt Yhtenäisen Venäjän kannatusta vaalien lopputuloksessa mahdollisesti jopa 10 - 15 prosenttiyksikköä todelliseen tilanteeseen nähden. Tarkkaa arviota vaikutuksesta ei tällä hetkellä ole.


Kysymys

  • Mitä päätelmiä voi tehdä Venäjän duuman vaalien (4.12.2011) tuloksista?
  • What conclusions can be drawn from the election of the Russian duma (4.12.2011)?


Tulos

Hallitsevana piirteenä tuloksissa on vaalipiirien tasolla näkyvä vahva yhteys Yhtenäisen Venäjän kannatuksen ja äänestysaktiivisuuden välillä. Vaikka pientä korrelaatiota voi olla rehellisissäkin vaaleissa, näyttää näissä vaaleissa korrelaatio niin vahvalta, ettei sitä voi selittää muuten kuin sillä, että uurniin on lisätty ylimääräisiä äänestyslippuja Yhtenäisen Venäjän hyväksi. Vaikutus näyttää huomattavan suurelta ja on se on lisännyt Yhtenäisen Venäjän kannatusta vaalien lopputuloksessa mahdollisesti jopa 10 - 15 prosenttiyksikköä todelliseen tilanteeseen nähden. Tarkkaa arviota vaikutuksesta ei tällä hetkellä ole. Ks. käynnissä olevat keskustelut Keskustelusivulta.

The dominant feature in the election results is the strong correlation between the voting activity and the support of the United Russia party. It is difficult to explain the strength of this correlation using the same statistical arguments that seem to hold for the other parties, e.g. more or less Gaussian probability distribution of the support percentage. To explain the anomaly the possibility of a systematic fraud has been considered leading to a rough estimate of 10-15% of manufactured votes based on the distribution of the votes. The plausibility of these assumptions is debated more thoroughly in the Discussion page.


Perustelut

  • Tämä osio perustelee Tuloksen kertomalla mistä vaalidata on saatu, miten datatiedostoja luetaan, ja millaisia analyysejä ja johtopäätöksiä datasta on tehty.
  • This section gives justification for the Result (Sect. Tulos) by explaining where the election data has been obtained, how to read the data files and how to analyze and interpret the data.


Vaalidata (eri lähteitä) - Data sources

Näytä tulokset -linkin takaa löytyy Opasnet-tietokantaan talletetut vaalitulokset. Tarkemmat tiedot tiedostoformaatin rakenteesta on annettu täällä. Alkuperäinen datatiedosto löytyy csv-muodossa osoitteesta http://peregrins.com/elect/results.csv.gz . Näytä tulokset -link allows the user to download the election data from the Opasnet database. More information on the format of the election data file can be found here. The original election data in csv-format can be obtained from http://peregrins.com/elect/results.csv.gz .


Vaalidata-analyysejä internetissä - Internet sources on election data analysis


Havaintoja jotka tukevat Tulosta - Observations which support the Result (Sect. Tulos)

  • Äänestysdatan tilastollisissa analyyseissa (ks. alla) huomiota ovat kiinnittäneet erityisesti seuraavat havainnot
    1. Suuri poikkeama Gaussisen jakauman muodosta joka erityisesti suurten äänestysprosenttien kohdalla ei lähesty nollaa vaan kasvaa 100% aktiivisuutta lähestyttäessä (ks. kuva kappaleessa Äänestysprosenttijakauma Suomessa ja Venäjällä)
    2. Luonnolliselta vaikuttava lokaali maksimi n. 20-40% kohdalla Yhtenäisen Venäjän monissa aluekohtaisissa äänestystuloksissa (ks. kuvat kappaleessa Kannatusjakautumia Venäjän vaaleista)
    3. Kannatusprosenttien piikittyminen ei-satunnaisessa prosenttilukujoukossa kannatusjakatuman hännässä (ks. kappale Tasakannatusfiltteröity data).
  • Karkea arvio vaaleissa yleensä toteutuvasta (lähes) Gaussisesta jakatumasta poikkeavasta todennäköisyysmassasta johtaa n. 10-15% varovaiseen arvioon, jota on käytetty osiossa Tulos. Gaussisten jakautumien esiintymistä perustellaan yksityiskohtaisemmin täällä
  • Statistical analysis (see below) of the election data has drawn attention especially to the following observations
    1. Large deviations from the Gaussian distribution in the long tail part of the distribution which does not go to zero but grows when approaching 100% activity (see fig. in Sect. Overall voting activity in Finland and Russia)
    2. Seemingly natural local maximum at 20-40% support range for United Russia in several local election commission results (see figs. in Sect. Party support in Russian duma elections 2011)
    3. Non-zero concentration of election sites for extremely narrow bin sizes at nonrandom set of support percentages in the tail part of the distribution (see Sect. Binning data using extremely narrow bin sizes)
  • A rough estimate of the probability mass diviant from the (approximately) Gaussian distribution, which is usually to be expected in fair elections leads to the 10-15% estimate used in Sect. Result (Tulos). The emergence of Gaussian distributioons is justified in more detail here.


Vertailua Suomen eduskuntavaaleihin 2011 - Comparison with Finnish parlamentary election 2011


1. Regressioanalyysiä - Regression analysis

  • Tämä osio sisältää vaalidatasta tehtyjä regressioanalyysituloksia. Sinun ei tarvitse ajaa mallia uudestaan (se kestää muutamia minuutteja), koska tulokset löytyvät valmiiksi laskettuna tästä: [1]
  • This section contains regression analysis of the election data. You don't need to run the model (it will take a few minutes) because you can familiarize yourself with the pre-run results at [2]


2. Äänestysprosenttijakauma Suomessa ja Venäjällä - Overall voting activity in Finland and Russia

  • Alla oleva kuva on tuotettu koodilla, jonka voit kopioida omaan R-kääntäjääsi klikkaamalla tekstilinkkiä 'Näytä koodi' alla. Ajopainike ei ole käytössä.
  • The picture below has been produced using the code which can be copied to your own R environment by copy pasting it by clicking the text 'Näytä koodi' below. Run code button is redundant.

+ Näytä koodi

Äänestysaktiivisuus duuma-eduskunta.png

Kannatusjakautumia Venäjän vaaleista - Party support in Russian duma elections 2011

  • Tämä analyysi muuttuu vähitellen hienosyisemmäksi kuten etenet sivua alaspäin. Tässä yksinkertaisesti suodatetaan haluttu data ja kuvataan se. Tarkoitus on ladata data Opasnet-kantaan, jolloin voit ajaa analyysit yksinkertaisesti nappia painamalla. Vielä tämä ei toimi, vaan joudut kopioimaan koodin omalle koneellesi ja ajamaan sen R:llä siellä.
  • The analysis programs get progressively more sophisticated as you scroll down the page. This is the simplest analysis model which basically allows you to filter the data and make some nice plots. You can compare the statistics of different parties in different regions of Russia. We will upload the data file into the Opasnet data base so that you can simply run the program by pressing the button below (does not work quite yet! In the meanwhile you can install R on your own computer and download the input data file from the bottom of the page manually.)


+ Näytä koodi


1. Neljän suurimman puolueen kannatusvertailu - Comparison of the support of four largest parties

  • Neljän suurimman puolueen kannatusprosentit (x-akseli) eri äänestysalueilla ja äänestysalueiden määrä (y-akseli).
  • Here is a picture of the 4 biggest parties in Russia. The x-axis shows the percentage of votes cast at the polling station and the y-axis shows the number of polling stations corresponding to the percentage.


Comp 4 parties all.png



2. Kahden suurimman puolueen aluekohtainen kannatusvertailu - Comparison of the local support of two largest parties

  • Kuvasarja, joissa tarkastellaan kannatusprosentteja kahden suurimman puolueen (Yhtenäinen Venäjä oikealla ja Kommunistinen puolue vasemmalla) osalta Venäjän eri alueilla. Tulokset (ylhäältä alas) pätevät seuraaville tasavalloille ja alueille: Adygea, Bashkortostan, Dagestan, Kabardino-Balkar, Karachai-Cherkess, Komi, Mordovia ja Pohjois-Ossetia. Nämä edustavat ensimmäistä viittätoista paritonta aluekoodinumeroa listassa.
  • A series of pictures comparing the voting activity of the Unified Russia (pictures on the right) party with the second largest Communist Party (pictures on the left). The data has been calculated in the regions of (top down) The Republic of Adygea, Republic of Bashkortostan, The Republic of Dagestan, Kabardino-Balkar Republic, Karachai-Cherkess Republic, The Republic of Komi, The Republic of Mordovia and The Republic of North Ossetia. These represent the first odd-valued region codes less than or equal to 15.


PicCR 1.png
PicUR 1.png
PicCR 3.png
PicUR 3.png
PicCR 5.png
PicUR 5.png
PicCR 7.png
PicUR 7.png
PicCR 9.png
PicUR 9.png
PicCR 11.png
PicUR 11.png
PicCR 13.png
PicUR 13.png
PicCR 15.png
PicUR 15.png




3. Tasakannatusfiltteröity data - Binning data using extremely narrow bin sizes

  • Tässä esitetään histogrammit kunkin puolueen kannatuksesta [%], jos jokin puolue sai promillen tarkkuudella jonkin seuraavista "tasakannatuksista" (0.5,0.6,0.666,0.7,0.75,0.8,0.95,1.00)*100%). Filtteröinti antaa varsin mielenkiintoisen 'kamman' Yhtenäiselle Venäjälle.
  • The histograms showing the supporp ercentage of each party is shown for an extremely narrow bin size at nonrandom set of support percentages belonging to the set (0.5,0.6,0.666,0.7,0.75,0.8,0.95,1.00)*100%). The binning results in an interesting structure for the support of the United Russia party.



Hierarkkinen Bayes-malli - Hierarchial Bayesian model

Malli[1] [2] [3] [4] [5] [6] perustuu seuraaviin oletuksiin:

  • Jokaisella äänestysalueella jokin määrä ihmisiä tulee äänestämään (nHonest[i]). Tämä määrä riippuu erilaisista satunnaisista tekijöistä, jolloin suuressa joukossa voidaan sanoa, että kyseessä on binomijakauma, joka riippuu kahdesta asiasta: äänioikeutettujen määrästä (nVoters[i]) ja yksittäisen äänestäjän todennäköisyydestä tulla äänestämään (Activity[i]).
  • Se, mikä on yksittäisen äänestäjän todennäköisyys tulla äänestämään jollakin äänestysalueella on myös riippuvainen suuresta joukosta satunnaisia tekijöitä, jotka vaihtelevat äänestysalueiden välillä. Niinpä voidaan sanoa, että tämä todennäköisyys on satunnaisesti jakautunut beetajakauman mukaisesti parametreilla ActA ja ActB. Mallissa oletetaan, että eri äänestysalueiden välillä ei ole sellaista systemaattista eroa, joka estäisi beetajakauman käytön. Huomaa, että valheelliset äänet selkeästi ovat tällainen systemaattinen ero, mutta se huomioidaan toisaalla mallissa ja tässä tarkastellaan ainoastaan rehellisiä ääniä.
  • Jokaisella puolueella on jokin kansallinen kannatusprosentti (support[j]). Tämä kuitenkin vaihtelee äänestysalueesta toiseen mutta sillä tavalla satunnaisesti, että tätä satunnaisuutta voidaan kuvata äänestysaluekohtaisen dirichlet-jakauman avulla. Se montako ääntä kukin puolue kullakin äänestysalueella saa (nHonest2[i,j]), riippuu tästä puolue- ja äänestysaluekohtaisesta todennäköisyydestä ja toisaalta kokonaisäänimäärästä multinomijakauman mukaisesti.
  • Jos vaalit ovat rehelliset, tämä malli pystyy arvioimaan puoluekohtaiset kannatusprosentit sekä koko maahan että jokaiselle äänestysalueelle. Koska alustavien tarkastelujen perusteella äänestysprosentit eivät noudata tilastollisia lakeja, on mitä todennäköisimmin joukossa väärennettyjä vaalilippuja. Näiden määrä (nFabr[i,j]) pystytään arvioimaan siten, että vaalipiiri- ja puoluekohtaisesti katsotaan äänimääriä ja arvioidaan, poikkeaako tulos siitä mitä sen pitäisi edellä kuvattujen tilastollisten lakien perusteella olla. Oletusarvo on, että vaalivilppi on hyvin epätodennäköistä (pFabr[i,j]), joten vaalipiirin tuloksen pitää poiketa huomattavan paljon siitä, mitä tilastollisesti voisi olla odotettavissa. Jos tällainen suuri poikkeama kuitenkin nähdään, oletetaan, että epäillyn puolueen liiat äänet johtuvat väärennetyistä vaalilipuista.
  • Kuvassa esitettyjen mallin muuttujien selitykset saat kun klikkaat linkkiä alla olevaa linkkiä 'Näytä koodi'. Ajopainikkeella ei tässä yhteydessä ole merkitystä.
  • Explanation of the symbols in the picture above is obtained by clicking the link 'Näytä koodi' below. Run code button is redundant.

+ Näytä koodi


  • Hierarkisen mallin R-koodiin voi tutustua klikkaamalla alla olevaa linkkiä 'Näytä koodi'.
  • You can familiarize yourself with the R code of the hierarchial Bayes model by clicking the link 'Näytä koodi' below.


+ Näytä koodi


  • Hierarkisen Bayes-mallin koodi ei vielä täysin toimi klikkaamalla yllä olevaa ajopainiketta, koska syötteenä tarvitaan dataa toisesta analyysistä.) Malli käyttää hyväkseen kirjastorutiinia rbugs.
  • The R code of the Hierarchial Bayes model does not work fully yet by clicking the Run code button above because it uses example data from another analysis). The model uses the package rbugs.
#: The compilation of the model produces this error message: "vector-valued relation nHonest2 must involve consecutive elements of variable." Who can help to sort this out? --Jouni Tuomisto 19. joulukuuta 2011 kello 15.30 (EET)

Katso myös

Venäjän presidentinvaalit 2012

Viitteet


Aiheeseen liittyviä tiedostoja

Vaalien tulokset äänestysalueittain.

<mfanonymousfilelist></mfanonymousfilelist>