国政に限らず、都道府県知事選や地方議会議員選挙など、国内では様々な選挙が行われます。そして、国政上重要な選挙であれば、TVなどがこぞって特番を組んだり、選挙結果の速報を流したりします。
そこでしばしばみられるのが「開票率1%で当選確実(当確)」という現象。残りの99%の結果がわからないにも関わらず、どうして確実と言えるのでしょうか。そのしくみと原理を『広告・ニュースの数字のカラクリがわかる統計学』の著者・涌井良幸さんに聞いてみました。
※Smartnewsなどのアプリ内ブラウザでは数式が正常に表示されない場合があります。その際は、FirefoxやGoogle Chromeなど、単体のブラウザでお読みください。
選挙の開票速報で、開票率1%なのに当確が出るのはなぜなのか
選挙のたびに気になるのが上記の見出しである。なぜ、たったの1%を開票しただけで「当確」の判断ができるのか。この問いに対する答えを考えてみよう。
「開票」のしくみからわかる?
選挙の「開票」作業は慎重を要する作業である。したがって、1回の票の確認では公表はできない。そこで公表するには何回もの確認作業が必要になり、この作業を経た票だけが「開票」された票とみなされるのである。したがって、「開票率1%」などと開票状況が公表されるときには、多くの票は既に一通りは確認されていることになる。
つまり、この時点で態勢はほぼつかめていることになるため「開票率1%」の時点で相当な確信をもって各候補の当落を判断できてもおかしくない。だが、これでは開票作業開始「直後」に当確が出せないため、矛盾が生じる。
事前の調査より明らかになる?
投票所で投票を済ませた人の一部から投票先を聞き取る出口調査や選挙事務所などへの聞き取り調査などをもとにすれば、開票作業が始まる前に予め当選者を予測することができる。しかし、これだけで強い確信をもって候補者の「当確」を予め判断するのは難しいだろう。
投票結果を統計学の理論で推定する
では、統計学の理論を用いて推定するのはどうだろうか。開票された1%の開票結果だけをもとに、当確の判断ができるかどうか検討してみよう。
しかし、検討に入る前に既にいくつか不安がある。それは、「1%」という量に関することと「どの票を開票したか」ということである。これらのことを考慮しながら検討してみることにしよう。
1.「1%」という量
理論は極端にしてみると分かりやすい。そこで、100人の選挙人がA、B二人の立候補者のどちらかに投票する場合を考えてみよう。
この場合、開票率1%は「1人分を開票した」ということになる。その結果がAだったとき、これをもとにAの得票率を予測することはできるだろうか。
おそらく、多くの人は「無理」と答えることだろう。こう考えると「1%」という形式的な値は、推測の妥当性の根拠としてあまり意味がないことが分かる。
それでは、総投票数のほんの一部分が開票されただけで「当確」と判断するための合理的な理由は一体なんだろうか。この疑問に答えてくれるのが統計学の「推定に関する理論」であり、次のようになる。
- ある性質Aを有しているかいないかからなるデータ全体(=母集団)から、n個をランダムに取り出すときを考える
- 取り出したn個のデータのうち、性質Aを有するデータの比率をrとする(これを標本比率という)
- また、母集団における性質Aを有するデータの比率をR(これを母比率という)とする
このとき、統計学の区間推定の理論を使うと次のことがいえる。
信頼度95%で \(r-1.96\sqrt{\frac{r(1-r)}{n}} ≦ R ≦ r+1.96\sqrt{\frac{r(1-r)}{n}}\)
※「1.96がどこからきたのか」など、区間推定の理論の基礎については『中学数学でわかる統計の授業』(涌井良幸・涌井貞美共著)に詳しい
この理論では「全体の何%」よりもランダムに取り出したデータ数nがいくつなのか、選挙でいうところの開票した票の数が大事となる。では、この式を使ってA・B二人の立候補者のどちらかに投票する場合を考えてみよう。
例えば1000人分を開票した段階で600人がA候補者に投票しているのが分かったとする。このときn=1000、r=\(\frac{600}{1000}\)=0.6となり、先ほどの式にあてはめると次のようになる。
信頼度95%で\(0.6-1.96\sqrt{\frac{0.6(1-0.6)}{1000}} ≦ R ≦ 0.6+1.96\sqrt{\frac{0.6(1-0.6)}{1000}}\)
これを電卓で計算すると「信頼度95%で0.56≦R≦0.63」となり、わかりやすい言葉にすると「95%の確からしさで、A候補者の実際の支持率が56%以上63%以下だと推定できる」ということになる。
もし、「当確をだすためには信頼性95%が必要」とするならば、開票した1000人分のうち600人がA候補者に投票していると分かった時点で、A候補者に当確が出せることになる。仮に投票者の総数が10万人だったならば、そのうちの1000人(全体の1%)を開票しただけでA候補者の当確を判断することができたということになる。
ただし、ここでいう当確とはあくまでも「信頼度95%で当選と推定できる」ことを意味しているに過ぎない。実際「最後まで開票してみたら実は落選だった(当確取り消し)」という事例も過去に存在している。
2.どの票を開票したか
ただし、この式を使って一部から全体を推測しようと試みるにあたって、留意しなければならないことがある。それは「全体から一部を抽出する場合、その一部はランダムに選ばれなければならない(ランダムサンプリングを行う)」ということである。
先の区間推定の理論はランダムサンプリングが行われていることを前提としたものである。もし、開票された1%がA候補者の支持者が多い地区から抽出されていた場合、ランダムに選ばれたとは言えない。そのため、先ほどの式の利用はためらわれることになる。
以上、選挙速報で「当確」を出す方法を探ってみたが、これも決して満足なものではない。実際、選挙速報ではいくつかの方法を組み合わせ、それらを総合して「当確」かどうかを判断しているようである。
また、「統計に関する理論」は選挙速報だけではなく、世論調査や広告をはじめとするさまざまなところで使われている。その一方で「一見もっともらしい統計を用いて、都合のいい結論に誘導する」といった使われ方をされることも多い。
本記事のような雑学としてだけではなく、こうしたカラクリに騙されないためにも、統計に関する知識を持っておいて損はないだろう。