
他の多くの人と同じように、私も 2024 年の米国大統領選挙の結果を理解するのにしばらく時間がかかりました。しかし、やるべき重要なことがもう 1 つあります。それは、私が立てた予測が実際にどうなったかを分析することです。そして、ようやくその作業に取り掛かることができました。
私は、約 1.5 か月の間に、主に 3 つの異なる予測を行いました。① 加重された高品質の世論調査のみに基づくもの (538 件からダウンロードしました)、② 2016 年と 2020 年の選挙の完全な平均世論調査の偏りで調整したもの、そして ③ 2016/20 年の世論調査の偏りの半分だけ調整したものです。
2016年と2020年の世論調査の偏りを統合した理由は何だったのでしょうか? 「トランプ氏が登場して以来、選挙の動向は大きく変化したため、それ以前の選挙は考慮していません。古いルールはもう適用されません。2024年は、それ以前のどの選挙よりも2020年と2016年に似ているでしょう。」(私の最初の記事を参照)
そしてなぜ私は半数の投票バイアスを含むものを含めたのでしょうか?
11 月初旬、非常に合理的に聞こえる議論に基づいて、2012 年と 2022 年の世論調査の誤差が考慮すべきかどうかも調べ始めました。残念ながら、それらの議論は完全に間違っていたことが判明したため、この事後分析では予測 ④ と ⑤ を除外します。
予測①から予測③では、7 つの激戦州での勝利差を予測し、各州での候補者の勝利確率、予想選挙人数 (EV)、そして、これらを合わせて (モンテカルロ シミュレーションに基づいて) 全体の勝利の可能性を算出しました。ここで焦点を当てるのは、私の予測差が激戦州での実際の差からどれだけかけ離れていたかを見ることです。なぜなら、私の予測の他のすべての要素は、激戦州に基づいていたからです。
私は、方向性の正確さ、平均絶対誤差 (MAE)、および二乗平均平方根誤差 (RMSE) という 3 つの一般的なアプローチでこれを行うことにしました。MAE は予測されたマージンと実際のマージンとの絶対差を計算し、それらの値を平均するだけですが、RMSE は大きな誤差に対してより重いペナルティを課します。また、7 つの激戦州を均等に重み付けした場合と、それぞれを EV ベースで重み付けした場合についても、MAE と RMSE を実行します。均等重み付けでは、各州の予測を同等の重要性で扱い、戦略的重要性に関係なく予測精度のみに焦点を当てます。ただし、EV ベースの重み付けでは、各予測の選挙上の重要性をより適切に反映します。MAE と RMSE はどちらも、低いほど良いです。
ということで、さっそく始めましょう。私の予測がどうなったか見てみましょう。
メトリック | 予測① | 予測② | 予測 ③ |
---|---|---|---|
方向精度 | 42.9% | 100% ✓ | 100% ✓ |
MAE(等重み) | 2.37 | 2.11 | 1.01 ✓ |
RMSE(等重み) | 2.46 | 2.32 | 1.32 ✓ |
MAE(EV加重) | 2.26 | 2.11 | 0.81 ✓ |
RMSE(EV加重) | 2.35 | 2.32 | 1.06 ✓ |
ご覧のとおり、どの方法を使用し、個々のスイング州をどのように重み付けするかに関係なく、予測 ③ は他の 2 つを簡単に上回ります (マージンとは無関係に正確に予測された州の数を調べる最も基本的な指標である方向精度を除く)。
3 つの予測はすべて同じ世論調査と同じ重み付けに基づいており、どの世論調査の偏りに対してどの程度調整されたかが異なるだけなので、私が最初に立てた仮定が妥当であったことがわかります。トランプ氏が候補者である選挙は他の選挙とは異なり、世論調査会社は依然としてトランプ氏への支持を捕捉するのが苦手です (「恥ずかしがり屋のトランプ投票者」などのため)。ただし、世論調査会社は依然として少し改善しています。単純なモデル (2016/20 年の平均世論調査誤差を取り、それを半分にカットする) で、ほとんどの場合はうまくいきます。
このトピック全体を締めくくるにあたり(4年以内にまた始めるまで)、さらにもう1つ読みたいものがあります。ポリマーケットのフランス人ベッターが、いわゆる隣人投票(非常に大雑把に言えば、「あなたは誰に投票しますか?」ではなく「あなたの隣人は誰に投票すると思いますか?」と尋ねる)を行い、すべてを正確に予測したという報告があります。アンドリュー・ゲルマン教授は、
それでは、3年半後にお会いしましょう。👋🏻