paint-brush
Tôi đã cố gắng dự đoán cuộc bầu cử năm 2024—Đây là những gì tôi đã dự đoán đúng (và hoàn toàn sai)từ tác giả@maxspeicher
511 lượt đọc
511 lượt đọc

Tôi đã cố gắng dự đoán cuộc bầu cử năm 2024—Đây là những gì tôi đã dự đoán đúng (và hoàn toàn sai)

từ tác giả Maximilian Speicher3m2025/03/13
Read on Terminal Reader

dài quá đọc không nổi

Tôi đã thử nghiệm ba mô hình dự đoán bầu cử: một mô hình sử dụng các cuộc thăm dò chất lượng cao thô, một mô hình được điều chỉnh theo các lỗi thăm dò trong quá khứ (2016/20) và một mô hình có một nửa điều chỉnh. Mô hình được điều chỉnh một nửa (③) hoạt động tốt nhất trên nhiều số liệu chính xác. Điều này xác nhận rằng các thành kiến thăm dò từ thời Trump vẫn còn quan trọng, nhưng đã có những cải tiến. Trong khi đó, các phương pháp tiếp cận thay thế—như kết hợp các cuộc bầu cử cũ—đã chứng minh là không đáng tin cậy. Hẹn gặp lại các bạn vào năm 2028! 🚀
featured image - Tôi đã cố gắng dự đoán cuộc bầu cử năm 2024—Đây là những gì tôi đã dự đoán đúng (và hoàn toàn sai)
Maximilian Speicher HackerNoon profile picture

Giống như nhiều người khác, tôi mất một thời gian để tiêu hóa kết quả của cuộc bầu cử tổng thống Hoa Kỳ năm 2024. Nhưng vẫn còn một điều quan trọng nữa cần làm: phân tích xem những dự đoán của tôi thực sự diễn ra như thế nào. Và cuối cùng tôi cũng làm được điều đó.


Tôi thường đưa ra ba dự đoán khác nhau trong khoảng thời gian ~1,5 tháng: ① chỉ dựa trên các cuộc thăm dò chất lượng cao có trọng số (tôi đã tải xuống từ 538 cuộc thăm dò); ② điều chỉnh theo độ lệch thăm dò trung bình đầy đủ từ các cuộc bầu cử năm 2016 và 2020; và ③ điều chỉnh theo chỉ một nửa độ lệch thăm dò năm 2016/20.



Lý do của tôi khi tích hợp sự thiên vị thăm dò ý kiến từ năm 2016 và 2020 là gì? "Tôi không cân nhắc đến các cuộc bầu cử trước đó vì kể từ khi Trump bước vào sân khấu, động lực bầu cử đã thay đổi đáng kể. Các quy tắc cũ không còn áp dụng nữa. Năm 2024 sẽ giống với năm 2020 và 2016 hơn nhiều so với bất kỳ cuộc bầu cử nào trước đó." (Xem phần đầu tiên của tôi cập nhật từ ngày 22 tháng 9 năm 2024 .)


Và tại sao tôi lại đưa vào một cuộc thăm dò có thiên vị một nửa? Trong cập nhật từ ngày 9 tháng 10 năm 2024 , Tôi đã viết: "Có lẽ cũng không thực tế khi cho rằng sẽ có lỗi thăm dò ý kiến có hệ thống không đáng kể ở các tiểu bang dao động trong năm nay (①) cũng như cho rằng nó sẽ lớn như năm 2016/20 (②). Sự thật có lẽ sẽ nằm ở đâu đó ở giữa."


Đầu tháng 11 -- dựa trên những lập luận nghe có vẻ rất hợp lý -- tôi cũng bắt đầu xem xét liệu những lỗi thăm dò từ năm 2012 và 2022 có liên quan để xem xét hay không. Thật không may, những lập luận đó hóa ra hoàn toàn sai, vì vậy chúng tôi sẽ loại trừ các dự đoán ④ và ⑤ trong phân tích hậu nghiệm này.


Những gì mà các dự đoán ① đến ③ đã làm là dự đoán biên độ chiến thắng ở bảy tiểu bang dao động, sau đó đưa ra xác suất chiến thắng ở mỗi tiểu bang cho các ứng cử viên, số phiếu đại cử tri dự kiến (EV) và, kết hợp (và dựa trên mô phỏng Monte Carlo), cơ hội chung để giành chiến thắng toàn bộ. Điều tôi sẽ tập trung vào ở đây là xem dự đoán biên độ của tôi lệch xa đến mức nào so với biên độ thực tế ở các tiểu bang dao động, vì đó là những biên độ mà tất cả các thành phần khác trong dự báo của tôi dựa trên.


Tôi đã chọn thực hiện điều này với ba cách tiếp cận phổ biến: độ chính xác theo hướng, sai số tuyệt đối trung bình (MAE) và sai số bình phương trung bình căn bậc hai (RMSE). Trong khi MAE chỉ tính toán sự khác biệt tuyệt đối giữa biên độ dự đoán và biên độ thực tế, sau đó tính trung bình các giá trị này, thì RMSE phạt các lỗi lớn nặng hơn. Tôi cũng sẽ thực hiện MAE và RMSE để có trọng số bằng nhau cho bảy tiểu bang dao động cũng như để có trọng số dựa trên EV cho từng tiểu bang. Trọng số bằng nhau xử lý mỗi dự đoán của tiểu bang với tầm quan trọng như nhau, tập trung hoàn toàn vào độ chính xác dự đoán bất kể tầm quan trọng chiến lược. Tuy nhiên, trọng số dựa trên EV phản ánh tốt hơn ý nghĩa bầu cử của mỗi dự đoán. Đối với cả MAE và RMSE, thấp hơn là tốt hơn.


Sau khi đã nói như vậy, chúng ta hãy bắt đầu thôi. Hãy cùng xem dự đoán của tôi có thành công không.

Hệ mét

Dự đoán ①

Dự đoán ②

Dự đoán ③

Độ chính xác theo hướng

42,9%

100% ✓

100% ✓

MAE (trọng số bằng nhau)

2,37

2.11

1.01 ✓

RMSE (trọng số bằng nhau)

2,46

2.32

1,32 ✓

MAE (trọng số EV)

2.26

2.11

0,81 ✓

RMSE (có trọng số EV)

2,35

2.32

1.06 ✓


Như chúng ta có thể thấy, bất kể chúng ta sử dụng phương pháp nào và cân nhắc từng tiểu bang dao động như thế nào, dự đoán ③ đều dễ dàng vượt trội hơn hai dự đoán còn lại (ngoại trừ độ chính xác theo hướng, thước đo cơ bản nhất, xem xét có bao nhiêu tiểu bang được dự đoán chính xác mà không phụ thuộc vào biên độ).


Vì cả ba dự đoán đều dựa trên cùng một cuộc thăm dò với cùng trọng số và chỉ khác nhau ở mức độ điều chỉnh theo sai lệch thăm dò nào, điều này cho thấy các giả định ban đầu của tôi là hợp lý: Các cuộc bầu cử có Trump là ứng cử viên không giống với các cuộc bầu cử khác; các cuộc thăm dò vẫn kém hiệu quả trong việc thu hút sự ủng hộ cho Trump (do "những cử tri nhút nhát của Trump" v.v.); tuy nhiên, các cuộc thăm dò vẫn có sự cải thiện đôi chút; các mô hình đơn giản (lấy lỗi thăm dò trung bình từ năm 2016/20 và cắt giảm một nửa) hầu như đều có hiệu quả.


Để kết thúc toàn bộ chủ đề này (cho đến khi chúng ta bắt đầu lại sau chưa đầy 4 năm nữa), một bài đọc thêm nữa: Có báo cáo rằng một người cá cược người Pháp trên Polymarket đã tham gia cái gọi là thăm dò ý kiến hàng xóm (nói một cách rất sơ lược, hỏi "bạn nghĩ hàng xóm của bạn sẽ bỏ phiếu cho ai?" thay vì "bạn sẽ bỏ phiếu cho ai?"), do đó dự đoán mọi thứ chính xác. Giáo sư Andrew Gelman đã viết bài viết rất thú vị về điều này .


Được rồi, hẹn gặp lại sau 3,5 năm nữa nhé. 👋🏻