ציון תחזיות הבחירות לשנת 2016

בתחילת החודש ב- BuzzFeed News, הכרזנו כי נציין את תחזיות הבחירות השנה . ביום שני אחר הצהריים, סוף סוף מועצת המממנים של מישיגן אישר את זכייתו של טראמפ . עכשיו, כשבסוף נקראה כל מדינה - בהנחה שכך מאמציה המספרים של ג'יל שטיין לא משנה דברים - יש לנו את התוצאות.



כן ה הסקרים טעו . אבל כמה חזאים, שבדרך כלל מסתמכים על סקרים ולרוב משלבים אותם עם נתונים אחרים כדי לתת סיכויים למי ינצח, טעו פחות מאחרים. לא צריך מתמטיקה מפוארת כדי לקבוע זאת תחזיות FiveThirtyEight של נייט סילבר למרות שהעניקו להילרי קלינטון סיכויים טובים יותר מאשר לטראמפ, היו הטעויות ביותר. לא רק שהוא נתן לטראמפ יותר מסיכוי של 1 ל -4 לנצח בבחירות, אלא גם הוא שוב ושוב מוּגָן התחזיות שלו ' שטות על טראמפ , מסיבות שאחר כך הוכיח רוֹאֶה אֵת הַנוֹלָד . תחזיות אחרות בעלות פרופיל גבוה נתנו לטראמפ סיכויים קטנים עד שנעלמים.

לסיכום, להלן התחזיות שבדקנו - המפורטות על פי הסבירות שטראמפ ינצח או יקשור את קלינטון במכללת האלקטורל:



תחזיות אלה מבוססות על האופן בו כל אחת ממאה המדינות ומחוז קולומביה היו אמורות להצביע. נוכל להבין טוב יותר - אם כי עדיין לא מושלם - את שיקול הדעת של החזאים על ידי התבוננות כיצד הם ניבאו את גזעי המדינה הבודדים.

היסודות מסתכמים בזה: אילו חזאים קיבלו הכי הרבה שיחות נכון? מה הגיע הכי קרוב לשוליים הסופיים בין קלינטון לטראמפ? אילו חזאים מאזנים הכי טוב את הביטחון והנכונות? (לדוגמה: האם הם נתנו לקלינטון סיכוי של 99% לזכות במישיגן או 80%? והאם הם צדקו?)

הגישה הפשוטה לשפוט תחזיות מסובכות

הגישה הפשוטה ביותר היא רק לספור את מספר המצבים שכל חזאי נקרא נכון. אבל זה מפספס ניואנסים קריטיים. לדוגמה, זה לא לוקח בחשבון את ההבדל בין 51% סיכויים ל 99% סיכויים. ובכל זאת, זה מקום פשוט להתחיל בו.

סאם וואנג של קונסורציום הבחירות בפרינסטון ניחש נכון יותר מדינות מכל אחד אחר שבדקנו: 46 פלוס מחוז קולומביה. סילבר'ס FiveThirtyEight, וכמעט כל תחזית אחרת, קיבלו 45 נכונים. (וואנג, בניגוד לשאר החזאים, חשב שטראמפ יזכה בצפון קרוליינה).

זה מדגיש פרדוקס: למרות האמון ההיפר -מוטעה שלו שקלינטון תיקח את הבית הלבן - ויתן לה סיכוי של 99% - וואנג ניחש שיותר מדינות נכונות מכל אחד אחר.

אז למה הוא חשב שלטראמפ יש סיכוי כל כך קטן לנצח? לא רק עשה סקרי המדינה נכשלים , אבל רובם נכשלו באותו אופן: לזלזל בטראמפ. זה נקרא שגיאה מתואמת. כל החזאים מבינים שהסקרים אינם מושלמים; לפעמים הם מראיינים את האנשים הלא נכונים או לשקול את תגובותיהם בצורה לא נכונה . אך חלק מתפקידו של החזאי הוא להעריך עד כמה יכולה להיות טעות מתואמת - וכמה נרחבת -. חזאים רבים סבור כי סיכוי זה לא צפוי , אבל נייט סילבר לא עשה זאת .

בבחירות הבאות זו אשמתי , וואנג הצביע על הטעות הזו כעקב אכילס של התחזית שלו. לא הערכתי נכון את גודל השגיאה המתואמת - בגורם חמש, כתב. סקרים נכשלו, והגברתי את הכישלון הזה.

גישה מתוחכמת יותר

מוכנים לקצת יותר מתמטיקה? מדד שנקרא ציון ברייר נמצא בשימוש נרחב בכדי לכמת את הדיוק של החזאים - בבחירות ומעבר להן. (זה המדד העיקרי אמרנו שנשתמש לציון . פרסמנו את נתונים וקוד מאחורי חישובים אלה ב- GitHub .)

ציוני בריר מביאים בחשבון רק שני דברים: כמה סביר היה שהחזאי חשב שמשהו יקרה, והאם הוא עשה זאת? ציוני ברייר מתגמלים ביטחון כשאתה צודק, אך מעניש את הביטחון כשאתה טועה.

ציונים קטנים יותר טובים יותר. אפס הוא הציון הטוב ביותר האפשרי - זה אומר שהיית בטוח ב 100% בתחזיות שלך, וכולם הגיעו נכון. הציון הגרוע ביותר האפשרי הוא 1 - היית בטוח ב -100% בתחזיות שלך, וכולן טעו.

להלן שני סוגים של ציוני ברייר לכל תחזית. הראשון משוקלל לפי קולות הבחירות של כל מדינה, כך שפנסילבניה (20 קולות) נחשבת פי חמישה מניו המפשייר (4 קולות). השנייה סופרת כל מדינה באופן שווה:

כפי שאתה יכול לראות, התחזיות של FiveThirtyEight השיגו את הציונים הטובים ביותר. הניו יורק טיימסוגם פולסאווי - שנתנה לנשיאות טראמפ את ההזדמנויות הטובות ביותר לאחר חמישה ושמונה - הבקיעה טוב יחסית ברמת המדינה. התחזיות עם הביצועים הגרועים ביותר היו אלה מ-האפינגטון פוסטוקוס יומי, ששניהם נתנו סיכויים כמעט בטוחים לקלינטון שזכתה בפנסילבניה, ויסקונסין ומישיגן. (זמן קצר לאחר הבחירות, ההאפינגטון פוסטעורך הסקרים כתב מאמר המסביר איך פוצצנו את זה ומה אנחנו עושים כדי למנוע חזרה .)

בתרשים שלמעלה, תבחין כי כל התחזיות השיגו ציון גרוע יותר בעמודה המשוקללת מאשר המשוערת. זה בעצם אומר: בסך הכל החזאים היו גרועים יותר בניבוי התוצאה במדינות מאוכלסות יותר מאשר במדינות קטנות יותר. (הערה צדדית: אפילו התחזיות המדויקות ביותר השנה הצליחו לרעה יותר על ציון בריר מאשר כל אחת מהתחזיות המפורסמות בשנת 2012 , בחירות עם הרבה פחות הפתעות.)

מדד נפוץ נוסף, ה- כלל ניקוד לוגריתמי - מה שמטיל עונש גדול עוד יותר על ביטחון לא במקומה - מייצר דירוגים דומים בחלק העליון והתחתון, עם כמה משמרות באמצע החבילה, ומענישקוס יומיתוספת עבורו שניות קיצונית על קלינטון במישיגן :

הערה: כדי להסביר את העיגול, ציוני היומן למעלה רואים את כל 0% הסיכויים להיות 0.01% (או 1 מתוך 10,000) סיכויים.

אם מסתכלים על תחזיות החזאים לאורך זמן, אפשר לראות את התחזית של FiveThirtyEight נפרדת משאר החבילות בתחילת נובמבר:

חיזוי ההצבעה

ברור שהסקרים לא ייצגו את תמיכתו של טראמפ. אך איזו תחזית ניבאה את מניות ההצבעה ברמת המדינה בצורה המדויקת ביותר? זו שאלה קצת יותר קשה לענות עליה, כי החזאים ייצגו את מרווח הניצחון הצפוי של טראמפ בדרכים מעט שונות. אנו יכולים לקבץ את התחזיות לשני סוגים, עם חפיפה מסוימת:

  • תחזיות המאפשרות חישוב הציפיות של טראמפשולי הניצחון של נקודת אחוזעל קלינטון, בין כל הקולות. קבוצה זו מכילה FiveThirtyEight, PollSavvy, ה-ניו יורק טיימס, קונסורציום הבחירות בפרינסטון, והאפינגטון פוסט.

  • תחזיות המאפשרות חישוב הציפיות של טראמפחלק מההצבעה הדו-מפלגתית(כלומר, לא כולל ג'ונסון, שטיין ומק'מלין). קבוצה זו מכילה FiveThirtyEight, PollSavvy,קוס יומי, Kremp /צִפחָה, ודסארט והולברוק. (PredictWise לא ערכה תחזיות של שיתוף הצבעות).

עבור כל תחזית מדינת נשיאות - לא כולל DC (שחלק מהתחזיות לא העריכו) ויוטה (שבה חזאים נקטו גישות שונות למועמדותו של מק'מלין) - חישבנו את שגיאת שורש הריבועי ממוצעת מבין השוליים החזויים של החזאים לעומת התוצאות בפועל. (חלק מהמדינות עדיין לא דיווחו במלואן על הצבעותיהן, אך נראה שהרווחים הנוכחיים של כל מרוץ יציבים. אנו נעדכן את הפוסט כשיגיעו לספירות הגמר.)

בקרב הקבוצה הראשונה, FiveThirtyEight השיגו את הציונים הטובים ביותר (מספרים קטנים יותר טובים יותר):

בין השנייה, FiveThirtyEight הצליח גרוע יותר, בין השאר מכיוון שהוא העריך את תמיכתו של טראמפ במעוזים הרפובליקנים כמו מערב וירג'יניה ודרום דקוטה במידה רבה יותר מאשר למשל,קוס יומיעשה:

מירוץ הסנאט

רבים מהחזאים פרסמו תחזיות גם למרוצי הסנאט השנה. הטבלה שלהלן מראה כיצד הם קלעו ב -32 המרוצים שדרגנו. (לא דירגנו את מרוץ הסנאט של קליפורניה, שהעמיד שני דמוקרטים אחד נגד השני, או את לואיזיאנה, שהייתה מבחינה טכנית ראשוני.)

כאן, FiveThirtyEight וה-ניו יורק טיימסהוביל את החבילה, אם כי הדירוג המדויק תלוי באופן שבו אתה מבקיע אותו. על פי ציוני ברייר, מודל הסקרים פלוס של FiveThirtyEight הוציא אתפִּי. אבל כלל הניקוד הלוגריתמי קיבל בדיוק מספיק עונש נוסף נגד הסקרים פלוס-על ביטחון עצמי יתר בסיכוייו של ראס פיינגולד בוויסקונסין-לתתפִּיהמקום העליון.

זהו לשנה זו.