אני מניח שכולכם יודעים מה קורה/קרה בבחירות בארה”ב בשנת 2020. תהליך ספירת הקולות נמשך על פני מספר ימים, וכל מה שאפשר לעשות זה לעקוב אחרי התהליך: מי מוביל הספירה באיזו מדינה ובכמה. דוגמה אקראית מבוקר כתיבת שורות אלה: הכותרת של כלכליסט היא “הדרמה בארה”ב: כמעט שוויון בפנסילבניה ובג’ורג’יה, טראמפ מצמצם הפער באריזונה“.
יש נקודה חשובה שמשום מה מתעלמים ממנה: ההצבעה הסתיימה, ותוצאות הבחירות כבר נקבעו. רק שאנחנו עדיין לא יודעים מי ניצח כי לא סיימו לספור את כל הקולות. (( איזה קולות סופרים? זו שאלה אחרת שחורגת מתחומי העניין של הבלוג הזה)).
כל הדרמה הזו הזכירה לי בעיה ישנה מסוף המאה ה-19, שנקראת פשוט “בעיית הבחירות” (The ballot problem). הניסוח מאוד פשוט. שני מועמדים מתחרים בבחירות. אם מוציאים את פתקי ההצבעה מהקלפי זה אחד זה באופן אקראי, מה הסיכוי כי המועמד שקיבל את רוב הקולות יוביל לאורך כל מהלך הספירה?
הקישור שהופיע בפיסקה הקודמת יוביל אתכם לעמוד בויקיפדיה שבו תוכלו לקרוא על ההיסטוריה של הבעיה הזו, ועל כל מיני דרכים שנמצאו כדי לפתור אותה. אפשר למשל לנסות לרשום/לספור את כל המהלכים האפשריים של ספירת הקולות, ואת כל המהלכים האפשריים שבהם המנצח מוביל לאורך כל הספירה. אפשר להשתמש באינדוקציה מתמטית. הפתרון המקורי השתמש בנוסחת נסיגה. אני רוצה להציג כאן פתרון אחר שמבוסס על הפתרון של המתמטיקאי הצרפתי Désiré André.
סיפורנו מתחיל בעיירה ציורית במרכז אילינוי, שם מתגוררים כמה אלפי אנשים, ויש בה רק קלפי אחת. הם בוחרים באחד משני המתמודדים לנשיאות, בואו נקרא להם ג’ו ודונלד. כל קשר לפוליטיקה מקרי לחלוטין. בחרתי בשם ג’ו מכיוון שכאשר התגוררתי בארה”ב האמריקאים הכירו אותי בשם ג’ו, ובשם דונלד כי בין היתר יש לי אוסף מפואר של כ-150 ברווזים.

נניח שג’ו קיבל A קולות, ודונלד קיבל B קולות, ובאופן מסתורי אנחנו יודעים את הערכים המספריים של A ו-B לפני שהתחילה ספירת הקולות, ואנחנו גם יודעים כי A גדול מ-B, כלומר ג’ו ניצח. מה הסיכויים שג’ו יוביל לאורך כל תהליך ספירת הקולות?
יש מספר תרחישים אפשריים. נתחיל במקרה הכי קל: הפתק הראשון שהוצא מהקלפי הוא של דונלד. דונלד מוביל, ולכן ג’ו לא מוביל לאורך כל הספירה. הסיכוי לתרחיש הזה הוא B/(A+B).
עכשיו בואו נשים לב כי מכיוון שג’ו ניצח, אם דונלד מוביל בשלב מסויים, אז בנקודת זמן כלשהי לאחר מכן ייווצר שיוויון קולות, כי ג’ו קיבל יותר קולות. הנה דוגמה לתרחיש אפשרי שבו זה קורה:
מספר הקולות שנספרו | למי ניתן הקול | היתרון של ג’ו |
1 | דונלד | 1- |
2 | דונלד | 2- |
3 | דונלד | 3- |
4 | ג’ו | 2- |
5 | דונלד | 3- |
6 | דונלד | 4- |
7 | ג’ו | 3- |
8 | ג’ו | 2- |
9 | ג’ו | 1- |
10 | ג’ו | 0 |
מה שקורה אחר כך לא ממש משנה. כל תרחיש שבו הקול הראשון הוא קול לדונלד מגיע בנקודה כלשהי לשוויון בספירה, וההסתברות לתרחיש הזה היא כאמור B/(A+B) . אפשר לתאר את התרחיש הזה בגרף הבא:

מה קורה אם הקול הראשון שנספר ניתן לג’ו? כאן ג’ו מוביל בתחילת הספירה, ולאר מכן יש שתי אפשרויות: או שג’ו ימשיך להוביל לאורך כל הספירה, או שבשלב מסויים ייווצר שיוויון בקולות.
בואו נוסיף לגרף שלנו תרחיש אפשרי שבו ג’ו מתחיל להוביל, אבל לאחר מכן הספירה מגיעה לשוויון:

אני לא בחרתי את התרחיש הזה באופן מקרי! התרחיש השני (הכחול) הוא השיקוף של התרחיש הראשון (האדום). למעשה, לכל אחד מהתרחישים שבהם דונלד מוביל בתחילת הספירה (לאחר שהקול הראשון נספר), יש תרחיש מקביל שבו ג’ו מקבל את הקול הראשון שנספר והספירה מגיעה לשוויון. גם ההיפך נכון: לכל אחד מהתרחישים שבהם ג’ו מוביל בתחילת הספירה (לאחר שהקול הראשון נספר) והספירה מגיעה בשלב כלשהו לשוויון, יש תרחיש מקביל שבו דונלד מקבל את הקול הראשון שנספר ואז הספירה חייבת להגיע לשוויון.
לכן ההסתברויות לשני סוגי התרחישים – תרחיש שבו דונלד מוביל בתחילת הספירה, ותרחיש שבו ג’ו מוביל בתחילת הספירה אך אינו מוביל לאורך כל הספירה – שוות, וכל אחת מהן שווה ל- B/(A+B). אם נחבר אותן נקבל את ההסתברות לתרחיש שבו ג’ו אינו מוביל לאורך כל הספירה, והסתברות זו שווה ל- 2B/(A+B).
מכאן קל לחשב כי ההסתברות שג’ו יוביל לאורך כל הספירה שווה ל-1 פחות ההסתברות שהוא לא יוביל לאורך כל הספירה, כלומר ל- (A+B)/(A-B).
שימו לב כי התוצאה היא בעצם ההפרש בין מספרי הקולות שניתנו למועמדים חלקי סך כל הקולות. מעניין, אבל לא בהכרח אינטואיטיבי.
אתם מוזמנים להמשיך להחזיק אצבעות למען המועמד המועדף שלכם.
השאלה המעניינת היא – מה תוחלת מספר המהפכים שאתה מצפה להם. או, כמה פעמים, בתוחלת, אתה מצפה לקבל שוויון?
בהחלט מעניין למדי (ואף אקטואלי…)
עוד טרם מחשבה שנייה והעמקה בקישור שניתן, אני רק אציין סתם את הדוגמא הפשוטה שנניח B=1.
אז אכן קל לראות גם אינטואיטיבית שהסיכוי שמועמד המנצח יוביל לאורך כל הדרך שווה לסיכוי שאותו קול בודד למתמודד B לא ייצא באחד משני הפתקים הראשונים, וזה הרי בדיוק מה שיוצא בביטוי “2B חלקי A+B” כאשר B=1.
תןדה על ההסבר היפה.
מדהים לראות בכל פעם מחדש כיצד חישובי הסתברות משונים מובילים לתשובה. זה אכן מתאים לתיאור ההסתברות כ”ספירה ללא ספירה”.
מה הסיכוי שבכל 4 המדינות בהן מוביל דונלד, מהן אחת בהובלה של 14%.
בכולן תהיה הפסקת ספירה.
ובכולן מיד בחידוש הספירה קרוב ל100% מההצבעות לג’ו?
עו”ד של דונלד שכרו מומחים לסטטיסטיקה ומתמתיקאים שחישבו הסתברות של 1 ל52מיליון.