ברשימה הקודמת תיארתי תרגיל חישובי שביצעתי, ומטרתו הייתה לנסות להעריך מה ההסתברות כי קול בודד ישנה את תוצאת הבחירות. הרשימה זכתה לתגובות רבות וגם לביקורות רבות, והתייחסתי התייחסות חלקית אליהן בתגובות לתגובות. ברשימה זו אשתדל לענות באופן מפורט יותר לשואלים ולמבקרים. חילקתי את התגובות לשתי קטגוריות: שאלות לגבי התוצאות שהתקבלו ומשמעותן, ושאלות טכניות/סטטיסטיות.
שאלות לגבי התוצאות שהתקבלו ומשמעותן
הטענה החשובה ביותר היא כי תוצאות הבחירות לא נקבעות על ידי קול בודד אלא על ידי כלל הקולות, ולכן התשובה לשאלה האם להצביע צריכה לבוא מתחום תורת המשחקים ולא מתחום הסטטיסטיקה. אני מסכים בהחלט עם הטענה הזו. הרשימה לא נועדה לענות על השאלה האם להצביע, והחישובים שערכתי לא נותנים תשובה לשאלה זו אלא לשאלה ממוקדת מאוד. התשובה לשאלה האם כדאי להצביע בבחירות הרבה יותר מורכבת, ודנתי בה (באופן כללי ולא מעמיק) ברשימה קודמת. התרגיל החישובי שערכתי עונה לשאלה ספציפית ביותר: בהינתן תוצאה מסויימת של הבחירות, מה ההסתברות כי הוספת קול נוסף לאחת המפלגות תשנה את חלוקת המנדטים, ואין להסיק מתוצאותיו האם יש או אין טעם להצביע.
דובי שאל מה הסיכוי שהקול שלו יעביר מנדט מהגוש הנגדי אל הגוש שלו. התשובה המיידית היא כי הסיכוי הרבה יותר נמוך. התשובה היותר מעמיקה היא כי יש צורך להגדיר מהו גוש. קל אולי להעריך כי מפלגה כדוגמת הבית היהודי שייכת לגוש הימין, אבל האם אכן תתמוך מפלגה כזו בממשלה שיקים (אם יתבקש לכך על ידי הנשיא) בנימין נתניהו, והאם תצטרף לממשלה כזו? הם מישהו מוכן לערוב לכך שנפתלי בנט לא יצטרף לממשלה בראשות יחימוביץ? או ש”ס? מה בקשר ליהדות התורה – האם הם שמאל או ימין? בלד היא מפלגה לאומית ערבית – לא ימין יהודי אבל בהחלט ימין מדיני ערבי. לדידם הליכוד והעבודה חד הם. לאיזה גוש יש לשייך אותם? קטונתי מלענות על כל השאלות האלה, ומשום כך איני יכול לענות על השאלה של דובי. זיו ניסח את אותה שאלה באופן מדוייק יותר: “לאיזו מפלגה, מבין מרצ, העבודה, יש עתיד, התנועה וחד”ש, אני צריך להצביע כדי שיהיה כמה שיותר סיכוי שאני ‘אגנוב’ מנדט מהליכוד, ש”ס, יהדות התורה או הבית היהודי?”. לא ערכתי את החישובים, אבל ברור למדי שהסיכוי כי מאורע כזה יקרה הינו קלוש, עקב הפער הגדול (בתחזית המנדטים) בין שני הגושים שהגדיר מתן, כ-20 מנדטים שהם יותר מחצי מליון קולות קולות.
אני כן יכול לענות על השאלה המשתמעת מתגובתו של מתן ק: האם רוב רובו העצום של הסיכוי להעביר מנדט הוא בין שתי רשימות שיש ביניהן הסכם עודפים? זה נראה כך כיוון שההסתברויות שחושבו דומות לכל זוג מפלגות הקשורות בהסכמי עודפים. הדמיון בהסתברויות נובע משיטת חישוב המנדטים, בה מאחדים כל זוג מפלגות שכרתו בינן הסכם עודפים ל-“מפלגת על” אחת, לצורך חלוקת המנדטים. עם זאת, העובדה שיש הסבר לדמיון בהסתברויות בזוגות המפלגות אינה אומרת כי מתן בהכרח טועה. בדקתי את תוצאות הסימולציה, והתברר כי מתן צודק בתחושתו, ואכן הסיכוי להעביר מנדט מרשימה לרשימה אחרת שאנה קשורה עימה בהסכם עודפים הינו אפסי.
שאלות טכניות/סטטיסטיות
טענה שהועלתה על ידי מספר מגיבים היא שהחישובים נערכו על סמך הערכה מסויימת של מספר המנדטים הצפויים לכל מפלגה, ולא נערך חישוב לגבי התפלגויות מנדטים אחרות. כמו כן נטען כי העובדה כי התפלגות המנדטים שבחרתי הייתה קבועה (בכל 2 מליון הסימולציות השתמשתי באותה התפלגות מנדטים כדי לסמלץ את מספר הקולות לכל מפלגה) גרמה להגדלה של ההסתברויות שחישבתי. זה נכון באופן עקרוני – ככל שההנחות מכילות יותר שונות, גם ההסתברויות למאורעות ספציפיים יקטנו. הסיבה פשוטה – יש יותר מאורעות (ותאמינו או לא, מרחב המדגם בסימולציה הוא סופי), ולכן ההסתברויות של המאורעות באופן כללי יותר קטנות, כי צריך לחלק את “עוגת ההסתברות” להרבה יותר פרוסות. השאלה היא לכן לא האם הייתה מספיק שונות בהנחות, אלא האם ההנחות שלי מתאימות לשאלה ששאלתי. השאלה הייתה פשוטה: בהינתן תוצאה מסויימת של הבחירות, מה ההסתברות כי הוספת קול נוסף לאחת המפלגות תשנה את חלוקת המנדטים. הדגש הוא על המלים “תוצאה מסויימת”. הפירוש שנתתי למלים אלה הוא כי וקטור חלוקת המנדטים נתון וקבוע, והתוצאה שקיבלתי תקפה כמובן רק בהנחה זו. עם זאת, ערכתי מספר בדיקות. באחת מהן הוספתי בכל סימולציה עד פלוס/מינוס חצי מנדט לכל מפלגה (על ידי הוספת משתנה מקרי אחיד על הקטע בין -0.5 ל-0.5 למספר המנדטים של כל מפלגה, ולאחר מכן נרמול התפלגות המנדטים כך שיתקבל שוב וקטור הסתברות). בבדיקה נוספת לא הנחתי כלל התפלגות מנדטים, ובחרתי בכל סימולציה את וקטור ההסתברויות להתפלגות מולטינומית מתוך התפלגות דיריכלה אחידה. בשני המקרים קיבלתי תוצאות דומות, וההסתברויות היו אכן בסדר גודל של 1 ל-10000, כצפוי במקרה בו אין כל אינפורמציה מוקדמת על תוצאת הבחירות (וסקרתי מספר עבודות שהגיעו למסקנה דומה ברשימה שכתבתי על הטיעונים בעד הצבעה בבחירות).
טענה מעניינת העלה הקורא ליר: המודל שבניתי מניח את התפלגות המנדטים הנתונה לגבי בעלי זכות הבחירה שהחליטו להצביע, והסימולציה תחילה קובעת את מספר המצביעים (לפי ההנחה על אחוז ההצבעה) ואח”כ קובעת איך יתפלגו הקולות בין המצביעים בפועל. זה מתאר מצב בו אדם תחילה מחליט האם להצביע, ובמקרה שהאזרחית מחליטה להצביע, היא מחליטה לאחר מכן לאיזה מפלגה תיתן את קולה. ליר טוען כי המצב בפועל שונה: תחילה מחליטים באיזה מפלגה לתמוך, ולאחר מכן מתקבלת ההחלטה האם ללכת לקלפי ולהצביע בפועל עבור המפלגה או לוותר על הזכות להצביע. ליר טוען, ובצדק, שלפי מודל ההחלטה שלו יתקבלו תוצאות אחרות. תשובתי היא שאני מסכים כי המודל שלי פשטני במידה מסויימת, אך כך גם המודל שלו. תהליך ההחלטה האם להצביע ובעד מי הוא מורכב למדי. אני מניח שחלק מהאנשים פועלים לפי המודל הראשון שאני הצעתי (זה מודל ההחלטה שלי, דרך אגב), ואנשים אחרים פועלים לפי המודל של ליר. לא מן הנמנע כי לאנשים רבים יש עץ החלטות מורכב יותר. המודל שבחרתי נראה לי סביר, בין היתר בגלל העובדה שהסקרים (שתוצאותיהם שימשו כקלט לסימולציה שלי) משקפים מודל החלטה כזה (תחילה הסוקר שואל האם בכוונת הנסקר להצביע בבחירות, ורק במקרה של תשובה חיובית שואל הסוקר לאיזה מפלגה בכוונת הנסקר להצביע). כמו כן, אין תשובה חד משמעית לשאלה האם אחוז ההצבעה משתנה בין התומכים של מפלגות שונות, לא כל שכן נתונים שיאפשרו סימולציה על סמך המודל הזה. אם יש הבדלים משמעותיים באחוזי ההצבעה בין התומכים של מפלגות שונות, התוצאות עשויות להיות שונות. אם אין הבדלים משמעותיים התוצאות יהיו דומות.
ליר טען גם כי ההתבססות שלי על מודל של התפלגות מולטינומית שגוי, וכי יש להשתמש במודל של התפלגות נורמלית. אני דוחה טענה זו מכל וכל. התפלגות מספרי הקולות של המפלגות היא מולטינומית מעצם הגדרתה, ולכן סימולציה של התפלגות מולטינומית היא הדרך הנכונה. יש לזכור גם כי מספרי הקולות של המפלגות אינם בלתי תלויים, אלא יש בינם מתאם שלילי (כשמפלגה אחת מקבלת הרבה קולות, האחרות בהכרח יקבלו פחות, ולהיפך). בסימולציה כפי שליר מציע אין תלות בין מספרי הקולות שמקבלת כל מפלגה.
התוצאות לגבי בלד נראו לחלק מהמגיבים מוזרות. הנה הסבר מהיר: ב-2 מליון הסימולציות שנערכו, לא היה אף לא מקרה אחד כי הוספת קול נוסף לבלד העלתה את מספר המנדטים שקיבלה מפלגה זו. האמד הנקודתי למאורע כי הצבעה לבלד תשנה את תוצאת הבחירות הוא לכן אפס חלקי 2 מליון, כלומר אפס. נשאלת השאלה: האם העובדה שלא ראינו מאורע מסויים מעידה על כך שאין כל סיכוי שהמאורע יתרחש? כמובן שלא. לכן לא ציינתי לגבי בלד את ההסתברות הספציפית, אלא רווח סמך: ההסתברות למאורע קטנה מ-1 ל-667 אלף. רווח סמך זה הוא מקורב, ומבוסס על “כלל אצבע” המכונה בעגה הסטטיסטית “The rule of three“, ולפיו רווח סמך עליון למאורע שלא נצפה הוא 3 חלקי מספר התצפיות, ובמקרה שלנו 3 חלקי 2 מליון.
יש לי שאלה קצת אחרת, מה המשמעות שלהצבעה שלי למפלגה שלא תעבור את האחוז חסימה תלך לטובת מפלגה x.
נניח שאני מצביע לארץ חדשה והם בסופו של דבר לא יעברו את האחוז חסימה מה הסיכוי שזה יהיה הקול הנוסף שייתן לליכוד או לעבודה מנדט נוסף תוך הסתמכות על הסכמי העודפים כמובן.
מפלגה שלא עוברת את אחוז החסימה אינה משתתפת בחלוקת המנדטים, ולכן המפלגה שחתמה איתה על הסכם העודפים אינה נהנית מהעודפים. כך קרה עם קדימה בבחירות הקודמות שחתמה על הסכפ עודפים עם מימד.
נדמה לי שלא הבנת את השאלה של אילן. הרי הוא שאל מה הסיכוי שהקול האבוד שלו יתן מנדט נוסף לליכוד או לעבודה. כלומר, הוא לא מתייחס להסכמי עודפים של ארץ חדשה עם מפלגה אחרת (ברור שאין להם הסכם עודפים עם הליכוד או עם העבודה, וגם אם היה, השאלה שלו היתה לא הגיונית, אפילו אם היה מניח בטעות שגם מפלגה שעוברת את אחוז החסימה מעבירה את הקולות שלה למפלגה איתה היא בהסכם).
אני מניח שהשאלה שלו שקולה לשאלה מה הסיכוי שאי-ההצבעה תוסיף מנדט לליכוד לעומת העבודה. נדמה לי שהתשובה תלויה בשאלה לאיזו מפלגה שעוברת את אחוז החסימה הוא היה מצביע, אם היה נמנע מלהצביע לארץ חדשה. ואז, כבר חישבת את הסיכויים לגבי הליכוד ולגבי העבודה, ולגבי כל מפלגה אחרת. אם הסיכויים האלו נמוכים דיים, אז הוא יכול להרגיש יותר שליו אם הוא מסכן את קולו בהצבעה למפלגה שסביר להניח שלא תעבור את אחוז החסימה.
אגב, אני חושב שהמודל שבו יש תוספת אקראית של לפחות פלוס\מינוס חצי מנדט הוא המודל הנכון, כי קשה להניח בטחון ברמה של כ-10000 קולות מסקרים, בעיקר כי משתנה אחוז ההצבעה הוא קשה מאוד לחיזוי.
במקרה כזה, האם הסימולציה נחוצה בכלל?
שאלה מעניינת נוספת היא האם 1 ל-10000 הוא סיכוי גבוה או נמוך, בהינתן הרווח (תוספת מנדט למפלגה שלי). יהיה מעניין לחשוב איך בני-אדם יכולים להעריך זאת (רובנו לא צריכים, יש רווחים פסיכולוגים רבים מההצבעה, בלי קשר לשאלה אם השפעתי או לא).
החישובים שיוסי עשה הינן יותר תרגיל מחשבתי מחישוב מדויק של ההסתברויות האם קולי יעשה הבדל או לא.
וככה צריך להתיחס לתוצאות.
לדעתי התוצאה העיקרית היא שההסתברות שקולי חשוב אינה כלל מבוטלת אם חושבים על ה-4 שנים העתידיים (עם הבעיות כלכליות, בטחוניות, וכו’).
בכל מקרה מאוד נהנתי לקרוא את הפןסט והתגובות.
F