ארכיב עבור תגית תורת המשחקים

משחקי הכנסת

אני מניח שכולכם מודעים למצב הפוליטי הנוכחי, שבו הגוש המעוניין להקים ממשלה שבראשה לא יעמוד בנימין נתניהו מורכב ממספר לא קטן של מפלגות בגודל בינוני עד נמוך. במצב הזה, מספר אנים טוענים כי עליהם לקבל את המנדט להרכבת הממשלה ולעמוד בראשה, וביניהם יאיר לפיד (יש עתיד, 17 חברי כנסת), בני גנץ (כחול לבן, 8 חברי כנסת) ונפתלי בנט (ימינה, 7 חברי כנסת).

אני לא הולך לנהל כאן דיון פוליטי, דעותיי הפוליטיות ידועות. הפוסט הזה נכתב כי מישהו הזכיר לי היום בטוויטר את הפוסט משחקי המשילות שכתבתי לפני כשבע שנים, ועסק במושג "ערך שאפלי", המחשב את כוחן היחסי של המפלגות בהרכבת קואליציות אפשריות. לא אחזור כאן על כל ההסבר, אבל אתן דוגמה קיצונית שתבהיר את המצב: נניח שבכנסת מיוצגות 3 מפלגות. לשתיים מהן יש 59 ח"כים כל אחת, ולשלישית שני ח"כים. במצב הזה כל שתי מפלגות יכולות להקים קואליציה ולהשאיר את השלישית באופוזיציה, ולכן ערך השאפלי של כל מפלגה הוא שליש.

אבל יש כאן טוויסט: ערך שאפלי הוא סימטרי ואינו מבדיל בין ימין לשמאל. נניח ששתי המפלגות הגדולות הו מפלגת ימין ומפלגת שמאל, ואינן יכולות להגיע להסכמה על קואליציה ביניהן. המפלגה הקטנה היא מפלגת מרכז, ויכולה להצטרף לכל אחת משתי המפלגות האחרות להקמת קואליציה. במילים אחרות: היא לשון המאזניים. זה נותן לה יתרון על שתי המפלגות האחרות, ולכן היא תובעת לעצמה את תפקיד ראש הממשלה. מה עושים?

על פניו, התביעה מוצדקת, לפחות באופן תיאורטי – לתורת המשחקים יש גם מושגי פתרון אחרים שיתנו לה את הבכורה. באופן מעשי? כבר היו דברים מעולם.

אז הנה: בכנסת התיאורטית שלנו הוקמה קואליציית ימין-מרכז או שמאל-מרכז לפי טעמכם, ובראשה הממשלה עומד מנהיג מפלגת המרכז. איך ממשיכים מכאן? אפשרות אחת היא להקים ממשלה פריטטית, כמו ממשלת נתניהו-גנץ. למרבה הצער התברר שזה מתכון לצרות, גם בתוך הממשלה וגם בכנסת. המפלגה הקטנה ככל הנראה לא תצליח למצות את כל ערך השאפלי שלה, כי, מה לעשות, ערך שאפלי מתייחס לנקודה ספציפית בזמן, ואילו המדינה צריכה להמשיך להתנהל בהובלת הממשלה והכנסת גם לאחר הקמת הקואליציה.

עד כאן הדיון הפילוסופי, ועכשיו אשחק קצת במספרים, באדיבות מחשבון ערך השאפלי של דניס ליץ' מאוניברסיטת וורוויק. אבל לפני שנתחיל, עלי להזהיר אתכם כי אם אתם מצפים לתובנות חדשות על המצב הפוליטי, אל תעצרו את נשימתכם. מה שתראו כאן זה רק משחקים במספרים שימחישו את יתרונות והחסרונות של ערך שאפלי כמדד להערכת כח פוליטי.

הנה ערכי שאפלי של כל אחת ממפלגות הכנסת:

מפלגהחברי כנסתערך שאפליכח נומינלי
הליכוד3030.2%25.0%
יש עתיד1714.0%14.2%
ש"ס96.6%7.5%
כחול לבן86.3%6.7%
ימינה75.4%5.8%
העבודה75.4%5.8%
יהדות התורה75.4%5.8%
ישראל ביתנו75.4%5.8%
הציונות הדתית64.5%5.0%
הרשימה המשותפת64.5%5.0%
תקווה חדשה64.5%5.0%
מרצ64.5%5.0%
רע"מ43.5%3.3%

אפשר לראות כאן כל מיני דברים מעניינים. למשל מספר חברי הכנסת של הליכוד, 30, הוא 25% מסך חברי הכנסת, אך ערך השאפלי של הליכוד גבוה יותר וערכו כ-30%. ערך השאפלי של יש עתיד שווה בערך לכוחה הנומינלי בכנסת, שהוא כ-14%. לכל שאר המפלגות ערך שאפלי נמוך יותר מהכוח הנומינלי.

כל זה קורה לפני שמתחילות להיווצר קואליציות. כרגע, למיטב ידיעתי יש לנו שתי קואליציות: גוש אחד הוא גוש הימין שכולל את הליכוד, ש"ס, יהדות התורה והציונות הדתית, בסך הכל 52 חברי כנסת.

הקואליציה השניה היא "גוש השינוי", שלא ברור מהו. הגוש הזה כולל את יש עתיד, ישראל ביתנו, העבודה, מרץ, תקווה חדשה, וביום טוב גם את כחול לבן, ומונה 43 או 51 חברי כנסת. מצבה של הרשימה המשותפת לא ברור. ברור לי שהיא תתנגד לממשלה בראשות גוש הימין, אבל האם היא תוזמן להצטרף לממשלה בהובלת גוש השינוי? האם היא תתמוך גם אם לא תצורף? האם היא תימנע בהצבעה? לצורך הדיון בלבד אני אצרף את כחול לבן ואת הרשימה המשותפת לגוש השינוי, שימנה לכן 57 חברי כנסת.

ועשיו נותרנו עם ימינה ורע"ם, ששומרות את הקלפים צמודים לחזה. כל זה מוביל אותנו לכנסת עם ארבעה גושים/סיעות, והנה טבלת ערכי השאפלי שלהם:

גוש/מפלגהחברי כנסתערך שאפליכח נומינלי
שינוי5750.0%47.5%
ימין5216.7%43.3%
ימינה716.7%5.8%
רע"ם416.7%3.3%

כמובן שקואליציה מוקמת בסופו של דבר לפי מספר חברי הכנסת ולא לפי ערכי שאפלי, ולכן השאלה הגדולה היא האם גוש השינוי יצליח לנצל את ערך השאפלי המוסף שלו (2.5%) כדי לצרף אליו את רע"ם או את ימינה ולהקים ממשלה ((וזאת בהנחה שאנשי ימין בגוש השינוי יסכימו לשיתוך הרשימה המשותפת ורע"ם בקואליציה בצורה כזו או אחרת)) ? הוא יוכל לעשות את זה אם הגוש יפעל כגוש.

אבל מה קורה כשבגוש השינוי אין הסכמה? כרגע הנושא המרכזי הוא המלצה לנשיא לגבי המועמד לקבלת המנדט. למיטב ידיעתי ((לא שמעתי חדשות מאז הבוקר)) חלק מתכוונים להמליץ על יאיר לפיד בפני הנשיא, גנץ חושב שהוא האיש הראוי, ולא ברור מה חושבים בתקווה חדשה וברשימה המשותפת. ולכן, במשחק האחרון לפוסט הזה אפצל את הגוש, ונראה מה קורה:

גוש/מפלגהחברי כנסתערך שאפליכח נומינלי
ימין5250.0%43.3%
שינוי מצומצם3713.3%30.8%
כחול לבן810.0%6.7%
ימינה76.7%5.8%
הרשימה המשותפת66.7%5.0%
תקווה חדשה66.7%5.0%
רע"מ46.7%3.3%

התוצאה הלא מפתיעה: כאשר כחול לבן ותקווה חדשה עדיין אינן מוכנות להמליץ לנשיא להטיל את המנדט על יאיר לפיד, הן מחזקות את כוחן היחסי, אבל המחיר הוא חיזוק משמעותי של גוש הימין. יותר מכך, אם הן לא ימליצו להטיל את המנדט על יאיר לפיד, הרי שעל פניו (או לפחות על פי ערך שאפלי) האדם בעל הסיכוי הטוב ביותר להקים ממשלה הוא מנהיג גוש הימין.

האם כל זה טוב או לא? אני מניח שכל אחד יסיק מסקנות אחרות בהתאם לדעותיו הפוליטיות. לכן אני מבקש מכולם לא לקיים את הדיון הפוליטי כאן.

על מכבי תל אביב ורוג’ר פדרר

האמת, לא ראיתי את המשחק בין מכבי תל-אביב וצסק"א מוסקבה בפיינל פור 2014 של היורוליג. אני לא צופה במשחקי כדורסל מאז הזכיה האחרונה של שיקגו בולז באליפות ה-NBA, ב-1998. בלי מיקל ג'ורדן, אני פשוט משתעמם. אבל על מה שקרה במשחק של מכביי שמעתי גם שמעתי.

למי שלא שמע: כשקבוצתו בפיגור של 15 נקודות בסוף הרבע השלישי של המשחק, הורה דייויד בלאט,  מאמן מכבי, לשחקניו לנסות ללכת על כל הקופה: לעבור למשחק מהיר, הגנה אגרסיבית, וזריקות לשלוש נקודות, תוך תקווה שהיריבה תעשה יותר טעויות מהרגיל.

במונחי ספורט, אולי זה היה הימור. במונחים סטטיסטיים, בלאט החליט להגדיל את השונות. לאחר 3 הרבעים הראשונים, המשחק כבר לא היה שקול. האסטרטגיה של בלאט הגדילה את ההסתברות לתבוסה: המשחק היה יכול להגמר ב-30 נקודות הפרש לטובת צסק"א, אבל במשחק של הכל או לא כלום, זה באמת לא משנה אם ההפסד הוא בהפרש של 15 נקודות או 30 נקודות. לעומת זאת, לקיחת הסיכון גם אפשרה הסתברות לרבע שייגמר ב-16 נקודות הפרש לטובת מכבי, בניגוד לאסטרטגיות של 3 הרבעים הראשונים במשחק שמהלכם לא היה טוב במיוחד מנקודת הראות של הצהובים.

איך זה קשור לרוג’ר פדרר?

הסבר קצר על משחק הטניס. המשחק הטיפוסי מורכב משלוש מערכות, וכדי לנצח על הזוכה לנצח בשתי מערכות מתוך ה-3 (( 1. ישנם טורנירים בהם המנצח נקבע בשיטת הטוב מ-5 מערכות)). כל מערכה מורכבת ממשחקונים, וכדי לנצח במערכה יש לנצח ב-6 (ולפעמים 7 או יותר) משחקונים. כך יכול להווצר מצב מוזר: שחקן שהפסיד 6:1 במערכה הראשונה (כלומר ניצח במשחקון אחד והפסיד ב-6), וניצח בשתי המערכות הבאות בתוצאה 6:4, זכה המשחק כי ניצח ב-2 מערכות מתוך ה-3, אבל ניצח בסך הכל ב-13 משחקונים, בעוד שיריבו ניצח  ב-14 משחקונים. תופעה זו, המזכירה את פרדוקס סימפסון,  קורה בערך ב-5% ממשחקי הטניס המקצועניים (( 2. Wright, B., Rodenberg, R. M., & Sackmann, J. (2013). Incentives in Best of N Contests: Quasi-Simpson's Paradox in Tennis.International Journal of Performance Analysis in Sport13(3), 790-802. )). דבר דומה קרה גם במשחק הכדורסל: צסק"א ניצחה ב-3 מתוך 4 רבעי המשחק, אך הפסידה במשחק כולו.

מסתבר כי אלוף העולם בהפסדים ב-"משחקי סימפסון" בענף הטניס הוא לא אחר מאשר רוג’ר פדרר, אחד מגדולי הטניס בכל הזמנים. הוא שיחק ב-28 משחקים בהם המפסיד זכה ביותר משחקונים מאשר המנצח. המאזן שלו? 24 הפסדים, רק 4 ניצחונות.

מעניין לציין כי השחקן בעל המאזן הטוב ביותר במשחקים כאלה הוא ג'ון אייזנר , עם מאזן של 19 נצחונות ו-5 הפסדים. אייזנר זכור גם כמנצח במשחק הארוך ביותר בהיסטוריה, בטוניר וימבלדון ב-2010, בו ניצח את יריבו בתוצאה 70:68 במערכה החמישית. במשחק הנ"ל, אייזנר זכה ב-24 נקודות פחות מאשר יריבו. (( 3. כדי לנצח במשחקון, יש לצבור יותר נקודות מאשר היריב)) אייזנר מבסס את כל משחקו על חבטת הגשה חזקה במיוחד שמותירה את היריב ללא מענה במקרים רבים. כאשר ליריב יש מענה, לאייזנר בדרך כלל אין.

למי שמשחק מול פדרר אין הרבה סיכויים לנצח; פדרר ניצח ביותר מ-80% המשחקים בהם השתתף. מעבר לכך – שיטת הניקוד בטניס מוטה לטובת השחקן הטוב יותר. יתרון קטן על היריב מתורגם על ידי שיטת הניקוד להבדל משמעותי בסיכויי הניצחון במשחק. הדרך הכמעט יחידה לנסות לנצח את פדרר היא להגדיל את הסיכון על ידי משחק אגרסיבי. אתה עלול להפסיד שתי מערכות בתוצאה 6:0, אבל יש לך גם סיכוי להפסיד פחות משחקונים מאשר בדרך כלל, ואם תנצח מספיק משחקונים, אולי זה יספיק לך לנצח בשתי מערכות צמודות, ואז למי איכפת מהמערכה בה פדרר הביס אותך?

משחקי המשילות

לפני כשבוע חוקקה הכנסת את "חוק המשילות", שהוא למעשה סדרת תיקונים למספר חוקי יסוד. אחד הסעיפים בחוק קבע כי אחוז החסימה בבחירות לכנסת יועלה מ-2% ל-3.25%, כלומר, מפלגה שתזכה בפחות מ-3.25% מסך הקולות הכשרים בבחירות, לא תקבל ייצוג בכנסת. לו היה אחוז החסימה בבחירות האחרונות לכנסת 3.25% ומספר הקולות שקיבלה כל מפלגה לא היה משתנה, הרי שרשימות חדש, בלד וקדימה לא היו נכנסות לכנסת, ושמונת המושבים שלהם היו מתחלקים בין המפלגות האחרות.

המוטיבציה לשינוי, כפי שהסבירו מציעיו, הייתה הרצון "לחזק את יכולת המשילות של הממשלה", כלומר להפחית את תלותה בסיעות קטנות ו-"סחטניות" (( 1. כמובן שבדברי ההסבר (קישור לקובץ rtf) הרשמיים נעשה שימוש במלים נמלצות יותר)). האם אכן יביא החוק לתוצאה המבוקשת? איך בכלל מודדים את כוחה של מפלגה? מהו כוחה של סיעת "קדימה" לה שני נציגים בכנסת?

בכנסת שלנו, למפלגה בת 59 מנדטים אמור להיות כח רב. נכון? לא בהכרח. אם יש בכנסת רק שתי מפלגות, לאחת 59 מנדטים ולשניה 61, הרי שכל הכח מרוכז בידי המפלגה השניה. היא לא זקוקה לשום עזרה מהמפלגה האחרת כדי להקים ממשלה. היא מחזיקה 100% מהכח, ומפלגת ה-59 מחזיקה 0% מהכח.

מה קורה בכנסת תיאורטית בה יש 3 מפלגות, שלכל אחת מהן 40 מנדטים? אם נתעלם משיקולי ימין ושמאל לרגע, ונניח כי כל שתי מפלגות יכולות לחבור יחד ולהותיר את השלישית באופוזיציה, נהיה מוכרחים להגיע למסקנה כי לכל שלוש המפלגות כח שווה, וכל אחת מהן מחזיקה ב-33 וליש אחוזים מהכח.

ומה קורה בכנסת תיאורטית בה יש 3 מפלגות, לשתיים מהן 50 מנדטים כל אחת, והשלישית היא מפלגה "קטנה" עם 20 נציגים בלבד?

שאלות דומות לאלה הטרידו את לויד שאפלי, מתמטיקאי אמריקאי. ב-1953, הציע פתרון לשאלות אלו, במסגרת עבודת הדוקטורט שהגיש לאוניברסיטת פרינסטון. "הערך של שאפלי", ותרומות משמעותיות רבות נוספות שתרם לתחום המתמטי הידוע בשם "תורת המשחקים" זיכו אותו בפרס נובל לכלכלה בשנת 2012. ברשימה זו אנסה להסביר את מושג וההגיון מאחוריו, ואראה כיצד ליישם אותו כדי לנתח את המשמעות המיידית של העלאת אחוז החסימה במסגרת "חוק המשילות".

אז הנה סיפור המסגרת בצורה פשטנית (( 2. כמובן שהבעיה ששאפלי דן בה הינה כללית יותר, כמו גם הפתרון שהציג. למעוניינים, הנה קישור למצגת (קובץ pdf) המכסה את הנושא בצורה טובה.)): יש לנו כנסת, ובה מפלגות בגדלים שונים, וצריך להקים קואליציה של 61 מנדטים לפחות כדי להקים ממשלה. מה הכוח של כל מפלגה במשא ומתן?

ראשית יש לשים לב כי יש שני סוגים אפשריים של קואליציות: כאלה שיכולות להקים ממשלה, וכאלה שלא. קואליציה של מפלגות שסך המנדטים שלהם עולה על 60 יכולה להקים ממשלה, ולכן שאפלי נותן לה ערך שרירותי השווה ל-1. קואליציה של מפלגות שסך המנדטים שלהם קטן מ-61 לא יכולות להקים ממשלה, ושאפלי נותן לקואליציות כאלה ערך שרירותי השווה ל-0. שימו לב כי הערך של הקואליציה אינו בהכרח שווה לכח שלה. הערך אומר אם הקואליציה יכולה להקים ממשלה או לא, אך יש ממשלות חזקות ויש ממשלות חלשות. בנוסף, הוא מניח מספר הנחות (אקסיומות) לגבי התכונות שפתרון (כלומר הערכת הכח של כל מפלגה בנפרד צריך לקיים):

ההנחה הראשונה היא שאיחוד לא יכול להזיק. אם יש שתי קואליציות של מפלגות, והן מחליטות להתאחד, הכח של הקואליציה המאוחדת לא יהיה קטן מסך הכוחות של כל אחת משתי הקואליציות לחוד, ואולי אף יגדל. בפרט, שתי מפלגות שיתאחדו יוכלו להגדיל את כוחן המשותף (( 3. לדוגמה, הברית בין יש עתיד והבית היהודי במשא ומתן הקואליציוני לאחר בחירות 2013 אפשרה לשתי המפלגות להשיג יותר הישגים פוליטיים מאשר לו היו מנהלות משאים ומתנים נפרדים מול הליכוד)). אתם בודאי מכירים את התופעה הזו בשם "הפרד ומשול". מתמטיקאים קוראים לתכונה כזו "סופר-אדיטיביות".

ההנחה השניה היא שלגולם אין ערך. גולם אינו יכול להשפיע על שום דבר. תחשבו על הכנסת שהתחלקה לשתי מפלגות עם 61 ו-59 מנדטים. מפלגת ה-59 היא גולם, ומפלגת ה-61 תקים ממשלה מבלי להתחשב ברצונותיה. הערך שלה הוא לכן אפס.

ההנחה השלישית היא קרויה הנחת הסימטריה. אם יש שתי מפלגות, שבכל מצב תורמות את אותה התרומה לכל קואליציה, אז הכח שלהן זהה. תחשבו על כנסת בה יש מפלגה אחת גדולה עם 59 מנדטים, ועוד כמה מפלגות קטנות, נניח, 4 מפלגות נוספות שלהן יש 2, 10, 20 ו-29 חברי כנסת. כדי להקים ממשלה, מפלגת ה-59 צריכה לצרף אליה לקואליציה רק אחת מבין 4 "הקטנות", ולהשליך את 3 הנותרות לאופוזיציה. ולא משנה באיזה מהן תבחר. "אתה אמנם ראש סיעה של 29 חברי כנסת, אבל אם תצטרף לממשלה, כל מה שתקבל זה תפקיד סגן השר לענייני גימלאים. לא מוצא חן בעיניך? הצעתי את אותו דיל גם לסיעת 'ישראל הקיקיונית'. תחליט מהר לפני שהם יקחו את זה ולא יישאר לך כלום". אולי התסריט הזה לא נראה לכם ריאלי, אבל זה בערך מה שקרה בשנותיה הראשונות של מדינת ישראל, כאשר הייתה מפלגה דומיננטית אחת והרבה מפלגות בינוניות וקטנות. אמנם הממשלה הייתה "בלי חירות ומק"י" (( 4. ממש כמו היום)), אבל כל המפלגות האחרות היו שותפות קואליציוניות זוטרות של מפא"י בשלב זה או אחר.

כדי ליצור סולם בר השוואה, שאפלי קובע כי סכום הכוחות של כל המפלגות יהיה שווה ל-1, כלומר ל-100%.

שאפלי מוסיף עוד הנחה טכנית אחת, שלא אפרט כאן, וזה מספיק כדי לבנות פתרון. הנה הרעיון: בואו ניקח מפלגה מסויימת, נקרא לה X, ונסתכל על כל הקואליציות האחרות שאפשר להרכיב בלעדיה. מה יקרה אם נוסיף את X לאחת הקואליציות האלה? יש שלוש אפשרויות:

  1. לפני הוספת X, הקואליציה לא יכלה להרכיב ממשלה, וגם אחרי הוספת X אינה יכולה להרכיב ממשלה. כלומר ערך הקואליציה היה אפס לפני הוספת X ונשאר אפס לאחר ההוספה. התרומה של X היא אפס.
  2. לפני הוספת X, הקואליציה לא יכלה להרכיב ממשלה, ואולם אחרי הוספת X הקואליציה יכולה להרכיב ממשלה. במלים אחרות, ערך הקואליציה היה אפס לפני הוספת X ועלה לאחד לאחר ההוספה. התרומה של X היא 1.
  3. לפני הוספת X, הקואליציה כבר יכלה להרכיב ממשלה, וכמובן שאחרי הוספת X הקואליציה עדיין יכולה להרכיב ממשלה. ערך הקואליציה היה 1 לפני הוספת X ונשאר 1 לאחר ההוספה. התרומה של X היא 0.

שאפלי מציע להסתכל על תהליך של הרכבת קואליציה "מקיר לקיר": יוצרים "קואליציה" של מפלגה אחת, ואחר כך מוסיפים לה עוד אחת, ועוד אחת, עד שמקבלים לבסוף קואליציה שמחברת את כל המפלגות. באיזשהו שלב גם מפלגה X נוספה לקואליציה. מה הייתה התרומה שלה בעת שצורפה לקואליציה? אם נרכיב את הקואליציה הגדולה בסדר אחר, ייתכן ש-X תצורף בשלב בו תהיה תרומתה שונה. לכן נחזור על התרגיל לכל האפשרויות, ונחשב את התרומה של X בכל אחד מהמקרים. התרומה הממוצעת היא מדד לכוחה של מפלגה, וזהו הערך של שאפלי.

הנה דוגמה. בכנסת יש 4 מפלגות: למפלגות A ו-B יש 50 מנדטים כל אחת, למפלגה C יש 19 מנדטים, ומפלגה D היא סיעת יחיד ולה מנדט 1. נחשב את ערכי שאפלי של כל המפלגות. ראשית, שימו לב כי מפלגה D היא "גולם", לכן ערך שאפלי שלה חייב להיות אפס. כמו כן, למפלגות A ו-B אותו מספר מנדטים ולכן יהיו להן ערכי שאפלי שווים. לכן אם נחשב את ערך שאפלי של מפלגה C, נוכל לחשב את הערכים של A ו-B. הנה החישוב:

יש 24 דרכים בהן אפשר להרכיב קואליציה מקיר לקיר על ידי הוספת מפלגה אחת בכל פעם. הן כולן מוצגות בטבלה הבאה (לחצו על התמונה לצפיה בגודל מלא):

 

  בשורה הראשונה לדוגמה, בונים תחילה קואליציה עם A ו-B. יש שם 100 מנדטים, ולכן ערכה של קואליציה זו הוא 1. אם מוסיפים את C, מספר המנדטים עולה ל-119, אבל זה כבר לא משנה. ערך הקואליציה נשאר 1, הערך המוסף של C הוא אפס. מבין 24 האפשרויות, יש בדיוק 8 מקרים בהם הוספת C מעלה את ערך הקואליציה מ-0 ל-1. הממוצע של 8 אחדים ו-16 אפסים הוא שליש, ולכן ערך שאפלי של מפלגה C, כלומר הכוח שלה במשחק הקואליציוני הוא 33.3%. 66.7% הנותרים מתחלקים שווה בשווה בין מפלגות A ו-B, ולכן גם ערך שאפלי שלהן הוא שליש, או 33.3%. 19 המנדטים של מפלגה C שווים כמו 50 המנדטים של מפלגות A ו-B. כל שתיים מבין 3 המפלגות A, B ו-C יכולות להקים יחד ממשלה ולזרוק את המפלגה השלישית לאופוזיציה (שם יארח להם לחברה הנציג של מפלגה D).

כעת אנתח את מה שקורה בכנסת ה-19, ומה היה עשוי לקרות בה אם אחוז החסימה המוגדל היה חל עליה, בהנחה שדפוסי ההצבעה ומספרי הקולות לכל מפלגה לא היו משתנים. בטבלה הבאה מוצגים מספרי המנדטים של כל מפלגה בכנסת הנוכחית, ומספרי המנדטים שהיו מתקבלים לו היו מחולקים על פי אחוז חסימה של 3.25%, בהרכב המפלגות הקיים, וגם בתרחיש בו 3 ה-"מפלגות הערביות" רעם-תעל, חדש ובלד היו רצות ברשימה משותפת (( 5. אני נמנע מלהכנס לדיון פוליטי על התרחיש ההזוי והגזעני הזה. אציין רק שיש חילוקי דעות אידיאולוגיים מהותיים בין שלוש מפלגות אלה, וכן כי חדש אינה מפלגה ערבית במהותה, אלא מפלגה ללא לאומיות)). בנוסף מוצגים גם אחוז המושבים בכנסת של כל מפלגה וערכי שאפלי (( 6. הערכים חושבו על ידי המחשבון הנמצא באתר Cut The Knot ))המתאימים להרכב כל כנסת, הנוכחית ושתי הכנסות ההיפותטיות  (לחצו על התמונה לצפיה בגודל מלא).

 

  כל אחד מוזמן לבחון את המספרים ולנתח את משמעותם. יש כמובן מספר שינויים, וכמובן יהיו עוד, שכן תוצאות הבחירות הבאות יהיו בודאי שונות מתוצאות הבחירות האחרונות. ניתן להבחין בשני שינויים עיקריים: המפלגה הגדולה נעשית חזקה יותר, ובתרחישים מסויימים חלק מהמפלגות הבינוניות (העבודה וש"ס) מתחזקות משמעותית. מעבר לכך, אין שינויים משמעותיים וה-"משילות", whatever it means, תישאר פחות או יותר כפי שהייתה. לפחות, בטווח הקצר, אין בחוק הזה פגיעה במצב הפוליטי הקיים.

עם זאת, אין פירוש הדבר כי החוק לא בעייתי ומסוכן בטווח הארוך. הבעייתיות של החוק נדונה כבר בהרחבה ולא אחזור על כך כאן. שינויים בחוקי יסוד תמיד יש לבצע בזהירות רבה, מה גם שברור לאור הניתוח שהבאתי כי תועלת לא תהיה בו, ופוטנציאל הנזק מרובה.

מצגת ההרצאה על תורת המשחקים

במסגרת "חודש משחקי החשיבה" שייערך ברעננה, נתתי אתמול הרצאה בנושא "נפלאות התבונה – מבט אל תורת המשחקים". ניתן לראות כאן את מצגת ההרצאה.

תורת המשחקים, הדברים החשובים והאינסוף – סקירה של ספרי חיים שפירא

למרות שחיים שפירא הוא מתמטיקאי וסטטיסטיקאי בן גילי, שלמד סטטיסטיקה בתל אביב בערך באותה תקופה בה אני למדתי בירושלים, ואחד מעמיתיי לעבודה למד יחד איתו, לא שמעתי את שמו עד לפני מספר שנים, כאשר הגיע לתת הרצאה באירוע שארגן מקום העבודה השלי.

כותרת ההרצאה הייתה "כשפו הדב פגש את וודי אלן", ואני זוכר היטב את המשפט שפתח אותה: "שמי חיים שפירא", אמר שפירא, "ואני מלמד את המקצוע הכי משעמם בעולם – סטטיסטיקה". רוב מכריע של הקהל צחק, אפילו אני חייכתי. ההרצאה הייתה מרתקת ומבדרת. שפירא יכול ללא ספק לפתח קריירה של סטנדאפיסט (והוא בעצם סוג של סטנדאפיסט כאשר הוא עולה על הבמה להרצות).

כשנתיים לאחר ההרצאה הזו, בספטמבר 2008, פצח שפירא גם בקריירה של סופר, והוציא לאור את ספרו הראשון (אם מתעלמים מספרון בהוצאת האוניברסיטה המשודרת שיצא לאור כמה שנים קודם לכן: "בעקבות אליס – מסעות לעולמו של לואיס קרול").

הספר נשא את הכותרת "שיחות על תורת המשחקים", ונראה מבטיח. הספר, שיצא לאור מספר שנים לאחר זכייתו של פרופ' ישראל אומן בפרס נובל לכלכלה, ענה ככל הנראה על צורך של הציבור להבין את התחום בו עוסק אומן, ולכן הפך לרב-מכר. אני מודה שלא רכשתי את הספר, בניגוד למנהגי לאסוף ספרי מתמטיקה פופולרית, והסתפקתי בשאילת הספר מהספריה לצורך קריאתו. לכן, עברו כבר שנתיים מאז שקראתי את הספר, ואף כי אתמול עיינתי בו בחטף באחד מדוכני שבוע הספר, הדברים שאכתוב עליו מבוססים על זכרוני.

בצדק נקרא הספר "שיחות על תורת המשחקים". הוא כתוב כאילו מישהו הקליט את שפירא משוחח על נושאים שונים, ואחר כך העלה את הדברים על הכתב. מי שיקרא את הספר ייהנה ללא ספק: הוא שזור סיפורים משעשעים ודוגמאות מעניינות. חלק מהדברים אכן עוסקים בתורת המשחקים. יש את הדיון הבלתי נמנע על דילמת האסירים, וגם על משחקים קשורים, כגון משחק השפן. יש הסבר אינטואיטיבי למדי על שיווי המשקל של נאש. יש דיון במשחקי מיקוח, ומשחק/תרגיל המכירה הפומבית של הדולר (ששודרג, ככל הנראה עקב האינפלציה, המשבר הכלכלי בארה"ב והתחזקות השקל, למכירה פומבית של 100 שקלים)  נדון גם הוא. יש גם דוגמאות מעניינות מעולם הטבע – תופעות התנהגותיות של בעלי חיים שניתן להסביר באמצעות מודלים מתורת המשחקים.

אבל יש גם נושאים אחרים, שלא ממש קשורים. יש למשל, פרק שכותרתו "איך לשקר בעזרת סטטיסטיקה", ובו מביא שפירא שתי שיטות עיקריות לעיוות נתונים. מובאת החידה הנחמדה על חלוקת המטמון בין הפיראטים. בעיית שתי המעטפות זוכה גם היא לדיון, סיכויי הזכיה בהימורים שונים נדונים באריכות וגם בעיית מונטי הול נכנסה לספר הזה. נחמד מאוד, אבל מה לזה ולתורת המשחקים?

ההתרשמות שלי הייתה שהצורך למלא 200 ומשהו עמודים במהירות גבר על הרצון להוציא ספר פופולרי רציני שיסביר את תורת המשחקים בשפה שווה לכל נפש. והאמת, אין צורך בספר כזה, כי כבר קיימים מספר ספרים טובים מאוד על התחום שתורגמו לעברית: "דילמת האסיר" מאת ויליאם פאונדסטון ו-"תורת המשחקים" מאת דיקסיט וניילבאף, שני ספרים שכן נמצאים בספריה שלי.

ההצלחה של הספר הראשון הובילה את שפירא לכתיבת ספר שני, שנשא את הכותרת המעט יומרנית, אך בהחלט מוצדקת, "על הדברים החשובים באמת". לטעמי זהו ספרו הטוב ביותר של שפירא (עד כה). הלפר שלושה חלקים, וכל ספר עוסק באחת מבין שלוש היצירות הספרותיות הנפלאות, "סיפורי פו הדב" מאת א.א. מילן, "אליס בארץ הפלאות" (והמשכו, "מבעד למראה") שכתב המתמטיקאי צ'רלס דודג'סון, הידוע יותר בשמו הספרותי לואיס קרול, ו-"הנסיך הקטן" של אנטואן דה סנט-אכזופרי. גם הדברים שאכתוב על הספר הזה נכתבים מהזכרון, שכן עברה כמעט שנה מאז שקראתי אותו. החלק המוקדש לפו הדב הוא למעשה הרחבה של ההרצאה ששמעתי את שפירא נושא לפני מספר שנים.שפירא מדגים בעזרת פו, אליס, הנסיך, וכמה דמויות נוספות רעיונות מתחומי הפילוסופיה, ועשה זאת בהומור רב, ובשפה ברורה. עם זאת, אני חייב לציין, לצערי, כי חלקי הספר מהווים סדרה מונוטונית יורדת. בעוד שהחלק על פו הדב הוא מצויין, הפרק על אליס פחות טוב, ועדיף לקרוא את החוברת של האוניברסיטה המשודרת המבוססת על הרצאותיו של שפירא, או לפנות להערות הקלאסיות של מרטין גרדנר . החלק השלישי על הנסיך הקטן קצר מאוד, ועושה עוול גם לספר וגם לשפירא עצמו. הערך המוסף שלו קטן ביותר, לדעתי. עם זאת, אני בהחלט ממליץ לקרוא את הספר.

עוד שנה עברה, והנה, לקראת שבוע הספר, הוציא שפירא לאור ספר שלישי: "אינסוף המסע שאינו נגמר". עוד ספר עם כותרת יומרנית, והפעם, לצערי, היומרה ריקה מתוכן, ומוטב היה לו הספר לא נכתב. הספר לא עוסק באינסוף. זאת אומרת, חלק ממנו כן עוסק באינסוף. יש פרק שאכן עוסק בתורת הקבוצות, ובו בין היתר מביא שפירא את סיפור המלון של הילברט, מתאר את שיטת האלכסון של קנטור ומדגים כיצד מוכיחים כי המספרים הרציונליים בני מניה, אך הממשיים אינם ניתנים למניה, ועוד כהנה וכהנה. הספר גם עוסק בערב רב של נושאים אחרים: אנקדוטות מתורת המספרים, דיון במספרים הראשוניים, פרק על הקבועים פיי ו-e, ונוסחת אוילר המקשרת בינהם, מספרים מדומים, פתרון משוואות בעזרת שורשים, מספרי ארדש, המשפט האחרון של פרמה, פרקטלים, הפרדוקסים של זנון (ש"איש לא הצליח לפתור", טוען שפירא), מספרי פיבונצ'י, מספרים ראשוניים, ועוד ועוד ועוד.

הספר בעייתי מאוד. אין לו דרך. ההסברים מסורבלים, ולו הייתי צריך לנסות להבין את ההוכחה של אויקלידס לקיומם של אינסוף מספרים ראשוניים, למשל, מהטקסט של שפירא, הייתי מתקשה בכך. כאדם שעוסק במתמטיקה, הספר פשוט שיעמם אותי. אני לא כל כך יודע מה תהיה התגובה של מי ששנא מתמטיקה בלימודיו בבית הספר כאשר ינסה לקרוא אותו. חבל שהספר הזה יצא לאור, ואני ממליץ לכם לוותר עליו. יש מספיק ספרים טובים בעברית שעוסקים הנושאים האלה.

מחשבות על דילמת האסירים והיווצרות חוקים

רשימה זו נכתבת בעקבות דיון שנערך ביני ובין ידידי משכבר הימים ראובן בתגובות לרשימה "מה רע בקצת סטרואידים". (ניתן לראות כאן את שרשור התגובות, שהתחיל הקורא סמיילי).

הדיון התנהל סביב הטענה שהעליתי, לפיה חוקים נוצרים כדי להמנע מנקודת שיווי המשקל של דילמת האסירים. ראובן אמר כי לדעתו זו גישה נאיבית, ולכן אנסה להסביר ברשימה הזו באופן משכנע יותר מדוע הגישה שהצגתי אינה נאיבית כלל וכלל.

בטרם אגש לשטוח את טיעוניי, אקדים ואציין כי הרעיון בדבר הקשר בין דילמת האסירים והיווצרות חוקים אינו רעיון מקורי שלי. אני שמעתי אותו לראשונה מפי פרופ' מיכאל משלר ז"ל, אצלו למדתי כמה קורסים בתורת המשחקים. פרופ' משלר אף סיפר על אחת הסטודנטיות שלו שנסעה עד לפיטסבורג הרחוקה כדי לכתוב שם דיסרטציה בפילוסופיה שעסקה ברעיון הזה ממש, והוכתרה בתואר דוקטור בזכות עבודתה זו. לצערי, לא הצלחתי למצוא זכר לכך בחיפושיי ברשת. אם למישהו מהקוראים יש מידע על כך, אשמח לשמוע.

בואו וניזכר בדילמת האסירים "המקורית". המשטרה עוצרת שני אנשים החשודים בביצוע פשע חמור כלשהו. ברור לחלוטין (למשטרה לפחות) כי השניים אכן אשמים, אך אין די ראיות כדי להרשיעם בבית המשפט. חוקר המשטרה נוקט גישת הפרד ומשול, וכולא את כל אחד מהחשודים בתא נפרד. לאחר מכן הוא מביא בפני כל אחד מהחשודים סיכום מצב קצר. אם שני החשודים ישתקו בחקירתם, המשטרה לא תוכל להאשימם בפשע החמור שביצעו, אך הם יואשמו באחזקת נשק בלתי חוקי, וכל אחד מהם צפוי למאסר של חצי שנה. אם שניהם יודו בפשע בו הם חשודים, כל אחד מהם צפוי ל-10 שנות מאסר. אבל, אם אחד החשודים יודה בפשע בעוד חברו שותק בחקירה, הוא יוכל לשמש כעד מדינה נגד חברו ולהשתחרר ללא מאסר כלל, בעוד שחברו יישלח למאסר של 15 שנה. ניתן לסכם את כל התוצאות האפשריות (מנקודת מבטו של אחד החשודים) בטבלה הבאה:

מה אני אקבל מה השותף שלי עושה
שותק בחקירה מודה באשמה
מה אני עושה שותק בחקירה חצי שנה 15 שנים
מודה באשמה יוצא לחפשי 10 שנים

הנה השיקול של החשוד: אם השותף שלו שותק, עדיף לו להודות באשמה, כי אז יצא לחופשי, וזה יותר טוב מחצי שנה שיקבל אם גם הוא ישתוק. לעומת זאת, אם שותפו מודה באשמה, אז בודאי עדיף להודות באשמה ולקבל 10 שנים, שכן זו תוצאה טובה יותר ממאסר של 15 שנים שיקבל אם ישתוק במקרה זה. לסיכום, לא משנה מה יעשה השותף, בכל מקרה עדיף להודות באשמה מאשר לשתוק.

החשוד השני, השותף לפשע, עומד בדיוק מול אותה טבלת תוצאות, שוקל את אותם שיקולים, ומגיע בהכרח לאותה מסקנה: עדיף לדבר.

התוצאה הסופית: שני החשודים מודים באשמה ונשלחים למאסר של 10 שנים כל אחד, כאשר יכלו לקבל עונש קל של חצי שנת מאשר, לו שניהם מילאו את פיהם מים.

כל זה טוב ויפה בתיאוריה. למה חוקרי המשטרה לא משתמשים בתרגיל הזה שוב ושוב כדי להוציא הודאות מהחשודים? כי גם הפושעים מתוחכמים. הם אולי לא למדו קורסים בתורת המשחקים, אבל יודעים היטב כי מי שיעיד נגד חברו לא יסתובב חפשי זמן רב, ותוך זמן קצר יימצא עם כדור בראש. החוק הבלתי כתוב של העולם התחתון שינה את טבלת התוצאות של דילמת האסירים:

מה אני אקבל מה השותף שלי עושה
שותק בחקירה מודה באשמה
מה אני עושה שותק בחקירה חצי שנה 15 שנים
מודה באשמה יוצא לחפשי כדור בראש 10 שנים

עכשיו, אם השותף שותק, גם לחברו עדיף לשתוק. עדיף לשבת חצי שנה בכלא מלקבל כדור בראש. יש נסיונות מצד רשויות החוק להתחכם ולשנות עוד את הטבלה על ידי החלפת "כדור בראש" ל-"תכנית להגנת עדים". לפעמים יש פושעים שזה משתלם להם, לפעמים לא. בכל מקרה, דילמת האסירים שוב אינה דילמה.

לא תמיד ניתן לשנות את הדילמה באמצעות חוק. בואו ניקח לדוגמא סטודנט שגר לו בבניין 9 במעונות שבגבעת רם. לבניין הזה יש מטבח אחד המשמש את כל דייריו. כאשר הסטודנט מכין לעצמו במטבח חביתה לארוחת ערב, הוא יכול לנקות אחריו את משטח העבודה והכיריים, או להשאיר אותם מלוכלכים. אתם מוזמנים לבדוק כי זו וריאציה על דילמת האסירים. לא משנה מה הדיירים האחרים עושים, לכל דייר תמיד כדאי יותר לא לנקות אחריו. המטבח נשאר מלוכלך עד שעובדי הנקיון של המעונות ינקו אותו למחרת בבוקר. אפשר לקבוע בחוק (או בתקנון המעונות) כי כל סטודנט המשתמש במטבח חייב לנקות אחריו (ואולי יש כלל כזה בתקנון). אבל אם הכלל הזה לא יאכף, איש לא ינקה.

לפעמים אין צורך באכיפה של ממש, די בחינוך. דוגמא מצוינת היא שמירת פרחי הבר. אם כל אחד יקטף לעצמו פרח בר אחד, הוא ירוויח בטווח הקצר, התוצאה הרסנית לכולם. דילמת אסירים. יש חוק להגנת פרחי בר. הוא לא נאכף באינטנסיביות. אין צורך. שנים של חינוך טבעו בתודעת כולנו את הכלל לפיו אין לקטוף פרחי בר.

לעומת זאת, אם תתבוננו בצומת הקרוב למקום מגוריכם, תגלו שם דילמת אסירים מסוג אחר. כאשר כמה מכוניות מתקרבות לצומת, כל נהג יכול לבחור אם להכנס לצומת או לתת זכות קדימה לנהגים האחרים. בדקו ותראו כי תמיד "משתלם יותר" לנהג להכנס לצומת ולא לתת זכות קדימה לאחרים, בין אם האחרים נותנים לו זכות קדימה ובין אם לאו. הבעיה היא שהתשלום המשולם בנקודת שיווי המשקל בה איש לא נותן זכות קדימה הוא כבד למדי: פקק במקרה הטוב, תאונה + פקק במקרה הפחות טוב. הפתרון: בכל צומת מוצבים תמרורים ואף רמזורים המסדירים את סדר הקדימויות בין הנהגים השונים. תמרורים ורמזורים הם נגזרות של חוקים. כאן, לצערנו, יש צורך גם לאכוף את החוקים האלה, כיוון שרב מספר הנהגים המתייחסים לתמרורי עצור ולרמזורים אדומים כאל המלצות בלבד. שימו לב, אגב, שהפתרון שמציעים התמרורים והרמזורים אינו בהכרח "צודק". חלק מהנהגים עלולים להמתין יותר זמן בצומת מאשר נהגים אחרים. אבל הפקקים והתאונות נמנעים, לפחות חלקית.

הבאתי כאן מספר דוגמאות הממחישות כיצד מצבים הדומים לדילמת האסירים נפתרים על ידי שינוי טבלת התשלומים באמצעות כלל, תקנה או חוק. האם זה מוכיח שכל חוק בא למנוע מצב של דילמת אסירים? ודאי שלא. אבל נדמה לי שהעקרון הובהר. גם אם תובא דוגמא של חוק שלא נובע ממצב של דילמת אסירים (ואשמח לראות דוגמא כזו, אני עצמי לא הצלחתי לחשוב על אחת), עדיין יהיה אפשר לומר כי ניתן להמנע מנקודת שיווי המשקל של דילמת האסירים באמצעות שינוי טבלת התשלומים על ידי חיקוק, וגם זו טענה חזקה מאוד.

מה רע בקצת סטרואידים?

עולם הבייסבול הזדעזע קלות השבוע. מרק מגווייר, בעבר כוכב הסנט לואיס קרדינלס וכיום מאמן החובטים של הקבוצה, התוודה והודיע כי השתמש בסמים אסורים (סטרואידים וכולי) שסייעו לו לשבור בשנת 1998 את שיא ההום ראנס ההיסטורי של רוג'ר מאריס (61 הום ראנס) ולהעמידו של 70 הום ראנס. (השיא,  דרך אגב, החזיק מעמד במשך שלוש שנים בלבד. בארי בונדס חבט 73 הום ראנס בשנת 2001, ככל הנראה גם בעזרת סטרואידים).

הוידוי המפתיע (בעל התוכן המאוד לא מפתיע) של מגווייר מספקים לי הזדמנות למלא הבטחה שנתתי כאן לפני כשמונה חדשים, לאחר שכוכב בייסבול אחר, מני רמירז, הושעה לחמישים משחקים עקב שימוש בסמים אסורים. מה בכלל לא בסדר בשימוש בסמים? למה לא להרשות לספורטאי שרוצה בכך להלעיט את גופו בסטרואידים, הורמוני גדילה ושאר ירקות, ובכך לשפר את יכולותיו? התשובה, רמזתי אז, מגיעה מתחום הכלכלה. עתה אביא אותה במלואה.

לפני שאמשיך, אציין כי ההסבר שיובא כאן מתבסס על פרק מספרו של ג'יי סי ברדבורי: "כלכלן הבייסבול", ואני רק מביא את הדברים בשם אומרם (אם כי בהמשך אחווה גם את דעתי בנושא).

סטרואידים, אומר ברדבורי, הם רק עוד דרך לשיפור הביצועים (של הספורטאי), כמו שמירה  על תזונה נכונה או אימונים מרובים. ובכל זאת אנשים נוטים להתייחס בצורה שונה (ושלילית) כלפי ספורטאים שמשתמשים בהם. טענה אחת היא שהסטרואידים "אינם טבעיים". ברדבורי טוען שזה לא העניין. התערבויות "לא טבעיות" אחרות, כגון ניתוחים למיניהם (החל בניתוחי לייזר לשיפור הראיה וכלה בניתוח "טומי ג'ון"), זריקות קורטיזון וכדומה נחשבות כלגיטימיות. גם הטענה כי שימוש בסמים למינהם אינה לגיטימית כי אנשים "רגילים" אינם משתמשים בחומרים ממריצים נדחית על ידי ברדבורי: ניקוטין, קפאין וסוכר הם כולם סטימולנטים לגיטימיים שנמצאים בשימוש נרחב. אענה אפשרית נוספת היא שסטרואידים למינהם מסכנים את בריאות הספורטאים. גם אם זה נכון, אומר ברדבורי, זה לא צריך לשנות. זכותו של כל אחד לקחת על עצמו סיכונים. העיסוק בבייסבול עצמו הוא מסוכן (אחרי הכל, מישהו שעומד במרחק של 18 מטר ממך זורק לעברך כדור שמשקלו 150 גרם במהירות של כ-150 קמ"ש). ואם באמת הדאגה לבריאות השחקנים חשובה, עדיף לאסור עליהם לעשן ולצרוך אלכוהול, זה יועיל להם הרבה יותר.

הבעיה העיקרית, טוען ברדבורי, היא שהחלטה של שחקן להשתמש בסטרואידים משפיעה גם על השחקנים האחרים. שחקן שמשתמש בסטרואידים משפר את ביצועיו, ועקב כך ישפר ככל הנראה גם את שכרו. מי שייפגע עקב כך הם שחקנים אחרים, שרמת משחקם דומה לשחקן שמשתמש בסטרואידים, ששכרם ייפגע, אם באופן מוחלט ואם באופן יחסי לאותו שחקן סורר. מה יכולים אותם שחקנים לעשות כדי לסגור את הפער? לקחת סטרואידים גם הם. ובסופו של דבר, נגיע למצב בו כולם (או כמעט כולם) לוקחים סטרואידים,  והיתרון של שימוש בסטרואידים מתבטל. אשתמש בפרפרזה על לואיס קרול: נוצר מצב שבו כולם רצו בכל הכח קדימה וכולם נשארו במקום. זהו מצב קלאסי של דילמת האסירים.

עד כאן עיקרי טיעוניו של ברדבורי.

אין לי ביקורת על הניתוח המתמטי של ברדבורי, הוא מדוייק לחלוטין. הבעיה שלי עם ברדבורי היא שהוא טוען שההסבר הרציונלי שנתן הוא היחיד התקף. הנימוקים שנתן נגד הטענות המקובלות (לא טבעי, לא לגיטימי, וכולי) הם נכונים ורציונליים, אבל האם רק השיקולים הרציונליים תקפים? ומה בדבר המושג הבסיסי של "הוגנות"? האם הוא לא משחק תפקיד? אני חושב שכן, ברדבורי לא התייחס לכך.

עוד בעיה עם הטיעונים של ברדבורי: הוא מניח שגודל העוגה נשאר קבוע. בפועל, במהלך תקופת הסטרואידים בבייסבול חל סחרור שדחף את משכורות כל השחקנים כלפי מעלה, כולל את משכורותיהם של אלה שלא השתמשו בסטרואידים. השחקנים הרוויחו בגדול, למגינת ליבם של בעלי הקבוצות. הסטרואידים השתלמו לשחקנים. מי שבאמת מתנגד לסטרואידים הם בעלי הקבוצות.

ובואו לא נשכח – אין ספק שהמשחק היה מלהיב יותר בשיא תקופת הסטרואידים. גרתי בשיקגו בתקופת המירוץ לשבירת שיא ההום ראנס שנערך בין מרק מגווייר לסמי סוסה. זו הייתה תקופה נפלאה. דיבורים על סטרואידים היו גם אז, אבל לאף אחד לא היה איכפת. זכיתי לראות את שני השחקנים האלה בפעולה, ואף הייתי אחד מבין כ-40000 העדים להום ראן מספר 60 של סוסה. הספורט המקצועני הוא בראש ובראשונה בידור, ובסוף שנות התשעים גם בעלי הקבוצות הרוויחו מהשימוש בסטרואידים, ולכן כולם עצמו את עינהם. ההתעוררות חלה כאשר בעלי הקבוצות הבינו כי הנזק הכספי הצפוי להם בטווח הארוך עקב העליה בשכר השחקנים עולה על הרווחים של הטווח הקצר.

עוד חוויות מדילמת האסירים

לפני כשנה כתבתי כאן על חויותי ממשחק דילמת האסירים ששיחקתי במסגרת קורס שלמדתי. לפני כעשרה ימים השתתפתי בקורס ניהול משא ומתן שניתן על די אותו המנחה, עו"ד יונתן קוברסקי (לחצו על הלינק כדי לראות אותו מרצה ביוטיוב), ובאחד התרגילים שנערכו, שוחקה גירסה אחרת של דילמת האסירים. אתאר כאן את חוויותי ותובנותי מהמשחק הזה. אין בכוונתי להתעמק בניחוח אנליטי של המשחק.

בשלב הראשון המשתתפים בקורס חולקו לשש קבוצות, ונערכו שלושה משחקים במקביל, כשבכל משחק מתחרות שתי קבוצות זו בזו . מאחר ובכל קבוצה היו בין שלושה לארבעה חברים, תהליך קבלת ההחלטות בכל קבוצה היה נתון למו"מ (כך לפחות זה היה בקבוצה שלי).

סיפור המסגרת למשחק (למעוניינים, הנה ההסבר המלא באנגלית, קובץ pdf): שתי מדינות, אלבה ובתיה, הן יצרניות נפט קטנות, שמוכרות את תפוקת הנפט שלהן לשכנתן הגדולה והעשירה, מדינת קפיטה. מחירי הנפט של כל מדינה נקבעים כל חודש על ידי ועדה מיוחדת לקביעת מחירי הנפט (אלה אנחנו, השחקנים). המחיר יכול להיות 10, 20 או 30 דולר לחבית. ההכנסות החדשיות ממכירת הנפט תלויות במחירים שקבעו שתי המדינות. אם בתיה, למשל, מוכרת את הנפט שלה ב-20 דולר לחבית, ואלבה קובעת מחיר של 30 דולר לחבית, אז בתיה תיהנה מהכנסה של 18 מליון דולר, בעוד אלבה תכניס לקופת שני מליון דולר בלבד. באופן כללי, אלה הן ההכנסות של מדינת בתיה בהנתן מחירי הנפט שלה ושל אלבה בחודש נתון לחבית (אני שיחקתי באחת הקבוצות של בתיה, ולכן מתאר את נקודת המבט שלה. חוץ מזה, יש לי דודה נפלאה ששמה בתיה.):

הכנסות בתיה ממכירת נפט

(במליוני דולרים)

מחיר הנפט של בתיה (דולר לחבית)
10 20 30
מחיר הנפט של אלבה

(דולר לחבית)

30 15 18 11
20 15 8 2
10 5 3 2

מטריצת ההכנסות של אלבה זהה לזו של בתיה.

אלבה ובתיה כמובן מסוכסכות ביניהן, מה שלא אפשר מו"מ או תיאום של מחירי הנפט. מטרת כל קבוצה להביא למקסימום את רווחי המדינה שלה בשמונת החודשים הקרובים, תוך כדי אדישות לביצועים של המדינה המתחרה. כמו כן נאמר לנו כי כרגע שתי המדינות מוכרות את הנפט שלהן ב-20 דולר לחבית.

בכל זאת ניתוח אנליטי קצר של המשחק, לפני שאעבור לחוויות ולתובנות. קל לראות כי האסטרטגיה של קביעת מחיר הנפט ב-20 דולר לחבית שולטת על האסטרטגיה של 30 דולר. לא משנה מה יהיה המחיר שאלבה תקבע, תמיד עדיף לבתיה למכור ב-20 ולא בשלושים. אם למשל, המחיר של אלבה הוא 30 דולר לחבית, אז במחיר של 30 דולר לחבית בתיה תרוויח 11 מליון דולר, ובמחיר של 20 דולר לחבית בתיה תרוויח 18 מליון דולר, וכן הלאה. מכאן שאף פעם לא כדאי לבתיה לקבוע מחיר של 30 דולר לחבית. אותם השיקולים נכונים גם למדינת אלבה, ולכן אם אנשי אלבה רציונליים, גם הם לעולם לא יקבעו מחיר של 30 דולר לחבית. מעשית, ניתן למחוק את המחיר 30 מטבלת התשלומים, ולהסתפק בטבלה מצומצמת:

הכנסות בתיה ממכירת נפט

(במליוני דולרים)

מחיר הנפט של בתיה (דולר לחבית)
10 20 30

מחיר הנפט של אלבה

(דולר לחבית)

30 15 18 11
20 15 8 2
10 5 3 2

הבעיה היא שעכשיו, הפלא ופלא, ניתן להפעיל את אותו השיקול על הטבלה המצומצמת, ואם מניחים שאלבה לעולם לא תקבע מחיר של 30 דולר לחבית, תמיד עדיף למכור ב-10 דולר לחבית ולא 20 דולר לחבית. אותם השיקולים אמורים להנחות גם את אלבה, ובסיכומו של דבר, נקודת שיווי המשקל (של נאש) במשחק הזה היא שכל מדינה מוכרת את הנפט שלה ב-10 דולר לחבית ונהנית מהכנסה חדשית של 5 מליון דולר, תוצאה נחותה מהתוצאה שהייתה מתקבלת לו היו קובעות שתי המדינות מחיר של 20 דולר לחבית או אפילו 30 דולר לחבית.

הדינמיקה שהתפתחה הייתה דומה לדינמיקה שהתפתחה אז. (המעוניינים יכולים לראות כאן את מהלכי שלושת המשחקים. אני שיחקתי בקבוצת בתיה במשחק 2).  שתי קבוצות התחילו מייד לשחק את נקודת שיווי המשקל 10-10. בדיון שנערך לאחר סיום המשחק הסבירו זאת ברצון להביא את הסיכון שלהם למינימום. שתי קבוצות אחרות פתחו ב-20-20, ובדיון שלאחר המשחק הסבירו זאת ברצון לשמר את המצב שהיה קיים (כזכור היה נתון כי בתחילת המשחק מחיר הנפט של שתי המדינות היה 20 דולר לחבית). המשחק השלישי החל גם הוא ב-20-20. הקבוצה ששיחקה מול הקבוצה שלי גם היא רצתה לשמר את המצב הנתון. אני, לעומת זאת, שכנעתי את חברות הקבוצה שלי כי כדאי להתחיל ב-20 כאיתות לרצון טוב, והמחיר של 20 ממזער נזקים אפשריים שיגרמו עקב מחיר תחרותי של המדינה השניה, אך עדיין נותן מרחב לתמרון. למעשה, האסטרטגיה "מידה כנגד מידה" עמדה מול עיניי.

אולם בהמשך העניינים התחממו. שתי הקבוצות שפתחו ב-10-10 עברו עוד סיבוב של 10-10, ואז אחת הקבוצות העלתה את המחיר שלה ל-20, כדי לאותת "בואו נתקדם". שתי הקבוצות האחרות שהתחילו ב-20-20 הדרדרו לשני סיבובים רצופים של 10-10. במשחק "שלי" שיחקנו 20 גם בסיבוב השני אך קיבלנו 10 מהקבוצה השניה. לכן החלטנו להעניש אותם ב-10 בסיבוב השלישי, ולהפתעתנו הקבוצה שמולנו שיחקה 30 בסיבוב השלישי, ומאוחר יותר הסבירו זאת בכך שרצו לאותת כי הם רוצים להמנע מנקודת הקפאון של 10-10.

בשלב הזה התאפשר משא ומתן בין הקבוצות המתחרות. כמו כן נמסר כי עקב המצב בקפיטה, ההכנסות בסיבוב הרביעי יהיו כפולו מהרגיל.

מה קרה לאחר המשא ומתן? שתי קבוצות של משחק מספר 3 סיכמו על 30-30 ועמדו בסיכום בשלושת הסיבובים הבאים.

שתי הקבוצות של משחק מספר 1 סיכמו גם הן על 30-30, אך אלבה לא עמדה בסיכום, וכבר בסיבוב הראשון אחרי המו"מ "הכניסו" לבתיה 10, וגרפו 30 מליון בעוד שהכנסות בתיה צנחו ל-4 מליון. בסיבוב הבא הם שיחקו 10-10, ובסיבוב שלאחריו אני אלבה כנראה חשו רגשות אשמה על הבגידה שני סיבובים קודם לכן, ובהניחם כי בתיה תשחק שוב 10 קבעו את מחיר הנפט שלהם ל-20, כסוג של פיצוי לבתיה על הפסדיהם בסיבוב הרביעי. האם זה השתלם? אם תעשו חשבון תגלו כי אלבה הרוויחו מכל התרגיל 3 מליון דולר. האם זה היה שווה את המשקעים שנוצרו בעקבות הפרת האמון?

אצלנו, לעומת זאת הדברים התפתחו אחרת. אני נשלחתי כנציג הקבוצה שלי. לפני שיצאתי למו"מ סיכמנו ביננו כי נציע לקבוצה הבאה שנשחק 2 סיבובים 20-20 ואחר כך נעלה ל-30-30. לא היינו מעוניינים להציע לשחק מייד 30-30, משתי סיבות: ראשית, היו לנו חששות לאור ה-10 ששוחק מולנו בסיבוב השני. שנית, הפיתוי לסטות מ-30-30 גדול מדי. לכן כשבעת המו"מ הקבוצה שמולנו הציעה שנתאם את מחיר הנפט ונקבע אותו על 30 דולר סירבתי, והעליתי את ההצעה שלנו. הנציגה שמולי אמרה לי כי אין לה סמכות לקבל החלטה על כך. לכן הבהרתי כי בסיבוב הבא נשחק 20, ונמשיך לעשות כן כל עוד הם ישחקו 20 גם הם. 2 הסיבובים הבאים לאחר המו"מ התנהלו כצפוי – פעמיים 20-20. אבל בסיבוב שלאחר מכן חלה התפתחות מעניינת. שתי שותפותיי לקבוצה דרשו להוריד את מחיר הנפט ל-10, ולאחר דין ודברים נאלצתי לקבל את הכרעתן. הקבוצה שמולנו העלתה את המחיר ל-30, כי הבינו שאנו בכל זאת נעלה את המחיר ל-30 אחרי שני סיבובים ב-20. התוצאה: משבר אמון. אחרי המשחק התברר לי כי בקבוצה שמולי שיחק אדם שאני עובד איתו באופן סדיר, וגם מי שהייתה המנהלת שלי במשך יותר מ-4 שנים (עד שקודמה לתפקיד בכיר יותר). מייד שנפגשנו בסיום המשחק (במהלך המשחק ישבנו בחדרים נפרדים) הם שאלו אותי "איך עשיתי להם כזה דבר". לא נעים.

בתום הסיבוב השישי הודיעו לנו כי תנאי המשחק משתנים שוב: בשני הסיבובים האחרונים, השביעי והשמיני, הכנסותיה של הקבוצה שתציע מחיר נמוך יותר יוכפלו פי ארבע (אם שתי הקבוצות קובעות את אותו המחיר, ההכנסות נשארות ללא שינוי), וזאת בגלל המצב במדינת קפיטה. כמו כן, התאפשר לנו לקיים עוד מפגש עם נציג הקבוצה שמולנו. הפעם סירבתי לצאת למו"מ, בעקבות התקרית שחוללנו בסיבוב השישי.

מהן האפשרויות שעמדו בפנינו? אפשרות אחת היא לשחק 30-10 ואחר כך 10-30. כך הקבוצה שתשחק 10 בסיבוב השביעי תרוויח 60 מליון והקבוצה שתשחק 30 תרוויח 2 מליון, ובסיבוב שלאחר מכן מתחלפים. באפשרות הזו כל קבוצה תרויח סך של 62 מליון בשני הסיבובים האחרונים. אם משחקים 30-20 ואח"כ 20-30, כל קבוצה תרויח 74 מליון, ואם משחקים 10-20 ואח"כ 20-10, כל קבוצה תרויח 63 מליון. כיוון שהאפשרות של 30-10 כמעט זהה לאפשרות של 20-10 היא ירדה מהפרק, והאופציה שנדונה ברצינות היא האופציה של 20-10, שוב, בגלל שהפיתוי לבגוד כאשר מנסים לשחק 30-10 גדול מדי.

השאלה העיקרית היא – מי יהיה ראשון? כלומר, איזה צד יזכה להציע את המחיר הנמוך בסיבוב השביעי, ואז הצד שכנגד ייאלץ לסמוך עליו כי יקיים את חלקו בהסכם בסיבוב השמיני? כולם רצו להיות ראשונים, גם הנציגה שלנו שיצאה למו"מ מול נציג הקבוצה שמולנו. אולם היא לא זכתה לנהל מו"מ של ממש. הנציג של הקבוצה השניה הודיעה לה כי הוא ישחק 10 בסיבוב השביעי בכל מקרה. לנו רק נותר לבחור אם נשחק בסיבוב השביעי 10 או 20. אם נשחק 20, הובהר לנו, אזי הקבוצה שמולנו תשחק 20 בסיבוב השמיני ותאפשר לנו לרבע את הכנסתנו ממשחק 10 בסיבוב השמיני. אם נבחר ב-10 בסיבוב השביעי, אז הם ישחקו 10 גם בסיבוב השמיני. אכן, מידה כנגד מידה.וכך היה: שיחקנו 20 בסיבוב השביעי, 10 בשמיני, וגרפנו 63 מליון. אותו מהלך קרה פחות או יותר (אם כי איני יודע את פרטי המו"מ) במשחק נוסף.

במשחק השלישי חלה התפתחות מעניינת. סוכם שם לשחק 20-30 ואח"כ 30-20, אולם הקבוצה שהייתה אמורה לשחק 30 בסיבוב השביעי טעתה ושיחקה 20 בטעות. התוצאה: 20-20, אף קבוצה לא קיבלה את הבונוס. בסיבוב השמיני, הקבוצה שנבגדה כמובן הורידה את המחיר ל-10, והקבוצה שטעתה העלתה את המחיר ל-30, כדי לפצות את הקבוצה שמולם על הטעות שעשו.כאן המשחק היה אמור להסתיים, וכאן באה עוד הפתעה: סיבוב נוסף. המסר: תמיד יש טווח ארוך. דובי הסביר זאת היטב בתגובה שלו לרשימה שלי על החוויות  מדילמת האסירים שפרסמתי לפני כשנה:

האיטרציה של המשחק לא באמת נגמרה אחרי הפעם העשירית. המשחק הזה היה מוטמע בתוך משחק אחר, הרבה יותר משמעותי בתועלות ובהפסדים הפוטנציאליים שלו. כאמור, אם המשחק היה על סכום כסף משמעותי, ובמיוחד אם המשחק היה עם זרים גמורים, סביר להניח שהתוצאות היו שונות בעליל. ההטמעה של המשחק במשחק החברתי הגדול יותר של מקום העבודה יצרה את התנאים הדרושים לקיומו של אמון – שבלעדיו אין משמעות לעצם יצירת התקשורת ביניכם.

עוד שלוש הערות לסיום:

בדפים שקיבלנו היה מקום לרשום את מהלי המשחק והרווחים של כל אחת מהקבוצות בכל סיבוב. מעניין שכולם, פרט למשתתפת אחת, מילאו באדיקות את כל הנתונים וחישבו את רווחי הקבוצה המתחרה, למרות שנאמר לנו בפירוש כי אנו אמורים להיות אדישים לרווחי הקבוצה שמתחרה מולנו. מתברר יכ יצר התחרות חזק מההוראות.

שנית, מתברר שהתחרות בין אלבה ובתיה הועילה להן, אך לא לקפיטה. כזכור, במצב שהיה קיים לפני תחילת המשחק, מחיר הנפט היה 20 דולר לחבית. לו נשמר המחיר בכל 8 סיבובי המשחק, אלבה ובתיה היו מכניסות 72 מליון דולר כל אחת (וקפיטה הייתה משלמת 144 מליון דולר). בפועל, הקבוצה שלי, בתיה, הרוויחה 128 מליון דולר וקבוצת אלבה שהתמודדה מולנו שלשלה לקופתה 114 מליון. קפיטה שילמה בסך הכל 98 מליון דולר יותר מאשר הייתה משלמת לו לא הייתה תחרות בין שתי ספקיות הנפט שלה. בעקבות הדיון בתגובות עם דובי, אני כבר לא בטוח בדברים האלה, ולכן הן נמחקו. ברור שחלק מההכנסות גדלו עקב סיבובי הבונוס (שעל פי סיפור המסגרת נבעו מבעיות בקפיטה – מזג אויר קשה ותקלה בכור הגרעיני שהביאו להגדלת הביקוד ליבוא נפט). אבל גם אם מוציאים אותם מהחישוב, לא ברור מה קורה. בכל מקרה, אני לוקח את דבריי בחזרה, ומודה לדובי על קריאתו הביקורתית והערותיו המועילות.

ולסיום – דבר שכבר עמדתי עליו במהלך הרשימה אבל נראה לי שחשוב להדגיש אותו: גם כאשר אין ערוץ תקשורת בין המשתתפים במשחק, ניתן בהחלט להעביר מסרים בין הקבוצות, על ידי המהלכים שמשחקים. מי שמשחק ברידג' מכיר את הרעיון הזה היטב. המעשים שלנו מהווים מסר בפני עצמם, ולא רק הדברים שאנו אומרים. התובנה הזו מסבירה גם את התפקיד שיש במשחק למחיר של 30 דולר לחבית (ואני מודה כי הבנתי זאת רק בסיום המשחק, לא בתחילתו). באמצעות קביעת מחיר של 30 ניתן לאותת לקבוצה השניה על רצון טוב, וגם לפצות אותה על מעשים שאנו מצטערם עליהם, בין אם עשינו זאת בכוונה ובין אם לאו. כשאר מחקתי את העמודה והשורה של ה-30 מטבלת המשחק, עשיתי מעשה נכון מבחינה מתמטית, אבל לא בהכרח מעשה נכון מבחינת התנהלות.

גיל קלעי כותב על פוליטיקה ורציונליות

היום התפרסם ב"הארץ" מאמר מאת גיל קלעי, פרופסור למתמטיקה וחבר במרכז לחקר הרציונליות באוניברסיטה העברית בירושלים, שכותרתו "על פוליטיקה ורציונליות". קלעי סוקר מספר מהלכים פוליטיים, וביניהם גם התנהלותה של הילרי קלינטון במירוץ מול ברק אובמה להשגת המועמדות לנשיאות ארה"ב.

כצפוי, מאמר של חוקר מהזרם המרכזי של תורת המשחקים הוא בהכרח שיר הלל לרציונליות. הילרי קלינטון פעלה באופן רמיונלי לגמרי במסע הבחירות שלה, טוען קלעי. בנימין נתניהו וציפי לבני פעלו ברציונליות כשהכריזו, שניהם, על ניצחון בליל הבחירות, מסביר קלעי. "תומכי מרצ שהצביעו לקדימה לא נהגו בחוסר רציונליות", כותב קלעי, ומסביר מדוע. "מובן שגם תומכי מרצ שהצביעו מרצ פעלו באופן רציונלי", מוסיף קלעי.

רגע, אני פיספסתי משהו. תומך מרץ שהצביע עבור מרץ פעל באופן רציונלי, את זה אני מבין. גם תומך מרץ שלא הצביע עבור מרץ אלא עבור מפלגה אחרת (קדימה, במקרה הזה) פעל באופן רציונלי? איכשהו זה לא מסתדר לי.

אני מניח שלפרופסור קלעי יש איזשהו הסבר כדי ליישב את הסתירה הזו. אני מניח שחלק מקוראיי יטרחו ויסבירו לי מדוע אין כאן שום סתירה (אולי אני לא בוחן את דבריו של קלעי באופן רציונלי?)

קוראיי הותיקים יודעים בודאי שאני לא תומך של הטענה כי אנשים תמיד מקבלים החלטות באופן רציונלי. מקבל החלטות רציונלי עושה את החיים של אנשי תורת המשחקים והמודלים הכלכליים הרבה יותר קלים. אבל יש עדויות כבדות משקל נגד הטענה הזו. דניאל כהנמן זכה בפרס נובל לכלכלה על מחקריו המשותפים עם עמוס טברסקי ז"ל, שהראו כיצד החלטות לא מתקבלות באופן רציונלי אצל בני אדם, ואף פירטו את מנגננוני ההטיה המרחיקים את מקבל ההחלטות האנושי מההחלטה שהיה מקבל "האדם הרציונלי".

לכן אני סבור כי מסקנתו של פרופ' קלעי, כי התנהלות הפוליטיקאים אצלנו איננה התנהגות בלתי רציונלית, אלא קושי בקבלת החלטות בתנאי אי ודאות, גורפת מדי. אני חושש שיש לנו דוגמאות רבות מדי של התנהגות בלתי רציונלית של פוליטיקאים. נכון, לא כולם, אבל ההתנהלות הנוכחית במשא ומתן להרכבת הממשלה (שהיא הטריגר לכתיבת המאמר של קלעי) בהחלט מראה כי חלק מהשחקנים אינם פועלים באופן רציונלי.

עדכון שפן הבייסבול

לפני מספר שבועות כתבתי כאן על משחק השפן שמשחקים כוכב הבייסבול מני רמירז וסוכנו סקוט בוראס מול קבות הלוס אנג'לס דודג'רס. כזכור רמירז דחה שתי הצעות שהוצעו לו על ידי הדודג'רס: תחילה דחה הצעה של 45 מליון דולר לשנתיים, אחר כך דחה הצעה של 25 מליון דולר לשנה.

הבוקר דווח כי הדודג'רס חזרו עם הצעה חדשה: שוב 45 מליון דולר לשנתיים, אך באופן שהשחקן יקבל סכום גדול יותר בשנת 2009 לעומת הסכום שהיה אמור לקבל בהצעה הראשונית. בעידן שבו הריבית קרובה ל-0 זה לא משהו, אבל עדיין מדובר בשיפור לעומת ההצעה הקודמת. עד כה לא דחה רמירז את ההצעה. האם העובדה שאימוני האביב כבר החלו בשבוע שעבר והדודג'רס כבר שיחקו אתמול את משחק הידידות הראשון שלהם גורמת לכוכב העל וסוכן העל שלו ללחוץ על הגז קצת יותר בעדינות? אמשיך לעקוב ולדווח.

עדכון: הבוקר (27.2.2009) דחה רמירז גם את ההצעה הזו.

עדכון מאוחר (שבת 7.3.2009): בתאריך 4.3.2009 חתמו רמירז והדודג'רס על חוזה חדש, לפיו רמירז ישחק בשנתיים הבאות בשורות הדודג'רס ויקבל תמורת שירותיו 45 מליון דולר. היה שווה לחכות.