לפני כשנה כתבתי כאן על חויותי ממשחק דילמת האסירים ששיחקתי במסגרת קורס שלמדתי. לפני כעשרה ימים השתתפתי בקורס ניהול משא ומתן שניתן על די אותו המנחה, עו”ד יונתן קוברסקי (לחצו על הלינק כדי לראות אותו מרצה ביוטיוב), ובאחד התרגילים שנערכו, שוחקה גירסה אחרת של דילמת האסירים. אתאר כאן את חוויותי ותובנותי מהמשחק הזה. אין בכוונתי להתעמק בניחוח אנליטי של המשחק.
בשלב הראשון המשתתפים בקורס חולקו לשש קבוצות, ונערכו שלושה משחקים במקביל, כשבכל משחק מתחרות שתי קבוצות זו בזו . מאחר ובכל קבוצה היו בין שלושה לארבעה חברים, תהליך קבלת ההחלטות בכל קבוצה היה נתון למו”מ (כך לפחות זה היה בקבוצה שלי).
סיפור המסגרת למשחק (למעוניינים, הנה ההסבר המלא באנגלית, קובץ pdf): שתי מדינות, אלבה ובתיה, הן יצרניות נפט קטנות, שמוכרות את תפוקת הנפט שלהן לשכנתן הגדולה והעשירה, מדינת קפיטה. מחירי הנפט של כל מדינה נקבעים כל חודש על ידי ועדה מיוחדת לקביעת מחירי הנפט (אלה אנחנו, השחקנים). המחיר יכול להיות 10, 20 או 30 דולר לחבית. ההכנסות החדשיות ממכירת הנפט תלויות במחירים שקבעו שתי המדינות. אם בתיה, למשל, מוכרת את הנפט שלה ב-20 דולר לחבית, ואלבה קובעת מחיר של 30 דולר לחבית, אז בתיה תיהנה מהכנסה של 18 מליון דולר, בעוד אלבה תכניס לקופת שני מליון דולר בלבד. באופן כללי, אלה הן ההכנסות של מדינת בתיה בהנתן מחירי הנפט שלה ושל אלבה בחודש נתון לחבית (אני שיחקתי באחת הקבוצות של בתיה, ולכן מתאר את נקודת המבט שלה. חוץ מזה, יש לי דודה נפלאה ששמה בתיה.):
הכנסות בתיה ממכירת נפט (במליוני דולרים) |
מחיר הנפט של בתיה (דולר לחבית) | |||
10 | 20 | 30 | ||
מחיר הנפט של אלבה
(דולר לחבית) |
30 | 15 | 18 | 11 |
20 | 15 | 8 | 2 | |
10 | 5 | 3 | 2 |
מטריצת ההכנסות של אלבה זהה לזו של בתיה.
אלבה ובתיה כמובן מסוכסכות ביניהן, מה שלא אפשר מו”מ או תיאום של מחירי הנפט. מטרת כל קבוצה להביא למקסימום את רווחי המדינה שלה בשמונת החודשים הקרובים, תוך כדי אדישות לביצועים של המדינה המתחרה. כמו כן נאמר לנו כי כרגע שתי המדינות מוכרות את הנפט שלהן ב-20 דולר לחבית.
בכל זאת ניתוח אנליטי קצר של המשחק, לפני שאעבור לחוויות ולתובנות. קל לראות כי האסטרטגיה של קביעת מחיר הנפט ב-20 דולר לחבית שולטת על האסטרטגיה של 30 דולר. לא משנה מה יהיה המחיר שאלבה תקבע, תמיד עדיף לבתיה למכור ב-20 ולא בשלושים. אם למשל, המחיר של אלבה הוא 30 דולר לחבית, אז במחיר של 30 דולר לחבית בתיה תרוויח 11 מליון דולר, ובמחיר של 20 דולר לחבית בתיה תרוויח 18 מליון דולר, וכן הלאה. מכאן שאף פעם לא כדאי לבתיה לקבוע מחיר של 30 דולר לחבית. אותם השיקולים נכונים גם למדינת אלבה, ולכן אם אנשי אלבה רציונליים, גם הם לעולם לא יקבעו מחיר של 30 דולר לחבית. מעשית, ניתן למחוק את המחיר 30 מטבלת התשלומים, ולהסתפק בטבלה מצומצמת:
הכנסות בתיה ממכירת נפט (במליוני דולרים) |
מחיר הנפט של בתיה (דולר לחבית) | |||
10 | 20 | 30 | ||
מחיר הנפט של אלבה (דולר לחבית) |
30 | 15 | 18 | 11 |
20 | 15 | 8 | 2 | |
10 | 5 | 3 | 2 |
הבעיה היא שעכשיו, הפלא ופלא, ניתן להפעיל את אותו השיקול על הטבלה המצומצמת, ואם מניחים שאלבה לעולם לא תקבע מחיר של 30 דולר לחבית, תמיד עדיף למכור ב-10 דולר לחבית ולא 20 דולר לחבית. אותם השיקולים אמורים להנחות גם את אלבה, ובסיכומו של דבר, נקודת שיווי המשקל (של נאש) במשחק הזה היא שכל מדינה מוכרת את הנפט שלה ב-10 דולר לחבית ונהנית מהכנסה חדשית של 5 מליון דולר, תוצאה נחותה מהתוצאה שהייתה מתקבלת לו היו קובעות שתי המדינות מחיר של 20 דולר לחבית או אפילו 30 דולר לחבית.
הדינמיקה שהתפתחה הייתה דומה לדינמיקה שהתפתחה אז. (המעוניינים יכולים לראות כאן את מהלכי שלושת המשחקים. אני שיחקתי בקבוצת בתיה במשחק 2). שתי קבוצות התחילו מייד לשחק את נקודת שיווי המשקל 10-10. בדיון שנערך לאחר סיום המשחק הסבירו זאת ברצון להביא את הסיכון שלהם למינימום. שתי קבוצות אחרות פתחו ב-20-20, ובדיון שלאחר המשחק הסבירו זאת ברצון לשמר את המצב שהיה קיים (כזכור היה נתון כי בתחילת המשחק מחיר הנפט של שתי המדינות היה 20 דולר לחבית). המשחק השלישי החל גם הוא ב-20-20. הקבוצה ששיחקה מול הקבוצה שלי גם היא רצתה לשמר את המצב הנתון. אני, לעומת זאת, שכנעתי את חברות הקבוצה שלי כי כדאי להתחיל ב-20 כאיתות לרצון טוב, והמחיר של 20 ממזער נזקים אפשריים שיגרמו עקב מחיר תחרותי של המדינה השניה, אך עדיין נותן מרחב לתמרון. למעשה, האסטרטגיה “מידה כנגד מידה” עמדה מול עיניי.
אולם בהמשך העניינים התחממו. שתי הקבוצות שפתחו ב-10-10 עברו עוד סיבוב של 10-10, ואז אחת הקבוצות העלתה את המחיר שלה ל-20, כדי לאותת “בואו נתקדם”. שתי הקבוצות האחרות שהתחילו ב-20-20 הדרדרו לשני סיבובים רצופים של 10-10. במשחק “שלי” שיחקנו 20 גם בסיבוב השני אך קיבלנו 10 מהקבוצה השניה. לכן החלטנו להעניש אותם ב-10 בסיבוב השלישי, ולהפתעתנו הקבוצה שמולנו שיחקה 30 בסיבוב השלישי, ומאוחר יותר הסבירו זאת בכך שרצו לאותת כי הם רוצים להמנע מנקודת הקפאון של 10-10.
בשלב הזה התאפשר משא ומתן בין הקבוצות המתחרות. כמו כן נמסר כי עקב המצב בקפיטה, ההכנסות בסיבוב הרביעי יהיו כפולו מהרגיל.
מה קרה לאחר המשא ומתן? שתי קבוצות של משחק מספר 3 סיכמו על 30-30 ועמדו בסיכום בשלושת הסיבובים הבאים.
שתי הקבוצות של משחק מספר 1 סיכמו גם הן על 30-30, אך אלבה לא עמדה בסיכום, וכבר בסיבוב הראשון אחרי המו”מ “הכניסו” לבתיה 10, וגרפו 30 מליון בעוד שהכנסות בתיה צנחו ל-4 מליון. בסיבוב הבא הם שיחקו 10-10, ובסיבוב שלאחריו אני אלבה כנראה חשו רגשות אשמה על הבגידה שני סיבובים קודם לכן, ובהניחם כי בתיה תשחק שוב 10 קבעו את מחיר הנפט שלהם ל-20, כסוג של פיצוי לבתיה על הפסדיהם בסיבוב הרביעי. האם זה השתלם? אם תעשו חשבון תגלו כי אלבה הרוויחו מכל התרגיל 3 מליון דולר. האם זה היה שווה את המשקעים שנוצרו בעקבות הפרת האמון?
אצלנו, לעומת זאת הדברים התפתחו אחרת. אני נשלחתי כנציג הקבוצה שלי. לפני שיצאתי למו”מ סיכמנו ביננו כי נציע לקבוצה הבאה שנשחק 2 סיבובים 20-20 ואחר כך נעלה ל-30-30. לא היינו מעוניינים להציע לשחק מייד 30-30, משתי סיבות: ראשית, היו לנו חששות לאור ה-10 ששוחק מולנו בסיבוב השני. שנית, הפיתוי לסטות מ-30-30 גדול מדי. לכן כשבעת המו”מ הקבוצה שמולנו הציעה שנתאם את מחיר הנפט ונקבע אותו על 30 דולר סירבתי, והעליתי את ההצעה שלנו. הנציגה שמולי אמרה לי כי אין לה סמכות לקבל החלטה על כך. לכן הבהרתי כי בסיבוב הבא נשחק 20, ונמשיך לעשות כן כל עוד הם ישחקו 20 גם הם. 2 הסיבובים הבאים לאחר המו”מ התנהלו כצפוי – פעמיים 20-20. אבל בסיבוב שלאחר מכן חלה התפתחות מעניינת. שתי שותפותיי לקבוצה דרשו להוריד את מחיר הנפט ל-10, ולאחר דין ודברים נאלצתי לקבל את הכרעתן. הקבוצה שמולנו העלתה את המחיר ל-30, כי הבינו שאנו בכל זאת נעלה את המחיר ל-30 אחרי שני סיבובים ב-20. התוצאה: משבר אמון. אחרי המשחק התברר לי כי בקבוצה שמולי שיחק אדם שאני עובד איתו באופן סדיר, וגם מי שהייתה המנהלת שלי במשך יותר מ-4 שנים (עד שקודמה לתפקיד בכיר יותר). מייד שנפגשנו בסיום המשחק (במהלך המשחק ישבנו בחדרים נפרדים) הם שאלו אותי “איך עשיתי להם כזה דבר”. לא נעים.
בתום הסיבוב השישי הודיעו לנו כי תנאי המשחק משתנים שוב: בשני הסיבובים האחרונים, השביעי והשמיני, הכנסותיה של הקבוצה שתציע מחיר נמוך יותר יוכפלו פי ארבע (אם שתי הקבוצות קובעות את אותו המחיר, ההכנסות נשארות ללא שינוי), וזאת בגלל המצב במדינת קפיטה. כמו כן, התאפשר לנו לקיים עוד מפגש עם נציג הקבוצה שמולנו. הפעם סירבתי לצאת למו”מ, בעקבות התקרית שחוללנו בסיבוב השישי.
מהן האפשרויות שעמדו בפנינו? אפשרות אחת היא לשחק 30-10 ואחר כך 10-30. כך הקבוצה שתשחק 10 בסיבוב השביעי תרוויח 60 מליון והקבוצה שתשחק 30 תרוויח 2 מליון, ובסיבוב שלאחר מכן מתחלפים. באפשרות הזו כל קבוצה תרויח סך של 62 מליון בשני הסיבובים האחרונים. אם משחקים 30-20 ואח”כ 20-30, כל קבוצה תרויח 74 מליון, ואם משחקים 10-20 ואח”כ 20-10, כל קבוצה תרויח 63 מליון. כיוון שהאפשרות של 30-10 כמעט זהה לאפשרות של 20-10 היא ירדה מהפרק, והאופציה שנדונה ברצינות היא האופציה של 20-10, שוב, בגלל שהפיתוי לבגוד כאשר מנסים לשחק 30-10 גדול מדי.
השאלה העיקרית היא – מי יהיה ראשון? כלומר, איזה צד יזכה להציע את המחיר הנמוך בסיבוב השביעי, ואז הצד שכנגד ייאלץ לסמוך עליו כי יקיים את חלקו בהסכם בסיבוב השמיני? כולם רצו להיות ראשונים, גם הנציגה שלנו שיצאה למו”מ מול נציג הקבוצה שמולנו. אולם היא לא זכתה לנהל מו”מ של ממש. הנציג של הקבוצה השניה הודיעה לה כי הוא ישחק 10 בסיבוב השביעי בכל מקרה. לנו רק נותר לבחור אם נשחק בסיבוב השביעי 10 או 20. אם נשחק 20, הובהר לנו, אזי הקבוצה שמולנו תשחק 20 בסיבוב השמיני ותאפשר לנו לרבע את הכנסתנו ממשחק 10 בסיבוב השמיני. אם נבחר ב-10 בסיבוב השביעי, אז הם ישחקו 10 גם בסיבוב השמיני. אכן, מידה כנגד מידה.וכך היה: שיחקנו 20 בסיבוב השביעי, 10 בשמיני, וגרפנו 63 מליון. אותו מהלך קרה פחות או יותר (אם כי איני יודע את פרטי המו”מ) במשחק נוסף.
במשחק השלישי חלה התפתחות מעניינת. סוכם שם לשחק 20-30 ואח”כ 30-20, אולם הקבוצה שהייתה אמורה לשחק 30 בסיבוב השביעי טעתה ושיחקה 20 בטעות. התוצאה: 20-20, אף קבוצה לא קיבלה את הבונוס. בסיבוב השמיני, הקבוצה שנבגדה כמובן הורידה את המחיר ל-10, והקבוצה שטעתה העלתה את המחיר ל-30, כדי לפצות את הקבוצה שמולם על הטעות שעשו.כאן המשחק היה אמור להסתיים, וכאן באה עוד הפתעה: סיבוב נוסף. המסר: תמיד יש טווח ארוך. דובי הסביר זאת היטב בתגובה שלו לרשימה שלי על החוויות מדילמת האסירים שפרסמתי לפני כשנה:
האיטרציה של המשחק לא באמת נגמרה אחרי הפעם העשירית. המשחק הזה היה מוטמע בתוך משחק אחר, הרבה יותר משמעותי בתועלות ובהפסדים הפוטנציאליים שלו. כאמור, אם המשחק היה על סכום כסף משמעותי, ובמיוחד אם המשחק היה עם זרים גמורים, סביר להניח שהתוצאות היו שונות בעליל. ההטמעה של המשחק במשחק החברתי הגדול יותר של מקום העבודה יצרה את התנאים הדרושים לקיומו של אמון – שבלעדיו אין משמעות לעצם יצירת התקשורת ביניכם.
עוד שלוש הערות לסיום:
בדפים שקיבלנו היה מקום לרשום את מהלי המשחק והרווחים של כל אחת מהקבוצות בכל סיבוב. מעניין שכולם, פרט למשתתפת אחת, מילאו באדיקות את כל הנתונים וחישבו את רווחי הקבוצה המתחרה, למרות שנאמר לנו בפירוש כי אנו אמורים להיות אדישים לרווחי הקבוצה שמתחרה מולנו. מתברר יכ יצר התחרות חזק מההוראות.
שנית, מתברר שהתחרות בין אלבה ובתיה הועילה להן, אך לא לקפיטה. כזכור, במצב שהיה קיים לפני תחילת המשחק, מחיר הנפט היה 20 דולר לחבית. לו נשמר המחיר בכל 8 סיבובי המשחק, אלבה ובתיה היו מכניסות 72 מליון דולר כל אחת (וקפיטה הייתה משלמת 144 מליון דולר). בפועל, הקבוצה שלי, בתיה, הרוויחה 128 מליון דולר וקבוצת אלבה שהתמודדה מולנו שלשלה לקופתה 114 מליון. קפיטה שילמה בסך הכל 98 מליון דולר יותר מאשר הייתה משלמת לו לא הייתה תחרות בין שתי ספקיות הנפט שלה. בעקבות הדיון בתגובות עם דובי, אני כבר לא בטוח בדברים האלה, ולכן הן נמחקו. ברור שחלק מההכנסות גדלו עקב סיבובי הבונוס (שעל פי סיפור המסגרת נבעו מבעיות בקפיטה – מזג אויר קשה ותקלה בכור הגרעיני שהביאו להגדלת הביקוד ליבוא נפט). אבל גם אם מוציאים אותם מהחישוב, לא ברור מה קורה. בכל מקרה, אני לוקח את דבריי בחזרה, ומודה לדובי על קריאתו הביקורתית והערותיו המועילות.
ולסיום – דבר שכבר עמדתי עליו במהלך הרשימה אבל נראה לי שחשוב להדגיש אותו: גם כאשר אין ערוץ תקשורת בין המשתתפים במשחק, ניתן בהחלט להעביר מסרים בין הקבוצות, על ידי המהלכים שמשחקים. מי שמשחק ברידג’ מכיר את הרעיון הזה היטב. המעשים שלנו מהווים מסר בפני עצמם, ולא רק הדברים שאנו אומרים. התובנה הזו מסבירה גם את התפקיד שיש במשחק למחיר של 30 דולר לחבית (ואני מודה כי הבנתי זאת רק בסיום המשחק, לא בתחילתו). באמצעות קביעת מחיר של 30 ניתן לאותת לקבוצה השניה על רצון טוב, וגם לפצות אותה על מעשים שאנו מצטערם עליהם, בין אם עשינו זאת בכוונה ובין אם לאו. כשאר מחקתי את העמודה והשורה של ה-30 מטבלת המשחק, עשיתי מעשה נכון מבחינה מתמטית, אבל לא בהכרח מעשה נכון מבחינת התנהלות.
מעניין מאוד.
רק הערה לעניין ההפסדים לכאורה של קפיטה: לא עשיתי את החישוב, אבל נראה לי שהם לא קנו אותה כמות של נפט שהם היו קונים לו המחיר היה נשאר קבוע. כלומר, אני לא בטוח שהם בהכרח הפסידו כסף כאן – יכול להיות שהם פשוט יכלו להרשות לעצמם לקנות הרבה יותר נפט בגלל התחרות. (במילים אחרות, התחרות הגדילה את העוגה).
הממ
בהחלט יש משהו בדבריך. כיוון שאין מספיק נתונים, התעלומה תישאר.
מדוע אין מספיק נתונים? ידוע לנו מחיר חבית בכל חודש בכל מדינה וכמה שילמה קפיטה לכל מדינה בכל חודש. מכאן אפשר לחשב די בקלות כמה חביות נקנו לאורך כל התקופה, וכמה חביות היו נקנות אילו המחיר היה נותר קבוע לכל אורך המשחק. אני פשוט עצלן מכדי לאסוף את הנתונים מתוך הפוסט ולחשב.
אתה שוב צודק. מה הייתי עושה בלעדיך? אני מרים את הכפפה ואעשה את החישוב.
נו?
(:
לא שכחתי, פשוט חוץ מהבלוג יש לי גם משפחה ועבודה…
עשיתי כמה חישובים (אתה יכול לראות אותם על הספרדשיט בגוגל דוקס בו תיארתי את מהלכי המשחקים), אבל עוד לא הגעתי למסקנה חד משמעית. העוגה גדלה – לפעמים, לא תמיד. קפיטה מרוויחה? יש מצבים שכן, אבל לא תמיד.
ממה שאני רואה, המחיר הממוצע לחבית בכל חודש הוא נמוך יותר מ-20 בכל קונסטלציה חוץ מאשר 20-30 ו-30-30. במשחקים 1 ו-2, לא הייתה אף איטרציה שהניבה קונסטלציה גרועה יותר מ-20-20, ולכן, גם בלי חישוב מדוייק, אפשר להסיק שקפיטה שילמה פחות פר חבית (בממוצע) מאשר אם האיזון היה נשמר על 20-20. את משחק שלוש צריך לחשב, וגוגל דוקס מעצבן אותי, אז הוא ישאר כתעלומה.
לא הכנסתי לחישוב עניינים של הכפלת וריבוע רווחים, אבל זה לא צריך לשנות, לפחות לא בשני המשחקים הראשונים.
אני לוקח את דבריי בחזרה
תובנה בסיסית, המקרינה על כל המשחק (שבשל ההתעלמות ממנה, שיחקו כולם באופן בלתי מושכל):
מתוך הנחה (שאכן ניתנה במשחק) שאין תחרותיות (במשמעות של לדפוק את היריב) אלא המטרה היא למקסם רווחים, הניתוח האמיתי הוא שלו היו עובדות אלבה ובתיה בשיתוף פעולה יעיל, כלומר במיקסום הרווח המשותף וחלוקתו בשווה, היתה האחת קובעת מחיר 20 בעוד השניה 30, ובחודש הבא – מתחלפות. רק על סמך הבנה בסיסית זו, ומתוך הנחה שהשותף/יריב הינו אינטיליגנטי דיו להבין עובדה זו גם כן, ניתן לבנות אסטרטגיה ואפילו טקטיקה מושכלות.
נעם, אתה טועה. גם אם אין לי שום מטרה לדפוק את המתחרה, עדיין אין לי שום סיבה לסמוך עליו. אם אנחנו מגיעים להסכם האמור, ואכן בסיבוב הראשון המתחרה בוחר 30 ואני בוחר 20, אני יכול לדעת שבסיבוב הבא הוא יבחר 20. למה לי לבחור שלושים ולהפסיד כסף? אני יכול לבחור 10 ולהרוויח בגדול. גם המתחרה יודע שאני יכול לעשות את זה, ולכן הוא לא יסמוך עלי, ובסיבוב הראשון יבחר בעצמו ב-10 וידפוק אותי.
זו הרי כל דילמת האסיר – הבעיה היא לא ברציונליות של השחקנים, אלא בחוסר האמון ביניהם. מכיוון שהאחד אינו יכול לשלוט או אפילו לפקח על פעולותיו של השני, אלא רק לצפות בהן בדיעבד, לא קל להגיע לטקטיקה המיטבית שתיארת.
ואכן, בהנחיות לשחקנים נאמר בפירוש כי היחסים בין אלבה לבתיה אינם טובים, ואין קשרים דיפלומטיים בין המדינות. עוד נאמר בפירוש כי כל נסיון לתאם מחירים עם המדינה המתחרה ייחשב לבגידה.
דברי היו רלוונטיים רק לסיבובים 7,8 במשחק, ואז תאום היה מותר. עם זאת, גם ללא הסכמים, הדברים תקפים.
דנתי במה צריך להיות לנגד עיני השחקן בטרם יגיע להחלטה. ניתוח הנתונים הכרחי, ובתאור של יוסי הנתון המהותי שהזכרתי לא הועלה. המודעות לו הכרחית, כאמור לצורך בניית אסטרטגיה טובה.
לגבי סיבובים 1-6, למשל, האסטרטגיה הנכונה היא, למרבית ההפתעה, לתמחר 30 באופן קבוע!
ארחיב ואעמיק:
ה’אדישות’ הנדרשת להחלטות היריב הינה מדומה. אדישות אמיתית היתה מבטלת את הדילמה: כל שנצרך הוא לגבש אסטרטגיה מול ניהול רנדומלי של הצד שכנגד, ומיידי לראות שמול יריב חסר אסטרטגיה משלו הנכון הוא להציג מחיר 10 בכל פעם (כי ממוצע ההכנסות הוא 11.67, גבוה יותר מן הממוצע בשתי האפשרויות האחרות). אלא שמכיוון שמולנו שותף שהחלטותיו אינן אקראיות אלא שכלתניות, עלינו להניח שאף הוא יכריז על 10 ואז הרווח צולל ל-5, וזוהי בדיוק דילמת האסיר: האסטרטגיה במקרה של שותף נבון שונה מזו במקרה של שותף אקראי, כי החלטתי שלי מקרינה, באמצעות השותף, על עצמה.
על כן הניתוח, מלכתחילה, חייב לקחת בחשבון את החלטת ה’ראי’ של השותף: עלי להבין שההחלטה שלי היא משותפת – גם ללא כל הסכם. האסטרטגיה המיטבית במקרה זה היא לחשב – ועדיין לא לבצע! – איזו החלטה הסכמית תביא למקסום הרווח המשותף. מתוך הנחה שהשותף אינטיליגנטי כמוני ועל כן החלטתו תשקף את שלי, עלי לבצע החלטה אסטרטגית זו – ואז שנינו נרוויח הכי הרבה, אל מול היריב האמיתי שלנו: קפטה, המשלם. (כמובן, אם אני חושש שהשותף איננו נבון דיו, או שיש לו אינטרסים נוספים/אחרים, כמו לדפוק אותי גם אם הוא מפסיד מזה, עלי לבחור בכיוון אחר; אך המידע לגבי האסטרטגיה המשותפת הטובה ביותר הינו הכרחי בכל בניית אסטרטגיה בה אני לוקח בחשבון שותף נבון שלפחות אחד האינטרסים שלו, גם אם לא המכריע, הוא מיקסום רווח).
מכאן נובע, בתנאי הטבלה לעיל, שההחלטה לשחק 30 היא הנכונה, כי מתוך 3 אפשרויות התאומות, 10-10, 20-20 ו-30-30 היא הרווחית ביותר.
עם שינוי התנאים אחרי סיבוב 6 נוצר ספין נוסף. כעת האסטרטגיה הטובה ביותר למיקסום הרווח המשותף היא: 20-30. החיסרון שלה הוא שאיננה שיקופית; אך מכיוון שאין עוסקים בארוע בודד אלא בצמד של ארועים אפשר לבנות אסטרטגיה של זיג-זג , 20-30, תור תור. איך להגיע טקטית זוהי בעיה – אך שלא כדברי דובי, לא זו היא ‘דילמת האסיר’. דילמת האסיר איננה נובעת מבעיית האמון אלא היא מובנית בעצם ההשלכה החוזרת של החלטת האסיר על עצמה מכוח הנחת תבונת השותף, כפי שניתחתי לעיל.
בתנאים החדשים ישנו קצ’ שיוסי עמד עליו: לו היה מדובר במערכת יחסים ארוכת טוח התנהלות אמינה של שני הצדדים היתה הכרחית לצורך מיקסום הרווח. הטווח המוגבל במשחק המדובר – שני ארועים בלבד – יוצר מערכת לא יציבה, בה הסיבוב האחרון קריטי ומקרין לאחור על הקודם.
מכיוון שבניית אמון איננה מטרה במשחק אלא רק כלי למיקסום הרווח, בסיבוב האחרון אין לאף אחד עניין לשמור על אמינות ושני הצדדים יחתרו למיקסום נקודתי: הכרזת 10. וממילא גם סיבוב 7 מקבלא אותו איפיון והתוצאה עגומה.
על פי ההגדרות היבשות של המשחק אין מפלט מזה. לחידוד העניין: לו שני השותפים היו מחשבים, זו היתה התוצאה המוכרחת. אך כאן נכנס חשבון נוסף, פסיכולוגי.
המשך יבוא.
אתה ממשיך לא להבין שדילמת האסיר היא לא חידה מתמטית – היא חידה פסיכולוגית. הבעיה היא שאני לא יכול לדעת מה יעשה הצד השני ואין לי שום שליטה על כך, ובחישוב פשוט אפשר לראות שזה לא משנה מה יעשה הצד השני – תמיד כדאי יותר לי, בודאי בטווח המיידי, לשחק 20, על פני לשחק 30.
לצד השני אין אינטרס לדפוק אותי, אבל יש לו אינטרס למקסם רווחים, ולכן, אם הוא יחשוב שאני הולך לשחק 30, האינטרס הברור שלו הוא לשחק 20 ולמקסם את הרווחים שלו. זה רציונלי לעילא.
וזו דווקא כן דילמת האסיר. דילמת האסיר אינה תלויה כלל באפשרות לתקשר – לתקשורת אין משמעות אם אין אמון בין הצדדים, והיא נובעת בדיוק מתוך הנחת התבונה של הצד השני. דילמת האסיר הוא פרדוקס שבא להראות שדווקא מתוך ניסיון למקסם רווחים, מושגת תוצאה שאינה פארטו-מקסימלית.
אתה ממשיך לטעון שאינני מבין, ולא לקבל את זה שאני חולק עליך.
אבהיר שוב: דילמת האסיר איננה בעיה של אמון. זו בעיה נלווית, טקטית. דילמת האסיר המהותית היא שההתנהגות שאתה מפנה אליה – אני מצטט: “ובחישוב פשוט אפשר לראות שזה לא משנה מה יעשה הצד השני – תמיד כדאי יותר לי, בודאי בטווח המיידי, לשחק X, על פני לשחק Y” – כלומר, ההתנהגות הרציונלית (לכאורה) איננה מביאה לתוצאות הטובות ביותר. הסיבה, כאמור, היא שהצד השניא יננו ‘אקראי’ בבחירתו אלא רציונלי, ועל כן נוצר שיקוף. ההחלטות שלנו תלויות, עד גבול מסוים, זו בזו (אם כי לא באופן ישיר), ועל כן האסטרטגיה הטובה ביותר ורכבת יותר מ’החישוב הפשוט’.
אני מפנה אותך לערך ‘דילמת האסיר’ בתוך קבוצת המושגים בתורת המשחקים בויקיפדיה. אני מקווה שתיווכח לדעת שהבעיה היסודית הינה מתמטית ולא פסיכולוגית.
אחרי שבררנו מהי האסטרטגיה האופטימלית כאשר יש שיתוף פעולה בין שני השחקנים הנבונים (שהיא גם האסטרטגיה האופטימלית בכלל), נוצרת בעיה משנית של איך ליצור את שיתוף הפעולה הזה כאשר אין חשבונות נוספים חוץ ממקסום הרווח (כמו אי פגיעה באמינות כהגנה על אופציות עתידיות, כבוד עצמי, הגינות כערך ועוד), לא רק על יסוד הפיקפוק הסודי ביושרו של השותף אלא במיוחד על רקע הבעיה המתמטית המקורית, שכשאין מדובר במשחק מתמשך – דילמה איטרטיבית – היא ניצבת במלוא עוזה, כמכתיבה לכאורה את המהלך האחרון ורדוקטיבית את אלה שלפניו.
לבעיה הטקטית הזו הפתרון הוא אכן פסיכולוגי. אמנם החישוב מתעל אותי, במשחק הנידון, להצגת מחיר 10, אך השיקוף יוצר מצב של רווח משותף נמוך בלבד. הפיתוי להרוויח יותר מפי 7 בניהול שונה הוא גבוה, והנזק במקרה של פיספוס איננו נורא (יחסית לרווח האפשרי). לכן ניהול רציונלי אמיתי כן יביא לתימחור 20-30 של שני הצדדים (בין אם יש תקשורת ובין אם אין). ההחלטה הטובה ביותר היא זו: להחליט מראש לשחק פעם אחת 20 ופעם שניה 30 מתוך עיוורון שבבחירה לתוצאות סיבוב 7. את הסדר נבחר אקראית. השיקוף יוצר מצב אופטימלי: אם אחד התחיל 20 והשני 30, הרווח של כל אחד הוא 74. ואם התחילו אותו דבר, הרווח הכולל הוא 19. בכל מקרה טוב מאסטרטגיית 10-10, והממוצע גם הוא נאה.
ואני שב ומדגיש: זוהי אסטרטגיה מתמטית מיטבית, בלי ערוב ‘שיקולים זרים’ – ועם זאת היא לוקחת בחשבון אפשרות של ‘בגידה’ מסוגים שונים – שאינם ממיטים קטסטרופה כלכלית והם כדאיים לעומת סיוכוי הרווח. ההערה הזו נחוצה כי במקרה של בגידה שהזקה רב ורווח פוטנציאלי לא גבוה בניהול הדדי מיטבי, השיקולים יצטרכו עיון מחודש.
כן, רק שחישוב האסטרטגיה האופטימלית הוא טריוויאלי (לכן לא ברורה לי ההכרזה שלך בראשית הדיון כאילו גילית את אמריקה לגבי ההתנהלות האופטימלית). דווקא מה שאתה מכנה “בעיה משנית” הוא הדבר שהופך את כל העסק לדילמה, ולא לסתם תרגיל אלמנטרי בחשבון.
live it
שלום רב
אחת מהשואלות בפורום שלנו התיחסה לאתר שלך, נכנסתי והתלהבתי, בעיקר מהתאור המדוקדק והמקצועי. מהיירידה לפרטים והניתוח המעמיק.
ברשותך, אפנה את הפונים אלינו אל עמוד זה.
בתודה ובכבוד רב
ליאור מנצ’ר – משחק החיים