קישורים

ניווט

נושאים

ארכיב עבור תגית הסתברות

ממתינים לתוצאות הסופיות

אני מניח שכולכם יודעים מה קורה/קרה בבחירות בארה”ב בשנת 2020.  תהליך ספירת הקולות נמשך על פני מספר ימים, וכל מה שאפשר לעשות זה לעקוב אחרי התהליך: מי מוביל הספירה באיזו מדינה ובכמה. דוגמה אקראית מבוקר כתיבת שורות אלה: הכותרת של כלכליסט היא “הדרמה בארה”ב: כמעט שוויון בפנסילבניה ובג’ורג’יה, טראמפ מצמצם הפער באריזונה“.

יש נקודה חשובה שמשום מה מתעלמים ממנה: ההצבעה הסתיימה, ותוצאות הבחירות כבר נקבעו. רק שאנחנו עדיין לא יודעים מי ניצח כי לא סיימו לספור את כל הקולות. (( איזה קולות סופרים? זו שאלה אחרת שחורגת מתחומי העניין של הבלוג הזה)).

כל הדרמה הזו הזכירה לי בעיה ישנה  מסוף המאה ה-19, שנקראת פשוט “בעיית הבחירות” (The ballot problem). הניסוח מאוד פשוט. שני מועמדים מתחרים בבחירות. אם מוציאים את פתקי ההצבעה מהקלפי זה אחד זה באופן אקראי, מה הסיכוי כי המועמד שקיבל את רוב הקולות יוביל לאורך כל מהלך הספירה?

הקישור שהופיע בפיסקה הקודמת יוביל אתכם לעמוד בויקיפדיה שבו תוכלו לקרוא על ההיסטוריה של הבעיה הזו, ועל כל מיני דרכים שנמצאו כדי לפתור אותה. אפשר למשל לנסות לרשום/לספור את כל המהלכים האפשריים של ספירת הקולות, ואת כל המהלכים האפשריים שבהם המנצח מוביל לאורך כל הספירה. אפשר להשתמש באינדוקציה מתמטית. הפתרון המקורי השתמש בנוסחת נסיגה. אני רוצה להציג כאן פתרון אחר  שמבוסס על הפתרון של המתמטיקאי הצרפתי Désiré André.

סיפורנו מתחיל בעיירה ציורית במרכז אילינוי, שם מתגוררים כמה אלפי אנשים, ויש בה רק קלפי אחת. הם בוחרים באחד משני המתמודדים לנשיאות, בואו נקרא להם ג’ו ודונלד. כל קשר לפוליטיקה מקרי לחלוטין. בחרתי בשם ג’ו מכיוון שכאשר התגוררתי בארה”ב האמריקאים הכירו אותי בשם ג’ו, ובשם דונלד כי בין היתר יש לי אוסף מפואר של כ-150 ברווזים.

נניח שג’ו קיבל A קולות, ודונלד קיבל B קולות, ובאופן מסתורי אנחנו יודעים את הערכים המספריים של A ו-B לפני שהתחילה ספירת הקולות, ואנחנו גם יודעים כי A גדול מ-B, כלומר ג’ו ניצח. מה הסיכויים שג’ו יוביל לאורך כל תהליך ספירת הקולות?

יש מספר תרחישים אפשריים. נתחיל במקרה הכי קל: הפתק הראשון שהוצא מהקלפי הוא של דונלד. דונלד מוביל, ולכן ג’ו לא מוביל לאורך כל הספירה. הסיכוי לתרחיש הזה הוא B/(A+B).

עכשיו בואו נשים לב כי מכיוון שג’ו ניצח, אם דונלד מוביל בשלב מסויים, אז בנקודת זמן כלשהי לאחר מכן ייווצר שיוויון קולות, כי ג’ו קיבל יותר קולות. הנה דוגמה לתרחיש אפשרי שבו זה קורה:

מספר הקולות
שנספרו
למי ניתן הקולהיתרון של ג’ו
1דונלד1-
2דונלד2-
3דונלד3-
4ג’ו2-
5דונלד3-
6דונלד4-
7ג’ו3-
8ג’ו2-
9ג’ו1-
10ג’ו0

מה שקורה אחר כך לא ממש משנה. כל תרחיש שבו הקול הראשון הוא קול לדונלד מגיע בנקודה כלשהי לשוויון בספירה, וההסתברות לתרחיש הזה היא כאמור B/(A+B) . אפשר לתאר את התרחיש הזה בגרף הבא:

מה קורה אם הקול הראשון שנספר ניתן לג’ו? כאן ג’ו מוביל בתחילת הספירה, ולאר מכן יש שתי אפשרויות: או שג’ו ימשיך להוביל לאורך כל הספירה, או שבשלב מסויים ייווצר שיוויון בקולות.

בואו נוסיף לגרף שלנו תרחיש אפשרי שבו ג’ו מתחיל להוביל, אבל לאחר מכן הספירה מגיעה לשוויון:

אני לא בחרתי את התרחיש הזה באופן מקרי! התרחיש השני (הכחול) הוא השיקוף של התרחיש הראשון (האדום). למעשה, לכל אחד מהתרחישים שבהם דונלד מוביל בתחילת הספירה (לאחר שהקול הראשון נספר), יש תרחיש מקביל שבו ג’ו מקבל את הקול הראשון שנספר והספירה מגיעה לשוויון. גם ההיפך נכון: לכל אחד מהתרחישים שבהם ג’ו מוביל בתחילת הספירה (לאחר שהקול הראשון נספר) והספירה מגיעה בשלב כלשהו לשוויון, יש תרחיש מקביל שבו דונלד מקבל את הקול הראשון שנספר ואז הספירה חייבת להגיע לשוויון.

לכן ההסתברויות לשני סוגי התרחישים – תרחיש שבו דונלד מוביל בתחילת הספירה, ותרחיש שבו ג’ו מוביל בתחילת הספירה אך אינו מוביל לאורך כל הספירה – שוות, וכל אחת מהן שווה ל- B/(A+B). אם נחבר אותן נקבל את ההסתברות לתרחיש שבו ג’ו אינו מוביל לאורך כל הספירה, והסתברות זו שווה ל- 2B/(A+B).

מכאן קל לחשב כי ההסתברות שג’ו יוביל לאורך כל הספירה שווה ל-1 פחות ההסתברות שהוא לא יוביל לאורך כל הספירה, כלומר ל- (A+B)/(A-B).

שימו לב כי התוצאה היא בעצם ההפרש בין מספרי הקולות שניתנו למועמדים חלקי סך כל הקולות. מעניין, אבל לא בהכרח אינטואיטיבי.

אתם מוזמנים להמשיך להחזיק אצבעות למען המועמד המועדף שלכם.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

משפט הקופים

קוף מקבל כל פעם כדור ומניח אותו באחד משני סלים בהסתברויות שוות. בכל סל יש מקום לשני כדורים ואם סל מתמלא מרוקנים אותו מייד. כאשר יש בדיוק כדור אחד בכל סל, הקוף מקבל בננה. הוא מתחיל עם שני סלים ריקים. כמה כדורים יניח בממוצע עד שיקבל בננה?

אפשר לגשת לחידה הזו בכמה צורות.

הגישה ה-“נאיבית”

מי שלא בקיא בסטטיסטיקה והסתברות, יכול לחשוב על הגישה הבאה: ברור שאחרי כדור אחד הוא לא יקבל בננה. אחרי שני כדורים הוא יקבל בננה בהסתברות חצי, או שלא יקבל בננה ואז הוא יעמוד שוב בפני שני סלים ריקים. אם לא קיבל אחרי 2 כדורים, זה בגלל שהוא שם את שני הכדורים הראשונים באותו סל, ואז הוא ניצב שוב בפני שני סלים ריקים ולכן ברור כי הוא לא יקבל בננה אחרי הכדור השלישי. אבל הוא יכול לקבל בננה אחרי הכדור רביעי אם ישים את הכדור הרביעי בסל הריק. מה הסיכוי שנגיע עד לכאן? רבע, כי הסיכוי שהקוף יגיע לכדור השלישי הוא חצי, ומכאן כמו קודם יש לו סיכוי של חצי להגיע לבננה בעוד שני כדורים, וחצי של חצי זה רבע.

מכל הדיון הזה אפשר להסיק כי מספר הכדורים עד קבלת הבננה חייב להיות זוגי, וכן כי הסיכוי לקבלת בננה אחרי שני כדורים הוא חצי, אחרי ארבעה כדורים הסיכוי הוא רבע, אחרי שישה כדורים – שמינית, וכך הלאה.

אפשר לקרוא לגישה הזו בהרבה שמות, אבל נאיבית היא לא. לאלה שהגיעו עד לכאן – אנא קבלו את התנצלותי על כך שהטעיתי אתכם בכותרת. אני קורא לגישה הזו בשם “הגישה הנכונה“. זה מה שצריך לעשות: למצוא את כל האפשרויות, ואת הסיכוי/הסתברות של כל אפשרות.

עכשיו רק צריך לשקלל את האפשרויות בהסתברויות שלהן. כלומר לחשב את זה:

זה דורש קצת אלגברה, ואני אדלג על החישוב ברשותכם. התוצאה היא 4.

גישה שניה: מציאת בעיה דומה

זו גישה מקובלת: אם עומדים בפני בעיה, מנסים למצוא בעיה דומה שכבר פתרנו, ובעזרת הפתרון הזה מגיעים לפתרון של הבעיה הנוכחית (( מכירים את הסיפור על המתמטיקאי והפיזיקאי שנתבקשו להרתיח מים בקומקום? ))

אפשר לנסח את הבעיה של הקוף באופן הבא: הוא מקבל שני כדורים, ושם כל אחד מהם בסל באופן אקראי. אם חילק אותם שווה בשווה בין שני הסלים, הוא מקבל בננה. אם לא – הוא יכול לנסות שוב.

כדי שהגישה הזו תעבוד צריך לשים לב לשני פרטים חשובים. קודם כל – שני הסלים שונים זה מזה. אני מניח שאף אחד לא יתווכח על זה. נקרא לסלים בשם הסל הימני והסל השמאלי.

הפרט השני בדרך כלל יותר בעייתי: גם שני הכדורים שונים זה מזה. אם כדור אחד היה אדום ואחד היה כחול, אז הטענה הזו הייתה ברורה לגמרי. אבל לפעמים קשה לשים לב להבדלים בין הכדורים. אולי ההבדלים הם רק בשריטות שיש על הכדורים. אפילו אם מדובר בשני כדורים חדשים מהניילון – הם עדיין שונים זה מזה. וגם אם הם זהים בכל פרט שאתם יכולים לדמיין – הם עדיין שונים זה מזה. אלה שני כדורים ולא כדור אחד. הם מורכבים מאטומים שונים. לכן נקרא לכדורים האלה בשם כדור א וכדור ב. מה יכול לקרות כשהקוף מקבל את שני הכדורים? יש ארבע אפשרויות

  • שני הכדורים בסל הימני
  • שני הכדורים בסל השמאלי
  • כדור א בסל הימני וכדור ב בסל השמאלי
  • כדור א בסל השמאלי וכדור ב בסל הימני

ומכיוון שהקוף בוחר באופן אקראי את הסל שבו יניח כל כדור, לכל ארבע האפשרויות האלה יש סיכוי שווה, והסיכוי הזה שווה לרבע. ומכיוון שבדיוק שתי אפשרויות שבהן הקוף יקבל בננה, הסיכוי שהוא יקבל בננה הוא חצי.

אז בעצם יכולנו להקל על הקוף ולתת לא להטיל מטבע. אם יצא פלי, מה חבל. אם יצא עץ, הקוף יכול לטפס על העץ ולקטוף לעצמו בננה.

וכך הפכנו את בעיית הקוף לבעיה שכולנו (( אני מקווה )) מכירים. כמה פעמים בממוצע צריך להטיל מטבע הוגן עד קבלת עץ? התשובה היא אחד חלקי הסיכוי לקבלת עץ, כלומר אחד חלקי חצי, כלומר 2. אבל רגע, בכל “הטלת מטבע” כזו הקוף מקבל 2 כדורים, ולכן מספר הכדורים הוא 2 כפול 2, כלומר 4, אותה התשובה שקיבלנו קודם.

גישה שלישית: שרשרת מרקוב – לא להיבהל!

דיברתי כבר על שרשראות מרקוב כאשר דנתי בבעיית המטריות. שאלת הקוף היא עוד דוגמא נחמדה לשרשרת מרקוב.

ניזכר: שרשרת מרקוב היא קבוצה של מצבים, בצירוף ההסתברות לעבור ממצב למצב.

לשרשרת של הקוף יש שלושה מצבים:

  1. שני סלים ריקים. נסמן מצב זה ב-00.
  2. סל אחד ריק ובשני יש כדור. נסמן מצב זה ב-01.
  3. כדור אחד בכל סל. נסמן מצב זה ב-11.

אם הקוף במצב 00 הוא יכול לעבור רק למצב 01. יש שני סלים ריקים, הוא מקבל כדור ושם אותו באחד הסלים. זה כל מה שאפשר. ההסתברות לעבור ממצב 00 למצב 01 שווה ל-1.

אם הקוף במצב 01 יכולים לקרות שני דברים: או שהוא שם את הכדור הבא בסל שכבר יש בו כדור. בסל יש שני כדורים, מרוקנים אותו, והקוף חוזר למצב 00. זה קורה בהסתברות חצי. הדבר השני שיכול לקרות הוא שהקוף ישים את הכדור בסל הריק, יגיע למצב 11, יקבל בננה, והמשחק נגמר. גם זה יכול לקרות בהסתברות חצי.

אם הקוף במצב 11 הוא כבר לא מתעניין בנו, כי יש לו בננה. ההסתברות לעבור ממצב 11 למצב 00 או 01 היא 0. המצב הבא, אם נתעקש, יהיה שוב 11. כלומר, ממצב 11 עוברים למצב 11 בהסתברות 1.

הנה תיאור ציורי של השרשרת:

הקוף למעשה מטייל לו בין מצבים 00 ל-01 עד שבמקרה הוא מצליח לעבור למצב 11. בעזרת הציור קל לראות שמספר הכדורים שהקוף יניח עד קבלת הבננה הוא זוגי.

איך כל זה עוזר לנו?

נניח שממוצע מספר הצעדים/כדורים מ-00 ל-11 הוא X.

כפי שראינו קודם, X שווה ל-2 בהסתברות 0.5.

אבל אם בשני הצעדים הראשונים שלו הקוף יצא מ-00 וגם חזר לשם, אז ממוצע מספר הצעדים שנותרו לו מעכשיו הוא גם כן X! וזאת מכיוון שמצבו עכשיו, לאחר שני צעדים לא שונה מהמצב ההתחלתי. כלומר, ממוצע מספר הצעדים אם אנחנו יודעים שהוא כבר עשה סיבוב אחד של 00 ל-01 ל-00 הוא 2+X. ההסתברות שזה יקרה גם כן שווה לחצי. ולכן

פתרון המשוואה הזו הוא X=4.

משפט הקופים

המסקנה מתוך כל הדיון הזה: אם תתנו לקוף לתקתק מספיק זמן על מכונת כתיבה הוא ידפיס את כל כתבי שייקספיר.

רגע? מה?

בואו נחזור לבעיה המקורית, זאת עם הכדורים והבננה. מה הסיכוי שהקוף יטייל במשך כל חייו האינסופיים בין המצבים 00 ו-01?

קודם ראינו כי הסיכוי שהוא יגיע לבננה אחרי 2 צעדים הוא חצי, אחרי 4 צעדים – רבע, אחרי 6 צעדים – שמינית, וכך עד אינסוף. לכן הסיכוי שהוא יקבל בננה שווה לחצי ועוד רבע ועוד שמינית וכן הלאה. זהו סכום של טור גיאומטרי אינסופי, והסכום הזה שווה ל-1. ההסתברות שהקוף יקבל בננה היא 1.

עכשיו, בואו נרחם על הקוף שלנו, ולפני שנטיל עליו להדפיס את כל כתבי שייקספיר נבקש ממנו לתקתק את המילה “יוסי”. הקוף נמצא בעצם בשרשרת מרקוב בת שני מצבים. במצב אחד יש לו דף נייר חלק, ובמצב השני יש דף שעליו מתנוסס השם שלי.

הקוף מקבל דף חלק. זהו מצב 0. הוא מתקתק ארבע אותיות ובא אלי להראות לי מה הוא הצליח לעשות. אם כתוב “יוסי” אני נותן לו חיזוק חיובי ומשחרר אותו עד מחר. הוא הגיע למצב 1. אם לא, אני מקמט את הנייר, זורק לפח, ונותן לו דף נייר חדש, שינסה שוב, עד שיעשה את זה כמו שצריך.

זה כמו הטלת מטבע, רק שהסיכוי להטלת עץ הוא מאוד קטן. אבל לא אפס. נסמן את הסיכוי הזה באות p. הקוף מתחיל במצב 0, עובר למצב 1 בהסתברות p ונשאר במצב 0 בהסתברות p-1. אם הוא מגיע למצב 1 הוא נשאר שם בהסתברות 1.

כמו קודם, אם הוא יטיל את המטבע שוב ושוב בסוף יתקבל עץ. אפשר לחשב כמו קודם סכום של טור גיאומטרי אינסופי ולראות כי ההסתברות לקבל עץ או לתקתק את כל כתבי שייקספיר שווה ל-1. הקוף יצטרך בממוצע 1/p ניסיונות. כל מה שאתם צריכים זה לחכות.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

בעיית ימי ההולדת

שוב פירסמתי סקר בטוויטר שמאחוריו מסתתרת רשימה על בעיה מעניינת בהסתברות – והפעם בעיית ימי ההולדת. הנה השאלה והתפלגות התוצאות:

בואו ננסה להבין ביחד מה קורה כאן. לשם כך, כרגיל, צריך להניח הנחות.

ההנחה הראשונה היא שאין תלות בין תאריכי הלידה של שני אנשים שונים. כלומר, אם אתם יודעים, למשל, שאני נולדתי ב-13 באוקטובר ((אל תשכחו לציין את זה בלוח השנה שלכם)), זה לא אומר לכם כלום על תאריך ההולדת של דונלד טראמפ, וגם לגבי תאריך ההולדת של כל אדם אחר. שימו לב שבהנחה הזו אנו מוציאם מהמשחק אפשרות של תאומים, שלישיות וכולי.

ההנחה השנייה היא שיש בשנה 365 ימים, ויש לכן 365 ימי הולדת אפשריים. ההנחה הזו מאפשרת לי להתעלם מכל האנשים המעצבנים שנולדו ב-29 לפברואר.

ההנחה השלישית היא שהתפלגות ימי ההולדת היא אחידה. פירוש הדבר הוא שהסיכוי כי אדם שבחרתם באופן מקרי נולד ב-1 בינואר שווה לסיכוי שהוא נולד ב-35 במאי, או בכל יום אחר בשנה, והסיכוי הזה הוא 1/365.

כרגיל, אפשר להתווכח על ההנחות, ולהחליף כל הנחה בהנחה אחרת, אבל זה רק יגרום לחישובים יותר מסובכים, בעוד שהתשובות המהותיות לא ישתנו. אם החישובים לא מדברים אליכם, דלגו עליהם, והתרכזו בעקרונות ובתוצאות. כדאי לכם להגיע עד הסוף, כי יש גם סרט.

ועכשיו נענה לשאלות. אם יש 23 אנשים באוטובוס, מה ההסתברות שלשניים מהם יש יום הולדת באותו יום?

אפשר לשאול את השאלה הזו בצורה אחרת: מה המספר המינימלי של אנשים באוטובוס כדי שההסתברות שלשניים מהם יש יום הולדת באותו יום תעלה על 50%?

קודם כל אסביר מדוע יש מספר אנשים שבו ההסתברות שלשניים מהם יש יום הולדת באותו יום עולה על 50%.

ובכן, אם יש באוטובוס רק בן אדם אחד (הנהג, אני מקווה), ההסתברות כי יש באוטובוס שני אנשים שנולדו באותו יום היא כמובן 0.

אם יש באוטובוס שני אנשים, ההסתברות ששניהם נולדו באותו יום היא 1/365. אסביר: ההסתברות ששניהם נולדו ב-1 בינואר היא 1/365 כפול 1/365. ההסתברות ששניהם נולדו ב-2 בינואר היא שוב 1/365 כפול 1/36, וכן הלאה. נחבר 1/365 כפול 1/365 לעצמו 365 פעמים, ונקבל 1/365.

אם יש באוטובוס 3 אנשים ההסתברות ששניים מהם נולדו באותו יום גבוהה יותר. ההסתברות שהנהג והנוסע הראשון נולדו באותו יום היא כאמור 1/365, אבל יש לקחת בחשבון גם את האפשרות שהנהג והנוסע השני נולדו באותו יום, וגם את האפשרות ששני הנוסעים נולדו באותו יום. התוצאה אמנם אינה חיבור פשוט של כל שלושת ההסתברויות ((כי יש חפיפה בין המאורעות)), אבל אני מקווה שברור כי היא גבוהה יותר.

אם נוסיף עוד נוסע ועוד נוסע ועוד נוסע ההסתברות שיש באוטובוס שני אנשים שנולדו באותו יום תלך ותגדל.

אם יהיו באוטובוס 366 איש ((זה אוטובוס ממש גדול)), ההסתברות שבאוטובוס יש שני אנשים שחולקים יום הולדת מגיעה ל-100%: במקרה הכי גרוע יש 365 אנשים שכל אחד נולד ביום אחר בשנה, ואז יום ההולדת של האדם ה-366 חייב להיות זהה ליום הולדת של אחד מהאחרים ((כי הנחנו שאין 29 בפברואר)). הטיעון הזה, אגב, מבוסס על טענה מתמטית המכונה “עקרון שובך היונים“.

ובכן, ההסתברות של המאורע שלנו מתחילה ב-0, גדלה ככל שנוספים אנשים לאוטובוס ומגיעה בסוף ל-100%. לכן חייבת להיות נקודה בה ההסתברות הזו תעבור את ה-50%. הנקודה הזו היא, באופן מפתיע, כאשר מספר האנשים באוטובוס מגיע ל-23. אני לא מתכוון לעבור כאן על כל החישוב, אבל  יש ברשת מחשבון לחישוב ההסתברויות , שם גם יש הסבר כיצד ההסתברות מחושבת. 23 הוא מספר יחסית קטן של אנשים, והאינטואיציה של רוב בני האדם ((כן, כן, גם שלי)) אומרת להם כי זה מספר קטן מדי של אנשים, יחסית למספר ימי ההולדת האפשריים. מסיבה זו בעיית ימי ההולדת מכונה “פרדוקס ימי ההולדת“, למרות שאין כאן שום סתירה לוגית.

אם תביטו שוב בתוצאות הסקר, אתם עלולים לחשוב כי כמעט מחצית מהמשיבים (49%) ענו את התשובה הנכונה. אבל זה לא נכון. זו התשובה הנכונה לשאלה שדנתי בה עד עתה, אבל זו לא התשובה לשאלה ששאלתי.

אני שאלתי מה ההסתברות כי בין 22 הנוסעים האחרים יש אדם שחולק איתי יום הולדת. במילים אחרות, מה ההסתברות שיש באוטובוס עוד אדם שנולד ב-13 באוקטובר. התשובה לשאלה הזו היא בערך 5%. כדי שההסתברות שמישהו באוטובוס חולק איתי יום הולדת תהיה בערך 50%, צריכים להיות עליו 253 אנשים. החישוב כאן יותר פשוט מהחישוב של השאלה הקודמת, ולכן אסביר אותו במפורט. מי שלא מתעניין בחישובים יכול לדלג פיסקה.

ההסתברות כי הנוסע הראשון מבין 22 הנוסעים האחרים נולד ב-13 באוקטובר היא 1/365, ולכן ההסתברות כי לא נולד ב-13 באוקטובר היא 364/365. באופן דומה, ההסתברות כי הנוסע השני לא נולד ב-13 באוקטובר גם היא 364/365, וכך הלאה לכל שאר הנוסעים. בגלל אי התלות בין ימי ההולדת, ההסתברות כי אף אחד מבין 22 הנוסעים האחרים היא לכן המכפלה של 364/365 בעצמו 22 פעמים. זה יוצא 0.941. מכאן שההסתברות כי לפחות אחד מבין ה-22 נולד ב-13 באוקטובר היא 1-0.941=0.058, או, בקירוב טיפה גס, בערך 5%. שליש מהמשיבים לסקר בחרו את התשובה הנכונה. ((ומי שענה “אחר” בגלל שהתוצאה יותר קרובה ל-6% מאשר ל-5%, גם זה סבבה))

יש הרבה פולקלור מסביב לבעיית ימי ההולדת. בספר הקלאסי Lady Luck מספר המחבר, המתמטיקאי וורן וויבר, כי השתתף בארוחה עם מספר גנרלים בזמן מלחמת העולם השנייה. הוא סיפר להם על בעיית ימי ההולדת, וכצפוי, הטענה כי אם יש בחדר 23 אנשים אז הסיכוי ששניים מהם חולקים יום הולדת היא כ-50% לא תאמה את האינטואיציה של חלק מהנוכחים. מכיוון שבארוחה השתתפו 22 איש, הם החליטו להעמיד את הטענה למבחן: כל אחד מהמשתתפים אמר מהו יום הולדתו, ולא נמצאו שני סועדים עם יום הולדת משותף. אז התערבה בשיחה המלצרית שנכחה בחדר ואמרה “סלחו לי, אבל אני האדם ה-23 בחדר, ויום הולדתי הוא ה-17 במאי, כמו יום ההולדת של הגנרל היושב שם”.

מבין 45 הנשיאים של ארצות הברית, הנשיאים פולק והרדינג נולדו שניהם ב-2 בנובמבר. הנשיאים פילמור וטאפט מתו שניהם ב-8 במרץ, ושלושת הנשיאים אדמס, ג’פרסון ומונרו מתו ב-4 ביולי. אף נשיא לא חולק איתי יום הולדת.

ג’וני קארסון, המנחה ההמיתולוגי של ה-Tonight Show, התעמק גם הוא בבעיה. בשידור ב-6.2.1980 הוא סיפר לאורח שלו כי מספיק שיהיו 35-40 אנשים בחדר, כדי שיימצאו ביניהם שני אנשים שחולקים יום הולדת משותף.  (אם יש בחדר 35 אנשים, ההסתברות היא כ-85%. כשיש 40 אנשים ההסתברות היא כמעט 90%). המרואיין לא השתכנב וקארסון החליט לערוך הדגמה. הוא שאל גברת מהקהל מה תאריך הלידה שלה, והיא ענתה שיום הולדתה הוא ב-9 לאוגוסט. התברר כי אין עוד אדם בקהל שזהו יום הולדתו. קארסון החליט לנסות שוב. הוא בחר מישהו אחר מהקהל, ויום הולדתו היה ה-9 באפריל. שוב התברר כי אין בקהל אדם נוסף שזהו יום הולדתו. קארסון המתוסכל ניסה שוב, הפעם עם יום ההולדת של עצמו, ה-23 באוקטובר. שוב לא היה בקהל אדם נוסף שזהו יום הולדתו. הפעם היו בקהל שני אנשים שחלקו עימו יום הולדת. ((תודה לגיל גרינגרוז ששהפנה את תשומת ליבי)) מי שהגיע עד לכאן כבר הבין כי קארסון חיפש תשובה לשאלה הלא נכונה. בקהל, אגב, היו כ-500 איש, מה ששמבטיח בודאות כי היו שם לפחות שני אנשים עם יום הולדת משותף. אתם מוזמנים לצפות בהקלטת השידור.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

איך להמר (אם אתה מוכרח)

איך להמר (אם אתה מוכרח)

אתם חייבים 100 אלף דולר לשוק האפור, אבל יש לכם רק 50 אלף, וצריך לשלם בערב. זה לא משנה אם יהיו לכם 50 אלף דולר, או 90 אלף, או 99,999. כל סכום קטן מ-100 אלף יגרום לתוצאות הרות אסון. הסיכוי היחיד שלכם נמצא בקזינו. אתם ניגשים לשולחן הרולטה, שם אפשר להמר על אדום-שחור. אם הימרתם בדולר אחד על אדום, והתוצאה היא אדום, תקבלו בחזרה את הדולר שלכם ודולר אחד נוסף. אם התוצאה אינה אדום ((יש עוד שתי אפשרויות – שחור וירוק)) הפסדתם את הדולר. יש לציין כי הסתברות הזכיה כאשר מהמרים על אדום היא קצת פחות מ-50%. מה הכי כדאי לעשות? מהי האסטרטגיה שתביא למקסימום את ההסתברות שתצאו מהקזינו ובכיסכם 100 אלף דולר?

שאלה דומה לזו הוצגה בעמוד הראשון של הספר הקלאסי How to gamble if you must מאת Lester E. Dubins, ‎Leonard J. Savage, andb ‎William Sudderth. כותרת המשנה של הספר היא Inequalities for Stochastic Processes, ומעידה על כך שזהו בהחלט ספר מתמטי. ההוכחה לתשובה שמייד אציג נמצאת בפרק החמישי של הספר, למי שמתעניין. כאן אנסה לתת הסבר אינטואיטיבי לתשובה.

אבל לפני כן קצת שעשועים. בסקר שערכתי בטוויטר השתתפו 46 צייצנים. הדיעות התחלקו פחות או יותר שווה בשווה בין ארבע התשובות האפשריות שהוצעו:

לפני שנדון בתשובות קצת היסטוריה, על קצה המזלג. משחקי הימורים היו נפוצים כבר בזמנים קדומים, ויש תיעוד שלהם בכל התרבויות העתיקות. מחקרים אודות הימורים ומשחקי מזל שערכו מלומדים כקרדנו במאה ה-16, כריסטיאן הויגנס במאה ה-17, ואברהם דה-מואבר ויעקב ברנולי במאה ה-18, ואחרים, הניחו את היסודות לתורת ההסתברות. למעשה, הפתרון שאציג מייד נובע מעבודה של דה-מואבר משנת 1711.

ועוד אנקדוטה (אולי משעשעת): בראשית ימיה, עמדה חברת FedEx בפני משבר. היה עליה לשלם חוב של 24,000 דולר, כשבקופתה היו 5000 דולר בלבד. יו”ר החברה ומייסדה, נטל את הכסף שבקופה, טס ללאס וגאס, הימר בשולחן הבלאק ג’ק וזכה ב-27,000 דולר. כך ניצלה החברה, והשאר, כמו שאומרים, היסטוריה. תודה לשי אלקין שהסב את תשומת ליבי לסיפור.

למתעניינים בהיסטוריה של חקר ההימורים והנחת יסודות תורת ההסתברות, אמליץ לקרוא את הספר נגד האלים מאת פיטר ברנשטיין, או את הספר הקלאסי
Games, Gods and Gambling מאת פלורנס נייטיגייל דייויד (( שאין לבלבל בינה ובין פלורנס נייטינגייל )) .

ועכשיו לתשובות.

תשובה אפשרית אחת היא שלא משנה מה עושים כי ממילא נפסיד הכל. זה נכון. ההימור נוטה לטובת הקזינו. ההסתברות לזכיה ברולטה בהימור על אדום (או על שחור) היא 18/38, בערך 47%. מי שיהמר לאורך זמן יצבור אט אט הפסדים, ומי שימשיך להמר עוד ועוד יפסיד בסופו של דבר את כל כספו.  את זה הוכיח כריסטיאן הויגנס. מי שענה את התשובה הזו בסקר צדק.

אבל חדי העין ישימו לב כי השאלה כפי שנוסחה כאן שונה מעט מהניסוח בטוויטר, גם בגלל מגבלת התוים בטוויטר ואולי גם בגלל חוסר דיוק מצידי. בואו נדון באסטרטגיה שתביא למקסימום את ההסתברות לצאת מהקזינו עם 100 דולר, כאשר מגיעים אליו עם 50 אלף דולר. כאן בגדול יש שתי אפשרויות. אפשרות אחת היא להמר מייד על כל הסכום, בתקוה שתזכה בהימור אדום-שחור וכספך יוכפל. ההסתברות לכך היא, כאמור, בערך 47%.

מה קורה אם מהמרים כל פעם על חלק מהסכום? בואו ניקח לדוגמא את האסטרטגיה הבאה: להמר על 25 אלף דולר, לקוות לזכות ועל ידי כך להגדיל את הונך ל-75 אלף דולר, ואחר כך להמר שוב על 25 אלף דולר, כאשר זכיה תביא אותך אל הסכום הנכסף של 100 אלף דולר. במקרה הטוב ביותר תגיע למטרה על ידי שתי זכיות רצופות של 25 אלף דולר כל אחת. ההסתברות לכך היא 0.47 כפול 0.47 ((בהנחה הסבירה לגמרי שאין תלות בין ההימורים )) , כלומר בערך 22.4%.

יש כמובן אפשרות שתפסיד בהימור הראשון את 25 אלפי הדולרים עליהם הימרת. עכשיו יהיה עליך להכפיל את הונך פי 4, וזה ידרוש שוב לפחות שתי זכיות רצופות ((להמר על 25, לזכות, ואז להמר על 50 ושוב לזכות )) , וההסתברות לכך היא שוב כ-22.4%.

אם מהמרים על סכומים קטנים יותר, יש צורך ביותר זכיות, וההסתברות להגיע ל-100 אלף דולר צונחת בהתאם.

זו האינטואיציה שעומדת מאחורי הקביעה כי האסטרטגיה האופטימלית היא להמר מייד על כל הסכום בתקווה להכפילו. ברנולי ודה-מואבר הבינו זאת כבר בראשית המאה ה-18. הוכחות מתמטיות מלאות לטענות קרובות הופיעו בתחילת המאה ה-20.

רק רגע, יש עוד אפשרות: לעשות משהו אחר. אפשר להמר בשיטת ההכפלות, הידועה גם בשם  שיטת המרטינגייל.

הנה הרעיון: אתה מתחיל בהימור אדום שחור על דולר. אם זכית – קיבלת את הדולר שלך בחזרה ועוד דולר אחד כרווח. אם הפסדת, לא נורא. המר כעת על שני דולר. אם זכית, אתה מקבל את שני הדולרים שלך בחזרה, ועוד שני דולרים כרווח, בסך בכל ארבעה דולרים. אבל הימרת רק על שלושה דולרים! מכאן שהרווחת דולר.

ומה קורה אם הפסדת גם בהימור השני? אין בעיה. הכפל את סכום ההימור והמר כעת על ארבעה דולר. אם זכית, תקבל שמונה דולר, אבל הימרת רק על שבעה דולר (1+2+4). הרווחת דולר.

ומה אם הפסדת בהימור על ארבעת הדולרים? אין בעיה. הכפל את סכום ההימור ל-8 דולר. אם תזכה תקבל בחזרה 16 דולר, כשהימרת רק על 15 דולר – כלומר שוב הרווחת דולר.

ומה יקרה אם הפסדת בהימור על שמונת הדולרים? אולי עדיין אין בעיה, אבל בקרוב תהיה לך בעיה.

קודם כל נתייחס לבעיה הספציפית שלנו – להגיע מ-50 אלף דולר ל-100 אלף דולר. בשיטה הזו זה ייקח קצת זמן, ותצטרך לזכות בהרבה הימורים בדרך.

כמובן, אם עומד לרשותך סכום כסף בלתי מוגבל, השיטה הזו תוביל אותך לזכיה בהסתברות 1. אבל, הסכום שעומר לרשותך (( ולרשות כל אחד, בעצם )) מוגבל, וייתכן מאוד שתגיע למצב בו אין בידיך מספיק כסף כדי להכפיל את ההימור. למעשה, אפשר להוכיח כי אם תהמר בשיטה זו לאורך זמן, תגיע למצב בו אין בידיך די כסף כדי להכפיל את ההימור בהסתברות 1.

שלישית, ברוב בתי הקזינו יש הגבלה על גובה ההימור. שיטת ההכפלות תביא אותך בסופו של דבר אל המחסום הזה ואז לא תוכל למשיך ולהכפיל את ההימור גם אם יש בכיסך את הסכום הדרוש.

באופן אישי, אם היה לי קזינו, לא הייתי מתנגד לכך שיהמרו נגדי בשיטת ההכפלה. אדרבא. אמנם מדי פעם אפסיד דולר, אך ההפסד הזה יכוסה על ידי ההפסדים של כל המכפילים שיגיעו לגבול ההימור שלהם, והפסדים אלה יהיו יותר נפוצים ויותר גדולים מדולר אחד.

אז אם אתם רוצים להמר בשביל הכיף – סבבה. אם אתם רוצים להרוויח כסף מהימורים, כדאי שיהיה לכם קזינו. והכי חשוב, אל תסתבכו עם השוק האפור.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

בעיית המטריות: איך לא להירטב?

השבוע שוב פרסמתי בטוויטר חידה הסתברותית: לבנאדם יש המון מטריות, חלקן בבית וחלק במשרד. אם יורד גשם הוא לוקח איתו מטריה מהמלאי. אם לא, הוא הולך לדרכו בלי לקחת מטריה. האם הוא יירטב? מספר המשיבים היה קטן יחסית, אבל רובם ידעו את התשובה הנכונה: בסופו של דבר הוא יירטב.

פתרון החידה מתבסס על מודל הסתברותי הנקרא שרשרת מרקוב. בויקיפדיה יש הסבר פורמלי טוב של המושג ההסתברותי. כאן, כהרגלי, אנסה להסביר את המושג באופן יותר אינטואיטיבי. לאחר ההסבר הבסיסי אסביר מדוע שרשרת מרקוב היא מודל טוב עבור החידה, ואראה כיצד מגיעים לפתרון.

שרשרת מרקוב היא תהליך מקרי. לשרשרת יש מספר מצבים (שיכול להיות סופי או אינסופי), ובכל צעד בשרשרת, נמצאים באחד המצבים האפשריים, ובצעד הבא עוברים ממצב זה למצב אחר, או נשארים במקום. המעבר נקבע באופן מקרי על סמך הסתברויות קבועות.

לדוגמא, נניח שיש לנו שרשרת מרקוב שבה יש שלושה מצבים אפשריים. נסמן אותם בספרות 0, 1, ו-2. השרשרת יכולה להראות כך: 0, 2, 1, 0, 0, 2, 1, 2, … וכן הלאה. פירוש הדבר הוא שהתחלנו במצב 0, משם עברנו למצב 2, משם עברנו למצב 1, וכן הלאה.

התכונה החשובה של המודל ההסתברותי הזה היא שלא משנה באיזה מצב נמצאים, המעבר למצב הבא לא תלוי בהיסטוריה של השרשרת, אלא רק במצב הנוכחי. אם השרשרת נמצאת במצב 2, למשל, ההסתברות שהיא תעבור למצב 1 היא אותה הסתברות גם במקרה שהשרשרת הגיע למצב הנוכחי ממצב 0 וגם במקרה שהיא הגיע למצב הנוכחי ממצב 1 או 2. כלל המעבר הוא אותו כלל.

כלל מעבר אפשרי כאשר נמצאים במצב 0, הוא שעוברים ממנו למצב 1 בהסתברות 1/2, עוברים למצב 2 בהסתברות 1/3, או שנשארים במצב 0 בהסתברות 1/6. ((ודאו ששלושת ההסתברויות שציינתי מסתכמות ל-1!)). באופן דומה יש לנו כללי מעבר דומים כאשר נמצאים במצב 1 או במצב 2.

עכשיו נראה איך המושג של שרשרת מרקוב עוזר לנו לפתור את בעיית המטריות.

בואו נסתכל תחילה על מקרה פרטי, בו לאיש שלנו יש רק מטריה אחת. נגדיר את המצבים של השרשרת להיות מספר המטריות שעומדות לרשות האיש. זה פשוט: או שיש לו מטריה במקום שבו הוא נמצא, או שאין לו. לכן המצבים האפשריים יהיו 0 ו-1.

איך הוא עובר ממצב למצב? זה תלוי בהסתברות שירד גשם. ההסתברות הזו לא נתונה לנו, ולכן אניח כי ההסתברות שירד גשם במקום בו הוא נמצא ועומד לצאת לדרכו היא קבועה ושווה ל-P כאשר P הוא מספר כלשהו בין 0 ל-1 (לא כולל את 0 ו-1). בכך הגדרנו מודל המתאר את תנאי החידה. ((אני סבור שגם כאשר P משתנה ואינו קבוע כל הזמן אפשר להגדיר שרשרת מרקוב מתאימה, עם מספר אינסופי של מצבים, ולהגיע לאותה תשובה, אך לא אכנס לזה כאן, או בכלל))

אם האיש שלנו נמצא במצב 1, כלומר יש לו מטריה בהישג יד, ויורד גשם, הוא ייקח עימו את המטריה למחוז חפצו, ושם שוב תעמוד המטריה לרשותו, כלומר הוא יישאר במצב 1. זה קורה בהסתברות P. אם לעומת זאת יש לו מטריה ולא יורד גשם, הוא הולך לדרכו בלי המטריה, ואז, במחוז חפצו, לא תעמוד לרשותו המטריה, כלומר הוא עובר ממצב 1 למצב 0 בהסתברות 1-P.

לעומת זאת, אם הוא נמצא במצב 0, אז הוא יעבור למצב 1 בהסתברות 1, כי לא משנה אם יורד גשם או לא יורד גשם, אין לו ברירה אלא לצאת לדרכו בלי מטריה, והמטריה תחכה לו במחוז חפצו.

כמובן, אם הוא נמצא במצב 0 ויורד גשם, אז הוא יירטב.

כעת אטען כי אם נסתכל על כל הפעמים שהוא נמצא במצב 1, בסופו של דבר הוא יעבור בודאות למצב 0. תחשבו על קוביה. אם תטילו אותה פעם אחת, ההסתברות שהיא תראה 6 היא 1/6. אבל ככל שתטילו אותה יותר ויותר פעמים גדל הסיכוי ש-6 יופיע בסופו של דבר. יתרה מזאת, אם נמשיך להטיל את הקוביה עוד ועוד, המספר 6 יופיע עוד ועוד פעמים. אם נטיל את הקוביה אינסוף פעמים, המספר 6 יופיע אינסוף פעמים, וזאת בהסתברות של 100%. ((אפשר להוכיח זאת באופן מתמטי )).

באופן דומה אפשר להוכיח כי אם נסתכל על כל הפעמים שהוא נמצא במצב 0, ואם השרשרת תרוץ עד איסוף הוא יהיה במצב 0 איסוף פעמים, בסופו של דבר ירד שם גשם, ולכן הוא יירטב.

מה קורה אם יש לו יותר ממטריה אחת?

כעת המצבים הם 0, 1 , ו-2.

אם יש לו מטריה אחת (מצב 1), הוא יעבור למצב 2, בו יש לו שתי מטריות, בהסתברות P (יורד גשם, והוא לוקח איתו את המטריה למקום שיש בו כבר מטריה אחת) או שיישאר במצב 1 (לא יורד גשם, ולכן הוא הולך בלי מטריה למקום ששיש בו מטריה אחת).

אם יש לו 2 מטריות הוא נמצא במצב 2, ויכול לעבור משם למצב 0 (כאשר לא יורד גשם, ולכן הוא הולך למקום בו אין לא אף מטריה) או לעבור למצב 1 (יורד גשם, הוא לוקח עימו מטריה למקום בו אין מטריות, ולכן תעמוד שם לרשותו מטריה 1.

אם הוא במצב 0 ויורד גשם הוא יירטב.

אם השרשרת תרוץ מספיק זמן היא תגיע בסופו של דבר למצב 0, ובסופו של דבר ירד גשם כאשר הוא במצב 0, אז הוא יירטב.

ומה אם יש לו המון מטריות? 4, או 50 או 1000? זזה לא משנה. הטיעון עדיין עובד. בסופו של דבר הוא יגיע למצב 0 כאשר יורד גשם, כלומר בסופו של דבר הוא יירטב.

מסקנה: תמיד תקחו אתכם את המטריה.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו