חיפוש באתר

קישורים

עמודים

קטגוריות

ארכיב עבור 'הממ… מעניין…'

משפט הקופים

קוף מקבל כל פעם כדור ומניח אותו באחד משני סלים בהסתברויות שוות. בכל סל יש מקום לשני כדורים ואם סל מתמלא מרוקנים אותו מייד. כאשר יש בדיוק כדור אחד בכל סל, הקוף מקבל בננה. הוא מתחיל עם שני סלים ריקים. כמה כדורים יניח בממוצע עד שיקבל בננה?

אפשר לגשת לחידה הזו בכמה צורות.

הגישה ה-“נאיבית”

מי שלא בקיא בסטטיסטיקה והסתברות, יכול לחשוב על הגישה הבאה: ברור שאחרי כדור אחד הוא לא יקבל בננה. אחרי שני כדורים הוא יקבל בננה בהסתברות חצי, או שלא יקבל בננה ואז הוא יעמוד שוב בפני שני סלים ריקים. אם לא קיבל אחרי 2 כדורים, זה בגלל שהוא שם את שני הכדורים הראשונים באותו סל, ואז הוא ניצב שוב בפני שני סלים ריקים ולכן ברור כי הוא לא יקבל בננה אחרי הכדור השלישי. אבל הוא יכול לקבל בננה אחרי הכדור רביעי אם ישים את הכדור הרביעי בסל הריק. מה הסיכוי שנגיע עד לכאן? רבע, כי הסיכוי שהקוף יגיע לכדור השלישי הוא חצי, ומכאן כמו קודם יש לו סיכוי של חצי להגיע לבננה בעוד שני כדורים, וחצי של חצי זה רבע.

מכל הדיון הזה אפשר להסיק כי מספר הכדורים עד קבלת הבננה חייב להיות זוגי, וכן כי הסיכוי לקבלת בננה אחרי שני כדורים הוא חצי, אחרי ארבעה כדורים הסיכוי הוא רבע, אחרי שישה כדורים – שמינית, וכך הלאה.

אפשר לקרוא לגישה הזו בהרבה שמות, אבל נאיבית היא לא. לאלה שהגיעו עד לכאן – אנא קבלו את התנצלותי על כך שהטעיתי אתכם בכותרת. אני קורא לגישה הזו בשם “הגישה הנכונה“. זה מה שצריך לעשות: למצוא את כל האפשרויות, ואת הסיכוי/הסתברות של כל אפשרות.

עכשיו רק צריך לשקלל את האפשרויות בהסתברויות שלהן. כלומר לחשב את זה:

זה דורש קצת אלגברה, ואני אדלג על החישוב ברשותכם. התוצאה היא 4.

גישה שניה: מציאת בעיה דומה

זו גישה מקובלת: אם עומדים בפני בעיה, מנסים למצוא בעיה דומה שכבר פתרנו, ובעזרת הפתרון הזה מגיעים לפתרון של הבעיה הנוכחית[1]

אפשר לנסח את הבעיה של הקוף באופן הבא: הוא מקבל שני כדורים, ושם כל אחד מהם בסל באופן אקראי. אם חילק אותם שווה בשווה בין שני הסלים, הוא מקבל בננה. אם לא – הוא יכול לנסות שוב.

כדי שהגישה הזו תעבוד צריך לשים לב לשני פרטים חשובים. קודם כל – שני הסלים שונים זה מזה. אני מניח שאף אחד לא יתווכח על זה. נקרא לסלים בשם הסל הימני והסל השמאלי.

הפרט השני בדרך כלל יותר בעייתי: גם שני הכדורים שונים זה מזה. אם כדור אחד היה אדום ואחד היה כחול, אז הטענה הזו הייתה ברורה לגמרי. אבל לפעמים קשה לשים לב להבדלים בין הכדורים. אולי ההבדלים הם רק בשריטות שיש על הכדורים. אפילו אם מדובר בשני כדורים חדשים מהניילון – הם עדיין שונים זה מזה. וגם אם הם זהים בכל פרט שאתם יכולים לדמיין – הם עדיין שונים זה מזה. אלה שני כדורים ולא כדור אחד. הם מורכבים מאטומים שונים. לכן נקרא לכדורים האלה בשם כדור א וכדור ב. מה יכול לקרות כשהקוף מקבל את שני הכדורים? יש ארבע אפשרויות

  • שני הכדורים בסל הימני
  • שני הכדורים בסל השמאלי
  • כדור א בסל הימני וכדור ב בסל השמאלי
  • כדור א בסל השמאלי וכדור ב בסל הימני

ומכיוון שהקוף בוחר באופן אקראי את הסל שבו יניח כל כדור, לכל ארבע האפשרויות האלה יש סיכוי שווה, והסיכוי הזה שווה לרבע. ומכיוון שבדיוק שתי אפשרויות שבהן הקוף יקבל בננה, הסיכוי שהוא יקבל בננה הוא חצי.

אז בעצם יכולנו להקל על הקוף ולתת לא להטיל מטבע. אם יצא פלי, מה חבל. אם יצא עץ, הקוף יכול לטפס על העץ ולקטוף לעצמו בננה.

וכך הפכנו את בעיית הקוף לבעיה שכולנו[2] מכירים. כמה פעמים בממוצע צריך להטיל מטבע הוגן עד קבלת עץ? התשובה היא אחד חלקי הסיכוי לקבלת עץ, כלומר אחד חלקי חצי, כלומר 2. אבל רגע, בכל “הטלת מטבע” כזו הקוף מקבל 2 כדורים, ולכן מספר הכדורים הוא 2 כפול 2, כלומר 4, אותה התשובה שקיבלנו קודם.

גישה שלישית: שרשרת מרקוב – לא להיבהל!

דיברתי כבר על שרשראות מרקוב כאשר דנתי בבעיית המטריות. שאלת הקוף היא עוד דוגמא נחמדה לשרשרת מרקוב.

ניזכר: שרשרת מרקוב היא קבוצה של מצבים, בצירוף ההסתברות לעבור ממצב למצב.

לשרשרת של הקוף יש שלושה מצבים:

  1. שני סלים ריקים. נסמן מצב זה ב-00.
  2. סל אחד ריק ובשני יש כדור. נסמן מצב זה ב-01.
  3. כדור אחד בכל סל. נסמן מצב זה ב-11.

אם הקוף במצב 00 הוא יכול לעבור רק למצב 01. יש שני סלים ריקים, הוא מקבל כדור ושם אותו באחד הסלים. זה כל מה שאפשר. ההסתברות לעבור ממצב 00 למצב 01 שווה ל-1.

אם הקוף במצב 01 יכולים לקרות שני דברים: או שהוא שם את הכדור הבא בסל שכבר יש בו כדור. בסל יש שני כדורים, מרוקנים אותו, והקוף חוזר למצב 00. זה קורה בהסתברות חצי. הדבר השני שיכול לקרות הוא שהקוף ישים את הכדור בסל הריק, יגיע למצב 11, יקבל בננה, והמשחק נגמר. גם זה יכול לקרות בהסתברות חצי.

אם הקוף במצב 11 הוא כבר לא מתעניין בנו, כי יש לו בננה. ההסתברות לעבור ממצב 11 למצב 00 או 01 היא 0. המצב הבא, אם נתעקש, יהיה שוב 11. כלומר, ממצב 11 עוברים למצב 11 בהסתברות 1.

הנה תיאור ציורי של השרשרת:

הקוף למעשה מטייל לו בין מצבים 00 ל-01 עד שבמקרה הוא מצליח לעבור למצב 11. בעזרת הציור קל לראות שמספר הכדורים שהקוף יניח עד קבלת הבננה הוא זוגי.

איך כל זה עוזר לנו?

נניח שממוצע מספר הצעדים/כדורים מ-00 ל-11 הוא X.

כפי שראינו קודם, X שווה ל-2 בהסתברות 0.5.

אבל אם בשני הצעדים הראשונים שלו הקוף יצא מ-00 וגם חזר לשם, אז ממוצע מספר הצעדים שנותרו לו מעכשיו הוא גם כן X! וזאת מכיוון שמצבו עכשיו, לאחר שני צעדים לא שונה מהמצב ההתחלתי. כלומר, ממוצע מספר הצעדים אם אנחנו יודעים שהוא כבר עשה סיבוב אחד של 00 ל-01 ל-00 הוא 2+X. ההסתברות שזה יקרה גם כן שווה לחצי. ולכן

פתרון המשוואה הזו הוא X=4.

משפט הקופים

המסקנה מתוך כל הדיון הזה: אם תתנו לקוף לתקתק מספיק זמן על מכונת כתיבה הוא ידפיס את כל כתבי שייקספיר.

רגע? מה?

בואו נחזור לבעיה המקורית, זאת עם הכדורים והבננה. מה הסיכוי שהקוף יטייל במשך כל חייו האינסופיים בין המצבים 00 ו-01?

קודם ראינו כי הסיכוי שהוא יגיע לבננה אחרי 2 צעדים הוא חצי, אחרי 4 צעדים – רבע, אחרי 6 צעדים – שמינית, וכך עד אינסוף. לכן הסיכוי שהוא יקבל בננה שווה לחצי ועוד רבע ועוד שמינית וכן הלאה. זהו סכום של טור גיאומטרי אינסופי, והסכום הזה שווה ל-1. ההסתברות שהקוף יקבל בננה היא 1.

עכשיו, בואו נרחם על הקוף שלנו, ולפני שנטיל עליו להדפיס את כל כתבי שייקספיר נבקש ממנו לתקתק את המילה “יוסי”. הקוף נמצא בעצם בשרשרת מרקוב בת שני מצבים. במצב אחד יש לו דף נייר חלק, ובמצב השני יש דף שעליו מתנוסס השם שלי.

הקוף מקבל דף חלק. זהו מצב 0. הוא מתקתק ארבע אותיות ובא אלי להראות לי מה הוא הצליח לעשות. אם כתוב “יוסי” אני נותן לו חיזוק חיובי ומשחרר אותו עד מחר. הוא הגיע למצב 1. אם לא, אני מקמט את הנייר, זורק לפח, ונותן לו דף נייר חדש, שינסה שוב, עד שיעשה את זה כמו שצריך.

זה כמו הטלת מטבע, רק שהסיכוי להטלת עץ הוא מאוד קטן. אבל לא אפס. נסמן את הסיכוי הזה באות p. הקוף מתחיל במצב 0, עובר למצב 1 בהסתברות p ונשאר במצב 0 בהסתברות p-1. אם הוא מגיע למצב 1 הוא נשאר שם בהסתברות 1.

כמו קודם, אם הוא יטיל את המטבע שוב ושוב בסוף יתקבל עץ. אפשר לחשב כמו קודם סכום של טור גיאומטרי אינסופי ולראות כי ההסתברות לקבל עץ או לתקתק את כל כתבי שייקספיר שווה ל-1. הקוף יצטרך בממוצע 1/p ניסיונות. כל מה שאתם צריכים זה לחכות.


הערות
  1. מכירים את הסיפור על המתמטיקאי והפיזיקאי שנתבקשו להרתיח מים בקומקום? []
  2. אני מקווה []

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

עוד שימוש מפתיע לרנדומיזציה: קבלת החלטות

לפני שבוע, הצייצן eSivion העלה סקר לא שגרתי בטוויטר, בו ביקש מהמשיבים להצביע כך התפלגות התשובות לסקר תהיה 10% לתשובה א, 20% לתשובה ב, 30% לתשובה ג ו-40% לתשובה ד:

הניסוי הצליח![1]

איך עושים את זה, או יותר נכון, איך הציבור הצליח לעשות את זה?

אחת המגיבים לסקר סיפק ספוילר כחצי שעה לאחר שהסקר פורסם:

 

טוב, אני לא יודע עד כמה הספוילר הזה השפיע על התוצאה הסופית. אומר רק שאני נתבקשתי לחוות את דעתי כמה דקות אחרי שהסקר עלה, ועניתי שאתייחס רק לאחר שהוא הסתיים. התשובה אל אותו ליאור היא אכן הדרך הנכונה להגיע להתפלגות שרוצים: רנדומיזציה, אם כי אני הייתי ממליץ על ספרת היחידות של השניות, או על מחוג השניות.

לפני כמה ימים כתבתי על רנדומיזציה בהקשר על ניסויים מבוקרים, אבל רעיון הרנדומיזציה טוב גם לדרים אחרים, כמו להשיג תוצאה מסויימת בסקר של טוויטר. אבל…

אם תצפו במשחקי טניס מקצוענים, תראו שרבים מן השחקנים עונדים שעון יד. זה לא בהכרח בלל שהם ממהרים לאן שהוא, ורוצים לסיים את המשחק בהתאם לתוכניות שלהם[2]. כאשר מגיע תורו של שחקן טניס לחבוט את חבטת הפתיחה, יש לו בגדול שתי אפשרויות: לחבוט ימינה או לחבוט שמאלה[3] . אם יחבוט כל הזמן ימינה, היריב ייערך בהתאם, וזה גם מה שיקרה אם יחבוט כל הזמן שמאלה. גם אם יחבוט ימינה ושמאלה לסירוגין, היריב יעלה על זה מהר מאוד. חייבים לשמור כל הזמן על יתרון ההפתעה. איך עושים את זה? מציצים בשעון. אם מספר השניות שעברו בדקה הנוכחית קטן משלושים, חובטים ימינה. אחרת – חובטים שמאלה. כך ליריב לא תהיה דרך טובה לחזות לאן תיחבט החבטה הבאה.

זה קורה גם בבייסבול. כאן יש פיצ’ר, שהוא השחקן שזורק את הכדור לעבר החובט. יש כל מיני סוגי זריקות שהפיצ’ר יכול לזרוק: כדור מהיר, כדור מסובב, וכדומה. אם החובט יודע מראש איזה סוג זריקה יזרוק הפיצ’ר, זה ישפר את סיכוייו לחבוט בכדור[4].

הפתרון הוא כמובן לזרוק את הכדור באופן שיקשה על החובט לנחש מראש מה יהיה סוג הזריקה. אפשר לעשות את זה על ידי רנדומיזציה, למשל על ידי מבט מהיר בשעון. גרג מאדוקס, אחד מגדולי הפיצ’רים בכל הזמנים, סיפר כי הוא השתמש בשיטה הזו כדי לקבל החלטות באשר לזריקה שאותה יזרוק. זה כמובן לא מספיק, כדי להיות כמו גרג מאדוקס צריך גם כשרון נדיר, אבל הרנדומיזציה בודאי שלא הזיקה לא.


הערות
  1. אם כי מבחן כי בריבוע מראה כי ההתפלגות של ההצבעות שונה באופן מובהק סטטיסטית מההתפלגות לה קיווה אי-שיוויון []
  2. כמו שקרה בסרטו של אלפרד היצ’קוק זרים הרכבת []
  3. אני מפשט קצת את הדברים []
  4. גם ככה הסכוי לחבוט נמוך למדי. החובטים הממש טובים מצליחים לחבוט בכדור בכ-30% מהפעמים []

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

מלחמת המינים

באיים המטריארכליים שבאוקיינוס השקט יש העדפה ברורה לבנות, ולכן כל משפחה מביאה ילדים לעולם עד שנולדת להם בת (לאחר שנולדת בת המשפחה מפסיקה להביא ילדים לעולם).

מהו יחס המינים באיים?

מתוך 47 איש שענו על שאלה זו בטוויטר, 36 ידעו את התשובה הנכונה: למרות שלכאורה יש משפחות עם הרבה בנים ורק בת אחת, עדיין יהיה מספר שווה בערך של גברים ונשים.

 

למה זה נכון?

כמקובל, יש צורך להניח מספר הנחות. ההנחות המקובלות הן:

  • בכל לידה נולד רק ילד אחד
  • כל ילד הוא בהכרח בן או בת
  • הסיכוי ללידת בן שווה לסיכוי ללידת בת
  • אין קשר בין המינים של הילדים השונים באותה המשפחה

ארבע ההנחות האלה יוצרות מודל: תיאור של המציאות, שייתכן שאינו מדוייק לגמרי, אבל הוא מספיק טוב כדי לתת תשובה אמינה לשאלה שלנו.

על ההנחות אפשר להתווכח. 3 ההנחות הראשונות יקלו עלינו את החישובים. 2 ההנחות הראשונות מתעלמות ממקרים של לידות תאומים, וממקרים נדירים בהם נולדים תינוקות שאינם זכר או נקבה ביולוגיים.[1] גם ההנחה השלישית אינה נכונה בטבע: ידוע כי נולדים יותר בנים מאשר בנות, והטבע “מאזן את עצמו” בכך ששיעור התמותה של תינוקות זכרים גבוה יותר. אפשר לבנות מודל יותר מורכב שייקח בחשבון הנחות יותר מורכבות, אבל זה רק יסבך את החישובים.

ההנחה הרביעית היא קריטית. אם היא לא נכונה, אז כל הניתוח שיוצג כאן אינו נכון. שוב, אפשר להחליף את ההנחה הזו בהנחה יותר מורכבת, אבל אין לנו שום סיבה לחשוד בכך שההנחה הזו לא נכונה.

עכשיו, כשיש לנו מודל, בואו ננסה לראות מה קורה. נסתכל על דור היפותטי באיים, שבו יש 1024 משפחות חדשות בתחילת דרכן. נניח גם כי בכל שנה יש לידה (במשפחות שאין בהן בת).

בשנה הראשונה, ל-512 משפחות תיוולד בת, ול-512 משפחות ייוולד בן[2]. בסוף השנה יש 512 בנות ו-512 בנים.

בשנה השניה, 512 המשפחות שלהן יש בן יביאו עוד ילד לעולם. ל-256 מהמשפחות האלה תיוולד בת, ול-256 משפחות ייוולד בן. כעת יש 768 בנים (512+256) וגם 768 בנות. יש 256 משפחות עם שני בנים ו-256 משפחות עם בן ובת.

בשנה השלישית, 256 המשפחות שלהן יש שני בנים יביאו עוד ילד לעולם. ל-128 מהמשפחות תיוולד בת, ול-128 מהמשפחות ייוולד בן. כעת יש 896 בנים (768+128) וגם 896 בנות. יש 512 משפחות עם בת אחת, 256 משפחות עם בן ובת, 128 משפחות עם שני בנים ובת, ו-128 משפחות עם שלושה בנים.

בשנה הרביעית, 128 המשפחות שלהן יש שלושה בנים יביאו עוד ילד לעולם. ל-64 מהמשפחות תיוולד בת, ול-64 מהמשפחות ייוולד בן. כעת יש 960 בנים (896+64) וגם 960 בנות. יש 512 משפחות עם בת אחת, 256 משפחות עם בן ובת, 128 משפחות עם שני בנים ובת, 64 משפחות עם שלושה בנים ובת, ו-64 משפחות עם ארבעה בנים.

וכן הלאה. אני אעצור את החישוב הזה כאן, כי ההמשך ברור.

ומכיוון שמשספר הבנים בסופו של דבר שווה למספר הבנות, במשפחה ממוצעת יש מספר שווה של בנים ובנות.

אפשר גם לחשב את גודלה של משפחה ממוצעת: יש לנו 512 משפחות עם ילד אחד (בת), 256 משפחות עם 2 ילדים, 128 משפחות עם שלושה ילדים, וכן הלאה. ולכן (בהנחה שאם יש 10 בנים מוותרים וזהו):

אז במשפחה ממוצעת יש למעשה שני ילדים, ילד אחד הוא בהכרח בת (פרט למשפחה חסרת המזל שבה יש 10 בנים) ובכל משפחה יש רק בת אחת, ולכן הילד הנוסף במשפחה הממוצעת הוא בהכרח בן. במילים אחרות, במשפחה ממוצעת יש בת אחת ובן אחד, ולכן כמובן מספר הבנים שנולדו ל-1024 המשפחות ההיפותטיות שלו שווה למספר הבנות.

אפשר ורצוי לערוך גם חישוב הסתברותי: ההסתברות שבמשפחה יש ילד אחד היא חצי, ההסתברות שבמשפחה יש שני ילדים היא רבע, ההסתברות שבמשפחה יש שלושה ילדים היא שמינית, וכן הלאה. לכן אפשר לחשב התוחלת של מספר הילדים במשפחה ולמצוא כי היא שווה ל-2:

 

את החישוב האחרון מבצעים בעזרת כמה תעלולים אלגבריים שכוללים בין השאר את הנוסחה לחישוב סכום של טור גיאומטרי/הנדסי שכנראה שמעתם עליה כשלמדתם מתמטיקה בבית הספר. זה לא מפתיע: סדרת ההסתברויות היא סדרה גיאומטרית: חצי, רבע, שמינית… כל הסתברות קטנה פי 2 מההסתברות הקודמת. לכן הסטטיסטיקאים מכנים את ההתפלגות שתוארה כאן בשם התפלגות גיאומטרית. מספר הילדים במשפחה הוא, בפי הסטטיסטיקאים, משתנה מקרי גיאומטרי. ושוב, מכיוון שעל פי תנאי השאלה תוחלת מספר הבנות במשפחה שווה ל-1, תוחלת מספר הבנים במשפחה חייבת גם היא להיות שווה ל-1, כלומר תוחלת מספר הבנים שווה לתוחלת מספר הבנות.

חישוב התוחלת הוא אולי מפחיד אבל התוצאה מאוד אינטואיטיבית. תחשבו על קוביה. אתם מטילים אותה ורוצים להוציא 5[3]. כמה הטלות בממוצע צריך להטיל עד שתקבלו 5? ההסתברות להטלת חמש היא שישית, ולכן האינטואיציה אומרת שצריך בממוצע 6 הטלות. 6 זה אחד חלקי שישית. גם במקרה הלידות אותה האינטואיציה עובדת. ההסתברות ללידת בת היא חצי, ולכן מספר הלידות הממוצע על לידת בת הוא אחד חלקי חצי, כלומר 2.

להתפלגות הגיאומטרית יש שימוש בכל מקום שבו רוצים לדעת כמה ניסיונות צריך לנסות עד להצלחה, זאת בתנאי שאין תלות בין הניסיונות וההסתברות להצלחה קבועה. איש מכירות, למשל, מעוניין לדעת כמה ניסיונות מכירה הוא צריך בממוצע לבצע עד שתתקיים מכירה. חולה הממתין לתרומת איבר להשתלה מעוניין לדעת כמה תורמים “יצטרך לחכות” עד שיימצא תורם מתאים. במקרה הזה, בהנחה שהסיכוי להתאמה של 10%, ושאין קשר בין התורמים (הנחה סבירה), יצטרכו בממוצע למצוא 10 תורמים פוטנציאליים עד שתימצא התאמה. אם בכל חודש מאותר תורם פוטנציאלי אחד, אז זמן ההמתנה הממוצע עד להשתלה הוא 10 חודשים.


הערות
  1. ואני מערבב כאן בין המין הביולוגי ובין המגדר לצורך נוחות הדיון, אבקש את סליחתכם []
  2. באופן תיאורטי כמובן, הכל באופן תיאורטי []
  3. נניח שהימרתם על 5, סתם []

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

איך אפשר לדעת מי תזכה במונדיאל?

לכאורה, אין דבר יותר פשוט מזה. חפשו בגוגל “מי תזכה במונדיאל”, ותקבלו המון תחזיות: תוכלו לדעת מה הייתה התוצאה של סימולציה שאיזה סטארט-אפ עשה, מה קבעו המומחים הפיננסיים, מה החליטו הקוראים של הארץ, והכי חשוב, מה חושבים נהגי המוניות:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

הבעיה העיקרית היא שהדרך הכי טובה לדעת מה יקרה במונדיאל כבר לא קיימת. פול התמנון, עליו השלום, כבר לא איתנו. אני מקווה שנשמתו צרורה בצרור החיים.

אבל יש מי שמנסה למצוא יורש לפול. האתר psychic-pets.com קורא לעזרתם של בעלי חיות מחמד מכל העולם ומבקש מהם לנסות לברר מה יקרה. נכון למועד כתיבת שורות אלו, קרוב לאלף חיות מחמד נרתמו למשימה, מתוכן 85 חיות מחמד מגרמניה ושתיים מאירן. גם חיית המחמד שלי נמצאת שם. זהו ברווז, כמובן. לא סתם ברווז אלא ברווז פלא, העונה לשם Coin.

אז מה הסיכוי שהחיות האלה, או אפילו רק אחת מהן, יחזו את תוצאות המונדיאל? בואו נשתעשע במספרים.[1]

קודם כל, למען הפשטות אני מוציא (בינתיים) מהמשחק את שלב הבתים, ומתרכז בשלב שאחריו, בו 16 נבחרות מתחרות בשיטת הנוק אאוט. יש בשלב הזה 15 משחקים משמעותיים (ועוד משחק אחד על המקום השלישי שהוא פחות מעניין). דרך אגב, כמה משחקים היו נערכים בשיטת הנוק אאוט אם לשלב הזה היו מגיעות לא 16 אלא 53 נבחרות? תחשבו על זה.

אז החיות שלנו צריכות לחזות את התוצאות של 15 משחקים. אני אשחק כאן את תפקיד פרקליטו של השטן ואטען שהחיות לא חוזות את התוצאות אלא מנחשות. אם כך, מה הסיכוי שחיה אחת תחזה את כל התוצאות של כל 15 המשחקים? לכל משחק יש שתי תוצאות אפשריות (אין תיקו). הסיכוי לניחוש נכון הוא לכן 50% או חצי. יש 15 משחקים, והם לא תלויים זה בזה (בדרך כלל): התוצאה של משחק קודם בדרך כלל לא משפיעה על התוצאה של המשחק הבא. אני יודע שההנחה הזו לא נכונה ב-100%. יכול להיות שנבחרת שהתאמצה מאוד במשחק מסויים תגיע יותר עייפה ומוחלשת לשלב הבא, יכול להיות ששחקן מפתח הורחק או נפצע, ועוד. אבל אם חיות המחמד מנחשות, הן לא לוקחות את כל הדברים האלה בחשבון, והניחושים שלהן לא תלויים זה בזה. לכן, ההסתברות לניחוש התוצאות של 15 משחקים היא ההסתברות לניחוש נכון של משחק אחד מוכפלת בעצמה 15 פעמים. זה יוצא 1 ל-32768, או 0.003%. סיכוי נמוך? בהחלט, אבל בכל זאת גדול מאפס.

אבל יש לנו קרוב ל-1000 חיות שמנסות לבצע את אותו התרגיל.  אולי אחת מהן תצליח? כאן אפשר להשתמש בהתפלגות פואסון כדי לחשב את ההסתברות שאף חיה לא תצליח לחזות את כל התוצאות של כל המשחקים, שחיה אחת תצליח, ששתיים יצליחו וכולי. ובכן, ההסתברות שאף חיה מתוך האלף לא תצליח לחזות את התוצאות של כל 15 המשחקים היא 96.99%, ויש הסתברות של 2.96% שחיה אחת מבין האלף תצליח במשימה (אבל לא ניתן לדעת מראש איזה).

מצד שני, אני מטיל על החיות משימה לא הוגנת. בנדיק החתול מאיסלנד לא מתעניין בתוצאת המשחק שבין הונגריה ומיקרונזיה (אם יש בכלל משחק כזה). גם פול התמנון התמחה בנבחרת שלו, גרמניה. אז בואו נתרכז במשחקים של גרמניה.

אני מניח שגרמניה תשחק בסך הכל 7 משחקים – 3 בשלב המוקדם, ועוד ארבעה בשלב הנוק אאוט (כלומר, אני מניח שתגיע לחצי הגמר). לכן המשימה של מוקמוק הארנב ושאר חבריו מגרמניה אמורה יותר קלה – בואו נראה עד כמה היא יותר קלה.

שוב, לכל משחק יש שתי תוצאות: או שגרמניה מנצחת, וזה מה שחשוב, או שלא (ואני אתעלם כאן באלגנטיות ממה שלגארי לינקר היה לומר בעניין).

הסיכוי לניחוש נכון הוא חצי, ולכן הסיכוי לסדרה של שבעה ניחושים נכונים הוא חצי מוכפל בעצמו שבע פעמים. זה יוצא 1 ל-128, או 0.78%. עדיין נמוך, ועם זאת אפשרי.

אבל רגע. יש לנו 85 חיות מחמד מגרמניה. מה הסיכוי שלפחות אחת מהן תצליח? אנו נגייס שוב את התפלגות פואסון לעזרתנו. החישוב מראה לנו כי ההסתברות שאף אחת מבין 85 חיות המחמד לא תנחש את התוצאות של כל שבעת המשחקים היא כמעט 51.5%, ומכאן שיש הסתברות של 48.5% שלפחות אחת מהן תצליח במשימה. תיראו מופתעים.

אפשר כמובן לרדת לפרטים יותר קטנים: מה ההסתברות שלפחות חיה אחת תצליח לחזות תוצאה של שישה משחקים לפחות משבעת המשחקים של גרמניה (יותר מ-48.5%) או שלפחות חיה אחת תצליח לחזות את כל התוצאות של המשחקים של גרמניה בשלב הנוק אאוט בלבד (הרבה יותר מ-48.5%). לא ערכתי את החישובים האלה. אתם מוזמנים לנסות.

ועכשיו ברצינות. משחקי הניחושים האלה הם משעשעים ובדרך כל לא מזיקים. אולם יש אנשים שמהמרים על תוצאות המשחקים האלה. במקרה כזה לשאול את דג הזהב שלך מה תהיה התוצאה לדעתו זו לא אסטרטגיה טובה. אני מחזיר אתכם לחישובי הסטארט-אפ שהוזכר בפיסקה הראשונה ולאמירתו הבלתי נשכחת של גארי לינקר: “כדורגל משחקים תשעים דקות ובסוף גרמניה מנצחת”.  ב-2014, למשל, גרמניה ניצחה ב-6 משחקים מתוך השבעה ששיחקה (משחק אחד הסתיים בתיקו). הסטארט-אפ הנ”ל הכניס למודל שלו את תוצאות כל המשחקים שנערכו מאז 1930. אני אמנע מלהביע את דעתי כי אני לא מכיר את כל פרטי המודל.

אני הסתכלתי על התוצאות של נבחרת גרמניה בארבעת הטורנירים האחרונים: מ-2002 עד 2014. בתקופה הזו גרמניה ניצחה ב-9 משחקים מתוך 12 בשלב הבתים – 75% הצלחה. בשלבי הנוק אאוט גרמניה ניצחה ב-13 משחקים מתוך 16 (כולל שני משחקים על המקום השלישי) – 81% הצלחה.

לכן, בשלב הבתים ברווז הפלא שלי יטיל מטבע שנופל על עץ בהסתברות 75% ועל פלי בהסתברות 25%.  יש לו סיכוי של קצת יותר מ-42% לנחש את התוצאות של שלושת המשחקים, פי 3.4 מסיכויי הניחוש של חיית מחמד אחרת שלא יודעת סטטיסטיקה. בשלב הבתים הברווז שלי יטיל מטבע שנופלת על עץ בהסתברות של 80%, ויהיה לו סיכוי של כמעט 41% לחזות את התוצאות של כל המשחקים, סיכוי גבוה פי 6.6 מהסיכוי של מוקמוק הארנב. הברווז שלי יכול לעשות הרבה יותר טוב מזה: הוא יכול “לנחש” תמיד שגרמניה תנצח: כך הסיכוי שלו לנחש נכונה את תוצאות כל המשחקים יהיה מעל ל-75%.

לפני שאתם רצים להמר אל תשכחו שסוכנויות ההימורים מכירות אל כל החישובים האלה (וגם חישובים יותר מסובכים) ולכן קובעות את שערי ההימורים כך שבסופו של דבר הן ירוויחו.

אני, אגב, לא צופה במשחקים, אבל מאחל שעות של הנאה למי שכן.


הערות
  1. את החישובים ביצעתי בערת תוכנת R []

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

בעיית ימי ההולדת

שוב פירסמתי סקר בטוויטר שמאחוריו מסתתרת רשימה על בעיה מעניינת בהסתברות – והפעם בעיית ימי ההולדת. הנה השאלה והתפלגות התוצאות:

בואו ננסה להבין ביחד מה קורה כאן. לשם כך, כרגיל, צריך להניח הנחות.

ההנחה הראשונה היא שאין תלות בין תאריכי הלידה של שני אנשים שונים. כלומר, אם אתם יודעים, למשל, שאני נולדתי ב-13 באוקטובר[1], זה לא אומר לכם כלום על תאריך ההולדת של דונלד טראמפ, וגם לגבי תאריך ההולדת של כל אדם אחר. שימו לב שבהנחה הזו אנו מוציאם מהמשחק אפשרות של תאומים, שלישיות וכולי.

ההנחה השנייה היא שיש בשנה 365 ימים, ויש לכן 365 ימי הולדת אפשריים. ההנחה הזו מאפשרת לי להתעלם מכל האנשים המעצבנים שנולדו ב-29 לפברואר.

ההנחה השלישית היא שהתפלגות ימי ההולדת היא אחידה. פירוש הדבר הוא שהסיכוי כי אדם שבחרתם באופן מקרי נולד ב-1 בינואר שווה לסיכוי שהוא נולד ב-35 במאי, או בכל יום אחר בשנה, והסיכוי הזה הוא 1/365.

כרגיל, אפשר להתווכח על ההנחות, ולהחליף כל הנחה בהנחה אחרת, אבל זה רק יגרום לחישובים יותר מסובכים, בעוד שהתשובות המהותיות לא ישתנו. אם החישובים לא מדברים אליכם, דלגו עליהם, והתרכזו בעקרונות ובתוצאות. כדאי לכם להגיע עד הסוף, כי יש גם סרט.

ועכשיו נענה לשאלות. אם יש 23 אנשים באוטובוס, מה ההסתברות שלשניים מהם יש יום הולדת באותו יום?

אפשר לשאול את השאלה הזו בצורה אחרת: מה המספר המינימלי של אנשים באוטובוס כדי שההסתברות שלשניים מהם יש יום הולדת באותו יום תעלה על 50%?

קודם כל אסביר מדוע יש מספר אנשים שבו ההסתברות שלשניים מהם יש יום הולדת באותו יום עולה על 50%.

ובכן, אם יש באוטובוס רק בן אדם אחד (הנהג, אני מקווה), ההסתברות כי יש באוטובוס שני אנשים שנולדו באותו יום היא כמובן 0.

אם יש באוטובוס שני אנשים, ההסתברות ששניהם נולדו באותו יום היא 1/365. אסביר: ההסתברות ששניהם נולדו ב-1 בינואר היא 1/365 כפול 1/365. ההסתברות ששניהם נולדו ב-2 בינואר היא שוב 1/365 כפול 1/36, וכן הלאה. נחבר 1/365 כפול 1/365 לעצמו 365 פעמים, ונקבל 1/365.

אם יש באוטובוס 3 אנשים ההסתברות ששניים מהם נולדו באותו יום גבוהה יותר. ההסתברות שהנהג והנוסע הראשון נולדו באותו יום היא כאמור 1/365, אבל יש לקחת בחשבון גם את האפשרות שהנהג והנוסע השני נולדו באותו יום, וגם את האפשרות ששני הנוסעים נולדו באותו יום. התוצאה אמנם אינה חיבור פשוט של כל שלושת ההסתברויות[2], אבל אני מקווה שברור כי היא גבוהה יותר.

אם נוסיף עוד נוסע ועוד נוסע ועוד נוסע ההסתברות שיש באוטובוס שני אנשים שנולדו באותו יום תלך ותגדל.

אם יהיו באוטובוס 366 איש[3], ההסתברות שבאוטובוס יש שני אנשים שחולקים יום הולדת מגיעה ל-100%: במקרה הכי גרוע יש 365 אנשים שכל אחד נולד ביום אחר בשנה, ואז יום ההולדת של האדם ה-366 חייב להיות זהה ליום הולדת של אחד מהאחרים[4]. הטיעון הזה, אגב, מבוסס על טענה מתמטית המכונה “עקרון שובך היונים“.

ובכן, ההסתברות של המאורע שלנו מתחילה ב-0, גדלה ככל שנוספים אנשים לאוטובוס ומגיעה בסוף ל-100%. לכן חייבת להיות נקודה בה ההסתברות הזו תעבור את ה-50%. הנקודה הזו היא, באופן מפתיע, כאשר מספר האנשים באוטובוס מגיע ל-23. אני לא מתכוון לעבור כאן על כל החישוב, אבל  יש ברשת מחשבון לחישוב ההסתברויות , שם גם יש הסבר כיצד ההסתברות מחושבת. 23 הוא מספר יחסית קטן של אנשים, והאינטואיציה של רוב בני האדם[5] אומרת להם כי זה מספר קטן מדי של אנשים, יחסית למספר ימי ההולדת האפשריים. מסיבה זו בעיית ימי ההולדת מכונה “פרדוקס ימי ההולדת“, למרות שאין כאן שום סתירה לוגית.

אם תביטו שוב בתוצאות הסקר, אתם עלולים לחשוב כי כמעט מחצית מהמשיבים (49%) ענו את התשובה הנכונה. אבל זה לא נכון. זו התשובה הנכונה לשאלה שדנתי בה עד עתה, אבל זו לא התשובה לשאלה ששאלתי.

אני שאלתי מה ההסתברות כי בין 22 הנוסעים האחרים יש אדם שחולק איתי יום הולדת. במילים אחרות, מה ההסתברות שיש באוטובוס עוד אדם שנולד ב-13 באוקטובר. התשובה לשאלה הזו היא בערך 5%. כדי שההסתברות שמישהו באוטובוס חולק איתי יום הולדת תהיה בערך 50%, צריכים להיות עליו 253 אנשים. החישוב כאן יותר פשוט מהחישוב של השאלה הקודמת, ולכן אסביר אותו במפורט. מי שלא מתעניין בחישובים יכול לדלג פיסקה.

ההסתברות כי הנוסע הראשון מבין 22 הנוסעים האחרים נולד ב-13 באוקטובר היא 1/365, ולכן ההסתברות כי לא נולד ב-13 באוקטובר היא 364/365. באופן דומה, ההסתברות כי הנוסע השני לא נולד ב-13 באוקטובר גם היא 364/365, וכך הלאה לכל שאר הנוסעים. בגלל אי התלות בין ימי ההולדת, ההסתברות כי אף אחד מבין 22 הנוסעים האחרים היא לכן המכפלה של 364/365 בעצמו 22 פעמים. זה יוצא 0.941. מכאן שההסתברות כי לפחות אחד מבין ה-22 נולד ב-13 באוקטובר היא 1-0.941=0.058, או, בקירוב טיפה גס, בערך 5%. שליש מהמשיבים לסקר בחרו את התשובה הנכונה.[6]

יש הרבה פולקלור מסביב לבעיית ימי ההולדת. בספר הקלאסי Lady Luck מספר המחבר, המתמטיקאי וורן וויבר, כי השתתף בארוחה עם מספר גנרלים בזמן מלחמת העולם השנייה. הוא סיפר להם על בעיית ימי ההולדת, וכצפוי, הטענה כי אם יש בחדר 23 אנשים אז הסיכוי ששניים מהם חולקים יום הולדת היא כ-50% לא תאמה את האינטואיציה של חלק מהנוכחים. מכיוון שבארוחה השתתפו 22 איש, הם החליטו להעמיד את הטענה למבחן: כל אחד מהמשתתפים אמר מהו יום הולדתו, ולא נמצאו שני סועדים עם יום הולדת משותף. אז התערבה בשיחה המלצרית שנכחה בחדר ואמרה “סלחו לי, אבל אני האדם ה-23 בחדר, ויום הולדתי הוא ה-17 במאי, כמו יום ההולדת של הגנרל היושב שם”.

מבין 45 הנשיאים של ארצות הברית, הנשיאים פולק והרדינג נולדו שניהם ב-2 בנובמבר. הנשיאים פילמור וטאפט מתו שניהם ב-8 במרץ, ושלושת הנשיאים אדמס, ג’פרסון ומונרו מתו ב-4 ביולי. אף נשיא לא חולק איתי יום הולדת.

ג’וני קארסון, המנחה ההמיתולוגי של ה-Tonight Show, התעמק גם הוא בבעיה. בשידור ב-6.2.1980 הוא סיפר לאורח שלו כי מספיק שיהיו 35-40 אנשים בחדר, כדי שיימצאו ביניהם שני אנשים שחולקים יום הולדת משותף.  (אם יש בחדר 35 אנשים, ההסתברות היא כ-85%. כשיש 40 אנשים ההסתברות היא כמעט 90%). המרואיין לא השתכנב וקארסון החליט לערוך הדגמה. הוא שאל גברת מהקהל מה תאריך הלידה שלה, והיא ענתה שיום הולדתה הוא ב-9 לאוגוסט. התברר כי אין עוד אדם בקהל שזהו יום הולדתו. קארסון החליט לנסות שוב. הוא בחר מישהו אחר מהקהל, ויום הולדתו היה ה-9 באפריל. שוב התברר כי אין בקהל אדם נוסף שזהו יום הולדתו. קארסון המתוסכל ניסה שוב, הפעם עם יום ההולדת של עצמו, ה-23 באוקטובר. שוב לא היה בקהל אדם נוסף שזהו יום הולדתו. הפעם היו בקהל שני אנשים שחלקו עימו יום הולדת.[7] מי שהגיע עד לכאן כבר הבין כי קארסון חיפש תשובה לשאלה הלא נכונה. בקהל, אגב, היו כ-500 איש, מה ששמבטיח בודאות כי היו שם לפחות שני אנשים עם יום הולדת משותף. אתם מוזמנים לצפות בהקלטת השידור.


הערות
  1. אל תשכחו לציין את זה בלוח השנה שלכם []
  2. כי יש חפיפה בין המאורעות []
  3. זה אוטובוס ממש גדול []
  4. כי הנחנו שאין 29 בפברואר []
  5. כן, כן, גם שלי []
  6. ומי שענה “אחר” בגלל שהתוצאה יותר קרובה ל-6% מאשר ל-5%, גם זה סבבה []
  7. תודה לגיל גרינגרוז ששהפנה את תשומת ליבי []

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו