חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

ארכיב עבור תגית הסתברות

בעיית ימי ההולדת

שוב פירסמתי סקר בטוויטר שמאחוריו מסתתרת רשימה על בעיה מעניינת בהסתברות – והפעם בעיית ימי ההולדת. הנה השאלה והתפלגות התוצאות:

בואו ננסה להבין ביחד מה קורה כאן. לשם כך, כרגיל, צריך להניח הנחות.

ההנחה הראשונה היא שאין תלות בין תאריכי הלידה של שני אנשים שונים. כלומר, אם אתם יודעים, למשל, שאני נולדתי ב-13 באוקטובר[1], זה לא אומר לכם כלום על תאריך ההולדת של דונלד טראמפ, וגם לגבי תאריך ההולדת של כל אדם אחר. שימו לב שבהנחה הזו אנו מוציאם מהמשחק אפשרות של תאומים, שלישיות וכולי.

ההנחה השנייה היא שיש בשנה 365 ימים, ויש לכן 365 ימי הולדת אפשריים. ההנחה הזו מאפשרת לי להתעלם מכל האנשים המעצבנים שנולדו ב-29 לפברואר.

ההנחה השלישית היא שהתפלגות ימי ההולדת היא אחידה. פירוש הדבר הוא שהסיכוי כי אדם שבחרתם באופן מקרי נולד ב-1 בינואר שווה לסיכוי שהוא נולד ב-35 במאי, או בכל יום אחר בשנה, והסיכוי הזה הוא 1/365.

כרגיל, אפשר להתווכח על ההנחות, ולהחליף כל הנחה בהנחה אחרת, אבל זה רק יגרום לחישובים יותר מסובכים, בעוד שהתשובות המהותיות לא ישתנו. אם החישובים לא מדברים אליכם, דלגו עליהם, והתרכזו בעקרונות ובתוצאות. כדאי לכם להגיע עד הסוף, כי יש גם סרט.

ועכשיו נענה לשאלות. אם יש 23 אנשים באוטובוס, מה ההסתברות שלשניים מהם יש יום הולדת באותו יום?

אפשר לשאול את השאלה הזו בצורה אחרת: מה המספר המינימלי של אנשים באוטובוס כדי שההסתברות שלשניים מהם יש יום הולדת באותו יום תעלה על 50%?

קודם כל אסביר מדוע יש מספר אנשים שבו ההסתברות שלשניים מהם יש יום הולדת באותו יום עולה על 50%.

ובכן, אם יש באוטובוס רק בן אדם אחד (הנהג, אני מקווה), ההסתברות כי יש באוטובוס שני אנשים שנולדו באותו יום היא כמובן 0.

אם יש באוטובוס שני אנשים, ההסתברות ששניהם נולדו באותו יום היא 1/365. אסביר: ההסתברות ששניהם נולדו ב-1 בינואר היא 1/365 כפול 1/365. ההסתברות ששניהם נולדו ב-2 בינואר היא שוב 1/365 כפול 1/36, וכן הלאה. נחבר 1/365 כפול 1/365 לעצמו 365 פעמים, ונקבל 1/365.

אם יש באוטובוס 3 אנשים ההסתברות ששניים מהם נולדו באותו יום גבוהה יותר. ההסתברות שהנהג והנוסע הראשון נולדו באותו יום היא כאמור 1/365, אבל יש לקחת בחשבון גם את האפשרות שהנהג והנוסע השני נולדו באותו יום, וגם את האפשרות ששני הנוסעים נולדו באותו יום. התוצאה אמנם אינה חיבור פשוט של כל שלושת ההסתברויות[2], אבל אני מקווה שברור כי היא גבוהה יותר.

אם נוסיף עוד נוסע ועוד נוסע ועוד נוסע ההסתברות שיש באוטובוס שני אנשים שנולדו באותו יום תלך ותגדל.

אם יהיו באוטובוס 366 איש[3], ההסתברות שבאוטובוס יש שני אנשים שחולקים יום הולדת מגיעה ל-100%: במקרה הכי גרוע יש 365 אנשים שכל אחד נולד ביום אחר בשנה, ואז יום ההולדת של האדם ה-366 חייב להיות זהה ליום הולדת של אחד מהאחרים[4]. הטיעון הזה, אגב, מבוסס על טענה מתמטית המכונה "עקרון שובך היונים".

ובכן, ההסתברות של המאורע שלנו מתחילה ב-0, גדלה ככל שנוספים אנשים לאוטובוס ומגיעה בסוף ל-100%. לכן חייבת להיות נקודה בה ההסתברות הזו תעבור את ה-50%. הנקודה הזו היא, באופן מפתיע, כאשר מספר האנשים באוטובוס מגיע ל-23. אני לא מתכוון לעבור כאן על כל החישוב, אבל  יש ברשת מחשבון לחישוב ההסתברויות , שם גם יש הסבר כיצד ההסתברות מחושבת. 23 הוא מספר יחסית קטן של אנשים, והאינטואיציה של רוב בני האדם[5] אומרת להם כי זה מספר קטן מדי של אנשים, יחסית למספר ימי ההולדת האפשריים. מסיבה זו בעיית ימי ההולדת מכונה "פרדוקס ימי ההולדת", למרות שאין כאן שום סתירה לוגית.

אם תביטו שוב בתוצאות הסקר, אתם עלולים לחשוב כי כמעט מחצית מהמשיבים (49%) ענו את התשובה הנכונה. אבל זה לא נכון. זו התשובה הנכונה לשאלה שדנתי בה עד עתה, אבל זו לא התשובה לשאלה ששאלתי.

אני שאלתי מה ההסתברות כי בין 22 הנוסעים האחרים יש אדם שחולק איתי יום הולדת. במילים אחרות, מה ההסתברות שיש באוטובוס עוד אדם שנולד ב-13 באוקטובר. התשובה לשאלה הזו היא בערך 5%. כדי שההסתברות שמישהו באוטובוס חולק איתי יום הולדת תהיה בערך 50%, צריכים להיות עליו 253 אנשים. החישוב כאן יותר פשוט מהחישוב של השאלה הקודמת, ולכן אסביר אותו במפורט. מי שלא מתעניין בחישובים יכול לדלג פיסקה.

ההסתברות כי הנוסע הראשון מבין 22 הנוסעים האחרים נולד ב-13 באוקטובר היא 1/365, ולכן ההסתברות כי לא נולד ב-13 באוקטובר היא 364/365. באופן דומה, ההסתברות כי הנוסע השני לא נולד ב-13 באוקטובר גם היא 364/365, וכך הלאה לכל שאר הנוסעים. בגלל אי התלות בין ימי ההולדת, ההסתברות כי אף אחד מבין 22 הנוסעים האחרים היא לכן המכפלה של 364/365 בעצמו 22 פעמים. זה יוצא 0.941. מכאן שההסתברות כי לפחות אחד מבין ה-22 נולד ב-13 באוקטובר היא 1-0.941=0.058, או, בקירוב טיפה גס, בערך 5%. שליש מהמשיבים לסקר בחרו את התשובה הנכונה.[6]

יש הרבה פולקלור מסביב לבעיית ימי ההולדת. בספר הקלאסי Lady Luck מספר המחבר, המתמטיקאי וורן וויבר, כי השתתף בארוחה עם מספר גנרלים בזמן מלחמת העולם השנייה. הוא סיפר להם על בעיית ימי ההולדת, וכצפוי, הטענה כי אם יש בחדר 23 אנשים אז הסיכוי ששניים מהם חולקים יום הולדת היא כ-50% לא תאמה את האינטואיציה של חלק מהנוכחים. מכיוון שבארוחה השתתפו 22 איש, הם החליטו להעמיד את הטענה למבחן: כל אחד מהמשתתפים אמר מהו יום הולדתו, ולא נמצאו שני סועדים עם יום הולדת משותף. אז התערבה בשיחה המלצרית שנכחה בחדר ואמרה "סלחו לי, אבל אני האדם ה-23 בחדר, ויום הולדתי הוא ה-17 במאי, כמו יום ההולדת של הגנרל היושב שם".

מבין 45 הנשיאים של ארצות הברית, הנשיאים פולק והרדינג נולדו שניהם ב-2 בנובמבר. הנשיאים פילמור וטאפט מתו שניהם ב-8 במרץ, ושלושת הנשיאים אדמס, ג'פרסון ומונרו מתו ב-4 ביולי. אף נשיא לא חולק איתי יום הולדת.

ג'וני קארסון, המנחה ההמיתולוגי של ה-Tonight Show, התעמק גם הוא בבעיה. בשידור ב-6.2.1980 הוא סיפר לאורח שלו כי מספיק שיהיו 35-40 אנשים בחדר, כדי שיימצאו ביניהם שני אנשים שחולקים יום הולדת משותף.  (אם יש בחדר 35 אנשים, ההסתברות היא כ-85%. כשיש 40 אנשים ההסתברות היא כמעט 90%). המרואיין לא השתכנב וקארסון החליט לערוך הדגמה. הוא שאל גברת מהקהל מה תאריך הלידה שלה, והיא ענתה שיום הולדתה הוא ב-9 לאוגוסט. התברר כי אין עוד אדם בקהל שזהו יום הולדתו. קארסון החליט לנסות שוב. הוא בחר מישהו אחר מהקהל, ויום הולדתו היה ה-9 באפריל. שוב התברר כי אין בקהל אדם נוסף שזהו יום הולדתו. קארסון המתוסכל ניסה שוב, הפעם עם יום ההולדת של עצמו, ה-23 באוקטובר. שוב לא היה בקהל אדם נוסף שזהו יום הולדתו. הפעם היו בקהל שני אנשים שחלקו עימו יום הולדת.[7] מי שהגיע עד לכאן כבר הבין כי קארסון חיפש תשובה לשאלה הלא נכונה. בקהל, אגב, היו כ-500 איש, מה ששמבטיח בודאות כי היו שם לפחות שני אנשים עם יום הולדת משותף. אתם מוזמנים לצפות בהקלטת השידור.


הערות
  1. אל תשכחו לציין את זה בלוח השנה שלכם []
  2. כי יש חפיפה בין המאורעות []
  3. זה אוטובוס ממש גדול []
  4. כי הנחנו שאין 29 בפברואר []
  5. כן, כן, גם שלי []
  6. ומי שענה "אחר" בגלל שהתוצאה יותר קרובה ל-6% מאשר ל-5%, גם זה סבבה []
  7. תודה לגיל גרינגרוז ששהפנה את תשומת ליבי []

איך להמר (אם אתה מוכרח)

איך להמר (אם אתה מוכרח)

אתם חייבים 100 אלף דולר לשוק האפור, אבל יש לכם רק 50 אלף, וצריך לשלם בערב. זה לא משנה אם יהיו לכם 50 אלף דולר, או 90 אלף, או 99,999. כל סכום קטן מ-100 אלף יגרום לתוצאות הרות אסון. הסיכוי היחיד שלכם נמצא בקזינו. אתם ניגשים לשולחן הרולטה, שם אפשר להמר על אדום-שחור. אם הימרתם בדולר אחד על אדום, והתוצאה היא אדום, תקבלו בחזרה את הדולר שלכם ודולר אחד נוסף. אם התוצאה אינה אדום[1] הפסדתם את הדולר. יש לציין כי הסתברות הזכיה כאשר מהמרים על אדום היא קצת פחות מ-50%. מה הכי כדאי לעשות? מהי האסטרטגיה שתביא למקסימום את ההסתברות שתצאו מהקזינו ובכיסכם 100 אלף דולר?

שאלה דומה לזו הוצגה בעמוד הראשון של הספר הקלאסי How to gamble if you must מאת Lester E. Dubins, ‎Leonard J. Savage, andb ‎William Sudderth. כותרת המשנה של הספר היא Inequalities for Stochastic Processes, ומעידה על כך שזהו בהחלט ספר מתמטי. ההוכחה לתשובה שמייד אציג נמצאת בפרק החמישי של הספר, למי שמתעניין. כאן אנסה לתת הסבר אינטואיטיבי לתשובה.

אבל לפני כן קצת שעשועים. בסקר שערכתי בטוויטר השתתפו 46 צייצנים. הדיעות התחלקו פחות או יותר שווה בשווה בין ארבע התשובות האפשריות שהוצעו:

לפני שנדון בתשובות קצת היסטוריה, על קצה המזלג. משחקי הימורים היו נפוצים כבר בזמנים קדומים, ויש תיעוד שלהם בכל התרבויות העתיקות. מחקרים אודות הימורים ומשחקי מזל שערכו מלומדים כקרדנו במאה ה-16, כריסטיאן הויגנס במאה ה-17, ואברהם דה-מואבר ויעקב ברנולי במאה ה-18, ואחרים, הניחו את היסודות לתורת ההסתברות. למעשה, הפתרון שאציג מייד נובע מעבודה של דה-מואבר משנת 1711.

ועוד אנקדוטה (אולי משעשעת): בראשית ימיה, עמדה חברת FedEx בפני משבר. היה עליה לשלם חוב של 24,000 דולר, כשבקופתה היו 5000 דולר בלבד. יו"ר החברה ומייסדה, נטל את הכסף שבקופה, טס ללאס וגאס, הימר בשולחן הבלאק ג'ק וזכה ב-27,000 דולר. כך ניצלה החברה, והשאר, כמו שאומרים, היסטוריה. תודה לשי אלקין שהסב את תשומת ליבי לסיפור.

למתעניינים בהיסטוריה של חקר ההימורים והנחת יסודות תורת ההסתברות, אמליץ לקרוא את הספר נגד האלים מאת פיטר ברנשטיין, או את הספר הקלאסי
Games, Gods and Gambling מאת פלורנס נייטיגייל דייויד[2] .

ועכשיו לתשובות.

תשובה אפשרית אחת היא שלא משנה מה עושים כי ממילא נפסיד הכל. זה נכון. ההימור נוטה לטובת הקזינו. ההסתברות לזכיה ברולטה בהימור על אדום (או על שחור) היא 18/38, בערך 47%. מי שיהמר לאורך זמן יצבור אט אט הפסדים, ומי שימשיך להמר עוד ועוד יפסיד בסופו של דבר את כל כספו.  את זה הוכיח כריסטיאן הויגנס. מי שענה את התשובה הזו בסקר צדק.

אבל חדי העין ישימו לב כי השאלה כפי שנוסחה כאן שונה מעט מהניסוח בטוויטר, גם בגלל מגבלת התוים בטוויטר ואולי גם בגלל חוסר דיוק מצידי. בואו נדון באסטרטגיה שתביא למקסימום את ההסתברות לצאת מהקזינו עם 100 דולר, כאשר מגיעים אליו עם 50 אלף דולר. כאן בגדול יש שתי אפשרויות. אפשרות אחת היא להמר מייד על כל הסכום, בתקוה שתזכה בהימור אדום-שחור וכספך יוכפל. ההסתברות לכך היא, כאמור, בערך 47%.

מה קורה אם מהמרים כל פעם על חלק מהסכום? בואו ניקח לדוגמא את האסטרטגיה הבאה: להמר על 25 אלף דולר, לקוות לזכות ועל ידי כך להגדיל את הונך ל-75 אלף דולר, ואחר כך להמר שוב על 25 אלף דולר, כאשר זכיה תביא אותך אל הסכום הנכסף של 100 אלף דולר. במקרה הטוב ביותר תגיע למטרה על ידי שתי זכיות רצופות של 25 אלף דולר כל אחת. ההסתברות לכך היא 0.47 כפול 0.47[3] , כלומר בערך 22.4%.

יש כמובן אפשרות שתפסיד בהימור הראשון את 25 אלפי הדולרים עליהם הימרת. עכשיו יהיה עליך להכפיל את הונך פי 4, וזה ידרוש שוב לפחות שתי זכיות רצופות[4] , וההסתברות לכך היא שוב כ-22.4%.

אם מהמרים על סכומים קטנים יותר, יש צורך ביותר זכיות, וההסתברות להגיע ל-100 אלף דולר צונחת בהתאם.

זו האינטואיציה שעומדת מאחורי הקביעה כי האסטרטגיה האופטימלית היא להמר מייד על כל הסכום בתקווה להכפילו. ברנולי ודה-מואבר הבינו זאת כבר בראשית המאה ה-18. הוכחות מתמטיות מלאות לטענות קרובות הופיעו בתחילת המאה ה-20.

רק רגע, יש עוד אפשרות: לעשות משהו אחר. אפשר להמר בשיטת ההכפלות, הידועה גם בשם  שיטת המרטינגייל.

הנה הרעיון: אתה מתחיל בהימור אדום שחור על דולר. אם זכית – קיבלת את הדולר שלך בחזרה ועוד דולר אחד כרווח. אם הפסדת, לא נורא. המר כעת על שני דולר. אם זכית, אתה מקבל את שני הדולרים שלך בחזרה, ועוד שני דולרים כרווח, בסך בכל ארבעה דולרים. אבל הימרת רק על שלושה דולרים! מכאן שהרווחת דולר.

ומה קורה אם הפסדת גם בהימור השני? אין בעיה. הכפל את סכום ההימור והמר כעת על ארבעה דולר. אם זכית, תקבל שמונה דולר, אבל הימרת רק על שבעה דולר (1+2+4). הרווחת דולר.

ומה אם הפסדת בהימור על ארבעת הדולרים? אין בעיה. הכפל את סכום ההימור ל-8 דולר. אם תזכה תקבל בחזרה 16 דולר, כשהימרת רק על 15 דולר – כלומר שוב הרווחת דולר.

ומה יקרה אם הפסדת בהימור על שמונת הדולרים? אולי עדיין אין בעיה, אבל בקרוב תהיה לך בעיה.

קודם כל נתייחס לבעיה הספציפית שלנו – להגיע מ-50 אלף דולר ל-100 אלף דולר. בשיטה הזו זה ייקח קצת זמן, ותצטרך לזכות בהרבה הימורים בדרך.

כמובן, אם עומד לרשותך סכום כסף בלתי מוגבל, השיטה הזו תוביל אותך לזכיה בהסתברות 1. אבל, הסכום שעומר לרשותך[5] מוגבל, וייתכן מאוד שתגיע למצב בו אין בידיך מספיק כסף כדי להכפיל את ההימור. למעשה, אפשר להוכיח כי אם תהמר בשיטה זו לאורך זמן, תגיע למצב בו אין בידיך די כסף כדי להכפיל את ההימור בהסתברות 1.

שלישית, ברוב בתי הקזינו יש הגבלה על גובה ההימור. שיטת ההכפלות תביא אותך בסופו של דבר אל המחסום הזה ואז לא תוכל למשיך ולהכפיל את ההימור גם אם יש בכיסך את הסכום הדרוש.

באופן אישי, אם היה לי קזינו, לא הייתי מתנגד לכך שיהמרו נגדי בשיטת ההכפלה. אדרבא. אמנם מדי פעם אפסיד דולר, אך ההפסד הזה יכוסה על ידי ההפסדים של כל המכפילים שיגיעו לגבול ההימור שלהם, והפסדים אלה יהיו יותר נפוצים ויותר גדולים מדולר אחד.

אז אם אתם רוצים להמר בשביל הכיף – סבבה. אם אתם רוצים להרוויח כסף מהימורים, כדאי שיהיה לכם קזינו. והכי חשוב, אל תסתבכו עם השוק האפור.


הערות
  1. יש עוד שתי אפשרויות – שחור וירוק []
  2. שאין לבלבל בינה ובין פלורנס נייטינגייל []
  3. בהנחה הסבירה לגמרי שאין תלות בין ההימורים []
  4. להמר על 25, לזכות, ואז להמר על 50 ושוב לזכות []
  5. ולרשות כל אחד, בעצם []

בעיית המטריות: איך לא להירטב?

השבוע שוב פרסמתי בטוויטר חידה הסתברותית: לבנאדם יש המון מטריות, חלקן בבית וחלק במשרד. אם יורד גשם הוא לוקח איתו מטריה מהמלאי. אם לא, הוא הולך לדרכו בלי לקחת מטריה. האם הוא יירטב? מספר המשיבים היה קטן יחסית, אבל רובם ידעו את התשובה הנכונה: בסופו של דבר הוא יירטב.

פתרון החידה מתבסס על מודל הסתברותי הנקרא שרשרת מרקוב. בויקיפדיה יש הסבר פורמלי טוב של המושג ההסתברותי. כאן, כהרגלי, אנסה להסביר את המושג באופן יותר אינטואיטיבי. לאחר ההסבר הבסיסי אסביר מדוע שרשרת מרקוב היא מודל טוב עבור החידה, ואראה כיצד מגיעים לפתרון.

שרשרת מרקוב היא תהליך מקרי. לשרשרת יש מספר מצבים (שיכול להיות סופי או אינסופי), ובכל צעד בשרשרת, נמצאים באחד המצבים האפשריים, ובצעד הבא עוברים ממצב זה למצב אחר, או נשארים במקום. המעבר נקבע באופן מקרי על סמך הסתברויות קבועות.

לדוגמא, נניח שיש לנו שרשרת מרקוב שבה יש שלושה מצבים אפשריים. נסמן אותם בספרות 0, 1, ו-2. השרשרת יכולה להראות כך: 0, 2, 1, 0, 0, 2, 1, 2, … וכן הלאה. פירוש הדבר הוא שהתחלנו במצב 0, משם עברנו למצב 2, משם עברנו למצב 1, וכן הלאה.

התכונה החשובה של המודל ההסתברותי הזה היא שלא משנה באיזה מצב נמצאים, המעבר למצב הבא לא תלוי בהיסטוריה של השרשרת, אלא רק במצב הנוכחי. אם השרשרת נמצאת במצב 2, למשל, ההסתברות שהיא תעבור למצב 1 היא אותה הסתברות גם במקרה שהשרשרת הגיע למצב הנוכחי ממצב 0 וגם במקרה שהיא הגיע למצב הנוכחי ממצב 1 או 2. כלל המעבר הוא אותו כלל.

כלל מעבר אפשרי כאשר נמצאים במצב 0, הוא שעוברים ממנו למצב 1 בהסתברות 1/2, עוברים למצב 2 בהסתברות 1/3, או שנשארים במצב 0 בהסתברות 1/6.[1]. באופן דומה יש לנו כללי מעבר דומים כאשר נמצאים במצב 1 או במצב 2.

עכשיו נראה איך המושג של שרשרת מרקוב עוזר לנו לפתור את בעיית המטריות.

בואו נסתכל תחילה על מקרה פרטי, בו לאיש שלנו יש רק מטריה אחת. נגדיר את המצבים של השרשרת להיות מספר המטריות שעומדות לרשות האיש. זה פשוט: או שיש לו מטריה במקום שבו הוא נמצא, או שאין לו. לכן המצבים האפשריים יהיו 0 ו-1.

איך הוא עובר ממצב למצב? זה תלוי בהסתברות שירד גשם. ההסתברות הזו לו נתונה לנו, ולכן אניח כי ההסתברות שירד גשם במקום בו הוא נמצא ועומד לצאת לדרכו היא קבועה ושווה ל-P כאשר P הוא מספר כלשהו בין 0 ל-1 (לא כולל את 0 ו-1). בכך הגדרנו מודל המתאר את תנאי החידה.[2]

אם האיש שלנו נמצא במצב 1, כלומר יש לו מטריה בהישג יד, ויורד גשם, הוא ייקח עימו את המטריה למחוז חפצו, ושם שוב תעמוד המטריה לרשותו, כלומר הוא יישאר במצב 1. זה קורה בהסתברות P. אם לעומת זאת יש לו מטריה ולא יורד גשם, הוא הולך לדרכו בלי המטריה, ואז, במחוז חפצו, לא תעמוד לרשותו המטריה, כלומר הוא עובר ממצב 1 למצב 0 בהסתברות 1-P.

לעומת זאת, אם הוא נמצא במצב 0, אז הוא יעבור למצב 1 בהסתברות 1, כי לא משנה אם יורד גשם או לא יורד גשם, אין לו ברירה אלא לצאת לדרכו בלי מטריה, והמטריה תחכה לו במחוז חפצו.

כמובן, אם הוא נמצא במצב 0 ויורד גשם, אז הוא יירטב.

כעת אטען כי אם נסתכל על כל הפעמים שהוא נמצא במצב 1, בסופו של דבר הוא יעבור בודאות למצב 0. תחשבו על קוביה. אם תטילו אותה פעם אחת, ההסתברות שהיא תראה 6 היא 1/6. אבל ככל שתטילו אותה יותר ויותר פעמים גדל הסיכוי ש-6 יופיע בסופו של דבר. יתרה מזאת, אם נמשיך להטיל את הקוביה עוד ועוד, המספר 6 יופיע עוד ועוד פעמים. אם נטיל את הקוביה אינסוף פעמים, המספר 6 יופיע אינסוף פעמים, וזאת בהסתברות של 100%.[3].

באופן דומה אפשר להוכיח כי אם נסתכל על כל הפעמים שהוא נמצא במצב 0, ואם השרשרת תרוץ עד איסוף הוא יהיה במצב 0 איסוף פעמים, בסופו של דבר ירד שם גשם, ולכן הוא יירטב.

מה קורה אם יש לו יותר ממטריה אחת?

כעת המצבים הם 0, 1 , ו-2.

אם יש לו מטריה אחת (מצב 1), הוא יעבור למצב 2, בו יש לו שתי מטריות, בהסתברות P (יורד גשם, והוא לוקח איתו את המטריה למקום שיש בו כבר מטריה אחת) או שיישאר במצב 1 (לא יורד גשם, ולכן הוא הולך בלי מטריה למקום ששיש בו מטריה אחת).

אם יש לו 2 מטריות הוא נמצא במצב 2, ויכול לעבור משם למצב 0 (כאשר לא יורד גשם, ולכן הוא הולך למקום בו אין לא אף מטריה) או לעבור למצב 1 (יורד גשם, הוא לוקח עימו מטריה למקום בו אין מטריות, ולכן תעמוד שם לרשותו מטריה 1.

אם הוא במצב 0 ויורד גשם הוא יירטב.

אם השרשרת תרוץ מספיק זמן היא תגיע בסופו של דבר למצב 0, ובסופו של דבר ירד גשם כאשר הוא במצב 0, אז הוא יירטב.

ומה אם יש לו המון מטריות? 4, או 50 או 1000? זזה לא משנה. הטיעון עדיין עובד. בסופו של דבר הוא יגיע למצב 0 כאשר יורד גשם, כלומר בסופו של דבר הוא יירטב.

מסקנה: תמיד תקחו אתכם את המטריה.


הערות
  1. ודאו ששלושת ההסתברויות שציינתי מסתכמות ל-1! []
  2. אני סבור שגם כאשר P משתנה ואינו קבוע כל הזמן אפשר להגדיר שרשרת מרקוב מתאימה, עם מספר אינסופי של מצבים, ולהגיע לאותה תשובה, אך לא אכנס לזה כאן, או בכלל []
  3. אפשר להוכיח זאת באופן מתמטי []

מה הסיכוי שקולך ישפיע אם תצביעי בבחירות

הקדמה

ברשימה הקודמת סקרתי את מגוון הטיעונים בעד הצבעה בבחירות, מעשה שעל פניו נראה "בלתי רציונלי", בהתחשב בעובדה שהסיכוי שקול בודד ישפיע על תוצאת הבחירות נמוך למדי. כמה נמוך? על פי דאגלס ואנדרוורקן, הסיכוי כי קול בודד במדינת מפתח כצפון-קרוליינה יכריע את גורל הבחירות לנשיאות ארצות הברית הוא כ-1 ל-10 מליון. לעומת זאת, הסיכוי כי קול בודד יכריע את תוצאת הבחירות למועצת עיר קטנה בקנטאקי הוא כ-1 ל-90, סיכוי גבוה למדי בעיני מספר אנשים.

הפתרון המקובל כיום הוא שהתועלת מההצבעה נובעת לא רק מהתועלת האישית המתבטאת בסיכוי כי קולו של המצביע ישנה את תוצאת הבחירות, אלא גם מהתועלת לכלל הנובעת מההצבעה. התועלת לכלל הרבה יותר גבוהה מהתועלת לפרט, כי על הכף מונחים הרבה יותר גורלות והרבה יותר כספים (תחשבו על מספר ההרוגים במלחמה אפשרית עם אירן לעומת האפשרות שאתן תהרגו, או על הוצאה ממשלתית לטובת תקציבים חברתיים של 138 מיליארד שקלים בחמש שנים לעומת העלות/רווח האישי שלכם עקב תוצאת הבחירות שלא תעלה ככל הנראה מעל סך של כמה עשרות או מאות אלפי שקלים).

יש הבדל גדול בין שיטת הבחירות בישראל לעומת ארה"ב: כפי שציין אביתר בתגובתו לרשימה הקודמת, ההשפעה של הצבעה (או המנעות מהצבעה) אינה מתבטאת בקביעת המנצח או המפסיד, אלא בקביעה כמה חברי כנסת יהיו לכל מפלגה. לכן בניתוח שמוכוון לבחירות בישראל, השאלה צריכה להיות: אם אצביע למפלגה  מסויימת, מה הסיכוי שהיא תקבל  מנדט נוסף שלא הייתה מקבלת לו לא הצבעתי בבחירות?

הבדל משמעותי נוסף בין ישראל וארצות הברית – מספר המצביעים בישראל נמוך בהרבה מאשר בארה"ב. מכיוון שמושב בכנסת שווה כ-20 עד 30 אלף קולות (לאחר מעבר אחוז החסימה), וראינו כי בבחירות רוב הסיכוי של קול בודד להשפיע הולך וקטן עם עליית מספר המצביעים, סביר להניח כי כאשר כמה אלפי קולות עשויים להטות את הכף, הסיכוי של קול בודד להשפיע גדול יותר.

מתי קול בודד יכול להשפיע על תוצאת הבחירות בישראל?

הנה מספר מצבים אפשריים בהם קול בודד עשוי להשפיע על תוצאת הבחירות. בכולם אניח כי את, הבוחרת, מתלבטת האם להצביע עבור מפלגה א, ואינך שוקלת להצביע למפלגה אחרת;  האלטרנטיבה שלך היא להצביע בפתק לבן (קול לא כשר) או לא להצביע כלל. הנה תיאור של מספר מצבים בהם קולך עשוי להשפיע על תוצאות הבחירות:

א. מפלגה א מתנדנדת באזור אחוז החסימה. הקול שלך יכול להשפיע אם ללא קולך המפלגה לא תעבור את אחוז החסימה, ובעזרתו היא תעבור אותו. במקרה שתעבור, תזכה בשני מנדטים בכנסת במקום באפס.

ב. מפלגה א תעבור בוודאות את אחוז החסימה. המפלגה לא חתמה על הסכם עודפים עם מפלגה אחרת (או שחתמה על הסכם עודפים עם מפלגה אחרת שלא עוברת את אחוז החסימה). הקול שלך יכול להשפיע אם ללא קולך המפלגה לא תקבל מנדט נוסף בשלב השני של חלוקת המנדטים (כמפורט בחוק בדר-עופר), ובעזרתו היא תקבל אותו.

ג. מפלגה א קשורה בהסכם עודפים עם מפלגה ב. ברור כי שתי המפלגות יעברו את אחוז החסימה. הקול שלך יכול להשפיע אם:

1. ללא הקול שלך שתי המפלגות (א ו-ב) לא יזכו במנדט נוסף בשלב השני של חלוקת המנדטים, ויחד איתו זכו במנדט נוסף שמוענק למפלגה א.

2. ללא הקול שלך שתי המפלגות (א ו-ב) לא יזכו במנדט נוסף בשלב השני של חלוקת המנדטים, ויחד איתו זכו במנדט נוסף שמוענק למפלגה ב.

3. שתי המפלגות זוכות במנדט נוסף בשלב השני של חלוקת המנדטים גם ללא קולך, אך הצבעתך למפלגה א העניקה לה את המנדט הנוסף בשלב השלישי של חלוקת המנדטים, ולו לא הצבעת לה, המנדט הנוסף היה מוענק למפלגה ב.

4. שתי המפלגות זוכות במנדט נוסף בשלב השני של חלוקת המנדטים גם ללא קולך, אך הצבעתך למפלגה א יוצרת תיקו בין שתי המפלגות, ומפלגה א זוכה במנדט הנוסף בהגרלה; לו לא הצבעת למפלגה א, המנדט הנוסף היה מוענק למפלגה ב.

יכולות להיות עוד אפשרויות, אבל אני מסתפק בדוגמאות אלה.

איך מחשבים את ההסתברות כי קולך ישפיע?

קטע זה הוא טכני וניתן לדלג עליו ולעבור היישר אל חלק התוצאות.

הדרך הקלה והמהירה היא לבצע סימולציה של ההצבעה. מגרילים בעזרת המחשב תוצאה אפשרית של הבחירות ומחשבים את חלוקת המנדטים. לאחר מכן, מוסיפים קול נוסף לאחת המפלגות, ומחשבים מחדש את חלוקת המנדטים. אין הבדל בין שתי החלוקות? הקול לא השפיע. יש הבדל? הקול השפיע? חוזרים על התרגיל הזה הרבה מאוד פעמים, ומחשבים את הפרופורציה של מספר הפעמים הבן הקול הנוסף שינה את חלוקת המנדטים. פרופורציה זו היא אמדן להסתברות כי הקול הנוסף השפיע על תוצאת הבחירות.

כמובן שיש צורך להניח מספר הנחות:

  • אחוז ההצבעה: אני מניח כי אחוז ההצבעה בבחירות יהיה הין 60 ל-70 אחוזים, ובוחר את האחוז באופן מקרי ואחיד בתחום זה. מספר המצביעים יחושב על פי האחוז המוגרל מתוך מספר בעלי זכות הבחירה, שהוא 5656705.
  • לפי נתונים מבחירות קודמות, אני מניח כי 1.5% הקולות יפסלו מסיבות שונות, ועוד 3% משאר הקולות יינתנו למפלגות שלא עברו את אחוז החסימה. לכן מספר הקולות הכשרים (ממנו מחושב אחוז החסימה) יחושב כ-98.5% ממספר המצביעים,  ומספר הקולות של המפלגות שעברו את אחוז החסימה (לפיו נקבע המודד למנדט) יחושב כ-95.5% ממספר המצביעים.
  • הסכמי עודפים: . למיטב ידיעתי, הסכמי העודפים שנחתמו כוללים את: הליכוד ביתנו והבית היהודי, העבודה ויש עתיד, התנועה ומרץ, עם שלם וקדימה (באתר ועדת הבחירות אין שום מידע על כך נכון למועד כתיבת שורות אלה). בבחירות הקודמות נחתמו גם הסכמי עודפים בין שס ויהדות התורה, ובין חד"ש ורע"מ-תע"ל, ואני מניח כי גם בבחירות אלה הסכמים אלה ייחתמו.

לאחר שקבעתי את מספר הקולות למפלגות שעברו את אחוז החסימה, אני מחלק אותם בין המפלגות האלה בעזרת סימולציה של התפלגות מולטינומית. את המפלגות שעברו את אחוז החסימה בחרתי לפי תחזית המנדטים הצפויים לכל מפלגה על פי תחזית אתר בטל בשישים (שאיני יכול להוות דעה על איכותה, אבל בכל זאת צריך להסתמך על משהו) כפי שפורסמה ביום 4.1.2013 בשעה 14.00:

הליכוד ביתנו 35
העבודה 18
הבית היהודי 13
ש"ס 12
התנועה 10
יש עתיד 10
יהדות התורה 6
רעם-תעל 5
מרצ 4
חדש 4
בלד 3

 

את ההסתברויות להתפלגות מולטינומית קבעתי על ידי חלוקת מספר המנדטים שבתחזית ב-120.

לכל חלוקת מנדטים ערכתי 11 חישובי השפעה, כאשר בכל פעם הוספתי קול אחד למפלגה אחרת.

הסימולציה הורצה 2000000 פעמים.

הנה תוצאה אחת לדוגמה מתוך 2000000 ההרצות:

אחוז ההצבעה הוגרל להיות 61.4% ולכן מספר המצביעים נקבע להיות 3470406, ומספר הקולות שניתנו ל-11 המפלגות שעברו את אחוז החסימה הוא 3314238. האופן בו התחלקו 3.3 מליון קולות אלה בין המפלגות מופיע בעמודה השניה בטבלה וחלוקת המנדטים לפי קולות אלה בעמודה השלישית. בעמודה הרביעית הוספתי עוד קול אחד לליכוד ביתנו, וחלוקת המנדטים לאחר הוספת קול זה מופיעה בעמודה האחרונה. בזכות קול אחד, הליכוד ביתנו זכו במנדט נוסף על חשבון הבית היהודי.

מפלגה קולות חלוקת המנדטים קול נוסף לליכוד חלוקת המנדטים עם קול נוסף לליכוד
הליכוד ביתנו 966349 34 966350 35
הבית היהודי 358956 14 358956 13
העבודה 497558 19 497558 19
יש עתיד 275354 9 275354 9
ש"ס 331066 11 331066 11
יהדות התורה 166104 7 166104 7
התנועה 276958 11 276958 11
מרצ 109864 3 109864 3
רעם-תעל 138728 6 138728 6
חדש 110507 3 110507 3
בלד 82794 3 82794 3
סך הכל 3314238 120 3314239 120

 

החישוב שונה במקצת לצורך חישוב ההסתברות כי קול הניתן למפלגה המתנדנדת על סף אחוז החסימה ישפיע על חלוקת המנדטים. לאחר חישוב מספר המצביעים, אני מגריל משתנה מקרי בינומי עם N שווה למספר המצביעים ו-p שווה למספר ערכים, בין 1.5 ל-2.5 אחוז. P מבטא את ההסתברות כי מצביע כלשהו יבחר במפלגה זו. כמו כן, אני מחשב את אחוז החסימה עצמו על ידי חלוקת מספר המצביעים ב-50 ועיגול כפי מטה. אם מספר המצביעים למפלגה א שווה בדיוק לאחוז החסימה, אז הקול הנוסף של המצביעה המתלבטת ישפיע ובזכותו תעבור המפלגה את אחוז החסימה.

התוצאות

א. ההסתברות כי קול למפלגה על סף אחוז החסימה (כלומר ההסתברות כי מצביע כלשהו יבחר במפלגה זו היא בדיוק 2%) יכריע ויעביר את המפלגה אל מעל אחוז החסימה הוא 0.00147 או כ-1 ל-685. מתברר כי תוצאה זו רגישה ביותר להסתברות כי מצביע כלשהו יבחר במפלגה זו. אם ההסתברות היא 1.99% במקום 2%, אז ההסתברות כי קול נוסף ישפיע עולה ל-1 ל-1685, ואם במפלגה תומכים 1.98% מהבוחרים,  אז ההסתברות כי קול נוסף ישפיע תהיה קרובה ל-1 ל-23000.

במלים אחרות, אם את מתכוונת להצביע למפלגה המתנדנדת על סף אחוז החסימה, ההסתברות כי קולך ישפיע על התוצאה הסופית של הבחירות נמוכה למדי ברוב המקרים.

ב. התוצאות מפורטות בטבלה

מפלגה ההסתברות כי קול למפלגה זו ישנה את חלוקת המנדטים
הליכוד ביתנו 0.001469 (1 ל-681)
הבית היהודי 0.001468 (1 ל-681)
העבודה 0.001783 (1 ל-561)
יש עתיד 0.001759 (1 ל-569)
ש"ס 0.002235 (1 ל-447)
יהדות התורה 0.002290 (1 ל-437)
התנועה 0.002542 (1 ל-393)
מרצ 0.002533 (1 ל-395)
רעם-תעל 0.002720 (1 ל-368)
חדש 0.002813 (1 ל-356)
בלד 0.0000015> (פחות מ-1 ל-667 אלף)

סיכום

הטענה כי "אין טעם להצביע כיוון שממילא קול אחד לא ישנה דבר" אינה נכונה בדרך כלל. במדינת ישראל, השילוב של המספר הקטן מאוד של קולות (כ-30 אלף או פחות מכך) המזכים במנדט בכנסת עם שיטת הבחירות (בחירות ארציות יחסיות עם חלוקת מנדטים לפי חוק בדר-עופר), יוצרת הסתברויות גבוהות מאוד לכך שקול בודד ישנה את חלוקת המנדטים – בין 1 ל-350 ל-1 ל-700, כל זאת כאשר המפלגה עבורה מצביעים עוברת את אחוז החסימה וקשורה בהסכם עודפים עם מפלגה אחרת שעוברת אף היא את אחוז החסימה.

פיס 123: תוחלת הזכיה וסיכויי הזכיה בתביעה

תקציר הפרקים הקודמים: ארגון אמון הציבור מגלה טעות בסיכויי הזכיה שפורסמו באתר מפעל הפיס. מפעל הפיס מתקן את הטעות. אחד המהמרים, שהוא גם ד"ר למתמטיקה, תובע את מפעל הפיס בסכום של 3.2 מליון שקלים + 5 מליון שקלים כפיצוי על עגמת הנפש.

ובכן, לאחר שאומתו סיכויי הזכיה במשחק פיס 123 המפורסמים כעת באתר מפעל הפיס, ניתן לגשת לחישוב תוחלת הזכיה והערכת סיכויי התביעה הייצוגית.

כאשר ידועים סיכויי הזכיה וגובה הפרסים וההפסדים, החישוב הוא פשוט: מכפילים כל זכיה/הפסד בהסתברות שלה, ומסכמים.

למשל, הסיכוי לזכות בפרס הראשון במשחק המשולב הוא 1 ל-1000, או 0.001. מי שמהמר על שקל יקבל כפרס 100 שקלים, ולכן סך הרווח שלו הוא 99 שקלים. מכפילים 99 ב-0.001 ומקבלים 0.099. כל עושים לגבי שאר הפרסים, כמפורט בטבלה, ולבסוף יש לסכם את כל המכפלות.(נתוני יחס הזכיה ומכפיל הזכיה לפרסים 1 עד 4 שבטבלה נלקחו מאתר מפעל הפיס):

פרס יחס זכיה הסתברות זכיה מכפיל פרס רווח/הפסד מחובר לתוחלת
ראשון 1:1000 0.00100 100 99 0.0990
שני 1:241.5 0.00414 25 24 0.0994
שלישי 1:37 0.02703 5 4 0.1081
רביעי 1:4.11 0.24331 1 0 0.0000
אין זכיה 1.38 0.72452 0 1- 0.7245-
סך הכל 0.4180-

השורה התחתומה אומרת כי על כל שקל הימור, מפעל הפיס מרוויח (והמהמרים מפסידים) 41.8 אגורות, ובמלים אחרות, מפעל הפיס לוקח לקופתו 41.8% מכספי ההימורים ומחלק למהמרים 58.2% מהכספים כפרסים. אל תסמכו עלי. אנא בדקו את חישוביי.

לאחר שצלחנו את החלק הטכני המשעמם הזה, הבה נעבור לניתוח סיכויי הזכיה של הד"ר למתמטיקה בתביעה הייצוגית שלו.

התובעים, כך פורסם, הציגו שתי טענות:

הטענה הראשונה היא כי מפעל הפיס הציג באתר האינטרנט שלה שסיכויי הזכיה בפרס השני הם 1:200, אולם לפי חישוביהם, הסיכוי לזכות בפרס השני הוא למעשה 1:500. את הטענה הזו אפשר לבדוק. אני חושב שכולם כבר מסכימים על כך שסיכויי הזכיה בפרס השני הם לא 1 ל-200 וגם לא 1 ל-500, אלא 1 ל-240 (בערך).

הטענה השניה היא כי לפי מפעל הפיס, תוחלת ההגרלה 123 משולב אמורה להיות בשיעור של 60.34%, כלומר 60.34% מכספי ההימור מחולקים כפרסים, אולם בפועל, כך נטען בתביעה, תוחלת ההגרלה הינה בשיעור של 58.2% בלבד (כפי שהראה החישוב שערכתי למעלה).

קודם כל, לא ברור לי איך חישוב הסתברות שגוי הוביל לחישוב תוחלת נכון. ייתכן כי חישוב ההסתברות היה נכון (בכל זאת ד"ר למתמטיקה) אולם לכתב התביעה, או להודעה לעיתונות, או לכתבה השתרבב מספר שגוי.

התובעים הנכבדים צריכים, אני מניח, להוכיח כי הפרסום השגוי נעשה בזדון ומתוך כוונה להטעות את המשקיעים המהמרים התמימים. האם יצליחו התובעים להוכיח זאת? איני יודע.

אבל הטיעון העיקרי שלי, ואני מקווה שגם של ההגנה, הוא: אז מה? ונניח שפורסם מספר שגוי, והתוחלת אכן נמוכה ממה שפורסם. האם בפועל הייתה התוחלת שונה? כללי המשחק היו נתונים, ובהנתן הכללים נקבעת התוחלת. הנזק היחיד שעלול להגרם בפועל הוא הנזק למהמר שנכנס לאתר ואמר לעצמו: "וואו, תוחלת של 60.3%! אני הולך על זה! זו לא סתם הגרלה מעפנה שנותנת רק 58.2%!". כמה מהמרים כאלה היו? על כמה כסף הם הימרו? אחרי שנדע את הנתון הזה, נוכל להעריך את הזנק שנגרם להם: 2.1% מסך הסכום שעליו הם הימרו. ההימור שלי הוא כי סך הסכום הזה הוא אפס, או כמעט אפס.

אז מה סיכויי הזכיה? לא רעים בכלל. השופטים, אנשים טובים ומקצועיים אמנם, אבל רובם לא מבין בסטטיסטיקה, פשוט כי ההכשרה שניתנת לתלמידי הפקולטה למשפטים בתחום הזה מזערית. לשקר בעזרת סטטיסטיקה אפשר גם אפשר, וייתכן מאוד שיימצא שופט שישתכנע מהטיעונים.

אני אמשיך לעקוב.