לפני כשעה דווח ב-Ynet כי עד עתה נשלחו 750,000 טפסים להגרלה בהשקעה ממוצעת של 73 שקל למשתתף. נתונים אלה מאפשרים להעריך את הסיכוי כי אף אחד לא ינחש את כל המספרים הזוכים ויזכה בפרס הראשון, ויותר מכך – את התפלגות מספר הזוכים בפרס הראשון.
ובכן: כל טבלה עולה 5.5 ש”ח. כיוון שכך – בטופס ממוצע יש 13.27 טבלאות (73/5.5). כיוון שסיכוי הזכיה של טבלה אחת הוא בערך 1 ל-2 מליון, הרי סיכוי הזכיה של טופס ממוצע הוא כ-1 ל- 153000 או 0.0000065. אבל יש 750,000 טפסים, ולכן, תוחלת מספר הטפסים שיזכו בפרס הראשון הוא 750,000 כפול 0.0000065 כלומר 4.9. כיוון שבשעות הקרובות יישלחו עוד כמה טפסים (ניתן לשלוח טפסים עד 23:45) אני מעריך שהתוחלת תגדל ל-5.5 (כלומר יישלחו עוד כ-100,000 טפסים ב-6 השעות הקרובות).
אבל, אפשר להניח הנחה חזקה יותר – כיוון שיש מידה מסויימת של אי תלות בין הטפסים הנשלחים – או יותר נכון – תלות חלשה – אפשר להניח כי בקירוב התפלגות מספר הזוכים תהיה התפלגות פואסונית עם פרמטר 5.5=ג. בעזרת הנהחה זו ניתן לחשב כי ההסתברות כי איש לא יזכה בפרס הראשון היא 0.0041, ההסתברות כי יהיה זוכה יחיד היא 0.0225, ההסתברות לשני זוכים היא 0.0618, לשלושה – 0.1133, לארבעה – 0.1558, לחמישה 0.1714, לשישה – 0.1571, לשבעה ההסתברות היא 0.1234, ההסתברות כי יהיו 8 זוכים בפרס הראשון היא 0.0849, וההסתברות כי יהיו תשעה זוכים או יותר היא 0.1056 (וייתכן כי בגלל טעויות עיגול או הקשה כל ההסתברויות האלה לא מסתכמות בדיוק ל-1.0000 – מי שמעוניין לבדוק אותי מוזמן להוריד את מחשבון ההסתברויות של NCSS – כלי מצויין בעזרתו חישבתי את ההסתברויות האלה).
לסיכום – ההימור שלי הוא כי מחר בבוקר נתבשר כי חמישה משתתפים מתחלקים בפרס הגדול – וזוכים ב-10 מיליון ש”ח כ”א (לפני מס).
ועכשיו סיפור: בשנת 1993 (או אולי 1994? אני לא ממש זוכר) לימדתי את הקורס “מבוא להסתברות ולסטטיסטיקה” באוניברסיטה העברית. רצה הגורל, ובדיוק כאשר לימדתי את הנושא של הקירוב הפואסוני להתפלגות הבינומית, הצטברו 16 מליוני שקלים בפרס הראשון של הגרלת הלוטו, הפרס הגבוה ביותר שהוצע אי פעם בהגרלה זו. מכיוון שפורסמו נתונים על מספר הטפסים שנשלחו, יכולתי להשתמש בהם כדוגמא לשימוש בקירוב בשיעור של יום שני. החישוב הוביל למסקנה כי בהתפלגות מספר הזוכים הצפוי, הסתברות הגבוהה ביותר הייתה למאורע כי ארבעה זוכים יזכו בפרס הראשון. ההגרלה הייתה ביום שלישי, ובשיעור של יום רביעי כולנו כבר ידענו כי 16 מיליוני השקלים אכן התחלקו בין 4 זוכים.
ואז, במשך מספר שבועות שוב לא זכה איש בפרס הראשון בלוטו, ולפתע נשבר שיא הפרס – והפרס הראשון עמד על 20 מיליון שקלים. הסטודנטים ביקשו ממני שאנבא שוב את מספר הזוכים – אני אני סירבתי בתקיפות: “כבר לימדתי אתכם את הנושא הזה. יש לכם נתונים בעיתון – תחשבו לבד!”. החישוב שערכתי לעצמי הראה שוב כי יש סיכוי גבוה לחלוקת הפרס בין 4 או 5 זוכים, אולם למחרת ההגרלה כי בפרס הגדול – 20 מיליון שקלים – זכה אדם יחיד – קיבוצניק מרמת הגולן.
מוסר השכל – הסטטיסטיקה אינה מאפשרת ניבוי אלא רק ניחוש אינטליגנטי.
פורסם לראשונה באתר “רשימות” בתאריך 26 בספטמבר 2005שם התקבלו 7 תגובות
גילי [אתר] בתאריך 9/26/2005 7:21:16 PM
ועוד חיזוק למוסר ההשכל
סתלמידי פסיכולוגיה באוניברסיטה העברית מחוייבים בשנה א’ ללמוד קורס בסטטיסטיקה לפסיכולוגים. רצה הגורל שבשנה שבה הייתי אני תלמידת שנה א’ בחוג, את קורס החובה בסטטיסטיקה לימדה פרופסור אחת שהיא במקרה גם אמא שלי, מה שמוסיף קצת פיקנטיות לסיפור הבא.
פרופ’ בר-הלל העלתה בפני הכיתה טענה, שגם אם למאורע יש שני outcomes אפשריים, אין הדבר מחייב שההסתברות לכל אחד מהם תהיה 50%. היא נתנה לדוגמא הטלה של מטבע לעומת הטלה של נעץ. ההסתברות שהמטבע תנחת על עץ שווה להסתברות שהמטבע תנחת על פלי (בהנחה שזו מטבע כשרה, תנאים אידיאלים וכו’), אבל ההסתברות שהנעץ ינחת על הכיפה קטנה מההסתברות שהנעץ ינחת על הצד. כך טענה אמא שלי, ועמדה להטיל נעץ לשם הניסוי האמפירי. אבל כמובן, מישהו היה חייב להצביע ולהתווכח עם הנחות היסוד: והרי נעץ יכול לנחות ביותר משני אופנים, הוא יכול לנחות גם על החוד, לדוגמא.
“כן,” אמרה אמא שלי, “גם המטבע יכולה לנחות על ההיקף שלה ולהיעמד. אבל הסבירות לכך מזערית, ולצורך העניין אפשר להתעלם מהאופציה הזאת. כך גם לגבי הנעץ: ההסתברות שהנעץ ינחת בדיוק על החוד ולא יפול לצד, כל כך קטנה, שאפשר פשוט להתעלם ממנה.”
אמרה, והטילה את הנעץ.
הנעץ נתקע בתקרה.
גילעד בתאריך 9/26/2005 8:48:23 PM
לעניין מוסר ההשכל
אחד משתיים, כלומר 50%, כלומר ‘או שכן או שלא’ זה ‘ניחוש אינטליגנטי’?
lior [אתר] בתאריך 9/26/2005 9:15:39 PM
תוצאה מעניינת
התוצאה שלך מתאימה מאוד מבחינה כלכלית: אילו תוחלת מספר הזוכים היתה נמוכה מ 4, היה ניתן לעשות ארביטראז’ על ידי שליחת כל הטפסים האפשריים. זה כרוך בהשקעה של 11 מיליון שקל, אבל ההשקעה הזאת גורפת רווח בטוח.
אם חמישה זוכים מתחלקים בפרס כל אחד מהם מקבל 10 מיליון שקל. זה קצת פחות מהסכום הדרוש לכיסוי כל האפשרויות. יכול להיות שיחד עם הפרסים המשניים שני הסכומים משתווים. לכאורה אין קשר בין הסכומים האלה (גובה הפרס לכל זוכה תלוי במספר הטפסים הנשלחים שהוא משתנה די רנדומי), אבל מה שיפה כאן זה שהם בכל זאת מתאזנים.
יוסי לוי [אתר] בתאריך 9/26/2005 10:30:26 PM
תשובה לגילי
הסיפור שלך מבהיר למה חשוב לעשות הבחנה בין מודל למציאות.
אני נהגתי למנות בין התוצאות האפשריות של הטלת מטבע, בנוסף לשתי האפשרויות הקלאסיות ולאפשרות שהמטבע תיפול על צידה, גם עוד כמה אפשרויות אקזוטיות, כגון האפשרות שהמטבע תתגלגל ותיעלם בסדק ברצפה, או שעורב יכנס דרך החלון, יחטוף את המטבע במקורו ויתעופף משם.
במציאות אי אפשר תמיד להתעלם מאפשרויות זניחות, שהרי, כפי שאמר לי פעם פרופ’ ריטוב, מאורעות שהסתברותם שואפת לאפס קורים כל הזמן. במודל ההסתברותי אנו אכן מזניחים את כל האפשרויות הפחות סבירות לשם נוחות הדיון, אך למרות שבתיאוריה אין הבדל בין התיאוריה והמציאות, במציאות יש.
חנן כהן [אתר] בתאריך 9/27/2005 7:09:35 AM
6 יתחלקו ב-50 מיליון שקלים
.
עזי בתאריך 9/30/2005 7:02:14 PM
החשבון הנכון
כתבה של משה פרל במעריב/אנרג’י היום צופה בפיס בזווית שונה ומעניינת:
http://www.nrg.co.il/online/1/ART/991/089.html
הפרט השולי שפרל לא לקח בחשבון, ויש לו משקל מועט אך קיים — יש כאלו שרואים בקניית פיס גם מעין תרומה לקהילה, לא?
אסף רזון [אתר] בתאריך 6/21/2007 3:50:25 PM
והנה עוד אנקדוטה
קראתי את זה כמדומני בכתבה על “איפה היית במלחמת יום כיפור”.
העונה, כמדומני שזה פרופ’ יצחק בן ישראל, סיפר שהוא היה עתודאי צעיר במחלקת חקר ביצועים בחיל האוויר. המשימה שלו היתה לחשב את מספר האבדות (מטוסים) הצפוי ממתקפה על סוללות נ”מ בסוריה.
הוא עשה כמקובל – בנה מודל, הגדיר הסתברויות, חישב תוחלת. מספר המטוסים שיצא היה 6.5 .
ואז הגיעה המלחמה. והמבצע יצא לפועל. ומה קרה?
6 מטוסים נפלו. אחד נפגע אבל הצליח לחזור אל הבסיס.
ומאז התחילה האגדה על הסגן שחזה בדיוק מוחלט מה יקרה במלחמה…