האמת: שום דבר מיוחד.
בידיעה שפורסמה ב-Ynet לפני כחודש נמסר כי “אותם מספרים בדיוק יצאו בשתי הגרלות לוטו ברציפות“. מדובר בלוטו הבולגרי, שם המספרים 4, 15, 23, 24, 35 ו-42 הוגרלו ב-6 בספטמבר ולאחר מכן שוב, ב-10 לחודש. עוד נמסר בידיעה כי “המתמטיקאי מיכאיל קונסטנטינוב חישב ומצא כי הסיכוי לכך הוא 1 ל-4.2 מיליון”. כן נמסר כי שר הספורט של בולגריה הורה לפתוח חקירה מיוחדת בנושא.
המממ.
האם באמת מדובר באירוע כל כך נדיר שמצדיק חקירה, ולא סתם חקירה אלא חקירה “מיוחדת”? האם הסיכוי ל”כך” הוא באמת אחד ל-4.2 מליון, כמו שחישב מר קונסטנטינוב?
התשובה הרבה יותר מסובכת, ועם זאת לא קשה להבנה. כמו תמיד: התשובה המדויקת תלויה בניסוח מדויק של השאלה, כלומר למה מתכוונים כשאומרים “כך”. אביא תחילה את התשובות כפי שפורסמו באתר ChanceWiki (אתם מוזמנים לגלוש ולעיין בחישובים המפורטים):
- הסיכוי כי המספרים 4, 15, 23, 24, 35 ו-42 יעלו בגורל בשתי הגרלות בתאריכים נתונים (6 בספטמבר ו-10 בספטמבר) הוא בערך אחד ל-27000 מיליארד.
- הסיכוי כי בשתי הגרלות בתאריכים נתונים יעלו אותם 6 מספרים (אך לא בהכרח הצירוף הנ”ל) הוא בערך אחד ל-5.2 מיליון.
- הסיכוי כי במשך שנה שלמה, בה נערכות 104 הגרלות, יעלו אותם 6 מספרים בשתי הגרלות רצופות, הוא בערך אחד ל-51000.
- הסיכוי כי במשך רצף של 5400 הגרלות (הלוטו הבולגרי קיים יותר מחמישים שנה, וזה בערך מספר ההגרלות שנערכו בו) יעלו אותם 6 מספרים בשתי הגרלות רצופות הוא בערך אחד ל-970.
- הסיכוי כי באיזה הגרלת לוטו, באיזה מקום בעולם, באיזושהי נקודת זמן בתקופה של חמישים שנה בה נערכות הגרלות דו שבועיות, יעלו אותם 6 מספרים בשתי הגרלות רצופות וזאת בהנחה שיש בעולם כ-100 הגרלות לוטו כאלה, הוא בערך 10%.
אז מתברר שדי צפוי שמתישהו, איפהשהו, יעלו אותם מספרים בשתי הגרלות לוטו רצופות. אני מקווה שהחקירה המיוחדת של שר הספורט הבולגרי תעלה על זה.
הנה הסבר אינטואיטיבי למה שקרה באמת.
תחשבו על קוביה. הרי הגרלת הלוטו היא תהליך שבו בוחרים אפשרות אחת מתוך 5245786 אפשרויות (זה מספר הצירופים האפשריים של 6 מספרים מתוך 42, כלומר מספר הצירופים האפשריים בלוטו הבולגרי). במלים אחרות, הגרלת הלוטו שקולה להטלת קוביה עם 5245786 צדדים, ולכן הדיון העקרוני לא צריך להיות שונה מדיון בהטלה קוביה “רגילה” הדומה לקוביות שמתנוססות בראש העמוד הזה.
לקוביה רגילה יש 6 צדדים, ובהחנה שהקוביה “הוגנת”, יש סיכוי שווה של שישית לכל אחת מהתוצאות האפשריות של הטלת הקוביה (התוצאות הן הספרות 1-6).
אם נטיל את הקוביה פעמיים, יש סיכוי של אחד ל-36 כי בשתי ההטלות נקבל 6, אבל הסיכוי כי נקבל בשתי ההטלות את אותו הספר, לאו דווקא 6, הוא הרבה יותר גדול, ושווה לאחד ל-6. זאת כי לתוצאה של שתי הטלות יש 36 תוצאות אפשריות, ורק אחת מהן היא 6-6, אבל 6 מתוך ה-36 הן “דאבל” (1-1, 2-2, וכן הלאה עד 6-6).
אם תטילו את הקוביה מספר פעמים, אז הסיכוי כי באיזהו שלב בסדרת ההטלות יופיע אותו מספר בשתי הטלות רצופות עולה, כי יש לכם יותר הזדמנויות לקבל שתי הטלות רצופות. אתם מוזמנים לנסות ולכתוב את כל 216 התוצאות האפשריות של סדרה של 3 הטלות קוביה, ולספור בכמה תוצאות מתקבלת אותה תוצאה פעמיים ברציפות (תוצאת ההטלה הראשונה שווה לשניה, או השניה שווה לשלישית). ככל שסדרת ההטלות תתארך, כל הסיכוי יגדל.
ואם לא רק אתם עושים את התרגיל הזה, אלא גם כמה חברים, הסיכוי כי מישהו יקבל מתישהו שתי הטלות קוביה רצופות עם אותה תוצאה שוב עולה.
מתברר כי אירועים שנתפסים בעיננו כנדירים אינם נדירים כלל ועיקר. אם אתם חולמים בלילה כח מחר ירד גשם, או שתזכו בלוטו, ולמחרת הדבר אכן קורה, מה הסיכוי לכך? הסיכוי כי אתה או את תחלמו הלילה כי תזכו בפרס הגדול בלוטו וכן תזכו בו בהגרלה הגדולה נמוך למדי. הסיכוי כי מישהו איפהשהו יחלום משהו והמשו הזה יתקיים סביר למדי.
הסיכוי כי אתם תיכנסו למסעדה בבנגקוק ותפגשו שם את איציק שעבד ביחד איתכם לפני כמה שנים ולא ראיתם אותו המון זמן הוא קטן מאוד (זה קרה לי, למעשה). הסיכוי שמישהו יכנס לאיזשהו מקום בעולם ויפגוש שם מישהו שלא ראה כבר המון זמן הוא גבוה מאוד. הסיכוי שאתם תזכו בפרס הגדול בלוטו פעמיים הוא קטן מאוד. הסיכוי שמישהו איפהשהו מתישהו יזכה בפרס הדגול בלוטו פעמיים הוא סביר, וגם זה קרה, יותר מפעם אחת. אני ממליץ לכם לקרוא את המאמר הזה שפורסם בניו-יורק טיימס כבר ב-1990. בכתבה זו מרואיינים מספר סטטיסטיקאים נודעים, ובהם פרסי דיאקוניס, ברדלי אפרון (מספר 8 ברשימת הסטטיסטיקאים הגדולים) ואריק להמן. דיאקוניס ופרדריק מוסטלר גם נתנו שם לתופעה הזו: חוק המספרים הגדולים מאוד.
בספרו האחרון של בני ברבש, “המפץ הקטן”, הוא מתייחס לחוק המספרים הגדולים מאוד (כלומר סבו של המספר מתייחס).
מצד אחד זה חוק קצת מבאס, כי מאוד נעים להיתקל במה שנהוג לכנות צירופי מקרים וזה נותן הרגשה טובה (כמו לראות בכביש מכונית עם מספר פלינדרומי, למרות שהסיכוי לזה דווקא די גבוה. יחסית).
מצד שני, בכל הנוגע לעסקי הלוטו החוק הזה מאוד מעודד אותי.
אני תמיד אומר שלמי שממלא לוטו יש סיכוי הרבה יותר גבוה לזכות בהשוואה למי שלא ממלא.
אבל מי שלא ממלא חוסך לפחות 13 ש”ח בסבירות גבוהה 🙂
הפעם האחרונה שקניתי כרטיס היה לפני שנים רבות, אז איני בטוח במחיר הכרטיס.
יופי של הסבר לתופעה שרוב האנשים לא תופסים. חבל שהעובדות הסטטיסטיות הפשוטות האלו לא מחלחלות.
תודה. למרות שאני כבר לא נאיבי ויודע שהן לא מחלחלות, אני לא מתייאש.
אני חושב שמה שמונע מאנשים לראות עד כמה המקרים הללו הם לא בלתי-סבירים, הוא מה שאפשר לכנות ה”דווקא השקוף” (איך מתרגמים implicit? לא באה לי המילה): השאלה “מה הסיכוי שזה יקרה” תמיד באה אחרי שמשהו קרה, ואז הנטייה שלנו היא לצמצם את עולם ההסתכלות שלנו דווקא על המקרה הספציפי ולהתעלם מכך שהרבה מה”דווקאים” לא באמת מעניינים אותנו. למשל, לא מעניין אף אחד מה הסיכוי שזה יקרה “דווקא” ברומניה (כי זה לא קרה “דווקא” ברומניה – זה קרה איפשהו בעולם, הרומניה היא סתם מקריות). זה לא קרה “דווקא” ב-2009, אלו לא היו “דווקא” המספרים האלה, וכן הלאה. כפי שציינת, אם ישאלו “מה הסיכוי שדווקא בשבוע הבא, דווקא בפולין יעלו בגורל דווקא המספרים 1 2 3 4 5 ו-6, הסיכוי יהיה נמוך למדי (כלומר, הסיכוי יהיה זהה לסיכוי לזכות בהגרלת לוטו), אבל ככל שמורידים יותר דווקאים אנחנו הולכים ומתקרבים לסיכוי של 100 אחוז להתכנות של כל ארוע.
יותר מכך: אחד המשפטים הבסיסיים שמוכיחים כבר בתחילת שנה א’ אומר, בניסוח חופשי, כי אם יש סיכוי שמשהו יקרה, הוא בסופו של דבר יקרה (אם נחכה מספיק זמן, כמובן).
גם מרפי חשב ככה.
אכן, זהו בדיוק הניסוח המתמטי של “חוק מרפי”
אני ממליץ להאזין לפרק Stochasticity בתוכנית Radiolab. אמנם למי שמבין אפילו קצת בסטטיסטיקה זה לא יחדש, אבל התוכנית מציגה בחן רב את הקלות שבה אנחנו מוצאים “נס” במקרה אקראי שההסתברות האמיתית שיקרה אינה זניחה כלל.
דומני שאין קישור למאמר בניו-יורק טיימס.
אופס. הוספתי. תודה.
פוסט נהדר :]
דבר אחד אני לא מבין…
במאמר ב NY times כתוב על בחורה שזכתה פעמיים בלוטו בארבעה חודשים.
אני מבין את הרעיון שאם מסתכלים על כל המהמרים בעולם, מגיעים למספר לא גדול מדי.
אבל הבחורה הזו שואלת את עצמה: מה הסיכוי שאזכה שוב בלוטו? 1 ל 17 מיליארד?
אבל היא זכתה!
נקודת המבט פה קצת מבלבלת. קטונתי ואני בטוח שההסבר כאן הוא הנכון, פשוט כשמסתכלים על זה מנקודה אחרת, זה נראה סיכון קטן בהרבה.
עלית בדיוק על הנקודה. הסיכוי שמישהי שכבר זכתה תזכה שוב שונה מהסיכוי שמישהו איפהשהו יזכה פעמיים
יוצא מן הכלל
משהו דומה אבל שלא קשור למספרים גדולים אלא לסתם “צירופי מקרים” הוא “פרדוקס יום ההולדת”.
ממש בקצרה (רק הנקודה הרלוונטית לדיון):
ההסתברות ששני אנשים בקבוצה יוולדו ביום כלשהו (לא קבוע מראש) גבוהה בהרבה מההסתברות ששני אנשים יוולדו ביום מסוים (קבוע מראש). זה לא באמת פרדוקס, והפרטים מוסברים בערך בויקיפדיה.
נראה לי שהרבה מקוראי הבלוג מודעים ל”פרדוקס” הזה, רק חשבתי שראוי לציין אותו בהקשר זה.
שלום יוסי!
תודה רבה על המאמר המרתק.
אינני מתמטיקאי (וגם זה אנדר-סטייטמנט…), אבל יש לי שתי שאלות לגבי ההסבר המעניין.
ראשית, מה קובע את גבולות הדגימה. ז”א על פי אנו קובעים האם להתייחס רק לתאריך מסויים או רק לבולגריה או לכל היקום או לכל היקומים? אני יכול הרי להכליל עוד יותר ולומר שההסתברות שיצאו מספרים כלשהם בלוטו היא 1. זה שבכל היקום בכל הזמנים ייצא מספר מסויים בלוטו עדיין לא מסביר, לטעמי, את המיקרו-קוסמוס של הלוטו הספציפי.
אולי זה חוסר הבנה בסיסי שלי בנוגע להסתברות, אבל אנסה לנסח את השאלה שלי באופן כללי יותר, לא ברור לי מהם הגבולות של הסתברות, הרי ככל שהדגימה קטנה יותר כך מאבדת ההסתברות משמעות (זה שלהטלת מטבע בודד יש הסתברות של 0.5 ליפול על צד מסויים, לא מנבא כלום, לעומת זאת בהטלת 100,000 מטבעות המציאות תהיה קרובה מאוד ל-0.5). האם יש נוסחה שקובעת מה היחס בין גודל הדגימה לאפשרות לנבא את המציאות?
השאלה השניה שלי נוגעת למשפט (?) שבהינתן זמן מספיק, כל אירוע בהסתברות יותר מ-0 ייתרחש בהכרח. האם אנחנו יכולים להסיק מכך שמתי-שהוא המין האנושי יושמד, כדור-הארץ יושמד וכדומה, או שייתכן שתמיד נצליח איכשהו ללכת בין הטיפות ולהשאר ב-0.9 או 0.8 (או כמה שזה לא יהיה) של הישרדות המין האנושי?
לשאלה הראשונה: ברור שההסתברות תלויה בהגדרה של מרחב המדגם. זו בדיוק הנקודה שניסיתי להסביר: להסתכל רק על שתי הגרלות בודדות בלוטו הבולגרי זה מרחב מדגם צר מדי, ומרחב מדגם ראוי יותר הוא המרחב של כל הגרלות הלוטו.
לשאלה השניה: זה מה שקורה כשלוקחים משפט מתמטי ומנסחים אותו בצורה פופולרית מדי. הכוונה הייתה לסדרה של ניסויים חוזרים, זהים ובלתי תלויים (כמו סדרה של הטלות מטבע). אם עורכים סדרה ארוכה מספיק של ניסויים כאלה, אז כל תוצאה של הניסוי שיש לה הסתברות חיובית, תתקבל לבסוף בהסתברות אחת.
יוסי,
תודה רבה על תשובותיך המחכימות. רציתי לדעת אם יש ניסוח מתמטי או הגדרה ליחס בין מרחב המדגם ליכולת הניבוי.
לי לא ידוע על משהו כזה
אקטואלי היום יותר מתמיד…
זה הזמן לעדכן את הפוסט…
“המספרים בהגרלת הלוטו: 5, 6, 7, 8, 9 ו-10”
ו-20 זוכים
אחת השאלות שצריכות להשאל פה היא כמה אנשים בלוטו בדרא”פ ממלאים רצפים של מספרים.
https://www.ynet.co.il/news/article/B14rzMLiv
כן, באמת המידע המעניין יותר הוא על כמות הזוכים ולא הפליאה מהרצף עצמו.
אם למשל בשבוע ממוצע זוכים שם 2 אנשים, אז לכאורה פי יש פי עשרה שמהמרים על רצפים מאשר על “קומבינציות שרירותיות”?
או שאולי זה רצף יותר מיוחד וקליט ממבחינת הממלאים מאשר נניח 17,18,19,20,21,22…
מעניין גם מה היה הצירוף הזוכה אותו ניחשו שם 33 מנחשים, כפי שמתואר בשנת 2003.