ארכיב עבור 'האנשים שמאחורי הסטטיסטיקה'
מקבץ 3
במקבץ השבוע גם כמה קישורים מהשבוע הקודם שנדחו בגלל פול התמנון.
- ב-7 ביולי צוין יום השנה ה-104 להולדתו של הסטטיסטיקאי וחוקר תורת ההסתברות ויליאם פלר. צייצתי את המאורע בתוספת הערה כי "מי שלא ציטט את ספרו של פלר בעבודת המאסטר או הדוקטורט שלו, לא באמת עשה תואר בסטטיסטיקה". טוב, אולי קצת הגזמתי, אבל הספר אכן מצוטט בעבודת המוסמך שלי.
- כאשר ערכתי את רשימת 15 הסטטיסטיקאים הגדולים כללתי בה 5 סטטיסטיקאים חיים. אחד מהם הלך לעולמו ב-8 ביולי, בגיל 91. דויד בלקוול, בנו של פועל רכבת מדרום אילינוי, אשר לימד את עצמו לקרוא, הפך לאחד הסטטיסטיקאים המשפיעים ביותר במאה העשרים. בלקוול חקר גם את תורת המשחקים, וכתב ספר לימוד פופולרי בתחום. ויליאם בריגס כותב גם הוא בבלוג שלו על בלקוול, ומתאר שם את פתרונו של בלקוול לבעית ההימורים הידועה כ-"פרדוקס סנט-פטרסבורג".
- נניח שאתם מתכנתים קוד מחשב. ודאי שיש בו באגים. איך תדעו כמה באגים יש בו? ג'ון ד. קוק מסביר בבלוג שלו איך לעשות את זה: אפשר לבקש ממישהו לבדוק את הקוד. נניח שימצא 20 באגים. זה אומר שיש בקוד לפחות 20 באגים, אבל לא מקדם אתכם הרבה. הפתרון – לתת לעוד מישהו לבדוק את הקוד. סביר להניח שימצא חלק מהבאגים שמצא הבודק הראשון, ואולי גם יעלה על באגים אחרים. עכשיו, בעזרת קצת סטטיסטיקה, תוכלו לאמוד את מספר הבאגים שנמצאים ועדיין לא התגלו.
- מעולם לא כתבתי מכתב אהבה כזה, אבל מלים כאלה רק סטטיסטיקאי יכול לכתוב.
- בהמשך לפול התמנון: האם העובדה כי מישהי זכתה ארבע פעמים בלוטו "סותרת את כל הסטטיסטיקות"? ממש לא.
- חובבי הבייסבול יודעים כי קבוצת פיטסבורג פיראטס היא אחת הקבוצות החלשות ביותר בליגת הביססבול האמריקנית (MLB). ובכל זאת, הליגה מציעה לאוהדים לרכוש אופציה לרכישת כרטיס למשחק השביעי של הפיראטים בסדרת הגמר (ה"וורלד סירייס"), אם יהיה משחק כזה, כמובן. האם כדאי לקנות את האופציה? ואם כן, האם המחיר המוצע "משתלם"? בלוג הבייסבול FanGraphs מציג שילוב של ניתוח סטטיסטי וכלכלי, עם הסבר נאה למושג התוחלת ומשמעות האופציה.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 18 ביולי, 2010. נושאים: האנשים שמאחורי הסטטיסטיקה, הממ... מעניין....
תגובות: 1
| טראקבק
מהלימון ועד הקופקסון – מצגת
היום נתתי במועדון קשישים בתל-אביב הרצאה שנשאה את הכותרת: "מהלימון ועד הקופקסון – קיצור תולדות הנסויים הקליניים", לחיצה על הקישור תפתח קובץ pdf של מצגת ההרצאה. אני מקווה לכתוב אחלק מהדברים בצורת רשימה מסודרת כאן בבלוג בעתיד הקרוב. חלק מהדברים כבר מוכרים לכם, ומבוססים על הרשימה "הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל" שהתפרסמה כאן בעבר.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 18 במרץ, 2010. נושאים: ביוסטטיסטיקה, האנשים שמאחורי הסטטיסטיקה, היסטוריה.
תגובות: 1
| טראקבק
מה באמת קורה בלוטו הבולגרי?
האמת: שום דבר מיוחד.
בידיעה שפורסמה ב-Ynet לפני כחודש נמסר כי "אותם מספרים בדיוק יצאו בשתי הגרלות לוטו ברציפות". מדובר בלוטו הבולגרי, שם המספרים 4, 15, 23, 24, 35 ו-42 הוגרלו ב-6 בספטמבר ולאחר מכן שוב, ב-10 לחודש. עוד נמסר בידיעה כי "המתמטיקאי מיכאיל קונסטנטינוב חישב ומצא כי הסיכוי לכך הוא 1 ל-4.2 מיליון". כן נמסר כי שר הספורט של בולגריה הורה לפתוח חקירה מיוחדת בנושא.
המממ.
האם באמת מדובר באירוע כל כך נדיר שמצדיק חקירה, ולא סתם חקירה אלא חקירה "מיוחדת"? האם הסיכוי ל"כך" הוא באמת אחד ל-4.2 מליון, כמו שחישב מר קונסטנטינוב?
התשובה הרבה יותר מסובכת, ועם זאת לא קשה להבנה. כמו תמיד: התשובה המדויקת תלויה בניסוח מדויק של השאלה, כלומר למה מתכוונים כשאומרים "כך". אביא תחילה את התשובות כפי שפורסמו באתר ChanceWiki (אתם מוזמנים לגלוש ולעיין בחישובים המפורטים):
- הסיכוי כי המספרים 4, 15, 23, 24, 35 ו-42 יעלו בגורל בשתי הגרלות בתאריכים נתונים (6 בספטמבר ו-10 בספטמבר) הוא בערך אחד ל-27000 מיליארד.
- הסיכוי כי בשתי הגרלות בתאריכים נתונים יעלו אותם 6 מספרים (אך לא בהכרח הצירוף הנ"ל) הוא בערך אחד ל-5.2 מיליון.
- הסיכוי כי במשך שנה שלמה, בה נערכות 104 הגרלות, יעלו אותם 6 מספרים בשתי הגרלות רצופות, הוא בערך אחד ל-51000.
- הסיכוי כי במשך רצף של 5400 הגרלות (הלוטו הבולגרי קיים יותר מחמישים שנה, וזה בערך מספר ההגרלות שנערכו בו) יעלו אותם 6 מספרים בשתי הגרלות רצופות הוא בערך אחד ל-970.
- הסיכוי כי באיזה הגרלת לוטו, באיזה מקום בעולם, באיזושהי נקודת זמן בתקופה של חמישים שנה בה נערכות הגרלות דו שבועיות, יעלו אותם 6 מספרים בשתי הגרלות רצופות וזאת בהנחה שיש בעולם כ-100 הגרלות לוטו כאלה, הוא בערך 10%.
אז מתברר שדי צפוי שמתישהו, איפהשהו, יעלו אותם מספרים בשתי הגרלות לוטו רצופות. אני מקווה שהחקירה המיוחדת של שר הספורט הבולגרי תעלה על זה.
הנה הסבר אינטואיטיבי למה שקרה באמת.
תחשבו על קוביה. הרי הגרלת הלוטו היא תהליך שבו בוחרים אפשרות אחת מתוך 5245786 אפשרויות (זה מספר הצירופים האפשריים של 6 מספרים מתוך 42, כלומר מספר הצירופים האפשריים בלוטו הבולגרי). במלים אחרות, הגרלת הלוטו שקולה להטלת קוביה עם 5245786 צדדים, ולכן הדיון העקרוני לא צריך להיות שונה מדיון בהטלה קוביה "רגילה" הדומה לקוביות שמתנוססות בראש העמוד הזה.
לקוביה רגילה יש 6 צדדים, ובהחנה שהקוביה "הוגנת", יש סיכוי שווה של שישית לכל אחת מהתוצאות האפשריות של הטלת הקוביה (התוצאות הן הספרות 1-6).
אם נטיל את הקוביה פעמיים, יש סיכוי של אחד ל-36 כי בשתי ההטלות נקבל 6, אבל הסיכוי כי נקבל בשתי ההטלות את אותו הספר, לאו דווקא 6, הוא הרבה יותר גדול, ושווה לאחד ל-6. זאת כי לתוצאה של שתי הטלות יש 36 תוצאות אפשריות, ורק אחת מהן היא 6-6, אבל 6 מתוך ה-36 הן "דאבל" (1-1, 2-2, וכן הלאה עד 6-6).
אם תטילו את הקוביה מספר פעמים, אז הסיכוי כי באיזהו שלב בסדרת ההטלות יופיע אותו מספר בשתי הטלות רצופות עולה, כי יש לכם יותר הזדמנויות לקבל שתי הטלות רצופות. אתם מוזמנים לנסות ולכתוב את כל 216 התוצאות האפשריות של סדרה של 3 הטלות קוביה, ולספור בכמה תוצאות מתקבלת אותה תוצאה פעמיים ברציפות (תוצאת ההטלה הראשונה שווה לשניה, או השניה שווה לשלישית). ככל שסדרת ההטלות תתארך, כל הסיכוי יגדל.
ואם לא רק אתם עושים את התרגיל הזה, אלא גם כמה חברים, הסיכוי כי מישהו יקבל מתישהו שתי הטלות קוביה רצופות עם אותה תוצאה שוב עולה.
מתברר כי אירועים שנתפסים בעיננו כנדירים אינם נדירים כלל ועיקר. אם אתם חולמים בלילה כח מחר ירד גשם, או שתזכו בלוטו, ולמחרת הדבר אכן קורה, מה הסיכוי לכך? הסיכוי כי אתה או את תחלמו הלילה כי תזכו בפרס הגדול בלוטו וכן תזכו בו בהגרלה הגדולה נמוך למדי. הסיכוי כי מישהו איפהשהו יחלום משהו והמשו הזה יתקיים סביר למדי.
הסיכוי כי אתם תיכנסו למסעדה בבנגקוק ותפגשו שם את איציק שעבד ביחד איתכם לפני כמה שנים ולא ראיתם אותו המון זמן הוא קטן מאוד (זה קרה לי, למעשה). הסיכוי שמישהו יכנס לאיזשהו מקום בעולם ויפגוש שם מישהו שלא ראה כבר המון זמן הוא גבוה מאוד. הסיכוי שאתם תזכו בפרס הגדול בלוטו פעמיים הוא קטן מאוד. הסיכוי שמישהו איפהשהו מתישהו יזכה בפרס הדגול בלוטו פעמיים הוא סביר, וגם זה קרה, יותר מפעם אחת. אני ממליץ לכם לקרוא את המאמר הזה שפורסם בניו-יורק טיימס כבר ב-1990. בכתבה זו מרואיינים מספר סטטיסטיקאים נודעים, ובהם פרסי דיאקוניס, ברדלי אפרון (מספר 8 ברשימת הסטטיסטיקאים הגדולים) ואריק להמן. דיאקוניס ופרדריק מוסטלר גם נתנו שם לתופעה הזו: חוק המספרים הגדולים מאוד.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 15 באוקטובר, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, הימורים, מה אומרת הסטטיסטיקה.
תגובות: 22
| טראקבק
שלושים למותו של אריק ליאו להמן
את הידיעה על מותו של אריק לאו להמן פרסמתי בקצרה באתר האיגוד הישראלי לסטטיסטיקה לפני חודש בדיוק. הידיעה הגיעה אלי במקרה, דרך הודעה לקונית שפורסמה בפורום המתמטיקה של תפוז. האישור היחיד שמצאתי לנכונותה היה בויקיפדיה, שם אכן צויין כי להמן נפטר ב-12.9.2009. זהו. חיפוש באתרי החדשות דרך גוגל העלה רק ידיעות על שחקן כדורגל גרמני הנושא את אותו השם, ורק בפורום ברזילאי כלשהו מצאתי עותק של המייל ששלח תלמידו ועמיתו, פיטר ביקל, לחברי הסגל של המחלקה לסטטיסטיקה באוניברסיטת ברקלי ובה הודיע על הפטירה. כעבור מספר ימים הופיעה הודעה גם באתר המחלקה לסטטיסטיקה של ברקלי, והועלה קובץ pdf המסכם את מורשתו של להמן.

אריק לאו להמן
אני מודה שהופתעתי מכך שמותו של להמן לא הדהד בעולם הסטטיסטיקה (ובמחשבה שניה, סיפור שאספר עוד מעט יראה שאולי לא הייתי צריך להיות מופתע). שמו מוכר לכל סטטיסטיקאי, בזכות שני הספרים המונומנטליים שכתב: האחד על אמידה נקודתית, והשני על בדיקת השערות (הקישורים לגוגל בוקס, שם תוכלו גם לעיין בחלקים מהספרים). הספרים אינם רק סיכום של ידע, אלא מכילים את מחקריו של להמן בנושאים האלה, ולמרות שנכתבו לראשונה בשנות החמישם של המאה הקודמת הם עדיין רלוונטיים, גם בזכות המהדורות המעודכנות שהוציא להמן לאור יחד בסיוע שניים מתלמידיו.
למעשה, ספר הסטטיסטיקה הראשון שרכשתי נכתב גם הוא על ידי להמן (ביחד עם ג. ל. הודג'ס): "מושגים בסיסיים בהסתברות וסטטיסטיקה" (זה שוב לינק לגוגל בוקס. אני רכשתי את המהדורה העברית), כאשר הייתי תלמיד שנה א. אני חייב לציין שהספר שמרתק תרם תרומה רבה להחלטתי לוותר על לימודי הכלכלה ולהתמקד בסטטיסטיקה.
כאשר הייתי תלמיד שנה ג, הגיע להמן לביקור בישראל ונתן הרצאה בסמינר של המחלקה לסטטיסטיקה. הסמינר מיועד אמנם לאנשי סגל המחלקה, אבל החלטתי לבוא בכל זאת. לא התאכזבתי. להמן נתן הרצאה בהירה, מעניינת ומשעשעת בנושא הקשור לבדיקת השערות (אני לא זוכר את הפרטים כמובן). עצם העובדה שכתלמיד שנה ג הצלחתי בכל זאת לעקוב אחרי רוב הדברים שאמר מעידה על יכולתו כמרצה מעולה.
התלבטתי אם להביא עימי את העותק של ספרו ולבקש ממנו לכתוב לי הקדשה עליו. בסוף התביישתי וויתרתי. היום אני קצת מצטער. בכל מקרה, אזרתי אומץ, ניגשתי אליו אחרי ההרצאה, והחלפתי איתו כמה מלים.
את להמן ראיתי שוב, מרחוק, בקיץ 1997, בכנס האיגוד האמריקני לסטטיסטיקה שנערך באנהיים, קליפורניה. היום אני יודע שהוא כבר היה בן 80 70 באותה עת. ראיתי אותו פוסע באיטיות באיזור הצפוף של מכירת הספרים, מקווה שלא יידרס על ידי ההמון. הוא נראה מבולבל ועייף, נראה שאף אחד לא ממש ראה אותו. עד ששמתי לב כי זה אכן להמן, הוא נעלם בין הסטטיסטיקאים הרבים שהיו שם, רובם למדו מספריו, אני מניח.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 13 באוקטובר, 2009. נושאים: בנימה אישית, האנשים שמאחורי הסטטיסטיקה.
תגובות: 3
| טראקבק
קריירה בסטטיסטיקה – גליון מיוחד של AMSTAT NEWS
גליון חודש ספטמבר 2009 של AMSTAT NEWS, המגזין החודשי של האיגוד האמריקני לסטטיסטיקה, מוקדש לנושא המעניין במיוחד של קריירה בסטטיסטיקה. בין היתר, תוכלו למצוא שם כתבה בנושא עבודה מול ממשקים, מאמר על אסטרטגיה בחיפוש עבודה, וטיפים לכתיבת תוצאות מחקר במאמר מדעי – שלושה נושאים שיכולים לעניין גם את אלה שאינם סטטיסטיקאים.
במאמרים שיעניינו יותר את ציבור הסטטיסטיקאים מסביר הסטטיסטיקאי סיו-לי מנג מדוע הסטטיסטיקה היא הסיכוי שלך לאושר (או לסבל), וסטטיסטיקאים מרחבי ארצות הברית מתארים את עיסוקיהם הרבים והמגוונים.
חמישה מאמרים נוספים מביטים לאחור ומסכמים את הקריירות של חמישה סטטיסטיקאים נודעים.
ניתן לעיין בגליון און-ליין באתר האיגוד האמריקני לסטטיסטיקה.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 22 בספטמבר, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה.
תגובות: אין
| טראקבק