ארכיב עבור 'היסטוריה'

סטטיסטיקאי בפריז

אין כמו ביקור בפריז לשיפור מצב הרוח והנפש. ביום רביעי של השבוע שעבר נסענו זוגתי ואני לחופשה של חמישה ימים בפריז. מועד הנסיעה, שלא במקרה, היה יום הולדתי הראשוני ה-15. זה לא היה ביקורנו הראשון בעיר, ולכן הביקור הנוכחי דילג על "אתרי החובה" השונים של העיר. הפעם בחרנו לסייר בעיקר ברחובות וכיכרות שעדיין לא ביקרנו בהם, בגנים ובשווקים. אמנם תיכננו ביקור במוזיאון האורנז'רי, אך הוא היה סגור עקב שביתה. ביקרנו במוזיאון אחד בלבד – מוזיאון המוזיקה, ואני ממליץ לכולם בחום לבקר בו.

יש מוזיאון אחד בפריז שאני רוצה מאוד לבקר בו, אך מוזיאון כזה אינו קיים: מוזיאון המתמטיקה. אמנם, ב"ארמון התגליות" (Palais de la découverte) יש תערוכה קטנה שעוסקת במתמטיקה, אך היא מאכזבת למדי (ביקרתי בה לפני כמה שנים).

פריז היא המשכן הטבעי למוזיאון מתמטיקה. היא הייתה עיר הבירה של המתמטיקה העולמית במאה ה-18, ובמשך מהמאה ה-19 הייתה עדיין אחד ממרכזי המתמטיקה העולמיים (יחד עם ברלין וגטינגן). בפריז נשא דויד הילברט את נאומו המפורסם בו הציג את 23 הבעיות שיתוו את כיוון המתמטיקה במאה ה-20. בין המתמטיקאים הגדולים שחיו ופעלו בעיר (ואני דולה את השמות מהזיכרון בלבד) ניתן למנות את קושי, לפלס, לגראנז', גלואה, דקארט, האדמר, פואנקרה, ג'רמיין, פורייה, וגם את הרוזן בופון (שמייד אכתוב עליו בהרחבה). אני תמיד מופתע מכך שהעיר פריז די מבליעה את ההיסטוריה המפוארת שלה בתחום הכל כך חשוב הזה.

אחת הדרכיםבהן חולקת פריז כבוד לאנשים היא על ידי קריאת רחובות על שמם. בפריז יש כ-100 רחובות וככרות הנקראים על שם מתמטיקאים, לאו דווקא צרפתיים. יש גם רחובות על שם ברנולי, לייבניץ, ליאונרדו, אך אין רחובות על שם גאוס ורימן. יש כיכר בה נפגשים רחובות ניוטון, גליליאו ואוילר. הנה השלט של רחוב דקארט, ברובע הלטיני:

במרחק מספר דקות הליכה מרחוב דקארט נמצא רחוב בופון, המוביל אל הגנים הבוטניים של פריז (Jardin des Plantes) ובמרכזם ניצב, הפלא ופלא, פסלו של הרוזן בופון!

הרוזן בופון ואני

הרוזן בופון היה איש אשכולות קלאסי של המאה ה-18: הוא היה חוקר טבע, מתמטיקאי, קוסמולוג ועורך אנציקלופדיות. מתברר גם שהוא היה בין מקימי הגנים הבוטניים ומנהלם, ולכן אין זה פלא שפסלו ניצב במרכזם.

לפני כחמש שנים כתבתי כאן על רשימת 100 המשפטים הגדולים של המתמטיקה שהופיעה באחד מאתרי האינטרנט. במקום ה-99 של אותה רשימה הופיעה בעיית המחט של בופון. מהי בעיית המחט של בופון?

תארו לעצמכם דף נייר גדול, עליו משורטטים קווים מקבילים שהמרחק בינם קבוע. נסמן את המרחק בין הקווים באות d. ניקח מחט, שאורכה L, (כאשר L<d), ונטיל אותה על הגליון. מה ההסתברות כי המחט תחצה את אחד הקווים?

בשרטוט שלמעלה מוצגות 7 מחטים, שמתוכן 4 חוצות קווים. הניסוי שתואר למעלה נותן אמדן להסתברות המבוקשת: 4/7.

בופון חישב ומצא כי ההסתברות שהמחט תחצה את אחד הקווים, P, היא

במקרה המיוחד בו אורך המחט שווה למרחק בין הקווים (כלומר L=d), מקבלים כי P=2/π.

π הוא, כמובן, היחס בין היקף המעגל וקוטרו. איך הוא הגיע לכאן? כדי לחשב את ההסתברות נחוצים שני ערכים: מרחק מרכז המחט מהקו הקרוב, והזוית בין המחט ובין הקו. עם הזווית מקבלים כבונוס את הסינוס שלה, והוא מכניס את פיי לתמונה.

נחמד, אבל למה פתרון הבעיה הזו ראוי להמנות בין 100 המשפטים הגדולים של המתמטיקה?

התשובה המפתיעה: בעזרתה ניתן לחשב את ערכו של פיי!

אפשר לבצע את הניסוי של הטלת המחט מספר גדול של פעמים ולאמוד את ההסתברות P על ידי היחס בין מספר הפעמים בהן המחט חצתה את הקו לבין מספר ההטלות. חוק המספרים הגדולים מבטיח כי האמדן קרוב לערך האמיתי של ההסתברות, אם מספר הנסיונות מספיק גדול. כעת, כשיש לנו אמדן טוב ל-P, וידועים לנו ערכי L ו-d, אפשר לחשב את פיי באופן הבא:

או פשוט π=2/P אם d=L.

ב-1901 פרסם המתמטיקאי האיטלקי מריו לזריני קירוב של פיי שהשיג על ידי ניסוי בופון. הוא הטיל מחט שאורכה היה 5/6 מהמרחק בין הקוים 3408 פעמים, והמחט חצתה את הקוים 1808 פעמים. האמדן שקיבל לערכו של פיי היה לכן 355/113, או …3.1415929 בעוד שהערך האמיתי הוא …3.1415926. אמנם, לזריני בחר בקפידה את אורך המחט ואת מספר ההטלות (ויש הטוענים יותר מדי בקפידה), אך התוצאה עדיין מרשימה. מי שמעוניין יכול לנסות בעצמו בבית, או להשתמש באחד מהסימולטורים של הניסוי ברשת.

העקרון לפיו מחושב הערך של פיי מתוצאה של ניסוי מקרי ידוע היום בסטטיסטיקה כ"שיטת מונטה קרלו". כיום יש שימוש נרחב בסימולציה לחישוב ערכים של פרמטרים שונים, הודות ליכולות המחשוב המודרניות. מדהים ששיטה זו מתבססת על עקרונות שהיו ידועים כבר במאה ה-18.

מקבץ 4

שלום לכולם. הפעם מקבץ ארוך למדי, עקב משך הזמן הארוך מאז המקבץ הקודם.

  • השבוע צוינו 100 שנה למותה של פלורנס נייטינגייל.
  • בעיית המעטפות (עליה כתבתי לפני כשנתיים)  הרימה שוב את ראשה, הפעם בבלוג של וייאם בריגס, שהקדיש שתי רשימות לנושא. את הרשימה הראשונה אפילו קראתי. (המשך הפריט גולש לפרטים טכניים, אז מי שלא מעוניין מוזמן פשוט לדלג עליו). בתחילה בריגס מציג את החישוב השגוי לפיו החלפת המעטפות תביא לתוחלת רווח של 1.25X (כאשר  X הוא הסכום במעטפה שקיבלת), ולכן מתקבלת המסקנה הפרדוקסלית לפיה כדאי להחליף את המעטפה שוב ושוב ושוב. אולם בריגס אינו מסיק מכך כי יש לנסות לערוך את החישוב בצורה נאותה יותר. המסקנה של בריגס היא שיש להשליך את התוחלת לכל הרוחות בבעיות החלטה (טוב, הוא השתמש במלים קצת יותר מעודנות). וכיוון שכך, הוא פונה מייד אל העולם הבייסיאני (הבייסיאניים לא משתמשים בתוחלת? אלה חדשות אפילו בשבילי), ומתחיל להציג שלל פתרונות מהסוג שגרמו לי לא להתלהב מהענף הזה של הסטטיסטיקה. עלי לציין כי הגבתי לרשימה וציינתי מהיכן מגיע הפרדוקס, ומדוע תוחלת הרווח מהחלפת המעטפות היא אפס (ולכן לא משנה אם מחליפים או לא). בתגובה בריגס דרש ממני "להוכיח" (?!) כי החישוב שלו לפיו התוחלת היא 1.25X אינו נכון. אני לא מבין את זה. הוא הוא יטען כי 2 ועוד 2 שווים ל-5 ואני אטען כי התשובה הנכונה היא 4 (למניעת תשובות מתחכמות – אני מדבר על שדה הממשיים), האם אדרש להוכיח כי התשובה 5 אינה נכונה? בריגס הוסיף וטען כי התוחלת הוא מושג שכיחותי (frequentist) ואילו ניסוי המעטפות נערך פעם אחת בלבד, ולכן מושג התוחלת אינו תקף. אני לא מבין את הטיעון הזה. ואם נערוך סדרה של ניסויים זהים, אז הטיעון שלי יהיה תקף לפתע? אשמח למי שיאיר את עיניי. את הרשימה השניה של בריגס כבר לא קראתי, אבל אתם מוזמנים.
  • נתן יאו מהבלוג Flowing Data העוסק בויזואליזציה של נתונים כתב רשימה על 7 הכללים הבסיסיים ליצירת גרפים ותרשימים. 7 הכללים הם: בדוק את הנתונים, הסבר את הקידוד, הוסף תוויות לצירים, ציין את יחידות המדידה, שמור על פרופרציות גיאומטריות נכונות, ציין את מקור הנתונים, וזכור מי קהל היעד שלך. כעת פוצח יאו בסדרה של שבע רשימות שתסביר ביתר פירוט את כל אחד מהכללים. הנה הלינק לרשימה הראשונה בסדרה: בדוק את הנתונים.
  • שמוליק הביא בבלוג שלו דוגמא בה הכלל החמישי של יאו מופר בגסות.
  • והנה הצגה גרפית יפה (בוושינגטון פוסט) המשווה בין תכניות המס של שני נשיאי ארה"ב האחרונים, בוש ואובאמה.
  • רנדום ג'ון מדווח על הרצאה של פרנק הארל בכנס useR!  שעסקה ב"אלרגיה לאינפורמציה". תופעה זו באה לידי ביטוי בהתנגדות להשיג אינפורמציה הדרושה לקבלת החלטה נכונה ובהתעלמות מאינפורמציה חשובה וזמינה. הוא מביא לינק למצגת של גירסה יותר ישנה של ההרצאה.
  • ועוד דיווח מכנס: ג'ון ג'ונסון מחברת קאטו מדווח על התובנות שלו מכנס JSM2010 שנערך בואנקובר בתחילת החודש.
  • למתעניינים בכריית נתונים (שלאחרונה הצטרפתי לשורותיהם): ג'ון אלדר כותב על עשרת הטעויות האפשריות הגדולות ביתר בדאטה מיינינג. כשערך את ספירת המלאי גילה שיש לו למעשה 11 טעויות ברשימה. הפתרון שלו: הן דורגו החל מ-0 ועד 10. זה לא רעיון מקורי. גם בליגת המכללות הנקראת "Big10" יש 11 מכללות (שימו לב ללוגו).
  • וזה לא שייך למקבץ, אבל הפריט הקודם הזכיר לי אנקדוטה על המתמטיקאי נורברט ווינר, אולי האבטיפוס של דמות הפרופסור המפוזר. באחת הפעמים שעבר דירה, ביקשה ממנו אשתו לברר כי אל הדירה החדשה הגיעו 10 מזוודות. ווינר חזר ודיווח לרעייתו כי ספר 9 מזוודות בלבד, והדגים בנוכחותה את הספירה החוזרת: 0, 1, 2,…
  • כריסטיאן רוברט (Xian) מאוניברסיטת דופין בפריז החליט להעביר סמינר על המארים הקלאסיים של הסטטיסטיקה. כדי להחליט אלו מאמרים ילמדו בסמינר, הוא ערך סקר בין קוראי הבלוג שלו. בין המועמדים: מאמרם הקלאסי של ניימן ופירסון, מאמרו של ברדלי אפרון (מספר 8 ברשימת 15 הסטטיסטיקאים הגדולים שערכתי), מאמרו של קוקס (מספר 10) על ניתוח השרדות, ועוד רבים וטובים. בולטים בהעדרם מהרשימה  מאמר כלשהו מאת פישר ומאמרו של בייס (עליו כתבתי ברשימה "הכוכב, הסמים והכומר"). כשצפיתי בתוצאות הסקר הופתעתי: המאמר של ניימן ופירסון הגיע רק למקום החמישי, אותו הוא חולק במשותף עם מאמרו של הייסטינגס על שיטת MCMC. למקום הראשון הגיע מאמרו של אפרון על שיטת הבוטסטרפ; במקום השני: דמפסטר, ליירד ורבין במאמרם על שאלגוריתם EM. שלישי היה מאמרו של רוברט טיבשירני על שיטת הלאסו, ובמקום הרביעי – ישראל על המפה: מאמרם של יוסי הוכברג ויואב בנימיני מאוניברסיטת תל אביב על גישת ה-FDR  לבדיקת השערות מרובות.
  • תמר בן יוסף כותבת על התייקרות הדירות בישראל, ובפרט על הקשיים והכשלים במדידת מחירי הדירות.
  • בבלוג עבודה שחורה כותב יפתח גולדמן על סקר שערך משרד התמ"ת אודות התפלגות השכר בישראל ומסקנתו: התפלגות השכר מוּטה, והשכר הממוצע לא מייצג את התפלגות השכר במשק. קוראי הבלוג הותיקים, שקראו את רשימתי על המנהל והפועלים, בודאי לא מופתעים.

מהלימון ועד הקופקסון – מצגת

היום נתתי במועדון קשישים בתל-אביב הרצאה שנשאה את הכותרת: "מהלימון ועד הקופקסון – קיצור תולדות הנסויים הקליניים", לחיצה על הקישור תפתח קובץ pdf של מצגת ההרצאה. אני מקווה לכתוב אחלק מהדברים בצורת רשימה מסודרת כאן בבלוג בעתיד הקרוב. חלק מהדברים כבר מוכרים לכם, ומבוססים על הרשימה "הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל" שהתפרסמה כאן בעבר.

יום פיי שמח!

המתמטיקאים בעולם חוגגים היום את יום הפיי. פיי הוא קבוע מתמטי שודאי שמעתם עליו, וערכו שווה בקירוב ל-3.14.בשיטה הנהוגה בארה"ב, התאריך של היום, ה-14 במרץ, נכתב כך: 3.14, ומכאן מקור המנהג.

בגוגל מציינים את היום על ידי לוגו מיוחד (שהוא התירוץ לכל הפוסט הזה):

ואם כבר כתבתי פוסט, אז הנה חידון פיי שכתבתי פעם כאשר ניהלתי את פורום המתמטיקה בתפוז. אתם מוזמנים לנסות את כוחכם. בהצלחה!

1) בעולם העתיק פיי מוזכר בכתבים בבליים, מצריים ואף בתנ"ך. מי מהשלושה נותן את הקירוב המדוייק ביותר לערך האמיתי של פיי?
א. המצרים.
ב. התנ"ך.
ג. הבבלים.

2) מבין ארבעת השברים הבאים – איזה הוא הקירוב המדוייק ביותר לפיי?
א. 2549491779/811528438
ב. 22/7
ג. 864/275
ד. 3927/1250

3) מי הנהיג את השימוש באות היוונית פיי לציון היחס בין היקף המעגל לקוטרו?
א. ארכימדס
ב. אוילר.
ג. גאוס
ד. איינשטיין.

4) בעיית ריבוע המעגל קשורה למספר פיי. בעיה זו אינה ניתנת לפתרון כיוון ש-
א. פיי הוא מספר אלגברי.
ב. פיי הוא מספר רציונלי.
ג. פיי הוא מספר אירציונלי.
ד. פיי הוא מספר טרנסצנדנטי.

5) המתמטיקאי שהוכיח כי בעיית ריבוע המעגל אינה ניתנת לפתרון הוא:
א. אוילר.
ב. גאוס.
ג. לינדמן.
ד. לז´נדר.

6) לפיי תפקיד חשוב בסטטיסטיקה כיוון ש-:
א. ניתן לקרב את ערכו של פיי באמצעות הטלת מחט על גיליון נייר.
ב. פיי מופיע בנוסחה לחישוב גודל המדגם.
ג. פיי מופיע בנוסחת ההתפלגות הנורמלית.
ד. פיי הוא הערך המקסימלי בעקומת צפיפות האוכלוסיה של אוילר.

7) המתמטיקאי שיום הולדתו הוא יום הפיי, ה-14 למרץ, הוא:
א. אוילר.
ב. איינשטיין.
ג. גאוס.
ד. פרמה.

8 ) עד לכמה ספרות (בערך) אחרי הנקודה העשרונית חושב ערכו של פיי?
א. מיליון.
ב. 206 מיליארד.
ג. 25,000.
ד. 75 מיליון.

9) באיזה אופן מתנהגות הספרות בפיתוח העשרוני של פיי ?
א. באופן מחזורי.
ב. באופן אקראי.
ג. באופן סטטיסטי.
ד. באופן לא מחזורי.

10) איזה מהנוסחאות הבאות אינן מהוות קירוב טוב לפיי?

 

עדכון 14.3.2019: הוספתי סוף סוף את התשובות בתגובות.

רשמים מהרצאתו של מריו ליביו

ביום חמישי האחרון הייתי בהרצאתו של מריו ליביו שנושאה היה כשם ספרו החדש: "האם אלוהים מתמטיקאי". לשמחתי הגעתי מוקדם מספיק כדי להכנס לאולם. אלה שהגיעו מאוחר מדי מצאו אולם מלא ונאלצו לצפות בהרצאה בשידור האינטרנט באולם סמוך. המעוניינים יכולים לצפות בהקלטת ההרצאה באתר יוטיוב.

ההרצאה הייתה בהחלט מעניינת, וליביו הוא בהחלט מרצה טוב. הוא הביא במשך כשעה את ה-highlights של ספרו האחרון. אני עדיין קורא את הספר, אולם לא נתקלתי בהרצאה כספוילרים של ממש. למי שעדיין לא שמע, הספר עוסק בעצם בשאלה הפילוסופית האם המתמטיקה היא תגלית או המצאה. ליביו סוקר בספרו (וסקר בהרצאתו) את הגישות הפילוסופיות שעסקו ועוסקות בשאלות האלה, תןך כדי שהוא שם על ציר הזמן את האירועים המדעיים ש השפיעו על הדיון הזה, ובינהם תצפיותיהם האסטרונומיות של קפלר וגליליאו, פיתוח החשבון הדיפרנציאלי והאינטגלי על ידי ניוטון ולייבניץ, הופעתן של הגיאומטריות הלא אויקלידיות, ומשפטי אי השלמות של גדל.

במקביל, הוא הראה כיצד המתמטיקה והמדע צועדים יד ביד, כאשר פיתוחים מתמטיים חדשים נמצאים מתאימים למוגלים מדעיים חדשים. כדוגמא מרכזית בהרצאתו הביא את תורת הקשרים, שאמנם המוטיבציה הראשונית לפיתוחה הייתה תיאוריית מבנה האטום של הלורד קלווין (אשר שרדה רק כעשרים שנה לפני שהופרכה), אך המחקר המתמטי של תורה זו נמשך, ובסופו של דבר נמצאה שימושית עבור תיאוריות מדעיות חדשות, ובהן תורת המיתרים וחקר מבנה ה-DNA.

הכל טוב ויפה ומרשים, עד שליביו הציג את השאלה הבאה: האין זה מפתיע/מדהים שתורה מתמטית שפותחה ללא כל יישום שהוא, כמו תורת הקשרים, נמצאת לפתע כמתאימה ביותר לתיאור תיאוריה פיזיקלית שכלל לא הייתה מוכרת עד לפני זמן לא רב, כמו תורת המיתרים? השאלה הייתה אמורה להיות שאלה רטורית, אבל לדעתי לפחות, התשובה לשאלה הזו ברורה לחלוטין. לא, זה לא מפתיע בכלל. זה אפילו היה צפוי. יש הרבה תיאוריות מדעיות, יש הרבה תורות מתמטיות, והסיכוי שעם הופעת תיאוריה מדעית חדשה יתברר כי כבר קיימת תורה מתמטית שיכולה להתאים לה, הוא לכן, לדעתי, לא מבוטל כלל וכלל. כבר הסברתי, ברשימה על הלוטו הבולגרי, כי אירוע שנראה בהסתכלות נקודתית כצירוף מקרים מדהים אינו כל כך נדיר, אם בוחנים את כל פוטנציאל צירופי המקרים.

בסיום ההרצאה, כאשר ניתנה לקהל האפשרות לשאול שאלות, הרמתי את ידי ושאלתי אל פרופ' ליביו בדיוק את השאלה הזו. התשובה הייתה מאכזבת (התשובה של ליביו לשאלתי נמצאת 1:04:50 שעות מתחילת הקלטת ההרצאה ביוטיוב). ליביו ענה לי כי אמנם "יש משהו" בדברי, אך מייד המשיך ושאל שאלה נוספת, שנראתה רטורית בעיניו שלפחות. איך אתה מסביר את העובדה שניוטון פיתח תיאוריה מדעית ומתמטית כה מדוייקת על הכבידה, וזאת בהסתמכות על תצפיותיו הלא מדוייקות של קפלר, שאל ליביו. והוסיף ושאל ליביו, האם אין זה מדהים כי התיאוריה של ניוטון, שנבנתה על בסיס התצפיות הלא מדוייקות של קפלר, נתנה תחזיות הרבה יותר מדוייקות? שאל ולא ענה, ואני נמנעתי מלהכנס לדיון איתו בנושא (אני מניח שהוא גם לא היה נותן לי).

אז הנה כאן תשובותיי לליביו. קודם כל, אני חושב שבדבריי יש יותר מ-"משהו". אנחנו חיים בעולם מסויים, ומושפעים ממנו. לכן, אין זה מפתיע כלל וכלל כי גם התיאוריות המדעיות שאנו מפתחים וגם התורות המתמטיות שאנו מפתחים מושפעות מהעולם הזה ומתארות אותו בעת ובעונה אחת. קשרים, למשל, קיימים במציאות. אז מדוע שמתממטיקאים לא יחקרו את תכונותיהם המתמטיות? ולמה בדיוק אנחנו צריכים להיות מופתעים שקשרים קיימים במציאות לא רק בשרוכי נעליים ובספינות מפרשים אלא גם במקומות נוספים, לא בהכרח מעשי ידי אדם? תורת הקשרים, חקר ה-DNA ותורת המיתרים היו על מסלול התנגשות. זה שאנחנו, בני האדם, לא ראינו את זה קורה, לא אומר שהיה כאן אירוע מדהים. ליביו עצמו הביא את דוגמת המדוזה: האם מדוזה תבונית שחיה בקרקעית האוקיינוס, וכל תחושותיה הן שינויי לחץ וטמפרטורה, תפתח מספרים טבעיים? מדוזה כזו תפתח מן הסתם מתמטיקה רציפה, ובמקביל תיאוריות מדעיות על העולם הרציף שהיא חווה. האם נופתע אם נגלה שהמתמטיקה הרציפה שהמדוזה הזו תפתח תהווה שפה מתאימה למדע שאותה מדוזה מפתחת?

השאלה שליביו הציב בפני כתשובה לשאלתי גם היא אינה רטורית בעיני. קודם כל, היא לא ממש עונה על השאלה ששאלתי. מעבר לכך, אני לא מופתע מהיכולת של ניוטון לעבד מידע לא מדוייק ולהפיק ממנו תיאוריה שתפיק אינפורמציה מדוייקת יותר. עשו זאת לפניו, עשו זאת אחריו, ויעשו זאת שוב ושוב בעתיד. דוגמא קלאסית, שליביו לא התייחס אליה בספרו: גאוס השתמש במידע חלקי ביותר על מסלולו של האסטרואיד צרס כדי לחשב במדוייק את מסלולו. אני מעריך מאוד (איך לא) את היכולות של ניוטון וגאוס. מופתע? לא בטוח. זו מהות המדע: הרחבת הידע. אפילו העובדה שמדובר בשני ענקים אינה מטה את הכף לצידו של ליביו. הפיתוחים המתמטיים פורצי הדרך שלהם פותחו כמעט במקביל על ידי מתמטיקאים נוספים (ע"ע לייבניץ, לזנדר, לשתי הדוגמאות האלה). לו לא היו לנו ניוטון וגאוס, עדיין היו לנו החשבון הדיפרנציאלי והאינטגרלי ושיטת הריבועים הפחותים. אני בטוח שרוב הקוראים יוכלו להביא שפע של דוגמאות נוספות.

ואסיים בדעתי האישית (ללא נימוק, איני רואה טעם לחזור על הנימוקים בעד גישה זו שמתוארים היטב בספרו של ליביו, לצד נימוקי הנגד). אני חושב מהמתמטיקה היא פרי המצאתו של האדם. אמנם נחמד לחשוב על המתמטיקה כספר שכתב אלוהים, ואנו מגלים מתוכו דף אחר דף, כפי שתיאר זאת פול ארדש. אבל אני מתחבר יותר לאמירתו של דויד הילברט על תורת הקבוצות: "איש לא יגרש אותנו מגן העדן שקנטור ברא עבורנו".

הכוכב, הסמים והכומר

לפני כחודשיים דיווחתי כאן על השעייתו של סופרסטאר הבייסבול  מני רמירז ל-50 משחקים, לאחר שבבדיקת סמים שנערכה לו התקבלה תוצאה חיובית. עם הדיווח העליתי נקודה למחשבה: לאור העובדה שבבדיקה התקבלה תוצאה חיובית, מה ההסתברות כי רמירז אכן השתמש בסמים אסורים? נתתי גם רמז עבה לפתרון: מספר 4 ברשימת 15 הסטטיסטיקאים הגדולים.

הבטחתי רשימה בנושא, והנה אני סוף סוף מקיים. לזירוז העניין תרם דוברמן, שפרסם בבלוג שלו את החידה הזו. ההקשר היה שונה (שפעת החזירים במקום סמים אסורים), אבל העקרון זהה. מי שמעוניין לקרוא את הפתרון של דוברמן יכול לקרוא אותו בלינק הזה, אם כי אני מייד אתן הסבר משלי וגם ארחיב על הנושא.

ובכן, מה ההסתברות כי רמירז אכן השתמש בסמים אסורים אם בדיקת הסמים שלו הייתה חיובית? התשובה האמיתית והכנה ביותר שאני יכול לתת לכם היא שאני לא יודע. חסרים נתונים. אז בואו ונמציא נתונים לצורך התרגיל. בדיקת הסמים יכולה לטעות. יכול להיות שנבדק כלשהו משתמש בסמים אסורים, ובכל זאת מתקבלת תוצאה שלילית בבדיקה. גם יכול להיות שהנבדק לא השתמש בסמים אסורים ותוצאת הבדיקה בכל זאת הייתה חיובית משום מה (רמירז לא טען זאת, דרך אגב). אלה הן שתי הטעויות שעשויות לקרות בכל תהליך קבלת החלטות. אבל באיזה סיכוי עשויה כל טעות להתרחש? אני אניח, כמו דוברמן בחידה שלו, כי לכל טעות יש סיכוי של אחוז אחד, כלומר 0.01. (את הסיכויים האמיתיים יודעים  מן הסתם יצרני ערכת הבדיקה). עדיין אין מספיק נתונים. כדי לענות על השאלה צריך גם לדעת מהו אחוז משתמשי הסמים באוכלוסיה הרלוונטית, ואת האחוז הזה קשה מאוד לברר. אני מעריך את המספר הזה ב-5 עד 10 אחוז. מסמך פנימי של ליגת ה-MLB שהודלף לאחרונה אמר כי בשנת 2003 התקבלו תוצאות חיוביות אצל 104 שחקנים שנבדקו (אשמח ללינק – לא מצאתי את הידיעה המקורית). בליגה יש כ-1000 שחקנים, ולכן אחוז המשתמשים הוא בסביבות 10. יש הסבורים כי "תקופת הסטרואידים" שהחלה לקראת סוף שנות התשעים של המאה הקודמת כנראה חלפה כבר מן העולם. אני סבור כי השחקנים פשוט עברו להשתמש בחומרים חדשים, שבבדיקות הנוכחיות לא מזהות. יש להם תמריץ כלכלי לכך. בואו ניקח את המספר העגול של 10% לצורך התרגיל.

נניח שכל 1000 השחקנים נבדקים. מתוכם 100 משתמשים בסמים אסורים, על פי הנחתנו, ומכיוון שהבדיקה תתן תוצאה חיובית אם הנבדק משתמש בסמים ב-99 אחוז מהמקרים, נקבל (תיאורטית) 99 תוצאות חיוביות ותוצאה שלילית אחת. 900 השחקנים האחרים נקיים, ועבור 99% מהם תוצאת הבדיקה תהיה שלילית. כלומר, יתקבלו 891 תוצאות שליליות , ואילו 9 שחקנים חסרי מזל יקבלו תוצאה חיובית  (ואלי יושעו) הגם שלא השתמשו בסמים אסורים. נרכז את המספרים האלה בטבלה:

תוצאת הבדיקה

חיובית

שלילית

סה"כ

משתמש בסמים אסורים?

משתמש

99

1

100

לא משתמש

9

891

900

סה"כ

108

892

1000

מתוך 108 שחקנים עבורם התקבלה תוצאה חיובית, 99 אכן משתמשים בסמים, ולכן ההסתברות כי שחקן שתוצאת הבדיקה שלו חיובית אכן משתמש בסמים היא 99/108 כלומר כמעט 92%.

שימו לב כי התוצאה תלויה בהנחה הראשונית על אחוז השחקנים המשתמשים בסמים, שאינו ידוע לנו. אם האחוז הזה הוא רק 5% ולא 10%, אז ההסתברות כי השחקן "שלנו" אכן השתמש בסמים תהיה "רק" 84%.

עכשיו בואו נעזוב את החישובים, ונעבור לדיון עקרוני בתרגיל שנעשה. אנו התמקדנו בשני מאורעות. צפינו במאורע "בבדיקת הסמים התקבלה תוצאה חיובית" והתעניינו במאורע "השחקן שנבדק משתמש בסמים אסורים". כמו כן היו נתונות לנו מספר הסתברויות. הייתה ידועה לנו, בין היתר ההסתברות כי תוצאת בדיקת הסמים היא חיובית כאשר ידוע כי השחקן הנבדק משתמש בסמים אסורים. אבל ההסתברות שעניינה אותנו באמת הייתה ההסתברות כי השחקן הנבדק משתמש בסמים אסורים כאשר ידוע כי תוצאת בדיקת הסמים היא חיובית. שתי ההסתברויות שתיארתי הן הסתברויות מותנות, אבל מתארות מצבים שונים. אחת מתארת הסתברות של מאורע שקורה בהווה (תוצאת הבדיקה חיובית) בהנתן מאורע שקרה בעבר (השחקן השתמש בסמים אסורים). השניה מתארת הסתברות של מאורע שקרה בעבר בהנתן מאורע שקרה בהווה. החישוב שלנו "הפך" את כיוון זרימת הזמן: מההווה לעבר במקום מעבר להווה. וכזכור, כל התרגיל שלנו לא היה מתאפשר ללא הנחה אפריורית כלשהי על אחוז השחקנים המשתמשים בסמים אסורים. הבדיקה אפשרה לנו לעדכן את ההסתברות האפריורית לכך שהשחקן השתמש בסמים אסורים, ולהחליף אותה בהסתברות אפוסטריורית.

הנה תיאור אפשרי אחר של התהליך: בהתחלה לא היה לנו כל ידע לגבי הרגלי השימוש של השחקן המסוים בסמים אסורים, ולכן הנחנו כי הסיכוי לכך שהוא משתמש בסמים כאלה שווה לפרופורציית השחקנים המשתמשים בסמים. הבדיקה שנערכה ותוצאתה נתנו לנו אינפורמציה חדשה, וממנה למדנו כי ההסתברות שהשחקן משתמש בסמים גבוהה הרבה יותר. החישוב שעשינו הוא מעין ביטוי מתמטי לתהליך למידה.

הראשון שניסח את התרגיל ההסתברותי הזה בכתובים היה כומר אנגלי שחי לו במאה ה-18, ושמו תומאס בייס. בייס היה ידוע כמי שעוסק במתמטיקה, ואף היה חבר החברה המלכותית, אם כי בימי חייו לא פרסם אף לא מאמר אחד שתיעד את עבודתו. המאמר המתמטי היחיד שהתפרסם תחת שמו הופיע רק שנתיים לאחר מותו, וזהו למעשה מכתב ששלח לידידו ג'ון קאנטון. במכתב תיאר בייס את הדרך לחשב "הסתברות מותנה הפוכה" (שתיארתי זה עתה). הדוגמא שהביא בייס עסקה, אגב, בסיכויי הנצחון במשחק ביליארד, במיטב המסורת של התפתחות תורת ההסתברות בהתאם לצרכיהם של המהמרים. למעוניינים לקרוא את המאמר עצמו, הנה קישור לקובץ pdf. עותק מקורי של המאמר, דרך אגב, יעלה לכם כ-4200 דולר, אם תמצאו מישהו שמוכן למכור.

הקוראים הותיקים של הבלוג הזה אמורים לדעת כי הזכרתי את בייס בעבר. הוא מופיע במקום ה-4 ברשימת 15 הסטטיסטיקאים הגדולים שערכתי. בעבר קוננתי על כך שמשפט בייס לא הופיע ברשימת 100 המשפטים הגדולים של המתמטיקה שערך מישהו. במסגרת התחקיר לרשימה זו הגעתי ל"פרוייקט מילניום" שנערך על ידי המרכז למדעים קוגניטיביים אוניברסיטת מינסוטה, שניסה לבחור ולדרג את 100 העבודות המשפיעות ביותר על המדעים הקוגניטיביים. מאמרו של בייס היה בין 306 העבודות המועמדות, אך פאנל המומחים שביצע את מלאכת הדירוג לא חשב שהעבודה ראויה דיה כדי להכלל ב-Top 100.

כפי שציינתי כאן בעבר, על הבסיס שהניח בייס צמח ענף שלם של הסטטיסטיקה שנקרא כמובן "סטטיסטיקה בייסיאנית". לסטטיסטיקה הבייסיאנית שימושים מרחיקי לכת. היא עומדת בבסיסן של מערכות הבינה המלאכותית למינהן, ומיושמת במגוון תחומים, החל בגנטיקה וכלה בסינון דואר זבל. אני מסתפק כאן בהפניה למאמר שפרסם פרופ' ישראל בנימיני ב-Ynet לפני מספר שנים, בו יש סקירה נאה של המשפט ושימושיו.

15 הסטטיסטיקאים הגדולים

הקדמה

אמנם יש כאלה שאומרים שפוסטים של רשימות הם כל כך 2006, אבל רשימות הן בכל זאת דבר נחמד, ובמונחי הזמן שלי, 2006 לא כל כך רחוקה. הבלוג המעניין The list universe שאני קורא באופן קבוע (מומלץ) מביא כמעט כל יום רשימה מעניינת של 10 או 15 או 20 ה<שימו כאן כל דבר כמעט>. גם לי מתחשק לכתוב רשימה מהסוג הזה, ואני כידוע לא רק סטטיסטיקאי, אלא גם אדם שאוהב סטטיסטיקה, ולכן הרשימה שלי מביאה באופן טבעי את 15 הסטטיסטיקאים הגדולים ביותר, לדעתי, כמובן. אני צופה שיהיו כאלה שיחלקו על דעתי, יטענו כי הדירוג מקפח את זה ועושה חסד עם זה, ואולי יש מישהו שאינו ראוי להכלל ברשימה ואני כללתי אותו, או להיפך. זה רק שעשוע.

הקריטריון לפיו בחרתי להכניס סטטיסטיקאי (או סטטיסטיקאית) לרשימה הוא אחד ויחיד: מידת ההשפעה שלו על הסטטיסטיקה המודרנית, ואני מתכוון להשפעה ישירה. לכן כל אבות תורת ההסתברות, ובכללם פרמה, הברנולים, פסקל, לפלס, דה-מואבר, ואפילו קולמוגורוב ומרקוב לא מופיעים ברשימה שלי. הם הניחו יסודות, אבל את הסטטיסטיקה שנבנתה על היסודות האלה בנו אחרים. כמו לכל כלל, גם לכלל הזה יש יוצא מן הכלל (נא להמנע מתגובות שעוסקות בפרדוקס השקרן), ומי שתהיה לו סבלנות ימצא את היוצא מהכלל הזה קרוב מאוד לראש הרשימה.

השתדלתי לשמור על ראייה היסטורית. עשרה מהנכללים ברשימה כבר אינם חיים עימנו היום, שלושה נוספים הם בני 90, והצעיר ביותר הינו בן 71. אני יכול לחשוב על כמה סטטיסטיקאים הפעילים כיום שיכולים להימנות ביחד עם ה-15 שבחרתי, אולי במסגרת "רשימת 20", אחד או שניים אף יכולים להכנס לרשימת ה-15 על חשבון אלה שדירגתי בתחתית. אבל אני מעדיף להמתין להיסטוריה שתאמר את דברה.

אז הנה הרשימה שלי. על חלק הנזכרים הרשימה כבר כתבתי בעבר, ואני מצרף לינקים (אני גם מצרף לכל אחד לינק לביוגרפיה שלו בויקיפדיה – לחצו על השם בכותרת). על השאר אני מקווה לכתוב בעתיד, ואעדכן את הלינקים בהתאם. תיהנו.

15. דויד בלקוול (נולד 1919)

דויד בלקוול

סטטיסטיקאי מאוניברסיטת ברקלי, קליפורניה, חוגג באפריל השנה את יום הולדתו ה-90. תרומתו הידועה ביותר לסטטיסטיקה היא חלקו במשפט ראו-בלקוול, המאפשר בניה קונסרוקטיבית של אמד לפרמטר, שהינו עדיף על פני אמד נתון נאיבי כלשהו. בלקוול תרם גם תרומות משמעותיות לסטטיסטיקה הבייסיאנית, תורת המשחקים ותורת ההחלטות הסטטיסטיות.

14. ג'ורג' בוקס (נולד 1919)

ג'ורג' בוקס

סטטיסטיקאי אנגלי שפעל רוב ימיו באוניברסיטת ויסקונסין במדיסון. מחלוצי המחקר בתחומים של סטטיסטיקה בייסיאנית, בקרת איכות, ניתוח סדרות עיתיות ותכנון ניסויים.

13.ק.ר. ראו (נולד 1920)

ק.ר. ראו

סטטיסטיקאי הודי, מתלמידיו של רונלד פישר. שותפו של דויד בלקוול למשפט ראו-בלקוול. תוצאה ידועה נוספת הנושאת את שמו היא אי-שוויון ראו-קראמר, הנותן חסם תחתון לשונותו של אמד, ובכך מהווה הערכה לטיבו. מלבד תרומותיו לתורת האמידה, נודע ראו גם בתרומותיו לפיתוח שיטות לניתוח רב-משתני.

12. פרנק וילקוקסון (1892-1965)

פרנק וילקוקסון

את וילקוקסון אני אוהב במיוחד, כי הוא הגיע אל העיסוק בסטטיסטיקה כמוני – במקרה. הוא בכלל היה כימאי, וחיפש שיטת ניתוח סטטיסטית שלא תהיה תלויה בהתפלגות של הנתונים. הוא חשב על שיטה פשוטה למדי, אך לא הצליח למצוא מראה מקום ביבליוגרפי עבורה. לכן כתב מאמר שתיאר אותה ושלח אותו לכתב עת סטטיסטי, מתוך מחשבה כי המאמר יידחה עם הפניה לעבודה המקורית שמתארת את השיטה, וכך סוף סוף ישיג את ההפניה הביבליוגרפית שחסרה לו למאמר שלו. למרבה הפתעתו, המאמר ששלח התקבל לפירסום, וכך נולד תחום סטטיסטי חדש – הסטטיסטיקה האי-פרמטרית, וגם סטטיסטיקאי חדש.

11. ויליאם סילי גוסט (1876-1937)

ויליאם סילי גוסט

הסטטיסטיקאי שכמעט אף אחד לא שמע עליו, כולל בעלי תארים אקדמיים בסטטיסטיקה, אבל כ-ו-ל-ם מכירים. גוסט עבד במבשלות הבירה "גינס", ושם פיתח במסגרת עבודתו טכניקות סטטיסטיות שונות שעסקו בתכנון ניסויים וניתוח נתונים סטטיסטיים. את עבודותיו פרסם תחת הכינוי "סטודנט" בכתב העת ביומטריקה, הודות לקשריו הטובים עם העורך, קרל פירסון. את השיטה המפורסמת שפיתח להשוואת ממוצעים של שתי אוכלוסיות, מבחן t, מכיר כל מי שלמד קורס מבוא לסטטיסטיקה כלשהו.

10. דויד קוקס (נולד 1924)

דויד קוקס

סטטיסטיקאי אנגלי, נודע בעיקר בזכות תרומתו המכרעת לתחום של ניתוח נתוני השרדות (למשל, משך הזמן העובר עד שינוי במצבו הקליני של חולה). המודל של קוקס הוא סוס העבודה של ניתוח נתונים מסוג זה. תוצר לואי חשוב מאין כמוהו של מודל קוקס הוא שיטת אמידה חדשנית – "נראות חלקית" שמהווה אלטרנטיבה עמידה (רובסטית) לשיטת הנראות המירבית של פישר. הקוראים חדי העין שמו לב לדמיון בין שמו של קוקס ובין סטטיסטיקאי אנגלי אחר שנמצא ברשימה זו – ג'ורג' בוקס. השניים גם שמו לב לכך, והחליטו לכתוב מאמר משותף, פשוט כי מאמר שנושא את השמות בוקס-קוקס נראה להם משעשע (נסו להגיד "בוקס קוקס" עשר פעמים בקול רם בלי לצחוק). התוצאה הייתה מאמר חשוב שהגדיר, ניתח, והכניס לשימוש נרחב משפחה של טרנספומציות לנתונים, שנודעת מאז בשם טרנספומציית בוקס-קוקס.

9. ג'ון טוקי (1915-2000)

ג'ון טוקי

סטטיסטיקאי אמריקני זה היה "general practitioner". תופתעו אולי לשמוע שהוא זה שנמציא את המלים "ביט" ו-"software". אפשר לתאר כאן את עבודתו על טרנספומציות פורייה מהירות (FFT) ועל שיטת ה-jackknife, שהיא וריאציה של שיטת ה-bootstrap שפותחה מאוחר יותר על ידי ברדלי אפרון (שתשמעו עליו מייד). אבל טוקי נכנס לרשימה הזו בזכות גישת ה-"Exploratory Data Analysis" שפיתח וקידם. גישה זו דוגלת בהתבוננות בנתונים ואיתור תבניות בתוכם, בניגוד לגישה השלטת של "Confirmatory Data Analysis", שדוגלת בניסוח השערות ובדיקתן. ניתן לראות בשיטות כריית הנתונים (data mining) הפופולריות כיום כהרחבה של גישת טוקי, וללא ספק ההתפתחות העצומה בתחום מדעי המחשב סייעה לגישתו של טוקי להפוך לפופולרית ולגיטימית. מעניין לדעת האם טוקי חזה כל זאת כאשר עבד בשיתוף פעולה עם ג'ון פון ניומן בשנות הארבעים של המאה הקודמת.

8. ברדלי אפרון (נולד 1938)

ברדלי אפרון

אני נתקל בהרבה אנשים שמתייחסים לסטטיסטיקה כאל סוג של קסם, אבל אם יש שיטה סטטיסטית קסומה באמת, הרי זו שיטת ה-bootstrap שהגה ופיתח ברדלי אפרון מאוניברסיטת סטנפורד. חלקכם אולי מכירים את סיפורו של הברון מינכהאוזן, ששקע עם סוסו בבוץ טובעני. הברון רב התושיה וסוסו ניצלו מטביעה כאשר אחז הברון ברצועת המגף שלו עצמו ומשך את עצמו כלפי מעלה. תאמינו או לא, אבל בסטטיסטיקה הדבר אפשרי. אפרון הוכיח כי ניתן לאמוד מאפיינים סטטיסטיים של אמדים על ידי דגימה חוזרת ונשנית מתוך הנתונים שבידינו (שגם הם, מן הסתם, מהווים מדגם). כך נוצרת הדמיה (סימולציה) של מדגמים אלטרנטיביים שהיינו עשויים לראות. הטכניקה של אפרון עתירת מחשוב, והוצגה לראשונה בשנות השבעים של המאה הקודמת.

7. וו. אדוארדס דמינג (1900-1993)

ןן. אדוארדס דמינג

זהו אחד משני הסטטיסטיקאים ברשימה שלא היו חוקרים באקדמיה, השני הוא ויליאם גוסט. אך בעוד שגוסט עבד בחברה אחת, ונאלץ לפרסם את עבודותיו בעילום שם בגלל מדיניות החברה, דמינג סבב בעולם והרצה את הפילוסופיה הניהולית-סטטיסטית שלו שדגלה באבטחת איכות תהליכית באמצעים סטטיסטיים (תחום הידוע כ-SPC , Statistical Process Control). לכל מי שהיה מוכן לשמוע. מי שהקשיבו והפנימו היו היפנים, ודמינג נחשב לאחראי העיקרי לזינוק הטכנולוגי של יפן בשנות החמישים והשישים של המאה הקודמת.

6. קרל פרידריך גאוס (1777-1855)

קרל פרידריך גאוס

הרי אמרתי בדברי הפתיחה כי ברשימה יכללו אלה שיש להם השפעה ישירה על הסטטיסטיקה המודרנית, אז מה עושה כאן, ועוד במקום השישי, מתמטיקאי מהמאה ה-19? ובכן, לגאוס יש שתי השפעות כאלה: חלקו בגילוי משפט הגבול המרכזי ויישומיו, וכמובן, שיטת הריבועים הפחותים שפיתח. תוכלו לקרוא על שתי תרומות מכריעות אלה בהרחבה בשתי רשימות שפירסמתי כאן בעבר: למי צלצל הפעמון? וכן הכוכב הנעלם והאמד הכחול: משפט גאוס מרקוב ושיטת הריבועים הפחותים.

5. פלורנס נייטינגייל (1820-1910)

פלורנס נייטינגייל

נייטינגייל ידועה בציבור הרחב בעיקר כאחות, אך מדובר בסטטיסטיקאית חשובה, מחלוצות הביוסטטיסטיקה. "כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה, משום שזהו כלי המדידה של כוונותיו", אמרה נייטינגייל. היא הבהירה היטב את דבריה כאשר השתמשה בנתונים סטטיסטיים שאספה בקפדנות והציגה באמצעות שיטות שפיתחה כדי להוכיח כי שמירה על רמת סניטציה נכונה יכולה להוריד את שיעור התמותה בבתי החולים מ-80% ל-2% בלבד. על חייה של ניטינגייל ופועלה כתבתי כאן בהרחבה בעבר: הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל.

4. תומאס בייס (1702-1761)

תומאס בייס

תומאס בייס היה כומר אנגלי שחי לו במאה ה-18. בימי חייו הוא פרסם שני מאמרים בנושאים תיאולוגיים פילוסופיים, אך ככל הנראה התעניין גם במתמטיקה ובהסתברות. הסטטיסטיקה עוד לא נולדה בימיו. אז מה הוא עושה ברשימה הזו, ועוד במקום הרביעי? לאחר מותו של בייס פרסם ידידו, ריצ'רד פרייס, את אחד המכתבים ששלח אליו בייס. במכתב זה הראה בייס כיצד לחשב הסתברות מותנה "הפוכה" כאשר נתונה הסתברות מותנה. לא אכנס כאן לפרטים הטכניים (זה דורש רשימה נפרדת), אבל ההשלכות מהפכניות. בייס הראה כי במובן מסויים אין חשיבות לכיוון בו זורם הזמן – ניתן להסתכל על מאורעות בסדר בו הם מתרחשים או בכיוון ההפוך. אינטרפרטציה מיידית אחרת של התוצאה של בייס היא כי הסתברות אינה בהכרח אובייקטיבית אלא יכולה להיות תלויה ב"אמונות", כלומר בהנחות שמניחים על טבעו של העולם. על סמך אינטרפרטציה זו נבנה ענף שלם וחדש של הסטטיסטיקה – שנקרא, איך לא – סטטיסטיקה בייסיאנית. הניצנים של ענף זה החלו להופיע בשנות החמישים של המאה העשרים, והסטטיסטיקה הבייסיאנית כובשת לה אט אט עוד מעריצים.

3. ג'רזי ניימן (1894-1981)

ג'רזי ניימן

על ג'רזי ניימן וחלק מפועלו כבר כתבתי כאן בהרחבה ברשימה "בין שתי טעויות", שתיארה את התהליך של בדיקת השערות/קבלת החלטות, ואת הלמה של ניימן ופירסון, שהראתה כיצד ניתן לבנות כלל החלטה אופטימלי. למה זו היא ללא ספק המשפט השימושי ביותר בסטטיסטיקה, ורק היא לבדה מקנה לבעליה חיי נצח סטטיסטיים. בכל זאת, אני מציב במקום השלישי את ניימן לבדו, ודוחק מהרשימה את שותפו אגון פירסון (בנו של קרל פירסון). מעניין לציין כי הלמה של ניימן ופירסון דחקה את מתודולוגיית בדיקת ההשערות ששלטה עד אז בכיפה – המתודולוגיה של קרל פירסון, שניימן עבד בשיתוף פעולה עימו במשך כשנתיים. מי שלא אהב כלל לשתף פעולה עם ניימן היה רונלד פישר. הסיבה – שניהם הציגו שיטות לאמידה מרווחית של פרמטרים, כלומר שיטה למצוא תחום שהפרמטר נמצא בתוכו ברמת בטחון מסויימת. ניימן הציע את רווח הסמך – Confidence interval, בעוד שפישר הציע את הגבולות המהימנים – Fiducial limits. פישר כעס על ניימן כי חשב שגנב ממנו את הרעיון. אכן, במקרים מסויימים שתי השיטות נתנו את אותה התוצאה בדיוק. אולם, שיטתו של ניימן עדיפה על זו של פישר, כיוון שהיא מגובה בלמה שלו ושל פירסון, ולכן היא אופטימלית. פישר לא השתכנע עד יום מותו. השיטה שפיתח עדיין בשימוש במקרים בהם לא ניתן להפעיל את שיטתו של ניימן.

2. קרל פירסון (1857-1936)

קרל פירסון

קרל פירסון הוא הראשון שממש נשא בתואר "סטטיסטיקאי". הוא יסד את המחלקה לסטטיסטיקה האקדמית הראשונה בעולם, ביוניברסיטי קולג' שבלונדון, ואת כתב העת הראשון שעסק בסטטיסטיקה בלבד – ביומטריקה. תרומותיו העיקריות לסטטיסטיקה הן בפיתוח התיאוריה של הרגרסיה הלינארית (שיסודותיה הונחו, כזכור, על ידי גאוס שהמציא את שיטת הריבועים הפחותים), פיתוח מקדם המתאם, עבודתו במיון וסיווג ההתפלגויות הסטטיסטיות השונות, ופיתוח מבחן טיב ההתאמה (שידוע גם בשם "מבחן חי-בריבוע").

1. רונלד פישר (1890-1962)

רונלד פישר

לו ניתנה לי הזדמנות לפגוש באדם אחד אשר אינו בין החיים היום, האדם אותו הייתי בוחר לפגוש היה רונלד פישר. פישר למד אסטרונומיה בקיימברידג´, והתעניין במיוחד בהערכת הטעויות בחישובים אסטרונומיים. לאחר סיום לימודיו עסק מספר שנים בהוראת מתמטיקה, וב-1919 עזב את ההוראה לטובת משרת מחקר בחווה לניסויים חקלאיים, שם עסק בניסויים גנטיים. עבודתו בחווה הוליכה אותו אל העיסוק בסטטיסטיקה, שהייתה אז ענף זנוח של המתמטיקה. במסגרת עבודתו היה עליו לתכנן ניסויים ולנתח את תוצאותיהם – שני השלבים הקריטיים בכל מחקר המתבסס על איסוף נתונים ועיבודם. במשך שנות עבודתו בחווה הניח פישר את היסודות לסטטיסטיקה המודרנית. הוא הגה ופיתח את שיטת הרנדומיזציה לתכנון ניסויים, ואת ניתוח השונות (ANOVA),  כלים יסודיים ומרכזיים בסטטיסטיקה המודרנית. פישר הדגיש כי שלב התכנון הוא השלב הקריטי ביותר בכל ניסוי. "לקרוא לסטטיסטיקאי לאחר שהניסוי הסתיים זה כמו לקרוא לרופא לאחר שהחולה מת", אמר פישר. "לכל היותר יוכל הסטטיסטיקאי לומר מדוע הניסוי נכשל". כמו כן הגה פישר מושג מרכזי נוסף בסטטיסטיקה – מושג הנראות (Likelihood) וממנו פיתח את שיטת האמידה הידועה כשיטת הנראות המקסימלית. פיתוחים מרכזיים נוספים שלו כללו שיטות סטטיסטיות לניתוח מדגמים קטנים, וחישובי פונקציות ההתפלגות המדויקות של מדדים סטטיסטיים רבים. חלק מעבודתו של פישר נתקל בביקורת מצידו של בכיר העוסקים בסטטיסטיקה באותה תקופה, קרל פירסון, שהתנגד במיוחד למושג הנראות ושיטת הנראות המירבית. פישר, בתגובה, פירסם מאמר ובו הצביע על טעויות באחת מעבודותיו של פירסון. היריבות בין השניים נמשכה עד מותו של פירסון, ולמעשה גם אחריה, כאשר בנו של קרל פירסון, סטטיסטיקאי נודע בזכות עצמו, המשיך לריב את ריבו של אביו. נצחון בעל משמעות סמלית נחל פישר כאשר התמנה לכהן בקתדרה על שם גאלטון בקיימברידג´ במקום פירסון, כאשר האחרון פרש לגמלאות (העלבון כפול, כי פירסון היה כזכור תלמידו של גאלטון). גם בראיה היסטורית, ניצח פישר בויכוח עם פירסון ובנו. הוא זכה להכרה בהישגיו כאשר נבחר לחברה המלכותית, זכה בפרסים רבים, כולל מדליית דרוין, וכן הוענק לו תואר אצולה. פישר פרסם מאמרים רבים הן בסטטיסטיקה והן בגנטיקה. נציין כאן את שני ספריו החשובים ביותר: "שיטות סטטיסטיות למחקר", בו סיכם את תרומותיו לסטטיסטיקה, ו-"תיאוריה גנטית של הברירה הטבעית", בו סיכם את מחקריו בתחום הגנטיקה.

הקוראים הותיקים של הבלוג הזה בודאי זוכרים את האנקדוטה אודות פישר שסירב להשתכנע כי עישון גורם לסרטן על סמך מתאם שנצפה בין שתי התופעות (ראו את הרשימה הראשונה שפירסמתי: האם החסידה מביאה ילדים לעולם?), נאמן לעקרון הסטטיסטי לפיו מתאם אינו מעיד על סיבתיות. פישר, מעשן כבד כל חייו, מת לאחר שחלה בסרטן המעי הגס בשנת 1962.

כאב ראש תורכי

מי שחטף כאבי ראש בעקבות הזעזועים בשווקי המטבע הבינלאומיים שהיו בשנה האחרונה, ישמח אולי לדעת שזו לא תופעה חדשה.

אסף ברטוב מדווח בבלוג של פרוייקט בן יהודה על תנודות שער החליפין של הלירה התורכית בתקופת האימפריה העות'מנית, כפי שתוארו בספרו של יהושע ילין, "זכרונות לבן ירושלים" (להלן ציטוט קצר מהקטע המלא שהביא אסף):

"הלירה היא לפעמים מאה ועשרים גרוש, ולפעמים יותר או פחות; וכן שונה מחירה בכל עיר ועיר: בירושלים מאה ועשרים, וביפו מאה וארבעים וכו'; וכן שאר המטבעות משתנות ומתחלפות."

אין חדש תחת השמש.

10 האמונות המדעיות המופרכות של העבר

הבלוג המעניין "The list universe" (שאני קורא באופן קבוע דרך הרסס, מומלץ) מביא היום את רשימת 10 האמונות המדעיות המופרכות של העבר (או יותר נכון, את ה-top 10 של הקטגוריה הזו). ברשימה ניתן למצוא, בין היתר, את האלכימיה, התיאוריה הגיאוצנטרית (לפיה הארץ היא מרכז היקום), תיאוריית הפלוגיסטון, וכמובן, את תיאוריית הבריאה הספומטנית.

ההומיאופתיה לא נמצאת לצערי ברשימה הזו. יש לכך שתי סיבות, לדעתי. ראשית, זו לא ממש אמונה מדעית (למרות שפה ושם יש מדענים שתומכים בתיאוריה הזו).

שנית, האמונה עדיין קיימת וקהל המאמינים גדול למדי. האפיפיור כבר יודע שהשמש לא סובבת את כדור הארץ, אבל חסידי ההומיאופתיה לא משתכנעים באותה הקלות. אולי בעוד כמה עשרות שנים נוכל להוסיף אותה לרשימה.

מי בעד חיסול התלושים?

מאמר מעניין שהופיע בסופ"ש במוסף "הארץ" תחת הכותרת "מי בעד חיסול התלושים?", מספר על ההיסטוריה של סקרי דעת הקהל בישראל:

"סקרי דעת קהל הם באמת יבוא מאמריקה, אבל נמצאים איתנו כבר יותר מ-60 שנה. "מפתיע לגלות שחקר דעת הקהל בישראל קדם להקמת המדינה", כתבה ד"ר דנה בלאנדר, חוקרת במכון הישראלי לדמוקרטיה, במאמר שהתפרסם באתר של המכון. החלוץ של המחקר החברתי-שימושי בארץ היה פרופ' אליהו (לואיס) גוטמן, שממניעים ציוניים ויתר על קריירה אקדמית בארצות הברית ובא ארצה ביולי 47'. כעבור חצי שנה, בעיצומה של מלחמת העצמאות, יחד עם אוריאל פואה, חוקר במדעי החברה שבא מאיטליה, הקים גוטמן בירושלים יחידת מחקר פסיכולוגית קטנה, שהורכבה ממתנדבים ועסקה בחקר דעת קהל בשביל מחלקת ההסברה של "משמר העם"."

פורסם לראשונה באתר "רשימות" בתאריך 17 באוגוסט 2008