חיפוש באתר

קישורים

עמודים

קטגוריות

ארכיב עבור 'האנשים שמאחורי הסטטיסטיקה'

ממתאם לסיבתיות – הקריטריונים של ברדפורד היל

בשנת 1965 נעשה הניסיון הראשון להציג מתווה שיאפשר הסקת סיבתיות על סמך מתאם, כאשר סיר אוסטין ברדפורד היל הציג 9 קריטריונים להסקה כזו. בפוסט זה אציג ואדגים את הקריטריונים והביקורת עליהם. לבסוף אביע את דעתי על הרלוונטיות העכשווית של שלהם.

רקע היסטורי


Austin Bradford Hill

היל הציג את מה שהפך להיות מאוחר יותר לרשימת קריטריונים במסגרת הרצאה בפני החברה המלכותית לרפואה בשנת 1965. חלק גדול מהדברים שנאמרו בהרצאה הסתמכו על עבודתו בדבר הקשר בין עישון ותחלואה בסרטן בריאה[1]. היל ידע כמובן כי סטנדרט הזהב להוכחת סיבתיות הוא ניסוי מבוקר בהקצאה רנדומלית. הוא היה הסטטיסטיקאי בצוות שתיכנן וביצע את ניסוי הסטרפטומיצין ב-1945, שהיה הניסוי הקליני הראשון שבו הייתה הקצאה רנדומלית של הטיפול. היל כמובן גם ידע היטב כי ניסויים כאלה אינם תמיד אפשריים, וניסה ליצור מסגרת עבודה למחקרים תצפיתיים: מחקרים בהם לא ניתן לקבוע לאיזו קבוצה ישתייך איזה נבדק, והקבוצות נוצרות מעצמן.
כותרת ההרצאה והמאמר שבו פורסם תמליל ההרצאה[2] הציגה במפורש את השאלה “מתאם או סיבתיות?”. בהרצאה היל נמנע מלהגדיר מהי סיבתיות או אפקט סיבתי. הוא ציין במפורש כי אין לו את ההכשרה הדרושה כדי לדון במשמעויות הפילוסופיות של מושג הסיבתיות, והבהיר כי יימנע מלעסוק בכך. היל גם לא התיימר לקבוע קריטריונים כלשהם. הוא הציע תשע נקודות מבט על הנושא הסבוך של מתאם וסיבתיות. עם זאת, נקודות המבט שהציע הפכו במהרה לרשימת קריטריונים ול-“צ’קליסט”, כאשר כל סימן V מחזק את הטענה לקשר סיבתי. למרות שהיל כאמור לא התייחס לרשימה שלו כאל רשימת קריטריונים, אני אתייחס אליהם ככאלה בהמשך.
כמו כן, אציין כי ההתייחסות של היל לנושא הייתה בקונטקסט של רפואה ובריאות הציבור. בדיקת קיום הקריטריונים בהקשרים אחרים אינה בלתי אפשרית, כמובן, אך לא אתייחס לכך כאן .

הקריטריונים

קריטריון הראשון של היל הוא קריטריון העוצמה (strength), והכוונה היא לעוצמת הקשר הסטטיסטי[3] בין שני המשתנים – משתנה הסיבה ומשתנה התוצאה. ההנחה היא שאם עצמת הקשר חזקה אז פחות סביר שיש גורמים שלא נצפו המשפיעים על עצמת הקשר הסטטיסטי, ואם יש כאלה אז השפעתם מוגבלת[4]. מאידך, הסביר היל, ניתן פעמים רבות להסביר קשר חלש על ידי הטיות בנתונים. היל ציין כי קשר סטטיסטי חלש אינו שולל את קיומה של סיבתיות, וקיימות דוגמאות לכך.[5]. קל גם למצוא דוגמאות בהן יש קשר סטטיסטי חזק ללא קשר סיבתי.

הקריטריון השני הוא עיקרון העקביות (consistency). היל הסביר כי מידת הביטחון בהסבר סיבתי גדלה כאשר עדויות לקשר מתקבלות ממספר מקורות, כלומר מחקרים שונים, עם תכנונים מחקריים שונים ושנערכו בקרב אוכלוסיות שונות. עם זאת ציין היל כי חוסר עקביות לא שולל בהכרח קשר סיבתי, ואין לקפוץ למסקנה כי קשר סיבתי אינו קיים. חוסר עקביות יכול להוביל לתובנות חדשות[6] ודורש מחקר נוסף. בראש המבקרים של קריטריון זה ניצב רונלד פישר[7], בעיצומו של הויכוח על הקשר בין העישון והתחלואה בסרטן הריאות. פישר טען, במידה רבה של צדק, שאם קיימת הטיה בסיסית, אז קיום מספר מחקרים אינו מבטל את ההטיה. פישר הציע מודל משלו לקשר בין העישון והסרטן, והמודל הזה סתר את המסקנות של היל ושל אחרים בדבר קיום הקשר הסיבתי בין שני משתנים אלה.

הקריטריון השלישי הוא עיקרון הייחודיות או הסגוליות (specifity). זהו הקריטריון הכי שנוי במחלוקת מבין התשעה. פרשנות אחת שלו אומרת כי סיבתיות הינה הסבר סביר כאשר מתמקדים באוכלוסיה מסויימת, איזור מסויים וכדומה. דוגמה לכך יכולה להיות תחלואה בסרטן הריאה בקרב מנקי ארובות בלונדון. אך ניתן לפרש את דבריו של היל גם באופן אחר. לפי פרשנות זו, היל טען כי יש לדרוש כי לגורם אחד יש תוצאה אפשרית אחת ולהיפך. זה בודאי לא נכון באופן כללי, והיל עצמו ציין זאת ונתן דוגמאות. עם זאת, הדבר בהחלט ייתכן תחת המיקוד שהוזכר קודם. בכל מקרה, גם היל הבהיר בדבריו כי זהו הקריטריון החלש ביותר מבין התשעה.

הקריטריון הרביעי הוא עיקרון הזמניות (temporality). הגורם הסיבתי חייב לקרות לפני התוצאה. קשה להתווכח על זה. כמובן, שאם תוצאה מתרחשת לאחר שמתרחש אירוע כלשהו, אי אפשר להסיק מכך שהאירוע גרם לתוצאה.

הקריטריון החמישי הוא קריטריון הגרדיאנט הביולוגי, המבטא את עצמת התגובה. לפי היל, אם כאשר מינון הגורם גבוה יותר גם התוצאה או עוצמתה גבוהה יותר, סביר יותר כי קיים קשר סיבתי. אחת הדוגמאות שהביא היל היא שהסיכון לחלות בסרטן הריאה גבוה יותר עבור מי שמעשן יותר. יש המפרשים את דבריו של היל כדרישה לקשר מונוטוני רציף בין המשתנים[8]. גם קריטריון זה לא חייב בהכרח להתקיים. למשל, לצריכת קפאין במידה סבירה יש יתרונות בריאותיים, ולכן אם נתבונן בתחלואה העשויה להיגרם מצריכת קפאין, נצפה בתחילה בירידה הסיכון לתחלואה, ורק לאחר מכן בעליה, כלומר הקשר לא מונוטוני אלא בצורת האות האנגלית J. היל לא התייחס לאפשרות הזו או לאפשרויות אחרות.

הקריטריון השישי הוא עיקרון הסבירות (Plausibility). למעשה הכוונה היא שניתן להצביע על מנגנון (ביולוגי) שבאמצעותו נותר הקשר בין הגורם ובין התוצאה. זהו למעשה אחד הקריטריונים של אריסטו. שוב, הקריטריון הזה לא הכרחי[9]. ייתכן שהמנגנון קיים אבל אנחנו עדיין לא יודעים מהו. אבל אם אנחנו כן יכולים להצביע על מנגנון אפשרי, זה מחזק את רמת הביטחון שלנו בקיומו של הקשר הסיבתי.

הקריטריון השביעי הוא עיקרון הקוהרנטיות. פרשנות של תצפית חדשה כגורם ותוצאה לא אמורה לסתור את הידע הקודם. כך למשל, אילו היו בידינו בסוף שנות ה-40 של המאה הקודמת ותחילת שנות ה-50 נתונים על פיהם עישון אינו גורם לתחלואה בסרטן, היה עלינו לספק הסבר טוב לנתונים החדשים המראים את ההיפך. שוב, קיום הקריטריון הזה אינו הכרחי: הרבה פעמים מתגלים דברים חדשים שלאורם מה שידענו קודם מתברר כלא נכון. עיקרון הקוהרנטיות נוסח בצורה יפה על ידי קארל סייגן: טענות יוצאות דופן צריכות להיתמך בעדויות יוצאות דופן. או אם נחזור לניסוח של ברדפורד היל: עדויות חדשות לא אמורות לסתור בצורה חמורה ידע קודם, ואם יש סתירה כזו, יש לבחון היטב מדוע זה קרה.

הקריטריון השמיני הוא עדות ניסויית (experimental evidence). יש מחלוקת גם בדבר הפרשנות לקריטריון הזה. היל התייחס לכך בקצרה. עדויות ניסוייות יכולות בודאי להתקבל מניסויים בחיות בתנאי מעבדה. היל גם התייחס למקרה בו אנשים מפסיקים לעשן. ככל הנראה התכוון כאן למחקר תצפיתי בו יושוו אנשים שהפסיקו לעשן לכאלה שממשיכים לעשן.

הקריטריון התשיעי והאחרון הוא קריטריון האנלוגיה. היל הביא את כדוגמה את מחלת האדמת והתרופה תאלידומיד, שלשתיהן יש השפעה חמורה על עוברים. לכן, אם מתגלה עוד תופעה דומה של מומים בלידה, כדאי לחפש מחלה או טיפול העלולים לגרום לכך. דוגמה אחרת היא עישון פאסיבי. כאן יש אנלוגיה בין תחלואה בסרטן עקב עישון ותחלואה בסרטן עקב הימצאות בסביבה בה אנשים אחרים מעשנים.

המשמעות של הקריטריונים

אין להבין כי אם כל הקריטריונים “מתקיימים” באופן כלשהו אז יש קשר סיבתי. הקריטריון ההכרחי היחידי הוא קריטריון הטמפורליות: הגורם הסיבתי חייב להתרחש לפני התוצאה. היל עצמו הבהיר כי ייתכנו מצבים בהם יש קשר סיבתי ולמרות זאת הקריטריונים אינם מתקיימים או מתקיימים באופן “חלש”. גם ההיפך נכון. ייתכנו מצבים בהם נראה כי הקריטריונים מתקיימים למרות שאין קשר סיבתי. הדברים האלה מתקשרים ישירות אל דייויד יום שטען כי אין אפשרות להוכיח קיום של קשר סיבתי.

הרלוונטיות העכשוית של הקריטריונים

ברור למדי כי הקריטריונים כפי שנוסחו לפני יותר מ-50 שנה אינם ניתנים כיום ליישום כפי שהם. זה נכון בעיקר לגבי העיקרון השישי הוא עיקרון הסגוליות והעיקרון התשיעי הוא עקרון האנלוגיה, שתמיד נחשבו ל-“חלשים”.
הקשר בין הגורם והתוצאה אינו עוד קופסא שחורה כפי שהיה בימיו של היל. אנו יודעים כיום כי כמעט תמיד יש תהליכים מסובכים מתחת לפני השטח, כך שלמשל הטענה “עישון גורם סרטן” שוב אינה מדוייקת, ולמעשה אף פעם לא הייתה נכונה במובן דטרמיניסטי אלא רק במובן הסתברותי. (הבהרה: אין להסיק מדברי כי עישון אינו גורם לסרטן). אל העישון מצטרפים גורמים נוספים שאינם גלויים לעין, וצירוף ההשפעות של כל הגורמים האלה, שחלקם עדיין לא מוכרים לנו הוא שוביל לבסוף לתוצאה של סרטן[10]. מכאן עולה החשיבות הרבה של עיקרון הסבירות, והיותו רלוונטי גם במאה ה-21.

נהוג כיום לחלק את העדויות לקשר סיבתי לשלוש קבוצות:

הקבוצה הראשונה כוללת עדויות ישירות לכך שקשר הסתברותי/סטטיסטי בין הגורם לתוצאה אינו “קשר אקראי”, כלומר אינו “spurious correlation”. עדויות אלה קשורות לעצמת הקשר הסטטיסטי, וליכולת לבצע ניסויים שיתמכו בהשערת הסיבתיות[11]. גם קריטריון של הגרדיאנט הביולוגי שייך לקבוצה זו.

הקבוצה השלישית כוללת עדויות מקבילות התומכות בהשערת הסיבתיות המתקבלות ממחקרים הדומים או קשורים לנושא הנדון ומראות תוצאות דומות. לקטגוריה זו נכנסים הקריטריונים של העקביות, הקוהרנטיות והאנלוגיה.

כפי שאנו רואים, חלק מהקריטריונים של היל משתבצים לתוך שלוש הקבוצות, אך לא כולם. לדעתי לא ניתן גם כיום לוותר על רוב הקריטריונים של היל. אין ספק שלעדויות הישירות יש תפקיד מכריע ולא ניתן לוותר עליהן. באשר לעדויות התהליכיות: אין לזלזל בחשיבותן, אבל עדיין ניתן לבסס קשר סיבתי ללא הבנת התהליכים המקשרים בין הגורם לתוצאה, למשל על ידי ביצוע ניסוי קליני מבוקר בהקצאה רנדומלית. חוסר בעדויות תהליכיות אינו מספיק כדי לשלול את קיומו של קשר סיבתי.

באשר לעדויות המקבילות – עקרון העקביות הוא אחד העקרונות החשובים ביותר, בייחוד לאור משבר השחזוריות מולו ניצב כיום המחקר המדעי, ובודאי שלא ניתן לוותר עליו.

הפוסטים הקודמים בסדרה


הערות
  1. אדון בנושא זה בהרחבה בהמשך הסדרה []
  2. כנהוג בחברות המדעיות בבריטניה []
  3. אתם בודאי שמעתם על מקדם המתאם של פירסון, אולם יש עוד מדדים רבים המאפשרים לבטא ולמדוד קשר סטטיסטי []
  4. רעיון זה מבוטא מתמטית על ידי אי-שיוויון קורנפילד []
  5. אולם, האם תיתכן סיבתיות כאשר אין קשר סטטיסטי בכלל, כלומר האם יש “סיבתיות ללא מתאם”? גם בשאלה זו אדון בהמשך הסדרה []
  6. למשל, קיום אפשרי של גורם נוסף שלא נלקח בחשבון []
  7. שאמנם נפטר כשלוש שנים לפני שהיל הציג את הקריטריונים שלו []
  8. סליחה []
  9. אם כי יהודה פרל טוען כי זה הדבר היחידי ההכרחי, וגם המספיק, כדי להוכיח סיבתיות []
  10. עוד הבהרה: אין לפרש את דבריי כטענה שהתהליך הגורם לתחלואה בסרטן הוא תהליך דטרמיניסטי []
  11. נושא שאדון בו בהמשך בהקשר לתיאוריה של דונלד רובין), וכמובן הקריטריון הטמפורלי.

    הקבוצה השניה כוללת עדויות תהליכיות (מכניסטיות) אשר שופכות אור על התהליך שמקשר בין הגורם או הגורמים המובילים לתוצאה (( נושא שאדון בו בהמשך בהקשר לתיאוריה של יהודה פרל []

100 שנה להולדתו של ג’ורג’ בוקס

החודש, בתאריך 18 באוקטובר, מלאו 100 שנה להולדתו של הסטטיסטיקאי הבריטי אמריקני ג’ורג’ בוקס.

בוקס נולד ב-18 באוקטובר 1919 בעיירה גרייבסנד שבמחוז קנט באנגליה. הוא החל בלימודי כימיה באוניברסיטה, אך עם פרוץ מלחמת העולם השנייה נקרא לשירות לפני שסיים את לימודיו. במסגרת שירותו היה עליו לבצע ניסויים כדי לבדוק השפעות אפשריות של גז החרדל, וטיפולים אפשריים לפגיעות מגז זה. מכיוון שבצוות בו עבד לא היה סטטיסטיקאי, הוא נעזר במספר ספרי סטטיסטיקה כדי ללמוד בעצמו את התחום של תכנון ניסויים, וכך החלה התעניינותו בסטטיסטיקה. כאשר המלחמה הסתיימה, בוקס החל ללמוד ביוניברסיטי קולג’ בלונדון, שם קיבל תואר ראשון במתמטיקה וסטטיסטיקה. לאחר מכן למד באוניברסיטת לונדון, וב-1953 קיבל תואר דוקטור לסטטיסטיקה. מדריך עבודת הדוקטורט שלו היה אגון פירסון.

בשנים 1948 עד 1956, במקביל ללימודיו בוקס עבד בחברת ICI, שהייתה בשעתה חברת הכימיה הגדולה ביותר בבריטניה. לאחר מכן עבר לאוניברסיטת פרינסטון, שם ניהל את קבוצת המחקר בסטטיסטיקה. ב-1960 עבר לאוניברסיטת ויסקונסין במדיסון, שם הקים את המחלקה לסטטיסטיקה של האוניברסיטה. הוא פרש לגימלאות בשנת 1992, בגיל 75. בוקס נפטר בשנת 2013, בגיל 93.

עבודתו המדעית של בוקס התמקמה בארבעה תחומים עיקריים: בקרת איכות, ניתוח סדרות עיתיות, תכנון ניסויים וסטטיסטיקה בייסיאנית. תרומותיו הידועות ביותר הן: מתודולוגיות לתכנון ניסויים ובכללן מתודולוגיית משטחי תגובה, שיטת בוקס-ג’נקינס לניתוח סדרות עיתיות, וטרנספורמציית בוקס-קוקס, שהיא עבודה משותפת עם סיר דויד קוקס. מסופר כי הטרנספורמציה פותחה לאחר שבוקס וקוקס חשבו כי יהיה משעשע לפתח ביחד שיטה סטטיסטית שתיקרא על שם שניהם. המאמר המשותף שפירסמו בוקס וקוקס בשנת 1964 צוטט כ-16 אלף פעמים.

בוקס פירסם מאות מאמרים מדעיים, וכתב שבעה ספרי לימוד בתחומים בהם עסק. ספרו המשפיע ביותר הוא ככל הנראה “Statistics for Experimenters” שנכתב בשיתוף פעולה עם ויליאם האנטר. בספר זה הופיעה האמירה המפורסמת המיוחסת לבוקס, לפיה כל המודלים שגויים, אם כי חלקם שימושיים.

כאן אספר אנקדוטה אישית: בישיבה שנערכה באחד ממקומות העבודה שבהם עבדתי הזכרתי את האמירה הפילוסופית הזו של בוקס. בסיכום הישיבה נכתב כי “הסטטיסטיקאי אמר כי המודל לא נכון”. האם זו אנקדוטה משעשעת? לא מבחינתי, בכל אופן.

לקראת סוף חייו כתב בוקס ספר אוטוביוגרפי המתאר את מהלך הקריירה המדעית שלו ואת חייו האישיים, החל מהרגע בו נדרש ללמוד סטטיסטיקה בכוחות עצמו כדי לתכנן ניסויים במעבדה לכימיה. כותרת הספר הולמת את ראשית דרכו המקצועית: “An accidental Statistician” .

בוקס נבחר לחבר באקדמיה האמריקנית לאמנויות ומדע בשנת 1974, ולעמית בחברה המלכותית בשנת 1985.
ב-1968, בוקס זכה במדליה על שם וולטר שוהרט ב-המוענקת על ידי האיגוד האמריקני לבקרת איכות. ב-1972 זכה בפרס על שם סם וילקס. ב-1974 הוזמן לשאת את ההרצאה השנתית לזכרו של רונלד פישר. ב-1993 זכה במדליית הזהב על שם גאי המוענקת על ידי החברה המלכותית לסטטיסטיקה. ב-2003 ייסד האיגוד האירופי לסטטיסטיקה בתעשייה ועסקים (ENBIS) פרס על שמו, והוא היה הזוכה הראשון בפרס.
בוקס היה נשיא האיגוד האמריקני לסטטיסטיקה בשנת 1978, ונשיא המכון לסטטיסטיקה מתמטית בשנת 1979.

לקריאה נוספת

George Edward Pelham Box Biography, University of St Andrews, Scotland
A Conversation with George Box. DeGroot, Statistical Science 1987
George Box: An interview with the International Journal of. Forecasting. Pena, International Journal of Forecasting 2001
George Box, (1919-2013): a wit, a kind man and a statistician. Champkin, Significance Magazine 2013

100 שנה להולדתו של ויליאם קראסקל

החודש, בתאריך 10.10.2019, מלאו 100 שנה להולדתו של הסטטיסטיקאי ויליאם קראסקל.

ויליאם קראסקל 1919-2005

ויליאם קראסקל נולד ב-1919 למשפחה יהודית בניו-ראשל, פרבר של העיר ניו-יורק.

הוא למד באוניברסיטת הארווארד, שם קיבל תואר ראשון במתמטיקה בשנת 1940, ותואר שני ב-1941. זמן קצר לאחר שסיים את לימודיו הצטרפה ארצות הברית למלחמת העולם השניה, וקראסקל גוייס לחיל הים ושירת בבסיס דאלגרן בוירג’יניה, שם עסק בחישובים בליסטיים שונים. שם התוודע לתחום הסטטיסטיקה, כאשר פגש סטטיסטיקאים ששירתו בבסיס וגם בסטטיסטיקאים שהגיעו לשם מדי פעם. הוא המשיך לשרת בצי גם לאחר שהמלחמה נסתיימה.

לאחר שסיים את שירותו בצי חזר לניו יורק ועבד בעסק המשפחתי. במקביל החל בלימודים חלקיים באוניברסיטת קולומביה. הוא נזקק לאישור מיוחד כדי להתקבל, כיוון שלא עמד בדרישות הסף, והתקבל ללימודים לאחר שרואיין על ידי אברהם ואלד, שהיה אז ראש המחלקה לסטטיסטיקה.

ב-1950 החליט להפוך לסטטיסטיקאי מקצועי. קראסקל עבר לאוניברסיטת שיקגו שם קיבל משרת מרצה זוטר, עם הבטחה מאת אלן ואליס, שהיה אז ראש המחלקה לסטטיסטיקה, להתמנות לפרופסור כאשר יקבל את תואר הדוקטור. קראסקל ביצע מחקר משותף עם אלן ואליס, וכן עם הנרי שפה, שבינתיים עבר לאוניברסיטת ברקלי.  קיבל את תואר הדוקטור מאוניברסיטת קולומביה ב-1955. מדריכי עבודת הדוקטורט שלו היו הנרי שפה והווארד לוין. עבודת הדוקטורט שלו כללה את המבחן הקרוי כיום מבחן קראסקל-ואליס. הוא נשאר באוניברסיטת שיקגו עד לפרישתו לגמלאות ב-1990.

קראסקל נודע בעיקר בזכות עבודותיו בתחומים של סטטיסטיקה אי פרמטרית, ניתוח משתנים איכותיים, ושיטות סטטיסטיות עמידות (רובסטיות). מבחן קראסקל-ואליס הוא דוגמה לשלושה תחומים אלה. שיתוף פעולה עם ליאו גודמן הוליד ארבעה מאמרים קלאסיים שעסקו במדדי קשר למשתנים איכותיים, שקובצו לאחר מכן בספר אחד. קראסקל עסק גם במחקרים בתחום ההיסטוריה של הסטטיסטיקה. הוא פירסם בסך הכל 109 מאמרים מדעיים וספרים

ב-1970 קראסקל מונה על ידי הנשיא ניקסון לחבר בועדה הלאומית לסטטיסטיקה. כעבור שנה מונה ליו”ר מועת המחקר לסטטיסטיקה לאומית, תפקיד בו שירת עד 1978.

קראסקל היה חבר כבוד באיגוד האמריקני לסטטיסטיקה, במכון לסטטיסטיקה מתמטית, באיגוד האמריקני לקידום המדע ובאקדמיה האמריקנית למדעים ואמנויות. הוא כיהן כנשיא המכון לסטטיסטיקה מתמטית ב-1971, וכנשיא האיגוד האמריקני לסטטיסטיקה בשנת 1982. ב-1970 זכה בפרס על שם סם וילקס.

 

לקריאה נוספת

.

10 שנים למותו של אריק להמן

היום, 12 בספטמבר 2019, מלאו 10 שנים למותו של הסטטיסטיקאי אריק לאו להמן. כאשר מלאו שלושים לפטירתו כתבתי כאן פוסט אישי אודותיו. כעת ברצוני לכתוב גם על חייו ופועלו.

אריק לאו להמן (1917-2009)להמן נולד ב-1917 בעיר שטרסבורג בחבל אלזס לוריין, וגדל בפרנקפורט שבגרמניה. ב-1933, כאשר היטלר מונה לקאנצלר גרמניה, נמלטה משפחתו לשוויץ. לאחר שסיים את לימודיו בתיכון למד מתמטיקה במשך שנתיים בקולג’ טריניטי שבאוניברסיטת קיימברידג’. ב-1940 היגר לארצות הברית, וב-1941 התקבל ללימודי דוקטורט באוניברסיטת ברקלי בקליפורניה, למרות שפורמלית לא החזיק באף תואר אקדמי. הוא קיבל תואר שני במתמטיקה בשנת 1942, ותואר הדוקטור הוענק לו ב-1946. מדריך עבודת הדוקטורט שלו, שעסקה במבחנים אופטימליים על ערכו של מקדם המתאם, היה ג’רזי ניימן. במהלך מלחמת העולם השניה עסק בחקר ביצועים בבסיס חיל האוויר האמריקני בגואם.

לאחר שסיים את לימודי הדוקטורט המשיך להמן בתפקידו כמרצה לסטטיסטיקה באוניברסיטת ברקלי. בשנים 1950-1951 היה מרצה באוניברסיטאות קולומביה ופריסטון, וב-1952 היה פרופסור חבר באוניברסיטת סטנפורד. לאחר מכן חזר לאוניברסיטת ברקלי, שם כיהן כפרופסור למתמטיקה ולסטטיסטיקה עד לפרישתו ב-1988, אך המשיך בעבודתו המדעית גם לאחר מכן. בין השנים 1950 עד 1984 להמן היה מדריך עבודה הדוקטורט של 46 סטודנטים. ב-1977 נישא להמן לסטטיסטיקאית ג’ולי שייפר. הוא נפטר בשיבה טובה ב-12 בספטמבר 2009.

להמן תרם תרומות משמעותיות לתורת האמידה ולתיאוריה של בדיקת השערות אי פרמטרית. הוא נודע גם בזכות משפט להמן-שפה ואמד הודג’ס-להמן לחציון של אוכלוסייה. כמו כן עסק במחקר אודות ההיסטוריה והפילוסופיה של הסטטיסטיקה. בין שותפיו למחקר נמנו הנרי שפה, צ’ארלס סטיין, גו’זף הודג’ס, אוולין פיקס, פרסי דיאקוניס, וויליאם קראסקל, ג’ולייט פופר שייפר, ג’ודית טאנור, וחתן פרס נובל לכלכלה קנת’ ארו. בסך הכל פירסם להמן 123 מאמרים מדעיים.

בנוסף לכך, להמן ידוע גם בזכות הספרים שכתב. הוא כתב שבעה ספרי לימוד שעסקו בעיקר בנושאים מתקדמים בסטטיסטיקה. הספר “מושגים בסיסיים בהסתברות וסטטיסטיקה” שכתב יחד עם ג’וזף הודג’ס, תורגם לחמש שפות, כולל תרגום לעברית. בסך הכל תורגמו ספריו לתשע שפות שונות.

ב-2007 פרסם להמן ספר אוטוביוגרפי בו תיאר את זכרונותיו מעבודות משותפות, קשרי ידידות ומפגשים עם סטטיסטיקאים, כולל פגישה קצרה ולא נעימה עם רונלד פישר. ב-2011  פרסם ספר שעסק בעבודות המוקדמות של פישר וניימן, בו הבהיר את חילוקי הדיעות העקרוניים שהיו בין השניים לגבי הכיוון אליו צריך מדע הסטטיסטיקה להתפתח.

להמן נבחר לחבר כבוד של האיגוד האמריקני לסטטיסטיקה, המכון לסטטיסטיקה מתמטית, והחברה המלכותית לסטטיסטיקה. כן נבחר להיות חבר במכון הבינלאומי לסטטיסטיקה, באקדמיה האמריקנית לאמנויות ומדעים, ובאקדמיה הלאומית למדעים של ארצות הברית. להמן כיהן כנשיא המכון לסטטיסטיקה מתמטית בשנים 1960-1961 . הוא זכה במספר מענקי מחקר יוקרתיים, כולל מענק מקרן גוגנהיים, והוזמן לשאת את ההרצאות על שם רונלד פישר, סם וילקס ואברהם ולד. הוענקו לו שני תוארי דוקטור לשם כבוד מטעם אוניברסיטת ליידן ואוניברסיטת שיקגו. לכבוד יום הולדתו ה-80 ב-1997, אוניברסיטת ברקלי הקימה קרן מילגות על שמו. בשנת 2000 היה לזוכה הראשון בפרס על שם גוטפריד נתר.

לקריאה נוספת

 

110 שנים להולדתו של ויליאם קוקריין

היום, 15.7.2019, מציינים את יום הולדתו ה-110 של הסטטיסטיקאי ויליאם ג. קוקריין.

קוקריין נולד למשפחה מהמעמד הבינוני הנמוך בעיירה ראתרגלן בסקוטלנד. בבית הספר הצטיין בלימודים, וכך זכה במילגות ללימודים  באוניברסיטת גלזגו, תחילה לתואר ראשון, ולאחר מכן למד לתואר שני במתמטיקה בהדרכת ג’ון וישארט.

למרות שלא השיג תואר דוקטור, התקבל לעבודה בתחנת המחקר החקלאי ברותהאמסטד, בהמלצתו של פרנק ייטס. במהלך שהותו בתחנת המחקר בין השנים 1934 ל-1939 למד אצל רונלד פישר שנתן הרצאות בסטטיסטיקה לחוקרים, ועסק במחקר יישומי, עם דגש על תכנון ניסויים.

ב-1939 עבר לארצות הברית, שם עסק בהוראה ומחקר במספר אוניברסיטאות: איובה סטייט, פרינסטון, המכון לסטטיסטיקה של צפון קרוליינה ואוניברסיטת ג’ונס הופקינס. ב-1957 עבר לאוניברסיטת הרווארד, שם התבקש להקים מחלקה חדשה לסטטיסטיקה. הוא נשאר שם עד פרישתו לגימלאות בשנת 1976.

במהלך הקריירה שלו שיתף פעולה עם סטטיסטיקאים רבים, וביניהם פרנק ייטס, פרדריק מוסטלר, סם וילקס, וגרטרוד מרי קוקס. קוקריין וקוקס כתבו יחד ספר רב השפעה על תכנון ניסויים. ספר רב השפעה נוסף שכתב קוקריין עוסק בשיטות דגימה. בין היתר, הוא היה מעורב במחקרים אודות ההתנהגות המינית האנושית בצוותא עם אלפרד קינסי, השפעת הקרינה על ניצולי הירושימה, חיפוש החיסון למחלת הפוליו, ניתוחים לטיפול באולקוס. ביחד עם חוקרים נוספים עסק בהשפעת העישון על בריאות הציבור.  מחקרים אלה הובילו להכרה כי עישון הוא גורם סיכון משמעותי למחלת סרטן הריאות. למרות שלא היה דוקטור, הוא היה מדריך הדוקטורט של יותר מ-40 סטטיסטיקאים, הידוע שבהם הוא דון רובין.

קוקריין פיתח מספר שיטות סטטיסטיות הנקראות על שמו. הידועה  שבהן היא מבחן קוקראן-מאנטל-האנזל.

קוקריין זכה להכרה רבה בזכות תרומתו למדע הסטטיסטיקה. הוא נבחר לחבר כבוד באגודה המלכותית לסטטיסטיקה, וב-1967 זכה במדליה על שם וילקס. הוא היה נשיא המכון לסטטיסטיקה מתמטית, נשיא האיגוד האמריקני לסטטיסטיקה ונשיא האגודה הבינלאומית לביומטריקה.

קוקריין נפטר ב-1980, מספר חודשים לפני יום הולדתו ה-70.

 

לקריאה נוספת: