קישורים

ניווט

נושאים

ארכיב עבור תגית האנשים שמאחורי הסטטיסטיקה

יום הולדת 100 לק. ר. ראו

ק. ר. ראו

ק. ר. ראו

היום, 10.9.2020, הסטטיסטיקאי ק. ר. ראו, מחשובי הסטטיסטיקאים של המאה ה-20 חוגג את יום הולדתו ה-100.

בפוסט הזה לא תקראו על הביוגרפיה שלו ,עבודתו המדעית ,והפרסים ואותות הכבוד שקיבל. בשביל זה כתבתי לכם ערך בויקיפדיה אודותיו. כאן אני רוצה לספר סיפורים. למעשה אלה סיפורים שראו עצמו סיפר, בשלושה ראיונות שנערכו איתו שנערכו ב-1985, 2003 ו-2016.

ראו, כמו המון סטטיסטיקאים אחרים, הגיע לסטטיסטיקה במקרה. הוא מספר כי לאחר שסיים את לימודי התואר השני במתמטיקה נסע לכלכותה כדי להתראיין למשרה בצבא הוד מלכותו, כלומר להתגייס. הוא מספר כי הם חיפשו מתמטיקאים לכל מיני תפקידים. הוא לא התקבל לצבא בגלל גילו הצעיר. בכל מקרה, הוא פגש מישהו שסיפר לו על המכון לסטטיסטיקה שנמצא בעיר. הוא הגיע למכון ודיבר עם ראש המכון ומייסדו, פ. צ’. מהלנוביס. מהלנוביס קיבל אותו לעבודה במכון כחוקר, ובמקביל שלח אותו ללמוד לתואר שני בסטטיסטיקה באוניברסיטת כלכותה, שזה עתה פתחה תכנית ללימודי סטטיסטיקה. במכון עסק בניתוח נתונים במחקרים אנתרופולוגיים. כאשר מהלנוביס קיבל פניה לעזרה בניתוח נתונים דומים מהמוזיאון האנתרופולוגי של אוניברסיטת קיימברידג’, ראו נשלח לשם. מדובר היה באוסף גדול של עצמות ושלדים בני כאלף שנה שנחפרו בצפון אפריקה.

ראו עם אחד העכברים של רונלד פישר, 1947

במקביל לעבודתו שם, ראו פנה לרונלד פישר כדי שידריך אותו בעבודת דוקטורט. פישר הסכים, אולם התנה זו בכך שראו יערוך ניסויים במעבדה הגנטית שלו, ללא כל קשר לעבודת הדוקטורט. ראו מספר כי לפישר הייתה מעבדה ובה אלפי עכברים, והוא העסיק שם 10 עובדים, חלקם הגדול סטודנטים, שטיפלו בעכברים וערכו ניסויים בהכלאות בין העכברים. ניסויי העכברים לא נכללו לבסוף בעבודת בדוקטורט שלו, שהתבססה על השיטות שפיתח לניתוח נתוני העצמות במוזיאון. חלק לא מבוטל משיטות אלה היו הכללות של שיטות סטטיסטיות שפישר עצמו פיתח. ראו מספר כי פישר היה מאוד מרוצה מעבודתו. עם זאת, ראו מספר כי הציע גישה בייסיאנית לאחת הבעיות שהתמודד איתן. פישר שהיה אנטי-בייסיאני, ביקש מראו לנסות גישה אחרת, אבל ראו מספר בחיוך כי הוא התעלם מהבקשה. (( כאן יש לציין כי הפעם הראשונה בה הוזכרה המילה “Bayesian” בספרות הסטטיסטית הייתה במאמר של פישר, בו הבהיר כי המתודולוגיה שבה עסק המאמר אינה בייסיאנית. ))

ראו מספר גם על החיים בקיימברידג’, ובעיקר בקינג’ס קולג’. הוא מספר כי באותה עת דווקא היו הרבה סטודנטים ממוצא הודי בקיימברידג’. באופן רשמי ראו למד בקינג’ס קולג’, אבל למעשה בילה את כל זמנו במוזיאון (חוץ מהזמן שבילה במעבדה של פישר, כמובן). הוא מספר כי רק לעמיתי המכללה (( חברי הסגל האקדמי))  מותר לדרוך על המדשאות שם, כלל שקיים עד עצם היום הזה. בסופו שלדבר ראו מונה לעמית במכללה לכל ימי חייו בשנת 1974, וכעת הוא יכול לדרוך שם על הדשא, לאכול משולחן הקולג’ ולשתות יין ככל שיחפוץ.

ראו ובלקוול, 1977

ראו ובלקוול, 1977

שמו של ראו קשור בשתי תוצאות חשובות בחום תורת האמידה: משפט ראו-בלקוול וחסם קרמר-ראו. ראו מספר כי כאשר חזר להודו ולימד באוניברסיטת כלכותה, הוכיח בכיתה משפט של פישר שהתייחס למדגמים גדולים, למעשה אינסופיים (( בשפת המתמטיקה מדובר בתוצאה אסימפטוטית )) . אחד הסטודנטים שאל אותו מדוע הוא לא מוכיח את התוצאה למדגמים סופיים. ראו מספר כי באותו לילה חשב על השאלה של התלמיד ומצא את ההוכחה עבור מדגם סופי. זה היה חסם קרמר-ראו. כאשר הוכיח את התוצאה בכיתה שבוע לאחר מכן, עלה בדעתו דבר נוסף. הדבר הנוסף הזה הוא משפט ראו-בלקוול. ראו פרסם את שתי התוצאות במאמר שהופיע בשנת 1945. קרמר פירסם את החסם שגילה באופן עצמאי בשנת 1946. בלקוול, שגילה את מה שנקרא כיום משפט ראו-בלקוול בכוחות עצמו, פרסם את התוצאה שלו ב-1947.

משפט ידוע נוסף הוא משפט פישר-ראו. כאן ראו מספר כי פישר כתב מאמר מאוד טכני וביקש ממנו לבדוק את החישובים, ואז הוא שיפר את התוצאות של פישר.

מעניין לציין כי כאשר ראו נשאל מהם לדעתו הישגיו החשובים ביותר, הוא לא מציין את שלושת המשפטים שעמם הוא מזוהה יותר מכל, אלא את עבודותיו בתחומים של מערכים אורתוגונליים ואנטרופיה ריבועית (( לא להיבהל, גם אני לא מבין בזה כלום )), וכן את ה-score test שפיתח.

באופן לא מפתיע ראו מספר כי שני האנשים שלהם הייתה ההשפעה הגדולה ביותר עליו הם מהלנוביס ופישר. את מהלנוביס הוא מתאר כאדם קשה, ולדבריו כל אנשי המכון חששו ממנו. איש לא קרא לו בשמו, גם שלא בנוכחותו. מהלנוביס היה “הפרופסור”. כינוי זה נשמר לו גם אחרי מותו. ראו מונה כמנהל המכון, אך לא החליף את מהלנוביס כפרופסור. גם בראיונות שנתן הוא מתייחס אל מהלנוביס כאל הפרופסור.

ראו ופישר, 1960

ראו ופישר, 1960

גם לפישר היה מוניטין של אדם קשה, ולפי מספר סיפורים די בצדק. מעניין לראות כי לראו היו יחסים מאוד טובים עם פישר. הוא משבח את פישר גם כמרצה וגם כמנטור, שהתייחס בכבוד לסטודנטים שלו . הוא מספר כי פישר תמיד דרש ממנו לא להסתפק בפיתוחים מתמטיים אלא גם ליישם אותם על נתונים. לכן, סיפר ראו, שיטת העבודה שלו הייתה לאסוף קודם כל נתונים ולפתח מתודולוגיה לבעיה שמציגים הנתונים. במובן הזה, ראו היה data scientist כבר בשנות הארבעים של המאה ה-20. (( את המונח data science טבע הסטטיסטיקאי ג’ון טוקי במאמר The Future of Data Analysis  שיצא לאור ב-1962 )) בראיון שנתן ב-2016 ראו מסביר כי זו למעשה הדרך שבה ה-data science פועל, וכאן אצטט את דבריו:

“Data science … is a scientific discipline because it uses an experiment-oriented scientific approach. Based on empirical evidence, a hypothesis is formulated, and evidence is gathered to perform the hypothesis testing”

ראו, מהלנוביס ואנדריי קולמוגורוב, 1962

ראו, מהלנוביס ואנדריי קולמוגורוב, 1962

ראו סיפר בהרחבה גם על קשרי העבודה שלו עם מתמטיקאים וסטטיסטיקאים מברית המועצות החל משנות ה-60 ועד אמצע שנות ה-80, בשיא המלחמה הקרה, שנמשכו גם כאשר עבר לאוניברסיטת פיטסבורג ב-1979. הוא מציין כי קיבל תמלוגים על ספריו שתורגמו לרוסית, אך הכסף כמובן רובלים שהופקדו בבנק בברית המועצות. כאשר ביקר שם, נהג להשתמש בכסף הזה כדי להזמין את כל חבריו שם למסיבות שערך.

מה מאחלים לאדם בן 100? עד 120? נאחל לו יום הולדת שמח.

מקורות

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

ממתאם לסיבתיות – הקשר בין עישון ותחלואה בסרטן הריאה

עדויות בדבר הקשר בין עישון ותחלואה בסרטן הריאה החלו להופיע כבר בתחילת המאה העשרים, ומספר רב של מחקרים שנערכו בשנות הארבעים והחמישים של המאה העשרים סיפקו עדויות נוספות לקשר הזה. בפוסט זה אני סוקר את העדויות המחקריות שהראו את הקשר בין עישון סיגריות ותחלואה בסרטן, ואת השיקולים שהובילו לביסוס הקשר הסיבתי לפיו עישון הוא גורם הסיכון העיקרי לתחלואה בסרטן הריאה, וגיבוש הקונצנזוס המדעי התומך בטענה זו.

עדויות בדבר הקשר בין עישון ותחלואה בסרטן הריאה

בסוף המאה ה-19 התחלואה בסרטן הריאה הייתה נדירה. בבית החולים של אוניברסיטת דרזדן, מקרי סרטן הריאה היוו כאחוז אחד מבין כל הסרטנים שזוהו בניתוחים שלאחר המוות. שיעור זה עלה  ל-10% בשנת 1918, ול-14% ב-1927.

הועלו מספר השערות לגורמים סביבתיים אשר עשויים להסביר את הזינוק בתחלואה: עליה בזיהום תעשייתי, התרחבות השימוש באספלט לסלילת כבישם, זיהום אויר ממכוניות שמספרן עלה בהדרגה, חשיפה לגז במלחמת העולם הראשונה, ואפילו מגיפת השפעת של 1918. עם זאת, עליה בתחלואה נצפתה גם כאשר לא הייתה חשיפה לגורמים אלה.

הראשון שהצביע על הקשר בין העלייה בתחלואה בסרטן והריאה ובין העלייה בפופולריות של עישון סיגריות היה ככל הנראה המדען הגרמני פריץ ליקינט, שהראה ב-1929 כי שיעור המעשנים בקרב חולים בסרטן הריאה גבוה משיעורם באוכלוסייה הכללית. ממצאיו של ליקינט שוחזרו בשני מחקרים שפורסמו בגרמניה ב-1940 ו-1943. במחקרים אלה נצפה כי מספר המעשנים בקבוצה של חולי סרטן הריאה היה גבוה בערך פי 30 ממספר המעשנים בקבוצת ביקורת שהורכבה מאנשים בעלי רקע דומה, אך אינם חולים בסרטן הריאה. חמישה מחקרים שונים שנערכו בבריטניה ובארצות הברית בשנת 1950 הגיעו למסקנות דומות. מחקרים מסוג זה הינם מחקרים רטרוספקטיביים; נבחרו בהם שתי קבוצות: קבוצה אחת של חולים בסרטן הריאה וקבוצת ביקורת של אנשים, חולים או בריאים, מרקע דומה ((מבחינת גיל, מין וכדומה)) שאינם חולים ברטן הריאה. המסקנה שעלתה ממחקרים אלה היא שהסיכוי כי אדם שחולה בסרטן הריאות הינו מעשן גבוה מהסיכוי שאדם שאינו חולה בסרטן הריאה הינו מעשן. מחקרים אלה לא עונים על השאלה מהו הסיכון של אדם מעשן לחלות בסרטן היראות לעומת אדם שאינו מעשן. נגיע לסוגיה זו בהמשך.

עדויות נוספות לקשר בין טבק וסיגריות לבין תחלואה בסרטן הגיעו מניסויים בבעלי  חיים. ניסויים שערך החוקר הגרמני ברוש בשנת 1900 העלה כי חשיפה לתמצית המופקת מעלי טבק העלתה את התחלואה בסרטן אצל עכברים בהשוואה לקבוצת הביקורת. תוצאות אלה אושרו במספר רב של מחקרים שנערכו בשנות ה-30 ובתחילת שנות ה-40, שכללו מינם שונים של בעלי חים וסוגי חשיפה שונים, כולל חשיפה לעשן סיגריות. רוב המחקרים בנושא בוצעו על ידי החוקר הארגנטינאי/גרמני אנגל רופו. ב-1953, ניסוי בו “נמרח” משקע (tar) הנוצר על ידי עישון סיגריות על עורם של עכברים זכה לתהודה רבה. הניסוי הראה כי העכברים ש-“זכו לטיפול” זה פיתחו מספר גדול באופן משמעותי של גידולים סרטניים בהשוואה לקבוצת הביקורת. המגזין Time הכריז כי ניסוי זה הוכיח את הקשר בין עישון ותחלואה בסרטן מעבר לכל ספק.

סוג שלישי של עדויות לקשר בין עישון בתחלואה בסרטן הריאה היו עדויות פתולוגיות. בניתוחים שלאחר המוות אצל מעשנים, לאו דווקא כאלה שחלו בסרטן הריאה, נצפו הבדלים פתולוגיים בתאי הריאה בין מעשנים ובין לא מעשנים. המחקר הראשון שהצביע על הבדלים כאלה התפרסם בשנת 1932.

כמו כן, מחקרים הראו כי מספר כימיקלים הנמצאים במשקעים הנוצרים על ידי העישון (tar) ובעשן הסיגריות הינם קרצינוגניים, כלומר חשיפה אליהם גורמת לסרטן. שוב, תגליות רבות אודות קיומם של חומרים כאלה בעשן ובמשקע נעשו על ידי אנגל רופו, שפרסם את המממצא הראשון שלו ב-1939. מחקרים שנעשו בסוף שנות ה-40 ותחילת שנות ה-50 חשפו כימיקלים קרצינוגניים נוספים הקשורים בסיגריות.

עם זאת, עדיין לא הייתה תשובה לשאלה החשובה מכולן: האם הסיכון של אדם מעשן לחלות בסרטן הריאה גבוה מהסיכון של אדם שלא מעשן, ואם כן, עד כמה ההבדל בין הסיכונים משמעותי?

כדי לענות על שאלה זו, יש צורך במחקר פרוספקטיבי. במחקר כזה מתחילים לעקוב אחרי שתי קבוצות של אנשים: מעשנים ולא מעשנים, ועוקבים אחריהם לאורך זמן. שני מחקרים גדולים מסוג זה נערכו בשנות ה-50.

המחקר הראשון נערך בארצות הברית בין 1952 ל-1955, ותוצאותיו פורסמו בתחילת 1958. הוא כלל כ-187 אלף נבדקים, גברים בגילאים 50 עד 70. תקופת המעקב הראשונית הייתה קצרה יחסית, 44 חודשים, אולם המדגם  הגדול איפשר זיהוי הבדלים בין קבוצת המעשנים וקבוצת הלא מעשנים, אם יש כאלה במסגרת הזמן הזה. המחקר, שהובילו החוקרים האמונד והורן, העלה כי שיעור התמותה הכולל (מכל סיבה שהיא) בקרב המעשנים היה גבוה ב-57% משיעור התמותה בקרב לא מעשנים. גם שיעור התמותה במחלות לב היה גבוה ב-50%. שיעור התמותה מסרטן בקרב המעשנים היה גבוה כמעט פי 2 בהשוואה לאותו נתון בקרב הלא מעשנים. כאשר מדובר במוות עקב מחלה ריאתית כלשהי (לא כולל סרטן), שיעור התמותה בקרב מעשנים היה גבוה פי 2.85 בהשוואה ללא מעשנים. במחלות אחרות לא נצפו הבדלים משמעותיים. תקנון על פי גיל לא הביא לשינוי משמעותי בתוצאות. עם זאת, עלה כי בקרב מעשני סיגרים או מקטרת, וכן בקרב מעשנים מזדמנים, ההבדלים בשיעורי התחלואה והתמותה היו נמוכים יותר בינם ובין הלא מעשנים. המחקר הראה גם כי שיעורי התחלואה והתמותה עולים עם כמות העישון היומי – יותר סיגריות ביום = סיכון גבוה יותר. שיעור מקרי המוות בין אלה המעשנים חבילת סיגריות או יותר ביום כמעט כפול משיעור המקרים בקרב אלה המעשנים פחות מחבילה ביום.

מחקר נוסף נערך בבריטניה על ידי ריצ’רד דול ואוסטין ברדפורד היל. זה היה מחקר בהיקף קטן יותר, כ-40 אלף איש, כולם רופאים. עם זאת, תקופת המעקב הייתה ארוכה יותר. תוצאות ראשוניות שפורסמו ב-1956, העלו ממצאים דומים לאלה שנצפו במחקר של האמונד והורן. המעקב אחרי הרופאים נמשך עד שנת 2001. נמצא כי עישון מקצר את תוחלת החיים בכ-10 שנים. יותר מ-50% מהמעשנים מתו מסרטן או ממחלות לב. גם מחקר זה הראה כי הסיכון עולה עם כמות הסיגריות שהחולה מעשן.

ממתאם לסיבתיות – האם עישון הוא גורם סיכון לתחלואה בסרטן הריאה?

ג'רום קורנפילד

ג’רום קורנפילד

כל המחקרים שתוארו עד כה אינם מוכיחים סיבתיות, לפחות ברובם. אמנם הניסויים בבעלי חיים היו ברובם ניסויים מבוקרים, בהקצאה פחות או יותר רנדומלית, אולם האם ניתן לגזור מהם מסקנות לגבי בני אדם? גם המחקרים הפרוספקטיביים שצפו בבני אדם לאורך זמן, היו, ובכן, ניסויים תצפיתיים. לא הייתה הקצאה רנדומלית לקבוצת מעשנים וקבוצת לא מעשנים: זה בלתי אפשרי לא מבחינה אתית ולא מבחינה מעשית. שתי הקבוצות היו שונות זו מזו באופן מהותי: אלה בחרו לעשן ואלה לא, ולא ניתן לשלול את האפשרות שיש ביניהן הבדלים מהותיים נוספים.

את המשימה לענות לכל דברי הביקורת שנמתחו על רוב המחקרים לקחו על עצמם ג’רום קורנפילד מהמחלקה לביוסטטיסטיקה באוניברסיטת ג’ונס הופקינס ועמיתיו. במאמר שפורסם ב-1959, הביאו קורנפילד ועמיתיו סקירה של כל העדויות בדבר הקשר בין עישון ותחלואה בסרטן וענו לכל הביקורת שנמתחו על המחקרים השונים. הביקורות סווגו לחמישה נושאים מרכזיים: ארבעה מהם עוסקים בנתונים ולאוכלוסיות במחקרים השונים, בתקפות של המחקרים הרטרוספקטיביים והפרוספקטיביים, בתקפות של הממצאים הפתולוגיים ובתקפות של תוצאות ניסויי המעבדה. אני לא אסקור כאן את כל הנושאים האלה. אני בהחלט ממליץ לכל מי שמתעניין בסטטיסטיקה ובאפידמיולוגיה לקרוא את המאמר.

אסקור כאן רק את התגובה של קורנפילד ועמיתיו לביקורת העוסקות בפרשנות לתוצאות שהתקבלו. (מעתה אתייחס רק לקורנפילד כאל מייצג הכותבים).

קורנפילד מסביר כי ישנן שלוש פרשנויות אפשריות לנתונים. האפשרות הראשונה היא כי עישון גורם לסרטן. האפשרות השניה היא כי סרטן גורם לעישון, דבר שניתן להצדיק על ידי הנחה של קיום מצב “קדם-סרטני”, המתבטא בתחילה על ידי צורך לניקוטין ומאוחר יותר בסרטן עצמו. האפשרות השלישית היא קיומו של גורם משותף, אולי גנטי, אשר גורם לאנשים גם לעשן וגם לחלות בסרטן.

מי שהציע את האפשרות השניה היה רונלד פישר. המשמעות של האפשרות הזו היא קיומם של גידולים סרטניים שאובחנו רק בגיל 50 אבל החלו להתפתח לפני גיל 18, שהוא הגיל החציוני לתחילת העישון. מכיוון שאין שום עדות או ממצא התומכים בכך, קורנפילד דוחה את הטענה על הסף.

באשר להשערת הגורם במשותף, קורנפילד טוען כי הנתונים והעדויות שנאספו עד כה הינם קונסיסטנטיים עם הטענה כי עישון גורם לסרטן אך לא עם הטענה של קיום גורם משותף. טענתו היא כי תיאוריית הגורם המשותף אינה עולה בקנה אחד עם: השינוי והעליה בתפוצה של סרטן הריאה ב-50 השנים האחרונות, העדויות לקרצינגוניות של משקעי העישון בניסויים בחיות, התמותה הפחותה מסרטן הריאה בקרב מעשנים שהפסיקו לעשן, וההבדלים שנצפו בין מעשני סיגריות ובין מעשני סיגרים או מקטרות. גם אם כל אחד מארבעת הנימוקים אינו טיעון מספק נגד השערת הגורם המשותף, טוען קורנפילד, צירופם יחד אינו מאפשר “התייחסות רצינית” לטענת הגורם המשותף. קורנפילד מבהיר למעשה כי נטל הוכחת טענת הגורם המשותף מוטל על הטוענים את הטענה.

לבסוף עובר קורנפילד לדון בביקורת על “השערת הסיבתיות”, כלומר הטענה כי עישון גורם לתחלואה בסרטן הריאה. בתחילה הוא מטפל ברונלד פישר, שטען כי אין התאמה בין ההבדלים בעליית התחלואה בסרטן הריאה בין נשים וגברים, כאשר בקרב הגברים התחלואה גבוה יותר, ובין קצב העליה בשיעור הנשים המעשנות שהינו גבוה מקצב העליה בשיעור הגברים המעשנים. תשובתו של קורנפילד היא שטענתו של פישר לא נתמכת על ידי הנתונים הקיימים.

טענה נוספת נגד הקשר הסיבתי בין עישון ותחלואה ותמותה מסרטן הריאה, היא כי במחקרים נאספו למעשה נתוני תמותה ולא נתוני תחלואה, כאשר יש סיבות רבות לתמותה. בקרב מעשנים נצפתה עליה בתמותה גם ממחלות לב, מחלות ריאתיות ואחרות, אך לא מסיבות אחרות כגון תאונות. לכן, טען ארקין ((כל ההפניות נמצאות במאמר של קורנפילד ועמיתיו)) עישון אינו הגורם לתחלואה אלא רק סימפטום: אנשים אלה לא שומרים על בריאותם באופן כללי, ובפרט מעשנים. גם ברקסון העלה טענה דומה. בנוסף לטענת “העישון הוא סימפטום” שהעלה ארקין, טוען ברקסון כי אין זה סביר שגורם אחד יהווה גורם סיכון למספר מחלות. ברקסון טוען למעשה כי העקרונות של רוברט קוך מופרים.

קורנפילד משיב כי אין שום בעיה בטענה שגורם סיכון אחד יכול לגרום למספר תוצאות. הוא מביא כדוגמה את הערפל הגדול בלונדון שאירע ב-1952, אשר גרם לעליה בתמותה ממספר סיבות, בעיקר מחלות נשימתיות ומחלות לב כליליות. הוא מסביר כי עשן הסיגריות אינו חומר אחיד, אלא תערובת של מאות כימיקלים שונים, שרק התכונות של חלק מהם נחקרו עד כה. לדעת קורנפילד, אין זה מתקבל על הדעת כי כל החומרים האלה גורמים לאותה תוצאה. עולם שבו יש התאמה חד-חד-ערכית בין סיבה לתוצאה הינו ללא ספק יותר קל יותר להבנה, אך אנו איננו חיים בעולם כזה.

קורנפילד מודה כי אכן יש צורך במחקר נוסף כדי להבין את המנגנון המקשר בין העישון ובין התפתחות הסרטן ומחלות אחרות. אולם הוא מסביר כי אין די בכך כדי לשלול את קיומו של קשר סיבתי, מה גם שהנתונים שנאספו עד כה עולים בקנה אחד עם קיומו של קשר סיבתי.

לסיום מתייחס קורנפילד לשאלה מדוע ישנם מעשנים שאינם חולים בסרטן הריאה ומאידך יש אנשים שאינם מעשנים ובכל זאת חולים, ומודה שהתשובה לכך לא ידועה. הוא מביא לדוגמה את “אסון ליבק“, מקרה בו 251 תינוקות קיבלו חיסון לשחפת אשר היה מזוהם בזן פעיל של חיידק הגורם למחלה. למרות זאת, כעשירית מהתינוקות לא פיתחו כלל תסמינים של דלקת ריאות. האם נתון זה סותר את הטענה כי אותו חיידק דורם לדלקת ריאות?

קורנפילד מסיים ואומר כי למרות שהנתונים אינם מושלמים, כמעט ואין מחלוקת על כך שהנתונים מראים כי עישון הוא גורם סיכון בריאותי, וכי הוא ועמיתיו אינם יכולים לקבל את הטענה כי עישון הוא הרגל בלתי מזיק.

מקורות

  • Proctor, R. N. (2012). The history of the discovery of the cigarette–lung cancer link: evidentiary traditions, corporate denial, global toll. Tobacco control, 21(2), 87-91. (pdf)
  • Witschi, H. (2001). A short history of lung cancer. Toxicological sciences, 64(1), 4-6. (pdf)
  • Cornfield, J., Haenszel, W., Hammond, E. C., Lilienfeld, A. M., Shimkin, M. B., & Wynder, E. L. (1959). Smoking and lung cancer: recent evidence and a discussion of some questions. Journal of the National Cancer institute22(1), 173-203. (pdf)

הפוסטים הקודמים בסדרה

הפוסטים הבאים בסדרה

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

100 שנה להולדתו של ג’ורג’ בוקס

החודש, בתאריך 18 באוקטובר, מלאו 100 שנה להולדתו של הסטטיסטיקאי הבריטי אמריקני ג’ורג’ בוקס.

בוקס נולד ב-18 באוקטובר 1919 בעיירה גרייבסנד שבמחוז קנט באנגליה. הוא החל בלימודי כימיה באוניברסיטה, אך עם פרוץ מלחמת העולם השנייה נקרא לשירות לפני שסיים את לימודיו. במסגרת שירותו היה עליו לבצע ניסויים כדי לבדוק השפעות אפשריות של גז החרדל, וטיפולים אפשריים לפגיעות מגז זה. מכיוון שבצוות בו עבד לא היה סטטיסטיקאי, הוא נעזר במספר ספרי סטטיסטיקה כדי ללמוד בעצמו את התחום של תכנון ניסויים, וכך החלה התעניינותו בסטטיסטיקה. כאשר המלחמה הסתיימה, בוקס החל ללמוד ביוניברסיטי קולג’ בלונדון, שם קיבל תואר ראשון במתמטיקה וסטטיסטיקה. לאחר מכן למד באוניברסיטת לונדון, וב-1953 קיבל תואר דוקטור לסטטיסטיקה. מדריך עבודת הדוקטורט שלו היה אגון פירסון.

בשנים 1948 עד 1956, במקביל ללימודיו בוקס עבד בחברת ICI, שהייתה בשעתה חברת הכימיה הגדולה ביותר בבריטניה. לאחר מכן עבר לאוניברסיטת פרינסטון, שם ניהל את קבוצת המחקר בסטטיסטיקה. ב-1960 עבר לאוניברסיטת ויסקונסין במדיסון, שם הקים את המחלקה לסטטיסטיקה של האוניברסיטה. הוא פרש לגימלאות בשנת 1992, בגיל 75. בוקס נפטר בשנת 2013, בגיל 93.

עבודתו המדעית של בוקס התמקמה בארבעה תחומים עיקריים: בקרת איכות, ניתוח סדרות עיתיות, תכנון ניסויים וסטטיסטיקה בייסיאנית. תרומותיו הידועות ביותר הן: מתודולוגיות לתכנון ניסויים ובכללן מתודולוגיית משטחי תגובה, שיטת בוקס-ג’נקינס לניתוח סדרות עיתיות, וטרנספורמציית בוקס-קוקס, שהיא עבודה משותפת עם סיר דויד קוקס. מסופר כי הטרנספורמציה פותחה לאחר שבוקס וקוקס חשבו כי יהיה משעשע לפתח ביחד שיטה סטטיסטית שתיקרא על שם שניהם. המאמר המשותף שפירסמו בוקס וקוקס בשנת 1964 צוטט כ-16 אלף פעמים.

בוקס פירסם מאות מאמרים מדעיים, וכתב שבעה ספרי לימוד בתחומים בהם עסק. ספרו המשפיע ביותר הוא ככל הנראה “Statistics for Experimenters” שנכתב בשיתוף פעולה עם ויליאם האנטר. בספר זה הופיעה האמירה המפורסמת המיוחסת לבוקס, לפיה כל המודלים שגויים, אם כי חלקם שימושיים.

כאן אספר אנקדוטה אישית: בישיבה שנערכה באחד ממקומות העבודה שבהם עבדתי הזכרתי את האמירה הפילוסופית הזו של בוקס. בסיכום הישיבה נכתב כי “הסטטיסטיקאי אמר כי המודל לא נכון”. האם זו אנקדוטה משעשעת? לא מבחינתי, בכל אופן.

לקראת סוף חייו כתב בוקס ספר אוטוביוגרפי המתאר את מהלך הקריירה המדעית שלו ואת חייו האישיים, החל מהרגע בו נדרש ללמוד סטטיסטיקה בכוחות עצמו כדי לתכנן ניסויים במעבדה לכימיה. כותרת הספר הולמת את ראשית דרכו המקצועית: “An accidental Statistician” .

בוקס נבחר לחבר באקדמיה האמריקנית לאמנויות ומדע בשנת 1974, ולעמית בחברה המלכותית בשנת 1985.
ב-1968, בוקס זכה במדליה על שם וולטר שוהרט ב-המוענקת על ידי האיגוד האמריקני לבקרת איכות. ב-1972 זכה בפרס על שם סם וילקס. ב-1974 הוזמן לשאת את ההרצאה השנתית לזכרו של רונלד פישר. ב-1993 זכה במדליית הזהב על שם גאי המוענקת על ידי החברה המלכותית לסטטיסטיקה. ב-2003 ייסד האיגוד האירופי לסטטיסטיקה בתעשייה ועסקים (ENBIS) פרס על שמו, והוא היה הזוכה הראשון בפרס.
בוקס היה נשיא האיגוד האמריקני לסטטיסטיקה בשנת 1978, ונשיא המכון לסטטיסטיקה מתמטית בשנת 1979.

לקריאה נוספת

George Edward Pelham Box Biography, University of St Andrews, Scotland
A Conversation with George Box. DeGroot, Statistical Science 1987
George Box: An interview with the International Journal of. Forecasting. Pena, International Journal of Forecasting 2001
George Box, (1919-2013): a wit, a kind man and a statistician. Champkin, Significance Magazine 2013

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

100 שנה להולדתו של ויליאם קראסקל

החודש, בתאריך 10.10.2019, מלאו 100 שנה להולדתו של הסטטיסטיקאי ויליאם קראסקל.

ויליאם קראסקל 1919-2005

ויליאם קראסקל נולד ב-1919 למשפחה יהודית בניו-ראשל, פרבר של העיר ניו-יורק.

הוא למד באוניברסיטת הארווארד, שם קיבל תואר ראשון במתמטיקה בשנת 1940, ותואר שני ב-1941. זמן קצר לאחר שסיים את לימודיו הצטרפה ארצות הברית למלחמת העולם השניה, וקראסקל גוייס לחיל הים ושירת בבסיס דאלגרן בוירג’יניה, שם עסק בחישובים בליסטיים שונים. שם התוודע לתחום הסטטיסטיקה, כאשר פגש סטטיסטיקאים ששירתו בבסיס וגם בסטטיסטיקאים שהגיעו לשם מדי פעם. הוא המשיך לשרת בצי גם לאחר שהמלחמה נסתיימה.

לאחר שסיים את שירותו בצי חזר לניו יורק ועבד בעסק המשפחתי. במקביל החל בלימודים חלקיים באוניברסיטת קולומביה. הוא נזקק לאישור מיוחד כדי להתקבל, כיוון שלא עמד בדרישות הסף, והתקבל ללימודים לאחר שרואיין על ידי אברהם ואלד, שהיה אז ראש המחלקה לסטטיסטיקה.

ב-1950 החליט להפוך לסטטיסטיקאי מקצועי. קראסקל עבר לאוניברסיטת שיקגו שם קיבל משרת מרצה זוטר, עם הבטחה מאת אלן ואליס, שהיה אז ראש המחלקה לסטטיסטיקה, להתמנות לפרופסור כאשר יקבל את תואר הדוקטור. קראסקל ביצע מחקר משותף עם אלן ואליס, וכן עם הנרי שפה, שבינתיים עבר לאוניברסיטת ברקלי.  קיבל את תואר הדוקטור מאוניברסיטת קולומביה ב-1955. מדריכי עבודת הדוקטורט שלו היו הנרי שפה והווארד לוין. עבודת הדוקטורט שלו כללה את המבחן הקרוי כיום מבחן קראסקל-ואליס. הוא נשאר באוניברסיטת שיקגו עד לפרישתו לגמלאות ב-1990.

קראסקל נודע בעיקר בזכות עבודותיו בתחומים של סטטיסטיקה אי פרמטרית, ניתוח משתנים איכותיים, ושיטות סטטיסטיות עמידות (רובסטיות). מבחן קראסקל-ואליס הוא דוגמה לשלושה תחומים אלה. שיתוף פעולה עם ליאו גודמן הוליד ארבעה מאמרים קלאסיים שעסקו במדדי קשר למשתנים איכותיים, שקובצו לאחר מכן בספר אחד. קראסקל עסק גם במחקרים בתחום ההיסטוריה של הסטטיסטיקה. הוא פירסם בסך הכל 109 מאמרים מדעיים וספרים

ב-1970 קראסקל מונה על ידי הנשיא ניקסון לחבר בועדה הלאומית לסטטיסטיקה. כעבור שנה מונה ליו”ר מועת המחקר לסטטיסטיקה לאומית, תפקיד בו שירת עד 1978.

קראסקל היה חבר כבוד באיגוד האמריקני לסטטיסטיקה, במכון לסטטיסטיקה מתמטית, באיגוד האמריקני לקידום המדע ובאקדמיה האמריקנית למדעים ואמנויות. הוא כיהן כנשיא המכון לסטטיסטיקה מתמטית ב-1971, וכנשיא האיגוד האמריקני לסטטיסטיקה בשנת 1982. ב-1970 זכה בפרס על שם סם וילקס.

 

לקריאה נוספת

.

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו

10 שנים למותו של אריק להמן

היום, 12 בספטמבר 2019, מלאו 10 שנים למותו של הסטטיסטיקאי אריק לאו להמן. כאשר מלאו שלושים לפטירתו כתבתי כאן פוסט אישי אודותיו. כעת ברצוני לכתוב גם על חייו ופועלו.

אריק לאו להמן (1917-2009)להמן נולד ב-1917 בעיר שטרסבורג בחבל אלזס לוריין, וגדל בפרנקפורט שבגרמניה. ב-1933, כאשר היטלר מונה לקאנצלר גרמניה, נמלטה משפחתו לשוויץ. לאחר שסיים את לימודיו בתיכון למד מתמטיקה במשך שנתיים בקולג’ טריניטי שבאוניברסיטת קיימברידג’. ב-1940 היגר לארצות הברית, וב-1941 התקבל ללימודי דוקטורט באוניברסיטת ברקלי בקליפורניה, למרות שפורמלית לא החזיק באף תואר אקדמי. הוא קיבל תואר שני במתמטיקה בשנת 1942, ותואר הדוקטור הוענק לו ב-1946. מדריך עבודת הדוקטורט שלו, שעסקה במבחנים אופטימליים על ערכו של מקדם המתאם, היה ג’רזי ניימן. במהלך מלחמת העולם השניה עסק בחקר ביצועים בבסיס חיל האוויר האמריקני בגואם.

לאחר שסיים את לימודי הדוקטורט המשיך להמן בתפקידו כמרצה לסטטיסטיקה באוניברסיטת ברקלי. בשנים 1950-1951 היה מרצה באוניברסיטאות קולומביה ופריסטון, וב-1952 היה פרופסור חבר באוניברסיטת סטנפורד. לאחר מכן חזר לאוניברסיטת ברקלי, שם כיהן כפרופסור למתמטיקה ולסטטיסטיקה עד לפרישתו ב-1988, אך המשיך בעבודתו המדעית גם לאחר מכן. בין השנים 1950 עד 1984 להמן היה מדריך עבודה הדוקטורט של 46 סטודנטים. ב-1977 נישא להמן לסטטיסטיקאית ג’ולי שייפר. הוא נפטר בשיבה טובה ב-12 בספטמבר 2009.

להמן תרם תרומות משמעותיות לתורת האמידה ולתיאוריה של בדיקת השערות אי פרמטרית. הוא נודע גם בזכות משפט להמן-שפה ואמד הודג’ס-להמן לחציון של אוכלוסייה. כמו כן עסק במחקר אודות ההיסטוריה והפילוסופיה של הסטטיסטיקה. בין שותפיו למחקר נמנו הנרי שפה, צ’ארלס סטיין, גו’זף הודג’ס, אוולין פיקס, פרסי דיאקוניס, וויליאם קראסקל, ג’ולייט פופר שייפר, ג’ודית טאנור, וחתן פרס נובל לכלכלה קנת’ ארו. בסך הכל פירסם להמן 123 מאמרים מדעיים.

בנוסף לכך, להמן ידוע גם בזכות הספרים שכתב. הוא כתב שבעה ספרי לימוד שעסקו בעיקר בנושאים מתקדמים בסטטיסטיקה. הספר “מושגים בסיסיים בהסתברות וסטטיסטיקה” שכתב יחד עם ג’וזף הודג’ס, תורגם לחמש שפות, כולל תרגום לעברית. בסך הכל תורגמו ספריו לתשע שפות שונות.

ב-2007 פרסם להמן ספר אוטוביוגרפי בו תיאר את זכרונותיו מעבודות משותפות, קשרי ידידות ומפגשים עם סטטיסטיקאים, כולל פגישה קצרה ולא נעימה עם רונלד פישר. ב-2011  פרסם ספר שעסק בעבודות המוקדמות של פישר וניימן, בו הבהיר את חילוקי הדיעות העקרוניים שהיו בין השניים לגבי הכיוון אליו צריך מדע הסטטיסטיקה להתפתח.

להמן נבחר לחבר כבוד של האיגוד האמריקני לסטטיסטיקה, המכון לסטטיסטיקה מתמטית, והחברה המלכותית לסטטיסטיקה. כן נבחר להיות חבר במכון הבינלאומי לסטטיסטיקה, באקדמיה האמריקנית לאמנויות ומדעים, ובאקדמיה הלאומית למדעים של ארצות הברית. להמן כיהן כנשיא המכון לסטטיסטיקה מתמטית בשנים 1960-1961 . הוא זכה במספר מענקי מחקר יוקרתיים, כולל מענק מקרן גוגנהיים, והוזמן לשאת את ההרצאות על שם רונלד פישר, סם וילקס ואברהם ולד. הוענקו לו שני תוארי דוקטור לשם כבוד מטעם אוניברסיטת ליידן ואוניברסיטת שיקגו. לכבוד יום הולדתו ה-80 ב-1997, אוניברסיטת ברקלי הקימה קרן מילגות על שמו. בשנת 2000 היה לזוכה הראשון בפרס על שם גוטפריד נתר.

לקריאה נוספת

 

לקריאה נוספת בנושאים הקשורים לנושא רשימה זו