חיפוש באתר

קישורים

עמודים

קטגוריות

הסקה סיבתית – פוסט פתיחה

כולם מכירים את המנטרה “מתאם לא מעיד על סיבתיות”. אז מה כן מעיד על סיבתיות? כבר כתבתי כאן כמה וכמה פוסטים על מתאם וסיבתיות. הפוסט הראשון שעלה בנסיכת המדעים, ביוני 2004,”האם החסידה מביאה ילדים לעולם“, עסק במתאם וסיבתיות. התייחסתי לנושא עוד פעמים רבות במהלך השנים.

בספטמבר 2012 כתבתי כאן פוסט שנשא את הכותרת הפרובוקטיבית  “על מתאם וסיבתיות, או האם צמחונות גורמת לאנורקסיה“. הפוסט הזה הוא הפוסט הנקרא ביותר בנסיכת המדעים בכל הזמנים, ועורר זעם רב, כיוון שרמזתי כי התשובה לשאלה בכותרת עשויה (או עלולה) להיות חיובית. בהמשך נראה כי לפחות על פי גישה אחת התשובה היא אכן חיובית.

חודש לאחר מכן באוקטובר 2012, כתבתי פוסט נוסף בנושא. הכותרת הפעם הייתה “מתאם כן מעיד על סיבתיות“. הנקודה שניסיתי להבהיר שם הייתה שאם צופים במתאם, ראוי לחשוד שמה קיימת גם סיבתיות. כלומר, אין לפרש את המנטרה “מתאם לא מעיד על סיבתיות” כ-“אם יש מתאם אז אין סיבתיות”, כפי שרבים חושבים, למרבה הצער. הפירוש הנכון הוא כי מתאם בלבד אינו עדות מספקת לקיום סיבתיות.

אז איך מסיקים סיבתיות? איך אנחנו יודעים, למשל, כי עישון גורם לסרטן? מהי משמעות הטענה הזו בכלל? הרי יש אנשים שמעשנים כל חייהם ולמרות זאת לא חלו בסרטן. אז אולי עישון לא באמת גורם לסרטן? אם כך, אז מהי בכלל סיבתיות? האם הסטטיסטיקה יכולה לעזור לנו להוכיח כי קיימת סיבתיות או להפריך את קיומה?

אני פותח כאן בסדרת פוסטים שתנסה לענות על חלק מהשאלות האלה. אעדכן כאן את הקישורים עם התקדמות הסדרה. אם אתם רוצים לקבל עדכונים שוטפים, אתם מוזמנים להירשם כאן.

 

רשימת הפוסטים בסדרה:

100 שנה להולדתו של ג’ורג’ בוקס

החודש, בתאריך 18 באוקטובר, מלאו 100 שנה להולדתו של הסטטיסטיקאי הבריטי אמריקני ג’ורג’ בוקס.

בוקס נולד ב-18 באוקטובר 1919 בעיירה גרייבסנד שבמחוז קנט באנגליה. הוא החל בלימודי כימיה באוניברסיטה, אך עם פרוץ מלחמת העולם השנייה נקרא לשירות לפני שסיים את לימודיו. במסגרת שירותו היה עליו לבצע ניסויים כדי לבדוק השפעות אפשריות של גז החרדל, וטיפולים אפשריים לפגיעות מגז זה. מכיוון שבצוות בו עבד לא היה סטטיסטיקאי, הוא נעזר במספר ספרי סטטיסטיקה כדי ללמוד בעצמו את התחום של תכנון ניסויים, וכך החלה התעניינותו בסטטיסטיקה. כאשר המלחמה הסתיימה, בוקס החל ללמוד ביוניברסיטי קולג’ בלונדון, שם קיבל תואר ראשון במתמטיקה וסטטיסטיקה. לאחר מכן למד באוניברסיטת לונדון, וב-1953 קיבל תואר דוקטור לסטטיסטיקה. מדריך עבודת הדוקטורט שלו היה אגון פירסון.

בשנים 1948 עד 1956, במקביל ללימודיו בוקס עבד בחברת ICI, שהייתה בשעתה חברת הכימיה הגדולה ביותר בבריטניה. לאחר מכן עבר לאוניברסיטת פרינסטון, שם ניהל את קבוצת המחקר בסטטיסטיקה. ב-1960 עבר לאוניברסיטת ויסקונסין במדיסון, שם הקים את המחלקה לסטטיסטיקה של האוניברסיטה. הוא פרש לגימלאות בשנת 1992, בגיל 75. בוקס נפטר בשנת 2013, בגיל 93.

עבודתו המדעית של בוקס התמקמה בארבעה תחומים עיקריים: בקרת איכות, ניתוח סדרות עיתיות, תכנון ניסויים וסטטיסטיקה בייסיאנית. תרומותיו הידועות ביותר הן: מתודולוגיות לתכנון ניסויים ובכללן מתודולוגיית משטחי תגובה, שיטת בוקס-ג’נקינס לניתוח סדרות עיתיות, וטרנספורמציית בוקס-קוקס, שהיא עבודה משותפת עם סיר דויד קוקס. מסופר כי הטרנספורמציה פותחה לאחר שבוקס וקוקס חשבו כי יהיה משעשע לפתח ביחד שיטה סטטיסטית שתיקרא על שם שניהם. המאמר המשותף שפירסמו בוקס וקוקס בשנת 1964 צוטט כ-16 אלף פעמים.

בוקס פירסם מאות מאמרים מדעיים, וכתב שבעה ספרי לימוד בתחומים בהם עסק. ספרו המשפיע ביותר הוא ככל הנראה “Statistics for Experimenters” שנכתב בשיתוף פעולה עם ויליאם האנטר. בספר זה הופיעה האמירה המפורסמת המיוחסת לבוקס, לפיה כל המודלים שגויים, אם כי חלקם שימושיים.

כאן אספר אנקדוטה אישית: בישיבה שנערכה באחד ממקומות העבודה שבהם עבדתי הזכרתי את האמירה הפילוסופית הזו של בוקס. בסיכום הישיבה נכתב כי “הסטטיסטיקאי אמר כי המודל לא נכון”. האם זו אנקדוטה משעשעת? לא מבחינתי, בכל אופן.

לקראת סוף חייו כתב בוקס ספר אוטוביוגרפי המתאר את מהלך הקריירה המדעית שלו ואת חייו האישיים, החל מהרגע בו נדרש ללמוד סטטיסטיקה בכוחות עצמו כדי לתכנן ניסויים במעבדה לכימיה. כותרת הספר הולמת את ראשית דרכו המקצועית: “An accidental Statistician” .

בוקס נבחר לחבר באקדמיה האמריקנית לאמנויות ומדע בשנת 1974, ולעמית בחברה המלכותית בשנת 1985.
ב-1968, בוקס זכה במדליה על שם וולטר שוהרט ב-המוענקת על ידי האיגוד האמריקני לבקרת איכות. ב-1972 זכה בפרס על שם סם וילקס. ב-1974 הוזמן לשאת את ההרצאה השנתית לזכרו של רונלד פישר. ב-1993 זכה במדליית הזהב על שם גאי המוענקת על ידי החברה המלכותית לסטטיסטיקה. ב-2003 ייסד האיגוד האירופי לסטטיסטיקה בתעשייה ועסקים (ENBIS) פרס על שמו, והוא היה הזוכה הראשון בפרס.
בוקס היה נשיא האיגוד האמריקני לסטטיסטיקה בשנת 1978, ונשיא המכון לסטטיסטיקה מתמטית בשנת 1979.

לקריאה נוספת

George Edward Pelham Box Biography, University of St Andrews, Scotland
A Conversation with George Box. DeGroot, Statistical Science 1987
George Box: An interview with the International Journal of. Forecasting. Pena, International Journal of Forecasting 2001
George Box, (1919-2013): a wit, a kind man and a statistician. Champkin, Significance Magazine 2013

100 שנה להולדתו של ויליאם קראסקל

החודש, בתאריך 10.10.2019, מלאו 100 שנה להולדתו של הסטטיסטיקאי ויליאם קראסקל.

ויליאם קראסקל 1919-2005

ויליאם קראסקל נולד ב-1919 למשפחה יהודית בניו-ראשל, פרבר של העיר ניו-יורק.

הוא למד באוניברסיטת הארווארד, שם קיבל תואר ראשון במתמטיקה בשנת 1940, ותואר שני ב-1941. זמן קצר לאחר שסיים את לימודיו הצטרפה ארצות הברית למלחמת העולם השניה, וקראסקל גוייס לחיל הים ושירת בבסיס דאלגרן בוירג’יניה, שם עסק בחישובים בליסטיים שונים. שם התוודע לתחום הסטטיסטיקה, כאשר פגש סטטיסטיקאים ששירתו בבסיס וגם בסטטיסטיקאים שהגיעו לשם מדי פעם. הוא המשיך לשרת בצי גם לאחר שהמלחמה נסתיימה.

לאחר שסיים את שירותו בצי חזר לניו יורק ועבד בעסק המשפחתי. במקביל החל בלימודים חלקיים באוניברסיטת קולומביה. הוא נזקק לאישור מיוחד כדי להתקבל, כיוון שלא עמד בדרישות הסף, והתקבל ללימודים לאחר שרואיין על ידי אברהם ואלד, שהיה אז ראש המחלקה לסטטיסטיקה.

ב-1950 החליט להפוך לסטטיסטיקאי מקצועי. קראסקל עבר לאוניברסיטת שיקגו שם קיבל משרת מרצה זוטר, עם הבטחה מאת אלן ואליס, שהיה אז ראש המחלקה לסטטיסטיקה, להתמנות לפרופסור כאשר יקבל את תואר הדוקטור. קראסקל ביצע מחקר משותף עם אלן ואליס, וכן עם הנרי שפה, שבינתיים עבר לאוניברסיטת ברקלי.  קיבל את תואר הדוקטור מאוניברסיטת קולומביה ב-1955. מדריכי עבודת הדוקטורט שלו היו הנרי שפה והווארד לוין. עבודת הדוקטורט שלו כללה את המבחן הקרוי כיום מבחן קראסקל-ואליס. הוא נשאר באוניברסיטת שיקגו עד לפרישתו לגמלאות ב-1990.

קראסקל נודע בעיקר בזכות עבודותיו בתחומים של סטטיסטיקה אי פרמטרית, ניתוח משתנים איכותיים, ושיטות סטטיסטיות עמידות (רובסטיות). מבחן קראסקל-ואליס הוא דוגמה לשלושה תחומים אלה. שיתוף פעולה עם ליאו גודמן הוליד ארבעה מאמרים קלאסיים שעסקו במדדי קשר למשתנים איכותיים, שקובצו לאחר מכן בספר אחד. קראסקל עסק גם במחקרים בתחום ההיסטוריה של הסטטיסטיקה. הוא פירסם בסך הכל 109 מאמרים מדעיים וספרים

ב-1970 קראסקל מונה על ידי הנשיא ניקסון לחבר בועדה הלאומית לסטטיסטיקה. כעבור שנה מונה ליו”ר מועת המחקר לסטטיסטיקה לאומית, תפקיד בו שירת עד 1978.

קראסקל היה חבר כבוד באיגוד האמריקני לסטטיסטיקה, במכון לסטטיסטיקה מתמטית, באיגוד האמריקני לקידום המדע ובאקדמיה האמריקנית למדעים ואמנויות. הוא כיהן כנשיא המכון לסטטיסטיקה מתמטית ב-1971, וכנשיא האיגוד האמריקני לסטטיסטיקה בשנת 1982. ב-1970 זכה בפרס על שם סם וילקס.

 

לקריאה נוספת

.

ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד

אשה בת 50 עברה בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד, והתקבלה תוצאה חיובית.[1] עם זאת, החולה והרופאה יודעות כי הבדיקה אינה מדוייקת ב-100% ותיתכן תוצאה שגויה.

השאלון שואל איזו פרופורציה של נשים שתוצאת הממוגרפיה שלהן חיובית אכן חולות בסרטן השד, וזאת על פי נתוני ה-NHS, שירותי הבריאות הלאומיים של בריטניה. את התשובה קל למצוא בגוגל: בערך אחת מכל ארבע נשים בגילאי 50 עד 70 שנקראות לבירור נוסף עקב תוצאה שאינה שלילית באופן חד משמעי, אחת אכן חולה בסרטן השד. נתון זה נקרא ערך הניבוי החיובי של הבדיקה. פורמלית, נאמר כי ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד בקרב נשים בגילאי 50 עד 70 הוא 25%. (אני מציע שתעצרו רגע לחשוב האם ערך הניבוי החיובי של 25% הוא סביר בעיניכם. אין תשובה אובייקטיבית לשאלה הזו.)

מכאן שאם תוצאת הבדיקה חיובית, עדיין יש סיכוי של 75% בערך שהנבדקת אינה חולה. כלומר: מתוך כל ארבע נשים בגילאי 50 עד 70 שתוצאת הממוגרפיה שלהן חיובית, שלוש אינן חולות.

לנשים צעירות יותר, ערך הניבוי החיובי נמוך יותר, ולכן ארגוני הבריאות לא ממליצים לנשים מתחת לגיל 50 שאינן נמצאות בקבוצת סיכון לעבור בדיקת ממוגרפיה.

שתי הפסקאות האחרונות עשויות לעורר בכן תמיהה, ובצדק. בדיקת הממוגרפיה היא אותה בדיקה, לא משנה מה גיל האישה שעברה את הבדיקה. אז למה ערך הניבוי החיובי משתנה עם הגיל?

כדי להבין זאת דרוש תחילה הסבר קצר על בניית כלים דיאגנוסטיים כגון בדיקת ממוגרפיה לגילוי מוקדם של סרן השד, או כל בדיקה אחרת.

כאשר מפתחים בדיקה כזו, מסתמכים על נתונים אמיתיים, שבהם אנחנו יודעים גם את תוצאת הבדיקה: חיובית או שלילית, וגם את המצב האמיתי של הנבדק: חולה או בריא. למעשה, הקריטריון לפיו קובעים האם תוצאת הבדיקה חיובית או שלילית נקבע בדרך כלל על סמך המצב הרפואי של הנבדק ותוצאת הבדיקה. כך למשל, אם עורכים בדיקת דם יכולים לקבל טווח של ערכים, ואז קובעים איזשהו קו מפריד כך שהערכים הגבוהים מהקו נחשבים לחיוביים ואלה שמתחת לקו נחשבים שליליים (או להיפך) [2] . בבדיקות ממוגרפיה זה קצת יותר מסובך כי אין תוצאה מספרית, אבל העיקרון דומה.

לאחר שנקבע הקריטריון לפיו מחליטים האם תוצאת הבדיקה חיובית או שלילית, ניתן לחשב כל מיני מדדים המאפיינים את הבדיקה. שני מדדים נפוצים הם הסגוליות (specificity) והרגישות (sensitivity) של הבדיקה, והם, כאמור, מאפיינים של הבדיקה עצמה.

ערך הניבוי החיובי של הבדיקה נקבע על פי שלושה ערכים. שניים מהם הם הסגוליות והרגישות. הערך השלישי הוא ההימצאות (prevalence) של המחלה, כלומר עד כמה המחלה שכיחה באוכלוסייה הנבדקת.[3] . עם קצת אלגברה אפשר לראות כי ככל שהמחלה נפוצה יותר באוכלוסייה, כך ערך הניבוי החיובי של הבדיקה עולה.

מכאן ברור הקשר בין ערך הניבוי החיובי של בדיקת הממוגרפיה ובין הגיל של הנבדקת. בקבוצת האוכלוסייה של נשים צעירות, מתחת לגיל חמישים לצורך הדיון, מחלת סרטן השד נפוצה פחות, ולכן ערך הניבוי החיובי נמוך יותר עבור נשים צעירות יותר. מסיבה זו (ומסיבות נוספות) ארגוני הבריאות לא ממליצים על בדיקת ממוגרפיה לנשים מתחת לגיל 50 שאינן בקבוצת סיכון.

רשימה זו היא הרשימה השמינית והאחרונה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:

 

 


הערות
  1. התוצאה חיובית אך המשמעות לנבדקת היא שלילית מאוד []
  2. כיצד קובעים את ערך הקו המפריד? זה נושא לרשימה אחרת []
  3. למי שמעוניין בנוסחה – הנה קישור []

מה מספר הכדורים האדומים בכד? – אמידת נראות מירבית

בכד יש 90 כדורים, חלקם אדומים וחלקם לבנים. נאמר לכם כי מספר הכדורים האדומים הוא 45 או 60 (אין אפשרות אחרת).

אתם מוציאים מהכד 300 כדורים עם החזרה, כלומר: מערבבים היטב את תכולת הכד, מוציאים כדור, רושמים את צבעו, ומחזירים אותו לכד. אחר כך מערבבים שוב את תכולת הכד, מוציאים שוב כדור, רושמים את צבעו ומחזירים אותו לכד, כך 300 פעמים.

בסך בכל הוצאתם 175 כדורים אדומים מתוך 300. מהי ההערכה שלכם לגבי מספר הכדורים האדומים בכד?

הנה התשובות שקיבלתי לחידה הזו בטוויטר:

 

בואו נעשה קצת סדר.

ראשית, לגבי הבקשה להעריך את מספר הכדורים האדומים בכד: בשפה יותר “סטטיסטית”, הבקשה היא לאמוד את מספר הכדורים האדומים בכד, ולכן אשתמש מעתה בביטויים כגון “לאמוד” ו-“אומדן”.

אם בכד יש 45 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 45 מתוך 90, כלומר חצי. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, מחציתם היו אדומים, כלומר הייתם שולפים 150 כדורים אדומים.

באופן דומה, אם בכד יש 60 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 60 מתוך 90, כלומר שני שליש. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, שני שליש מתוכם היו אדומים, כלומר הייתם שולפים 200 כדורים אדומים.

כאן אתם יכולים כבר להבין למה הנתון שנתתי לכם הוא שהוצאו 175 כדורים אדומים: 175 הוא הממוצע של 150 ו-200, כלומר אתם נמצאים באמצע הדרך בין שני העולמות המושלמים ההיפותטיים. או שלא?

בקשה שקולה לבקשה שלי היא לאמוד את ההסתברות להוציא כדור אדום מהכד: האם ההסתברות הזו היא חצי או שני שליש. אם לא הייתי אומר לכם מראש שההסתברות הזו חייבת להיות חצי או שני שליש, הייתם בוודאי אומרים כי ההסתברות היא 175 מתוך 300, כלומר 0.5833.  בסוף הפוסט הזה אסביר מדוע.

אחת הדרכים האפשריות לאמוד את מספר הכדורים האדומים בכד, או באופן שקול, לאמוד את ההסתברות להוציא כדור אדום מהכד היא להניח שאם ראינו משהו, זה אומר שההסתברות שנראה את אותו משהו גבוהה. העיקרון הזה נקרא עיקרון הנראות המירבית.[1]

נדגים את העיקרון בעזרת דוגמא יותר קיצונית. נניח ששלפתם 300 כדורים מהכד וכל הכדורים שנשלפו היו אדומים. אם בכד היו 45 כדורים אדומים, אז ההסתברות למאורע הזה היא חצי בחזקת 300. אם בכד היו 60 כדורים אדומים, ההסתברות לשלוף 300 כדורים אדומים היא שני שליש בחזקת 300. לא צריך לדעת הרבה מתמטיקה כדי לדעת שחצי בחזקת 300 הרבה יותר קטן משני שליש בחזקת 300. לכן, אם הוצאתם 300 כדורים אדומים, האפשרות הסבירה יותר היא שיש בכד 60 כדורים אדומים, וזה יהיה האומדן שלכם למספר הכדורים האדומים בכד.

ההמשך ברור: יש לחשב את ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 45 כדורים אדומים, ואת ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 60 כדורים אדומים. אם ההסתברות הראשונה יותר גבוהה, אז האומדן שלכם יהיה 45. אם ההסתברות השנייה תהיה יותר גבוהה, אז האומדן שלכם למספר הכדורים האדומים יהיה 60.

את שתי ההסתברויות האלה אפשר לחשב על ידי נוסחת ההתפלגות הבינומית. אל תטרחו לנסות. רוב הסיכויים הם שהמחשב שלכם לא יצליח לחשב את ההסתברויות האלה באופן מדוייק. אפשרות שניה היא לנסות לחשב את ההסתברויות האלה על ידי הקירוב הפואסוני להתפלגות הבינומית. הסברתי זאת בעבר כאן בבלוג, ראו למשל את הדוגמה הזו לחיזוי מספר הזוכים בלוטו.

אבל הדרך הכי קלה ומהירה היא לחשב את היחס בין שתי ההסתברויות[2]. מספרים שצריך לחשב בדרך, כמו 300 עצרת (מספר בן 615 ספרות) יצטמצמו, ולבסוף תקבלו כי ההסתברות להוציא 175 כדורים אדומים כאשר יש בכד 45 כדורים אדומים גדולה פי 1.4 מההסתברות להוציא  להוציא 175 כדורים אדומים כאשר יש בכד 60 כדורים אדומים. לכן האומדן שלי למספר הכדורים האדומים בכד הוא 45.

אומדן זה הוא אומדן נראות מירבית. הגעתי אליו על ידי כך שחישבתי את ההסתברות לקבל 175 כדורים אדומים בשני המצבים האפשריים, ובחרתי במצב שבו ההסתברות להוציא 175 כדורים אדומים הייתה גבוהה יותר.

מה היה קורה אילו לא אמרתי לכם כי מספר הכדורים בכד הוא בהכרח 45 או 60?

אין בעיה: פשוט צריך לחשב את כל ההסתברויות האפשריות לכל המקרים, החל מ-0 כדורים אדומים ועד ל-90 כדורים אדומים. בסך הכל מדובר כאן ב-91 חישובים, ואז למצוא את הערך שעבורו מתקבלת ההסתברות המקסימלית. אם תעשו את החישובים תמצאו כי הערך הזה הוא 59.

אבל יש דרך יותר קלה. אפשר לכתוב את ההסתברות להוציא 175 כדורים אדומים כפונקציה של ההסתברות להוציא כדור אדום אחד מהכד בשליפה בודדת. בעזרת קצת חדו”א אפשר למצוא את הערך שיביא את ההסתברות הזו למקסימום, וזה יהיה אמדן הנראות המירבית להסתברות להוציא כדור אדום מהכד.

שיטת האמידה על ידי נראות מקסימלית היא אחת משיטות האמידה החשובות ביותר בסטטיסטיקה. זאת מכיוון שלאמדי נראות מקסימלית יש תכונות מתמטיות העושות אותם לעדיפים במספר מובנים על פני אמדים אחרים. לכן השימוש בשיטה הזו נפוץ מאוד, וכל תכנה סטטיסטית מאפשרת את החישוב שלהם עבור כמעט כל מודל סטטיסטי.


הערות
  1. זו לא הגישה האפשרית היחידה. יש עוד גישות אפשריות, וייתכן ואדון בהן בפעם אחרת []
  2. אני מדלג על החישובים כי זה לא החלק החשוב כאן. למי שמעוניין, החישובים נמצאים כאן []