גישת “המציאות החילופית” שגובשה על ידי דונלד רובין באמצע שנות השבעים היא אחת משתי הגישות המובילות היום בתחום של הסקה סיבתית. הביטוי “מציאות חלופית” הוא התרגום שלי למונח counterfactual, שמקורו בגישה של דייויד יום שסקרתי בפוסט הראשון בסדרה. כזכור, יום טען כי יש להסיק סיבתיות על ידי השוואת מה שקרה בפועל למה שהיה עשוי לקרות אילו הייתה ננקטת פעולה אחרת מזו שננקטה. עקב כך, טען יום, אי אפשר לקבוע אפקט סיבתי, כי אנחנו לעולם יכולים לצפות במה שהיה קורה אילו. יום צודק כמובן. אבל, האם אפשר לעקוף את הבעיה?
רובין הסתייג מהשימוש במילה counterfactual, ומעדיף את הביטוי potential outcome או “תוצאה פוטנציאלית” בעברית. הסיבה לכך, מסביר רובין, היא שיש counterfactuals שלא ניתן לצפות בהם, אפילו לא באופן תיאורטי. הדוגמה שלו היא כי אין שום אפשרות תיאורטית לצפות בגובה שלך בגיל 3 אילו נולדת בקוטב הצפוני. לעומת זאת, אם מדובר בשני טיפולים אפשריים למחלה כלשהי, יש מראש אפשרות לצפות בשתי התוצאות: תוצאה אחת אם החולה יקבל טיפול אחד, תוצאה אחרת אם החולה יקבל את הטיפול השני, ואנחנו (( כלומר הרופא בהתייעצות עם החולה )) יכולים להחליט באיזו תוצאה אנחנו רוצים לצפות. אתם יכולים להחליט לצפות בגובה של עצמכם בגיל 3 אילו נולדתם בקוטב הצפוני עד מחר. יש אולי יקום מקביל שבו זה קורה, אבל אין שום אפשרות לצפות בו. (( לאיש שיושב באמצע השורה הראשונה, נע בחוסר נוחות בכיסא שלו ומצביע כי הוא רוצה לשאול שאלה: אני תיכף אחזור לזה ))
אתן כאן סקירה מאוד קצרה של ההיסטוריה של גישת התוצאה הפוטנציאלית. באופן לא מפתיע, הראשונים שהעלו את הרעיון בהקשר סטטיסטי היו רונלד פישר וג’רזי ניימן. פישר העלה את הרעיון בקצרה במאמר שהופיע ב-1918. הוא דן ברעיון הזה גם בספריו המשפיעים על שיטות מחקר ותכנון ניסויים שיצאו לאור בשנות העשרים של המאה הקודמת. אולם, כפי שרובין הדגיש כאשר נשא את ההרצאה השנתית של שם פישר ב-2004, הרעיון שהעלה פישר לא הבשיל לפורמולציה מתמטית. האדם הראשון שהציע תיאוריה מתמטית של תוצאות פוטנציאליות בהקשר של הסקה סטטיסטית היה ניימן, בעבודת הדוקטורט שלו מ-1923, שנכתבה בפולנית. (( סביר להניח שניימן לא הכיר את המאמר של פישר מ-1918 )) רובין הרחיב את העבודה של ניימן, ומתווה זה מכונה היום בשם Neyman-Runbin Framework, מונח שטבע יהודה פרל, ולעיתים רק בשם מודל הסיבתיות של רובין.
בואו נחזור לאדם שנולד אולי בקוטב הצפוני. אנחנו אולי יכולים לקחת קבוצה של אנשים שנולדו בקוטב הצפוני ולהשוות אותה לקבוצה של אנשים שנולדו במקום אחר, אבל האם נוכל להסיק מכך על סיבתיות כלשהי? התשובה היא לא, לפחות לא על פי מתווה ניימן-רובין. האנשים שנולדו בקוטב הצפוני שונים באופן מהותי מאלה שנולדו באפריקה, למשל.
ניזכר בסטנדרט הזהב להוכחת סיבתיות: ניסוי מבוקר בהקצאה רנדומלית. אם אנחנו רוצים לבדוק האם תרופה כלשהי גורמת לשיפור במצבו של חולה, אנחנו יכולים לערוך ניסוי קליני כדי לבדוק את זה. אם נמצא כי מצבם של החולים שטופלו היה בסופו של דבר יותר טוב ממצבם של החולים שלא טופלו והיוו את קבוצת הביקורת, נוכל להסיק כי התרופה גרמה לשיפור הזה.
מה בדבר מכשירי האידוי לטבק? האם אנחנו יכולים לבצע ניסוי קליני מבוקר בהקצאה רנדומלית כדי לבדוק את ההשפעות הבריאותיות של המכשירים הלאה? אנחנו לא יכולים לעשות את זה, אבל הסיבות לכך הן אתיות, לא יישומיות. סביר להניח שאפשר לערוך ניסוי כזה בצפון קוריאה, אם השלטונות שם יחליטו שזה מעניין אותם.
ומה ההשפעה של מקום הלידה על הגובה של אדם? או ההשפעה של המין הביולוגי של אדם על משהו שמעניין אותנו? אפילו קים ג’ונג און לא יכול לקחת קבוצה של אנשים, ולהקצות למחציתם כרומוזום Y באופן רנדומלי.
בבסיס מתווה ניימן-רובין נמצאת הטענה/אקסיומה שאין סיבתיות ללא התערבות: No causation without manipulation. ההתערבות היא שמאפשרת לנו את היכולת לצפות בתוצאה פוטנציאלית, ואנחנו יכולים להחליט באיזו תוצאה לצפות על ידי ההתערבות שבה ננקוט. אם אנחנו לא יכולים להתערב ולשנות את הגורם שחשוד כגורם סיבתי, אנחנו לא יכולים להחליט באיזה תוצאה פוטנציאלית אנחנו רוצים לצפות. רובין תיאר את זה יפה בהרצאה שנתן כאשר ביקר בארץ לפני כמה שנים: כאשר יש לכם נתונים תצפיתיים ואתם רוצים לבדוק האם גורם כלשהו, עישון למשל, הוא גורם סיבתי, בררו קודם כל אם הייתם יכולים לערוך ניסוי מבוקר בהקצאה רנדומלית כדי לבדוק את זה, אילו הייתם דיקטטורים כל יכולים. אם לא, אין טעם להמשיך הלאה.
כאן רק מתחילות הבעיות.
ניימן ורובין קובעים כי אפקט הוא סיבתי אם התוצאות הפוטנציאליות שונות זו מזו. לדוגמה, אם חולה מבריא אחרי שקיבל את התרופה, ומת אם הוא לא קיבל אותה, אז אנחנו יכולים להסיק כי התרופה גרמה להחלמת החולה.
אבל, אל תשכחו את דייויד יום. גם אם אפשר להתערב ולהחליט באיזו תוצאה פוטנציאלית רוצים לצפות, אנחנו יכולים לצפות רק בתוצאה פוטנציאלית אחת. או שאנחנו נותנים לחולה את התרופה, ואז רואים מה קרה לו לאחר שהוא לקח אותה, או שאנחנו לא נותנים לו אותה ואז אנחנו רואים מה קורה לו כשהוא לא מקבל את התרופה. אי אפשר גם וגם. זוהי הבעיה היסודית של ההסקה הסיבתית – The fundamental problem of causal inference, מונח שטבע פול הולנד ב-1986. אנחנו לא יכולים לצפות באפקט הסיבתי של גורם על אדם.
מה שאנחנו כן יכולים לעשות זה לנסות לצפות באפקט הממוצע באוכלוסייה מסויימת. יש לזה מחיר, או מחירים, שצריך לשלם. הולנד מביא כמה דוגמאות מעניינות במאמר שלו מ-1986. למעשה, בכל פעם שאנחנו מסיקים מסקנה סיבתית כלשהי, כגון “אם לא תלבש סוודר אתה תצטנן”, אנחנו מניחים משהו באופן לא מודע, כדי לעקוף את המחסום של יום. בפוסט הבא בסדרה אסקור את ההנחות המקובלות בהסקה סיבתית מתוך מחקרים תצפיתיים.
מקורות
● Statistics and Causal Inference – Paul W. Holland, 1986
● Causal Inference Using Potential Outcomes: Design, Modeling, Decisions – Donald B. Rubin, 2005
הפוסטים הקודמים בסדרה
כשאנחנו מדברים על הבעיה היסודית של ההסקה הסיבתית, האם אנחנו מדברים ברובד שבו לא ניתן להוכיח *שום* סיבתיות אפילו ברמת האירוע הפיזי הבודד – למשל שיש קשר סיבתי בין הבעיטה שלי בכדור לבין התנועה של הכדור?
אם זה ברובד הזה, אז לכאורה אין שום דרך לעקוף את הבעיה, רק שנדמה לי שזה בקטגוריה של ההנחות הבסיסיות שבלעדיהן אין לנו שום דרך לחקור את העולם, כמו ההנחה שיש מתאם כלשהו בין מה שאנו צופים בו ובין העולם החיצוני, או שיש עקביות כלשהי בעולם.
ואם אנחנו מקבלים שיש סיבתיות *כלשהי* שמיוסדת על האינטואיציות הבסיסיות שלנו, אז הקריטריון העיקרי להוכחת הסיבתיות במקרים מורכבים יותר – אולי הוא נוגע למנגנון שאותו אנו מציעים לסיבתיות ועד כמה הוא סביר ביחס לחלופות?
לפי יום, אין שום דרך להוכיח סיבתיות. לפי פופר, אין דרך להוכיח שום דבר, רק להפריך.
וכל התחום של הסקה סיבתית מתבסס על הנחות שאין שום אפשו להוכיח שהן נכונות, כלומר הכל מתבסס על האמונה שלנו כי ההנחות הן נכונות.