בפוסט זה אסקור מספר תיאוריות והגדרות של סיבתיות הרלוונטיות לנושא של הסקה סיבתית. היריעה, כמובן, רחבה הרבה יותר. סקירה טובה למדי של הנושא, בעיקר מהבחינה הפילוסופית, ניתן למצוא בערך Causality בויקיפדיה האנגלית.
סיבתיות על פי אריסטו
אחת התיאוריות המוקדמות ביותר לסיבתיות, לפחות בתרבות המערבים, היא התיאוריה של אריסטו. לפי אריסטו, סיבתיות היא למעשה התשובה לשאלה “למה?”. באופן מדוייק יותר, השאלה היא “למה דבר מסויים קיים?”. על פי אריסטו, כדי להבין את הסיבתיות, יש צורך לענות על ארבע שאלות שונות, ורק תשובות מלאות לארבע השאלות האלה.
ניקח למשל את השאלה “מדוע בית קיים?” ((ראו Aristotle’s Four Causes ))
השאלה הראשונה היא השאלה החומרית: מאיזה חומר (או חומרים) הבית עשוי? הבית אינו יכול להיות קיים ללא קיומם של לבנים, מלט, עץ וכולי. אבל זה לא מספיק. צריך לשאול גם מי יצר את הבית. זוהי השאלה הפורמלית. כל חומרי הבניין אינם יוצרים בית. כדי שייווצר מהם בית, צריך בנאי שייקח את כל החומרים האלה וייצור מהם בית. כן יש לברר מה הנימוק (( אני לא בטוח שזו המילה העברית הנכונה. הביטוי הוא efficient )) לקיומו של הבית . בדוגמה הזו, צריך חומרים, צריך גם בנאי, אבל כדי שהבית יתקיים צריך גם מישהו שיחליט לקחת את כל חומרי הבנייה ולבנות מהם בית. השאלה האחרונה היא שאלת הסיבה הסופית, או שאלת התכלית. למה מיועד הבית? הבית מיועד לכך שנוכל לגור בו, ולהגן על עצמנו מפגעי מזג האוויר ומדברים נוספים.
כל זה טוב ויפה, אבל הדברים עלולים להסתבך. הביקורת החריפה על מושג הסיבתיות לפי אריסטו נובעת משאלת התכלית. יש תכלית לבית, אבל האם יש תכלית לתחלואה בסרטן? במקרה הזה, קל יחסית לענות על השאלה החומרית. לשאלה הפורמלית יש תשובות חלקיות (עישון למשל), ובמקרה של עישון, המעשן החליט בשלב כלשהו שהוא רוצה לעשן. אבל מהי התכלית של מחלת הסרטן? אתם מוזמנים לנסות לענות.
התיאוריה של אריסטו לא עברה מן העולם. אני מזכיר אותה כאן בגלל ספר שיצא לאור לאחרונה בשם The book of why (( אני ממליץ לקרוא את הספר, אבל בביקורתיות )). הכותב העיקרי של הספר הוא (( שותפו לכתיבה, דנה מקנזי, הוא עיתונאי שסייע לפרל להציג את רעיונותיו בצורה שתתאים יותר לקהל הרחב. המאמרים והספרים שפרל כתב הינם בלתי קריאים לחלוטין )). זוהי התייחסות ישירה לאריסטו, אם כי פרל אינו מספק מתודולוגיה מתמטית/סטטיסטית למציאת תשובות לכל ארבע השאלות, אלא רק לשתיים מהן: השאלה הפורמלית ושאלת הנימוק. אדון בתיאוריה של פרל בהרחבה בהמשך הסדרה.
סיבתיות המבוססת על עולם חלופי (counterfactuals)
על פי הגישה הזו , השאלה שיש לשאול היא “מה היה קורה אילו…?”.

לשאלת הקשר הסיבתי בין עישון ותחלואה בסרטן, יש לבחון שתי אפשרויות. מה יקרה לאדם אם יעשן, ומה שיקרה לו אם הוא אינו מעשן. אם אדם מעשן חולה בסרטן, ואנחנו יכולים להראות כי אילו לא היה מעשן לא היה חולה, נוכל להסיק כי העישון גרם לסרטן. אבל יש כאן בעיה יסודית: אנו לא יכולים לצפות בשתי האפשרויות. אם אדם מעשן, לא נוכל לדעת מה היה קורה לא אילו לו היה מעשן, ולהיפך.
קריטריון זה לסיבתיות הועלה על ידי הפילוסוף במאה ה-18. אני לא אכנס כאן לכל הדיונים הפילוסופיים שנובעים מהתיאוריה של יום, אבל בגדול, השורה התחתונה היא שאי אפשר להסיק סיבתיות, כי אנחנו לא יודעים בביטחון “מה היה קורה אילו”.
אבל מסתבר שיש דרכים לעקוף את הבעיה. אציין כאן מספר אנשים שהתמודדו עם הבעיה הזו, בדרגות שונות של הצלחה ((תיראו מופתעים)) : רונלד פישר, קרל פירסון, אדני יול, וג’רזי ניימן. מי שביסס את תיאוריית המציאות החליפית כמסגרת סטטיסטית להסקת סיבתיות הוא דונלד רובין מאוניברסיטת הרווארד, שהרחיב את הגישה של ניימן. בהמשך הסדרה אתייחס בהרחבה לגישות של פישר ושל רובין.
סיבתיות הסתברותית (( פסקה זו מבוססת על הערך שעוסק בסיבתיות בויקיפדיה העברית. זו לא העתקה. אני כתבתי את תת הערך הזה ))
עד כה הדיון התמקד בסיבתיות דטרמיניסטית: אם A גורם ל-B הרי שאם קורה A אזי B גם הוא חייב לקרות. במובן הזה, מלחמה אינה גורמת למוות, שהרי, תודה לאל, יש אנשים שנלחמו במלחמה או חוו אותה ולא מתו. לפי אותו הגיון עישון אינו גורם לסרטן או מחלות לב, מכיוון שיש אנשים שעישנו כל חייהם ולא חלו בסרטן או במחלת לב. תרופה נגד כאבים אינה גורמת להפסקת הכאב או אף להקלה בו אצל כל אדם הסובל מכאבים, גם אם פעולת התרופה נבדקה בניסויים קליניים.
כתוצאה מכך, הוצע רעיון הסיבתיות ההסתברותית. באופן לא פורמלי, נאמר כי עישון הוא גורם לסרטן אם ההסתברות לאדם יחלה בסרטן כאשר ידוע כי הוא מעשן, גדולה מההסתברות שיחלה בסרטן אם לא ידוע האם הוא מעשן או לא.
הוכחת סיבתיות, גם לפי הגדרה זו, היא קשה. על פי ההגדרה A ו-B הם מאורעות הסתברותיים שאינם בלתי תלויים, אך באופן אמפירי ניתן לצפות בדרך כלל רק (( כאן הכוונה היא למונח הכללי association, ולא למונח הנפוץ correlation שהוא סוג מיוחד של קשר סטטיסטי. זוהי נקודה עדינה שאתייחס אליה בהמשך הסדרה.)) בין שני המאורעות. האמירה הידועה כי “מתאם אינו מעיד על סיבתיות” מבטאת בצורה לא מדויקת את הקושי הזה. אמירה זו טוענת למעשה כי לעולם לא ניתן להסיק סיבתיות מתוך נתונים תצפיתיים. לכן לעיתים הקשר הסיבתי/הסתברותי מבוטא בניסוח מסתייג כגון “עישון הוא גורם סיכון לסרטן”.
גורמים הכרחיים ומספיקים לסיבתיות
ניתן לחלק את גורמי הסיבתיות האפשריים לשלושה סוגים.
הסוג הראשון הוא גורם הכרחי. מצב לא יכול להתקיים אם הגורם לו אינו קיים. אם המצב קיים, אז בהכרח גם הגורם קיים. אולם, המצב אינו חייב להתקיים גם אם הגורם קיים.
לדוגמא, מחלת החצבת נגרמת על ידי נגיף החצבת. הנגיף חייב להימצא בתוך גופו של אדם כדי שיחלה בחצבת, ואם אדם חלה בחצבת, אנחנו יודעים כי הנגיף נמצא בגופו. עם זאת, הימצאותו של נגיף החצבת בתוך גופו של אדם לא מחייבת כי האדם יחלה בחצבת. למשל, אם אדם מחוסן נגד חצבת, הוא לא יחלה. (( כאן יש להבדיל בין “מחוסן” ובין “קיבל חיסון”, וזאת כי יעילות החיסון גבוהה אך אינה מקסימלית. ישנם מקרים, נדירים מאוד, בהם אנשים שקיבלו חיסון נותרו לא מחוסנים מסיבות שונות.))
הסוג השני הוא גורם מספיק. אם הגורם מתקיים, אז גם המצב שהוא גורם יתקיים. אולם, ייתכן כי המצב יתקיים גם ללא נוכחות הגורם, וזאת מכיוון שגורם אחר התקיים.
לדוגמה, אם יורד גשם, אז הדשא שצומח בגינה שליד ביתכם יירטב. אירוע של גשם מספיק כדי להרטיב את הגשם. אבל אם אתם יוצאים מהבית בבוקר ורואים כי הדשא רטוב, ואין לכם כל מידע אחר (( למשל כי ישנתם שינה עמוקה ואינכם יודעים מה קרה בחוץ במשך הלילה )), לא תוכלו להסיק כי ירד גשם. ייתכן והדשא נרטב כי הממטרות פעלו במשך הלילה.
יכול להיות גם גורם שאינו הכרחי וגם אינו מספיק. נניח שאם רוצים לאכול סלט מעגבניות אורגניות שגידלתם בעצמכם בחצר ביתכם. ירידת גשם אינה הכרחית כדי שתוכלו לאכול את העגבניות הפרטיות שלכם. אפשר להשקות. אבל ירידת גשם, אפילו יום יום לאורך כל העונה, אינה מספיקה. כדי שתוכלו לאכול עגבניות מהגינה שלכם אתם גם צריכים לזרוע אותן. אם לא תזרעו עגבניות, שום גשם לא יצמיח אותן.
בהמשך הסדרה נראה איך מושגים אלה קשורים לתיאוריה של פרל.
מה בקשר לגורם שהוא גם הכרחי וגם מספיק? באופן פילוסופי אפשר להתייחס גם לגורם כזה, למען השלמות. אבל אם גורם מסויים הוא גם הכרחי וגם מספיק למצב מסויים, הרי שהוא שקול למצב הנגרם. זה מעניין מבחינה פילוסופית, אבל לא מעשית.