חיפוש באתר

קישורים

עמודים

קטגוריות

ממתאם לסיבתיות – הקריטריונים של ברדפורד היל

בשנת 1965 נעשה הניסיון הראשון להציג מתווה שיאפשר הסקת סיבתיות על סמך מתאם, כאשר סיר אוסטין ברדפורד היל הציג 9 קריטריונים להסקה כזו. בפוסט זה אציג ואדגים את הקריטריונים והביקורת עליהם. לבסוף אביע את דעתי על הרלוונטיות העכשווית של שלהם.

רקע היסטורי


Austin Bradford Hill

היל הציג את מה שהפך להיות מאוחר יותר לרשימת קריטריונים במסגרת הרצאה בפני החברה המלכותית לרפואה בשנת 1965. חלק גדול מהדברים שנאמרו בהרצאה הסתמכו על עבודתו בדבר הקשר בין עישון ותחלואה בסרטן בריאה[1]. היל ידע כמובן כי סטנדרט הזהב להוכחת סיבתיות הוא ניסוי מבוקר בהקצאה רנדומלית. הוא היה הסטטיסטיקאי בצוות שתיכנן וביצע את ניסוי הסטרפטומיצין ב-1945, שהיה הניסוי הקליני הראשון שבו הייתה הקצאה רנדומלית של הטיפול. היל כמובן גם ידע היטב כי ניסויים כאלה אינם תמיד אפשריים, וניסה ליצור מסגרת עבודה למחקרים תצפיתיים: מחקרים בהם לא ניתן לקבוע לאיזו קבוצה ישתייך איזה נבדק, והקבוצות נוצרות מעצמן.
כותרת ההרצאה והמאמר שבו פורסם תמליל ההרצאה[2] הציגה במפורש את השאלה “מתאם או סיבתיות?”. בהרצאה היל נמנע מלהגדיר מהי סיבתיות או אפקט סיבתי. הוא ציין במפורש כי אין לו את ההכשרה הדרושה כדי לדון במשמעויות הפילוסופיות של מושג הסיבתיות, והבהיר כי יימנע מלעסוק בכך. היל גם לא התיימר לקבוע קריטריונים כלשהם. הוא הציע תשע נקודות מבט על הנושא הסבוך של מתאם וסיבתיות. עם זאת, נקודות המבט שהציע הפכו במהרה לרשימת קריטריונים ול-“צ’קליסט”, כאשר כל סימן V מחזק את הטענה לקשר סיבתי. למרות שהיל כאמור לא התייחס לרשימה שלו כאל רשימת קריטריונים, אני אתייחס אליהם ככאלה בהמשך.
כמו כן, אציין כי ההתייחסות של היל לנושא הייתה בקונטקסט של רפואה ובריאות הציבור. בדיקת קיום הקריטריונים בהקשרים אחרים אינה בלתי אפשרית, כמובן, אך לא אתייחס לכך כאן .

הקריטריונים

קריטריון הראשון של היל הוא קריטריון העוצמה (strength), והכוונה היא לעוצמת הקשר הסטטיסטי[3] בין שני המשתנים – משתנה הסיבה ומשתנה התוצאה. ההנחה היא שאם עצמת הקשר חזקה אז פחות סביר שיש גורמים שלא נצפו המשפיעים על עצמת הקשר הסטטיסטי, ואם יש כאלה אז השפעתם מוגבלת[4]. מאידך, הסביר היל, ניתן פעמים רבות להסביר קשר חלש על ידי הטיות בנתונים. היל ציין כי קשר סטטיסטי חלש אינו שולל את קיומה של סיבתיות, וקיימות דוגמאות לכך.[5]. קל גם למצוא דוגמאות בהן יש קשר סטטיסטי חזק ללא קשר סיבתי.

הקריטריון השני הוא עיקרון העקביות (consistency). היל הסביר כי מידת הביטחון בהסבר סיבתי גדלה כאשר עדויות לקשר מתקבלות ממספר מקורות, כלומר מחקרים שונים, עם תכנונים מחקריים שונים ושנערכו בקרב אוכלוסיות שונות. עם זאת ציין היל כי חוסר עקביות לא שולל בהכרח קשר סיבתי, ואין לקפוץ למסקנה כי קשר סיבתי אינו קיים. חוסר עקביות יכול להוביל לתובנות חדשות[6] ודורש מחקר נוסף. בראש המבקרים של קריטריון זה ניצב רונלד פישר[7], בעיצומו של הויכוח על הקשר בין העישון והתחלואה בסרטן הריאות. פישר טען, במידה רבה של צדק, שאם קיימת הטיה בסיסית, אז קיום מספר מחקרים אינו מבטל את ההטיה. פישר הציע מודל משלו לקשר בין העישון והסרטן, והמודל הזה סתר את המסקנות של היל ושל אחרים בדבר קיום הקשר הסיבתי בין שני משתנים אלה.

הקריטריון השלישי הוא עיקרון הייחודיות או הסגוליות (specifity). זהו הקריטריון הכי שנוי במחלוקת מבין התשעה. פרשנות אחת שלו אומרת כי סיבתיות הינה הסבר סביר כאשר מתמקדים באוכלוסיה מסויימת, איזור מסויים וכדומה. דוגמה לכך יכולה להיות תחלואה בסרטן הריאה בקרב מנקי ארובות בלונדון. אך ניתן לפרש את דבריו של היל גם באופן אחר. לפי פרשנות זו, היל טען כי יש לדרוש כי לגורם אחד יש תוצאה אפשרית אחת ולהיפך. זה בודאי לא נכון באופן כללי, והיל עצמו ציין זאת ונתן דוגמאות. עם זאת, הדבר בהחלט ייתכן תחת המיקוד שהוזכר קודם. בכל מקרה, גם היל הבהיר בדבריו כי זהו הקריטריון החלש ביותר מבין התשעה.

הקריטריון הרביעי הוא עיקרון הזמניות (temporality). הגורם הסיבתי חייב לקרות לפני התוצאה. קשה להתווכח על זה. כמובן, שאם תוצאה מתרחשת לאחר שמתרחש אירוע כלשהו, אי אפשר להסיק מכך שהאירוע גרם לתוצאה.

הקריטריון החמישי הוא קריטריון הגרדיאנט הביולוגי, המבטא את עצמת התגובה. לפי היל, אם כאשר מינון הגורם גבוה יותר גם התוצאה או עוצמתה גבוהה יותר, סביר יותר כי קיים קשר סיבתי. אחת הדוגמאות שהביא היל היא שהסיכון לחלות בסרטן הריאה גבוה יותר עבור מי שמעשן יותר. יש המפרשים את דבריו של היל כדרישה לקשר מונוטוני רציף בין המשתנים[8]. גם קריטריון זה לא חייב בהכרח להתקיים. למשל, לצריכת קפאין במידה סבירה יש יתרונות בריאותיים, ולכן אם נתבונן בתחלואה העשויה להיגרם מצריכת קפאין, נצפה בתחילה בירידה הסיכון לתחלואה, ורק לאחר מכן בעליה, כלומר הקשר לא מונוטוני אלא בצורת האות האנגלית J. היל לא התייחס לאפשרות הזו או לאפשרויות אחרות.

הקריטריון השישי הוא עיקרון הסבירות (Plausibility). למעשה הכוונה היא שניתן להצביע על מנגנון (ביולוגי) שבאמצעותו נותר הקשר בין הגורם ובין התוצאה. זהו למעשה אחד הקריטריונים של אריסטו. שוב, הקריטריון הזה לא הכרחי[9]. ייתכן שהמנגנון קיים אבל אנחנו עדיין לא יודעים מהו. אבל אם אנחנו כן יכולים להצביע על מנגנון אפשרי, זה מחזק את רמת הביטחון שלנו בקיומו של הקשר הסיבתי.

הקריטריון השביעי הוא עיקרון הקוהרנטיות. פרשנות של תצפית חדשה כגורם ותוצאה לא אמורה לסתור את הידע הקודם. כך למשל, אילו היו בידינו בסוף שנות ה-40 של המאה הקודמת ותחילת שנות ה-50 נתונים על פיהם עישון אינו גורם לתחלואה בסרטן, היה עלינו לספק הסבר טוב לנתונים החדשים המראים את ההיפך. שוב, קיום הקריטריון הזה אינו הכרחי: הרבה פעמים מתגלים דברים חדשים שלאורם מה שידענו קודם מתברר כלא נכון. עיקרון הקוהרנטיות נוסח בצורה יפה על ידי קארל סייגן: טענות יוצאות דופן צריכות להיתמך בעדויות יוצאות דופן. או אם נחזור לניסוח של ברדפורד היל: עדויות חדשות לא אמורות לסתור בצורה חמורה ידע קודם, ואם יש סתירה כזו, יש לבחון היטב מדוע זה קרה.

הקריטריון השמיני הוא עדות ניסויית (experimental evidence). יש מחלוקת גם בדבר הפרשנות לקריטריון הזה. היל התייחס לכך בקצרה. עדויות ניסוייות יכולות בודאי להתקבל מניסויים בחיות בתנאי מעבדה. היל גם התייחס למקרה בו אנשים מפסיקים לעשן. ככל הנראה התכוון כאן למחקר תצפיתי בו יושוו אנשים שהפסיקו לעשן לכאלה שממשיכים לעשן.

הקריטריון התשיעי והאחרון הוא קריטריון האנלוגיה. היל הביא את כדוגמה את מחלת האדמת והתרופה תאלידומיד, שלשתיהן יש השפעה חמורה על עוברים. לכן, אם מתגלה עוד תופעה דומה של מומים בלידה, כדאי לחפש מחלה או טיפול העלולים לגרום לכך. דוגמה אחרת היא עישון פאסיבי. כאן יש אנלוגיה בין תחלואה בסרטן עקב עישון ותחלואה בסרטן עקב הימצאות בסביבה בה אנשים אחרים מעשנים.

המשמעות של הקריטריונים

אין להבין כי אם כל הקריטריונים “מתקיימים” באופן כלשהו אז יש קשר סיבתי. הקריטריון ההכרחי היחידי הוא קריטריון הטמפורליות: הגורם הסיבתי חייב להתרחש לפני התוצאה. היל עצמו הבהיר כי ייתכנו מצבים בהם יש קשר סיבתי ולמרות זאת הקריטריונים אינם מתקיימים או מתקיימים באופן “חלש”. גם ההיפך נכון. ייתכנו מצבים בהם נראה כי הקריטריונים מתקיימים למרות שאין קשר סיבתי. הדברים האלה מתקשרים ישירות אל דייויד יום שטען כי אין אפשרות להוכיח קיום של קשר סיבתי.

הרלוונטיות העכשוית של הקריטריונים

ברור למדי כי הקריטריונים כפי שנוסחו לפני יותר מ-50 שנה אינם ניתנים כיום ליישום כפי שהם. זה נכון בעיקר לגבי העיקרון השישי הוא עיקרון הסגוליות והעיקרון התשיעי הוא עקרון האנלוגיה, שתמיד נחשבו ל-“חלשים”.
הקשר בין הגורם והתוצאה אינו עוד קופסא שחורה כפי שהיה בימיו של היל. אנו יודעים כיום כי כמעט תמיד יש תהליכים מסובכים מתחת לפני השטח, כך שלמשל הטענה “עישון גורם סרטן” שוב אינה מדוייקת, ולמעשה אף פעם לא הייתה נכונה במובן דטרמיניסטי אלא רק במובן הסתברותי. (הבהרה: אין להסיק מדברי כי עישון אינו גורם לסרטן). אל העישון מצטרפים גורמים נוספים שאינם גלויים לעין, וצירוף ההשפעות של כל הגורמים האלה, שחלקם עדיין לא מוכרים לנו הוא שוביל לבסוף לתוצאה של סרטן[10]. מכאן עולה החשיבות הרבה של עיקרון הסבירות, והיותו רלוונטי גם במאה ה-21.

נהוג כיום לחלק את העדויות לקשר סיבתי לשלוש קבוצות:

הקבוצה הראשונה כוללת עדויות ישירות לכך שקשר הסתברותי/סטטיסטי בין הגורם לתוצאה אינו “קשר אקראי”, כלומר אינו “spurious correlation”. עדויות אלה קשורות לעצמת הקשר הסטטיסטי, וליכולת לבצע ניסויים שיתמכו בהשערת הסיבתיות[11]. גם קריטריון של הגרדיאנט הביולוגי שייך לקבוצה זו.

הקבוצה השלישית כוללת עדויות מקבילות התומכות בהשערת הסיבתיות המתקבלות ממחקרים הדומים או קשורים לנושא הנדון ומראות תוצאות דומות. לקטגוריה זו נכנסים הקריטריונים של העקביות, הקוהרנטיות והאנלוגיה.

כפי שאנו רואים, חלק מהקריטריונים של היל משתבצים לתוך שלוש הקבוצות, אך לא כולם. לדעתי לא ניתן גם כיום לוותר על רוב הקריטריונים של היל. אין ספק שלעדויות הישירות יש תפקיד מכריע ולא ניתן לוותר עליהן. באשר לעדויות התהליכיות: אין לזלזל בחשיבותן, אבל עדיין ניתן לבסס קשר סיבתי ללא הבנת התהליכים המקשרים בין הגורם לתוצאה, למשל על ידי ביצוע ניסוי קליני מבוקר בהקצאה רנדומלית. חוסר בעדויות תהליכיות אינו מספיק כדי לשלול את קיומו של קשר סיבתי.

באשר לעדויות המקבילות – עקרון העקביות הוא אחד העקרונות החשובים ביותר, בייחוד לאור משבר השחזוריות מולו ניצב כיום המחקר המדעי, ובודאי שלא ניתן לוותר עליו.

הפוסטים הקודמים בסדרה


הערות
  1. אדון בנושא זה בהרחבה בהמשך הסדרה []
  2. כנהוג בחברות המדעיות בבריטניה []
  3. אתם בודאי שמעתם על מקדם המתאם של פירסון, אולם יש עוד מדדים רבים המאפשרים לבטא ולמדוד קשר סטטיסטי []
  4. רעיון זה מבוטא מתמטית על ידי אי-שיוויון קורנפילד []
  5. אולם, האם תיתכן סיבתיות כאשר אין קשר סטטיסטי בכלל, כלומר האם יש “סיבתיות ללא מתאם”? גם בשאלה זו אדון בהמשך הסדרה []
  6. למשל, קיום אפשרי של גורם נוסף שלא נלקח בחשבון []
  7. שאמנם נפטר כשלוש שנים לפני שהיל הציג את הקריטריונים שלו []
  8. סליחה []
  9. אם כי יהודה פרל טוען כי זה הדבר היחידי ההכרחי, וגם המספיק, כדי להוכיח סיבתיות []
  10. עוד הבהרה: אין לפרש את דבריי כטענה שהתהליך הגורם לתחלואה בסרטן הוא תהליך דטרמיניסטי []
  11. נושא שאדון בו בהמשך בהקשר לתיאוריה של דונלד רובין), וכמובן הקריטריון הטמפורלי.

    הקבוצה השניה כוללת עדויות תהליכיות (מכניסטיות) אשר שופכות אור על התהליך שמקשר בין הגורם או הגורמים המובילים לתוצאה (( נושא שאדון בו בהמשך בהקשר לתיאוריה של יהודה פרל []

רנדומיזציה – לא הכל זהב

בפוסט הקודם ראינו כי סטנדרט הזהב להוכחת סיבתיות הוא ביצוע ניסוי מבוקר בהקצאה רנדומלית. אבל לפעמים אי אפשר לערוך ניסוי כזה, או שהדברים עלולים להשתבש. בפוסט הזה אסקור מספר מגבלות החלות על ניסויים כאלה.

הקצאה רנדומלית היא בלתי אפשרית

המגבלה הראשונה היא שלפעמים אי אפשר לבצע הקצאה רנדומלית. דוגמה פשוטה: נניח שאם רוצים לבדוק מהם ההבדלים בין גברים לנשים ביחס למצב רפואי כלשהו. אתם לא יכולים לקחת קבוצה של בני אדם ולקבוע על ידי הטלת מטבע מי מהם יהיה גבר ומי תהיה אישה. נקודה. באופן דומה, אם אתם רוצים, נניח, להשוות בין חולי סכרת לבין אנשים בריאים, אין לכם אפשרות לקבוע מי יהיה חולה ומי בריא. הקצאה רנדומלית היא פשוט בלתי אפשרית.

יש עוד מצבים בהם אי אפשר לבצע הקצאה רנדומלית. למשל, אם אתם רוצים ללמוד על ההבדלים בין מעשנים ולא-מעשנים, בין צמחונים ללא-צמחונים, או בין אנשים שמבצעים פעילות גופנית אופן קבוע ובין אלה שלא. נכון, אילו הייתם דיקטטורים כל יכולים, לא הייתה לכם בעיה לבצע ניסויים כאלה. לדיקטטור כל יכול יש את האפשרות לקבוע מי ייאלץ לעשן, ועל מי ייאסר לעשן. אבל, לפחות אצלנו, אין דיקטטורים כאלה. צריך למצוא דרך אחרת להשוות בין מעשנים ולא מעשנים.

הקצאה רנדומלית אינה אתית

המגבלה השניה היא שיש מצבים בהם ניסוי בהקצאה רנדומלית אינו אתי. כאן אני מבדיל בין אתיקה “רכה” ואתיקה “קשה”. אם פיתחתם טיפול חדש למחלה כלשהי אתם צריכים לבצע סדרה של ניסויים קליניים, בהקצאה רנדומלית כמובן, כדי לבדוק את יעילותו ואת היקף תופעות הלוואי.[1] הנה השאלה: איזה טיפול תקבל קבוצת הביקורת? אם אין עדיין טיפול יעיל למחלה, אז קבוצת הביקורת תטופל מן הסתם בפלסבו. אבל אם יש כבר טיפול יעיל אחר, מתן פלסבו לקבוצת הביקורת אינו אתי. זוהי “אתיקה רכה”. אפשר לבצע את הניסוי, אבל תחת מגבלות אתיות. כאן ההחלטה היא קלה יחסית, אם כי לא חפה משאלות אתיות נוספות.

אבל יש גם “אתיקה קשה”. בניסויים קליניים לטיפולים בסרטן או במחלות נדירות הגורמות נזקים בריאותיים חמורים במיוחד, אין הקצאה רנדומלית, גם אם יש טיפולים אחרים בנמצא. יש לכך שתי סיבות. הראשונה היא שאם אין טיפול אחר בנמצא, אין זה מוסרי למנוע טיפול אפשרי מהחולים האלה, גם אם יעילותו עדיין מוטלת בספק. הסיבה השניה היא שגם אם יש טיפול אחר בנמצא, והחולה לא קיבל אותו מסיבות כלשהן או קיבל אותו ולא חל שיפור במצבו, עדיין אין זה מוסרי למנוע ממנו טיפול אחר/נוסף העשוי לשפר את מצבו הבריאותי. היכן עובר הקו? למרבה הצער אין לכך תשובה ברורה. ניסויים רבים לבחינת טיפולים למחלת בוצעו בהקצאה רנדומלית.

ובכל זאת, במצבים רפואיים ההחלטה קלה יחסית אם כי עדיין עולות שאלות. למשל, אם אין טיפול בנמצא, למה לא לתת את הטיפול לחולים היותר קשים, להם הטיפול יועיל יותר אם הוא אכן יעיל? השאלה הזו עולה גם כחורגים לתחומים אחרים, כגון הפעלת תכנית חינוך חדשה או ניסוי לבדיקת גישה כלכלית או חברתית חדשה. הסטטיסטיקה אומרת כמובן שיש לבצע הקצאה רנדומלית. אבל יש רבים שתוהים האם הקצאה רנדומלית בניסויים מסויימים היא אתית, וביניהם יש בהחלט גם סטטיסטיקאים.

ההקצאה אינה מאוזנת

גם כאשר רנדומיזציה הינה אפשרית ואתית דברים עלולים להשתבש. תוצאת הרנדומיזציה עלולה להיות לא מאוזנת. בואו נחזור לדוגמת השדה מהפוסט הקודם. אתם רוצים לבחון את ההשפעה של שני סוגי דשן על יבול תפוחי האדמה. כפי שרונלד פישר הסביר, אתם מחלקים את השדה ל-36 ריבועים, ובוחרים באופן מקרי 18 ריבועים שאותם תדשנו בדשן א, ואת 18 הריבועים האחרים תדשנו בדשן ב. הבעיה: יש סיכוי כי כל 18 הריבועים של דשן א יהיו בחלק העליון של השדה המשופע, ו-18 האחרים יהיו בחלק התחתון של השיפוע, המקבל יותר מים. בעיה. אפילו אם רק רוב הריבועים של דשן א יהיו בחלק העליון של השדה, עדיין תקפות הניסוי תהיה בספק. ההסתברות כי בחלק העליון של השדה החלוקה בין הדשנים תהיה 13-5 או גרוע מכך היא כמעט 10%. במקרה כזה, אמר פישר, אני פשוט אצא מהחדר, אחזור, ואבצע את הרנדומיזציה מחדש.

אבל יש כמובן דרכים יותר מתוחכמות להימנע ממצבים כאלה, ופישר אכן הציע פתרון יותר מעשי: רנדומיזציה לפי בלוקים. אפשר למשל לבצע רנדומיזציה בין הדשנים עבור החלק העליון של השדה, ועוד רנדומיזציה עבור החלק התחתון של השדה. בצורה כזו תבטיחו כי בכל חלק של השדה יהיו 9 חלקות שידושנו בדשן א ו-9 חלקות שידושנו בחלק ב.

ההקצאה לא מיושמת בפועל

זוהי הבעיה הגדולה ביותר. ייתכן כי לאחר שביצעתם את הרנדומיזציה של חלקות השדה, מישהו ישכח לדשן את אחת החלקות. או שבחלקה אחת ישימו יותר דשן מאשר בחלקה אחרת. או שדשן מסוג אחד יגלוש לחלקה הסמוכה שאמורה להיות מדושנת בדשן מהסוג השני. אפשר לחשוב על עוד כל מיני בעיות שיכולות לקרות בדישון שדה, או בטיפול בעכברים[2] . אבל בדברים כאלה קל יחסית לטפל.

הבעיה העיקרית היא כאשר מנסים לבצע ניסוי[3] בבני אדם. יש המון דברים שיכולים להשתבש ואין שום שליטה עליהם. בניסוי קליני, יהיו חולים שלא ייקחו את כל התרופות שעליהם לקחת על פי הפרוטוקול של הניסוי. או שלא יתייצבו לבדיקות. או שיחליטו לממש את זכותם לפרוש מהניסוי. וחולה שמחליט לפרוש מהניסוי יכול לבוא ולבצע את זה בצורה מסודרת ולאפשר בדיקות אחרונות, או פשוט להיעלם.

בניסוי שנועד לבדוק טיפול לאיידס שנערך בסן פרנסיסקו בשנות ה-90, מחצית מהחולים שוייכו לקבוצת הטיפול על ידי רנדומיזציה, והמחצית שניה קיבלה טיפול בפלסבו.[4] החולים כמובן לא ידעו מי קיבל את הטיפול האמיתי ומי קיבל את הפלסבו, וכולם, כמובן, רצו לקבל את הטיפול הפעיל. הפתרון היצירתי: זוגות של חולים החליפו ביניהם את מחצית מלאי התרופות שקיבלו. אם שני החולים קיבלו את הטיפול הפעיל, לא קרה כלום. אחרי ההחלפה עדיין שניהם מקבלים את הטיפול הפעיל. אותו הדבר קורה אם שניהם קיבלו את הפלסבו. אבל אם חולה אחד קיבל טיפול פעיל והשני פלסבו, אז אחרי ההחלפה אצל כל אחד מחצית מהכדורים הם כדורים פעילים, ומחצית מהכדורים הם כדורי פלסבו. ההיגיון: עדיף לקבל טיפול במינון נמוך מאשר לא לקבל טיפול כלל. ומכיוון שאיש אינו יודע אם בידיו תרופה פעילה או פלסבו, לשני הצדדים יש אינטרס לבצע את ההחלפה.

התרגיל הזה הפך את הניסוי לניסוי שבו יש בפועל 3 קבוצות: קבוצה שקיבלה טיפול מלא, קבוצה שקיבלה טיפול במינון חלקי, וקבוצת פלסבו. אבל איש אינו יודע כעת מי שייך לאיזו קבוצה. הניסוי נכשל, כייוון שהתוצאות שהתקבלו חושבו תחת ההנחה שיש בניסוי שתי קבוצות כפי שתוכנן. לאחר שנודע דבר הכשלון, חלק מהחולים סיפרו לחוקרים אודות ההחלפות שבוצע[5]. האם היה אפשר להימנע מהבעיה הזו אילו כל החולים היו מקבלים טיפול פעיל, בשני מינונים שונים? ייתכן מאוד שכן.

סיכום

כל אחת הבעיות שתוארו כאן שוללות את התקפות של הניסוי אם הן מתרחשות. הדרך הטובה ביותר להימנע מהן היא לחשוב מראש על כל האפשרויות ולתכנן את הניסוי בהתאם, אבל זה לא תמיד אפשרי. כמו כן, כפי שראינו, יש מחסומים שפשוט אי אפשר לעבור. לכן יש לחפש דרכים אחרות כדי לקבוע האם קיים קשר סיבתי.

הפוסטים הקודמים בסדרה

הפוסטים הבאים בסדרה

 

 

 


הערות
  1. להזכירכם, עד תחילת שנות ה-50 של המאה ה-20 ניסויים קליניים בהקצאה רנדומלית נחשבו לניסויים לא אתיים. []
  2. וראיתי מספר לא מבוטל של בעיות כאלה []
  3. אתי כמובן []
  4. לא הצלחתי למצוא את הרפרנס לניסוי הזה. את הסיפור שמעתי מפרופסור ברני בלאק מאוניברסיטת נורת’ווסטרן []
  5. ייתכן שעדיין ניתן לבצע תרגילים סטטיסטיים כדי ללמוד משהו על יעילות הטיפול, אבל התקפות של המסקנות תהיה מוגבלת יותר []

עוד שימוש מפתיע לרנדומיזציה: קבלת החלטות

לפני שבוע, הצייצן eSivion העלה סקר לא שגרתי בטוויטר, בו ביקש מהמשיבים להצביע כך התפלגות התשובות לסקר תהיה 10% לתשובה א, 20% לתשובה ב, 30% לתשובה ג ו-40% לתשובה ד:

הניסוי הצליח![1]

איך עושים את זה, או יותר נכון, איך הציבור הצליח לעשות את זה?

אחת המגיבים לסקר סיפק ספוילר כחצי שעה לאחר שהסקר פורסם:

 

טוב, אני לא יודע עד כמה הספוילר הזה השפיע על התוצאה הסופית. אומר רק שאני נתבקשתי לחוות את דעתי כמה דקות אחרי שהסקר עלה, ועניתי שאתייחס רק לאחר שהוא הסתיים. התשובה אל אותו ליאור היא אכן הדרך הנכונה להגיע להתפלגות שרוצים: רנדומיזציה, אם כי אני הייתי ממליץ על ספרת היחידות של השניות, או על מחוג השניות.

לפני כמה ימים כתבתי על רנדומיזציה בהקשר על ניסויים מבוקרים, אבל רעיון הרנדומיזציה טוב גם לדרים אחרים, כמו להשיג תוצאה מסויימת בסקר של טוויטר. אבל…

אם תצפו במשחקי טניס מקצוענים, תראו שרבים מן השחקנים עונדים שעון יד. זה לא בהכרח בלל שהם ממהרים לאן שהוא, ורוצים לסיים את המשחק בהתאם לתוכניות שלהם[2]. כאשר מגיע תורו של שחקן טניס לחבוט את חבטת הפתיחה, יש לו בגדול שתי אפשרויות: לחבוט ימינה או לחבוט שמאלה[3] . אם יחבוט כל הזמן ימינה, היריב ייערך בהתאם, וזה גם מה שיקרה אם יחבוט כל הזמן שמאלה. גם אם יחבוט ימינה ושמאלה לסירוגין, היריב יעלה על זה מהר מאוד. חייבים לשמור כל הזמן על יתרון ההפתעה. איך עושים את זה? מציצים בשעון. אם מספר השניות שעברו בדקה הנוכחית קטן משלושים, חובטים ימינה. אחרת – חובטים שמאלה. כך ליריב לא תהיה דרך טובה לחזות לאן תיחבט החבטה הבאה.

זה קורה גם בבייסבול. כאן יש פיצ’ר, שהוא השחקן שזורק את הכדור לעבר החובט. יש כל מיני סוגי זריקות שהפיצ’ר יכול לזרוק: כדור מהיר, כדור מסובב, וכדומה. אם החובט יודע מראש איזה סוג זריקה יזרוק הפיצ’ר, זה ישפר את סיכוייו לחבוט בכדור[4].

הפתרון הוא כמובן לזרוק את הכדור באופן שיקשה על החובט לנחש מראש מה יהיה סוג הזריקה. אפשר לעשות את זה על ידי רנדומיזציה, למשל על ידי מבט מהיר בשעון. גרג מאדוקס, אחד מגדולי הפיצ’רים בכל הזמנים, סיפר כי הוא השתמש בשיטה הזו כדי לקבל החלטות באשר לזריקה שאותה יזרוק. זה כמובן לא מספיק, כדי להיות כמו גרג מאדוקס צריך גם כשרון נדיר, אבל הרנדומיזציה בודאי שלא הזיקה לא.


הערות
  1. אם כי מבחן כי בריבוע מראה כי ההתפלגות של ההצבעות שונה באופן מובהק סטטיסטית מההתפלגות לה קיווה אי-שיוויון []
  2. כמו שקרה בסרטו של אלפרד היצ’קוק זרים הרכבת []
  3. אני מפשט קצת את הדברים []
  4. גם ככה הסכוי לחבוט נמוך למדי. החובטים הממש טובים מצליחים לחבוט בכדור בכ-30% מהפעמים []

סטנדרט הזהב להוכחת סיבתיות

אז איך מוכיחים סיבתיות? התשובה בשלוש מילים: עורכים ניסוי מבוקר.

אבל: התשובה המלאה כוללת עוד שתי מילים.

מי שמעוניין בהסבר מפורט ו/או לדעת איזה מילים חסרות לתשובה המלאה, מוזמן כמובן להמשיך לקרוא.

ניסוי מבוקר הוא תהליך שבו החוקר שולט בכל התנאים של הסביבה המעניינת אותו. לדוגמה, אם מושא המחקר שלכם הוא עכברים, אתם יכולים לשכן את העכברים שלכם בכלוב במעבדה, וכך אתם יכולים לשלוט על טמפרטורת החדר, רמת התאורה וכדומה. המונח באנגלית לשליטה בתנאי הסביבה הוא “control”, ומונח זה תורגם לעברית על ידי המילה “בקרה”, ומכאן השם ניסוי מבוקר.

אם אתם רוצים לבדוק כיצד טמפרטורת החדר משפיעה למשל על רמת הפוריות של העכברים שלכם, אתם יכולים, לכאורה, לשנות אותה ולראות מה קורה. הבעיה: אם אתם מעלים את טמפרטורת העכברים, אתם לא תראו מה היה קורה אילו לא העליתם אותה. זוהי בעיית המציאות החלופית[1]. אתם יכולים לפתור את הבעיה הזו בקלות יחסית. קחו שני כלובים. דאגו לכך שהתנאים בשני הכלובים יהיו זהים, פרט לטמפרטורת החדר. אתם יכולים לעשות את זה על ידי כך שתשימו כל כלוב החדר אחר, והתנאים שבשני החדרים יהיו זהים, פרט לטמפרטורה. בחדר אחד תהיה הטמפרטורה ה-“רגילה”, ובחדר השני תהיה טמפרטורה שונה. כך תוכלו להשוות את התוצאות המתקבלות בשני החדרים. אם יש שוני בין התוצאות, הוא חייב להיגרם על ידי שינוי הטמפרטורה, מכיוון שזהו ההבדל היחיד בין שני החדרים. נהוג לכנות את העכברים שבחדר שבו שונתה הטמפרטורה בשם “קבוצת הניסוי”, ואת העכברים שהיו בחדר בו שררה הטמפרטורה הרגילה  בשם “קבוצת הביקורת”.

התובנה החשובה ביותר בניסוי שתיארתי היא שהחוקר ביצע את שינוי הטמפרטורה, ומתוך כך הסיק שטמפרטורת החדר גורמת (או שאולי לא גורמת) לשינוי בפוריות העכברים. זה שונה לחלוטין ממצב בו החוקר צופה בשתי אוכלוסיות עכברים החיות בסביבות דומות, אך יש הבדלים בטמפרטורת בין שתי הסביבות. זה שונה גם ממצב שבו המדען נסע לחופשה, חזר למעבדה כעבור מספר שבועות כדי לגלות שטמפרטורת החדר השתנתה (אולי המזגן התקלקל) ובמקביל היה שינוי בפוריות העכברים (אולי היו בכלוב יותר גורי עכברים ממה שהיו אמורים להיות, אולי פחות). מהתצפית הזאת אי אפשר להסיק סיבתיות, לפחות לא באופן ישיר. הקביעה כי קיים גורם סיבתי נובעת ממה שהחוקר עשה, ולא ממה שהוא צפה בו. התיאוריה של יהודה פרל מתבססת על ההבחנה הזו.

כתבה מעניינת שפורסמה החודש במגזין דיסקובר מדרגת את עשרת הניסויים המדעיים החשובים ביותר בכל הזמנים. אני ממליץ בחום לקרוא את הכתבה הזו, ומציע לכם לחשוב אלו ניסויים מבין העשרה היו או אמורים להיות ניסויים מבוקרים ואלו לא.

אני רוצה להזכיר גם כי ניסוי לא חייב לשנות רק גורם אחד. ניתן, וכמעט תמיד רצוי לשנות כמה גורמים במקביל, מכיוון שבדרך כלל יש יחסי גומלין (אינטראקציות). כתבתי על כך בהרחבה בפוסט סטטיסטיקה רעה: לא לתכנן.

עד כאן הכל טוב ויפה, עד שמישהו מעצבן שיושב בשורה האחרונה מרים את היד ומבקש לשאול שאלה. האם באמת התנאים בשני החדרים היו זהים פרט לשוני בטמפרטורה? זו שאלה רטורית. התשובה היא לא. קודם כל, אלה חדרים שונים. אולי דומים מאוד, אבל לא זהים. בניסוי הזה הנחנו שאין הבדלים בין החדרים. אולי חדר אחד יותר קרוב לנתב האלחוטי וספג לכן יותר קרינה? אולי פשוט בחדר אחד שיעור הנקבות בקרב העכברים היה שונה משיעורן בקרב העכברים שבחדר השני? ואולי יש סיבה שלא חשבנו עליה? המון דברים יכולים לקרות.

שוב, יש בעיות שאפשר לפתור. אם אנחנו חושבים שזה חשוב, אפשר אולי להזיז את הראוטר למקום שבו הוא יהיה המרחק שווה בערך משני החדרים, או לבחור שני חדרים שמרחקם מהראוטר שווה. או שאולי אנחנו מניחים כי יש סבירות גבוהה לכך שהקרינה מהראוטר אינה משפיעה על שיעורי פוריות מכיוון שהיא נמוכה.[2]  לדאוג ששיעורי הנקבות בשתי הקבוצות יהיו שווים – אין בעיה. אבל יכולים לקרות עוד הרבה דברים אחרים, בוודאי בניסויים יותר מסובכים שבהם יש הרבה מאוד גורמים היכולים להשפיע על תוצאת הניסוי.[3]

הבעיה היא שיש דברים שלא קל ואי אפשר לטפל בהם. אלה יכולים להיות דברים שאנחנו לא יכולים לשלוט בהם, כמו מזג האוויר למשל, או דברים שאנחנו כלל מודעים לקיומם. אז מה עושים?

רונלד פישר מצא את הפתרון: הקצאה רנדומלית. אלה שתי המילים החסרות.

רונלד פישר

רונלד פישר

בראשית דרכו, פישר היה חוקר בתחנת המחקר החקלאית ברותהמסטד, מכון המחקר החקלאי המודרני הראשון, שנוסד ב-1843. בין היתר, החוקרים ניסו לבדוק את מידת ההשפעה של דשנים שונים על כמות היבול. חוץ מהדשנים, יש כמובן עוד גורמים המשפיעים על כמות היבול, כגון מזג האוויר, סוג הקרקע, מיקום הצמחים בשדה[4] וכדומה. מה עושים?

אי אפשר לקחת שני שדות ובכל אחד מהם לנסות דשן אחר, כי השדות שונים. לקחת שדה אחד ולחלק אותו לשניים? אלה שוב שני שדות, רק קטנים יותר. אז אולי ניקח שדה אחד, השנה נדשן אותו בדשן א ובשנה הבאה בדשן ב? בכל שנה יש מזג אויר אחר. ועדיין לא דיברנו על כך שלא כל הצמחים זהים.

פישר הציע לחלק את השדה ליחידות קטנות ושוות, ולקבוע באופן מקרי איזה סוג דשן תקבל כל יחידה. אם נניח שהשדה חולק ל-36 ריבועים קטנים, נבחר באופן מקרי 18 ריבועים ונדשן אותם בדשן א, ואת 18 הריבועים האחרים נדשן בדשן ב. הטכנולוגיה בה הוא השתמש כדי לקבוע מה תהיה ההקצאה הרנדומלית הייתה כובע ופתקים.

נניח שיש הבדלים בתאורה בחלקים השונים של השדה (אולי יש הר שמטיל צל בחלק מהיום על חלק מהשדה), אז בערך מחצית מהריבועים בחלק המוצל דושנו בדשן א ומחצית דושנו בדשן ב. אם בגלל שיפוע השדה יש חלק בשדה שמקבל יותר מים מחלק אחר, בערך מחצית מהריבועים בחלק הזה מדושנים בדשן א ומחצית בדשן ב. ואם יש גורם שלא חשבנו עליו שמשפיע על חלק מהשדה, עדיין בערך מחצית מהריבועים בחלק הזה דושנו בדשן א ומחצית בחלק ב. ואם יש הבדלים בין הצמחים, אז לכל תכונה של הצמחים שתוכלו לחשוב עליה, תהיה חלוקה בערך שווה בין שני סוגי הדשנים. אם לשיחים שונים של עגבניות יש רמות פוריות שונות, ההקצאה הרנדומלית תדאג לכך שבכל רמת פוריות יהיה מספר הצמחים שדושנו בדשן א יהיה שווה בערך למספר הצמחים שדושנו בדשן ב (בהנחה שיש מספר דומה של צמחים בכל חלקה).

הרנדומיזציה יוצרת למעשה את שני העולמות “המקבילים”: מבחינה התפלגותית הם זהים בכל דבר, פרט לגורם שאנחנו מנסים לברר האם הוא גורם סיבתי. פישר למעשה הסביר את הנקודה שדייויד יום פיספס. אנחנו יכולים לדעת “מה היה קורה אילו”.

ההקצאה הרנדומלית פותרת גם בעיה חמורה נוספת שלא הזכרתי: טעויות מדידה. זה קל לספור כמה עכברונים נולדו בכל כלוב. רק אני יכול לטעות בספירה כזו. אבל אם שוקלים את יבול העגבניות בחלקה 17, המאזניים עלולים להיות לא מספיק מדוייקים. על סמך ההקצאה הרנדומלית, פישר פיתח שיטות סטטיסטיות לאמידת גודל טעות המדידה, ולהפרדת השונות הנובעת מטעות המדידה מהשונות שבין החלקות והשונות שבין הצמחים הנמצאים בתוך כל חלקה. שיטה זו נקראת, שלא במפתיע, ניתוח שונות.

ב-1935 פישר פירסם את רעיונותיו ותובנותיו בספרו המשפיע שעסק בתכנון ניסויים. למרות שזכויות היוצרים על הספר עדיין לא פגו, הוא זמין לקריאה ברשת (בקישור הזה תוכלו להוריד את הספר במספר פורמטים לבחירתכם). אני ממליץ להציץ בו ולקרוא את ההקדמה.

עם זאת, רעיון ההקצאה הרנדומלית, כמו כל רעיון מהפכני, לא התקבל מייד. ההתנגדות העיקרית הייתה בתחום הרפואה. הטענה הייתה כי בניסוי רפואי הנערך בבני אדם, הקצאה רנדומלית אינה אתית. הניסוי הקליני הראשון עם הקצאה רנדומלית, ניסוי הסטרפטומיצין, נערך רק ב-1944, וזאת רק מפני שלא הייתה ברירה. לא היו מספיק מנות תרופות עבור כל החולים. ניסויים קליניים עם הקצאה רנדומלית[5] התקבלו רק לאחר הניסוי לבדיקת החיסון נגד פוליו שפיתח יונה סאלק. למעשה נערכו שני ניסויים: ניסוי אחד עם הקצאה רנדומלית וסמיות כפולה שהוביל הסטטיסטיקאי פול מאייר (בתמונה), וניסוי נוסף בו ההקצאה לא הייתה רנדומלית אלא על פי גילאי הילדים שהשתתפו בניסוי. ההבדלים בין שני הניסויים היו משמעותיים. בסופו של דבר התברר כי בניסוי השני הייתה הטיה שגרמה לכך שהחיסון נראה פחות יעיל ממה שהוא באמת.

בעולם מושלם,  סדרת הפוסטים הזו אמורה להסתיים כאן. אבל העולם לא מושלם, כידוע. הסדרה תימשך.

הפוסטים הקודמים בסדרה


הערות
  1. counterfactuals []
  2. נסו לחשוב איך יודעים את זה []
  3. ואני לא מזלזל בניסויים בעכברים. בניגוד למה שאולי ניתן לחשוב על סמך התיאור הפשטני שנתתי, ניסויים בחיות הם ניסויים מורכבים שיש לתכנן בזהירות רבה []
  4. ייתכן ויש איזורים בשדה שמקבלים יותר מים בגלל שיפוע הקרקע []
  5. וסמיות כפולה []

סיבתיות: הגדרות ותיאוריות

בפוסט זה אסקור מספר תיאוריות והגדרות של סיבתיות הרלוונטיות לנושא של הסקה סיבתית. היריעה, כמובן, רחבה הרבה יותר. סקירה טובה למדי של הנושא, בעיקר מהבחינה הפילוסופית, ניתן למצוא בערך Causality  בויקיפדיה האנגלית.

סיבתיות על פי אריסטו

אחת התיאוריות המוקדמות ביותר לסיבתיות, לפחות בתרבות המערבים, היא התיאוריה של אריסטו. לפי אריסטו, סיבתיות היא למעשה התשובה לשאלה “למה?”. באופן מדוייק יותר, השאלה היא “למה דבר מסויים קיים?”. על פי אריסטו, כדי להבין את הסיבתיות, יש צורך לענות על ארבע שאלות שונות, ורק תשובות מלאות לארבע השאלות האלה.

ניקח למשל את השאלה “מדוע בית קיים?”[1]

השאלה הראשונה היא השאלה החומרית: מאיזה חומר (או חומרים) הבית עשוי? הבית אינו יכול להיות קיים ללא קיומם של לבנים, מלט, עץ וכולי. אבל זה לא מספיק. צריך לשאול גם מי יצר את הבית. זוהי השאלה הפורמלית. כל חומרי הבניין אינם יוצרים בית. כדי שייווצר מהם בית, צריך בנאי שייקח את כל החומרים האלה וייצור מהם בית. כן יש לברר מה הנימוק[2] לקיומו של הבית . בדוגמה הזו, צריך חומרים, צריך גם בנאי, אבל כדי שהבית יתקיים צריך גם מישהו שיחליט לקחת את כל חומרי הבנייה ולבנות מהם בית. השאלה האחרונה היא שאלת הסיבה הסופית, או שאלת התכלית. למה מיועד הבית? הבית מיועד לכך שנוכל לגור בו, ולהגן על עצמנו מפגעי מזג האוויר ומדברים נוספים.

כל זה טוב ויפה, אבל הדברים עלולים להסתבך. הביקורת החריפה על מושג הסיבתיות לפי אריסטו נובעת משאלת התכלית. יש תכלית לבית, אבל האם יש תכלית לתחלואה בסרטן? במקרה הזה, קל יחסית לענות על השאלה החומרית. לשאלה הפורמלית יש תשובות חלקיות (עישון למשל), ובמקרה של עישון, המעשן החליט בשלב כלשהו שהוא רוצה לעשן. אבל מהי התכלית של מחלת הסרטן? אתם מוזמנים לנסות לענות.

התיאוריה של אריסטו לא עברה מן העולם. אני מזכיר אותה כאן בגלל ספר שיצא לאור לאחרונה בשם The book of why[3]. הכותב העיקרי של הספר הוא יהודה פרל[4]. זוהי התייחסות ישירה לאריסטו, אם כי פרל אינו מספק מתודולוגיה מתמטית/סטטיסטית למציאת תשובות לכל ארבע השאלות, אלא רק לשתיים מהן: השאלה הפורמלית ושאלת הנימוק. אדון בתיאוריה של פרל בהרחבה בהמשך הסדרה.

סיבתיות המבוססת על עולם חלופי (counterfactuals)

על פי הגישה הזו , השאלה שיש לשאול היא “מה היה קורה אילו…?”.

David Hume

David Hume

לשאלת הקשר הסיבתי בין עישון ותחלואה בסרטן, יש לבחון שתי אפשרויות. מה יקרה לאדם אם יעשן, ומה שיקרה לו אם הוא אינו מעשן. אם אדם מעשן חולה בסרטן, ואנחנו יכולים להראות כי אילו לא היה מעשן לא היה חולה, נוכל להסיק כי העישון גרם לסרטן. אבל יש כאן בעיה יסודית: אנו לא יכולים לצפות בשתי האפשרויות. אם אדם מעשן, לא נוכל לדעת מה היה קורה לא אילו לו היה מעשן, ולהיפך.

קריטריון זה לסיבתיות הועלה על ידי הפילוסוף דייוויד יום במאה ה-18. אני לא אכנס כאן לכל הדיונים הפילוסופיים שנובעים מהתיאוריה של יום, אבל בגדול, השורה התחתונה היא שאי אפשר להסיק סיבתיות, כי אנחנו לא יודעים בביטחון “מה היה קורה אילו”.

אבל מסתבר שיש דרכים לעקוף את הבעיה. אציין כאן מספר אנשים שהתמודדו עם הבעיה הזו, בדרגות שונות של הצלחה[5] : רונלד פישר, קרל פירסון, אדני יול, וג’רזי ניימן. מי שביסס את תיאוריית המציאות החליפית כמסגרת סטטיסטית להסקת סיבתיות הוא דונלד רובין  מאוניברסיטת הרווארד, שהרחיב את הגישה של ניימן. בהמשך הסדרה אתייחס בהרחבה לגישות של פישר ושל רובין.

סיבתיות הסתברותית[6]

עד כה הדיון התמקד בסיבתיות דטרמיניסטית: אם A גורם ל-B  הרי שאם קורה A אזי B גם הוא חייב לקרות. במובן הזה, מלחמה אינה גורמת למוות, שהרי, תודה לאל, יש אנשים שנלחמו במלחמה או חוו אותה ולא מתו. לפי אותו הגיון עישון אינו גורם לסרטן או מחלות לב, מכיוון שיש אנשים שעישנו כל חייהם ולא חלו בסרטן או במחלת לב. תרופה נגד כאבים אינה גורמת להפסקת הכאב או אף להקלה בו אצל כל אדם הסובל מכאבים, גם אם פעולת התרופה נבדקה בניסויים קליניים.

כתוצאה מכך, הוצע רעיון הסיבתיות ההסתברותית. באופן לא פורמלי, נאמר כי עישון הוא גורם לסרטן אם ההסתברות לאדם יחלה בסרטן כאשר ידוע כי הוא מעשן, גדולה מההסתברות שיחלה בסרטן אם לא ידוע האם הוא מעשן או לא.

הוכחת סיבתיות, גם לפי הגדרה זו, היא קשה. על פי ההגדרה A ו-B הם מאורעות הסתברותיים שאינם בלתי תלויים, אך באופן אמפירי ניתן לצפות בדרך כלל רק בקשר סטטיסטי[7] בין שני המאורעות. האמירה הידועה כי “מתאם אינו מעיד על סיבתיות” מבטאת בצורה לא מדויקת את הקושי הזה. אמירה זו טוענת למעשה כי לעולם לא ניתן להסיק סיבתיות מתוך נתונים תצפיתיים. לכן לעיתים הקשר הסיבתי/הסתברותי מבוטא בניסוח מסתייג כגון “עישון הוא גורם סיכון לסרטן”.

גורמים הכרחיים ומספיקים לסיבתיות

ניתן לחלק את גורמי הסיבתיות האפשריים לשלושה סוגים.

הסוג הראשון הוא גורם הכרחי. מצב לא יכול להתקיים אם הגורם לו אינו קיים. אם המצב קיים, אז בהכרח גם הגורם קיים. אולם, המצב אינו חייב להתקיים גם אם הגורם קיים.

לדוגמא, מחלת החצבת נגרמת על ידי נגיף החצבת. הנגיף חייב להימצא בתוך גופו של אדם כדי שיחלה בחצבת, ואם אדם חלה בחצבת, אנחנו יודעים כי הנגיף נמצא בגופו. עם זאת, הימצאותו של נגיף החצבת בתוך גופו של אדם לא מחייבת כי האדם יחלה בחצבת. למשל, אם אדם מחוסן נגד חצבת, הוא לא יחלה.[8]

הסוג השני הוא גורם מספיק. אם הגורם מתקיים, אז גם המצב שהוא גורם יתקיים. אולם, ייתכן כי המצב יתקיים גם ללא נוכחות הגורם, וזאת מכיוון שגורם אחר התקיים.

לדוגמה, אם יורד גשם, אז הדשא שצומח בגינה שליד ביתכם יירטב. אירוע של גשם מספיק כדי להרטיב את הגשם. אבל אם אתם יוצאים מהבית בבוקר ורואים כי הדשא רטוב, ואין לכם כל מידע אחר[9], לא תוכלו להסיק כי ירד גשם. ייתכן והדשא נרטב כי הממטרות פעלו במשך הלילה.

יכול להיות גם גורם שאינו הכרחי וגם אינו מספיק. נניח שאם רוצים לאכול סלט מעגבניות אורגניות שגידלתם בעצמכם בחצר ביתכם. ירידת גשם אינה הכרחית כדי שתוכלו לאכול את העגבניות הפרטיות שלכם. אפשר להשקות. אבל ירידת גשם, אפילו יום יום לאורך כל העונה, אינה מספיקה. כדי שתוכלו לאכול עגבניות מהגינה שלכם אתם גם צריכים לזרוע אותן. אם לא תזרעו עגבניות, שום גשם לא יצמיח אותן.

בהמשך הסדרה נראה איך מושגים אלה קשורים לתיאוריה של פרל.

מה בקשר לגורם שהוא גם הכרחי וגם מספיק? באופן פילוסופי אפשר להתייחס גם לגורם כזה, למען השלמות. אבל אם גורם מסויים הוא גם הכרחי וגם מספיק למצב מסויים, הרי שהוא שקול למצב הנגרם. זה מעניין מבחינה פילוסופית, אבל לא מעשית.

 

הפוסטים הבאים בסדרה

 


הערות
  1. ראו  Aristotle’s Four Causes []
  2. אני לא בטוח שזו המילה העברית הנכונה. הביטוי הוא efficient []
  3. אני ממליץ לקרוא את הספר, אבל בביקורתיות []
  4. שותפו לכתיבה, דנה מקנזי,  הוא עיתונאי שסייע לפרל להציג את רעיונותיו בצורה שתתאים יותר לקהל הרחב. המאמרים והספרים שפרל כתב הינם בלתי קריאים לחלוטין []
  5. תיראו מופתעים []
  6. פסקה זו מבוססת על הערך שעוסק בסיבתיות בויקיפדיה העברית. זו לא העתקה. אני כתבתי את תת הערך הזה []
  7. כאן הכוונה היא למונח הכללי association, ולא למונח הנפוץ correlation שהוא סוג מיוחד של קשר סטטיסטי. זוהי נקודה עדינה שאתייחס אליה בהמשך הסדרה. []
  8. כאן יש להבדיל בין “מחוסן” ובין “קיבל חיסון”, וזאת כי יעילות החיסון גבוהה אך אינה מקסימלית. ישנם מקרים, נדירים מאוד, בהם אנשים שקיבלו חיסון נותרו לא מחוסנים מסיבות שונות. []
  9. למשל כי ישנתם שינה עמוקה ואינכם יודעים מה קרה בחוץ במשך הלילה []