Skip to content

נסיכת המדעים

אלוהים משחק ביקום בקוביות

  • עמוד הבית
  • אודות נסיכת המדעים
  • ייעוץ סטטיסטי
  • מבוא לסטטיסטיקה
  • מצגות Presentations
  • יצירת קשר
  • Toggle search form

הסקה סיבתית ומציאות חלופית

Posted on 27 בפברואר 202026 בפברואר 2020 By יוסי לוי 2 תגובות על הסקה סיבתית ומציאות חלופית

גישת “המציאות החילופית” שגובשה על ידי דונלד רובין באמצע שנות השבעים היא אחת משתי הגישות המובילות היום בתחום של הסקה סיבתית. הביטוי “מציאות חלופית” הוא התרגום שלי למונח counterfactual, שמקורו בגישה של דייויד יום שסקרתי בפוסט הראשון בסדרה. כזכור, יום טען כי יש להסיק סיבתיות על ידי השוואת מה שקרה בפועל למה שהיה עשוי לקרות אילו הייתה ננקטת פעולה אחרת מזו שננקטה. עקב כך, טען יום, אי אפשר לקבוע אפקט סיבתי, כי אנחנו לעולם יכולים לצפות במה שהיה קורה אילו. יום צודק כמובן. אבל, האם אפשר לעקוף את הבעיה?

רובין הסתייג מהשימוש במילה counterfactual, ומעדיף את הביטוי potential outcome או “תוצאה פוטנציאלית” בעברית. הסיבה לכך, מסביר רובין, היא שיש  counterfactuals שלא ניתן לצפות בהם,  אפילו לא באופן תיאורטי. הדוגמה שלו היא כי אין שום אפשרות תיאורטית לצפות בגובה שלך בגיל 3 אילו נולדת בקוטב הצפוני. לעומת זאת, אם מדובר בשני טיפולים אפשריים למחלה כלשהי, יש מראש אפשרות לצפות בשתי התוצאות: תוצאה אחת אם החולה יקבל טיפול אחד, תוצאה אחרת אם החולה יקבל את הטיפול השני, ואנחנו (( כלומר הרופא בהתייעצות עם החולה )) יכולים להחליט באיזו תוצאה אנחנו רוצים לצפות. אתם יכולים להחליט לצפות בגובה של עצמכם בגיל 3 אילו נולדתם בקוטב הצפוני עד מחר. יש אולי יקום מקביל שבו זה קורה, אבל אין שום אפשרות לצפות בו. (( לאיש שיושב באמצע השורה הראשונה, נע בחוסר נוחות בכיסא שלו ומצביע כי הוא רוצה לשאול שאלה: אני תיכף אחזור לזה ))

אתן כאן סקירה מאוד קצרה של ההיסטוריה של גישת התוצאה הפוטנציאלית. באופן לא מפתיע, הראשונים שהעלו את הרעיון בהקשר סטטיסטי היו רונלד פישר וג’רזי ניימן. פישר העלה את הרעיון בקצרה במאמר שהופיע ב-1918. הוא דן ברעיון הזה גם בספריו המשפיעים על שיטות מחקר ותכנון ניסויים שיצאו לאור בשנות העשרים של המאה הקודמת. אולם, כפי שרובין הדגיש כאשר נשא את ההרצאה השנתית של שם פישר ב-2004, הרעיון שהעלה פישר לא הבשיל לפורמולציה מתמטית. האדם הראשון שהציע תיאוריה מתמטית של תוצאות פוטנציאליות בהקשר של הסקה סטטיסטית היה ניימן, בעבודת הדוקטורט שלו מ-1923, שנכתבה בפולנית. (( סביר להניח שניימן לא הכיר את המאמר של פישר מ-1918 )) רובין הרחיב את העבודה של ניימן, ומתווה זה מכונה היום בשם Neyman-Runbin Framework, מונח שטבע יהודה פרל, ולעיתים רק בשם מודל הסיבתיות של רובין.

בואו נחזור לאדם שנולד אולי בקוטב הצפוני. אנחנו אולי יכולים לקחת קבוצה של אנשים שנולדו בקוטב הצפוני ולהשוות אותה לקבוצה של אנשים שנולדו במקום אחר, אבל האם נוכל להסיק מכך על סיבתיות כלשהי? התשובה היא לא, לפחות לא על פי מתווה ניימן-רובין. האנשים שנולדו בקוטב הצפוני שונים באופן מהותי מאלה שנולדו באפריקה, למשל.

ניזכר בסטנדרט הזהב להוכחת סיבתיות: ניסוי מבוקר בהקצאה רנדומלית. אם אנחנו רוצים לבדוק האם תרופה כלשהי גורמת לשיפור במצבו של חולה, אנחנו יכולים לערוך ניסוי קליני כדי לבדוק את זה. אם נמצא כי מצבם של החולים שטופלו היה בסופו של דבר יותר טוב ממצבם של החולים שלא טופלו והיוו את קבוצת הביקורת, נוכל להסיק כי התרופה גרמה לשיפור הזה.

מה בדבר מכשירי האידוי לטבק? האם אנחנו יכולים לבצע ניסוי קליני מבוקר בהקצאה רנדומלית כדי לבדוק את ההשפעות הבריאותיות של המכשירים הלאה? אנחנו לא יכולים לעשות את זה, אבל הסיבות לכך הן אתיות, לא יישומיות. סביר להניח שאפשר לערוך ניסוי כזה בצפון קוריאה, אם השלטונות שם יחליטו שזה מעניין אותם.

ומה ההשפעה של מקום הלידה על הגובה של אדם? או ההשפעה של המין הביולוגי של אדם על משהו שמעניין אותנו? אפילו קים ג’ונג און לא יכול לקחת קבוצה של אנשים, ולהקצות למחציתם כרומוזום Y באופן רנדומלי.

בבסיס מתווה ניימן-רובין נמצאת הטענה/אקסיומה שאין סיבתיות ללא התערבות: No causation without manipulation. ההתערבות היא שמאפשרת לנו את היכולת לצפות בתוצאה פוטנציאלית, ואנחנו יכולים להחליט באיזו תוצאה לצפות על ידי ההתערבות שבה ננקוט. אם אנחנו לא יכולים להתערב ולשנות את הגורם שחשוד כגורם סיבתי, אנחנו לא יכולים להחליט באיזה תוצאה פוטנציאלית אנחנו רוצים לצפות. רובין תיאר את זה יפה בהרצאה שנתן כאשר ביקר בארץ לפני כמה שנים: כאשר יש לכם נתונים תצפיתיים ואתם רוצים לבדוק האם גורם כלשהו, עישון למשל, הוא גורם סיבתי, בררו קודם כל אם הייתם יכולים לערוך ניסוי מבוקר בהקצאה רנדומלית כדי לבדוק את זה, אילו הייתם דיקטטורים כל יכולים. אם לא, אין טעם  להמשיך הלאה.

כאן רק מתחילות הבעיות.

ניימן ורובין קובעים כי אפקט הוא סיבתי אם התוצאות הפוטנציאליות שונות זו מזו. לדוגמה, אם חולה מבריא אחרי שקיבל את התרופה, ומת אם הוא לא קיבל אותה, אז אנחנו יכולים להסיק כי התרופה גרמה להחלמת החולה.

אבל, אל תשכחו את דייויד יום. גם אם אפשר להתערב ולהחליט באיזו תוצאה פוטנציאלית רוצים לצפות, אנחנו יכולים לצפות רק בתוצאה פוטנציאלית אחת. או שאנחנו נותנים לחולה את התרופה, ואז רואים מה קרה לו לאחר שהוא לקח אותה, או שאנחנו לא נותנים לו אותה ואז אנחנו רואים  מה קורה לו כשהוא לא מקבל את התרופה. אי אפשר גם וגם. זוהי הבעיה היסודית של ההסקה הסיבתית – The fundamental problem of causal inference, מונח שטבע פול הולנד ב-1986. אנחנו לא יכולים לצפות באפקט הסיבתי של גורם על אדם.

מה שאנחנו כן יכולים לעשות זה לנסות לצפות באפקט הממוצע באוכלוסייה מסויימת. יש לזה מחיר, או מחירים, שצריך לשלם. הולנד מביא כמה דוגמאות מעניינות במאמר שלו מ-1986. למעשה, בכל פעם שאנחנו מסיקים מסקנה סיבתית כלשהי, כגון “אם לא תלבש סוודר אתה תצטנן”, אנחנו מניחים משהו באופן לא מודע, כדי לעקוף את המחסום של יום. בפוסט הבא בסדרה אסקור את ההנחות המקובלות בהסקה סיבתית מתוך מחקרים תצפיתיים.

מקורות

● Statistics and Causal Inference – Paul W. Holland, 1986

● Causal Inference Using Potential Outcomes: Design, Modeling, Decisions – Donald B. Rubin, 2005

הפוסטים הקודמים בסדרה

  • סיבתיות: הגדרות ותיאוריות
  • סטנדרט הזהב להוכחת סיבתיות
  • רנדומיזציה – לא הכל זהב
  • ממתאם לסיבתיות: הקריטריונים של ברדפורד היל
  • ממתאם לסיבתיות – הקשר בין עישון ותחלואה בסרטן הריאה
  • ממתאם לסיבתיות – מבחן הסיבתיות של גרייג’ר
הסקה סיבתית Tags:הסקה סיבתית

ניווט

Previous Post: 17 משוואות ששינו את העולם
Next Post: איך מחשבים את אחוזי התמותה?

Comments (2) on “הסקה סיבתית ומציאות חלופית”

  1. נועם הגיב:
    4 במרץ 2020 בשעה 14:46

    כשאנחנו מדברים על הבעיה היסודית של ההסקה הסיבתית, האם אנחנו מדברים ברובד שבו לא ניתן להוכיח *שום* סיבתיות אפילו ברמת האירוע הפיזי הבודד – למשל שיש קשר סיבתי בין הבעיטה שלי בכדור לבין התנועה של הכדור?

    אם זה ברובד הזה, אז לכאורה אין שום דרך לעקוף את הבעיה, רק שנדמה לי שזה בקטגוריה של ההנחות הבסיסיות שבלעדיהן אין לנו שום דרך לחקור את העולם, כמו ההנחה שיש מתאם כלשהו בין מה שאנו צופים בו ובין העולם החיצוני, או שיש עקביות כלשהי בעולם.

    ואם אנחנו מקבלים שיש סיבתיות *כלשהי* שמיוסדת על האינטואיציות הבסיסיות שלנו, אז הקריטריון העיקרי להוכחת הסיבתיות במקרים מורכבים יותר – אולי הוא נוגע למנגנון שאותו אנו מציעים לסיבתיות ועד כמה הוא סביר ביחס לחלופות?

    הגב
    1. יוסי לוי הגיב:
      15 באפריל 2020 בשעה 15:06

      לפי יום, אין שום דרך להוכיח סיבתיות. לפי פופר, אין דרך להוכיח שום דבר, רק להפריך.
      וכל התחום של הסקה סיבתית מתבסס על הנחות שאין שום אפשו להוכיח שהן נכונות, כלומר הכל מתבסס על האמונה שלנו כי ההנחות הן נכונות.

      הגב

כתיבת תגובה לבטל

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.

  • תכנים נוספים בנסיכת המדעים
  • ערוץ היוטיוב של נסיכת המדעים 
  • נסיכת המדעים בפייסבוק
  • חפירות על סטטיסטיקה
  • תכנים מומלצים ברשת בנושאי סטטיסטיקה ו- Data Science
  • Privacy policy
  • מה אומרת הסטטיסטיקה
  • כלכלה וחברה
  • בריאות
  • ביוסטטיסטיקה
  • האנשים שמאחורי הסטטיסטיקה
  • נשים בסטטיסטיקה
  • סטטיסטיקה רעה
  • אותי זה מצחיק
  • בנימה אישית

Copyright © 2025 נסיכת המדעים.

Powered by PressBook WordPress theme

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish.Accept Read More
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Always Enabled
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
SAVE & ACCEPT