Skip to content

נסיכת המדעים

אלוהים משחק ביקום בקוביות

  • עמוד הבית
  • אודות נסיכת המדעים
  • ייעוץ סטטיסטי
  • מבוא לסטטיסטיקה
  • מצגות Presentations
  • יצירת קשר
  • Toggle search form

ממתאם לסיבתיות – מבחן הסיבתיות של גרייג’ר

Posted on 31 בינואר 20203 במרץ 2020 By יוסי לוי 4 תגובות על ממתאם לסיבתיות – מבחן הסיבתיות של גרייג’ר

היסטוריה וקונטקסט

הוא סטטיסטיקאי וכלכלן וולשי אמריקני, שזכה בפרס נובל לכלכלה ((במשותף עם רוברט פ. אנג’ל )) בשנת 2003, בזכות תרומותיו לתיאוריה ולמתודולוגיה של . בשנת 1969 הציע גריינג’ר מבחן סטטיסטית לבדיקת השערת הסיבתיות בקונטקסט של סדרות עיתיות.

קלייב גריינג'ר
קלייב גריינג’ר

הקריטריונים של ברדפורד היל שהוצגו ב-1965 מתאימים בעיקר לבעיות בתחום האפידמיולוגיה ובריאות הציבור, שם מתעניינים בדרך כלל בחשיפה לגורם סיכון או התערבות, ובתוצאה בריאותית חיובית או שלילית, לפי ההקשר. בעוד שניתן ליישם את הקריטריונים גם בתחומים אחרים, למשל פסיכולוגיה ותחומים נוספים במדעי החברה, חלק ניכר מקריטריונים אלה אינם ישימים כאשר דנים בסדרות עיתיות, שלהן חשיבות מיוחדת בכלכלה. לכן נדרש כאן פיתרון אחר. הוא פיתרון אפשרי.

סדרה עיתית היא סדרה של נתונים הנאספים לאורך זמן. לכל נתון מצורפת נקודת הזמן בה נדגם הנתון. אתם מכירים הרבה סדרות כאלה. הלשכה המרכזית לסטטיסטיקה מפרסמת כל חודש את השכר הממוצע ואת מדד המחירים לצרכן.  בנק ישראל מפרסם מדי יום את שער החליפין בין השקל לדולר. השירות המטאורולוגי מפרסם כל יום מה הייתה הטמפרטורה בצהריים בכל מיני מקומות בארץ.

מבחן גריינג’ר

גריינג’ר התבסס על שתי הנחות יסוד:

  1. הגורם מתרחש לפני התוצאה
  2. הגורם מכיל מידע ייחודי על התוצאה

בעוד שההנחה הראשונה ברורה ומובנת מאליה, ההנחה השניה דורשת הסבר.

קודם כל, זכרו כי כאן אנו דנים בסיבתיות בקונטקסט של זמן. לכן ניסוח יותר מדוייק של ההנחה השניה היא כי הגורם מכיל מידע ייחודי אודות הערכים העתידיים של התוצאה. כלומר, מדובר בגורם המכיל מידע ייחודי לחיזוי של התוצאה.

נניח כי אנחנו יכולים לחזות במידת הצלחה כלשהי את הערכים העתידיים של התוצאה כאשר בידינו כל המידע האפשרי בעולם. מה יקרה אם נשליך החוצה את המידע על המשתנה שלדעתנו גורם את התוצאה, ונשתמש רק בשאר המידע?

אשתמש בדוגמה: האם הטמפרטורה בצהריים בתל אביב משפיעה על היקף מכירות הגלידה בעיר? ובפרט, האם טמפרטורה גבוהה יותר גורמת למכירת יותר גלידה?

אנחנו יכולים לאסוף נתונים על שני המשתנים האלה, ולקבל שתי סדרות עיתיות.

השלב הבא הוא לבנות שני מודלים לחיזוי היקף מכירת הגלידה היומי. במודל אחד אתם יכולים להסתמך על כל המידע שיש בעולם ועומד לרשותכם. כמובן שנתוני הטמפרטורה נכללים במידע עליו אתם יכולים להסתמך.

והנה הטוויסט: במודל השני אסור לכם להסתמך על נתוני הטמפרטורה. חוץ מזה הכל הולך.

אם החיזויים של שני המודלים שונים באופן משמעותי, המסקנה היא כי הטמפרטורה משפיעה על היקף מכירות הגלידה. במקרה כזה נאמר כי הטמפרטורה היא גורם סיבתית על פי גריינג’ר להיקף מכירות הגלידה.

עכשיו נמקד את תשומת ליבנו על המילים “באופן משמעותי”. איך מחליטים אם הבדל הוא משמעותי? גריינג’ר הציע להשתמש במבחן סטטיסטי, כלומר לזהות משמעות עם מובהקות סטטיסטית. המבחן שלו מסתמך על מודלים של אוטורגרסיה, מבחני t ומבחני F, שהם הכללות של רגרסיה לינארית. היא הפנים האחרות של . במילים אחרות, גריינג’ר הציע נתיב שמוביל ממתאם לסיבתיות.

זהו נתיב מסוכן, וגריינג’ר ידע זאת היטב. בנאום שנשא בטקס שבו הוענק לו פרס נובל, גריינג’ר התייחס למבחן הסיבתיות שהציע ואמר כי “התפרסמו הרבה מאמרים עם תוצאות מגוחכות”.

ביקורת על מבחן גריינג’ר וחולשותיו

ראשית, יש לשים לב כי הסיבתיות מוסקת על סמך חיזוי. לא מוצע מנגנון סיבתי, ופורמלית אין צורך להציע מנגנון כזה. זהו פער משמעותי בין גריינג’ר ובין הקריטריונים של ברדפורד היל המחייבים הצעה של מנגנון כזה. טענה שקולה היא הטענה כי מבחן גריינג’ר אינו עונה על השאלה הפורמלית ושאלת הנימוק של אריסטו.

שנית, מי שמשתמש במבחן בחוסר זהירות, עלול ליפול בכשל הפוסט הוק, טענה מוטעית לפיה אם Y  קרה לאחר X  אז X  גרם ל-Y. אמנם, כפי שטען , קיום הטמפורליות הוא תנאי הכרחי לסיבתיות, אך תנאי זה בהחלט אינו מספיק.

המבחן גם לא לוקח בחשבון , כאלה המשפיעים על שני משתנים אחרים ויוצרים ביניהם מתאם מלאכותי (spurious correlation). לא במקרה בחרתי לדוגמה את הגלידה והטמפרטורה. אני מניח שכולם מכירים את הדוגמה המשעשעת שבה יש מתאם בין מכירות הגלידה ומספר הטביעות בבריכה. ככל שמוכרים יותר גלידה, יותר אנשים טובעים. האם ניתן להסיק על פי מבחן גריינג’ר כי קניית גלידה גורמת לטביעות? ייתכן מאוד שכן.

מגבלות נוספות של סיבתיות גריינג’ר הן: (( ראו A review of the Granger-causality fallacy –  Mariusz Maziarz – קישור לקובץ pdf ))

  • רגישות לתדירות הסדרות העיתית ולמשך הזמן בו צופים בהן. לדוגמה, מחקר האוצר על מה שכונה “שכר המינימום ונזקיו” שפורסם בשנת 2004, חזה כי העלאת שכר המינימום תגרום לעליה באבטלה, בין היתר על ידי שימוש בסיבתיות גריינג’ר. כפי שציינתי בפוסט שהתייחס למחקר הנ”ל, בעיה מרכזית במחקר הייתה בכך שהוא הסתמך על נתונים שהתייחסו לתקופה קצרה יחסית של 11 שנים, בעוד שבזמן עריכת המחקר שכר המינימום כבר היה נהוג בישראל במשך יותר מ-30 שנה.
  • חוסר יכולת לזהות סיבתיות לא לינארית
  • חוסר יכולת להתמודד עם סדרות עיתיות לא לינאריות ו/או לא סטציונריות
  • ההנחה של ההתפלגות הנורמלית של טעויות המדידה לא תמיד מתקיימת.
  • היפוך הזמן: בתנאים מסויימים ניתן לחזות את ערכי העבר על ידי ערכי העתיד. מבחני גריינג’ר יראו גם במקרים אלה סיבתיות, אלא שהגורם קרה לאחר התוצאה.

למרות המגבלות האלה, מבחן גריינג’ר וההכללות שלו נמצאים בשימוש נרחב. על המשתמשים בו לעשות זאת בזהירות, וכל טענה לסיבתיות על פי גריינג’ר צריכה להיבחן לגופה באופן ביקורתי.

הפוסטים הקודמים בסדרה

  • סיבתיות: הגדרות ותיאוריות
  • סטנדרט הזהב להוכחת סיבתיות
  • רנדומיזציה – לא הכל זהב
  • ממתאם לסיבתיות: הקריטריונים של ברדפורד היל
  • ממתאם לסיבתיות – הקשר בין עישון ותחלואה בסרטן הריאה

הפוסטים הבאים בסדרה

  • הסקה סיבתית ומציאות חלופית
הסקה סיבתית Tags:הסקה סיבתית

ניווט

Previous Post: הודעה – עמוד מצגות
Next Post: ויזואליזציה של נתוני יחס חוב/תוצר

Comments (4) on “ממתאם לסיבתיות – מבחן הסיבתיות של גרייג’ר”

  1. איתי הגיב:
    31 בינואר 2020 בשעה 18:58

    מענייח אותי לדעת מי דחף לשימוש בשיטות אלה אם הוא עצמו ביקר זאת?
    הוא גם המציא את מושג הקואינטגרציה. תוכל לכתוב על כך ?

    הגב
    1. יוסי לוי הגיב:
      9 בפברואר 2020 בשעה 09:27

      1) לא רציתי להיכנס לעניין הזה מכיוון שאין לי מקורות להסתמך עליהם. ראיתי לפחות אמירה אחת באיזה פורום כי הוא כינה את השיטה שלו כסיבתית מטעמים שיווקיים – כדי למשוך יותר תשומת לב. אבל כאמור, אין לי אישור לכך ממקור אחר, ולכן זה נשאר בגדר רכילות ששמעתי.
      2) אני לא בקי בזה, ולא חושב שאגיע לזה בזמן הקרוב.

      הגב
  2. Ron Kenett הגיב:
    1 בפברואר 2020 בשעה 09:12

    גרינגר עבוד עם פול ניובולד שקודם לכך היה במדיסון ועבד עם בוקס. יש טענה שהיתה כאן העברת ידע, משיטות ARIMA של בוקס למה שגרימג’ר עשה שזיכה אותו בנובל בכלכלה. בוקס וטיאו עבדו על נתוני איכות אוויר בלוס אנגלס ופיתחו מודלים של התערבות בשדרות עיתיות. בובס אברהם, סטודנט של בוקס, גם עבד על הנושאים האלה. רוב המאמרים בנושאים האלה פורסמו ב JASA.

    נכחתי בסמינר של גינג’ר במדיסון בנוכחות בוקס וזכור לי שנושא הראוניות בפיתוח השיטות האלה עלה.

    בלי כל קשר – יוסי, כל הכבוד על הסדרה הזו!!

    הגב
    1. יוסי לוי הגיב:
      9 בפברואר 2020 בשעה 09:24

      תודה רון. חשבת לכתוב ספר זכרונות על כל המפגשים האלה שלך?

      הגב

כתיבת תגובה לבטל

האימייל לא יוצג באתר. שדות החובה מסומנים *

אתר זה עושה שימוש באקיזמט למניעת הודעות זבל. לחצו כאן כדי ללמוד איך נתוני התגובה שלכם מעובדים.

  • תכנים נוספים בנסיכת המדעים
  • ערוץ היוטיוב של נסיכת המדעים 
  • נסיכת המדעים בפייסבוק
  • חפירות על סטטיסטיקה
  • תכנים מומלצים ברשת בנושאי סטטיסטיקה ו- Data Science
  • Privacy policy
  • מה אומרת הסטטיסטיקה
  • כלכלה וחברה
  • בריאות
  • ביוסטטיסטיקה
  • האנשים שמאחורי הסטטיסטיקה
  • נשים בסטטיסטיקה
  • סטטיסטיקה רעה
  • אותי זה מצחיק
  • בנימה אישית

Copyright © 2025 נסיכת המדעים.

Powered by PressBook WordPress theme

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish.Accept Read More
Privacy & Cookies Policy

Privacy Overview

This website uses cookies to improve your experience while you navigate through the website. Out of these, the cookies that are categorized as necessary are stored on your browser as they are essential for the working of basic functionalities of the website. We also use third-party cookies that help us analyze and understand how you use this website. These cookies will be stored in your browser only with your consent. You also have the option to opt-out of these cookies. But opting out of some of these cookies may affect your browsing experience.
Necessary
Always Enabled
Necessary cookies are absolutely essential for the website to function properly. This category only includes cookies that ensures basic functionalities and security features of the website. These cookies do not store any personal information.
Non-necessary
Any cookies that may not be particularly necessary for the website to function and is used specifically to collect user personal data via analytics, ads, other embedded contents are termed as non-necessary cookies. It is mandatory to procure user consent prior to running these cookies on your website.
SAVE & ACCEPT