חיפוש באתר

קישורים

עמודים

קטגוריות

סטטיסטיקה רעה: אי אבחנה בין מתאם לסיבתיות

בנושא המתאם והסיבתיות דנתי רבות[1]. יש הרבה דוגמאות משעשעות: מתאם בין יבוא לימונים לבטיחות בדרכיםבין צבעה של מכונית והסיכוי כי תהיה מעורבת בתאונת דרכים, ובין מחזורי הירח ומחירי המניות. קוריוזים כאלה בדרך כלל לא גורמים נזק[2]. אף אחד לא יציע להטיל מגבלות על יבוא לימונים, או לצבוע מכוניות שחורות בצבע אחר. למעוניינים יש אתר שלם וספר שעוסק בכך.

ברשותכם אעבור לדוגמאות יותר רציניות.

דוגמא מפורסמת קשורה לגדול הסטטיסטיקאים, רונלד פישר, שהיה מעשן כבד. באמצע שנות החמישים של המאה העשרים, התגלו המתאמים הראשונים בין העישון ובין הסיכוי לחלות בסרטן הריאות. תלמידיו של פישר פנו אליו, וביקשו ממנו שינסה לעשן פחות למען בריאותו. הם נימקו את בקשתם במתאם הסטטיסטי שזה עתה התגלה. פישר דחה אותם, בנימוק שהמתאם עצמו אינו מראה סיבה ותוצאה, ואף הביע את דעתו זו בכתב העת החשוב Nature. ייתכן, אמר פישר, כי מחלת הסרטן גורמת בשלב הראשון של המחלה לצורך בניקוטין, המתבטא בכך שהחולה מעשן, ורק אחר כך מתפתחים הגידולים. פישר נפטר בשנת 1962. רק בשנות השבעים של המאה העשרים הוכיחו המדענים כי צריכה מוגברת של ניקוטין אכן גורמת לעליית הסיכון לחלות בסרטן הריאות.

טענה אחרת שהועלתה היא כי צמחונות אצל נערות בגיל ההתבגרות גורמת לאנורקסיה, וזאת על סמך מתאם גבוה בין שתי התופעות. ניתוח יותר זהיר הראה כי אורח חיים צמחוני לכשעצמו לא בהכרח גורם לאנורקסיה, אך בשילוב עם גורמי סיכון נוספים המחלה עלולה להתפתח.

הסקת סיבתיות עקב קיומו של מתאם עלולה בקלות להגיע לאבדן חיי אדם. הדוגמא המפורסמת ביותר (ואחת המזיקות ביותר) היא הטענה שחיסונים גורמים לאוטיזם, וזאת על פי מחקר גרוע במיוחד[3]. מאמר מאת אנדרו וייקפילד[4] , שפורסם בכתב העת Lancet בשנת 1998, הראה מתאם בין מתן חיסון MMR לילדים ובין אבחון אוטיזם אצל ילדים שחוסנו. זה הספיק כדי להצית תנועה רחבה של התנגדות לחיסונים, שקיימת עד היום. אי מתן חיסונים מוביל להתפרצות מגיפות ולמקרי מוות שהיו יכולים להימנע.

ב-2010 התפרסם מחקר שמצא כי צריכת חומצות שומניות כגון אומגה 3 יכולה להפחית את הסיכון להתקף לב. הטענה התבססה על מספר מחקרים תצפיתיים, וכן מספר ניסויי מעבדה. התברר כי לחומצות שומניות יש תכונות אנטי דלקתיות, וכי יש מתאם שלילי בין רמת הצריכה שלהן ובין רמת הטריגליצרידים בדם. כמו כן יש מתאם בין שלילי בין רמת הטריגליצרידים ובין הסיכון להתקף לב. מכאן הדרך קצרה להשערה כי צריכת חומצות שומניות תוביל להורדת הסיכון להתקף לב. זו תיאוריה יפה, אך היא מבוססת על מתאמים. היא התבררה כלא נכונה. בשנת 2013 התפרסמו התוצאות של מחקר קליני מבוקר, בו המטופלים צרכו, על פי הקצאה רנדומלית, שמן דגים (העשיר באומגה 3) או פלסבו. המחקר הראה כי אין עדות לאפקט חיובי של צריכת שמן דגים.

הדוגמא הטריה ביותר היא המחקר PURE, שתוצאותיו החלו להתפרסם לפני מספר חודשים. בין היתר, טענו החוקרים כי "יש מתאם גבוה בין צריכה גבוהה של פחמימות לשיעורי התמותה, בעוד שצריכת שומנים קשורה לשיעורי תמותה נמוכים". במחקר יש בעיות מתודולוגיות רבות המעמידות בספק רב את עצם קיומו של המתאמים המתוארים, אולם זה לא הפריע לעיתונים לצאת בכותרות כמו "שומן מפחית את הסיכון לתמותה", "שומן לא מזיק, הבעיה עם פחמימות", ו-"תזונה דלת שומן מעלה סיכון למוות מוקדם". שוב, פרשנות מוטעית של מתאם רשלני עלולה להביא להגברה של צריכת שומן, שתוביל לשיעורי תמותה גבוהים יותר ממחלות לב ומחלות נוספות.

כפי שכתב סטיבן ג'יי גולד בספרו The Mismeasure of Man: "ההנחה חסרת התוקף לפיה ממתאם נובעת סיבתיות היא ככל הנראה אחת מתוך שתיים או שלוש השגיאות החמורות ביותר והנפוצות ביותר בשיקול הדעת האנושי".


רשימות נוספות בסדרה:


הערות
  1. זה היה הפוסט הראשון שהופיע בנסיכת המדעים! []
  2. אם כי עלולים להיגרם הפסדים כספיים למי שישקיע את כספו על פי מחזורי הירח []
  3. שתוצאותיו התבררו לאחר מכן כמזוייפות, אבל גם אם היו אמיתיות לא היה ניתן להסיק מהן דבר []
  4. שהיה ד"ר לרפואה עד שרישיונו נשלל []

7 תגובות ל“סטטיסטיקה רעה: אי אבחנה בין מתאם לסיבתיות”

  • תגובה מאת גיל
    תאריך 2 בינואר 2018 10:16

    עם זאת, צריך לזכור שלפעמים כן אפשר להסיק ממתאמים לגבי סיבתיות. הרי ככלות הכל, הקשר בין עישון לסרטן לא התגלה במחקרים קליניים מבוקרים על בני אדם. בהנתן תנאים מסוימים אפשר להסיק בוודאות גבוהה על סיבתיות. התנאים הם שהקשר הוא חזק ועקבי, הקשר מופיע בתנאים שונים כמו אוכלוסיות שונות אם בנוכחות משתנים מתערבים שונים, הסיבה תמיד מופיעה לפני התוצאה, שיעורים גבוהים של המשתנה המסביר גורמים לאפקט חזק יותר במשתנה המוסבר, וגם הקשר הוא הגיוני ויש הבנה למה הוא יכול לקרות. לא זוכר איזה סטטיסטיקאי היה זה שהעלה את התנאים הללו.

    • תגובה מאת יוסי לוי
      תאריך 7 בינואר 2018 10:51

      גיל אני מסכים איתך פרט לעניין אחד סמנטי – זו לא הסקה ממתאמים על סיבתיות, אלא עדויות של מתאמים התומכות בסיבתיות (מבחינה פילוסופית אפשר לטעון כי אפילו ניסוי מבוקר אינו מוכיח סיבתיות).

      הסטטיסטיקאי שאתה מתייחס אליו הוא ג'רום קורנפילד.

      • תגובה מאת גיל
        תאריך 7 בינואר 2018 15:30

        תודה על השם, לא הכרתי אותו, האמת שהשם שחשבתי עליו היה אחר, אוסטין ברדפורד היל שנדמה לי שהוא יותר ידוע בהקשר הזה אבל הוא לא בהכרח הראשון.

    • תגובה מאת יוסי לוי
      תאריך 9 בינואר 2018 19:49

      עדכון: ג'רום קורנפילד היה הדמות המרכזית בביסוס העדויות על מתאם בין עישון ובין הסיכון לחלות בסרטן הריאות לכדי קשר סיבתי. אחד השותפים לעבודתו היה ברדפורד היל. הכללים לביסוס קשר סיבתי שמנה גיל, מקורם בעבודה המשותפת של קורנפילד והיל, אך נקראים על שמו של היל.

  • תגובה מאת מישה
    תאריך 2 בינואר 2018 21:43

    משום מה כשמדובר במתאם מקרי בין עליית ריכוז הפחמן הדו חמצני באטמוספירה לעליה של מעלה וחצי בממוצע הטמפ' הגלובלי כולם רוצים להאמין שזה חייב להיות קשר סיבתי למרות שזה לא.

    • תגובה מאת יוסי לוי
      תאריך 7 בינואר 2018 10:49

      תקרא את מה שגיל גינגרוז כתב כאן בתגובות.

    • תגובה מאת גיל
      תאריך 7 בינואר 2018 15:34

      מישה, אם אתה חושב שמדעני האקלים ביססו את המסקנות שלהם על קשר אחד ויחיד אז אתה טועה מאוד. יש המון עדויות להתחממות גלובלית מעשי ידי אדם שאין כמעט מדען בתחום שחושב שזה לא נכון. באופן כללי, זו צורת ההסקה או איסוף העדויות שקיימת במדעים היסטוריים שונים כמו גאולוגיה, אנתרופולוגיה וארכיאולוגיה, וגם אסטרופיסיקה. מה שחשוב זה לקחת מידע ממקורות שונים ולבדוק על פי את ההשערות השונות על פי הקריטריונים שציינתי (ויש גם נוספים).

תגובה