האם החסידה מביאה ילדים לעולם? ניתן לאסוף שפע של נתונים שיתמכו בתיאוריה המעניינת הזו, אבל אני סבור כי שום מתאם בין תנועת החסידות מעל לעיר ובין שיעורי הלידה לא ישכנעו איש מכם כי אכן כך הדבר.
האם יש קשר בין מספר הנעליים ורמת הידע במתמטיקה? לכו לבית הספר הקרוב ותיווכחו בעצמכם. לילדים בכיתות הגבוהות בודאי יש ידע נרחב יותר במתמטיקה, והם גם גדולים יותר פיזית, ולכן מספרי הנעליים שלהם גבוהים יותר.
האם ככל שנשלחות יותר מכוניות כיבוי כדי לכבות שריפה, כך גדול יותר הנזק שנגרם בשריפה? כן, בודאי. האם עלינו להסיק מכך שניתן לבטל את שירותי הכבאות? לא ולא. שריפות גדולות מצריכות כח כיבוי גדול יותר, וכמובן גורמות נזקים גדולים יותר.
האם בבתי חולים גדולים ומשוכללים שיעורי התמותה גבוהים יותר מבתי חולים קטנים ופחות מצויידים? לפעמים זה אכן כך. אולם לכל חולה אמליץ תמיד לבחור בבית החולים הגדול והמשוכלל. אכן, לבתי חולים כאלה מגיעים חולים יותר קשים, ולכן גם שיעורי ההצלחה שלהם יותר נמוכים לפעמים.
טוענים כי קיים קשר בין תוצאות המשחקים של קבוצת הבייסבול ניו-יורק יאנקיס, ובין ביצועי מדד הבורסה של ניו-יורק. כאשר היאנקיס מנצחים, הבורסה עולה, ולהיפך. האם כדאי לבסס את אסטרטגיית הכספים שלך על הביצועים של היאנקיס במגרש? אפשר לטעון כי כאשר הקבוצה המקומית מנצחת, משקיעי ניו-יורק שמחים ואופטימיים יותר, והדבר מתבטא במסחר. תיאוריה נחמדה, אבל המשחקים נערכים בשעות אחר הצהריים והערב , בעוד שהמסחר בבורסה מתקיים בבוקר. מאידך ייתכן כי כאשר שערי הבורסה עולים, השחקנים יותר שמחים ומשחקים במרץ רב יותר. וייתכן גם כי המתאם הנצפה הוא מקרי בלבד.
דוגמא קיצונית סיפק לנו הסטטיסטיקאי רונלד פישר, שהיה מעשן כבד. באמצע שנות החמישים של המאה העשרים, התגלו המתאמים הראשונים בין העישון ובין הסיכוי לחלות בסרטן הריאות. תלמידיו של פישר פנו אליו, וביקשו ממנו שינסה לעשן פחות למען בריאותו. הם נימקו את בקשתם במתאם הסטטיסטי שזה עתה התגלה. פישר דחה אותם, בנימוק שהמתאם עצמו אינו מראה סיבה ותוצאה. ייתכן, אמר פישר, כי מחלת הסרטן גורמת בשלב הראשון של המחלה לצורך בניקוטין, המתבטא בכך שהחולה מעשן, ורק אחר כך מתפתחים הגידולים. פישר נפטר בשנת 1962. רק בשנות השבעים של המאה העשרים הוכיחו המדענים כי צריכה מוגברת של ניקוטין אכן גורמת לעליית הסיכון לחלות בסרטן הריאות.
יש אנשים שיאמרו כי פישר נהג בטיפשות, אולם מבחינה סטטיסטית, פישר צדק לחלוטין. המתאם הסטטיסטי מראה קשר בלבד, ולא סיבה ותוצאה. הסטטיסטיקה יכולה לספק עדויות לתופעות, אך לא לספק פירוש לתופעה הנצפית. את הפירוש חייבים לספק המומחים, בעזרת כלים מתחום מומחיותם. בדוגמא של העישון והסרטן, הוכח הקשר הסיבתי (עישון גורם סרטן, ולא סרטן ורם עישון) בניסויים בתנאי מעבדה.
האם יש קשר בין היד הדומיננטית ובין הכשרון למתמטיקה? ייתכן, איני יודע. יש הטוענים כי קיים מתאם סטטיסטי בין התופעות, וראיתי פה ושם קטעי עיתונות המצטטים מארים בהם “הוכיחו” כי אטרי יד ימינם מגלים כישורים מתמטיים מיוחדים. אולם, מי שטוען טענה כזו, צריך להביא נימוקים משכנעים, מתחום הפסיכולוגיה ו/או נוירולוגיה. הקשר הסטטיסטי הוא רק עדות לתופעה, אך לא מספק שום מידע על הסיבות לתופעה הנצפית.
כיום כאשר עומדים לרשותנו מאגרי נתונים עצומים, ומחשבים רבי עוצמה. קל מאוד לתת למחשב לעבוד ולחפש מתאמים. זה יותר קל מלחפש מטבע תחת הפנס. אולם יש תמיד לזכור כי גם אם צופים במתאם בין שני משתנים, אין הדבר אומר כי קיים קשר ישיר בינם.
לא אפרט כאן כיצד מחושב מקדם המתאם הסטטיסטי. אומר רק שזהו אכן כלי רב עוצמה, אבל גם בעל מגבלות שיש להכיר ולהיזהר מפניהן. שימוש לא נכון במתאם הסטטיסטי עלול להוביל למסקנות מגוחכות, במקרה הטוב, ואף למסקנות מסוכנות, במקרה הגרוע.
פורסם לראשונה ב 27 ביוני 2004 באתר רשימות, שם התקבלו 4 תגובות
אביבה [אתר] בתאריך 7/12/2004 11:13:01 PM
ברוך הבא ובהצלחה.
יובל בתאריך 7/15/2004 2:20:46 PM
אכן, מתאם אינו בהכרח קשור לקשר בין סיבה ותוצאה.
למרות זאת, יש חוקרים המנסים להסיק קשרים
סיבתיים באופן מבוסס בשיטות הסתברותיות.
אחד מהם הוא יהודה פרל, מדען מחשב ותיק ומוכשר:
http://bayes.cs.ucla.edu/jp_home.html
יוסי ל בתאריך 7/15/2004 3:48:31 PM
מעניין.
תודה על הלינק.
תראזימאכוס בתאריך 7/20/2004 4:55:43 PM
תודה ובהצלחה