ארכיב עבור תגית עיוות נתונים
The Simpson
במשחק השביעי והמכריע בסדרת גמר אליפות הכדורסל הארצית, התמודדה קבוצת ספרינגפילד בולס מול יריבתה המושבעת, קבוצת יוטה סופרגז. כצפוי, המשחק הוכרע על פי היכולות האישיות של כוכבי שתי הקבוצות: בארט מספרינגפילד ויוחנן מיוטה. במחצית הראשונה היו לבארט 40% אחוזי קליעה מהשדה, בעוד שיוחנן צלף ב- 50% מנסיונות הקליעה שלו. במחצית השניה צפינו בהתעלות אישית של שני הכוכבים. בארט הדהים והכפיל את אחוז הקליעה שלו ל-80%, אך יוחנן שוב התעלה עליו, והשיג הישג בלתי יאמן של 90% קליעה. את סל הנצחון לזכות ספרינגפילד קלע בארט עם שריקת הסיום. הוא גם נבחר לשחקן המצטיין של המשחק המותח והשקול, לאחר שסיים אותו עם 67% קליעה, בעוד שאחוזי הקליעה של יוחנן במשחק היו בסופו של דבר נמוכים יותר: 63% בלבד.
לא, אין כאן טעות חישוב וגם לא טעות בסטטיסטיקה. למרות שיוחנן היה טוב יותר מבארט בכל אחת ממחציות המשחק, הרי בסיכום הכולל של המשחק בארט היה טוב יותר מיוחנן. זו תופעה סטטיסטית הידועה בשם "פרדוקס סימפסון".
הקוראים מוזמנים לעצור כאן, ולנסות למצוא מספרים ש-"יסתדרו" עם הדוגמא המלאכותית בה פתחתי. (המספרים שלי יובאו בהמשך הרשימה).
אולי הדוגמא המפורסמת ביותר לפרדוקס סימפסון היא פרשת ההפליה על רקע מגדרי בקבלה ללימודים מתקדמים באוניברסיטת ברקלי. בשנת 1973, נדהמו ראשי האוניברסיטה לגלות כי 44% מהגברים שנרשמו ללימודים מתקדמים (תואר שני ושלישי) באוניברסיטה התקבלו ללימודים, אך רק 35% מהנשים התקבלו. ראשי האוניברסיטה, שחששו מתביעה, הזעיקו לעזרה את הסטטיסטיקאי פיטר ביקל, וביקשו ממנו לבחון את נתוני הקבלה. ביקל ועמיתיו האמל ואו'קונל, פרסמו את ממצאיהם כעבור שנתיים בכתב העת היוקרתי Science. אביא כאן ניתוח של נתונים חלקיים אך מייצגים של נתוני הקבלה, כפי שהופיעו בספר הקלאסי של פרידמן ועמיתיו – Statistics.

לצורך הדגמת העקרון, נתרכז בששת החוגים הגדולים ביותר באוניברסיטה, אליהם נרשמו קצת יותר משליש מהמועמדים והמועמדות (באוניברסיטת ברקלי יש למעלה ממאה חוגים שהציעו תכניות ללימודים מתקדמים). נתוני ההרשמה והקבלה לחוגים אלה נתונים בטבלה הבאה:
|
גברים |
נשים |
סך הכל |
||||
|
חוג |
נרשמו |
אחוז קבלה |
נרשמו |
אחוז קבלה |
נרשמו |
אחוז קבלה |
|
A |
825 |
62 |
108 |
82 |
933 |
64 |
|
B |
560 |
63 |
25 |
68 |
585 |
63 |
|
C |
325 |
37 |
593 |
34 |
918 |
35 |
|
D |
417 |
33 |
375 |
35 |
792 |
34 |
|
E |
191 |
28 |
393 |
24 |
584 |
25 |
|
F |
373 |
6 |
341 |
7 |
714 |
6 |
|
סך הכל |
2691 |
45 |
1835 |
30 |
4526 |
39 |
התמונה הכללית המוצגת כאן דומה לתמונה שהתגלתה בנתונים המלאים: 45% מהגברים התקבלו ללימודים, רק 30% מהנשים. אבל שימו לב: ברוב החוגים אחוזי הקבלה של גברים ונשים דומים זה לזה, עם הבדלים של אחוזים בודדים לכאן או לכאן. רק בחוג A נראה שיש (אולי) אפליה על רקע מגדרי: לחוג זה התקבלו 82% מהנשים, אבל רק 62% מהגברים. הנשים משחקות כאן את תפקידו של יוחנן, הגברים את בארט. איך זה קרה?
שימו לב כי לחוגים A ו-B קל להתקבל – כשני שליש מהנרשמים מתקבלים. יותר ממחצית הנרשמים הגברים ביקשו להתקבל לחוגים אלה. לחוגים C עד F הרבה יותר קשה להתקבל. יותר מ-90% מהנרשמות ביקשו להתקבל לחוגים אלה. אופס.
תופעות כאלה אינן נדירות כלל וכלל, ויש שפע של דוגמאות נוספות (ראו למשל בערך של ויקיפדיה על הנושא). הוול סטריט ג'ורנל, למשל, העלה את השאלה הבאה: האם נתוני האבטלה במשבר הכלכלי הנוכחי גרועים יותר מאלה של המשבר של תחילת שנות ה-80 של המאה הקודמת? נראה שלא, או לפחות עדיין לא: בנובמבר 1982 עמד אחוז המובטלים בארה"ב על 10.8%, בעוד שבאוקטובר 2009 היה אחוז המובטלים 10.2%. אבל, בקרב העובדים בעלי תואר אקדמי אחוז האבטלה ב-2009 גבוה מזה של 1982, וכך הדבר גם בקרב בעלי השכלה אקדמית חלקית, בוגרי תיכון, ובעלי השכלה תיכונית חלקית. מה שקורה הוא שכיום יש יותר בעלי השכלה אקדמית, שבקרבם אחוז האבטלה נמוך יחסית לקבוצות האחרות, והרבה פחות בעלי השכלה תיכונית חלקית, שבקרבם תמיד אחוז האבטלה גבוה יותר. אחוז האבטלה הכולל הוא ממוצע משוקלל על פי גודל תת האוכלוסיה, וכאשר משקלם של האקדמאים גבוה יותר, הם מושכים את הממוצע המשוקלל כלפי מטה.
באותו אופן, כאשר יותר נשים נרשמות לחוגים עם אחוזי קבלה נמוכים, הן מושכות את הממוצע המשוקלל של נתוני הקבלה לנשים כלפי מטה, בעוד שהגברים שנרשמו ברובם לחוגים עם תנאי קבלה קלים מושכים את הממוצע המשוקלל של נתוני קבלת הגברים כלפי מעלה.
ואם נחזור לבארט ויוחנן, הנה נתוני הקליעות שלהם:
|
בארט |
יוחנן |
||
|
מחצית ראשונה |
נסיונות |
10 |
20 |
|
קליעות |
4 |
10 |
|
|
אחוז קליעה |
40% |
50% |
|
|
מחצית שניה |
נסיונות |
20 |
10 |
|
קליעות |
16 |
9 |
|
|
אחוז קליעה |
80% |
90% |
|
|
כל המשחק |
נסיונות |
30 |
30 |
|
קליעות |
20 |
19 |
|
|
אחוז קליעה |
67% |
63% |
כל שחקן זרק את הכדור לסל 30 פעם במהלך המשחק, ובסך הכל יוחנן החטיא פעם אחת יותר מבארט. אבל בארט לקח את רוב הזריקות שלו במחצית השניה בה שני השחקנים התעלו, בעוד יוחנן הרבה לזרוק לסל במחצת הראשונה, בה גם הוצגה יכולת טובה, אבל פחות טובה מהיכולת המופלאה של המחצית השניה.
מה שראינו בשתי הדוגמאות היא נוכחות של משתנה מתווך (confounding variable). בדוגמת הכדורסל המשתנה המתווך הוא מחצית המשחק. אני מניח שיתפתח ויכוח האם תואר השחקן המצטיין אכן מגיע לבארט, או שמא יוחנן היה טוב יותר. מי היה נבחר אילו יוטה ניצחה במשחק? האם החלוקה למחציות משנה משהו? מה היה קורה לו היינו מסתכלים על נתוני המשחק לפי רבעים? האם יש טעם להסתכל על נתונים חלקיים של המשחק ולא על המשחק כשלם?
משתנה מתווך הוא משתנה המסביר את מבנה הקשר בין שני משתנים אחרים. דנתי בנושא כבר ברשימה הראשונה שפורסמה אי פעם בבלוג הזה (האם החסידה מביאה ילדים לעולם?). הדוגמא הקלאסית היא הקשר בין מספר הנעליים לידע במתמטיקה: בכל בית ספר תמצאו כי לתלמידים שמספר הנעליים שלהם גדול יותר יש ידע רב יותר במתמטיקה (גילוי נאות: מספר הנעליים שלי הוא 46). מהו המשתנה המתווך בדוגמא זו?
בדוגמת נתוני האבטלה המשתנה המתווך הוא ההשכלה, ובדוגמא של אוניברסיטת ברקלי הדברים לדעתי קצת יותר ברורים. אין טעם, לדעתי, להסתכל על הנתונים הכוללים של האוניברסיטה, ויש לבחון מה המצב בכל חוג בנפרד. החוג (ומדיניות הקבלה שלו) הוא משתנה מתווך בין המגדר ובין אחוז הקבלה הכולל.
בזמנו פרסמתי כאן בבלוג רשימה שעסקה בנושא הממוצע המשוקלל תחת הכותרת "ממוצע משוקלל – איך ולמה" שזכתה לתגובות רבות ועוררה פולמוס עז בתגובות. הטענה שטענתי שם, ואני עדיין עומד מאחוריה, היא כי יש טעם בחישוב ממוצע משוקלל רק אם המשקלות מתאימים, ובמקרה של מיצוע יחסים, המשקל המתאים הוא המשתנה שבמכנה. כך, טענתי, יש למצע מהירויות תוך כדי שקלול בזמני התנועה, יחסי חוב-תוצר יש לשקלל בתוצר, וכן הלאה. שימו לב כי כל המדדים הכוללים שהובאו כאן הם ממוצעים משוקללים נכונים. בדוגמת הכדורסל אחוז הקליעות הכולל של כל שחקן הוא ממוצע משוקלל של אחוזי הקליעות בכל מחצית כשהמשקלות הם מספר הזריקות לסל בכל מחצית. בדוגמא של אוניברסיטת ברקלי, אחוז הקבלה הכולל של הנשים (גברים) הוא ממוצע משוקלל של אחוזי הקבלה של הנשים (גברים) בכל חוג, כשהמשקלות הם מספר הנשים (גברים) שניסו להתקבל לכל חוג. בדקו זאת!
את הרשימה על הממוצע המשוקלל כתבתי כהמשך לרשימה קודמת בנושא "ממוצע פוליטי" שם יצאתי נגד חישוב ממוצע כלשהו באחד ממסמכי משרד האוצר, וטענתי (או יותר נכון, תמכתי בסבר פלוצקר שטען) כי על האוצר היה להשתמש בממוצע משוקלל ולא בממוצע פשוט. אז הנה אשאל את השאלה לפני שתעלה בתגובות. אם הממוצע המשוקלל בברקלי הוא ממוצע משוקלל על פי המשקלות הנכונים, כפי שאני טוען, הרי שברקלי אכן הפלתה נשים לרעה בקבלה לאוניברסיטה. ורק לפני כמה פסקאות נכתב כאן כי אין לדון בממוצע המשוקלל אלא הנתונים הפרטניים???
גם כאן יש לי תשובה, אך היא אינה מתמטית. התשובה שלי היא שיש תמיד לזהות את המשתנה המתווך (אם ישנו כזה) ולהעריך את חשיבותו לטיב הקשר בין המשתנים (ראו את תגובתו המצויינת של דודי קינג לרשימה "ממוצע פוליטי") . סטטיסטיקאי טוב (כמו פיטר ביקל, למשל) יעשה את זה, ולא יסתפק רק בהצבת נתונים בנוסחאות. אין כל ספק שאחוז הקבלה הכולל של נשים באוניברסיטת ברקלי נמוך מזה של הגברים. כל מי שיודע לחשב ממוצע יכול לומר את זה. השאלה החשובה היא האם האחוז הנמוך נובע מאפליה מכוונת או מסיבות אחרות, ולשם כך צריך גם קצת חשיבה סטטיסטית, לא רק חישובים סטטיסטיים.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 23 בפברואר, 2010. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 6
| טראקבק
דיאגרמת העוגה "הטובה ביותר" בכל הזמנים
הנה היא – בחסות חדשות FOX (המקור: FlowingData):

אם פעם חשבתם שאי אפשר לאכול את העוגה ולהשאיר אותה שלמה, באו חכמי פוקס ולימדו אותנו איך אפשר לאכול 193% מהעוגה.
בהזדמנות זו, אני מפנה את הקוראים לפוסט של טל גלילי על ההיסטוריה של תרשימי העוגה ועל חלק מהבעיות שכרוכות בהם.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 8 בדצמבר, 2009. נושאים: אותי זה מצחיק.
תגובות: 3
| טראקבק
הרהורים על תקציב התרבות
לא, אני לא באמת מהרהר על תקציב התרבות. אבל קראתי את תחילתו של טור הדיעה שפרסם רותם סלע היום בגלובס. תחת הכותרת "תקציב התרבות חונק את הפריפריה" כותב סלע כי "כ-40% מההקצבות (תקציב התרבות י.ל.) מופנות למוסדות בתל אביב שתושביה מהווים כ-5% בלבד מאוכלוסיית המדינה".
אני לא רוצה להכנס לכל המשנה הסדורה שסלע מנסח בהמשך מאמרו. בהחלט יכול להיות שהוא צודק. יש לי בעיה עם הטיעון הכמותי שלו. נכון שבתחומי העיר תל-אביב-יפו חיים כ-5% מאוכלוסיית המדינה, אבל תל-אביב היא קצת יותר מהתחום המוניציפלי. במטרופולין של תל אביב חיים כ-3.2 מיליון איש, שהם כ-45% מתושבי המדינה, לא 5%. את הנתון הסטטיסטי הזה סלע לא לוקח בחשבון. הוא לא תומך בטיעון שלו (ולמען האמת, גם הנתון שהוא הביא – מיותר).
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 26 במאי, 2009. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 3
| טראקבק
הסטטיסטיקן הממשלתי וקו העוני: חוסר הבנה או ציניות?
הפרסום התקופתי של דו"ח העוני בשבוע שעבר נתן למירב ארלוזורוב עוד הזדמנות להביע את דעותיה על גבי העיתון בו היא כותבת, דה-מרקר. ארלוזורוב בחרה שלא לכתוב מאמר דיעה, אלא נקטה בטכניקה אחרת, פרסום שלושה ראיונות עם שני אינטרסנטים במסווה של ידיעה עיתונאית.
ברשימה של היום אדון בידיעה שהקדישה ארלוזורוב לדבריו של הסטטיסטיקן הממשלתי, פרופ' שלמה יצחקי, שאינו סטטיסטיקאי אלא כלכלן. יצחקי אמר לארלוזורוב: "קו העוני הוא קו מטופש, מכיוון שהוא נתון למניפולציות של האוצר ושל משרד הרווחה". ועוד אמר: "חיתוך ההתפלגות של האוכלוסייה בנקודה מסוימת, כדי לקבוע שכל מי שנמצא מתחתיה נחשב לעני, הוא חסר חשיבות". במקום קו שרירותי, מדווחת ארלוזורוב, מציע יצחקי לקבוע קו אחיד; למשל, לקבוע כי שני העשירונים התחתונים של האוכלוסייה ייחשבו לעניים. אבל יצחקי מפגין גם נדיבות: הוא מוכן לחשב את קו העוני ללא תוספת תקציב במקום המוסד לביטוח לאומי. זה דורש יום אחד של עבודה, הוא אומר. הוא לא דורש תקציב, אבל בהחלט מבהיר את המחיר: "אצלי", אומר יצחקי, "קו העוני יהיה סתם עוד נתון סטטיסטי אחד".
עד כאן דברי הסטטיסטיקן הממשלתי.
מה באמת אומר יצחקי? בוא נעבור על הטיעונים אחד לאחד.
"קו העוני הוא קו מטופש, כיוון שהוא נתון למניפולציות". הוא אכן מביא דוגמאות, כגון עדכון או אי-עדכון מדרגות המס. אם לא מעדכנים את המדרגות (דבר שאסור על פי החוק, אז לא ברור לי איך זה קורה), אומר יצחקי, הכנסתם של משלמי המסים יורדת ולכן גם השכר החציוני יורד ועימו קו העוני. לא נכון, מר יצחקי. קודם כל, טבלאות השכר, וגם חישובי קו העוני, נעשים על פי שכר הברוטו, אז מה לחישובי מס ההכנסה ולקו העוני? וגם אם החישוב היה נעשה על פי שכר הנטו ולא על פי שכר הברוטו, הטעון של יצחקי לא ממש מדוייק. ב-2006, למשל, היה השכר החציוני 5246 שח לחודש (קישור לאתר הלמ"ס, קובץ pdf). סף המס באותה שנה, (ההכנסה החודשית המינימלית שבגינה משלמים מס הכנסה) נע בין 4005 שח לגבר שאינו משפחה חד הורית, 4560 שח לאשה ללא ילדים, 5370 שח לאשה נשואה עם ילד אחד, ועד 6178 שח לאשה נשואה עם שני ילדים. במלים אחרות, סף המס קרוב למדי לשכר החציוני. השינויים שחלים בערכים שמעל החציון בגלל "מניפולציות" כביכול במדרגות המס, לא חלים בערכים שמתחת לחציון, והחציון יישאר בערך באותו מקום (לא בדיוק, כי סף המס אינו שווה בדיוק לחציון), ועימו יישאר גם קו העוני השווה למחצית החציון. ה"מניפולציות" שיצחקי תיאר לא משפיעות על קו העוני באופן משמעותי, והסבריו של יצחקי מעידים על חוסר הבנה או ציניות.
האם חיתוך ההתפלגות של האוכלוסיה בנקודה מסוימת, כדי לראות איזה אחוז נמצא מתחת לקו החיתוך ואיזה אחוז מעליו הוא חסר חשיבות? יצחקי לא טורח להסביר מדוע, כי אין לו הסבר. אם זהו נתון כל כך חסר חשיבות, מדוע הוא טורח כל כך להשמיץ אותו? ברור שלנתון יש חשיבות. ראשית, המתודולוגיה של קביעת ערך סף היא מתודולוגיה מדעית מקובלת, במדעי החיים, למשל, אך לא רק שם. את הטיעון העיקרי אומר בדברים שיצחקי עצמו כתב לי לפני כשנתיים: "במידה ויש נושא חשוב לדיווח שיטתי בסטטיסטיקה הרשמית הרי שהוא קיים לאורך זמן ולא בגלל שמישהו כרגע העלה את הנושא לראש שמחתו. כלל זה גם מעוגן בתקנות בינלאומיות המדגישות את הצורך לאי תלות של סטטיסטיקה ממלכתית באירועים פוליטיים". ובמלים פשוטות: חשיבותו של נתון זה נובעת מכך שפרסומו לאורך זמן מאפשרת מעקב אחרי השינויים בחלוקת ההכנסות ואחרי הדינמיקה של האוכלוסיה שבתחתית סולם ההכנסה. אני מסכים שאפשר היה לבחור מדד אחר, אולי בעל עדיפות מתודולוגית כלשהי על המדד הנוכחי. אפשר אולי גם להחליף אותו במדד אחר, אם הדבר ייעשה באופן שיאפשר את המעקב (למשל, תקופת מעבר בה יפורסמו שני המדדים גם יחד)*. אבל להגיד שהמדד לא חשוב – זה חוסר הבנה או ציניות.
טוב, בואו נבחר מדד אחר. מה בקשר להצעת יצחקי כי שני העשירונים התחתונים של האוכלוסייה ייחשבו לעניים? יש כאן כמה בעיות. ראשית, זהו מדד יחסי, כמו המדד הנוכחי שיצחקי ואחרים כל כך מתעבים. שנית, הוא לא ילמד אותנו דבר על שיעור העוני באוכלוסיה, כי שני העשירונים התחתונים מהווים תמיד 20% מהאוכלוסיה. היתרון: לא יהיה גידול בעוני, לפחות לא בשיעור באוכלוסיה, אם כי מספר העניים המוחלט לפי מדד יצחקי ילך ויגדל עם גידול האוכלוסיה. הרי לכם מדד מטופש וחסר חשיבות. האם יצחקי באמת לא מבין מה הוא הציע, או שזו פשוט הצעה צינית שתאפשר לו ולחבריו לטאטא את בעיית העוני אל מתחת לשטיח?
ולסיום, הבה נדון בהצעתו הנדיבה של יצחקי לחשב את קו העוני ללא תוספת תקציב. ביננו, זה לא ייקח יום עבודה, לי זה לקח חמש דקות (למצוא את השכר החציוני בטבלה ולחלק ב-2, כולל הזמן שהוקדש לחיפוש אחרי המחשבון בתוך ארגז הצעצועים של בני הצעיר). ובלמ"ס יש הרבה סטטיסטיקאים מוכשרים. המחיר בו נוקב יצחקי הוא מחיר הרבה יותר גבוה מתוספת תקציב. "אצלי זה יהיה סתם עוד נתון". נתון שייקבר בין טבלאות נתונים אחרים, נתון שננסה לחפש אחריו ונקבל תשובות סתומות מהלמ"ס (כמו הנתון על מספר המורים ושכרם הממוצע, שלא נמצא עד היום). יצחקי מבקש שנרשה לו לקחת את נתוני העוני ולהעלים אותם, ובכך לשבש את הדיון הציבורי בנושא. כאן אני בטוח שיצחקי מבין היטב מה הוא מציע. וזוהי הצעה צינית. נקודה.
* למיטב זכרוני, העיתונאי אריה כספי ז"ל השווה בשעתו מספר מדדי עוני אלטרנטיביים, כולל מדד מוחלט, והגיע למסקנה (הבלתי מפתhעה) כי כל המדדים שבחן מתנהגים באןפן דומה לאורך זמן (כלומר, קיים בינהם מתאם), ולכן לא ממש משנה באיזה מדד משתמשים. אני מקווה למצוא את הציטוט בספר המקבץ את מבחר מאמריו ולהביא ואתו בפניכם.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 1 בפברואר, 2009. נושאים: כלכלה וחברה, מה אומרת הסטטיסטיקה, על סדר היום.
תגובות: 6
| טראקבק
הגיחוך היומי: נתניהו מבטיח להעלות את שכר המינימום
כן, כן, ביבי נתניהו מבטיח שאם ייבחר (למה בדיוק?) יעלה את שכר המינימום.
רגע, רגע, ביבי היה פעם שר האוצר? לא? הוא היה שר האוצר במשך כשנתיים וחצי, בתאריכים 28 בפברואר 2003 – 9 באוגוסט 2005. למה הוא לא העלה אז את שכר המינימום? אולי בגלל שמשרד האוצר, שבראשותו עמד, פרסם "מחקר" בו "הוכיח" באותות ובמופתים כי שכר המינימום הינו "מסוכן ומזיק"?
נברתי בארכיון שלי ומצאתי רשימה (שפרסמתי לראשונה באתר "רשימות") שכותרתה: מחקר האוצר על "שכר המינימום ונזקיו" – קריאה ביקורתית. הרשימה הזו פורסמה לראשונה בתאריך 27 בנובמבר 2004, בערך באמצע כהונת ביבי בתפקיד שר האוצר. תחליטו עכשיו לאיזה ביבי אתם מאמינים. לזה שלא עשה כאשר הייתה בידו היכולת לעשות, או לזה שמבטיח הבטחות לפני הבחירות.
לקריאה נוספת בנושאים הקשורים לנושא רשימה זו
נשלח: 1 בפברואר, 2009. נושאים: על סדר היום.
תגובות: 2
| טראקבק