חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

ארכיב עבור תגית מה אומרת הסטטיסטיקה

איך סופרים את המתים

בתחילת אוגוסט 2014 השתתפתי בכנס האיגוד האמריקני לסטטיסטיקה בבוסטון, שם נכחתי בשני מושבים שעסקו בנושא של אמידת מספר הנפגעים/הרוגים בסכסוכים אלימים. רשימה זו מבוססת על ההרצאות ששמעתי.

בערך של ויקיפדיה על הסכסוך/מלחמת אזרחים בקולומביה מצויין כי נהרגו בסכסוך (נכון לעד מתי?) 4286 חיילים ושוטרים, וכן 13197 מבין חברי שני הארגונים הנאבקים בכוחות הממשלה. איך הם הגיעו למספרים האלה? וברמת דיוק כל כך גבוהה? מספר ההרוגים הכללי בסכסוך, על פי המקורות שויקיפדיה מצטטת, הוא הרבה יותר ערטילאי: בין 50 ל-200 אלף. האם ניתן להגיע למספר מדוייק יותר?

נתוני מספר ההרוגים בסכסוך בקולומביה כפי שהם מוצגים בויקיפדיה

 

שאלות דומות עולות בכל סכסוך. עד כמה מדוייקים מספרי ההרוגים המתפרסמים בדבר מלחמת האזרחים בסוריה? או בעירק? כמה אזרחים נהרגו בסכסוך האחרון בעזה? מדובר בבעיה סטטיסטית לא פשוטה. אנסה להסביר בקצרה ובפשטות את הבעיה ואת הגישות להתמודדות איתה.

מתברר שבל סכסוך אלים יש אנשים וארגונים העוסקים בתיעוד מקרי המוות (כמו ד"ר אשרף אל-קודרה בעזה). במקרה של הסכסוך בקולומביה, ד"ר שירה מיטשל מאוניברסיטת הארווארד הציגה נתונים שנאספו על ידי שישה ארגונים שונים, שלושה מהם ממשלתיים, לאורך תקופות זמן משתנות. בסוריה, לפי ד"ר מגאן פרייס מה-Human Rights Data Analysis Group, יש כחמישה ארגונים האוספים את נתוני ההרוגים, ואילו ד"ר דניאל מנריק-ואלייר מאוניברסיטת אינדיאנה אמד את מספר ההרוגים במלחמת האזרחים בקוסובו על סמך דיווחים של ארבעה ארגונים שונים. בכל מקרה, הדיווחים הם רשימות של שמות ההרוגים, לעיתים בתוספת מידע נוסף אודות ההרוגים (למשל גיל, מין, מקום מגורים) או נסיבות מותה (כמו לדוגמה הפצצה או הוצאה להורג).

נתוני ארבע רשימות הרוגים מממלחמת האזרחים בקוסובו, כפי שהוצגו על ידי דניאל מנריק-ואלייר בכנס JSM2014

 

בפני הסטטיסטיקאים המנסים לאמוד את סך ההרוגים הכללי בסכסוך עומדות שתי בעיות. הבעיה הראשונה היא לזהות אנשים שמותם מתועד יותר מפעם אחת. ייתכן כי מותו של אדם מסויים מופיע בשתי רשימות (או יותר) שהכינו ארגונים שונים, או אפילו מופיע פעמיים (או יותר) באותה רשימה. בשלב הראשון יש לעבור על כל הרשומות שבכל הרשימות, ולהשוות כל זוג רשומות כדי לקבוע האם מדובר באותו אדם או בשני אנשים שונים. האם יוסי לוי ויוסף לוי הם אותו אדם? מה בקשר לשני שמות פחות דומים אך יותר נדירים, לגביהם מקום המוות, זמנו ונסיבותיו זהות? צריך לבדוק כל מקרה (למעשה כל זוג מקרים) לגופו. זה לוקח זמן. אם בסך כל הרשימות יש 1000 רשומות של מקרי מוות, יש לנו כמעט חצי מיליון זוגות שצריך להשוות. כאשר מדובר ב-100,000 רשומות (וזה לא מספר דמיוני, בסוריה מדובר עד כה על כ-170 אלף הרוגים, ואם מדובר ב-5 רשימות אזי מספר הרשומות יכול להגיע בקלות לחצי מיליון), יש כבר 50 מיליון זוגות של רשומות שצריך להשוות. אין שום סיכוי לבצע את העבודה הזו באופן ידני, ויש להסתמך על עזרת המחשב והסטטיסטיקה. הרעיון הוא לבדוק מספר מצומצם של זוגות רשומות ובאופן ידני (כמה אלפים בדרך כלל) ולסווג אותן כמתארות אותו אדם או שני אנשים שונים. בעזרת הסיווג הידני והנתונים הנלווים לכל שם בונים מודל סטטיסטי שמחשב לכל זוג רשומות את ההסתברות כי הן מתארות בעצם את אותו האדם. בעזרת הפרמטרים של המודל הסטטיסטי אפשר לתכנת כעת אלגוריתם שישווה באופן אוטומטי את כל הזוגות ויקבע לכל אחד מהם האם מדובר באותו אדם (אם ההסתברות המחושבת גבוהה מסף מסויים) או לא. תהליך זה נקרא למידה סטטיסטית.[1]

לאחר שמסתיים תהליך ההשוואה וזיהוי הרשומות הכפולות, אנו נותרים למעשה עם נתונים מזוקקים, האומרים לנו כמה הרוגים נספרו רק ברשימה הראשונה, כמה ברשימה הראשונה והשניה, כמה ברשימה הראשונה והשלישית, וכך הלאה, עד מספר ההרוגים ששמם הופיע בכל הרשימות. מנתונים אלה אנחנו יכולים לקבל הערכת רצפה של מספר ההרוגים – זהו סך כל מספר הרשומות השונות בכל הרשימות. וכאן מופיעה הבעיה הסטטיסטית השניה: איך נדע מהו מספר האנשים שנהרגו אך שמם לא הופיע אף לא ברשימה אחת? סביר להניח כי יש גם כאלה. השיטה הסטטיסטית להתמודדות עם הבעיה הזו ידועה בשם "תפוש ותפוש שוב" ("capture – recapture") ואנסה לתאר אותה בפשטות בפסקאות הבאות.

נניח שאנחנו רוצים לדעת כמה דגים יש באגם מסויים. אפשר לאמוד מספרם בצורה הבאה: תופסים מספר מסויים של דגים, נניח 1000, מסמנים כל אחד מהם בנקודה אדומה, ומחזירים אותם לאגם. כעת באגם יש X  דגים, 1000 מתוכם מסומנים. ממתינים זמן מה כדי שהדגים המסומנים יתפזרו ברחבי האגם ויתערבבו עם חבריהם, ואז תופסים שוב 1000 דגים, ובודקים כמה מתוכם מסומנים בנקודה אדומה. אם 50 מתוך האלף מסומנים, מסיקים כי פרופורציית הדגים המסומנים באגם היא 5%, ומכיוון שידוע לנו כי יש באגם 1000 דגים מסומנים המהווים 5% מכלל הדגים באגם, ולכן אמדן של סך כל מספר הדגים באגם הוא 20,000.

מקרה ספירת המתים דומה. הדג המסומן בנקודה אדומה הוא המשל, ההרוג במלחמה הוא הנמשל. אבל יש כאן כמה בעיות. ראשית, במקרה של ספירת ההרוגים, בניגוד לספירת הדגים, אנחנו לא באמת יודעים כמה דגים מסומנים יש באגם. שנית, מה קורה אם מי שביצע את התפיסה השניה של הדגים היה רשלן, ודיווח אמנם כי תפס 50 דגים המסומנים בנקודה אדומה, אך שכח לספור ולכן לא דיווח כמה דגים תפס בסך הכל, מסומנים ולא מסומנים? לא נוכל לבצע את התרגיל הפשוט שביצענו קודם. נוכל כמובן לשלוח אותו לבצע שוב את המשימה, בתקווה שיבצע אותה טוב יותר, אך במקרה של ספירת ההרוגים, אין דרך מעשית לדגום קבוצה של אנשים ולבדוק מי מהם נהרג במלחמה ומי לא. הנתונים הטובים ביותר שנוכל לקבל הן הרשימות, כאשר חלק מהאנשים מופיעים ביותר מרשימה אחת.

הבעיה השלישית היא הקשה ביותר: בסיפור של הדגים, המתנו בין התפיסה הראשונה והשניה, כדי שהדגים יתערבבו בינם לבין עצמם ותיווצר אי תלות סטטיסטית בין המדגם הראשון למדגם השני. אין שום סיבה להניח כי אי תלות כזו קיימת בין רשימות ההרוגים השונות, אדרבא. כאן דרושה עזרתו של הסטטיסטיקאי, שיבנה מודל (או מספר מודלים) למבנה התלות בין הרשימות השונות. ייתכן מאוד כי מודלים שונים יתנו תוצאות שונות, ולסטטיסטיקה יש גם כלים להשוואה בין מודלים ובחירה במודל "הטוב ביותר" לפי קריטריון כזה או אחר.

אז בפעם הבאה שאתם רואים הערכות שונות למספר ההרוגים בסכסוך מסויים (ובעצם הערכות שונות לספירה כמותית של פרטים או פריטים כלשהם), התייחסו למספרים בספקנות. שאלו אולי לגבי השיטות הסטטיסטיות שבהן נעשה שימוש. התעקשו על קבלת מדד למידת אי הודאות שבאמדן (סטיית תקן, רווח סמך וכדומה). ואל תכעסו אם אתם נתקלים בשני אמדנים שונים. מדובר בבעיה סטטיסטית קשה, וגישות שונות לפתרונה יביאו ככל הנראה לתוצאות שונות.

 

מקורות (הרצאות בכנס JSM, בוסטון, אוגוסט 2014):

* Global Impact: Statistical Analyses of Conflict Data in Syria, Guatemala, and Colombia — Shira Mitchell, Harvard ; Al Ozonoff, Harvard ; Kristian Lum, Virginia Tech ; Alan M. Zaslavsky, Harvard ; Brent Coull, Harvard School of Public Health

* Estimating Undocumented Deaths During the Syrian Conflict — Patrick Ball, Human Rights Data Analysis Group ; Anita Gohdes, Human Rights Data Analysis Group ; Megan Price, Human Rights Data Analysis Group

* Record Linkage and Capture-Recapture in the the Analysis of Genocide in Guatemala — Patrick Ball, Human Rights Data Analysis Group

* Large-Scale Clustering Approaches for Identifying Unique Human Rights Violations — Samuel Ventura, Carnegie Mellon

* Bayesian Multiple-Recapture Estimation of Casualties in Armed Conflicts Using Nonparametric Mixtures — Daniel Manrique-Vallier, Indiana University


הערות
  1. 1. אנשים מתחום מדעי המחשב מעדיפים לכנות תחום זה בשם "למידה ממוכנת". []

עוני, פיתוח כלכלי וסטטיסטיקה על כוס שמפניה

רשימה זו היא החמישית והאחרונה בסדרת הרשימות הסוקרות את גיליון פברואר של כתב העת Significance, המוקדש לנושאי העוני והפיתוח הכלכלי. עורך המגזין, ג'וליאן צ'אמפקין, כותב במדור הויזואליזציה על אפקט כוס השמפניה.[1]

כולכם בודאי שמעתם על כלל ה-80/20. 20% האנשים העשירים בעולם מחזיקים בידיהם 80% מעושר העולם, המשאבים, הכל. ל-20% העניים ביותר יש, ובכן, כמעט שום דבר. איך יוצגו נתונים אלו בצורה שהמסר יועבר?

אינפוגרפיקה זו הופיעה לראשונה בדו"ח הפיתוח האנושי של האו"ם משנת 1992. מאז שוחזרה פעמים רבות, מכיוון שהיא ברורה מאוד, אינטואיטיבית מאוד. היא מספרת סיפור, וזה מה שחשוב. היא מציגה נתונים, אבל הם לא העיקר כאן. המסר הוא בצורה.

 conley_champagne_distribution

נתוני חלוקת ההכנסות בעולם בשנת 2008

אולי אנחנו לא מבינים בכלכלה, כותב צ'אמפקין, אבל אנחנו יודעים מהי שמפניה. זהו המשקה ששותים העשירים. זהו סמל הצריכה הראוותנית, ההדוניזם, הכסף המבוזבז שעדיף היה להשקיע אותו ב-… כל דבר אחר, בעצם. אם תנסו להציג את נתוני חלוקת העושר בעזרת כוס בירה, המסר לא יעבוד.

האם גרף כוס השמפניה מטעה? בפירוש לא. אין כאן כל עיוות של הנתונים. הגרף לא גורם לצופה לחשוב שחלקו של החמישון העליון גדול יותר או קטן יותר בצורה משמעותית מהחלק האמיתי, וכך גם לגבי החמישונים האחרים.

האם הגרף מניפולטיבי? צ'אמפקין חושב שכן. נכון, הוא מנגן על התת מודע של הצופים. לפרסומאים מותר לעשות את זה. גם לסטטיסטיקאים של האו"ם. יש להם מסר להעביר בדבר עוצמתו של אי השוויון בעולמנו, והמסר עובר. אני מסכים איתו.

רשימות נוספות בסדרה:


הערות
  1. 1. Champkin, J. (2014), The champagne glass effect. Significance, 11: 39–41. doi: 10.1111/j.1740-9713.2014.00726.x []

עוני, פיתוח כלכלי וסטטיסטיקה: האם סיוע בינלאומי הוא בזבוז כסף?

רשימה זו היא הרביעית בסדרת הרשימות הסוקרות את גיליון פברואר של כתב העת Significance, המוקדש לנושאי העוני והפיתוח הכלכלי. היא סוקרת מאמר דיעה מאת אואן בארדר, סטטיסטיקאי בכיר במרכז לפיתוח גלובלי.

ההתנגדויות לסיוע בינלאומי למדינות מתפתחות אינן חדשות. "סיוע בינלאומי הוא מנגנון הממסה אנשים עניים במדינות עשירות לצורך מימון אורח החיים של אנשים עשירים במדינות עניות" – כתב הכלכלן הבריטי פטר באואר[1] ב-1976. 33 שנים לאחר מכן כתבה הכלכלנית ילידת זמביה דאמביסה מויו בספרה (אותו הקדישה לפטר באואר) כי הסיוע הבינלאומי למדינות אפריקה טיפח תלות כלכלית של מדינות אלה בסיוע, עודד שחיתות והנציח את העוני.

אואן בארדר מציע דרך אחרת לבחון את הנושא[2]. לפי נתוני ארגון OECD, מדינות הארגון העבירו כסיוע למדינות המתפתחות סכום כולל של כ-2.6 טריליון דולר, שהם כ-4.7 טריליון דולר במונחי 2013. מה קנה כל הסכום העצום הזה?

הבה נניח לרגע כי ההישג היחיד שהושג בזכות כספים אלה הוא מיגור והכחדת נגיף האבעבועות השחורות. להזכירכם, זוהי אחת המחלות הקטלניות ביותר בהיסטוריה האנושים, שגרמה ליותר מקרי מוות מאשר כל המלחמות גם יחד. המקרה האחרון של הדבקות במחלה היה בשנת 1977, בסומליה. כמה חיים ניצלו עקב הכחדת הנגיף? קשה לדעת, ההערכות נעות בין 60 ל-120 מליון איש[3] הבה נהיה שמרנים ונחלק 4.7 טריליון ב-60 מיליון. נקבל כי עלות הצלת 60 מליון איש ממוות ממחלת האבעבועות השחורות היא קצת יותר מ-78 אלף דולר לאדם. האם זה הרבה? מעט? מה עלות חייו של אדם בעולם השלישי? בבריטניה מקובל להניח כי הוצאה של 160 אלף דולר (או פחות) להצלת חיים נחשבת ליעילה[4]. בארה"ב הסף המקובל גבוה יותר.

כמובן שלא כל 4.7 טריליוני הדולרים הוצאו על הכחדת נגיף האבעבועות השחורות. עלות מבצע החיסון העולמי הייתה 1.5 מיליארד דולר "בלבד". גם שיעורי התמותה ממחלות זיהומיות, מלריה, חצבת, ומחלות נוספות ירדו, והצילו חיים של 10 מליון איש כל שנה (בערך פי שש מ-1.7 מקרי מוות מאבעבועות שחורות שנמנעו בכל שנה מאז 1978). חלק מהכסף הושקע גם בפיתוח חקלאי, שבודאי הציל עוד כמה עשרות או מאות מליונים ממוות ברעב, חלק הושקע בחינוך, ובמטרות ראויות נוספות.

אכן היו מקרים בהם תכניות סיוע נכשלו, ואף ייתכן כי ניתן היה למנוע חלק מהכישלונות על ידי ניהול טוב יותר. בודאי היו גם כשלונות בלתי ניתנים למניעה. סיוע למדינות מתפתחות, כותב בארדר, הוא סוג של כרטיס הגרלה, אבל הפרס הגדול הוא עצום, ולכן סך המאזן של ההשתתפות בהגרלה זו הינו חיובי, והתועלת עולה עשרות ומאות מונים על הנזק.

רשימות נוספות בסדרה:


הערות
  1. 1. שזכה בתואר לורד מידי ראש ממשלת בריטניה מרגרט תאצ'ר, ובפרס מילטון פרידמן בשנת 2002 []
  2. 2. Barder, O. (2014), Is aid a waste of money?. Significance, 11: 31–32. doi: 10.1111/j.1740-9713.2014.00723.x []
  3. 3.  Henderson, D. A. et al. (1988) Smallpox and its Eradication, Vol. 6. Geneva: World Health Organization. []
  4. 4. McCabe, C., Claxton, K. and Culyer, A. J. (2008) The NICE cost-effectiveness threshold: what it is and what that means. Pharmacoeconomics, 26(9), 733–744. []

עוני, פיתוח כלכלי וסטטיסטיקה: על הקשר בין התאבדויות איכרים בהודו וגידולים מהונדסים גנטית

רשימה זו היא השלישית בסדרת הרשימות הסוקרות את גיליון פברואר של כתב העת Significance, המוקדש לנושאי העוני והפיתוח הכלכלי. היא עוסקת במאמר בדבר הטענה כי יש קשר בין התאבדויות איכרים בהודו וגידולים מהונדסים גנטית[1]

גידולים מהונדסים גנטית נמצאים במוקדם של ויכוחים רבים. בקהילה המדעית יש קונצנזוס לגבי התועלת בגידולים כאלה, אם כי ברור שאין בהם פתרון לכל הבעיות בחקלאות בעולם השלישי. מנגד, יש פעילות רבה של התנגדות לגידולים כאלה, ואין להקל ראש גם בנימוקיהם, בודאי ללא בדיקה רצינית של הנתונים אותם הם מביאים. מטבע הדברים, רוב הנימוקים בעד ונגד מתבססים על נתונים סטטיסטיים, מה שמחייב הערכה ביקורתית של הנתונים, השיטות הסטטיסטיות לניתוחם, והפרשנות לממצאים.

בשנת 2008 העלה יורש העצר הבריטי, הנסיך צ'רלס, טענה חמורה כנגד הגידולים המהונדסים גנטית, כאשר התייחס לתופעה של התאבדות איכרים בהודו, וטען כי לפחות חלק מהמקרים נובע מגידולים מהונדסים גנטית שנכשלו והובילו להתרוששות כלכלית של אותם איכרים[2].

כיצד בודקים את נכונותה של טענה כזו? הדרך הטובה ביותר היא, כמובן, לתכנן ולערוך ניסוי פרוספקטיבי, שידגום שתי קבוצות איכרים, כאלה המשתמשים בגידולים מהונדסים גנטית, וכאלה שלא, ויעקוב אחריהם לאורך זמן (כולל הזמן שלפני המעבר לגידולים מהונדסים גנטית). מחקר כזה מעולם לא נערך. במקום זאת פנה איאן פלויס, פרופסור לסטטיסטיקה חברתית באוניברסיטת מנצ'סטר, לנתונים קיימים ממקורות רשמיים שונים. סוכנות נתוני הפשיעה הלאומית של הודו (NCRB) אוספת ומפרסמת נתונים על התאבדויות החל מ-1996, בחתכי מדינה, משלח יד ומגדר. בנתונים עלול להיות דיווח חסר ממספר סיבות, כגון חשש מתביעה פלילית (התאבדות היא עבירה פלילית בהודו), ואי דיווח נשים כחקלאיות (כיוון שהשטח החקלאי רשום על שם גבר). כאשר צורפו יחד נתוני ה-NCRB ונתונים שפורסמו בכתב העת המדעי Lancet ב-2012, ניתן היה לקבל אמדנים אמינים למספר האיכרים המתאבדים בכל אחת מ-9 מדינות הודו המגדלות ביחד יותר מ-90% מהכותנה בהודו, שבהן התמקד המחקר הנוכחי.

אין די במספר האיכרים המתאבדים. יש לדעת גם מהו מספר האיכרים הכולל, כדי לדעת מהו שיעור המתאבדים. גם מספר האיכרים משתנה משנה לשנה. יותר קשה לאמוד מספרים אלה. יש שני מקורות רשמיים למספר האיכרים. סקר האוכלוסין נערך מדי 10 שנים, ונערך לאחרונה ב-2011. ישנו גם סקר חקלאי, הנערך מדי חמש שנים. הנתונים בשני הסקרים אינם מושלמים, ופרופ' פלויס מתאר כיצד גזר מהם אמדנים למספר האיכרים בכל מדינה בכל שנה, מוסיף את האזהרות המתבקשות, ומציין את הבעיות הפוטנציאליות באמדניו ואת המחקר הנוסף הדרוש.

הממצא הראשון אולי מפתיע מעט: שיעורי ההתאבדות בקרב איכרים גברים בהודו נמוך מעט משיעורי ההתאבדות בקרב שאר האוכלוסיה. בקרב נשים העוסקות בחקלאות, לעומת זאת, נראה כי שיעורי ההתאבדות גבוהים יותר בהשוואה לנשים שלא עוסקות בחקלאות.

האם שיעורי ההתאבדות בקרב האיכרים משתנים לאורך זמן? התשובה היא חיובית. בקרב הגברים יש עליה מכ-25 ל-100000 ב-1996 לכ-35 ל-100000 ב-2005, ואח"כ יש ירידה עד לשיעור של כ-29 ל-100000 ב-2011. בקרב הנשים יש ירידה מתמדת, מכ-63 ל-100000 (!) ב-1996 לכ-29 ל-100000 ב-2011. למעשה, החל מ-2009 אין הבדל בשיעורי ההתאבדות בין גברים לנשים. הנתונים אינם תומכים בטענה כי שיעורי ההתאבדות עלו לאחר הכנסת גידולים מהונדסים גנטית לשימוש.

כל זאת ברמה הארצית. ברמה המדינתית, התמונה אינה אחידה, ובמדינות שונות שיעורי ההתאבדות מתנהגים באופן לאורך זמן. האם יש גורם נוסף שלא נלקח בחשבון?

מהנתונים ניתן לקבוע כי רק במדינת פאנג'ב אכן עלו שיעורי ההתאבדות בקרב האיכרים מאז שנת 2002. במדינת מהרשטרה, לעומת זאת, נצפית ירידה תלולה בשיעורי ההתאבדות מאז 2003. שתי מדינות אלה מגדלות כמעט מחצית מהכותנה בהודו (26% ו-20%, בהתאמה) ובשתיהן כ-56% מהכותנה המגודלת הינה מהונדסת גנטית. מאז 2002 הייתה ירידה ביבולים בפאנג'ב ועליה במדינת מהרשטרה. תוצאה זו מתאימה לתיאוריה כי יש מרכיב כלכלי המשפיע על שיעורי ההתאבדות.

המסקנה היא בדרך כלל ניתן לקשר את הנהגת השימוש בגידולים מהונדסים גנטית לירידה בשיעורי ההתאבדות בקרב איכרים בהודו (שגם הם נמוכים יחסית ללא-איכרים בהודו בפרט, ולמדינות העולם בכלל), ולסייג את הדברים בכך שיצויין כי בפאנג'ב נצפתה התנהגות שונה.

רשימות נוספות בסדרה:


הערות
  1. 1. Plewis, I. (2014), Indian farmer suicides: Is GM cotton to blame?. Significance, 11: 14–18. doi: 10.1111/j.1740-9713.2014.00719.x []
  2. 2. Daily Mail (2008) The GM genocide: Thousands of Indian farmers are committing suicide after using genetically modified crops. Mail Online, November 3rd. []

עוני, פיתוח כלכלי וסטטיסטיקה: האם מקור אי השוויון הוא בקצוות?

רשימה זו היא השניה בסדרת הרשימות הסוקרות את גיליון פברואר של כתב העת Significance, המוקדש לנושאי העוני והפיתוח הכלכלי.

הפעם אסקור מאמר המציג את הבעיה של מדידת אי השוויון בהכנסות, ומציע את מדד פאלמה כאלטרנטיבה למדדים המקובלים, ובראשם מדד ג'יני.[1]. הוא מתייחס בעיקר למדינות מתפתחות, אולם תקף גם למדינות מפותחות.

המאמר פותח במניית שלוש השפעות שליליות עיקריות של רמת אי השוויון בחלוקת ההכנסות, ומספק את בכך את המוטיבציה למדידה טובה ככל האפשר של רמתו:[2] אי-שוויון בהכנסות מעכב תהליכי צמיחה כלכלית; אי-השוויון  פוגע באחריויות (accountability) של הממשלה, ומגדיל את הסיכוי לנקיטת מדיניות כלכלית וחברתית הפוגעת בצמיחה ובהקטנת העוני; אי-השוויון מרסן תהליכי החלטה קולקטיביים הנחוצים לתפקודה של חברה בריאה.

מדד ג'יני, שהינו המדד המקובל ביותר למדידת רמת אי-השוויון בחלוקת ההכנסות, פותח בראשית המאה ה-20. הוא מקבל ערכים הנעים בין 0 ל-1, כאשר ערך 0 מציין שוויון מלא בחלוקת ההכנסות (לכל האנשים אותה הכנסה), וערך 1 מציין אי-שוויון מוחלט (אדם אחד נהנה מכל ההכנסות, כל השאר מחוסרי הכנסה). נניח שבמדינה מסויימת ערך מדד זה הוא 0.4. מהי המשמעות של ערך זה? ומה ההבדל בין מדינה זו ומדינה אחרת, בה ערך מדד ג'יני שווה ל-0.45? וכיצד תעזור ידיעת ערך המדד לקובעי המדיניות? ונניח שמדיניות כלכלית מסויימת הורידה את ערך המדד מ-0.45 ל-0.4. כיצד הושפעו מכך הרבדים השונים בחברה? מתברר כי מדד ג'יני מגלה רגישות יתר לשינויים במרכז התפלגות ההכנסות, ואינו רגיש במיוחד לשינויים שמתרחשים בקצוות. הוא לא ישקף בצורה טובה שינויים ברמת ההכנסות של העשירים ביותר ושל העניים ביותר בחברה.

מדד אלטרנטיבי הוצע על ידי הכלכלן הצ'יליאני חוזה גבריאל פאלמה. שהבחין כי ברוב במדינות, המעמד המכונה לעיתים "מעמד הביניים", אותם 50% מהאוכלוסיה הנמצאים בין העשירון ה-5 לעשירון ה-9[3], מכניס לכיסיו כ-50% מההכנסות. המחצית השניה של ההכנסות מתחלקת בין העשירון העליון, בעלי ההכנסות הגבוהות, ובין ארבעת העשירונים התחתונים, בעלי ההכנסות הנמוכות (שאכנה בשם "העשירונים התחתונים"). לכן הציע פאלמה להסתכל על היחס בין סך הכנסות העשירון העליון ובין סך הכנסות העשירונים התחתונים. ככל שיחס זה גבוה יותר, אי-השוויון גדול יותר. מדד זה נותן ביטוי לקצוות התפלגות ההכנסות, ואינו לוקח בחשבון את השינויים הפחות מעניינים שבמרכז ההתפלגות. המדד הינו אינטואיטיבי להבנה, גם עבור קובעי המדיניות וגם עבור האזרחים. אם ערך המדד גבוה, ברור מה צריך לעשות: להקטין את הכנסות העשירון העליון ובמקביל להגדיל את הכנסות העשירונים התחתונים. כלומר, מדד פאלמה רלוונטי יותר לדיון במדיניות לצמצום העוני.

במחקר שביצעו כותבי המאמר עבור מרכז הפיתוח העולמי של האו"ם[4] , הם וידאו באופן אמפירי את יציבותו ועמידותו של המדד: בהכנסת מעמד הביניים נצפתה שונות מועטה בין מדינות העולם, ושונות רבה בין ההכנסות של העשירונים העליונים, וכן בין ההכנסות של העשירונים התחתונים.

כמובן, יש חילוקי דעות בקרב הכלכלנים והסטטיסטיקאים העוסקים באי-השוויון בחלוקת ההכנסות והשלכותיו. מבלי לנקוט בשמות, את מדד פאלמה אוהבים אלה הסבורים כי יש חשיבות רבה למידת השקיפות והאחריותיות של קובעי המדיניות, ואלה הטוענים כי הקטנת אי-השוויון מהווה זרז מרכזי לצמיחה כלכלית. המתנגדים הם בדרך כלל כלכלנים הסבורים כי בעיית אי-השוויון היא בעיה משנית בחשיבותה, וכאלה הסבורים כי התכונות המתמטיות/טכניות של המדד חשובות יותר על פני אינטואיטיביות ההבנה[5] .

דוגמה נאה מדגימה את ההבדלים בין שני המדדים בעזרת נתוני הונדורס וברזיל. ערכו של מדד ג'יני בהונדורס הוא 0.57, ובברזיל 0.54, כלומר רמת אי השוויון בחלוקת ההכנסות כמעט זהה בשתי המדינות[6]. מדד פאלמה מראה תמונה שונה. ערכו בברזיל 2.23, כלומר חלקו של העשירון העליון בעוגה גדול קצת יותר מכפליים מהחלק של העשירונים התחתונים. אפשר לחשב ולמצוא כי העשירון העליון בברזיל מקבל לעצמו כ-35% מההכנסות, וארבעת העשירונים התחתונים מקבלים קצת יותר מ-15%. בהונדורס, לעומת זאת, מדד פאלמה שווה ל-5.21. זאת מכיוון שהעשירון העליון בהונדורס מקבל 42% מהעוגה, וחלקם של ארבעת העשירונים התחתונים שם הוא 8% בלבד.

הערה משלי לסיום: יהיה מעניין לראות איך מתנהג מדד פאלמה בישראל. אני מקווה לערוך את החישובים ולהביא אותם כאן.

רשימות נוספות בסדרה:


הערות
  1. 1. Cobham, A. and Sumner, A. (2014), Is inequality all about the tails?: The Palma measure of income inequality. Significance, 11: 10–13. doi: 10.1111/j.1740-9713.2014.00718.x []
  2. 2. הנושא חורג מתחום הסטטיסטיקה, אך אני מרחיב אותו כאן מפאת חשיבותו הרבה []
  3. 3. לא אכנס כאן להגדרת "מעמד הביניים". אני משתמש בטרמינולוגיה של כותבי המאמר []
  4. 4. Cobham, A. and Sumner, A. (2013) Is it all about the tails? The Palma measure of income inequality. CGD Working Paper 343, Center for Global Development, Washington, DC. []
  5. 5. הם יעדיפו ללא ספק את מדד Theil, שערכו שווה להפרש בין האנטרופיה המקסימלית האפשרית  ובין האנטרופיה הנצפית. עזבו, לא חשוב. []
  6. 6. כמו כן, מקובל לחשוב כי ערך הגבוה מ-0.5 מציין אי-שוויון משמעותי []