חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

ארכיב עבור תגית על סדר היום

איך סופרים את המתים

בתחילת אוגוסט 2014 השתתפתי בכנס האיגוד האמריקני לסטטיסטיקה בבוסטון, שם נכחתי בשני מושבים שעסקו בנושא של אמידת מספר הנפגעים/הרוגים בסכסוכים אלימים. רשימה זו מבוססת על ההרצאות ששמעתי.

בערך של ויקיפדיה על הסכסוך/מלחמת אזרחים בקולומביה מצויין כי נהרגו בסכסוך (נכון לעד מתי?) 4286 חיילים ושוטרים, וכן 13197 מבין חברי שני הארגונים הנאבקים בכוחות הממשלה. איך הם הגיעו למספרים האלה? וברמת דיוק כל כך גבוהה? מספר ההרוגים הכללי בסכסוך, על פי המקורות שויקיפדיה מצטטת, הוא הרבה יותר ערטילאי: בין 50 ל-200 אלף. האם ניתן להגיע למספר מדוייק יותר?

נתוני מספר ההרוגים בסכסוך בקולומביה כפי שהם מוצגים בויקיפדיה

 

שאלות דומות עולות בכל סכסוך. עד כמה מדוייקים מספרי ההרוגים המתפרסמים בדבר מלחמת האזרחים בסוריה? או בעירק? כמה אזרחים נהרגו בסכסוך האחרון בעזה? מדובר בבעיה סטטיסטית לא פשוטה. אנסה להסביר בקצרה ובפשטות את הבעיה ואת הגישות להתמודדות איתה.

מתברר שבל סכסוך אלים יש אנשים וארגונים העוסקים בתיעוד מקרי המוות (כמו ד"ר אשרף אל-קודרה בעזה). במקרה של הסכסוך בקולומביה, ד"ר שירה מיטשל מאוניברסיטת הארווארד הציגה נתונים שנאספו על ידי שישה ארגונים שונים, שלושה מהם ממשלתיים, לאורך תקופות זמן משתנות. בסוריה, לפי ד"ר מגאן פרייס מה-Human Rights Data Analysis Group, יש כחמישה ארגונים האוספים את נתוני ההרוגים, ואילו ד"ר דניאל מנריק-ואלייר מאוניברסיטת אינדיאנה אמד את מספר ההרוגים במלחמת האזרחים בקוסובו על סמך דיווחים של ארבעה ארגונים שונים. בכל מקרה, הדיווחים הם רשימות של שמות ההרוגים, לעיתים בתוספת מידע נוסף אודות ההרוגים (למשל גיל, מין, מקום מגורים) או נסיבות מותה (כמו לדוגמה הפצצה או הוצאה להורג).

נתוני ארבע רשימות הרוגים מממלחמת האזרחים בקוסובו, כפי שהוצגו על ידי דניאל מנריק-ואלייר בכנס JSM2014

 

בפני הסטטיסטיקאים המנסים לאמוד את סך ההרוגים הכללי בסכסוך עומדות שתי בעיות. הבעיה הראשונה היא לזהות אנשים שמותם מתועד יותר מפעם אחת. ייתכן כי מותו של אדם מסויים מופיע בשתי רשימות (או יותר) שהכינו ארגונים שונים, או אפילו מופיע פעמיים (או יותר) באותה רשימה. בשלב הראשון יש לעבור על כל הרשומות שבכל הרשימות, ולהשוות כל זוג רשומות כדי לקבוע האם מדובר באותו אדם או בשני אנשים שונים. האם יוסי לוי ויוסף לוי הם אותו אדם? מה בקשר לשני שמות פחות דומים אך יותר נדירים, לגביהם מקום המוות, זמנו ונסיבותיו זהות? צריך לבדוק כל מקרה (למעשה כל זוג מקרים) לגופו. זה לוקח זמן. אם בסך כל הרשימות יש 1000 רשומות של מקרי מוות, יש לנו כמעט חצי מיליון זוגות שצריך להשוות. כאשר מדובר ב-100,000 רשומות (וזה לא מספר דמיוני, בסוריה מדובר עד כה על כ-170 אלף הרוגים, ואם מדובר ב-5 רשימות אזי מספר הרשומות יכול להגיע בקלות לחצי מיליון), יש כבר 50 מיליון זוגות של רשומות שצריך להשוות. אין שום סיכוי לבצע את העבודה הזו באופן ידני, ויש להסתמך על עזרת המחשב והסטטיסטיקה. הרעיון הוא לבדוק מספר מצומצם של זוגות רשומות ובאופן ידני (כמה אלפים בדרך כלל) ולסווג אותן כמתארות אותו אדם או שני אנשים שונים. בעזרת הסיווג הידני והנתונים הנלווים לכל שם בונים מודל סטטיסטי שמחשב לכל זוג רשומות את ההסתברות כי הן מתארות בעצם את אותו האדם. בעזרת הפרמטרים של המודל הסטטיסטי אפשר לתכנת כעת אלגוריתם שישווה באופן אוטומטי את כל הזוגות ויקבע לכל אחד מהם האם מדובר באותו אדם (אם ההסתברות המחושבת גבוהה מסף מסויים) או לא. תהליך זה נקרא למידה סטטיסטית.[1]

לאחר שמסתיים תהליך ההשוואה וזיהוי הרשומות הכפולות, אנו נותרים למעשה עם נתונים מזוקקים, האומרים לנו כמה הרוגים נספרו רק ברשימה הראשונה, כמה ברשימה הראשונה והשניה, כמה ברשימה הראשונה והשלישית, וכך הלאה, עד מספר ההרוגים ששמם הופיע בכל הרשימות. מנתונים אלה אנחנו יכולים לקבל הערכת רצפה של מספר ההרוגים – זהו סך כל מספר הרשומות השונות בכל הרשימות. וכאן מופיעה הבעיה הסטטיסטית השניה: איך נדע מהו מספר האנשים שנהרגו אך שמם לא הופיע אף לא ברשימה אחת? סביר להניח כי יש גם כאלה. השיטה הסטטיסטית להתמודדות עם הבעיה הזו ידועה בשם "תפוש ותפוש שוב" ("capture – recapture") ואנסה לתאר אותה בפשטות בפסקאות הבאות.

נניח שאנחנו רוצים לדעת כמה דגים יש באגם מסויים. אפשר לאמוד מספרם בצורה הבאה: תופסים מספר מסויים של דגים, נניח 1000, מסמנים כל אחד מהם בנקודה אדומה, ומחזירים אותם לאגם. כעת באגם יש X  דגים, 1000 מתוכם מסומנים. ממתינים זמן מה כדי שהדגים המסומנים יתפזרו ברחבי האגם ויתערבבו עם חבריהם, ואז תופסים שוב 1000 דגים, ובודקים כמה מתוכם מסומנים בנקודה אדומה. אם 50 מתוך האלף מסומנים, מסיקים כי פרופורציית הדגים המסומנים באגם היא 5%, ומכיוון שידוע לנו כי יש באגם 1000 דגים מסומנים המהווים 5% מכלל הדגים באגם, ולכן אמדן של סך כל מספר הדגים באגם הוא 20,000.

מקרה ספירת המתים דומה. הדג המסומן בנקודה אדומה הוא המשל, ההרוג במלחמה הוא הנמשל. אבל יש כאן כמה בעיות. ראשית, במקרה של ספירת ההרוגים, בניגוד לספירת הדגים, אנחנו לא באמת יודעים כמה דגים מסומנים יש באגם. שנית, מה קורה אם מי שביצע את התפיסה השניה של הדגים היה רשלן, ודיווח אמנם כי תפס 50 דגים המסומנים בנקודה אדומה, אך שכח לספור ולכן לא דיווח כמה דגים תפס בסך הכל, מסומנים ולא מסומנים? לא נוכל לבצע את התרגיל הפשוט שביצענו קודם. נוכל כמובן לשלוח אותו לבצע שוב את המשימה, בתקווה שיבצע אותה טוב יותר, אך במקרה של ספירת ההרוגים, אין דרך מעשית לדגום קבוצה של אנשים ולבדוק מי מהם נהרג במלחמה ומי לא. הנתונים הטובים ביותר שנוכל לקבל הן הרשימות, כאשר חלק מהאנשים מופיעים ביותר מרשימה אחת.

הבעיה השלישית היא הקשה ביותר: בסיפור של הדגים, המתנו בין התפיסה הראשונה והשניה, כדי שהדגים יתערבבו בינם לבין עצמם ותיווצר אי תלות סטטיסטית בין המדגם הראשון למדגם השני. אין שום סיבה להניח כי אי תלות כזו קיימת בין רשימות ההרוגים השונות, אדרבא. כאן דרושה עזרתו של הסטטיסטיקאי, שיבנה מודל (או מספר מודלים) למבנה התלות בין הרשימות השונות. ייתכן מאוד כי מודלים שונים יתנו תוצאות שונות, ולסטטיסטיקה יש גם כלים להשוואה בין מודלים ובחירה במודל "הטוב ביותר" לפי קריטריון כזה או אחר.

אז בפעם הבאה שאתם רואים הערכות שונות למספר ההרוגים בסכסוך מסויים (ובעצם הערכות שונות לספירה כמותית של פרטים או פריטים כלשהם), התייחסו למספרים בספקנות. שאלו אולי לגבי השיטות הסטטיסטיות שבהן נעשה שימוש. התעקשו על קבלת מדד למידת אי הודאות שבאמדן (סטיית תקן, רווח סמך וכדומה). ואל תכעסו אם אתם נתקלים בשני אמדנים שונים. מדובר בבעיה סטטיסטית קשה, וגישות שונות לפתרונה יביאו ככל הנראה לתוצאות שונות.

 

מקורות (הרצאות בכנס JSM, בוסטון, אוגוסט 2014):

* Global Impact: Statistical Analyses of Conflict Data in Syria, Guatemala, and Colombia — Shira Mitchell, Harvard ; Al Ozonoff, Harvard ; Kristian Lum, Virginia Tech ; Alan M. Zaslavsky, Harvard ; Brent Coull, Harvard School of Public Health

* Estimating Undocumented Deaths During the Syrian Conflict — Patrick Ball, Human Rights Data Analysis Group ; Anita Gohdes, Human Rights Data Analysis Group ; Megan Price, Human Rights Data Analysis Group

* Record Linkage and Capture-Recapture in the the Analysis of Genocide in Guatemala — Patrick Ball, Human Rights Data Analysis Group

* Large-Scale Clustering Approaches for Identifying Unique Human Rights Violations — Samuel Ventura, Carnegie Mellon

* Bayesian Multiple-Recapture Estimation of Casualties in Armed Conflicts Using Nonparametric Mixtures — Daniel Manrique-Vallier, Indiana University


הערות
  1. 1. אנשים מתחום מדעי המחשב מעדיפים לכנות תחום זה בשם "למידה ממוכנת". []

כמה הערות על זרעים מהונדסים גנטית

זרעים מהונדסים גנטית מעוררים רגשות עזים בקרב אנשים מסויימים. מתברר שגם אצלי.

לפני כשבוע הופיעה באתר "המקום הכי חם בגיהנום" טור דיעה תחת הכותרת "זרע הפורענות". הכותב, יוסי דורפמן, יוצא נגד הסכם שנחתם לאחרונה בין משרד הכלכלה ותאגיד החקלאות המהונדסת גנטית וחומרי ההדברה מונסנטו. אתר "עבודה שחורה" חזר ופרסם חלק מטורו של דורפמן, ושם הגבתי ביום חמישי האחרון במלים הבאות:

"חשוב מאוד להפריד בין המהות של זרעים מהונדסים גנטית, שצופנים בתוכם תועלת רבה לאנושות, ובין ההתנהלות העסקית של תאגיד מונסנטו, שהיא אכן בעייתית.
הדרך הראויה להתמודדות היא לא להתעלם מההתקדמות המדעית/טכנולוגית שמאפשרת יבולים גדולים יותר ואיכותיים יותר, אלא להשית רגולציה נכונה על התאגיד."

אני חושב שהסברים נוספים מיותרים. זרעים מהונדסים גנטית מניבים יבולים גדולים יותר, ומתוכננים לעמוד בפני מזיקים שונים, שצמחים "רגילים" אינם עמידים אליהם. הם משקפים את היכולות המדעיות והטכנולוגיות אליהם הגיעה האנושות בשנים האחרונות.

אני גם רוצה לחזור ולהדגיש כי ההתנהלות העסקית של תאגיד מונסנטו (בעיקר בנושא תביעות על הפרות פטנטים) היא בעייתית גם בעיני. עם התנהלות זו יש להתמודד באמצעות רגולציה, חקיקה, וגם בעזרת שופטים שיעיפו לכל הרוחות תביעות לא מוצדקות[1] עם הוצאות משפט כבדות. אני בהחלט גם מתנגד לחקיקה ייעודית לטובת תאגידים בכלל ומונסנטו בפרט, לקשרי הון שלטון, לשוחד, ולפעולות פליליות אחרות.

ולאחר כל ההסתייגויות הנ"ל, אני רוצה להפנות את תשומת לב קוראיי לכמה אמירות בעייתיות של דורפמן.

דורפמן כותב כי מונסנטו מחזיקה ב-90% משוק הזרעים המהונדסים גנטית, וזה נכון. הסיבה לכך: מונסנטו מחזיקה ברוב הפטנטים בתחום, והפטנטים עדיין בתוקף. עם זאת, יש לשים לב כי החל ב-2015 יחלו פטנטים רבים לפקוע, וצפויה תחרות גדולה מצד יצרנים גנריים, בדיוק כפי שקורה בתעשיות אחרות, כגון תרופות וחומרי הדברה. לכן צפוי כרסום במונופול. עד אז, יש לזכור כי מונופולים מעצם הגדרתם נתונים לרגולציה (בישראל, על ידי הממונה על ההגבלים העסקיים). אני מקווה שהממונה לא יגלה אזלת יד בנושא זה.

בעניין שימוש חוזר בזרעים: למיטב ידיעתי, הזרעים הצמחים המהונדסים גנטית כלל אינם מניבים זרעים. הסיבה לכך נעוצה בטבע. אם יניבו צמחים אלה זרעים, יופיעו באופן טבעי מוטציות שונות שעשויות/עלולות לשנות את התכונות של הצמחים בדור הבא. אם רוצים להבטיח תכונות מסויימות של זרעים, המוטבעות בהם באופן גנטי, הדרך היחידה להבטיח זאת היא על ידי הנדוס. האם זה הוגן? אפשר להתווכח. אפשר אולי להנדס זרעים כך שתתאפשר הצמחת מספר נוסף של דורות (שנים או שלושה) באופן שההסתברות לסחף גנטי משמעותי היא קטנה דיה. אני מניח שזה גם יתבטא במחיר הזרעים.

עד עכשיו דיברתי על אי דיוקים ועל אי הבנה. עכשיו מגיעים להטעיות.

דורפמן כותב: "מחיר של שקית זרעי תירס בשנות ה-80 בארצות הברית היה כ-70 דולר, ואילו היום עולה שקית זרעי תירס יותר מ-160 דולר". נו באמת. זה הטריק הכי ישן בספר. יכול להיות שדורפמן לא יודע כי כח הקניה של הדולר השתנה מעט מאז שנות ה-80 של המאה העשרים ועד היום? אני מפנה אתכם למחשבון האינפלציה באתר משרד העבודה של ארצות הברית. 70 דולר של שנת 1980 שווים ל-201 דולר של שנת 2014, מה שמשקף ירידה ריאלית של 20% במחיר שקית הזרעים. כן, אני קצת דמגוגי כאן. אולי שנות ה-80 של דורפמן חלו בשנת 1989? 70 דולר של 1989 שווים לכ-134 דולר, וזוהי אכן עליית מחיר ריאלית של 20%[2]. אוקיי, אבל בכל זאת מדובר במוצר שיניב יבול גדול יותר ועשוי להביא רווח גדול יותר לחקלאי.

דורפמן ממשיך, וזועק כי הזרעים המהונדסים גנטית העלו את שיעור ההתאבדויות של איכרים בהודו[3], בלי לבדוק את העובדות, כמובן. כתבתי על כך בהרחבה לא מזמן. הנתונים מראים דווקא את ההיפך: ניתן לקשר את הנהגת השימוש בגידולים מהונדסים גנטית לירידה בשיעורי ההתאבדות בקרב איכרים בהודו (שגם הם נמוכים יחסית ללא-איכרים בהודו בפרט, ולמדינות העולם בכלל). אך דורפמן לא מתעניין, כנראה, בעובדות.

מעניין לציין שקיבלתי תגובה לתגובה שלי ב-"עבודה שחורה"[4]:

"אחשלי אין משהו מתקדם יותר מהטבע וגם ידוע שאתה מקבל כסף על הפוסט הזה ,
וכל המהות של החברה זה לעשות כסף ממה שהטבע עושה בחינם יא גנבים קפיטליסטים )) ספר להם שהזרעים שלכם צריכים ריסוס מתמיד מאסיבי"

כן, אין משהו יותר מתקדם מהטבע. רעידות אדמה, בצורת, נגיפי אבעבועות שחורות ופוליו, הכל טבעי. שיהיה לך לבריאות.


הערות
  1. 1. למשל אם היבול נוצר כתוצאה מהאבקה טבעית באמצעות רוח או ציפורים, שפיזרו את הזרעים בשטח, והגיעו מחקלאי שכן []
  2. 2. מ-70 דולר ב-1989 ל-160 היום []
  3. 3. הוא נותן לינק לכתבה בהארץ, ותוך כדי כך מעוות את הדברים שנאמרו בכתבה []
  4. 4. המגיב הגיבור לא מספיק אמיץ כדי להזדהות בשמו, והוא יודע למה []

משחקי המשילות

לפני כשבוע חוקקה הכנסת את "חוק המשילות", שהוא למעשה סדרת תיקונים למספר חוקי יסוד. אחד הסעיפים בחוק קבע כי אחוז החסימה בבחירות לכנסת יועלה מ-2% ל-3.25%, כלומר, מפלגה שתזכה בפחות מ-3.25% מסך הקולות הכשרים בבחירות, לא תקבל ייצוג בכנסת. לו היה אחוז החסימה בבחירות האחרונות לכנסת 3.25% ומספר הקולות שקיבלה כל מפלגה לא היה משתנה, הרי שרשימות חדש, בלד וקדימה לא היו נכנסות לכנסת, ושמונת המושבים שלהם היו מתחלקים בין המפלגות האחרות.

המוטיבציה לשינוי, כפי שהסבירו מציעיו, הייתה הרצון "לחזק את יכולת המשילות של הממשלה", כלומר להפחית את תלותה בסיעות קטנות ו-"סחטניות"[1]. האם אכן יביא החוק לתוצאה המבוקשת? איך בכלל מודדים את כוחה של מפלגה? מהו כוחה של סיעת "קדימה" לה שני נציגים בכנסת?

בכנסת שלנו, למפלגה בת 59 מנדטים אמור להיות כח רב. נכון? לא בהכרח. אם יש בכנסת רק שתי מפלגות, לאחת 59 מנדטים ולשניה 61, הרי שכל הכח מרוכז בידי המפלגה השניה. היא לא זקוקה לשום עזרה מהמפלגה האחרת כדי להקים ממשלה. היא מחזיקה 100% מהכח, ומפלגת ה-59 מחזיקה 0% מהכח.

מה קורה בכנסת תיאורטית בה יש 3 מפלגות, שלכל אחת מהן 40 מנדטים? אם נתעלם משיקולי ימין ושמאל לרגע, ונניח כי כל שתי מפלגות יכולות לחבור יחד ולהותיר את השלישית באופוזיציה, נהיה מוכרחים להגיע למסקנה כי לכל שלוש המפלגות כח שווה, וכל אחת מהן מחזיקה ב-33 וליש אחוזים מהכח.

ומה קורה בכנסת תיאורטית בה יש 3 מפלגות, לשתיים מהן 50 מנדטים כל אחת, והשלישית היא מפלגה "קטנה" עם 20 נציגים בלבד?

שאלות דומות לאלה הטרידו את לויד שאפלי, מתמטיקאי אמריקאי. ב-1953, הציע פתרון לשאלות אלו, במסגרת עבודת הדוקטורט שהגיש לאוניברסיטת פרינסטון. "הערך של שאפלי", ותרומות משמעותיות רבות נוספות שתרם לתחום המתמטי הידוע בשם "תורת המשחקים" זיכו אותו בפרס נובל לכלכלה בשנת 2012. ברשימה זו אנסה להסביר את מושג וההגיון מאחוריו, ואראה כיצד ליישם אותו כדי לנתח את המשמעות המיידית של העלאת אחוז החסימה במסגרת "חוק המשילות".

אז הנה סיפור המסגרת בצורה פשטנית[2]: יש לנו כנסת, ובה מפלגות בגדלים שונים, וצריך להקים קואליציה של 61 מנדטים לפחות כדי להקים ממשלה. מה הכוח של כל מפלגה במשא ומתן?

ראשית יש לשים לב כי יש שני סוגים אפשריים של קואליציות: כאלה שיכולות להקים ממשלה, וכאלה שלא. קואליציה של מפלגות שסך המנדטים שלהם עולה על 60 יכולה להקים ממשלה, ולכן שאפלי נותן לה ערך שרירותי השווה ל-1. קואליציה של מפלגות שסך המנדטים שלהם קטן מ-61 לא יכולות להקים ממשלה, ושאפלי נותן לקואליציות כאלה ערך שרירותי השווה ל-0. שימו לב כי הערך של הקואליציה אינו בהכרח שווה לכח שלה. הערך אומר אם הקואליציה יכולה להקים ממשלה או לא, אך יש ממשלות חזקות ויש ממשלות חלשות. בנוסף, הוא מניח מספר הנחות (אקסיומות) לגבי התכונות שפתרון (כלומר הערכת הכח של כל מפלגה בנפרד צריך לקיים):

ההנחה הראשונה היא שאיחוד לא יכול להזיק. אם יש שתי קואליציות של מפלגות, והן מחליטות להתאחד, הכח של הקואליציה המאוחדת לא יהיה קטן מסך הכוחות של כל אחת משתי הקואליציות לחוד, ואולי אף יגדל. בפרט, שתי מפלגות שיתאחדו יוכלו להגדיל את כוחן המשותף[3]. אתם בודאי מכירים את התופעה הזו בשם "הפרד ומשול". מתמטיקאים קוראים לתכונה כזו "סופר-אדיטיביות".

ההנחה השניה היא שלגולם אין ערך. גולם אינו יכול להשפיע על שום דבר. תחשבו על הכנסת שהתחלקה לשתי מפלגות עם 61 ו-59 מנדטים. מפלגת ה-59 היא גולם, ומפלגת ה-61 תקים ממשלה מבלי להתחשב ברצונותיה. הערך שלה הוא לכן אפס.

ההנחה השלישית היא קרויה הנחת הסימטריה. אם יש שתי מפלגות, שבכל מצב תורמות את אותה התרומה לכל קואליציה, אז הכח שלהן זהה. תחשבו על כנסת בה יש מפלגה אחת גדולה עם 59 מנדטים, ועוד כמה מפלגות קטנות, נניח, 4 מפלגות נוספות שלהן יש 2, 10, 20 ו-29 חברי כנסת. כדי להקים ממשלה, מפלגת ה-59 צריכה לצרף אליה לקואליציה רק אחת מבין 4 "הקטנות", ולהשליך את 3 הנותרות לאופוזיציה. ולא משנה באיזה מהן תבחר. "אתה אמנם ראש סיעה של 29 חברי כנסת, אבל אם תצטרף לממשלה, כל מה שתקבל זה תפקיד סגן השר לענייני גימלאים. לא מוצא חן בעיניך? הצעתי את אותו דיל גם לסיעת 'ישראל הקיקיונית'. תחליט מהר לפני שהם יקחו את זה ולא יישאר לך כלום". אולי התסריט הזה לא נראה לכם ריאלי, אבל זה בערך מה שקרה בשנותיה הראשונות של מדינת ישראל, כאשר הייתה מפלגה דומיננטית אחת והרבה מפלגות בינוניות וקטנות. אמנם הממשלה הייתה "בלי חירות ומק"י"[4], אבל כל המפלגות האחרות היו שותפות קואליציוניות זוטרות של מפא"י בשלב זה או אחר.

כדי ליצור סולם בר השוואה, שאפלי קובע כי סכום הכוחות של כל המפלגות יהיה שווה ל-1, כלומר ל-100%.

שאפלי מוסיף עוד הנחה טכנית אחת, שלא אפרט כאן, וזה מספיק כדי לבנות פתרון. הנה הרעיון: בואו ניקח מפלגה מסויימת, נקרא לה X, ונסתכל על כל הקואליציות האחרות שאפשר להרכיב בלעדיה. מה יקרה אם נוסיף את X לאחת הקואליציות האלה? יש שלוש אפשרויות:

  1. לפני הוספת X, הקואליציה לא יכלה להרכיב ממשלה, וגם אחרי הוספת X אינה יכולה להרכיב ממשלה. כלומר ערך הקואליציה היה אפס לפני הוספת X ונשאר אפס לאחר ההוספה. התרומה של X היא אפס.
  2. לפני הוספת X, הקואליציה לא יכלה להרכיב ממשלה, ואולם אחרי הוספת X הקואליציה יכולה להרכיב ממשלה. במלים אחרות, ערך הקואליציה היה אפס לפני הוספת X ועלה לאחד לאחר ההוספה. התרומה של X היא 1.
  3. לפני הוספת X, הקואליציה כבר יכלה להרכיב ממשלה, וכמובן שאחרי הוספת X הקואליציה עדיין יכולה להרכיב ממשלה. ערך הקואליציה היה 1 לפני הוספת X ונשאר 1 לאחר ההוספה. התרומה של X היא 0.

שאפלי מציע להסתכל על תהליך של הרכבת קואליציה "מקיר לקיר": יוצרים "קואליציה" של מפלגה אחת, ואחר כך מוסיפים לה עוד אחת, ועוד אחת, עד שמקבלים לבסוף קואליציה שמחברת את כל המפלגות. באיזשהו שלב גם מפלגה X נוספה לקואליציה. מה הייתה התרומה שלה בעת שצורפה לקואליציה? אם נרכיב את הקואליציה הגדולה בסדר אחר, ייתכן ש-X תצורף בשלב בו תהיה תרומתה שונה. לכן נחזור על התרגיל לכל האפשרויות, ונחשב את התרומה של X בכל אחד מהמקרים. התרומה הממוצעת היא מדד לכוחה של מפלגה, וזהו הערך של שאפלי.

הנה דוגמה. בכנסת יש 4 מפלגות: למפלגות A ו-B יש 50 מנדטים כל אחת, למפלגה C יש 19 מנדטים, ומפלגה D היא סיעת יחיד ולה מנדט 1. נחשב את ערכי שאפלי של כל המפלגות. ראשית, שימו לב כי מפלגה D היא "גולם", לכן ערך שאפלי שלה חייב להיות אפס. כמו כן, למפלגות A ו-B אותו מספר מנדטים ולכן יהיו להן ערכי שאפלי שווים. לכן אם נחשב את ערך שאפלי של מפלגה C, נוכל לחשב את הערכים של A ו-B. הנה החישוב:

יש 24 דרכים בהן אפשר להרכיב קואליציה מקיר לקיר על ידי הוספת מפלגה אחת בכל פעם. הן כולן מוצגות בטבלה הבאה (לחצו על התמונה לצפיה בגודל מלא):

 

  בשורה הראשונה לדוגמה, בונים תחילה קואליציה עם A ו-B. יש שם 100 מנדטים, ולכן ערכה של קואליציה זו הוא 1. אם מוסיפים את C, מספר המנדטים עולה ל-119, אבל זה כבר לא משנה. ערך הקואליציה נשאר 1, הערך המוסף של C הוא אפס. מבין 24 האפשרויות, יש בדיוק 8 מקרים בהם הוספת C מעלה את ערך הקואליציה מ-0 ל-1. הממוצע של 8 אחדים ו-16 אפסים הוא שליש, ולכן ערך שאפלי של מפלגה C, כלומר הכוח שלה במשחק הקואליציוני הוא 33.3%. 66.7% הנותרים מתחלקים שווה בשווה בין מפלגות A ו-B, ולכן גם ערך שאפלי שלהן הוא שליש, או 33.3%. 19 המנדטים של מפלגה C שווים כמו 50 המנדטים של מפלגות A ו-B. כל שתיים מבין 3 המפלגות A, B ו-C יכולות להקים יחד ממשלה ולזרוק את המפלגה השלישית לאופוזיציה (שם יארח להם לחברה הנציג של מפלגה D).

כעת אנתח את מה שקורה בכנסת ה-19, ומה היה עשוי לקרות בה אם אחוז החסימה המוגדל היה חל עליה, בהנחה שדפוסי ההצבעה ומספרי הקולות לכל מפלגה לא היו משתנים. בטבלה הבאה מוצגים מספרי המנדטים של כל מפלגה בכנסת הנוכחית, ומספרי המנדטים שהיו מתקבלים לו היו מחולקים על פי אחוז חסימה של 3.25%, בהרכב המפלגות הקיים, וגם בתרחיש בו 3 ה-"מפלגות הערביות" רעם-תעל, חדש ובלד היו רצות ברשימה משותפת[5]. בנוסף מוצגים גם אחוז המושבים בכנסת של כל מפלגה וערכי שאפלי[6]המתאימים להרכב כל כנסת, הנוכחית ושתי הכנסות ההיפותטיות  (לחצו על התמונה לצפיה בגודל מלא).

 

  כל אחד מוזמן לבחון את המספרים ולנתח את משמעותם. יש כמובן מספר שינויים, וכמובן יהיו עוד, שכן תוצאות הבחירות הבאות יהיו בודאי שונות מתוצאות הבחירות האחרונות. ניתן להבחין בשני שינויים עיקריים: המפלגה הגדולה נעשית חזקה יותר, ובתרחישים מסויימים חלק מהמפלגות הבינוניות (העבודה וש"ס) מתחזקות משמעותית. מעבר לכך, אין שינויים משמעותיים וה-"משילות", whatever it means, תישאר פחות או יותר כפי שהייתה. לפחות, בטווח הקצר, אין בחוק הזה פגיעה במצב הפוליטי הקיים.

עם זאת, אין פירוש הדבר כי החוק לא בעייתי ומסוכן בטווח הארוך. הבעייתיות של החוק נדונה כבר בהרחבה ולא אחזור על כך כאן. שינויים בחוקי יסוד תמיד יש לבצע בזהירות רבה, מה גם שברור לאור הניתוח שהבאתי כי תועלת לא תהיה בו, ופוטנציאל הנזק מרובה.


הערות
  1. 1. כמובן שבדברי ההסבר (קישור לקובץ rtf) הרשמיים נעשה שימוש במלים נמלצות יותר []
  2. 2. כמובן שהבעיה ששאפלי דן בה הינה כללית יותר, כמו גם הפתרון שהציג. למעוניינים, הנה קישור למצגת (קובץ pdf) המכסה את הנושא בצורה טובה. []
  3. 3. לדוגמה, הברית בין יש עתיד והבית היהודי במשא ומתן הקואליציוני לאחר בחירות 2013 אפשרה לשתי המפלגות להשיג יותר הישגים פוליטיים מאשר לו היו מנהלות משאים ומתנים נפרדים מול הליכוד []
  4. 4. ממש כמו היום []
  5. 5. אני נמנע מלהכנס לדיון פוליטי על התרחיש ההזוי והגזעני הזה. אציין רק שיש חילוקי דעות אידיאולוגיים מהותיים בין שלוש מפלגות אלה, וכן כי חדש אינה מפלגה ערבית במהותה, אלא מפלגה ללא לאומיות []
  6. 6. הערכים חושבו על ידי המחשבון הנמצא באתר Cut The Knot []

עוני, פיתוח כלכלי וסטטיסטיקה: האם סיוע בינלאומי הוא בזבוז כסף?

רשימה זו היא הרביעית בסדרת הרשימות הסוקרות את גיליון פברואר של כתב העת Significance, המוקדש לנושאי העוני והפיתוח הכלכלי. היא סוקרת מאמר דיעה מאת אואן בארדר, סטטיסטיקאי בכיר במרכז לפיתוח גלובלי.

ההתנגדויות לסיוע בינלאומי למדינות מתפתחות אינן חדשות. "סיוע בינלאומי הוא מנגנון הממסה אנשים עניים במדינות עשירות לצורך מימון אורח החיים של אנשים עשירים במדינות עניות" – כתב הכלכלן הבריטי פטר באואר[1] ב-1976. 33 שנים לאחר מכן כתבה הכלכלנית ילידת זמביה דאמביסה מויו בספרה (אותו הקדישה לפטר באואר) כי הסיוע הבינלאומי למדינות אפריקה טיפח תלות כלכלית של מדינות אלה בסיוע, עודד שחיתות והנציח את העוני.

אואן בארדר מציע דרך אחרת לבחון את הנושא[2]. לפי נתוני ארגון OECD, מדינות הארגון העבירו כסיוע למדינות המתפתחות סכום כולל של כ-2.6 טריליון דולר, שהם כ-4.7 טריליון דולר במונחי 2013. מה קנה כל הסכום העצום הזה?

הבה נניח לרגע כי ההישג היחיד שהושג בזכות כספים אלה הוא מיגור והכחדת נגיף האבעבועות השחורות. להזכירכם, זוהי אחת המחלות הקטלניות ביותר בהיסטוריה האנושים, שגרמה ליותר מקרי מוות מאשר כל המלחמות גם יחד. המקרה האחרון של הדבקות במחלה היה בשנת 1977, בסומליה. כמה חיים ניצלו עקב הכחדת הנגיף? קשה לדעת, ההערכות נעות בין 60 ל-120 מליון איש[3] הבה נהיה שמרנים ונחלק 4.7 טריליון ב-60 מיליון. נקבל כי עלות הצלת 60 מליון איש ממוות ממחלת האבעבועות השחורות היא קצת יותר מ-78 אלף דולר לאדם. האם זה הרבה? מעט? מה עלות חייו של אדם בעולם השלישי? בבריטניה מקובל להניח כי הוצאה של 160 אלף דולר (או פחות) להצלת חיים נחשבת ליעילה[4]. בארה"ב הסף המקובל גבוה יותר.

כמובן שלא כל 4.7 טריליוני הדולרים הוצאו על הכחדת נגיף האבעבועות השחורות. עלות מבצע החיסון העולמי הייתה 1.5 מיליארד דולר "בלבד". גם שיעורי התמותה ממחלות זיהומיות, מלריה, חצבת, ומחלות נוספות ירדו, והצילו חיים של 10 מליון איש כל שנה (בערך פי שש מ-1.7 מקרי מוות מאבעבועות שחורות שנמנעו בכל שנה מאז 1978). חלק מהכסף הושקע גם בפיתוח חקלאי, שבודאי הציל עוד כמה עשרות או מאות מליונים ממוות ברעב, חלק הושקע בחינוך, ובמטרות ראויות נוספות.

אכן היו מקרים בהם תכניות סיוע נכשלו, ואף ייתכן כי ניתן היה למנוע חלק מהכישלונות על ידי ניהול טוב יותר. בודאי היו גם כשלונות בלתי ניתנים למניעה. סיוע למדינות מתפתחות, כותב בארדר, הוא סוג של כרטיס הגרלה, אבל הפרס הגדול הוא עצום, ולכן סך המאזן של ההשתתפות בהגרלה זו הינו חיובי, והתועלת עולה עשרות ומאות מונים על הנזק.

רשימות נוספות בסדרה:


הערות
  1. 1. שזכה בתואר לורד מידי ראש ממשלת בריטניה מרגרט תאצ'ר, ובפרס מילטון פרידמן בשנת 2002 []
  2. 2. Barder, O. (2014), Is aid a waste of money?. Significance, 11: 31–32. doi: 10.1111/j.1740-9713.2014.00723.x []
  3. 3.  Henderson, D. A. et al. (1988) Smallpox and its Eradication, Vol. 6. Geneva: World Health Organization. []
  4. 4. McCabe, C., Claxton, K. and Culyer, A. J. (2008) The NICE cost-effectiveness threshold: what it is and what that means. Pharmacoeconomics, 26(9), 733–744. []

עוני, פיתוח כלכלי וסטטיסטיקה: על הקשר בין התאבדויות איכרים בהודו וגידולים מהונדסים גנטית

רשימה זו היא השלישית בסדרת הרשימות הסוקרות את גיליון פברואר של כתב העת Significance, המוקדש לנושאי העוני והפיתוח הכלכלי. היא עוסקת במאמר בדבר הטענה כי יש קשר בין התאבדויות איכרים בהודו וגידולים מהונדסים גנטית[1]

גידולים מהונדסים גנטית נמצאים במוקדם של ויכוחים רבים. בקהילה המדעית יש קונצנזוס לגבי התועלת בגידולים כאלה, אם כי ברור שאין בהם פתרון לכל הבעיות בחקלאות בעולם השלישי. מנגד, יש פעילות רבה של התנגדות לגידולים כאלה, ואין להקל ראש גם בנימוקיהם, בודאי ללא בדיקה רצינית של הנתונים אותם הם מביאים. מטבע הדברים, רוב הנימוקים בעד ונגד מתבססים על נתונים סטטיסטיים, מה שמחייב הערכה ביקורתית של הנתונים, השיטות הסטטיסטיות לניתוחם, והפרשנות לממצאים.

בשנת 2008 העלה יורש העצר הבריטי, הנסיך צ'רלס, טענה חמורה כנגד הגידולים המהונדסים גנטית, כאשר התייחס לתופעה של התאבדות איכרים בהודו, וטען כי לפחות חלק מהמקרים נובע מגידולים מהונדסים גנטית שנכשלו והובילו להתרוששות כלכלית של אותם איכרים[2].

כיצד בודקים את נכונותה של טענה כזו? הדרך הטובה ביותר היא, כמובן, לתכנן ולערוך ניסוי פרוספקטיבי, שידגום שתי קבוצות איכרים, כאלה המשתמשים בגידולים מהונדסים גנטית, וכאלה שלא, ויעקוב אחריהם לאורך זמן (כולל הזמן שלפני המעבר לגידולים מהונדסים גנטית). מחקר כזה מעולם לא נערך. במקום זאת פנה איאן פלויס, פרופסור לסטטיסטיקה חברתית באוניברסיטת מנצ'סטר, לנתונים קיימים ממקורות רשמיים שונים. סוכנות נתוני הפשיעה הלאומית של הודו (NCRB) אוספת ומפרסמת נתונים על התאבדויות החל מ-1996, בחתכי מדינה, משלח יד ומגדר. בנתונים עלול להיות דיווח חסר ממספר סיבות, כגון חשש מתביעה פלילית (התאבדות היא עבירה פלילית בהודו), ואי דיווח נשים כחקלאיות (כיוון שהשטח החקלאי רשום על שם גבר). כאשר צורפו יחד נתוני ה-NCRB ונתונים שפורסמו בכתב העת המדעי Lancet ב-2012, ניתן היה לקבל אמדנים אמינים למספר האיכרים המתאבדים בכל אחת מ-9 מדינות הודו המגדלות ביחד יותר מ-90% מהכותנה בהודו, שבהן התמקד המחקר הנוכחי.

אין די במספר האיכרים המתאבדים. יש לדעת גם מהו מספר האיכרים הכולל, כדי לדעת מהו שיעור המתאבדים. גם מספר האיכרים משתנה משנה לשנה. יותר קשה לאמוד מספרים אלה. יש שני מקורות רשמיים למספר האיכרים. סקר האוכלוסין נערך מדי 10 שנים, ונערך לאחרונה ב-2011. ישנו גם סקר חקלאי, הנערך מדי חמש שנים. הנתונים בשני הסקרים אינם מושלמים, ופרופ' פלויס מתאר כיצד גזר מהם אמדנים למספר האיכרים בכל מדינה בכל שנה, מוסיף את האזהרות המתבקשות, ומציין את הבעיות הפוטנציאליות באמדניו ואת המחקר הנוסף הדרוש.

הממצא הראשון אולי מפתיע מעט: שיעורי ההתאבדות בקרב איכרים גברים בהודו נמוך מעט משיעורי ההתאבדות בקרב שאר האוכלוסיה. בקרב נשים העוסקות בחקלאות, לעומת זאת, נראה כי שיעורי ההתאבדות גבוהים יותר בהשוואה לנשים שלא עוסקות בחקלאות.

האם שיעורי ההתאבדות בקרב האיכרים משתנים לאורך זמן? התשובה היא חיובית. בקרב הגברים יש עליה מכ-25 ל-100000 ב-1996 לכ-35 ל-100000 ב-2005, ואח"כ יש ירידה עד לשיעור של כ-29 ל-100000 ב-2011. בקרב הנשים יש ירידה מתמדת, מכ-63 ל-100000 (!) ב-1996 לכ-29 ל-100000 ב-2011. למעשה, החל מ-2009 אין הבדל בשיעורי ההתאבדות בין גברים לנשים. הנתונים אינם תומכים בטענה כי שיעורי ההתאבדות עלו לאחר הכנסת גידולים מהונדסים גנטית לשימוש.

כל זאת ברמה הארצית. ברמה המדינתית, התמונה אינה אחידה, ובמדינות שונות שיעורי ההתאבדות מתנהגים באופן לאורך זמן. האם יש גורם נוסף שלא נלקח בחשבון?

מהנתונים ניתן לקבוע כי רק במדינת פאנג'ב אכן עלו שיעורי ההתאבדות בקרב האיכרים מאז שנת 2002. במדינת מהרשטרה, לעומת זאת, נצפית ירידה תלולה בשיעורי ההתאבדות מאז 2003. שתי מדינות אלה מגדלות כמעט מחצית מהכותנה בהודו (26% ו-20%, בהתאמה) ובשתיהן כ-56% מהכותנה המגודלת הינה מהונדסת גנטית. מאז 2002 הייתה ירידה ביבולים בפאנג'ב ועליה במדינת מהרשטרה. תוצאה זו מתאימה לתיאוריה כי יש מרכיב כלכלי המשפיע על שיעורי ההתאבדות.

המסקנה היא בדרך כלל ניתן לקשר את הנהגת השימוש בגידולים מהונדסים גנטית לירידה בשיעורי ההתאבדות בקרב איכרים בהודו (שגם הם נמוכים יחסית ללא-איכרים בהודו בפרט, ולמדינות העולם בכלל), ולסייג את הדברים בכך שיצויין כי בפאנג'ב נצפתה התנהגות שונה.

רשימות נוספות בסדרה:


הערות
  1. 1. Plewis, I. (2014), Indian farmer suicides: Is GM cotton to blame?. Significance, 11: 14–18. doi: 10.1111/j.1740-9713.2014.00719.x []
  2. 2. Daily Mail (2008) The GM genocide: Thousands of Indian farmers are committing suicide after using genetically modified crops. Mail Online, November 3rd. []