חיפוש באתר

קישורים

RSS סטטיסטיקה ברשת

עמודים

קטגוריות

תגיות

ארכיב עבור 'על סדר היום'

נורווגיה עוברת למדיניות אי הפללה של צרכני סמים

לפני כחודש (דצמבר 2017)  דיווח  העיתון Independent כי נורווגיה עומדת לעבור למדיניות אי הפללה של צרכני סמים.[1] אני חושב שזוהי הזדמנות מצויינת לדון בנושא ובהשלכות האפשריות של הנהגת מדיניות דומה בישראל.

ראשית כל, ננסה להבין מה כתוב באותיות הקטנות, אלה שמופיעות אחרי הכותרת. קודם כל, יו"ר ועדת הבריאות של הפרלמנט הנורווגי מבהיר כי לא מדובר בהרשאה גורפת לשימוש בסמים (לרבות קנאביס) ובסחר בהם. אין כאן לגליזציה. הסחר וההפצה עדיין יישארו עבירות פליליות. המטרה היא להעביר האחריות למדיניות הסמים ממערכת המשפט למערכת הבריאות. השינוי במדיניות יתבטא בהתייחסות אל צרכני סמים כאל חולים, ולכן המהלך ילווה בתכניות טיפוליות, כגון תהליכי גמילה. משתמשים שלא ישתפו פעולה עם מערכת הבריאות בהחלט עלולים למצוא את עצמם בכלא. בכך מאמצת נורווגיה את מדיניות הסמים של פורטוגל, שגם היא העבירה את האחריות למדיניות הסמים ממערכת המשפט אל מערכת הבריאות. כאן המקום לציין כי למרות שבפורטוגל אכן אין הפללה של משתמשים בסמים, יש אפשרות לנקוט נגדם סנקציות אזרחיות, כגון הטלת קנסות, שלילת רישיון הנהיגה, איסור לעסוק במקצועות מסויימים, ועוד.

שינוי המדיניות בנורווגיה בא בעקבות ההבנה כי במדינה יש תמותה משמעותית עקב שימוש בסמים – מעל 250 איש בשנה. זה שקול לתמותה של כ-425 איש בישראל – יותר ממספר ההרוגים בתאונות דרכים בישראל, והרבה הרבה יותר מספר ההרוגים בשנה עקב פעולות איבה.

מה המשמעות של כל זה לגבי מה שקורה בישראל?

אקדים ואומר כי אני בהחלט תומך בהנהגת תכנית כוללת לטיפול בנושא הסמים שתכלול אי הפללה של המשתמשים אך לא של הסוחרים והמפיצים, וזאת במשולב עם תכנית טיפולית מקיפה, כמו שיש בפורטוגל ועומדת להיות בנורווגיה. עם זאת, אני חושש כי הסיכוי שזה יקרה בישראל הוא קטן. ראו למשל את הצעת החוק (הפופוליסטית, לדעתי) שהגישה תמר זנדברג עם בחירתה לכנסת: אי הפללה בלי שום תכנית נלווית. זה כמו להגיש הצעת חוק לאי הפללה של מי שעובר ברמזור אדום.

ולמי שיגיד שהאנלוגיה של הרמזור האדום קיצונית, אענה כי שימוש בסמים מסוכן אף הוא. אל תגידו לי שזה לא מסוכן כי לכם לא קרה כלום. דברים קורים. זה כמו תופעות לוואי של תרופות. יש אנשים שמתו עקב שימוש באקמול. אני מכיר מקרה שבו חברת תרופות נאלצה להפסיק פיתוח של תרופה חדשה לטרשת נפוצה עקב 3 מקרים של דופק מהיר בקרב כ-2000 איש שקיבלו את התרופה בניסויים הקליניים. בכל בית חולים פסיכיאטרי בארץ יש מקרים של מטופלים שחוו התקף פסיכוטי (במקרה הטוב) לאחר שימוש בגראס. אלה אמנם אנקדוטות, אך מייד נעבור לנתונים מבוססי ראיות.

חיפוש קצר בגוגל או במאגרי מידע רפואיים יעלה מייד מחקרים המדווחים על נזקים שנגרמים עקב שימוש בסמים, גם כאלה שנחשבים כ-"קלים".  כך למשל, הסיכון להתפרצות סכיזופרניה בקרב משתמשי קנאביס גדול פי 4 מהסיכון אצל לא-משתמשים, הסיכון להתפתחות פסיכוזה גבוה ב-40% אצל משתמשי קנאביס לעומת לא משתמשים, והסיכון למעורבות בתאונת דרכים גדול פי 3 עד 7 בקרב נהגים שצרכו קנאביס (גם מספר ימים לפני הנהיגה בפועל, עקב רמת ה-THC בדם) לעומת הסיכון של נהגים שלא צרכו קנאביס, כאשר רמת הסיכון עולה עם המינון. יותר שימוש – יותר סיכון. כל זה רק מארבע התוצאות הראשונות בחיפוש בגוגל אחרי cannabis usage risk.[2] יש עוד הרבה מחקרים, שמזהים גם סיכונים מוגברים לכל מיני סוגים של סרטן, ועוד. יש לקחת בחשבון גם את ההשפעות הכלכליות והחברתיות של שימוש בסמים. כמובן, אי החוקיות של השימוש בסמים גורמת להגברת הפשיעה, ולנזקים בריאותיים נוספים הנגרמים עקב חוסר פיקוח על איכות המוצרים הנמכרים.

מה כל זה אומר לגבי ישראל?

לדעתי יש להעריך מה יקרה בשני תרחישים: תרחיש של מעבר למדיניות של אי הפללה מלווה בתכנית בריאותית, כפי שנהוג בפורטוגל ובקרוב בנורווגיה, וכן יש לבחון תרחיש של לגליזציה מלאה של שימוש בסמים (כשלדעתי, אם מחליטים לבחור בלגליזציה, אז יש ליישם מדיניות זו לגבי כל סוגי הסמים).

הערכתי היא כי מדיניות בנוסח פורטוגל ונורווגיה תביא לתוצאות חיוביות ולירידה בהיקף השימוש בסמים ובתוצאות הבריאותיות השליליות הנגרמות מהם. אני אומר זאת על סמך הניסיון החיובי של פורטוגל. לעומת זאת, מדיניות של לגליזציה תוביל לדעתי לעליה בהיקף השימוש ועקב כך לעליה באירועים בריאותיים ונזקים אחרים (כגון תאונות דרכים). לכן אני מעדיף את האפשרות הראשונה. אני סבור כי רוב מוחלט של הקוראים יסכימו איתי בקביעה כי המצב הנוכחי בלתי נסבל.

בשני המקרים יש לדון בשאלה מי יישא בהיבטים הכלכליים של כל אחת מהתכניות. אציין שוב רק את דעתי האישית.

במקרה של מדיניות אי הפללה והתערבות טיפולית בנוסח פורטוגל, ראוי לדעתי שהמימון יבוא מתוך תקציב הבריאות. יש להעביר לשם את הכספים שמוקצבים כיום למלחמה בסמים[3]. בנוסף, יהיה ניתן להפנות לתכנית את הכספים שיחסכו עקב הירידה הצפויה באירועים בריאותיים הנובעים משימוש בסמים.

במקרה של לגליזציה, חלקית או מלאה, ראוי שהמימון של הנזקים הבריאותיים ואחרים יושת על המשתמשים, הסוחרים ויצרנים, וזאת על ידי מיסוי ישיר, כפי שנהוג לגבי חומרים מסוכנים וחוקיים אחרים, כגון טבק ואלכוהול (מיסוי כזה גם צפוי להוריד את הביקוש לצריכת סמים). כך למשל הפעילות של ארגון הפשע טלגראס, שמגלגל כל חודש כ-60 מיליון ₪, תהפוך לחוקית, ותמוסה בהתאם.[4]

יש לי חששות לגבי ההיבטים הכלכליים של שני התרחישים. מימון ממלכתי במסגרת מדיניות אי הפללה חשוף לקיצוצים רוחביים למיניהם, או סתם לתת תקצוב או חוסר תקצוב, כפי שקורה בתחומים אחרים. מיסוי בתרחיש של לגליזציה צפוי להיתקל לקשיים בישראל. ראו מה קורה כיום, כאשר שר האוצר מסרב, משיקולים פופוליסטיים, למסות כראוי מוצרי טבק כגון אייקוס וטבק לגלגול. אני לא סבור, לצערי, כי המצב יהיה שונה כאשר הממשלה הנוכחית תוחלף בממשלה אחרת.

לסיכום, יש להודות כי שימוש בסמים מהווה בעיה שצריך להתמודד איתה, אם בדרך של אי הפללה בשילוב תכנית בריאותית כפי שנעשה בפורטוגל, אם בדרך של לגליזציה מלאה, ואם בדרך אחרת. בכל מקרה יש לבחון את ההשלכות על בריאות הציבור, ואת ההיבטים הכלכליים וחברתיים של כל האלטרנטיבות.


רשימות נוספות בנושא:


הערות
  1. את זה למדתי מציוץ מלא שמחה של טלגראס הבוקר []
  2. התוצאה שהשמטתי היא עוד מחקר המזהה את השימוש בקנאביס כגורם סיכון להתפרצות סכיזופרניה []
  3. ויש כאלה שיגידו "מלחמה". אני לא מתווכח []
  4. אמנם גם כספים שמקורם בפעילות לא חוקית חייבים במיסים, אבל זה כבר סיפור אחר []

מחקר האוצר על "שכר המינימום ונזקיו" – 13 שנים מאוחר יותר

בשנת 2004 פירסם משרד האוצר מחקר על "שכר המינימום ונזקיו", ובו הזהירו חכמי המשרד מפני הקטסטרופה הכלכלית שתתרחש אם יועלה שכר המינימום. נזכרתי בעובדה הזו בעקבות ציוץ מתבדח בטוויטר . המחקר ההוא היה מופת של סטטיסטיקה רעה: "מדגם" מוטה בכוונה תחילה – נבחרו רק הנתונים שהתאימו לאג'נדה, בלבול בין מתאם לסיבתיות, שימוש במדדים בעייתיים, זריקת מספרים חסרי ביסוס והצגה מעוותת של הנתונים (המעוותים). תוכלו לחזור ולקרוא את כל הביקורת שלי על המחקר ההוא.

13 שנים מאוחר יותר, אני סבור שהקטסטרופה הכלכלית לא התרחשה. עסקים לא פשטו רגל בהמוניהם, האבטלה לא עלתה (ראש הממשלה מתגאה באבטלה הנמוכה), ובכלל הכלכלה "במצב מצויין" לפחות בנתוני המקרו (במיקרו זה כנראה סיפור אחר, אבל נעזוב את זה כרגע).

האם במבט לאחור אנשי משרד האוצר סבורים שמסקנות המחקר היו בעייתיות לכל הפחות? כן ולא.

מצד אחד, המחקר ההוא נגנז. בפוסט שלי מ-2004 היה לינק למחקר. הנה הוא שוב: http://www.mof.gov.il/research/skiraframe.htm. אל תטרחו ללחוץ. הלינק הזה מוביל עכשיו להודעת שגיאה. ניסיתי לחפש אותו בגוגל. אמנם לא מצאתי אותו, אבל כן מצאתי מחקר חדש! משנת 2016! "השפעת השינויים בשכר המינימום על התעסוקה והשכר
בישראל"! (קישור לקובץ pdf). קראתי (לא בעיון רב, אני מודה). [1]

מה מתברר?

המחקר חדש, השטיקים אותם שטיקים. שוב המדגם המוטה, שוב בלבול בין מתאם וסיבתיות, שוב שימוש במדדים בעיתיים, שוב הצגה מעוותת של הנתונים, ושוב אותה מסקנה. הקטסטרופה בדרך.

מה אין במחקר החדש? נכון מאוד – אין התייחסות למחקר הישן, וזה מאוד נוח, כי כך אין צורך להתייחס אליו ולדון בשאלות מטרידות, כמו למשל האם התחזיות של המחקר ההוא התממשו (הן לא).

סיכום בשתי מילים: זאב זאב


הערות
  1. עדכון: המחקר המקורי התגלה בארכיון הרשת: https://web.archive.org/web/20051103080421/http://mof.gov.il:80/research/skira11_2004/skira11_2004.pdf . תודה לאייל בר חיים! []

כמה הערות על "מכונת האמת המוחלטת"

בעתון דה מרקר הופיעה אתמול כתבה שכותרתה:הסטארט-אפיסט שבונה את מכונת האמת המוחלטת: "זדורוב חף מפשע".מדובר בראיון עם הסטאראפיסט המצליח סער וילף. לאחר מספר שאלות מתבקשות על הצלחותיו עד כה, איך עשה את כספו, וכדומה, מגיעים לחלק המעניין, בו הוא מספר על הסטארטאפ הנוכחי שלו, ותוך כדי כך הוא מביע את דעתו על מערכת המשפט שלנו.

ובכן, הסטארטאפ הנוכחי "רוצה לשנות את האופן שבו אנחנו מבינים את העולם סביבנו, את האופן שבו אנחנו מתקשרים מידע ותובנות ומשתפים פעולה", מטרה אולי קצת יומרנית אבל בהחלט ראויה. "אנשים אינטליגנטים ורציונלים", אומר וילף, "מסתכלים על אותו מידע מגיעים למסקנות הפוכות לחלוטין, וכל אחד משוכנע בוודאות גמורה שהמסקנה שלו נכונה. מה חדש? זה העולם. זה לא אמור לקרות במערכת שמסיקה מסקנות בצורה מכוילת. למעשה, כל אחד מאתנו מחזיק במספר לא קטן של אמונות על העולם, שהוא בטוח שהן נכונות". הדרך להגיע לאמת מוחלטת על העולם היא "לאסוף נתונים, לבנות מודלים מתמטיים מורכבים, לחשב הסתברויות. הדיון הציבורי הוא נונסנס. המוח לא מסוגל להתמודד עם כזאת כמות של מידע ואי־ודאויות, ולכן כל אחד נותן משקל אחר לעובדות ומסנן את המידע בצורה שנוחה לו — ואז יוצאות מסקנות שונות". כך, טוען וילף, יוכל למשל להעריך האם להתנתקות הייתה השפעה חיובית או שלילית, "בוודאות של 90%". (בניגוד לדיון הציבורי שהוא, לדברי וילף, נונסנס) אני אמנם קטונתי מלהבין כיצד יעשה זאת, אבל עד כאן אני מוכן לפרגן.[1] יש לו, לדעתי, סיכוי טוב להצליח למכור קופסה שחורה למקבלי החלטות.

בשלב הזה הראיון עובר לדיון על מערכת המשפט שלנו. אביא שוב דברים בשם אומרם: "מערכת המשפט היא אחד המקומות שבהם המגבלות בתפישת הסתברות גורמות נזקים עצומים…למרות הניסיון וההכשרה, המוח של השופטים מוביל אותם פעם אחר פעם לקבל החלטות לא סבירות…נסים חדד, שבית המשפט המחוזי קבע שהוא אשם "מעבר לספק סביר" באונס תינוק. בחישוב של דקה אפשר היה להראות שההסתברות שהוא אשם קטנה מ–1%…מדובר בכשל ידוע בהסקה האנושית שנקרא "כשל התובע". זה כשל שבו אנחנו מתמקדים רק בעוצמת הראיות ומתעלמים מהשכיחות הכללית של התופעה. מבחינה הסתברותית, ככל שההשערה שאנחנו בוחנים יותר נדירה או לא סבירה, כך צריך ראיות יותר חזקות כדי להשתכנע שדווקא הפעם היא כן נכונה…אונס תינוק הוא עבירה נדירה ביותר. ברמה של אחד לעשרות מיליונים. השופטים התמקדו בראיות — דו"ח פתולוגי שלפיו התינוק סבל מפגיעה שיכולה להתאים לאונס…הם שכחו להתייחס לנדירות של העבירה. הסיכוי שהיתה כאן טעות אנוש בבדיקה הפתולוגית גבוה בהרבה מהסיכוי שחדד רוצה לאנוס תינוקות. וזה עוד לפני שהתייחסנו לכך ששום דבר בעברו של חדד לא מצביע על סטייה חמורה כל כך" "מחשב", אומר וילף, "לא צריך להיות שופט, אבל הוא יכול לסייע בקבלת ההחלטות. ואם זה יקרה, הרבה פחות חפים מפשע יישבו בכלא והרבה פחות אשמים יסתובבו חופשי ובאופן כללי יהיו הרבה פחות טעויות".

הטענה שעולה מדבריו של וילף כי יש בכלא הרבה חפים מפשע וכי הרבה אשמים מסתובבים חופשי היא בעייתית, לדעתי. יש טרייד אוף בין שני סוגי הטעויות. הצבת רף ראיות גבוה גורמת לזיכוי אשמים, אבל גם לרמה גבוהה של זיכויים, וכתוצאה מכך לא יהיו הרבה זכאים שיורשעו. באופן דומה, הצבת רף ראיות נמוך תגרום לשיעור גבוה יותר של הרשעת זכאים, אבל גם לשיעור נמוך של זיכוי נאשמים. המצב שוילף טוען שהוא קיים (הרבה הרשעות שוא והרבה זיכויי שוא) יכול לקרות כאשר בפני זכאים מוצב רף ראיות נמוך ובפני אשמים מוצב רף ראיות גבוה. אבל השופט לא יודע מראש האם הנאשם אשם זכאי, והוא אמור להחליט מראש מה רף הראיות הדרוש. המצב שויף מתאר יכול גם לקרות כאשר השופטים מגבשים את דעתם לפני שהוצגו בפניהם כל הראיות. אם זה המצב, ההאשמה שוילף מטיח במערכת המששפט היא חמורה. אבל, וזה אבל גדול, וילף לא מביא נימוקים לטענתו.

הדברים שאומר וילף בהמשך הם הרבה יותר חמורים. אני לא רוצה להתייחס ספציפית לפרשת ניסים חדד, שהורשע בפשע חמור ביותר בבית המשפט המחוזי וזזוכה אחר כך בערעור בבית המשפט העליון. אני תוהה איזה חישוב יכול להראות כי ההסתברות שהוא אשם קטנה מ-1%. אם מישהו מהקוראים יודע, אשמח אם יסביר לי את זה. גם הנפנוף בכשל התובע((רושם לעצמי לכתוב על כך רשימה ביום מן הימים)) מוזר לי, כיוון שוילף לא מתייחס כלל לכשל תובע שאירע אולי באחת הדוגמאות האחרות שהביא.((התחושה שלי היא שכשל התובע משמש כאן כבאזוורד ותו לא))

החומרה בדבריו של וילף נמצאת באופן שבו הוא חושב שמערכת המשפט צריכה לפעול. במקרה חדד, אומר למעשה וילף, הייתה לדעתו הסתברות אפריורית של פחות מ-1% לכך שחדד אשם בפשע שביצע. לכן, אמר וילף, על התביעה היה להציג ראיות חזקות במיוחד כדי להרשיעו. מה שנובע מדבריו של וילף הוא שאם יש נאשם שההסתברות האפריורית לאשמתו היא 99%, אזי גם בדל ראיה צריך להיות מספיק להרשעתו. מי יקבע את ההסתברות האפריורית הזו? הקופסה השחורה של וילף? השלטון? וילף לא מספק תשובה.

אני טוען שאין דבר כזה "הסתברות אפריורית לאשמה". נאשם הוא אשם או זכאי. זה שאנחנו לא יודעים אם הוא אשם או זכאי לא הופך את עצם האשם למשתנה מקרי. ומשום כך, אין דבר כזה "הסתברות כי הנאשם אשם". יבוא הבייסיאני ויגיד כי ההסתברות הזו משקפת למעשה את מידת האמונה באשמתו של הנאשם. ובכן, האם אנחנו רוצים כי השופט יבסס את החלטתו על סמך אמונות, או על סמך ראיות אובייקטיביות?

וכאן טמונה חומרת הדברים. וילף מציע לשנות כליל את הדרך בה מערכת המשפט פועלת. מערכת המשפט שלנו מניחה כי הנאשם שמובא למשפט זכאי, ועל התביעה להוכיח את אשמתו. וילף מציע להניח כי יש אמונה מסויימת בכך שהנאשם אשם, וכי רמת האמונה הזו תקבע את תוצאת המשפט. אם השופט מאמין מראש כי הנאשם אשם, עליו להרשיע אותו, ולעזאזל הראיות. יש מדינות כאלה. האם אנחנו רוצים לחיות במדינה כזאת?


הערות
  1. אני גם מוכן להתערב שאיש לא ישנה את דעתו על ההתנתקות גם לנוכח חוות דעת עם וודאות של  90%, אבל זה סיפור אחר []

איך סופרים את המתים

בתחילת אוגוסט 2014 השתתפתי בכנס האיגוד האמריקני לסטטיסטיקה בבוסטון, שם נכחתי בשני מושבים שעסקו בנושא של אמידת מספר הנפגעים/הרוגים בסכסוכים אלימים. רשימה זו מבוססת על ההרצאות ששמעתי.

בערך של ויקיפדיה על הסכסוך/מלחמת אזרחים בקולומביה מצויין כי נהרגו בסכסוך (נכון לעד מתי?) 4286 חיילים ושוטרים, וכן 13197 מבין חברי שני הארגונים הנאבקים בכוחות הממשלה. איך הם הגיעו למספרים האלה? וברמת דיוק כל כך גבוהה? מספר ההרוגים הכללי בסכסוך, על פי המקורות שויקיפדיה מצטטת, הוא הרבה יותר ערטילאי: בין 50 ל-200 אלף. האם ניתן להגיע למספר מדוייק יותר?

נתוני מספר ההרוגים בסכסוך בקולומביה כפי שהם מוצגים בויקיפדיה

 

שאלות דומות עולות בכל סכסוך. עד כמה מדוייקים מספרי ההרוגים המתפרסמים בדבר מלחמת האזרחים בסוריה? או בעירק? כמה אזרחים נהרגו בסכסוך האחרון בעזה? מדובר בבעיה סטטיסטית לא פשוטה. אנסה להסביר בקצרה ובפשטות את הבעיה ואת הגישות להתמודדות איתה.

מתברר שבל סכסוך אלים יש אנשים וארגונים העוסקים בתיעוד מקרי המוות (כמו ד"ר אשרף אל-קודרה בעזה). במקרה של הסכסוך בקולומביה, ד"ר שירה מיטשל מאוניברסיטת הארווארד הציגה נתונים שנאספו על ידי שישה ארגונים שונים, שלושה מהם ממשלתיים, לאורך תקופות זמן משתנות. בסוריה, לפי ד"ר מגאן פרייס מה-Human Rights Data Analysis Group, יש כחמישה ארגונים האוספים את נתוני ההרוגים, ואילו ד"ר דניאל מנריק-ואלייר מאוניברסיטת אינדיאנה אמד את מספר ההרוגים במלחמת האזרחים בקוסובו על סמך דיווחים של ארבעה ארגונים שונים. בכל מקרה, הדיווחים הם רשימות של שמות ההרוגים, לעיתים בתוספת מידע נוסף אודות ההרוגים (למשל גיל, מין, מקום מגורים) או נסיבות מותה (כמו לדוגמה הפצצה או הוצאה להורג).

נתוני ארבע רשימות הרוגים מממלחמת האזרחים בקוסובו, כפי שהוצגו על ידי דניאל מנריק-ואלייר בכנס JSM2014

 

בפני הסטטיסטיקאים המנסים לאמוד את סך ההרוגים הכללי בסכסוך עומדות שתי בעיות. הבעיה הראשונה היא לזהות אנשים שמותם מתועד יותר מפעם אחת. ייתכן כי מותו של אדם מסויים מופיע בשתי רשימות (או יותר) שהכינו ארגונים שונים, או אפילו מופיע פעמיים (או יותר) באותה רשימה. בשלב הראשון יש לעבור על כל הרשומות שבכל הרשימות, ולהשוות כל זוג רשומות כדי לקבוע האם מדובר באותו אדם או בשני אנשים שונים. האם יוסי לוי ויוסף לוי הם אותו אדם? מה בקשר לשני שמות פחות דומים אך יותר נדירים, לגביהם מקום המוות, זמנו ונסיבותיו זהות? צריך לבדוק כל מקרה (למעשה כל זוג מקרים) לגופו. זה לוקח זמן. אם בסך כל הרשימות יש 1000 רשומות של מקרי מוות, יש לנו כמעט חצי מיליון זוגות שצריך להשוות. כאשר מדובר ב-100,000 רשומות (וזה לא מספר דמיוני, בסוריה מדובר עד כה על כ-170 אלף הרוגים, ואם מדובר ב-5 רשימות אזי מספר הרשומות יכול להגיע בקלות לחצי מיליון), יש כבר 50 מיליון זוגות של רשומות שצריך להשוות. אין שום סיכוי לבצע את העבודה הזו באופן ידני, ויש להסתמך על עזרת המחשב והסטטיסטיקה. הרעיון הוא לבדוק מספר מצומצם של זוגות רשומות ובאופן ידני (כמה אלפים בדרך כלל) ולסווג אותן כמתארות אותו אדם או שני אנשים שונים. בעזרת הסיווג הידני והנתונים הנלווים לכל שם בונים מודל סטטיסטי שמחשב לכל זוג רשומות את ההסתברות כי הן מתארות בעצם את אותו האדם. בעזרת הפרמטרים של המודל הסטטיסטי אפשר לתכנת כעת אלגוריתם שישווה באופן אוטומטי את כל הזוגות ויקבע לכל אחד מהם האם מדובר באותו אדם (אם ההסתברות המחושבת גבוהה מסף מסויים) או לא. תהליך זה נקרא למידה סטטיסטית.[1]

לאחר שמסתיים תהליך ההשוואה וזיהוי הרשומות הכפולות, אנו נותרים למעשה עם נתונים מזוקקים, האומרים לנו כמה הרוגים נספרו רק ברשימה הראשונה, כמה ברשימה הראשונה והשניה, כמה ברשימה הראשונה והשלישית, וכך הלאה, עד מספר ההרוגים ששמם הופיע בכל הרשימות. מנתונים אלה אנחנו יכולים לקבל הערכת רצפה של מספר ההרוגים – זהו סך כל מספר הרשומות השונות בכל הרשימות. וכאן מופיעה הבעיה הסטטיסטית השניה: איך נדע מהו מספר האנשים שנהרגו אך שמם לא הופיע אף לא ברשימה אחת? סביר להניח כי יש גם כאלה. השיטה הסטטיסטית להתמודדות עם הבעיה הזו ידועה בשם "תפוש ותפוש שוב" ("capture – recapture") ואנסה לתאר אותה בפשטות בפסקאות הבאות.

נניח שאנחנו רוצים לדעת כמה דגים יש באגם מסויים. אפשר לאמוד מספרם בצורה הבאה: תופסים מספר מסויים של דגים, נניח 1000, מסמנים כל אחד מהם בנקודה אדומה, ומחזירים אותם לאגם. כעת באגם יש X  דגים, 1000 מתוכם מסומנים. ממתינים זמן מה כדי שהדגים המסומנים יתפזרו ברחבי האגם ויתערבבו עם חבריהם, ואז תופסים שוב 1000 דגים, ובודקים כמה מתוכם מסומנים בנקודה אדומה. אם 50 מתוך האלף מסומנים, מסיקים כי פרופורציית הדגים המסומנים באגם היא 5%, ומכיוון שידוע לנו כי יש באגם 1000 דגים מסומנים המהווים 5% מכלל הדגים באגם, ולכן אמדן של סך כל מספר הדגים באגם הוא 20,000.

מקרה ספירת המתים דומה. הדג המסומן בנקודה אדומה הוא המשל, ההרוג במלחמה הוא הנמשל. אבל יש כאן כמה בעיות. ראשית, במקרה של ספירת ההרוגים, בניגוד לספירת הדגים, אנחנו לא באמת יודעים כמה דגים מסומנים יש באגם. שנית, מה קורה אם מי שביצע את התפיסה השניה של הדגים היה רשלן, ודיווח אמנם כי תפס 50 דגים המסומנים בנקודה אדומה, אך שכח לספור ולכן לא דיווח כמה דגים תפס בסך הכל, מסומנים ולא מסומנים? לא נוכל לבצע את התרגיל הפשוט שביצענו קודם. נוכל כמובן לשלוח אותו לבצע שוב את המשימה, בתקווה שיבצע אותה טוב יותר, אך במקרה של ספירת ההרוגים, אין דרך מעשית לדגום קבוצה של אנשים ולבדוק מי מהם נהרג במלחמה ומי לא. הנתונים הטובים ביותר שנוכל לקבל הן הרשימות, כאשר חלק מהאנשים מופיעים ביותר מרשימה אחת.

הבעיה השלישית היא הקשה ביותר: בסיפור של הדגים, המתנו בין התפיסה הראשונה והשניה, כדי שהדגים יתערבבו בינם לבין עצמם ותיווצר אי תלות סטטיסטית בין המדגם הראשון למדגם השני. אין שום סיבה להניח כי אי תלות כזו קיימת בין רשימות ההרוגים השונות, אדרבא. כאן דרושה עזרתו של הסטטיסטיקאי, שיבנה מודל (או מספר מודלים) למבנה התלות בין הרשימות השונות. ייתכן מאוד כי מודלים שונים יתנו תוצאות שונות, ולסטטיסטיקה יש גם כלים להשוואה בין מודלים ובחירה במודל "הטוב ביותר" לפי קריטריון כזה או אחר.

אז בפעם הבאה שאתם רואים הערכות שונות למספר ההרוגים בסכסוך מסויים (ובעצם הערכות שונות לספירה כמותית של פרטים או פריטים כלשהם), התייחסו למספרים בספקנות. שאלו אולי לגבי השיטות הסטטיסטיות שבהן נעשה שימוש. התעקשו על קבלת מדד למידת אי הודאות שבאמדן (סטיית תקן, רווח סמך וכדומה). ואל תכעסו אם אתם נתקלים בשני אמדנים שונים. מדובר בבעיה סטטיסטית קשה, וגישות שונות לפתרונה יביאו ככל הנראה לתוצאות שונות.

 

מקורות (הרצאות בכנס JSM, בוסטון, אוגוסט 2014):

* Global Impact: Statistical Analyses of Conflict Data in Syria, Guatemala, and Colombia — Shira Mitchell, Harvard ; Al Ozonoff, Harvard ; Kristian Lum, Virginia Tech ; Alan M. Zaslavsky, Harvard ; Brent Coull, Harvard School of Public Health

* Estimating Undocumented Deaths During the Syrian Conflict — Patrick Ball, Human Rights Data Analysis Group ; Anita Gohdes, Human Rights Data Analysis Group ; Megan Price, Human Rights Data Analysis Group

* Record Linkage and Capture-Recapture in the the Analysis of Genocide in Guatemala — Patrick Ball, Human Rights Data Analysis Group

* Large-Scale Clustering Approaches for Identifying Unique Human Rights Violations — Samuel Ventura, Carnegie Mellon

* Bayesian Multiple-Recapture Estimation of Casualties in Armed Conflicts Using Nonparametric Mixtures — Daniel Manrique-Vallier, Indiana University


הערות
  1. 1. אנשים מתחום מדעי המחשב מעדיפים לכנות תחום זה בשם "למידה ממוכנת". []

כמה הערות על זרעים מהונדסים גנטית

זרעים מהונדסים גנטית מעוררים רגשות עזים בקרב אנשים מסויימים. מתברר שגם אצלי.

לפני כשבוע הופיעה באתר "המקום הכי חם בגיהנום" טור דיעה תחת הכותרת "זרע הפורענות". הכותב, יוסי דורפמן, יוצא נגד הסכם שנחתם לאחרונה בין משרד הכלכלה ותאגיד החקלאות המהונדסת גנטית וחומרי ההדברה מונסנטו. אתר "עבודה שחורה" חזר ופרסם חלק מטורו של דורפמן, ושם הגבתי ביום חמישי האחרון במלים הבאות:

"חשוב מאוד להפריד בין המהות של זרעים מהונדסים גנטית, שצופנים בתוכם תועלת רבה לאנושות, ובין ההתנהלות העסקית של תאגיד מונסנטו, שהיא אכן בעייתית.
הדרך הראויה להתמודדות היא לא להתעלם מההתקדמות המדעית/טכנולוגית שמאפשרת יבולים גדולים יותר ואיכותיים יותר, אלא להשית רגולציה נכונה על התאגיד."

אני חושב שהסברים נוספים מיותרים. זרעים מהונדסים גנטית מניבים יבולים גדולים יותר, ומתוכננים לעמוד בפני מזיקים שונים, שצמחים "רגילים" אינם עמידים אליהם. הם משקפים את היכולות המדעיות והטכנולוגיות אליהם הגיעה האנושות בשנים האחרונות.

אני גם רוצה לחזור ולהדגיש כי ההתנהלות העסקית של תאגיד מונסנטו (בעיקר בנושא תביעות על הפרות פטנטים) היא בעייתית גם בעיני. עם התנהלות זו יש להתמודד באמצעות רגולציה, חקיקה, וגם בעזרת שופטים שיעיפו לכל הרוחות תביעות לא מוצדקות[1] עם הוצאות משפט כבדות. אני בהחלט גם מתנגד לחקיקה ייעודית לטובת תאגידים בכלל ומונסנטו בפרט, לקשרי הון שלטון, לשוחד, ולפעולות פליליות אחרות.

ולאחר כל ההסתייגויות הנ"ל, אני רוצה להפנות את תשומת לב קוראיי לכמה אמירות בעייתיות של דורפמן.

דורפמן כותב כי מונסנטו מחזיקה ב-90% משוק הזרעים המהונדסים גנטית, וזה נכון. הסיבה לכך: מונסנטו מחזיקה ברוב הפטנטים בתחום, והפטנטים עדיין בתוקף. עם זאת, יש לשים לב כי החל ב-2015 יחלו פטנטים רבים לפקוע, וצפויה תחרות גדולה מצד יצרנים גנריים, בדיוק כפי שקורה בתעשיות אחרות, כגון תרופות וחומרי הדברה. לכן צפוי כרסום במונופול. עד אז, יש לזכור כי מונופולים מעצם הגדרתם נתונים לרגולציה (בישראל, על ידי הממונה על ההגבלים העסקיים). אני מקווה שהממונה לא יגלה אזלת יד בנושא זה.

בעניין שימוש חוזר בזרעים: למיטב ידיעתי, הזרעים הצמחים המהונדסים גנטית כלל אינם מניבים זרעים. הסיבה לכך נעוצה בטבע. אם יניבו צמחים אלה זרעים, יופיעו באופן טבעי מוטציות שונות שעשויות/עלולות לשנות את התכונות של הצמחים בדור הבא. אם רוצים להבטיח תכונות מסויימות של זרעים, המוטבעות בהם באופן גנטי, הדרך היחידה להבטיח זאת היא על ידי הנדוס. האם זה הוגן? אפשר להתווכח. אפשר אולי להנדס זרעים כך שתתאפשר הצמחת מספר נוסף של דורות (שנים או שלושה) באופן שההסתברות לסחף גנטי משמעותי היא קטנה דיה. אני מניח שזה גם יתבטא במחיר הזרעים.

עד עכשיו דיברתי על אי דיוקים ועל אי הבנה. עכשיו מגיעים להטעיות.

דורפמן כותב: "מחיר של שקית זרעי תירס בשנות ה-80 בארצות הברית היה כ-70 דולר, ואילו היום עולה שקית זרעי תירס יותר מ-160 דולר". נו באמת. זה הטריק הכי ישן בספר. יכול להיות שדורפמן לא יודע כי כח הקניה של הדולר השתנה מעט מאז שנות ה-80 של המאה העשרים ועד היום? אני מפנה אתכם למחשבון האינפלציה באתר משרד העבודה של ארצות הברית. 70 דולר של שנת 1980 שווים ל-201 דולר של שנת 2014, מה שמשקף ירידה ריאלית של 20% במחיר שקית הזרעים. כן, אני קצת דמגוגי כאן. אולי שנות ה-80 של דורפמן חלו בשנת 1989? 70 דולר של 1989 שווים לכ-134 דולר, וזוהי אכן עליית מחיר ריאלית של 20%[2]. אוקיי, אבל בכל זאת מדובר במוצר שיניב יבול גדול יותר ועשוי להביא רווח גדול יותר לחקלאי.

דורפמן ממשיך, וזועק כי הזרעים המהונדסים גנטית העלו את שיעור ההתאבדויות של איכרים בהודו[3], בלי לבדוק את העובדות, כמובן. כתבתי על כך בהרחבה לא מזמן. הנתונים מראים דווקא את ההיפך: ניתן לקשר את הנהגת השימוש בגידולים מהונדסים גנטית לירידה בשיעורי ההתאבדות בקרב איכרים בהודו (שגם הם נמוכים יחסית ללא-איכרים בהודו בפרט, ולמדינות העולם בכלל). אך דורפמן לא מתעניין, כנראה, בעובדות.

מעניין לציין שקיבלתי תגובה לתגובה שלי ב-"עבודה שחורה"[4]:

"אחשלי אין משהו מתקדם יותר מהטבע וגם ידוע שאתה מקבל כסף על הפוסט הזה ,
וכל המהות של החברה זה לעשות כסף ממה שהטבע עושה בחינם יא גנבים קפיטליסטים )) ספר להם שהזרעים שלכם צריכים ריסוס מתמיד מאסיבי"

כן, אין משהו יותר מתקדם מהטבע. רעידות אדמה, בצורת, נגיפי אבעבועות שחורות ופוליו, הכל טבעי. שיהיה לך לבריאות.


הערות
  1. 1. למשל אם היבול נוצר כתוצאה מהאבקה טבעית באמצעות רוח או ציפורים, שפיזרו את הזרעים בשטח, והגיעו מחקלאי שכן []
  2. 2. מ-70 דולר ב-1989 ל-160 היום []
  3. 3. הוא נותן לינק לכתבה בהארץ, ותוך כדי כך מעוות את הדברים שנאמרו בכתבה []
  4. 4. המגיב הגיבור לא מספיק אמיץ כדי להזדהות בשמו, והוא יודע למה []