ניהול סיכונים במערכות יחסים (כולל סקס)

 הקדמה קצרה: ב-13/11/2012 הופיע בבלוג "יחסי מין – הגיגים של (א)נשים על מגדר" פוסט מעורר הדים שכתבה קרן תחת הכותרת "על חלוקת סיכונים בסקס ובכלל".  הקדשתי לפוסט ולרעיונות שהועלו בו מחשבה רבה, וארבעה ימים לאחר מכן כתבתי תגובה מסודרת ושלחתי אותה לעורכי הבלוג בבקשה לפרסמו כפוסט אורח. הם מצידם השקיעו גם כן מחשבה רבה בבקשתי, והיום הודיעו לי כי אינם מעוניינים לפרסם את תגובתי כפוסט אורח מכיוון שפוסט כזה "לא יחדש הרבה", כפי שניסח זאת חגי, אחד העורכים. מכיוון שכך, אני מפרסם את תגובתי כאן, בבלוג הבית שלי, למרות שבלוג זה עוסק במוצהר בנושאים אחרים. עם זאת, יש גם קשר לסטטיסטיקה, כפי שתראו אם תמשיכו לקרוא.

הפוסט שכתבה קרן עסק בהשוואה בין הסיכונים שבהם עומדים גברים ונשים כתוצאה מקיום יחסי מין הטרוסקסואליים. הטענה המרכזית הייתה כי נשים עומדות בפני סיכונים גבוהים יותר מאשר גברים במצבים אלה, ולכן הגיעה למסקנה כי יש לנסות לחפש דרכים להעביר חלק מהסיכון הקיים מהצד הנשי לצד הגברי, במטרה לייצר מצב שבו סך הסיכון הקיים מתחלק באופן שווה (או לפחות שווה יותר) בין הצדדים. האם זה אפשרי? לדעתי לא, ולכן נכתב פוסט זה: להסביר מדוע זה לא אפשרי, ולהציע דרך אחרת, אפשרית.

ברצוני להציע נקודת מבט אחרת לנושא זה. אני בעוונותיי סטטיסטיקאי, ולכן נוטה לראות כל דבר מזווית ראיה סטטיסטית. בפרט, למונח "סיכון" יש בעיניי משמעות אחרת ממשמעותו בעיני קרן, והניתוח שאציע מבוסס על הגדרה מדויקת יותר של מונח זה.

ליחסי מין (או, עדיף, למערכת יחסים שכוללת בתוכה מין) יש הרבה תוצאות אפשריות. חלק מהתוצאות האפשריות רעות מאוד, חלקן סתם רעות, ולעומת זאת יש גם תוצאות אפשריות טובות ואפילו מצוינות ("והם חיים באושר ובעושר עד עצם היום הזה"). הבעיה העיקרית, שהיא אינהרנטית לכל אספקט של חיינו, היא בעיית חוסר הודאות. אנחנו לא יכולים לדעת מראש מה יהיה. מה שאנחנו כן יכולים לעשות זה לנסות לערוך רשימה של כל התוצאות האפשריות, והעריך את ההסתברות (הסיכוי) של כל תוצאה אפשרית להתרחש. ההערכה יכולה להיות כמותית (מספר בין 0% ל100%) או איכותית (סבירות נמוכה/גבוהה וכולי).

כמו כן, גם את מידת החוּמרה של כל תוצאה אפשרית ניתן להעריך. כשדנים בפיננסים זה קל – החומרה נקבעת לפי כמות הכסף שמרוויחים או מפסידים. בתוצאות של מערכת יחסים בין שני בני אדם לא ניתן לכמת את התוצאות האפשריות באופן כזה, עם זאת, אני מניח כי ניתן לדרג את התוצאות האפשריות על פי חומרתן. אני מניח, למשל, שכן אפשר לקבוע כי אונס גרוע יותר מסתם סקס משעמם שלא יוביל לדייט נוסף, וסקס טוב שלא יוביל לדייט נוסף עדיף על סקס משעמם שלא יוביל לדייט נוסף, וכדומה.

כאשר יש לנו רשימת תוצאות אפשריות עם הערכות להסתברות של כל אחת מהן להתרחש (אי-ודאות) ואפשרות להשוות בין כל שתי תוצאות על פי חומרתן (או טיבן), ניתן לומר כי סיכון הוא מצב של אי ודאות בו חלק מהתוצאות האפשריות הינן רעות, וסיכון ניתן למדידה על ידי כימות הנזק שייגרם אם תקרה תוצאה מסויימת וכימות הסיכוי כי תוצאה זו אכן תתרחש. למעשה אני מכליל כאן את ההגדרה הקלאסית של הובארד לסיכון, שהתמקדה בסיכונים כלכליים. אם מדובר בפיננסים, אז אפשר למדוד את הסיכון על ידי הכפלת ההסתברות בנזק הכספי הצפוי. כשעוברים ליחסים בין בני אדם זה בלתי אפשרי, כמובן, אבל אני חושב שלא תחלקו עלי אם אקבע כי, בהתאם להגדרה שנתתי, המאורע "אונס בסבירות גבוהה" טומן בתוכו יותר סיכון מאשר המאורע "סקס גרוע בסבירות נמוכה".

עוד הבדל בין סיכונים פיננסיים וסיכונים במערכות יחסים: בתחום הפיננסי ניתן לקנות ולמכור סיכונים – כל המשבר הכלכלי העולמי הנוכחי החל מסחר לא מבוקר בסיכונים פיננסיים. במערכות יחסים הסיכונים הם סובייקטיביים (הנושא נדון בהרחבה בתגובות לפוסט של קרן), ולכן העברת סיכונים אינה אפשרית למעשה ("תשמעי, יש לי דייט, הוא ממש נחמד וחתיך, אבל בפעם הקודמת הסקס איתו היה ממש גרוע, אז אחרי היציאה את יכולה לעלות אליו במקומי ולקבל את הסקס הגרוע?" – לא נראה לי). ההצעה של קרן להעביר סיכון מצד לצד נחמדה, אבל לדעתי לא ישימה.

וכאן, אפשר גם לראות את הבעיה בתרגיל המחשבתי (המבריק) שהציעה קרן כנקודת פתיחה לדיון שלה: התרגיל לא עסק באמת בסיכונים, אלא בתרחיש הגרוע ביותר (worst case scenario), בו הציבה הרשעה ודאית באונס ללא אפשרות משפטית להתגונן לגבר, מול אונס לאשה. מה שקרן יצרה למעשה בתרגיל המחשבתי שלה הוא מאזן אימה. היא הגדילה סיכון לגבר, בלי הפחתה משמעותית בסיכון לאשה, מתוך תקווה שאנס פוטנציאלי יירתע אם הסיכוי שיורשע באונס יגדל בצורה משמעותית.

אני שונא מאזני אימה, משתי סיבות. קודם כל, הם כוללים בתוכם אימה. שנית, האיזון בדרך כלל לא יציב. אני מעדיף מצבים נטולי אימה עד כמה שאפשר. את האימה לא ניתן לבטל לגמרי. אמנם איני קרימינולוג, אבל אני לא חושב שקיימת מערכת ענישה כלשהי שתיצור דמוטיבציה מוחלטת לביצוע פשעים. זה לא אומר שאני מציע לוותר על מערכת החוק והענישה, אבל בהחלט יש צורך במודעות למגבלות שלהם. עד כמה החמרה בענישה והורדת רף ההוכחה תביא להקטנת ההסתברות למקרי אונס (או רצח, או נסיעה במהירות גבוהה מהמותרת, או שימוש בסמים לא חוקיים)? פתרון הרבה יותר טוב הוא פשוט להפחית את הסיכונים.

דרך אחת להקטנת סיכון היא הפחתה של הנזק הצפוי במקרה של התרחשות המאורע הרע. כשעוסקים בפיננסים זה אפשרי – אפשר לקנות ביטוח. שוב, במערכות יחסים הפתרון הזה לא ישים. אולי אפשר לקנות ביטוח שבמקרה של אונס ישלם לקורבן סכום של X שקלים, אבל אני באופן אישי לא הייתי רואה בכך הפחתה משמעותית של הסיכון. אני סבור שרוב הקוראים מסכימים עימי.

כיוון שלסיכון יש שני מרכיבים: חומרת התוצאה של מאורע וההסתברות להתרחשותו, וכשמדובר בסיכונים במערכת יחסים לא ניתן לשנות באופן משמעותי את חומרת התוצאה, הדרך היחידה להפחתת הסיכונים היא על ידי הקטנת ההסתברויות של המאורעות הרעים. אונס הוא רע, ויישאר רע בכל מצב, אבל אם נוכל להקטין את הסיכוי להתרחשותו, הסיכון יפחת.

עד כאן התיאוריה. באופן מעשי, זה הרבה יותר מסובך. ברור לחלוטין שכל אחת ואחד צריכים לנקוט בצעדים שיפחיתו את ההסתברויות להתרחשות מאורעות עם תוצאות חמורות במידת האפשר. זה אומר לנהוג בזהירות, זה אומר לרוץ לממ"ד כשיש אזעקה, וזה אומר להיות זהירים במערכות יחסים, בייחוד במערכות יחסים שכוללות גם מין או פוטנציאל למין. עד לאן אפשר לקחת את זה? יש מי שיאמר כי הפתרון הוא לא לצאת מהבית (פתרון אדיוטי) , ואם את כבר יוצאת אז תלבשי בורקה ורעלה (עיצה מטופשת, כמובן, זה ממש לא מגן מפני אונס). מה בכל זאת? אני מציע שכל אחד ואחת יחשבו מה הפתרונות שמתאימים להם ויישמו אותם.

החברה צריכה גם היא לתת פתרונות לטובת הכלל. מערכות חוקים וענישה הם כאמור פתרון קיים אך בעל יעילות מוגבלת. פתרון הרבה יותר יעיל, אך דורש אומץ ואורך נשימה, טמון בחינוך. חינוך לשוויון וכבוד הדדי, חינוך להכרה כי כל אחד ואחת הם בעלי הזכויות על גופם, חינוך כי מערכות יחסים ויחסי מין הם יותר מאשר סקס. זה אינו פתרון קסם, אבל לעומת זאת זהו פתרון אמיתי.

"הצבעה אסטרטגית" – כן או לא?

כמקובל בכל מערכת בחירות, גם עתה שב ועולה נושא "ההצבעה האסטרטגית". הרעיון הוא כזה: אני יכול להצביע למפלגה קטנה שדעותיי קרובות לעמדותיה, או למפלגה גדולה שדעותיי קרובות גם לעמדותיה, אבל פחות. למי להצביע?

תשובה אפשרית אחת היא להצביע למפלגה שאני הכי קרוב לעמדותיה, במקרה זה – המפלגה הקטנה.

גישה אחרת מציעה לבחור לפי שיקולים אסטרטגיים: המפלגה הגדולה ודאי תעבור את אחוז החסימה ותיוצג בכנסת, בעוד שזה לא ודאי לגבי המפלגה הקטנה. ואם המפלגה הקטנה לא תעבור את אחוז החסימה – הקול שלי יבוזבז. גם אם תעבור המפלגה הקטנה את אחוז החסימה, השפעתה תהיה קטנה יחסית להשפעת המפלגה הגדולה, וגרוע מכך – היא תגרע מכוחה של המפלגה הגדולה ובכך תגביל את השפעתה. המסקנה המתבקשת – עלי להתפשר ולהצביע למפלגה הגדולה.

עוד מילה על בזבוז הקולות: אם המפלגה לה הצבעתי לא עברה את אחוז החסימה – מדובר בהרבה קולות שמתבזבזים. שלשום פרסמה מיה בנגל סטטוס בטוויטר בו כתבה כי שלושה מנדטים בבחירות 2009 נזרקו לפח. הטענה מתבססת על חיבור הקולות שקיבלו 9 מפלגות שאינן מפלגות ימין שלא עברו את אחוז החסימה בבחירות אלה. מדובר בקצת יותר מ-88 אלף קולות, ומכיוון שבכנסת ה-18 המודד למנדט (מספר הקולות המזכים במנדט) היה 27246 קולות, הרי שאותם 88 אלף קולות הם קצת יותר משלושה מנדטים. עיון בתוצאות הבחירות לכנסת ה-18 מעלה כי בסך הכל ניתנו כ-104 אלף קולות למפלגות שלא עברו את אחוז החסימה. שאר 16 אלפי הקולות ניתנו למפלגות "ימין", אך 16 אלף קולות אינם מזכים במנדט. כיוון שגוש המרכז שמאל בתחילת כהונת הכנסת ה-18 מנה 55 מנדטים, לו לא היו מתבזבזים אותם 104 אלפי קולות, גוש המרכז שמאל היה מונה 58 מנדטים. עדיין לא מספיק כדי לשנות את התוצאה הסופית של הבחירות – הקמת ממשלת ימין בראשות נתניהו, אך מאזן הכוחות בכנסת היה שקול יותר, וזה מצב טוב יותר לאופוזיציה (במסגרת הגילוי הנאות אספר כי אני מצביע בקביעות לאחת ממפלגות האופוזיציה).

האמנם?

התשובה המיידית היא כמובן "לא". ההסבר פשוט: אם יצורפו אותם 88 אלף קולות למפלגות שעברו את אחוז החסימה, מספר הקולות הדרוש למנדט יגדל מ27246 ל-28100 בערך, וזה אוצר כי בחלוקה הראשונית של המנדטים וגם בהמשך החלוקה (בחישובי העודפים לפי חוק בדר-עופר) יקבלו חלק מהמפלגות פחות מנדטים. אלו מפלגות? זה כבר תלוי בפרטים.

קל לבדוק מה היה קורה אילו. נתוני ההצבעה קיימים, וכל מה שצריך זה "לקחת" את הקולות מהמפלגות שלא עברו את אחוז החסימה, להעביר אותן למפלגות שעברו אותו, ולחשב מחדש את חלוקת המנדטים לפי חוק בדר-עופר (זה דווקא מסובך, אבל אפשרי). אז עשיתי זאת.

החישובים שערכתי מתבססים על ההנחות הבאות:

1) רק המצביעים של ארבע המפלגות הגדולות ביותר שלא עברו את אחוז החסימה (התנועה הירוקה מימד, גיל – גמלאי ישראל לכנסת, עלה ירוק, מפלגת הירוקים) יצביעו "הצבעה אסטרטגית" בחישובים ההיפותטיים שלי. מפלגות אלה קיבלו 71 אלף קולות יחד. שהיו ככל הנראה מספיקים ל-3 מנדטים בכנסת (בזכות עודף הקולות הגדול שהיה נשאר לאחר חלוקת המנדטים הראשונית).

2) המצביעים של  שאר המפלגות הקטנות (שכל אחת מהן קיבלה פחות מ-7000 קולות, ובדרך כלל הרבה פחות מכך) היו מצביעים עבורן בכל מקרה, וגם לו היו משנים את הצבעתם, זה לא היה משפיע על תוצאות הבחירות.

3) המצביעים של ארבע ה-"קטנות הגדולות" יתפלגו בין המפלגות הגדולות להם הם מצביעים בניתוח ההיפותטי שלי בהתאם ליחס מספר הקולות בין המפלגות הגדולות, ובפרט:

  א. קולות  התנועה הירוקה מימד יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.

  ב. קולות גיל – גמלאי ישראל לכנסת יתחלקו בין קדימה, הליכוד, ישראל ביתנו, ומפלגת העבודה ביחס: 34% : 33% : 18% : 15%.

  ג. קולות עלה ירוק לכנסת יתחלקו בין קדימה, ישראל ביתנו, ומפלגת העבודה ביחס: 51% : 27% : 23% .

  ד. קולות  מפלגת הירוקים יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.

לפי הנחות אלה, מבין 71 אלפי המצביעים ל-"קטנות הגדולות", כ-40 אלף מעבירים את קולם לקדימה, 6 אלפים לליכוד, 7 אלפים לישראל ביתנו ו- 18 אלף למפלגת העבודה.

בדקתי מספר תרחישים:

1) הצבעה אסטרטגית של כל מצביעי ארבע "הקטנות הגדולות", כלומר אותם 71 אלף קולות מתחלקים בין קדימה, הליכוד, ישראל ביתנו והעבודה כמפורט למעלה.

2) הצבעה אסטרטגית ימין-מרכז: קדימה, הליכוד וישראל ביתנו מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", 18 אלף קולות פוטנציאליים של מפלגת העבודה הולכים לאיבוד.

3) הצבעה אסטרטגית שמאל-מרכז: קדימה, והעבודה מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", אך הקולות הפוטנציאליים של הליכוד וישראל ביתנו הולכים לאיבוד.

4) הצבעה אסטרטגית ימין-שמאל: הליכוד, ישראל ביתנו, והעבודה מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", אך הקולות הפוטנציאליים של קדימה הולכים לאיבוד.

5) הליכוד זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

6) העבודה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

7) קדימה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

התוצאות הלא מפתיעות: גוש ה-"שמאל-מרכז" (קדימה, העבודה, מרץ, חדש, רעם-תעל ובלד) שמנה בתחילת הכהונה של הכנסת ה-18 55 מנדטים אינו משתנה באופן משמעותי. ברוב התרחישים הוא גדל ל-56 מנדטים. הנה עיקרי התוצאות (השינויים הפרסונליים על פי רשימות המועמדים באתר הכנסת, הפירוט המלא בקובץ האקסל המצורף, וכן מצוךף לינק לתכנית ה-SAS  שכתבתי לצורך חישובי המנדטים):

1) הצבעה אסטרטגית של כל מצביעי ארבע "הקטנות הגדולות": קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

2) הצבעה אסטרטגית ימין-מרכז קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

3) הצבעה אסטרטגית שמאל-מרכז: קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

4) הצבעה אסטרטגית ימין-שמאל: העבודה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף נכנסת לכנסת במקום אלכס מילר.

5) הליכוד זוכה בכל הקופה: הליכוד עולה בשני מנדטים על חשבון קדימה ושס; גוש השמאל-מרכז מונה 54 מנדטים. אללי אדמסו ויצחק דנינו נכנסים לכנסת במקום אורית זוארץ ואברהם מיכאלי.

6) העבודה זוכה בכל הקופה: העבודה עולה בשני מנדטים על חשבון קדימה וישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף וראלב מגאדלה נכנסים לכנסת במקום אורית זוארץ ואלכס מילר.

7) קדימה זוכה בכל הקופה: קדימה עולה בשני מנדטים על חשבון ישראל ביתנו ושס; גוש השמאל-מרכז מונה 57 מנדטים. יוליה שמאלוב- ברקוביץ ונינו אבסדזה נכנסים לכנסת במקום אלכס מילר ואברהם מיכאלי.

המסקנה שלי מהתרגיל התיאורטי שערכתי: ההשפעה של "הצבעה אסטרטגית" מוגבלת ביותר, ויש לה פוטנציאל מוגבל מאוד לשנות את התוצאות המהותיות של הבחירות, רק כאשר המאבק בין הגושים צמוד ביותר. לו לא היו הולכים אותם קולות שניתנו למפלגות שלא עברו את אחוז החסימה, המרוויחה הגדולה ביותר הייתה ככל הנראה יוליה שמאלוב-ברקוביץ.

את המסקנות לבחירות הקרובות מוזמן כל אחד להסיק בעצמו. אני, באופן אישי, אמשיך להצביע על פי צו מצפוני, ואתן את קולי לאותה מפלגה קטנה שקיבלה אותו מאז 1984 בכל גילגוליה.

השכר הממוצע כ-9000 ₪, כמה מרוויחים הרוב?

הנה צילום מסך של ידיעה מרגיזה שפורסמה אתמול בגלובס:

הידיעה מרגיזה ממספר סיבות.

קודם כל, הניתוח הכלכלי בידיעה הוא בסך הכל נכון, ומראה כי יש ירידה לאורך זמן ביחס בין השכר החציוני לשכר הממוצע במשק, מה שמעיד (מייד אסביר מדוע) על הגידול באי השוויון ובפערים החברתיים. ואותי זה מרגיז.

שנית, מצויין כי הלשכה המרכזית לסטטיסטיקה אינה מפרסמת את השכר החציוני במשק מדי חודש, ולצערי גם זה נכון. בכתבה צויין כי "מהלמ"ס נמסר כי אין הם מחשבים נתון זה", וסביר להניח כי זה נכון. זה גם מרגיז, כי ראוי שנתון השכר החציוני ייאמד ויפורסם מדי חודש, ובלשכה המרכזית לסטטיסטיקה יש הרבה סטטיסטיקאים מוכשרים שיודעים כיצד לבצע את המשימה הזו. למיטב ידיעתי, ההחלטה לא לפרסם את השכר החציוני מדי חודש נובעת ממדיניות, וזה כבר מאוד מרגיז. השכר החציוני מפורסם רק פעם בשנה, ומוחבא היטב בתוך השנתון הסטטיסטי.

שלישית, הגרפים בכתבה מטעים ומראים את הירידה ביחס חציון/ממוצע  כיותר חדה מכפי שהיא באמת, וגם ההשוואה של היחס הזה בין ישראל למדינות אחרות מוטה. זה נעשה על ידי הטריק הידוע של קיצוץ ציר ה-Y, וכבר כתבתי על כך בעבר (למשל ברשימה על מחקר האוצר על השפעת שכר המינימום על התעסוקה במשק).

אבל הפרט המרגיז ביותר הוא הפרשנות שניתנת בכתבה לשכר החציוני. בכתבה נאמר כי "החציון הוא מדד למיקום המרכז של קבוצת נתונים מספריים או מדגם, אך הוא טוב בהרבה לעומת הממוצע, שהרבה יותר רגיש לערכי קצה" וזה נכון. אבל נאמר גם כי "השכר של רוב השכירים הישראלים במשק (המכונה בספרות כ'שכר החציוני') עומד על כ-6,655 שקל", וזה ממש לא נכון. ומאוד מרגיז.

מדוע היחס בין השכר החציוני לשכר הממוצע מהווה מדד לאי שוויון? בואו ניזכר מה זה חציון. כאשר יש סדרת מספרים, כמו נתוני שכר של כ-2.5 מיליון שכירים בישראל, אפשר לסדר את הנתונים האלה בסדר עולה, מהקטן לגדול. המספר שנמצא באמצע הסדרה, בסביבת המקום המיליון ורבע, מחלק את נתוני השכר לשתי קבוצות שוות. בקבוצה אחת כל הנתונים גדולים ממנו או שווים לו, ובשניה כל הנתונים קטנים ממנו או שווים לו. המספר שבאמצע הוא החציון. אמנם זהו הסבר לא מדוייק, אבל לדעתי מבהיר את הנקודה העיקרית. המעוניינים יכולים לקרוא הסבר מפורט יותר בויקיפדיה.

האם רוב הנתונים בסדרה שווים לחציון? בדרך כלל לא. בואו ניקח דוגמא פשוטה, סדרה של 3 מספרים בלבד: 1,2,3. החציון הוא 2, אבל רוב הנתונים אינם שווים ל-2.

שימו לב כי גם הממוצע של שלושה מספרים אלה הוא 2, וזאת בגלל הסדרה סימטרית סביב 2. זה תמיד נכון: אם סדרת נתונים היא סימטרית, אז הממוצע של הסדרה שווה לחציון. גם ההיפך נכון: אם הממוצע שווה לחציון, אז הסדרה סימטרית סביבם (את זה קצת יותר קשה להוכיח).  לכן, ההפרש או היחס בין החציון והממוצע מהווים מדד למידת הסימטריה של הנתונים. למשל, אם נשנה את הנתונים ונחליף את 3 בערך גדול יותר, נניח 6? החציון יישאר 2 אבל הממוצע יגדל מ-2 ל-3. באופן כללי, כאשר הממוצע גדול מהחציון, אז הסדרה אסימטרית עם יותר ערכים גבוהים, וכאשר הממוצע קטן מהחציון, אז הסדרה אסימטרית עם יותר ערכים נמוכים.

כשמדובר בנתוני שכר, יש עוד פרט שצריך לקחת בחשבון. שכר יכול להיות מאוד גבוה, אבל אינו יכול להיות נמוך יותר מדי. באופן חוקי השכר חייב להיות גבוה משכר המינימום, ובכל מקרה אינו יכול להיות נמוך מ-0. לכן, כשמדובר בנתוני שכר, האסימטריה יכולה להתבטא רק בקיומם של בעלי שכר גבוה במיוחד, והמשמעות הכלכלית של כך היא אי שוויון בחלוקת ההכנסות. (דנתי בנושא זה בעבר ברשימה על המנהל והפועלים).

ועכשיו ננסה לענות לשאלה מהו השכר של רוב השכירים בישראל. המונח הסטטיסטי למדד כזה הוא השכיח (mode) – הערך הנפוץ ביותר בסדרת הנתונים. למשל, בסדרה  1,2,2,2,3 השכיח הוא 2, כיוון ש-2 מופיע בסדרה 3 פעמים, יותר מכל נתון אחר בסדרה. האם בסדרה של כ-2.5 מיליון נתוני משכורת של שכירים בישראל המספר 6655 הוא הנפוץ ביותר? איך אפשר לברר זאת?

כאמור, הלמ"ס מספקת כל חודש רק נתונים חלקיים, אך אחת לשנה מתפרסם בשנתון הסטטיסטי לוח התפלגות שכר לפי עשירונים (קישור לקובץ pdf באתר הלמ"ס). השנה האחרונה עבורה התפרסמו נתונים אלה היא 2010. לכן נמשיך את הדיון תוך כדי שימוש בנתונים אלה. הנה הנתונים הרלוונטיים לדיון שלנו:

גבול עליון (₪)

סך הכל שכירים (אלפים)

עשירון

2069

252.2

1

3501

252.3

2

4316

252.1

3

5049

252.2

4

5984

252.2

5

7051

252.2

6

8587

252.4

7

11229

252.0

8

16290

252.2

9

252.2

10

אנו רואים כי בכל עשירון יש כרבע מליון שכירים. הגבול העליון הוא השכר הגבוה ביותר בעשירון. כך למשל, בעשירון הראשון הגבול העליון הוא 2069 ₪. פירוש הדבר הוא כי  252.2 אלפי השכירים שבעשירון זה השתכרו לא יותר מ-2069 ₪ לחודש בשנת 2010.

הגבול העליון של העשירון ה-5 הוא השכר החציוני החודשי, 5984 ₪ בשנת 2010. 50% מהשכירים השתכרו 5984 ₪ לחודש או פחות מכך בשנת 2010 (אלה הנמצאים בעשירונים 1 עד 5) ו- 50% מהשכירים השתכרו יותר מ-5984 ₪ לחודש בשנת 2010 (אלה הנמצאים בעשירונים 6 עד 10). סביר מאוד כי מספר השכירים שהרוויחו בדיוק 5984 ₪ לחודש הוא נמוך למדי, וסביר שזה לא השכיח.

האמת היא שלשכיח עצמו אין כאן הרבה משמעות. מה כבר ההבדל בין 5986 ₪ ל-5986 או אפילו 6000? מעניין יותר לדעת מהי הקטגוריה השכיחה, אם נחלק את טווח השכר בקטגוריות ברוחב 1000 ₪, למשל. לשם כך עלינו למלא את הטבלה הבאה:

סך הכל שכירים (אלפים)

קטגוריית שכר

???

0-999.99

???

1000-1999.99

???

2000-2999.99

???

3000-3999.99

???

???

???

איך נעשה זאת?

לשם כך נצטרך להניח הנחה גסה, לפיה הפיזור של השכר בכל עשירון הוא אחיד. כך למשל, בעשירון הראשון, שתחומו 0 עד 2069, נניח כי מספר השכירים ששכרם בין 0 ל-1000 ₪ (תסלחו לי  על האגורה) שווה למספר השכירים ששכרם בין 1000 ל-2000 ₪, ואילו מספר השכירים ששכרם בין 2000 ל-2069 ₪ שווה ל-6.9% ממספר השכירים בקטגוריית השכר 1000-2000 ₪. וכעת, תוך כדי שימוש בתרגילי ערך משולש נוכל להסיק כי מספר השכירים בקטגוריות 0-1000  ₪ ו-1000-2000  ₪ הוא 121.9 אלף, וכי 8.4 אלפי שכירים היו בעלי שכר חודשי בין 2000 ל-2069 ₪. בעזרת חישובים דומים (קישור לקובץ אקסל עם החישובים) נוכל לאמוד את מספר השכירים ששכרם החודשי היה בין 2069 ל-3000 ₪ ב-164.0 אלפים, ולכן מספר השכירים בקטגוריית השכר 2000-3000 ₪ נאמד בסך הכל ב-172.4 אלפים. כך נוכל להמשיך את החישוב, ובסופו של דבר נקבל את התפלגות השכר הבאה:

 

ומכאן נוכל לראות כי קטגוריית השכר השכיחה היא זו שבין 4000 ל-5000 ₪; זה היה שכרם החודשי של 333.3 אלפי שכירים, המהווים 13.2% מסך כל השכירים במשק. שכר הקרוב לשכר החציוני, נניח בטווח 5500 עד 6500 ₪ קיבלו בערך 254.6 אלף שכירים, כ-10.1% מהשכירים במשק. השכר הממוצע במשק ב-2010 היה 8100 ₪. שכר קרוב לשכר הממוצע, בין 7500 ל-8500 ₪, קיבלו כ-202.2 אלף שכירים, שהם כ-8% מהשכירים במשק.

ואם ננסה להקיש מנתוני 2010 לנתוני 2012, ובהנחה שההתפלגות נשארה דומה ביסודה, נוכל לשער כי קטגוריית השכר השכיחה במשק ב-2012 נמצאת גם היא ככל הנראה כ-1000  ₪ מתחת לחציון, ורוב השכירים במשק משתכרים בתחום 4500-5500 ₪. עצוב.

Trust me, I'm a Statistician

מזה כ-8 חודשים אני מנהל בפייסבוק דף העוסק בצד הקליל של הסטטיסטיקה: קריקטורות, תמונות משעשעות, גרפים מפתיעים, קישורים מעניינים, ציטוטים מעוררי מחשבה, בקיצור – כל מה שעשוי לשעשע את מי שמתעניין בסטטיסטיקה (לפחות לדעתי). עד כה העמוד צבר קרוב ל-350 לייקים (לא יודע מה זה אומר או נותן חוץ מהרגשה טובה). **עדכון: ב1.12.2017 הדף הגיע ל-2000 לייקים.

אתם מוזמנים לעקוב אחרי הדף בפייסבוק: http://www.facebook.com/TrustMeImAStatistician

מתאם כן מעיד על סיבתיות

לא, לא, אל תדאגו, אני בסדר.

כן, זה אני, יוסי לוי, בעל השכלה רחבה בסטטיסטיקה, שאפילו נחשב לסטטיסטיקאי מכובד בחוגים מסויימים. אני יוסי לוי, שהפוסט הראשון שכתבתי בבלוג הזה עסק בנושא המתאם והסיבתיות, ופוסט זה כלל שפע של דוגמאות מגוחכות לתופעות שיש בינן מתאם, אך לא קשר סיבתי. רק לפני ארבעה שבועות כתבתי פוסט ארוך על הקשר האפשרי בין צמחונות ואנורקסיה, וכתבתי שם בפירוש כי מתאם  לא בהכרח מעיד על סיבתיות. אז כתבתי. זה לא היה מדוייק, ובעולם שלי "לא מדוייק" זה לא נכון. טעיתי בהיסח הדעת, ואני מודה בטעותי. מה הייתי צריך לכתוב?

בכל קורס מבוא לסטטיסטיקה משננים את המנטרה: מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות.

אבל המנטרה לא נכונה. תחשבו רגע בהגיון: מה יכול להעיד על סיבתיות אם לא מתאם? נניח שאתם צופים בשתי תופעות שאין שום קשר בינן. למשל, מספר הנעליים של אדם בוגר (בניגוד לתלמידים בבית הספר) ורמת הידע שלו במתמטיקה. אני מאמין שלא תמצאו מתאם בין שתי התופעות, או יותר נכון, המתאם במדגם שתקחו יהיה קרוב מאוד לאפס. מי שלא מוכן לאמץ את הדוגמא הזו, מוזמן לקחת דוגמת הארד-קור: קחו קובית משחק הוגנת (כלומר, לכל אחד מששת המספרים סיכוי שווה להופיע כלפי מעלה בהטלת הקוביה). הטילו אותה פעמיים ורשמו את תוצאת ההטלה הראשונה וההטלה השניה. חזרו על התרגיל שוב מספר רב של פעמים, וחשבו את המתאם בין שתי התצפיות. המתאם יהיה בערך אפס. אין מתאם. אז אם " מתאם לא מעיד על סיבתיות", מה אומר לנו חוסר המתאם? שיש סיבתיות? שתוצאת ההטלה הראשונה של הקוביה גורמת את תוצאת ההטלה השניה? שמספר הנעליים גורם את הידע במתמטיקה? או להיפך? לא.  ממש לא.

אם אתם מדענים, או חוקרים, או סתם אנשים סקרנים, חוסר קשר בין שתי תופעות ממש לא מעניין אתכם. אתם לא תגידו לעצמכם: "המממ, בחלק מצלחות הפטרי יש עובש, ובחלק אין, וכל החיידקים מתו בכל הצלחות, ולכן אין קשר בין העובש ומות החיידקים. נראה לי שעלינו על משהו גדול". בדיוק להיפך.

אנשים כמוכם אמורים לזהות שתי תופעות שנראה שיש קשר/מתאם בינן, ואז להכנס לעובי הקורה ולנסות לבדוק מה מקור הקשר והאם יש סיבתיות כלשהי. לפעמים תגלו שלמרות המתאם אין שום סיבתיות. לפעמים תגלו מבנה קשר כלשהו: A גורם את B, או אולי B גורם את A, או אולי C גורם גם את A וגם את B, ויש גם מבני קשר מסובכים יותר.

הסיבה לכך פשוטה: אם יש קשר סיבתי בין שתי תופעות, חייב להיות בינן גם מתאם. נכוו, ייתכן כי יש מתאם בין שתי תופעות גם אם אין בינן קשר סיבתי, אבל לא ייתכן כי לא קיים מתאם ויש קשר סיבתי.

ולכן, מתאם מעיד על סיבתיות. זוהי עדות נסיבתית, אבל בכל זאת עדות. היא לא מספיקה להרשעה להוכחה, אבל בלעדיה כל הקייס מתמוטט.

אמרו מעתה: מתאם מעיד על סיבתיות אפשרית, אך אינו מספיק להוכחת הסיבתיות.

אז מה כתוב כאן?

39656161936137668416363639842916664336846177811666
93166161776665811643505739293957616116439961996199
74616116995761932543772565613999387766363984385761
16386539164339397466931636439366776116662599615766
36163681774561168465435036391693384366366516456199
36363939656161936125619966573639456144665738657766
39614316665761436599576145376665396143654357746561
61936143654316938477613699978166368429163999616665
66256136395066745736433636396561816139446637664561
77369739651657993939298457654361936684611665776684
66934457376116579961164366936636613966434461656636
16667739386539654339383616573939256199665739574338
61386539456144665738657766396643936666744339259957
38613661612999166161931666653965616193613925773765
16774316434438576574576643656681818161666677383993
84663650656674663639664339613943613877166681665797
39998465977477366138659966389957613866655066993816
38744461611684996636972566256136661674375736772950
61369944616638654316383916446166251681433857844574
99385061393966433961397774167777663757376177396139
61578143385738615039388416163943663666394425617797
43368465619361396629433638617761663936663699663616
44616666776174666161773966433961391639366616816116
39259366656116994343662577617439365066161693846138
84457499434438576661663665393899503639166177394377
66386199431629846116257737616116664344816139778144
57664445665765434366257761743999436677619957456137
36746161169957619325396643396139386650571693667799
39979316776636435036813699164316573843665781668416
66934350939965999350657466395743386677386539164316
57844574993661436657399984613966391643162961163957
99611638393874618443509316615761996166391693846161
16653925618465443657667765435057168177396644618439
44365766776599846139384366578166386566383866576636
39164316573966253865445745661699813699398436396166
74573661436636668457816157619966438197394561579965
44574516668466931645664457846561668161994316298439
57294339386543509316841661366166997461611699576193
25741665443684161674661666773765433639256157166193
61663865391657293939391666166638573737846539656650
93662516393839445761813943363784776636616638653916
57293939664365433945364474998181436543251677974499
66437761167466663938168436396639654339618445667439
16572939397781999357749977663843611638993916396643
16996177436181434438576537846636993843653981394438
66373939664339613925773761744361776693846665446157
61295793936674617745396643399961666566253925936665
99616636571643979357666661773966435074574336849966
93366638652557256657167793656643363977366677611638
44574516991650745766392561846516457477398161167793
65392593666538614429433639773666776116386566818138
61364361166661663657653661436657613939257737613638
44613650396643396139847438776681168438778199934561
57996539444561746584387725168143385739506566653966
44618484936661663639746638576636996177846138667766
45618166656550656636994557377799436544363884164366
36501661386116663816667739434444574516387761164316
57611699813699398436776161295799391681369977431677
65847457667781611636431643617766168461938465456199
36616636816165437761367765378466778465451681397736
66776116387743454466849381398161846138667743817725
66571665455737773966434344392961843661436657613950
65614461366544613916506536394557377725665716366557
29667765295761813677617466376177816566165765846138
66773966433965816584666516669938773643654436388416
43663638613861166638366161161616506536394557377739
66433961394561575766776593446138574350933916938477
61163916384461846116996166365738653916433939843857
61166616383981577766433625619966576177667750976657
43651645619936393639997461611699576193254350931616
38363644613916456199393925613865656161936193571666
57614365995761453766654544653639166161936543505738
37841639161677663977615039396561619361995761453766
65433639454465816166667738393639389936668166654339
66817781396581393950659939664544653639654350573877
16972566653666816639166116395766365061166636395743
66616538166661386539816177993639656181394466817466
93166138651697662543363950659965454465665774435057
81816539664561441661165766365061163937841637847739
93579957614537666538667739652516576144613857381684
43363937847739667793578181169384773966436543396139
16668177657499653784773981394445747761366565434561
16668161774366773666776116366616816116663943669945
45613938386681369965619966386581651693847737669993
50743999666599936674166161934336778166776636393784
77393966433929618465656161936199576145376665658416
66931666654336255737846116396639614377847736399938
16503965435057164544579374663638386536817766773977
61456661388166656599366681664336816539847457667766
36399945614561611638506161996116653916294399816577
61456661169384616129436593578144613857393661612999
16666599576145376665669961936166387761454465613639
99435093163916395065997716972565447761391661169938
77613916611677169725666544776139506599387761454465
61168161816545446516381638819961746657366557843966
99576145376665654361938439436197394544653639396681
77994361973943664477396143378416394336393639998165
43509316394544656116664316573981612993659384363939
66817739363999816545446516996561656616571661653916
99656165399761973857615799447761665738164461385743
36393638669939994477744574377736662943663639776145
66616161384357664516666166368493456644663966434477
39654350665766509757841697662545446561165093388181
38166677394484166116394593579966396625386639454465
61166565616193611661166544776150659999454465389961
93611661774366994544653899619338164365777499849943
66447716745761818138654336396139434438576636657761
50663884654516813699776136816538396166654350573836
16397761456661613881166699777736667761163829576181
65773650994366447745373761453761655038994461664365
61666665396693618416397739366629436636661661431665
43576677659344613857396643394361383916364361166584
38663697433639431639616639939957611616846665164366
38976657744325933944613857445745161643165738394481
99579966363938776116651643165774654345619984774439
45373761453761386536817766777761456661611699164316
57163643574461385743364561446657391684383966162961
25164544577761456661611643443857616116389984975736
16776136776599506677433637847736396561619361664336
39935781657761366650453737614537613865397736667761
16436665163966436543169781615743363816393865396561
61936166436177661629616177431616936699579945614466
57431661366143665774999366251643163884388436439965
43776116816157166138396638376684779945445766816139
66431681615716613839663845614457656681613966433961
39381699164561993639363999746161169957619325665743
39816597433699166684617761666639656161936193571666
57614365995761453766653961613639656161936143166136
61363961436543378436394344616566448416435036

על מתאם וסיבתיות, או האם צמחונות גורמת לאנורקסיה

אני מניח שרוב הקוראים כבר שמעו על גרי יורופסקי ועל הטענה (המגוחכת לכשעצמה) כי ההרצאה שלו היא ההרצאה הכי טובה שתשמעו אי פעם. למי שלא יודע, יורופסקי הוא טבעוני קיצוני המטיף לטבעונות קיצונית והטמעתה בשיטות קיצוניות. אני לא מתכוון לדון בהרצאה שלו ובטיעוניו (וגם לא לתת לינק), כיוון שרוב הטיעונים (לשני הצדדים) כבר הושמעו.

אני מתכוון להתייחס כאן לטענה אחת בלבד שהועלתה על ידי הבלוגר (המומלץ) המכנה את עצמו "קנקן התה" וכותב את הבלוג "חשיבה חופשית". קנקן התה טוען כי מעבר לנזקים בריאותיים מיידיים (כגון אנמיה), ההטפה לצמחונות/טבעונות של יורופסקי ומרעיו עלולה לגרום להתפתחות של אנורקסיה נרבוזה.

זו האשמה חמורה. אני מצטט כאן את קנקן התה, שמצטט מצידו כתבה שפורסמה ב"מעריב":

על פי מחקר שבוצע במרכז הרפואי "רמב"ם", 96 אחוז מהנערות הישראליות שמפתחות אנורקסיה נרבוזה נמנעות מאכילת בשר אדום ו-75 אחוז נמנעות מאכילת עוף ובשר לבן – פי עשרה יותר משיעור הצמחונים בקרב המבוגרים הבריאים. "בבולימיה אנו מוצאים מגמה דומה, אם כי לא בטוטליות כזו".

"לקשר בין צמחונות להפרעות אכילה יש הסבר גופני", מבהירה ד"ר יעל לצר, מנהלת המרפאה להפרעות אכילה ברמב"ם. "בגיל ההתבגרות מובילה אי אכילת בשר למחסור באבץ, שמשמש רכיב חיוני לתהליך הצמיחה והגדילה. הפחתת כמות האבץ מובילה לעיתים לחוסר תיאבון, וכך מתפתח מעגל קסמים שמוביל להפחתת המזון ובהמשך להפרעת אכילה".

כשפרסמתי את הלינק לפוסט של קנקן התה בדף הפייסבוק של "ספקנים בפאב" המופעל על ידי ארגון הספקנים בישראל (שאני בין מייסדיו), התקבלו כמובן תגובות מעורבות, כצפוי בכל העלאה של נושא כה קונטרוברסלי. כאן אתייחס רק לתגובה של עפרה מהודר, שתמיד שואלת שאלות טובות: "אוי, יוסי, אני מתפלאת עליך. בתור סטטיסטיקאי, שקופץ כל כך בקלות ממתאם לסיבתיות. אם הרבה מהאנורקטיות הן טבעוניות, זה לא אומר שבהכרח הטבעונות גרמה לאנורקסיה. אולי, כמו שאמרו בכתבה, לנערות האלה יש צורך חזק בשליטה, וזה מתבטא במשטרים תזונתיים שונים."

עפרה צודקת, כמובן. הנתון לפיו 96% מהנערות הישראליות שמפתחות אנורקסיה הן צמחוניות מעיד על מתאם בין שתי התופעות. מתאם לא בהכרח מעיד על אינו מהווה ראיה מספיקה לקביעת סיבתיות. (תיקנתי את הטקסט ב-21.10.2012. רוצים לדעת מדוע? כי מתאם כן מעיד על סיבתיות.)

אבל רגע. גם רונלד פישר בשעתו גייס טענה זו כדי לשכנע את עצמו כי עישון אינו גורם לסרטן, אך ניתוחים סטטיסטיים מעמיקים יותר שנעשו על יד ג'רום קורנפילד ועמיתיו העמידו אותו על טעותו. כלומר – הטיעון כי מתאם אינו בהכרח מעיד על סיבתיות הינו נכון אך כללי מדי, ויש לבחון נתונים נוספים. יש לזכור כי כאשר יש מתאם ייתכן כי יש סיבתיות, מלאה או חלקית. וכמובן, מתאם יכול בהחלט לנבוע מסיבתיות. יותר מכך – סיבתיות מובילה תמיד למתאם. מנגנון אפשרי לסיבתיות שכזו תיארה ד"ר יעל לצר, מנהלת המרפאה להפרעות אכילה בבית החולים רמב"ם (ראו את הציטוט מהפוסט של קנקן התה לפני שלוש פסקאות). יש לנו מתאם, ומנגנון סיבתי. זה כבר יותר מאשר סתם מתאם.

ויש עוד. יש גם נתונים לגבי שיעור הצמחונים (והצמחוניות) באוכלוסיה ולגבי שיעור החולות באנורקסיה, שמאפשרים לשים את אותם 96% שהוזכרו בקונטקסט הנכון. בעזרת הנתונים הנוספים ניתן לחשב עד כמה גדול הסיכון לאנורקסיה בקרב נערות צמחוניות בהשוואה לחברותיהן הלא צמחוניות. הניתוח שאביא כאן הינו כמובן פשטני לעין ערוך מעבודתו ההיסטורית של קורנפילד, אך לדעתי מבהיר היטב את הנקודה.

לפי הכתבה במעריב שתיארה את המחקר של ד"ר לצר, 11.6% מהמתבגרות מגדירות עצמן כצמחוניות. לפי אתר אנונימוס, המצטט מחקר של הלשכה המרכזית לסטטיסטיקה, 9.8% מהנשים בישראל הן צמחוניות ושיעור הצמחונות באוכלוסייה עולה קלות עם הגיל, כלומר, בקרב נערות בגיל הסיכון לאנורקסיה שיעור הצמחוניות הוא נמוך יותר. לצורך החישובים אשתמש בערך 10%.

על פי ויקיפדיה, בחברה המערבית אחוז החולות במחלה נע בין 0.5% ל-1%. (0.2% מהמתגייסות לצה"ל לקו באנורקסיה, אך סביר להניח כי חולות רבות לא גויסו כלל). לפי מאמר של מיטרני ועמיתיה מ-1995 יש בישראל 29 מקרים חדשים של אנורקסיה לכל 100,000 נערות בגיל 12-18 כל שנה, וזה מוביל אותנו לבערך 0.5% חולות בסך הכל בקבוצת הגיל הנ"ל. דו"ח שהוגש לועדה לזכויות הילד של הכנסת ב-2004 (קישור לקובץ pdf) נוקב בשכיחות של 1%, בהתחשב בזמן שעבר מאז המחקר של מיטרני, ובהנחה ששיעור הסובלים מהפרעות אכילה שונות בישראל עלה באופן דומה לעלייתו בארצות מערביות אחרות. לכן אשתמש בחישובים שאציג מייד בערך של 1%.

ומכיוון שכאמור לפיו 96% מהנערות הישראליות החולות באנורקסיה הן צמחוניות, הרי ש-0.96% (96% מ-1) מהנערות הינן צמחוניות וגם חולות באנורקסיה.

בואו נשרטט לנו טבלה קטנה. שלושת נתוני הבסיס מסומנים באדום (כמו בטקסט). שאר הנתונים נקבעים על ידי נתוני הבסיס:

צמחונות

סה"כ

כן

לא

אנורקסיה

כן

0.96%

0.04%

1.00%

לא

9.04%

89.96%

99.00%

סה"כ

10.00%

90.00%

100.00%

בעזרת הטבלה אפשר לחשב הסתברויות מותנות:

מה ההסתברות כי נערה צמחונית חולה באנורקסיה? 10% מהנערות הינן צמחוניות, 0.96% הינן גם צמחוניות וגם חולות באנורקסיה, ולכן התשובה היא 0.96 חלקי 10, כלומר 0.096.

מה ההסתברות כי נערה שאינה צמחונית חולה באנורקסיה? 90% מהנערות אינן צמחוניות, 0.04% אינן צמחוניות וגם חולות באנורקסיה, ולכן התשובה היא 0.04 חלקי 90, כלומר 0.000444.

ההסתברות כי נערה צמחונית חולה באנורקסיה גבוהה פי 216 מההסתברות כי נערה שאינה צמחונית חולה באנורקסיה. בשפת הסטטיסטיקה והאפידמיולוגיה אומרים כי הסיכון היחסי לאנורקסיה המקושר לצמחונות הוא 216. זה מראה קשר חזק מאוד בין שתי התופעות, וזה כבר יותר מסתם מתאם.

מדד מקובל יותר לחוזק הקשר הוא ה-Odds Ratio (אין לי מושג איך לתרגם זאת לעברית. Odds הוא יחס הסתברויות, ולכן Odds Ratio הוא יחס של יחסי הסתברויות). החישוב הוא כדלקמן:

בקרב הצמחוניות, הסיכוי לחלות באנורקסיה הוא 0.96/10 כלומר 0.096 והסיכוי לא לחלות הוא לכן 0.904. היחס בין הסיכוי לחלות לבין הסיכוי לא לחלות, ה-Odds, הוא לכן 0.096 חלקי 0.904, כלומר 0.1062.

חישוב דומה מראה כי היחס בין הסיכוי לחלות באנורקסיה לבין הסיכוי לא לחלות בקרב הלא הצמחוניות הוא 0.000445.

ה-Odds Ratio, היחס בין  0.1062 ל-0.000445 שווה לכן ל-238.8 ומשמעותו כי הסיכון לאנורקסיה בקרב נערות צמחוניות גדול כמעט פי 239 מהסיכון בקרב נערות לא צמחוניות.

זה מספר עצום. לשם השוואה, תרופה בה ה-Odds Ratio להתרחשות אירוע קליני של מחלת הטרשת הנפוצה קרוב ל-2 (הסיכון ללא טיפול גדול פי  קצת פחות מ-2 מהסיכון תחת טיפול תרופתי) נמכרת במיליארדי דולרים כל שנה.

מסקנות

האם צמחונות גורמת לאנורקסיה? ודאי שלא. הרי יש נערות צמחוניות רבות (בערך 9 מתוך כל 10) שאינן חולות באנורקסיה.

האם יש מנגנון סיבתי המסביר כיצד אנורקסיה יכולה להתפתח מצמחונות? בהחלט כן.

האם הסיכון לחלות באנורקסיה גבוה באופן משמעותי עבור נערות צמחוניות? בהחלט כן. גבוה מאוד, אפילו. צמחונות היא גורם סיכון לאנורקסיה.

מכאן שאמנם אורח חיים צמחוני לכשעצמו לא בהכרח גורם לאנורקסיה, אך בשילוב עם גורמי סיכון נוספים המחלה עלולה להתפתח.

האם הורים לבת עשרה שהחליטה להיות צמחונית צריכים להיכנס לפאניקה? בהחלט לא, אבל הם צריכים להיות קשובים לביתם, למצוקות אפשריות אותן היא חווה, להיות עם אצבע על הדופק, ולוודא שאין סימנים אחרים המעידים על התפתחות מחלה קשה זו. המלצות אלה נכונות כמובן תמיד, לכל הורה, וכמובן גם להורים לבנים, וגם אם הבן או הבת אינם צמחונים.

האם צמחונות לכשעצמה היא דבר רע? אני לא חושב שמישהו העלה את הטענה הזו ברצינות. אני בודאי לא טוען זאת (אם כי איני צמחוני).

רק בריאות.

הערה (4.3.2019): הפוסט נסגר לתגובות עקב תגובות ספאם רבות לפוסט הספציפי הזה. אם ברצונכם להגיב, אנא שלחו אליי את תגובתכם למייל שלי שנמצא בדף יצירת קשר.

מיהו המדען המשפיע ביותר במאה ה-20?

מיהו המדען (או מדענית) המשפיע ביותר במאה ה-20? שאלתי שאלה זו את עוקביי בטוויטר וגם בפייסבוק. קיבלתי שפע של תשובות: זיגמונד פרויד, מילטון פרידמן, רוברט אופנהיימר, אלכסנדר פלמינג, ורנר פון בראון, "ההוא שהמציא את הטרנזיסטור" (מקובל לייחס את ההמצאה לשלושת הפיזיקאים שבשנת 1956 זכו במשותף בפרס נובל לפיזיקה על תרומתם לפיתוחו: ויליאם שוקלי, וולטר בראטיין וג'ון ברדין), מי שפיתח את הגלולה נגד הריון (הערה: אין אדם יחיד שניתן לייחס לו המצאה זו, אך מקובל כי האב ה"רשמי" של הגלולה הוא גרגורי פינקוס, שעמד בראש צוות שכלל גם את פרנק קולטון, מין צ'ה צ'אנג ואחרים), נורמן בורלוג, אלברט איינשטיין, אלן טיורינג, ריצ'ארד פיינמן, וייתכן שהיו עוד תשובות שאבדו בנשיה וגוגל לא הצליח לדלות, עם המשיבים הסליחה.

אני מוכרח לומר שלא הופתעתי מהתשובות (פרט להעלאת שמו של פרויד,  ואולי מאזכור שמו של מילטון פרידמן, שאותו אני לא נוטה לסווג כמדען – וראו את מה שכתבתי עליו לאחר מותו, הלינק למעלה). אפשר לזהות כאן ארבעה תחומים עיקריים בהם בלטו ודרכם השפיעו האנשים המכובדים שצויינו למעלה (וחלק גדול מהמוזכרים משתייכים ליותר מתחום אחד): אלקטרוניקה, מלחמת העולם השניה, רפואה/מדעי החיים, ומדעי המחשב. הקוראים מוזמנים לדון בתשובות שהועלו, בחלוקה הגסה שלי לתחומים, ולהעלות שמות אחרים.

הנסיון לקבוע מיהו המדען "המשפיע ביותר" נדון כמובן לכשלון מיידי, כיוון שלא ניתן לכמת את מידת ההשפעה. האם השפעתם של איינשטיין וטיורינג על מהלך מלחמת העולם השניה רבה או פחותה מהשפעתם על התפתחות עידן המידע? מה יותר חשוב: הטרנזיסטור או האנטיביוטיקה? התשובות לשאלות כאלה יהיו יותר מטופשות מהשאלות עצמן.

הנה שאלה אחרת, טובה יותר: לא שכחנו מישהו? סביר להניח ששכחנו עוד רבים וטובים. ועוד שאלה שאולי תרצו לשאול אותי: מי יופיע ברשימה שלך, יוסי? ובכן, בעיניי, רוב השמות שהוזכרו קודם ראויים להכלל בכל רשימה של "מדענים משפיעים", אבל ברצוני להציע עוד שם אחד שלא הוזכר עד כה: רונלד א. פישר.

כן. הוא כבר הופיע ברשימת 15 הסטטיסטיקאים הגדולים שערכתי, במקום הראשון. אבל הוא היה רק סטטיסטיקאי, לא? טוב, גם גנטיקאי (הביולוג הגדול ביותר מאז דרווין – טוען ריצ'ארד דוקינס). את סיפורו, סיפור הליידי הטועמת תה סיפרתי לא מזמן ב-"סיפור נובה – ערב סיפורי מדע ומדענים". אמרתי בפני עדים, ואף כתבתי זאת בבלוג זה ממש כי הוא "אחד המדענים המשפיעים ביותר של המאה ה-20".

פישר הניח את היסודות (ובנה חלק ניכר מהקומות הראשונות) של התיאוריה של תכנון ניסויים מבוקרים. כל ניסוי מדעי הנערך כיום חייב לכלול את "השילוש הקדוש" – שלושת תנאי היסוד שהציב פישר להבטחת תקפות הניסוי ותוצאותיו: רנדומיזציה, בקרה, סמיות.

פישר המציא את הכלי העיקרי (ובמשך שנים רבות – הבלעדי) להערכת כמותית של משקל העדויות המתקבלות בניסוי: ה-p-value. פתחו כל מאמר מדעי בו מתואר ניתוח כמותי של נתונים. ה-p-value יופיעו שם, וערכי p קטנים מ-0.05 יזכו להתייחסות מיוחדת, שכן הם מעידים על תוצאות מובהקות. הערך הקריטי 0.05 מקורו גם הוא בהערכה של פישר כי מדובר בערך מתקבל על הדעת, אף כי פישר עצמו ידע היטב כי אין לכך כל הצדקה תיאורטית.

ופישר גם אחראי לפיתוח ושיפור של שיטות סטטיסטיות רבות לניתוח נתונים כמותיים, ובראשן ניתוח השונות ("אנובה"). למה לדעתכם סטטיסטי המבחן של ה-ANOVA מסומן באות F?

לו היו כותבי המאמרים המדעיים מקפידים על הפניה למקורות, פישר היה כנראה המדען המצוטט ביותר (וזהו עוד מדד מקובל לחשיבותה של עבודה מדעית): יש לצטט את עבודתו בכל מאמר מדעי המתאר ניסוי מבוקר, משתמש ב-p-value להערכת התוצאות, ובודאי אם נעשה שימוש בניתוח שונות, או במבחן המדוייק של פישר, או באחת מהשיטות הסטטיסטיות הרבות האחרות שפיתח ושיפר. מדוע עבודות אלה אינן מצוטטות? כי הן הפכו ל-"מובנות מאליהן", כאילו ניתנו למשה בסיני, ולא היא.

עבודתו של פישר השפיע על כל המחקר המדעי מימיו והלאה. המדע במאה העשרים לאחר פישר אינו כשהיה לפניו, ולכן פישר הוא ללא ספק אחד המדענים המשפיעים ביותר של המאה ה-20.

 

הליידי טועמת תה

עצמו את עינכם ודמיינו לכם אחר הצהריים אביבי בקיימברידג’, אנגליה, בשנות העשרים של המאה הקודמת. אדונים וגבירות מתכנסים על אחת המדשאות למסיבת תה.

הליידי, גיבורת הסיפור שלנו, היא מוריאל בריסטול. היא לא רק ליידי, אלא מדענית בזכות עצמה, ביולוגית החוקרת את תהליכי הפוטוסינתזה. למרבה הצער, לא ידועים לנו עוד פרטים רבים אודותיה, ואפילו תמונה שלה לא השתמרה.

הגיבור הראשי של הסיפור שלנו הוא דווקא הגבר שיתייצב מייד מול הליידי – הג'נטלמן, אם אפשר לקרוא לו כך, כיוון שהדעות חלוקות.

הוא היה איש נמוך ורזה בעל זקן תיש, לבוש ברישול, חובש משקפיים עבות זגוגית, ומקטרת נצחית בפיו (שלא משה מפיו גם כאשר עסק בשחיה). הוא היה נקמן. נוטר טינה. יהיר. כאשר שיחה שעממה אותו, הפגין זאת על ידי הוצאת שיניו התותבות מפיו וניקויין. הוא היה מהתומכים הגדולים באאוגניקה, תחום מדעי שעסק באפשרויות להשבחת המין האנושי באמצעים גנטיים, ואף כיהן כפרופסור לאאוגניקה באוניברסיטת קיימברידג'. הוא היה שוחר מדון. בהזדמנות אחת כתב מאמר שאורכו עמוד אחד בלבד. חלקו הראשון של המאמר עסק בתיאור הבעיה והמאמצים הרבים שהשקיע אחד מיריביו המדעיים להגיע לפתרון. לאחר מכן הופיע הפתרון לבעיה שאורכו שלוש שורות. המאמר הוגש לפרסום בכתב העת היוקרתי אותו ערך יריבו (אך זה סירב לפרסמו)*. עוד מסופר עליו כי באמצע הרצאה של אחד מעמיתיו בקיימברידג' קם לפתע ממקומו, נטל את הגיר מידיו של המרצה ההמום, ושרטט על הלוח דוגמה שהפריכה את טענותיו של המרצה. הוא לא הסתפק בכך, אלא גם נזף בו: "אני מקווה שמעתה והלאה יעסוק המרצה הנכבד רק בנושאים שבהם הוא מבין. איך אפשר לטעות בשאלה כה פשוטה?"**

הוא היה גנטיקאי נודע, ולפי ריצ'רד דוקינס הוא הביולוג הגדול ביותר מאז דרווין.  הוא חקר את עבודתו של גרגור מנדל ואת הנתונים שפרסם. במחקרו הגיע למסקנה כי מנדל הגדול "שיפץ" את הנתונים שלו, כך שיתאימו יותר לתיאוריה הגנטית שפיתח.

הוא היה עקשן, וכמעשן כבד סירב להפסיק לעשן גם כאשר החלו להופיע עדויות הקושרות בין עישון וסיכול לחלות בסרטן. ב-1958 אף פרסם שני מאמרים בכתב העת Nature, בהם כתב, נאמן לעקרון כי מתאם אינו מעיד על סיבתיות,  כי לא ניתן לטעון על סמך הנתונים שנאספו עד כה כי עישון אכן גורם לסרטן. הוא אף הציע תיאוריה חליפית לפיה מחלת הסרטן גורמת לרצון לצריכת ניקוטין, כלומר לעישון.

הוא הלך לעולמו ב-1962 ממחלת הסרטן.

הוא היה סיר רונלד פישר, אחד המדענים המשפיעים ביותר של המאה ה-20.

ומשהכרנו את גיבורינו, נחזור אל מסיבת התה בקיימברידג'.

אחד ממשתתפי המסיבה הגיש לליידי, ד"ר מוריאל בריסטול, ספל תה. מייד לאחר שטעמה ממנו הניחה הליידי בריסטול את הספל, כיוון שהתה שבתוכו לא הוכן כהלכה: החלב הוסף לתה לאחר שנמזגו לתוכו המים הרותחים, ותה ראוי לשמו יש להכין בתהליך הפוך: קודם יש למזוג את החלב לספל, ורק אחר כך להוסיף מים רותחים. הטעם, טענה ד"ר בריסטול, שונה לגמרי.

פישר שמע את הטענה ונדרך. כמדען, הוא לא היה מוכן לקבל טענה כה פסקנית ללא סימוכין או נתונים תומכים. והאובססיה ששוכת בליבו של כל מדען טוב, דחקה בו לבדוק מייד את נכונות הטענה. הוא הציע לליידי בריסטול לעמוד מול אתגר טעימה, והיא נענתה בשמחה. לאחר מספר דקות ששל תכנון, הניסוי, שכולל בתוכו את כל העקרונות הבסיסיים שחייבים להמצא בכל ניסוי מדעי, יצא לדרך.

פישר התייצב מול בריסטול ובידיו שני ספלי תה; באחד מהם החלב נמזג לפני המים, בשני המים נמזגו לפני החלב. שני ספלים, כי כל ספל משמש כביקורת לרעהו.  בריסטול לא ידעה איזה ספל תה הוכן באיזה אופן. היא טעמה את התה בכל אחד מהספלים, ואמרה כיצד לדעתה הוכן התה בכל ספל. מבלי לומר מילה, מבלי להזיז שריר בפניו, רשם פישר את התשובה בפנקס קטן. תוצאות הניסוי יישארו סמויות עד סופו. הוא פנה לאחור וחזר עם זוג ספלים חדש. כך שמונה פעמים. הסדר בו הוגשו הספלים לליידי (מים לפני חלב בספל שביד ימין או בספל שביד שמאל) נקבע באופן מקרי, כך שלא תהיה אפשרות לניחוש על סמך תבנית כלשהי.

ולאחר שתם הניסוי, יש כמובן נתונים שצריך לנתח באופן סטטיסטי, לחשב p-value  ולהודיע מהן התוצאות, ומי אם לא רונלד פישר הוא האיש המתאים לעשות זאת?

האם היו הדברים מעולם או שזו רק אגדה? פישר פרסם מאמר שהפך ברבות השנים למאמר קלאסי בענף הסטטיסטי של תכנון ניסויים: The mathematics of the lady tasting tea (קישור לקובץpdf). במאמר מתאר פישר את סיפור המעשה, ומציג מספר ניסויים אפשריים שבעזרתם ניתן לבחון את טענת הליידי ואת הדרך לניתוח סטטיסטי של הנתונים. אולם, הוא לא מזכיר את שמה של הליידי, ואינו מציין אם מדובר בסיפור אמיתי או רק בדוגמא משעשעת.

אבל אני מכיר מישהו שטוען בספרו כי הוא מכיר מישהו שסיפר לו כי הוא היה שם, במסיבת התה בקיימברידג', וראה כל זאת במו עיניו. והליידי, ד"ר מוריאל בריסטול, הייתה ליידי אמיתית. היא לא טעתה אפילו פעם אחת.


סיפרתי סיפור זה ב-"סיפור נובה – ערב סיפורי מדע ומדענים" שנערך במסגרת אירוע ספקנים בפאב בספטמבר 2012.

*  היריב הוא הסטטיסטיקאי קרל פירסון, המייסד והעורך הראשון של כתב העת ביומטריקה.

** המרצה הנזוף הוא הסטטיסטיקאי ג'רזי ניימן, שיחד עם בנו של קרל פירסון, אגון, פיתח את התיאוריה של בדיקת השערות סטטיסטיות

הרצאה במסגרת ספקנים בפאב

הנושא של מפגש "ספקנים בפאב" הקרוב התל אביב הוא "סיפור-נובה: ערב סיפורי מדע ומדענים".  מה המקום שממלא המדע בחיינו? איך הוא משפיע על מי שאנחנו? מספרי סיפורים, חלקם מדענים, חלקם לא ראו מבחנה מקרוב מאז חטיבת הביניים, יישתפו בהתלבטויות, מפגשים, כישלונות והצלחות במדע. ערב סיפורים מיוחד על מדע ומדענים, לכל מי שאוהב מדע – ולכל מי שאוהב סיפור טוב.

אני אהיה בין המרצים ואספר על הגברת טועמת התה. אם אתם רוצים לדעת איך זה קשור למדע ומדענים (וגם לסטטיסטיקה), תצטרכו להגיע!

המפגש ייערך ביום שני, ה-3.9.2012, ברדיו EGPB שד"ל 7 (במרתף), תל-אביב.
התכנסות ב-19:30, תחילת האירוע 20:00 בדיוק!

פרטים נוספים באתר ארגון הספקנים בישראל.

להתראות