ניהול סיכונים במערכות יחסים (כולל סקס)
הקדמה קצרה: ב-13/11/2012 הופיע בבלוג "יחסי מין – הגיגים של (א)נשים על מגדר" פוסט מעורר הדים שכתבה קרן תחת הכותרת "על חלוקת סיכונים בסקס ובכלל". הקדשתי לפוסט ולרעיונות שהועלו בו מחשבה רבה, וארבעה ימים לאחר מכן כתבתי תגובה מסודרת ושלחתי אותה לעורכי הבלוג בבקשה לפרסמו כפוסט אורח. הם מצידם השקיעו גם כן מחשבה רבה בבקשתי, והיום הודיעו לי כי אינם מעוניינים לפרסם את תגובתי כפוסט אורח מכיוון שפוסט כזה "לא יחדש הרבה", כפי שניסח זאת חגי, אחד העורכים. מכיוון שכך, אני מפרסם את תגובתי כאן, בבלוג הבית שלי, למרות שבלוג זה עוסק במוצהר בנושאים אחרים. עם זאת, יש גם קשר לסטטיסטיקה, כפי שתראו אם תמשיכו לקרוא.
הפוסט שכתבה קרן עסק בהשוואה בין הסיכונים שבהם עומדים גברים ונשים כתוצאה מקיום יחסי מין הטרוסקסואליים. הטענה המרכזית הייתה כי נשים עומדות בפני סיכונים גבוהים יותר מאשר גברים במצבים אלה, ולכן הגיעה למסקנה כי יש לנסות לחפש דרכים להעביר חלק מהסיכון הקיים מהצד הנשי לצד הגברי, במטרה לייצר מצב שבו סך הסיכון הקיים מתחלק באופן שווה (או לפחות שווה יותר) בין הצדדים. האם זה אפשרי? לדעתי לא, ולכן נכתב פוסט זה: להסביר מדוע זה לא אפשרי, ולהציע דרך אחרת, אפשרית.
ברצוני להציע נקודת מבט אחרת לנושא זה. אני בעוונותיי סטטיסטיקאי, ולכן נוטה לראות כל דבר מזווית ראיה סטטיסטית. בפרט, למונח "סיכון" יש בעיניי משמעות אחרת ממשמעותו בעיני קרן, והניתוח שאציע מבוסס על הגדרה מדויקת יותר של מונח זה.
ליחסי מין (או, עדיף, למערכת יחסים שכוללת בתוכה מין) יש הרבה תוצאות אפשריות. חלק מהתוצאות האפשריות רעות מאוד, חלקן סתם רעות, ולעומת זאת יש גם תוצאות אפשריות טובות ואפילו מצוינות ("והם חיים באושר ובעושר עד עצם היום הזה"). הבעיה העיקרית, שהיא אינהרנטית לכל אספקט של חיינו, היא בעיית חוסר הודאות. אנחנו לא יכולים לדעת מראש מה יהיה. מה שאנחנו כן יכולים לעשות זה לנסות לערוך רשימה של כל התוצאות האפשריות, והעריך את ההסתברות (הסיכוי) של כל תוצאה אפשרית להתרחש. ההערכה יכולה להיות כמותית (מספר בין 0% ל100%) או איכותית (סבירות נמוכה/גבוהה וכולי).
כמו כן, גם את מידת החוּמרה של כל תוצאה אפשרית ניתן להעריך. כשדנים בפיננסים זה קל – החומרה נקבעת לפי כמות הכסף שמרוויחים או מפסידים. בתוצאות של מערכת יחסים בין שני בני אדם לא ניתן לכמת את התוצאות האפשריות באופן כזה, עם זאת, אני מניח כי ניתן לדרג את התוצאות האפשריות על פי חומרתן. אני מניח, למשל, שכן אפשר לקבוע כי אונס גרוע יותר מסתם סקס משעמם שלא יוביל לדייט נוסף, וסקס טוב שלא יוביל לדייט נוסף עדיף על סקס משעמם שלא יוביל לדייט נוסף, וכדומה.
כאשר יש לנו רשימת תוצאות אפשריות עם הערכות להסתברות של כל אחת מהן להתרחש (אי-ודאות) ואפשרות להשוות בין כל שתי תוצאות על פי חומרתן (או טיבן), ניתן לומר כי סיכון הוא מצב של אי ודאות בו חלק מהתוצאות האפשריות הינן רעות, וסיכון ניתן למדידה על ידי כימות הנזק שייגרם אם תקרה תוצאה מסויימת וכימות הסיכוי כי תוצאה זו אכן תתרחש. למעשה אני מכליל כאן את ההגדרה הקלאסית של הובארד לסיכון, שהתמקדה בסיכונים כלכליים. אם מדובר בפיננסים, אז אפשר למדוד את הסיכון על ידי הכפלת ההסתברות בנזק הכספי הצפוי. כשעוברים ליחסים בין בני אדם זה בלתי אפשרי, כמובן, אבל אני חושב שלא תחלקו עלי אם אקבע כי, בהתאם להגדרה שנתתי, המאורע "אונס בסבירות גבוהה" טומן בתוכו יותר סיכון מאשר המאורע "סקס גרוע בסבירות נמוכה".
עוד הבדל בין סיכונים פיננסיים וסיכונים במערכות יחסים: בתחום הפיננסי ניתן לקנות ולמכור סיכונים – כל המשבר הכלכלי העולמי הנוכחי החל מסחר לא מבוקר בסיכונים פיננסיים. במערכות יחסים הסיכונים הם סובייקטיביים (הנושא נדון בהרחבה בתגובות לפוסט של קרן), ולכן העברת סיכונים אינה אפשרית למעשה ("תשמעי, יש לי דייט, הוא ממש נחמד וחתיך, אבל בפעם הקודמת הסקס איתו היה ממש גרוע, אז אחרי היציאה את יכולה לעלות אליו במקומי ולקבל את הסקס הגרוע?" – לא נראה לי). ההצעה של קרן להעביר סיכון מצד לצד נחמדה, אבל לדעתי לא ישימה.
וכאן, אפשר גם לראות את הבעיה בתרגיל המחשבתי (המבריק) שהציעה קרן כנקודת פתיחה לדיון שלה: התרגיל לא עסק באמת בסיכונים, אלא בתרחיש הגרוע ביותר (worst case scenario), בו הציבה הרשעה ודאית באונס ללא אפשרות משפטית להתגונן לגבר, מול אונס לאשה. מה שקרן יצרה למעשה בתרגיל המחשבתי שלה הוא מאזן אימה. היא הגדילה סיכון לגבר, בלי הפחתה משמעותית בסיכון לאשה, מתוך תקווה שאנס פוטנציאלי יירתע אם הסיכוי שיורשע באונס יגדל בצורה משמעותית.
אני שונא מאזני אימה, משתי סיבות. קודם כל, הם כוללים בתוכם אימה. שנית, האיזון בדרך כלל לא יציב. אני מעדיף מצבים נטולי אימה עד כמה שאפשר. את האימה לא ניתן לבטל לגמרי. אמנם איני קרימינולוג, אבל אני לא חושב שקיימת מערכת ענישה כלשהי שתיצור דמוטיבציה מוחלטת לביצוע פשעים. זה לא אומר שאני מציע לוותר על מערכת החוק והענישה, אבל בהחלט יש צורך במודעות למגבלות שלהם. עד כמה החמרה בענישה והורדת רף ההוכחה תביא להקטנת ההסתברות למקרי אונס (או רצח, או נסיעה במהירות גבוהה מהמותרת, או שימוש בסמים לא חוקיים)? פתרון הרבה יותר טוב הוא פשוט להפחית את הסיכונים.
דרך אחת להקטנת סיכון היא הפחתה של הנזק הצפוי במקרה של התרחשות המאורע הרע. כשעוסקים בפיננסים זה אפשרי – אפשר לקנות ביטוח. שוב, במערכות יחסים הפתרון הזה לא ישים. אולי אפשר לקנות ביטוח שבמקרה של אונס ישלם לקורבן סכום של X שקלים, אבל אני באופן אישי לא הייתי רואה בכך הפחתה משמעותית של הסיכון. אני סבור שרוב הקוראים מסכימים עימי.
כיוון שלסיכון יש שני מרכיבים: חומרת התוצאה של מאורע וההסתברות להתרחשותו, וכשמדובר בסיכונים במערכת יחסים לא ניתן לשנות באופן משמעותי את חומרת התוצאה, הדרך היחידה להפחתת הסיכונים היא על ידי הקטנת ההסתברויות של המאורעות הרעים. אונס הוא רע, ויישאר רע בכל מצב, אבל אם נוכל להקטין את הסיכוי להתרחשותו, הסיכון יפחת.
עד כאן התיאוריה. באופן מעשי, זה הרבה יותר מסובך. ברור לחלוטין שכל אחת ואחד צריכים לנקוט בצעדים שיפחיתו את ההסתברויות להתרחשות מאורעות עם תוצאות חמורות במידת האפשר. זה אומר לנהוג בזהירות, זה אומר לרוץ לממ"ד כשיש אזעקה, וזה אומר להיות זהירים במערכות יחסים, בייחוד במערכות יחסים שכוללות גם מין או פוטנציאל למין. עד לאן אפשר לקחת את זה? יש מי שיאמר כי הפתרון הוא לא לצאת מהבית (פתרון אדיוטי) , ואם את כבר יוצאת אז תלבשי בורקה ורעלה (עיצה מטופשת, כמובן, זה ממש לא מגן מפני אונס). מה בכל זאת? אני מציע שכל אחד ואחת יחשבו מה הפתרונות שמתאימים להם ויישמו אותם.
החברה צריכה גם היא לתת פתרונות לטובת הכלל. מערכות חוקים וענישה הם כאמור פתרון קיים אך בעל יעילות מוגבלת. פתרון הרבה יותר יעיל, אך דורש אומץ ואורך נשימה, טמון בחינוך. חינוך לשוויון וכבוד הדדי, חינוך להכרה כי כל אחד ואחת הם בעלי הזכויות על גופם, חינוך כי מערכות יחסים ויחסי מין הם יותר מאשר סקס. זה אינו פתרון קסם, אבל לעומת זאת זהו פתרון אמיתי.
נשלח: 3 בדצמבר, 2012. נושאים: בנימה אישית, ניהול סיכונים, על סדר היום.
תגובות: 11
| טראקבק
"הצבעה אסטרטגית" – כן או לא?
כמקובל בכל מערכת בחירות, גם עתה שב ועולה נושא "ההצבעה האסטרטגית". הרעיון הוא כזה: אני יכול להצביע למפלגה קטנה שדעותיי קרובות לעמדותיה, או למפלגה גדולה שדעותיי קרובות גם לעמדותיה, אבל פחות. למי להצביע?
תשובה אפשרית אחת היא להצביע למפלגה שאני הכי קרוב לעמדותיה, במקרה זה – המפלגה הקטנה.
גישה אחרת מציעה לבחור לפי שיקולים אסטרטגיים: המפלגה הגדולה ודאי תעבור את אחוז החסימה ותיוצג בכנסת, בעוד שזה לא ודאי לגבי המפלגה הקטנה. ואם המפלגה הקטנה לא תעבור את אחוז החסימה – הקול שלי יבוזבז. גם אם תעבור המפלגה הקטנה את אחוז החסימה, השפעתה תהיה קטנה יחסית להשפעת המפלגה הגדולה, וגרוע מכך – היא תגרע מכוחה של המפלגה הגדולה ובכך תגביל את השפעתה. המסקנה המתבקשת – עלי להתפשר ולהצביע למפלגה הגדולה.
עוד מילה על בזבוז הקולות: אם המפלגה לה הצבעתי לא עברה את אחוז החסימה – מדובר בהרבה קולות שמתבזבזים. שלשום פרסמה מיה בנגל סטטוס בטוויטר בו כתבה כי שלושה מנדטים בבחירות 2009 נזרקו לפח. הטענה מתבססת על חיבור הקולות שקיבלו 9 מפלגות שאינן מפלגות ימין שלא עברו את אחוז החסימה בבחירות אלה. מדובר בקצת יותר מ-88 אלף קולות, ומכיוון שבכנסת ה-18 המודד למנדט (מספר הקולות המזכים במנדט) היה 27246 קולות, הרי שאותם 88 אלף קולות הם קצת יותר משלושה מנדטים. עיון בתוצאות הבחירות לכנסת ה-18 מעלה כי בסך הכל ניתנו כ-104 אלף קולות למפלגות שלא עברו את אחוז החסימה. שאר 16 אלפי הקולות ניתנו למפלגות "ימין", אך 16 אלף קולות אינם מזכים במנדט. כיוון שגוש המרכז שמאל בתחילת כהונת הכנסת ה-18 מנה 55 מנדטים, לו לא היו מתבזבזים אותם 104 אלפי קולות, גוש המרכז שמאל היה מונה 58 מנדטים. עדיין לא מספיק כדי לשנות את התוצאה הסופית של הבחירות – הקמת ממשלת ימין בראשות נתניהו, אך מאזן הכוחות בכנסת היה שקול יותר, וזה מצב טוב יותר לאופוזיציה (במסגרת הגילוי הנאות אספר כי אני מצביע בקביעות לאחת ממפלגות האופוזיציה).
האמנם?
התשובה המיידית היא כמובן "לא". ההסבר פשוט: אם יצורפו אותם 88 אלף קולות למפלגות שעברו את אחוז החסימה, מספר הקולות הדרוש למנדט יגדל מ27246 ל-28100 בערך, וזה אוצר כי בחלוקה הראשונית של המנדטים וגם בהמשך החלוקה (בחישובי העודפים לפי חוק בדר-עופר) יקבלו חלק מהמפלגות פחות מנדטים. אלו מפלגות? זה כבר תלוי בפרטים.
קל לבדוק מה היה קורה אילו. נתוני ההצבעה קיימים, וכל מה שצריך זה "לקחת" את הקולות מהמפלגות שלא עברו את אחוז החסימה, להעביר אותן למפלגות שעברו אותו, ולחשב מחדש את חלוקת המנדטים לפי חוק בדר-עופר (זה דווקא מסובך, אבל אפשרי). אז עשיתי זאת.
החישובים שערכתי מתבססים על ההנחות הבאות:
1) רק המצביעים של ארבע המפלגות הגדולות ביותר שלא עברו את אחוז החסימה (התנועה הירוקה מימד, גיל – גמלאי ישראל לכנסת, עלה ירוק, מפלגת הירוקים) יצביעו "הצבעה אסטרטגית" בחישובים ההיפותטיים שלי. מפלגות אלה קיבלו 71 אלף קולות יחד. שהיו ככל הנראה מספיקים ל-3 מנדטים בכנסת (בזכות עודף הקולות הגדול שהיה נשאר לאחר חלוקת המנדטים הראשונית).
2) המצביעים של שאר המפלגות הקטנות (שכל אחת מהן קיבלה פחות מ-7000 קולות, ובדרך כלל הרבה פחות מכך) היו מצביעים עבורן בכל מקרה, וגם לו היו משנים את הצבעתם, זה לא היה משפיע על תוצאות הבחירות.
3) המצביעים של ארבע ה-"קטנות הגדולות" יתפלגו בין המפלגות הגדולות להם הם מצביעים בניתוח ההיפותטי שלי בהתאם ליחס מספר הקולות בין המפלגות הגדולות, ובפרט:
א. קולות התנועה הירוקה מימד יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.
ב. קולות גיל – גמלאי ישראל לכנסת יתחלקו בין קדימה, הליכוד, ישראל ביתנו, ומפלגת העבודה ביחס: 34% : 33% : 18% : 15%.
ג. קולות עלה ירוק לכנסת יתחלקו בין קדימה, ישראל ביתנו, ומפלגת העבודה ביחס: 51% : 27% : 23% .
ד. קולות מפלגת הירוקים יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.
לפי הנחות אלה, מבין 71 אלפי המצביעים ל-"קטנות הגדולות", כ-40 אלף מעבירים את קולם לקדימה, 6 אלפים לליכוד, 7 אלפים לישראל ביתנו ו- 18 אלף למפלגת העבודה.
בדקתי מספר תרחישים:
1) הצבעה אסטרטגית של כל מצביעי ארבע "הקטנות הגדולות", כלומר אותם 71 אלף קולות מתחלקים בין קדימה, הליכוד, ישראל ביתנו והעבודה כמפורט למעלה.
2) הצבעה אסטרטגית ימין-מרכז: קדימה, הליכוד וישראל ביתנו מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", 18 אלף קולות פוטנציאליים של מפלגת העבודה הולכים לאיבוד.
3) הצבעה אסטרטגית שמאל-מרכז: קדימה, והעבודה מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", אך הקולות הפוטנציאליים של הליכוד וישראל ביתנו הולכים לאיבוד.
4) הצבעה אסטרטגית ימין-שמאל: הליכוד, ישראל ביתנו, והעבודה מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", אך הקולות הפוטנציאליים של קדימה הולכים לאיבוד.
5) הליכוד זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.
6) העבודה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.
7) קדימה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.
התוצאות הלא מפתיעות: גוש ה-"שמאל-מרכז" (קדימה, העבודה, מרץ, חדש, רעם-תעל ובלד) שמנה בתחילת הכהונה של הכנסת ה-18 55 מנדטים אינו משתנה באופן משמעותי. ברוב התרחישים הוא גדל ל-56 מנדטים. הנה עיקרי התוצאות (השינויים הפרסונליים על פי רשימות המועמדים באתר הכנסת, הפירוט המלא בקובץ האקסל המצורף, וכן מצוךף לינק לתכנית ה-SAS שכתבתי לצורך חישובי המנדטים):
1) הצבעה אסטרטגית של כל מצביעי ארבע "הקטנות הגדולות": קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.
2) הצבעה אסטרטגית ימין-מרכז קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.
3) הצבעה אסטרטגית שמאל-מרכז: קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.
4) הצבעה אסטרטגית ימין-שמאל: העבודה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף נכנסת לכנסת במקום אלכס מילר.
5) הליכוד זוכה בכל הקופה: הליכוד עולה בשני מנדטים על חשבון קדימה ושס; גוש השמאל-מרכז מונה 54 מנדטים. אללי אדמסו ויצחק דנינו נכנסים לכנסת במקום אורית זוארץ ואברהם מיכאלי.
6) העבודה זוכה בכל הקופה: העבודה עולה בשני מנדטים על חשבון קדימה וישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף וראלב מגאדלה נכנסים לכנסת במקום אורית זוארץ ואלכס מילר.
7) קדימה זוכה בכל הקופה: קדימה עולה בשני מנדטים על חשבון ישראל ביתנו ושס; גוש השמאל-מרכז מונה 57 מנדטים. יוליה שמאלוב- ברקוביץ ונינו אבסדזה נכנסים לכנסת במקום אלכס מילר ואברהם מיכאלי.
המסקנה שלי מהתרגיל התיאורטי שערכתי: ההשפעה של "הצבעה אסטרטגית" מוגבלת ביותר, ויש לה פוטנציאל מוגבל מאוד לשנות את התוצאות המהותיות של הבחירות, רק כאשר המאבק בין הגושים צמוד ביותר. לו לא היו הולכים אותם קולות שניתנו למפלגות שלא עברו את אחוז החסימה, המרוויחה הגדולה ביותר הייתה ככל הנראה יוליה שמאלוב-ברקוביץ.
את המסקנות לבחירות הקרובות מוזמן כל אחד להסיק בעצמו. אני, באופן אישי, אמשיך להצביע על פי צו מצפוני, ואתן את קולי לאותה מפלגה קטנה שקיבלה אותו מאז 1984 בכל גילגוליה.
נשלח: 17 בנובמבר, 2012. נושאים: הממ... מעניין..., חשבון פשוט, על סדר היום, קבלת החלטות.
תגובות: 25
| טראקבק
השכר הממוצע כ-9000 ₪, כמה מרוויחים הרוב?
הנה צילום מסך של ידיעה מרגיזה שפורסמה אתמול בגלובס:
![]() |
הידיעה מרגיזה ממספר סיבות.
קודם כל, הניתוח הכלכלי בידיעה הוא בסך הכל נכון, ומראה כי יש ירידה לאורך זמן ביחס בין השכר החציוני לשכר הממוצע במשק, מה שמעיד (מייד אסביר מדוע) על הגידול באי השוויון ובפערים החברתיים. ואותי זה מרגיז.
שנית, מצויין כי הלשכה המרכזית לסטטיסטיקה אינה מפרסמת את השכר החציוני במשק מדי חודש, ולצערי גם זה נכון. בכתבה צויין כי "מהלמ"ס נמסר כי אין הם מחשבים נתון זה", וסביר להניח כי זה נכון. זה גם מרגיז, כי ראוי שנתון השכר החציוני ייאמד ויפורסם מדי חודש, ובלשכה המרכזית לסטטיסטיקה יש הרבה סטטיסטיקאים מוכשרים שיודעים כיצד לבצע את המשימה הזו. למיטב ידיעתי, ההחלטה לא לפרסם את השכר החציוני מדי חודש נובעת ממדיניות, וזה כבר מאוד מרגיז. השכר החציוני מפורסם רק פעם בשנה, ומוחבא היטב בתוך השנתון הסטטיסטי.
שלישית, הגרפים בכתבה מטעים ומראים את הירידה ביחס חציון/ממוצע כיותר חדה מכפי שהיא באמת, וגם ההשוואה של היחס הזה בין ישראל למדינות אחרות מוטה. זה נעשה על ידי הטריק הידוע של קיצוץ ציר ה-Y, וכבר כתבתי על כך בעבר (למשל ברשימה על מחקר האוצר על השפעת שכר המינימום על התעסוקה במשק).
אבל הפרט המרגיז ביותר הוא הפרשנות שניתנת בכתבה לשכר החציוני. בכתבה נאמר כי "החציון הוא מדד למיקום המרכז של קבוצת נתונים מספריים או מדגם, אך הוא טוב בהרבה לעומת הממוצע, שהרבה יותר רגיש לערכי קצה" וזה נכון. אבל נאמר גם כי "השכר של רוב השכירים הישראלים במשק (המכונה בספרות כ'שכר החציוני') עומד על כ-6,655 שקל", וזה ממש לא נכון. ומאוד מרגיז.
מדוע היחס בין השכר החציוני לשכר הממוצע מהווה מדד לאי שוויון? בואו ניזכר מה זה חציון. כאשר יש סדרת מספרים, כמו נתוני שכר של כ-2.5 מיליון שכירים בישראל, אפשר לסדר את הנתונים האלה בסדר עולה, מהקטן לגדול. המספר שנמצא באמצע הסדרה, בסביבת המקום המיליון ורבע, מחלק את נתוני השכר לשתי קבוצות שוות. בקבוצה אחת כל הנתונים גדולים ממנו או שווים לו, ובשניה כל הנתונים קטנים ממנו או שווים לו. המספר שבאמצע הוא החציון. אמנם זהו הסבר לא מדוייק, אבל לדעתי מבהיר את הנקודה העיקרית. המעוניינים יכולים לקרוא הסבר מפורט יותר בויקיפדיה.
האם רוב הנתונים בסדרה שווים לחציון? בדרך כלל לא. בואו ניקח דוגמא פשוטה, סדרה של 3 מספרים בלבד: 1,2,3. החציון הוא 2, אבל רוב הנתונים אינם שווים ל-2.
שימו לב כי גם הממוצע של שלושה מספרים אלה הוא 2, וזאת בגלל הסדרה סימטרית סביב 2. זה תמיד נכון: אם סדרת נתונים היא סימטרית, אז הממוצע של הסדרה שווה לחציון. גם ההיפך נכון: אם הממוצע שווה לחציון, אז הסדרה סימטרית סביבם (את זה קצת יותר קשה להוכיח). לכן, ההפרש או היחס בין החציון והממוצע מהווים מדד למידת הסימטריה של הנתונים. למשל, אם נשנה את הנתונים ונחליף את 3 בערך גדול יותר, נניח 6? החציון יישאר 2 אבל הממוצע יגדל מ-2 ל-3. באופן כללי, כאשר הממוצע גדול מהחציון, אז הסדרה אסימטרית עם יותר ערכים גבוהים, וכאשר הממוצע קטן מהחציון, אז הסדרה אסימטרית עם יותר ערכים נמוכים.
כשמדובר בנתוני שכר, יש עוד פרט שצריך לקחת בחשבון. שכר יכול להיות מאוד גבוה, אבל אינו יכול להיות נמוך יותר מדי. באופן חוקי השכר חייב להיות גבוה משכר המינימום, ובכל מקרה אינו יכול להיות נמוך מ-0. לכן, כשמדובר בנתוני שכר, האסימטריה יכולה להתבטא רק בקיומם של בעלי שכר גבוה במיוחד, והמשמעות הכלכלית של כך היא אי שוויון בחלוקת ההכנסות. (דנתי בנושא זה בעבר ברשימה על המנהל והפועלים).
ועכשיו ננסה לענות לשאלה מהו השכר של רוב השכירים בישראל. המונח הסטטיסטי למדד כזה הוא השכיח (mode) – הערך הנפוץ ביותר בסדרת הנתונים. למשל, בסדרה 1,2,2,2,3 השכיח הוא 2, כיוון ש-2 מופיע בסדרה 3 פעמים, יותר מכל נתון אחר בסדרה. האם בסדרה של כ-2.5 מיליון נתוני משכורת של שכירים בישראל המספר 6655 הוא הנפוץ ביותר? איך אפשר לברר זאת?
כאמור, הלמ"ס מספקת כל חודש רק נתונים חלקיים, אך אחת לשנה מתפרסם בשנתון הסטטיסטי לוח התפלגות שכר לפי עשירונים (קישור לקובץ pdf באתר הלמ"ס). השנה האחרונה עבורה התפרסמו נתונים אלה היא 2010. לכן נמשיך את הדיון תוך כדי שימוש בנתונים אלה. הנה הנתונים הרלוונטיים לדיון שלנו:
|
גבול עליון (₪) |
סך הכל שכירים (אלפים) |
עשירון |
|
2069 |
252.2 |
1 |
|
3501 |
252.3 |
2 |
|
4316 |
252.1 |
3 |
|
5049 |
252.2 |
4 |
|
5984 |
252.2 |
5 |
|
7051 |
252.2 |
6 |
|
8587 |
252.4 |
7 |
|
11229 |
252.0 |
8 |
|
16290 |
252.2 |
9 |
|
– |
252.2 |
10 |
אנו רואים כי בכל עשירון יש כרבע מליון שכירים. הגבול העליון הוא השכר הגבוה ביותר בעשירון. כך למשל, בעשירון הראשון הגבול העליון הוא 2069 ₪. פירוש הדבר הוא כי 252.2 אלפי השכירים שבעשירון זה השתכרו לא יותר מ-2069 ₪ לחודש בשנת 2010.
הגבול העליון של העשירון ה-5 הוא השכר החציוני החודשי, 5984 ₪ בשנת 2010. 50% מהשכירים השתכרו 5984 ₪ לחודש או פחות מכך בשנת 2010 (אלה הנמצאים בעשירונים 1 עד 5) ו- 50% מהשכירים השתכרו יותר מ-5984 ₪ לחודש בשנת 2010 (אלה הנמצאים בעשירונים 6 עד 10). סביר מאוד כי מספר השכירים שהרוויחו בדיוק 5984 ₪ לחודש הוא נמוך למדי, וסביר שזה לא השכיח.
האמת היא שלשכיח עצמו אין כאן הרבה משמעות. מה כבר ההבדל בין 5986 ₪ ל-5986 או אפילו 6000? מעניין יותר לדעת מהי הקטגוריה השכיחה, אם נחלק את טווח השכר בקטגוריות ברוחב 1000 ₪, למשל. לשם כך עלינו למלא את הטבלה הבאה:
|
סך הכל שכירים (אלפים) |
קטגוריית שכר |
|
??? |
0-999.99 |
|
??? |
1000-1999.99 |
|
??? |
2000-2999.99 |
|
??? |
3000-3999.99 |
|
??? |
… |
|
??? |
… |
|
??? |
… |
איך נעשה זאת?
לשם כך נצטרך להניח הנחה גסה, לפיה הפיזור של השכר בכל עשירון הוא אחיד. כך למשל, בעשירון הראשון, שתחומו 0 עד 2069, נניח כי מספר השכירים ששכרם בין 0 ל-1000 ₪ (תסלחו לי על האגורה) שווה למספר השכירים ששכרם בין 1000 ל-2000 ₪, ואילו מספר השכירים ששכרם בין 2000 ל-2069 ₪ שווה ל-6.9% ממספר השכירים בקטגוריית השכר 1000-2000 ₪. וכעת, תוך כדי שימוש בתרגילי ערך משולש נוכל להסיק כי מספר השכירים בקטגוריות 0-1000 ₪ ו-1000-2000 ₪ הוא 121.9 אלף, וכי 8.4 אלפי שכירים היו בעלי שכר חודשי בין 2000 ל-2069 ₪. בעזרת חישובים דומים (קישור לקובץ אקסל עם החישובים) נוכל לאמוד את מספר השכירים ששכרם החודשי היה בין 2069 ל-3000 ₪ ב-164.0 אלפים, ולכן מספר השכירים בקטגוריית השכר 2000-3000 ₪ נאמד בסך הכל ב-172.4 אלפים. כך נוכל להמשיך את החישוב, ובסופו של דבר נקבל את התפלגות השכר הבאה:
![]() |
ומכאן נוכל לראות כי קטגוריית השכר השכיחה היא זו שבין 4000 ל-5000 ₪; זה היה שכרם החודשי של 333.3 אלפי שכירים, המהווים 13.2% מסך כל השכירים במשק. שכר הקרוב לשכר החציוני, נניח בטווח 5500 עד 6500 ₪ קיבלו בערך 254.6 אלף שכירים, כ-10.1% מהשכירים במשק. השכר הממוצע במשק ב-2010 היה 8100 ₪. שכר קרוב לשכר הממוצע, בין 7500 ל-8500 ₪, קיבלו כ-202.2 אלף שכירים, שהם כ-8% מהשכירים במשק.
ואם ננסה להקיש מנתוני 2010 לנתוני 2012, ובהנחה שההתפלגות נשארה דומה ביסודה, נוכל לשער כי קטגוריית השכר השכיחה במשק ב-2012 נמצאת גם היא ככל הנראה כ-1000 ₪ מתחת לחציון, ורוב השכירים במשק משתכרים בתחום 4500-5500 ₪. עצוב.
נשלח: 9 בנובמבר, 2012. נושאים: חשבון פשוט, כלכלה וחברה, מה אומרת הסטטיסטיקה, על סדר היום.
תגובות: 31
| טראקבק
Trust me, I'm a Statistician
מזה כ-8 חודשים אני מנהל בפייסבוק דף העוסק בצד הקליל של הסטטיסטיקה: קריקטורות, תמונות משעשעות, גרפים מפתיעים, קישורים מעניינים, ציטוטים מעוררי מחשבה, בקיצור – כל מה שעשוי לשעשע את מי שמתעניין בסטטיסטיקה (לפחות לדעתי). עד כה העמוד צבר קרוב ל-350 לייקים (לא יודע מה זה אומר או נותן חוץ מהרגשה טובה). **עדכון: ב1.12.2017 הדף הגיע ל-2000 לייקים.
אתם מוזמנים לעקוב אחרי הדף בפייסבוק: http://www.facebook.com/TrustMeImAStatistician
נשלח: 8 בנובמבר, 2012. נושאים: כללי.
תגובות: אין
| טראקבק
מתאם כן מעיד על סיבתיות
לא, לא, אל תדאגו, אני בסדר.
כן, זה אני, יוסי לוי, בעל השכלה רחבה בסטטיסטיקה, שאפילו נחשב לסטטיסטיקאי מכובד בחוגים מסויימים. אני יוסי לוי, שהפוסט הראשון שכתבתי בבלוג הזה עסק בנושא המתאם והסיבתיות, ופוסט זה כלל שפע של דוגמאות מגוחכות לתופעות שיש בינן מתאם, אך לא קשר סיבתי. רק לפני ארבעה שבועות כתבתי פוסט ארוך על הקשר האפשרי בין צמחונות ואנורקסיה, וכתבתי שם בפירוש כי מתאם לא בהכרח מעיד על סיבתיות. אז כתבתי. זה לא היה מדוייק, ובעולם שלי "לא מדוייק" זה לא נכון. טעיתי בהיסח הדעת, ואני מודה בטעותי. מה הייתי צריך לכתוב?
בכל קורס מבוא לסטטיסטיקה משננים את המנטרה: מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות. מתאם לא מעיד על סיבתיות.
אבל המנטרה לא נכונה. תחשבו רגע בהגיון: מה יכול להעיד על סיבתיות אם לא מתאם? נניח שאתם צופים בשתי תופעות שאין שום קשר בינן. למשל, מספר הנעליים של אדם בוגר (בניגוד לתלמידים בבית הספר) ורמת הידע שלו במתמטיקה. אני מאמין שלא תמצאו מתאם בין שתי התופעות, או יותר נכון, המתאם במדגם שתקחו יהיה קרוב מאוד לאפס. מי שלא מוכן לאמץ את הדוגמא הזו, מוזמן לקחת דוגמת הארד-קור: קחו קובית משחק הוגנת (כלומר, לכל אחד מששת המספרים סיכוי שווה להופיע כלפי מעלה בהטלת הקוביה). הטילו אותה פעמיים ורשמו את תוצאת ההטלה הראשונה וההטלה השניה. חזרו על התרגיל שוב מספר רב של פעמים, וחשבו את המתאם בין שתי התצפיות. המתאם יהיה בערך אפס. אין מתאם. אז אם " מתאם לא מעיד על סיבתיות", מה אומר לנו חוסר המתאם? שיש סיבתיות? שתוצאת ההטלה הראשונה של הקוביה גורמת את תוצאת ההטלה השניה? שמספר הנעליים גורם את הידע במתמטיקה? או להיפך? לא. ממש לא.
אם אתם מדענים, או חוקרים, או סתם אנשים סקרנים, חוסר קשר בין שתי תופעות ממש לא מעניין אתכם. אתם לא תגידו לעצמכם: "המממ, בחלק מצלחות הפטרי יש עובש, ובחלק אין, וכל החיידקים מתו בכל הצלחות, ולכן אין קשר בין העובש ומות החיידקים. נראה לי שעלינו על משהו גדול". בדיוק להיפך.
אנשים כמוכם אמורים לזהות שתי תופעות שנראה שיש קשר/מתאם בינן, ואז להכנס לעובי הקורה ולנסות לבדוק מה מקור הקשר והאם יש סיבתיות כלשהי. לפעמים תגלו שלמרות המתאם אין שום סיבתיות. לפעמים תגלו מבנה קשר כלשהו: A גורם את B, או אולי B גורם את A, או אולי C גורם גם את A וגם את B, ויש גם מבני קשר מסובכים יותר.
הסיבה לכך פשוטה: אם יש קשר סיבתי בין שתי תופעות, חייב להיות בינן גם מתאם. נכוו, ייתכן כי יש מתאם בין שתי תופעות גם אם אין בינן קשר סיבתי, אבל לא ייתכן כי לא קיים מתאם ויש קשר סיבתי.
ולכן, מתאם מעיד על סיבתיות. זוהי עדות נסיבתית, אבל בכל זאת עדות. היא לא מספיקה להרשעה להוכחה, אבל בלעדיה כל הקייס מתמוטט.
אמרו מעתה: מתאם מעיד על סיבתיות אפשרית, אך אינו מספיק להוכחת הסיבתיות.
נשלח: 21 באוקטובר, 2012. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 17
| טראקבק
אז מה כתוב כאן?
|
39656161936137668416363639842916664336846177811666 |
נשלח: 26 בספטמבר, 2012. נושאים: כללי.
תגובות: 7
| טראקבק
על מתאם וסיבתיות, או האם צמחונות גורמת לאנורקסיה
אני מניח שרוב הקוראים כבר שמעו על גרי יורופסקי ועל הטענה (המגוחכת לכשעצמה) כי ההרצאה שלו היא ההרצאה הכי טובה שתשמעו אי פעם. למי שלא יודע, יורופסקי הוא טבעוני קיצוני המטיף לטבעונות קיצונית והטמעתה בשיטות קיצוניות. אני לא מתכוון לדון בהרצאה שלו ובטיעוניו (וגם לא לתת לינק), כיוון שרוב הטיעונים (לשני הצדדים) כבר הושמעו.
אני מתכוון להתייחס כאן לטענה אחת בלבד שהועלתה על ידי הבלוגר (המומלץ) המכנה את עצמו "קנקן התה" וכותב את הבלוג "חשיבה חופשית". קנקן התה טוען כי מעבר לנזקים בריאותיים מיידיים (כגון אנמיה), ההטפה לצמחונות/טבעונות של יורופסקי ומרעיו עלולה לגרום להתפתחות של אנורקסיה נרבוזה.
זו האשמה חמורה. אני מצטט כאן את קנקן התה, שמצטט מצידו כתבה שפורסמה ב"מעריב":
על פי מחקר שבוצע במרכז הרפואי "רמב"ם", 96 אחוז מהנערות הישראליות שמפתחות אנורקסיה נרבוזה נמנעות מאכילת בשר אדום ו-75 אחוז נמנעות מאכילת עוף ובשר לבן – פי עשרה יותר משיעור הצמחונים בקרב המבוגרים הבריאים. "בבולימיה אנו מוצאים מגמה דומה, אם כי לא בטוטליות כזו".
…
"לקשר בין צמחונות להפרעות אכילה יש הסבר גופני", מבהירה ד"ר יעל לצר, מנהלת המרפאה להפרעות אכילה ברמב"ם. "בגיל ההתבגרות מובילה אי אכילת בשר למחסור באבץ, שמשמש רכיב חיוני לתהליך הצמיחה והגדילה. הפחתת כמות האבץ מובילה לעיתים לחוסר תיאבון, וכך מתפתח מעגל קסמים שמוביל להפחתת המזון ובהמשך להפרעת אכילה".
כשפרסמתי את הלינק לפוסט של קנקן התה בדף הפייסבוק של "ספקנים בפאב" המופעל על ידי ארגון הספקנים בישראל (שאני בין מייסדיו), התקבלו כמובן תגובות מעורבות, כצפוי בכל העלאה של נושא כה קונטרוברסלי. כאן אתייחס רק לתגובה של עפרה מהודר, שתמיד שואלת שאלות טובות: "אוי, יוסי, אני מתפלאת עליך. בתור סטטיסטיקאי, שקופץ כל כך בקלות ממתאם לסיבתיות. אם הרבה מהאנורקטיות הן טבעוניות, זה לא אומר שבהכרח הטבעונות גרמה לאנורקסיה. אולי, כמו שאמרו בכתבה, לנערות האלה יש צורך חזק בשליטה, וזה מתבטא במשטרים תזונתיים שונים."
עפרה צודקת, כמובן. הנתון לפיו 96% מהנערות הישראליות שמפתחות אנורקסיה הן צמחוניות מעיד על מתאם בין שתי התופעות. מתאם לא בהכרח מעיד על אינו מהווה ראיה מספיקה לקביעת סיבתיות. (תיקנתי את הטקסט ב-21.10.2012. רוצים לדעת מדוע? כי מתאם כן מעיד על סיבתיות.)
אבל רגע. גם רונלד פישר בשעתו גייס טענה זו כדי לשכנע את עצמו כי עישון אינו גורם לסרטן, אך ניתוחים סטטיסטיים מעמיקים יותר שנעשו על יד ג'רום קורנפילד ועמיתיו העמידו אותו על טעותו. כלומר – הטיעון כי מתאם אינו בהכרח מעיד על סיבתיות הינו נכון אך כללי מדי, ויש לבחון נתונים נוספים. יש לזכור כי כאשר יש מתאם ייתכן כי יש סיבתיות, מלאה או חלקית. וכמובן, מתאם יכול בהחלט לנבוע מסיבתיות. יותר מכך – סיבתיות מובילה תמיד למתאם. מנגנון אפשרי לסיבתיות שכזו תיארה ד"ר יעל לצר, מנהלת המרפאה להפרעות אכילה בבית החולים רמב"ם (ראו את הציטוט מהפוסט של קנקן התה לפני שלוש פסקאות). יש לנו מתאם, ומנגנון סיבתי. זה כבר יותר מאשר סתם מתאם.
ויש עוד. יש גם נתונים לגבי שיעור הצמחונים (והצמחוניות) באוכלוסיה ולגבי שיעור החולות באנורקסיה, שמאפשרים לשים את אותם 96% שהוזכרו בקונטקסט הנכון. בעזרת הנתונים הנוספים ניתן לחשב עד כמה גדול הסיכון לאנורקסיה בקרב נערות צמחוניות בהשוואה לחברותיהן הלא צמחוניות. הניתוח שאביא כאן הינו כמובן פשטני לעין ערוך מעבודתו ההיסטורית של קורנפילד, אך לדעתי מבהיר היטב את הנקודה.
לפי הכתבה במעריב שתיארה את המחקר של ד"ר לצר, 11.6% מהמתבגרות מגדירות עצמן כצמחוניות. לפי אתר אנונימוס, המצטט מחקר של הלשכה המרכזית לסטטיסטיקה, 9.8% מהנשים בישראל הן צמחוניות ושיעור הצמחונות באוכלוסייה עולה קלות עם הגיל, כלומר, בקרב נערות בגיל הסיכון לאנורקסיה שיעור הצמחוניות הוא נמוך יותר. לצורך החישובים אשתמש בערך 10%.
על פי ויקיפדיה, בחברה המערבית אחוז החולות במחלה נע בין 0.5% ל-1%. (0.2% מהמתגייסות לצה"ל לקו באנורקסיה, אך סביר להניח כי חולות רבות לא גויסו כלל). לפי מאמר של מיטרני ועמיתיה מ-1995 יש בישראל 29 מקרים חדשים של אנורקסיה לכל 100,000 נערות בגיל 12-18 כל שנה, וזה מוביל אותנו לבערך 0.5% חולות בסך הכל בקבוצת הגיל הנ"ל. דו"ח שהוגש לועדה לזכויות הילד של הכנסת ב-2004 (קישור לקובץ pdf) נוקב בשכיחות של 1%, בהתחשב בזמן שעבר מאז המחקר של מיטרני, ובהנחה ששיעור הסובלים מהפרעות אכילה שונות בישראל עלה באופן דומה לעלייתו בארצות מערביות אחרות. לכן אשתמש בחישובים שאציג מייד בערך של 1%.
ומכיוון שכאמור לפיו 96% מהנערות הישראליות החולות באנורקסיה הן צמחוניות, הרי ש-0.96% (96% מ-1) מהנערות הינן צמחוניות וגם חולות באנורקסיה.
בואו נשרטט לנו טבלה קטנה. שלושת נתוני הבסיס מסומנים באדום (כמו בטקסט). שאר הנתונים נקבעים על ידי נתוני הבסיס:
|
צמחונות |
סה"כ |
|||
|
כן |
לא |
|||
|
אנורקסיה |
כן |
0.96% |
0.04% |
1.00% |
|
לא |
9.04% |
89.96% |
99.00% |
|
|
סה"כ |
10.00% |
90.00% |
100.00% |
|
בעזרת הטבלה אפשר לחשב הסתברויות מותנות:
מה ההסתברות כי נערה צמחונית חולה באנורקסיה? 10% מהנערות הינן צמחוניות, 0.96% הינן גם צמחוניות וגם חולות באנורקסיה, ולכן התשובה היא 0.96 חלקי 10, כלומר 0.096.
מה ההסתברות כי נערה שאינה צמחונית חולה באנורקסיה? 90% מהנערות אינן צמחוניות, 0.04% אינן צמחוניות וגם חולות באנורקסיה, ולכן התשובה היא 0.04 חלקי 90, כלומר 0.000444.
ההסתברות כי נערה צמחונית חולה באנורקסיה גבוהה פי 216 מההסתברות כי נערה שאינה צמחונית חולה באנורקסיה. בשפת הסטטיסטיקה והאפידמיולוגיה אומרים כי הסיכון היחסי לאנורקסיה המקושר לצמחונות הוא 216. זה מראה קשר חזק מאוד בין שתי התופעות, וזה כבר יותר מסתם מתאם.
מדד מקובל יותר לחוזק הקשר הוא ה-Odds Ratio (אין לי מושג איך לתרגם זאת לעברית. Odds הוא יחס הסתברויות, ולכן Odds Ratio הוא יחס של יחסי הסתברויות). החישוב הוא כדלקמן:
בקרב הצמחוניות, הסיכוי לחלות באנורקסיה הוא 0.96/10 כלומר 0.096 והסיכוי לא לחלות הוא לכן 0.904. היחס בין הסיכוי לחלות לבין הסיכוי לא לחלות, ה-Odds, הוא לכן 0.096 חלקי 0.904, כלומר 0.1062.
חישוב דומה מראה כי היחס בין הסיכוי לחלות באנורקסיה לבין הסיכוי לא לחלות בקרב הלא הצמחוניות הוא 0.000445.
ה-Odds Ratio, היחס בין 0.1062 ל-0.000445 שווה לכן ל-238.8 ומשמעותו כי הסיכון לאנורקסיה בקרב נערות צמחוניות גדול כמעט פי 239 מהסיכון בקרב נערות לא צמחוניות.
זה מספר עצום. לשם השוואה, תרופה בה ה-Odds Ratio להתרחשות אירוע קליני של מחלת הטרשת הנפוצה קרוב ל-2 (הסיכון ללא טיפול גדול פי קצת פחות מ-2 מהסיכון תחת טיפול תרופתי) נמכרת במיליארדי דולרים כל שנה.
מסקנות
האם צמחונות גורמת לאנורקסיה? ודאי שלא. הרי יש נערות צמחוניות רבות (בערך 9 מתוך כל 10) שאינן חולות באנורקסיה.
האם יש מנגנון סיבתי המסביר כיצד אנורקסיה יכולה להתפתח מצמחונות? בהחלט כן.
האם הסיכון לחלות באנורקסיה גבוה באופן משמעותי עבור נערות צמחוניות? בהחלט כן. גבוה מאוד, אפילו. צמחונות היא גורם סיכון לאנורקסיה.
מכאן שאמנם אורח חיים צמחוני לכשעצמו לא בהכרח גורם לאנורקסיה, אך בשילוב עם גורמי סיכון נוספים המחלה עלולה להתפתח.
האם הורים לבת עשרה שהחליטה להיות צמחונית צריכים להיכנס לפאניקה? בהחלט לא, אבל הם צריכים להיות קשובים לביתם, למצוקות אפשריות אותן היא חווה, להיות עם אצבע על הדופק, ולוודא שאין סימנים אחרים המעידים על התפתחות מחלה קשה זו. המלצות אלה נכונות כמובן תמיד, לכל הורה, וכמובן גם להורים לבנים, וגם אם הבן או הבת אינם צמחונים.
האם צמחונות לכשעצמה היא דבר רע? אני לא חושב שמישהו העלה את הטענה הזו ברצינות. אני בודאי לא טוען זאת (אם כי איני צמחוני).
רק בריאות.
הערה (4.3.2019): הפוסט נסגר לתגובות עקב תגובות ספאם רבות לפוסט הספציפי הזה. אם ברצונכם להגיב, אנא שלחו אליי את תגובתכם למייל שלי שנמצא בדף יצירת קשר.
נשלח: 24 בספטמבר, 2012. נושאים: ביוסטטיסטיקה, בריאות, האנשים שמאחורי הסטטיסטיקה, מדע, מה אומרת הסטטיסטיקה, ספקנות.
תגובות: 32
| טראקבק
מיהו המדען המשפיע ביותר במאה ה-20?
מיהו המדען (או מדענית) המשפיע ביותר במאה ה-20? שאלתי שאלה זו את עוקביי בטוויטר וגם בפייסבוק. קיבלתי שפע של תשובות: זיגמונד פרויד, מילטון פרידמן, רוברט אופנהיימר, אלכסנדר פלמינג, ורנר פון בראון, "ההוא שהמציא את הטרנזיסטור" (מקובל לייחס את ההמצאה לשלושת הפיזיקאים שבשנת 1956 זכו במשותף בפרס נובל לפיזיקה על תרומתם לפיתוחו: ויליאם שוקלי, וולטר בראטיין וג'ון ברדין), מי שפיתח את הגלולה נגד הריון (הערה: אין אדם יחיד שניתן לייחס לו המצאה זו, אך מקובל כי האב ה"רשמי" של הגלולה הוא גרגורי פינקוס, שעמד בראש צוות שכלל גם את פרנק קולטון, מין צ'ה צ'אנג ואחרים), נורמן בורלוג, אלברט איינשטיין, אלן טיורינג, ריצ'ארד פיינמן, וייתכן שהיו עוד תשובות שאבדו בנשיה וגוגל לא הצליח לדלות, עם המשיבים הסליחה.
אני מוכרח לומר שלא הופתעתי מהתשובות (פרט להעלאת שמו של פרויד, ואולי מאזכור שמו של מילטון פרידמן, שאותו אני לא נוטה לסווג כמדען – וראו את מה שכתבתי עליו לאחר מותו, הלינק למעלה). אפשר לזהות כאן ארבעה תחומים עיקריים בהם בלטו ודרכם השפיעו האנשים המכובדים שצויינו למעלה (וחלק גדול מהמוזכרים משתייכים ליותר מתחום אחד): אלקטרוניקה, מלחמת העולם השניה, רפואה/מדעי החיים, ומדעי המחשב. הקוראים מוזמנים לדון בתשובות שהועלו, בחלוקה הגסה שלי לתחומים, ולהעלות שמות אחרים.
הנסיון לקבוע מיהו המדען "המשפיע ביותר" נדון כמובן לכשלון מיידי, כיוון שלא ניתן לכמת את מידת ההשפעה. האם השפעתם של איינשטיין וטיורינג על מהלך מלחמת העולם השניה רבה או פחותה מהשפעתם על התפתחות עידן המידע? מה יותר חשוב: הטרנזיסטור או האנטיביוטיקה? התשובות לשאלות כאלה יהיו יותר מטופשות מהשאלות עצמן.
הנה שאלה אחרת, טובה יותר: לא שכחנו מישהו? סביר להניח ששכחנו עוד רבים וטובים. ועוד שאלה שאולי תרצו לשאול אותי: מי יופיע ברשימה שלך, יוסי? ובכן, בעיניי, רוב השמות שהוזכרו קודם ראויים להכלל בכל רשימה של "מדענים משפיעים", אבל ברצוני להציע עוד שם אחד שלא הוזכר עד כה: רונלד א. פישר.
כן. הוא כבר הופיע ברשימת 15 הסטטיסטיקאים הגדולים שערכתי, במקום הראשון. אבל הוא היה רק סטטיסטיקאי, לא? טוב, גם גנטיקאי (הביולוג הגדול ביותר מאז דרווין – טוען ריצ'ארד דוקינס). את סיפורו, סיפור הליידי הטועמת תה סיפרתי לא מזמן ב-"סיפור נובה – ערב סיפורי מדע ומדענים". אמרתי בפני עדים, ואף כתבתי זאת בבלוג זה ממש כי הוא "אחד המדענים המשפיעים ביותר של המאה ה-20".
פישר הניח את היסודות (ובנה חלק ניכר מהקומות הראשונות) של התיאוריה של תכנון ניסויים מבוקרים. כל ניסוי מדעי הנערך כיום חייב לכלול את "השילוש הקדוש" – שלושת תנאי היסוד שהציב פישר להבטחת תקפות הניסוי ותוצאותיו: רנדומיזציה, בקרה, סמיות.
פישר המציא את הכלי העיקרי (ובמשך שנים רבות – הבלעדי) להערכת כמותית של משקל העדויות המתקבלות בניסוי: ה-p-value. פתחו כל מאמר מדעי בו מתואר ניתוח כמותי של נתונים. ה-p-value יופיעו שם, וערכי p קטנים מ-0.05 יזכו להתייחסות מיוחדת, שכן הם מעידים על תוצאות מובהקות. הערך הקריטי 0.05 מקורו גם הוא בהערכה של פישר כי מדובר בערך מתקבל על הדעת, אף כי פישר עצמו ידע היטב כי אין לכך כל הצדקה תיאורטית.
ופישר גם אחראי לפיתוח ושיפור של שיטות סטטיסטיות רבות לניתוח נתונים כמותיים, ובראשן ניתוח השונות ("אנובה"). למה לדעתכם סטטיסטי המבחן של ה-ANOVA מסומן באות F?
לו היו כותבי המאמרים המדעיים מקפידים על הפניה למקורות, פישר היה כנראה המדען המצוטט ביותר (וזהו עוד מדד מקובל לחשיבותה של עבודה מדעית): יש לצטט את עבודתו בכל מאמר מדעי המתאר ניסוי מבוקר, משתמש ב-p-value להערכת התוצאות, ובודאי אם נעשה שימוש בניתוח שונות, או במבחן המדוייק של פישר, או באחת מהשיטות הסטטיסטיות הרבות האחרות שפיתח ושיפר. מדוע עבודות אלה אינן מצוטטות? כי הן הפכו ל-"מובנות מאליהן", כאילו ניתנו למשה בסיני, ולא היא.
עבודתו של פישר השפיע על כל המחקר המדעי מימיו והלאה. המדע במאה העשרים לאחר פישר אינו כשהיה לפניו, ולכן פישר הוא ללא ספק אחד המדענים המשפיעים ביותר של המאה ה-20.
נשלח: 18 בספטמבר, 2012. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, הממ... מעניין..., מדע.
תגובות: 20
| טראקבק
הליידי טועמת תה
עצמו את עינכם ודמיינו לכם אחר הצהריים אביבי בקיימברידג’, אנגליה, בשנות העשרים של המאה הקודמת. אדונים וגבירות מתכנסים על אחת המדשאות למסיבת תה.
הליידי, גיבורת הסיפור שלנו, היא מוריאל בריסטול. היא לא רק ליידי, אלא מדענית בזכות עצמה, ביולוגית החוקרת את תהליכי הפוטוסינתזה. למרבה הצער, לא ידועים לנו עוד פרטים רבים אודותיה, ואפילו תמונה שלה לא השתמרה.
הגיבור הראשי של הסיפור שלנו הוא דווקא הגבר שיתייצב מייד מול הליידי – הג'נטלמן, אם אפשר לקרוא לו כך, כיוון שהדעות חלוקות.
הוא היה איש נמוך ורזה בעל זקן תיש, לבוש ברישול, חובש משקפיים עבות זגוגית, ומקטרת נצחית בפיו (שלא משה מפיו גם כאשר עסק בשחיה). הוא היה נקמן. נוטר טינה. יהיר. כאשר שיחה שעממה אותו, הפגין זאת על ידי הוצאת שיניו התותבות מפיו וניקויין. הוא היה מהתומכים הגדולים באאוגניקה, תחום מדעי שעסק באפשרויות להשבחת המין האנושי באמצעים גנטיים, ואף כיהן כפרופסור לאאוגניקה באוניברסיטת קיימברידג'. הוא היה שוחר מדון. בהזדמנות אחת כתב מאמר שאורכו עמוד אחד בלבד. חלקו הראשון של המאמר עסק בתיאור הבעיה והמאמצים הרבים שהשקיע אחד מיריביו המדעיים להגיע לפתרון. לאחר מכן הופיע הפתרון לבעיה שאורכו שלוש שורות. המאמר הוגש לפרסום בכתב העת היוקרתי אותו ערך יריבו (אך זה סירב לפרסמו)*. עוד מסופר עליו כי באמצע הרצאה של אחד מעמיתיו בקיימברידג' קם לפתע ממקומו, נטל את הגיר מידיו של המרצה ההמום, ושרטט על הלוח דוגמה שהפריכה את טענותיו של המרצה. הוא לא הסתפק בכך, אלא גם נזף בו: "אני מקווה שמעתה והלאה יעסוק המרצה הנכבד רק בנושאים שבהם הוא מבין. איך אפשר לטעות בשאלה כה פשוטה?"**
הוא היה גנטיקאי נודע, ולפי ריצ'רד דוקינס הוא הביולוג הגדול ביותר מאז דרווין. הוא חקר את עבודתו של גרגור מנדל ואת הנתונים שפרסם. במחקרו הגיע למסקנה כי מנדל הגדול "שיפץ" את הנתונים שלו, כך שיתאימו יותר לתיאוריה הגנטית שפיתח.
הוא היה עקשן, וכמעשן כבד סירב להפסיק לעשן גם כאשר החלו להופיע עדויות הקושרות בין עישון וסיכול לחלות בסרטן. ב-1958 אף פרסם שני מאמרים בכתב העת Nature, בהם כתב, נאמן לעקרון כי מתאם אינו מעיד על סיבתיות, כי לא ניתן לטעון על סמך הנתונים שנאספו עד כה כי עישון אכן גורם לסרטן. הוא אף הציע תיאוריה חליפית לפיה מחלת הסרטן גורמת לרצון לצריכת ניקוטין, כלומר לעישון.
הוא הלך לעולמו ב-1962 ממחלת הסרטן.
הוא היה סיר רונלד פישר, אחד המדענים המשפיעים ביותר של המאה ה-20.
ומשהכרנו את גיבורינו, נחזור אל מסיבת התה בקיימברידג'.
אחד ממשתתפי המסיבה הגיש לליידי, ד"ר מוריאל בריסטול, ספל תה. מייד לאחר שטעמה ממנו הניחה הליידי בריסטול את הספל, כיוון שהתה שבתוכו לא הוכן כהלכה: החלב הוסף לתה לאחר שנמזגו לתוכו המים הרותחים, ותה ראוי לשמו יש להכין בתהליך הפוך: קודם יש למזוג את החלב לספל, ורק אחר כך להוסיף מים רותחים. הטעם, טענה ד"ר בריסטול, שונה לגמרי.
פישר שמע את הטענה ונדרך. כמדען, הוא לא היה מוכן לקבל טענה כה פסקנית ללא סימוכין או נתונים תומכים. והאובססיה ששוכת בליבו של כל מדען טוב, דחקה בו לבדוק מייד את נכונות הטענה. הוא הציע לליידי בריסטול לעמוד מול אתגר טעימה, והיא נענתה בשמחה. לאחר מספר דקות ששל תכנון, הניסוי, שכולל בתוכו את כל העקרונות הבסיסיים שחייבים להמצא בכל ניסוי מדעי, יצא לדרך.
פישר התייצב מול בריסטול ובידיו שני ספלי תה; באחד מהם החלב נמזג לפני המים, בשני המים נמזגו לפני החלב. שני ספלים, כי כל ספל משמש כביקורת לרעהו. בריסטול לא ידעה איזה ספל תה הוכן באיזה אופן. היא טעמה את התה בכל אחד מהספלים, ואמרה כיצד לדעתה הוכן התה בכל ספל. מבלי לומר מילה, מבלי להזיז שריר בפניו, רשם פישר את התשובה בפנקס קטן. תוצאות הניסוי יישארו סמויות עד סופו. הוא פנה לאחור וחזר עם זוג ספלים חדש. כך שמונה פעמים. הסדר בו הוגשו הספלים לליידי (מים לפני חלב בספל שביד ימין או בספל שביד שמאל) נקבע באופן מקרי, כך שלא תהיה אפשרות לניחוש על סמך תבנית כלשהי.
ולאחר שתם הניסוי, יש כמובן נתונים שצריך לנתח באופן סטטיסטי, לחשב p-value ולהודיע מהן התוצאות, ומי אם לא רונלד פישר הוא האיש המתאים לעשות זאת?
האם היו הדברים מעולם או שזו רק אגדה? פישר פרסם מאמר שהפך ברבות השנים למאמר קלאסי בענף הסטטיסטי של תכנון ניסויים: The mathematics of the lady tasting tea (קישור לקובץpdf). במאמר מתאר פישר את סיפור המעשה, ומציג מספר ניסויים אפשריים שבעזרתם ניתן לבחון את טענת הליידי ואת הדרך לניתוח סטטיסטי של הנתונים. אולם, הוא לא מזכיר את שמה של הליידי, ואינו מציין אם מדובר בסיפור אמיתי או רק בדוגמא משעשעת.
אבל אני מכיר מישהו שטוען בספרו כי הוא מכיר מישהו שסיפר לו כי הוא היה שם, במסיבת התה בקיימברידג', וראה כל זאת במו עיניו. והליידי, ד"ר מוריאל בריסטול, הייתה ליידי אמיתית. היא לא טעתה אפילו פעם אחת.
סיפרתי סיפור זה ב-"סיפור נובה – ערב סיפורי מדע ומדענים" שנערך במסגרת אירוע ספקנים בפאב בספטמבר 2012.
* היריב הוא הסטטיסטיקאי קרל פירסון, המייסד והעורך הראשון של כתב העת ביומטריקה.
** המרצה הנזוף הוא הסטטיסטיקאי ג'רזי ניימן, שיחד עם בנו של קרל פירסון, אגון, פיתח את התיאוריה של בדיקת השערות סטטיסטיות
נשלח: 7 בספטמבר, 2012. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, מדע.
תגובות: 6
| טראקבק
הרצאה במסגרת ספקנים בפאב
הנושא של מפגש "ספקנים בפאב" הקרוב התל אביב הוא "סיפור-נובה: ערב סיפורי מדע ומדענים". מה המקום שממלא המדע בחיינו? איך הוא משפיע על מי שאנחנו? מספרי סיפורים, חלקם מדענים, חלקם לא ראו מבחנה מקרוב מאז חטיבת הביניים, יישתפו בהתלבטויות, מפגשים, כישלונות והצלחות במדע. ערב סיפורים מיוחד על מדע ומדענים, לכל מי שאוהב מדע – ולכל מי שאוהב סיפור טוב.
אני אהיה בין המרצים ואספר על הגברת טועמת התה. אם אתם רוצים לדעת איך זה קשור למדע ומדענים (וגם לסטטיסטיקה), תצטרכו להגיע!
המפגש ייערך ביום שני, ה-3.9.2012, ברדיו EGPB שד"ל 7 (במרתף), תל-אביב.
התכנסות ב-19:30, תחילת האירוע 20:00 בדיוק!
פרטים נוספים באתר ארגון הספקנים בישראל.
להתראות

