חיפוש באתר

קישורים

עמודים

קטגוריות

מהי טעות הדגימה האמיתית בסקרי הבחירות

בסקרי בחירות ודעת קהל נהוג לפרסם את “טעות הדגימה”, ולפעמים אפילו את “טעות הדגימה המירבית”.[1] אבל כאשר מדובר בסקרי מנדטים, הנתון הזה בעייתי.
נניח כי פורסם סקר לפיו מפלגה מסויימת מקבלת 30 מנדטים, וכי מצויין כי טעות הדגימה היא 4.5%. מה משמעות הדבר? 4.5% מ-30 הם 1.35. מה זה אומר? שמספר המנדטים יהיה בין 28.65 ל-31.35? אף אחר לא ידווח בסקר כי הוא חוזה למפלגה הזו 30.68 מנדטים. ומה המשמעות של טעות הדגימה הזו לגבי מפלגה שעל סף אחוז החסימה?

מה יכול להשתבש?

בסקרי מנדטים יש שלוש טעויות שמעניינות אותנו:
סוג הטעות הראשון מתייחס אל ההפרשים בין מספר המנדטים שמפלגה מקבלת בפועל ובין מספר המנדטים שהסקר חוזה כי יקבלו, או באופן יותר מדוייק – ההפרש המקסימלי שמתקבל. כמובן שאם נסתכל על כל ההפרשים של כל המפלגות הם יקזזו זה את זה וסכומם יהיה תמיד 0[2], הנתונים המעניינים הם הערכים המוחלטים של ההפרשים האלה. לדוגמא, אם מפלגה מסויימת מקבל בפועל 10 מנדטים, סקר אחד חוזה לה 12 מנדטים וסקר אחר חוזה לה 8 מנדטים, בשני הסקרים הטעות שווה ל-2.
מה הטעות המירבית האפשרית כאן? התשובה היא 120. ייתכן בהחלט כי על פי סקר מסויים מפלגה מסויימת תקבל 120 מנדטים אך בפועל היא לא תעבור את אחוז החסימה. הסיכוי לכך אפסי, אך עדיין גדול מאפס. זו הסיבה לכך ששמתי קודם את הביטוי “טעות הדגימה המירבית” במרכאות כפולות. אבל מייד נראה כמה מדדים מעניינים שכן יכולים לתת לנו מבט אל רמת הדיוק של הסקר.
סוג הטעות המעניין השני הוא הסיכוי שהסקר יראה כי מפלגה מסויימת עברה את אחוז החסימה למרות שלא עברה אותו בפועל. זה כמובן תלוי במרחק של המפלגה מאחוד החסימה. אחוז החסימה הוא כיום כ-134 אלף קולות. הסיכוי שהסקר יטעה ביחס למפלגה שבפועל קיבלה רק 70 אלף קולות בוודאי נמוך מהרבה מהסיכוי הדומה למפלגה שקיבלה 133 אלף קולות.
סוג הטעות המעניין השלישי הוא הסיכוי שהסקר יראה כי מפלגה מסויימת לא עברה את אחוז החסימה למרות שעברה אותו בפועל. זוהי תמונת המראה של הטעות השניה.
הכל טוב ויפה, אבל איך מחשבים את כל הדברים האלה?

איך אפשר להעריך את גדולי הטעויות?

דרך אפשרית לקבל הערכות לגדלי הטעויות האלה היא לבצע סימולציה. הרעיון מאוד פשוט והוסבר כבר בעבר. מניחים הנחה על התוצאה האמיתית הבחירות. אחר כך לוקחים מדגם ורואים מה קורה. חוזרים על כך הרבה פעמים, ולבסוף ממצעים הכל.
הסימולציה שלי מתייחסת לתוצאות ההיפותטיות הבאות לגבי הבחירות לכנסת ה-22. המספרים כמובן לא אמיתיים. הם מתבססים על תוצאות הבחירות לכנסת ה-21 בתוספת כמה שינויים שהכנסתי כדי להתאים אותם למה שאני רוצה להדגים. הנה טבלת “תוצאות האמת” שלי:

מפלגה מספר הקולות מספר המנדטים
הליכוד 1140370 36
כחול לבן 1125881 35
הרשימה המשותפת 337108 10
ש”ס 258275 8
יהדות התורה 249209 8
ימינה 283910 8
העבודה 190870 6
ישראל ביתנו 173004 5
המחנה הדמוקרטי 135529 4
עוצמה לישראל 133211 0
נועם 75223 0
כל השאר 33333 0
סך הכל 4102590 120

 

בישלתי את המספרים כך שאחוז החסימה עומד על 134417 קולות. עוצמה לישראל נמצאת קצת מתחת לאחוז החסימה, המחנה הדמוקרטי קצת מעליו. המרחק של נועם מאחוז החסימה הוא כ-59 אלף קולות, בדומה למרחק של מפלגת העבודה (54 אלף). המרחק של ישראל ביתנו מאחוז החסימה הוא כ-39 אלף קולות.
עכשיו אני יכול לקחת מדגם, של 500 איש נניח, מתוך האוכלוסייה שמונה כ-4.1 מיליון מצביעים. אני פשוט אבחר באופן מקרי 500 איש מתוכם. המדגם שלי יהיה מושלם: אין הטיה כי לכל האנשים מהאוכלוסייה יש את אותו הסיכוי להיכלל במדגם, ואף אחד לא ישקר לי כאן.

הנה מדגם לדוגמה, וחלוקת המנדטים כפי שחישבתי על פי תוצאותיו:

מפלגה מספר הקולות מספר המנדטים
הליכוד 130 34
כחול לבן 132 34
הרשימה המשותפת 37 9
ש”ס 28 7
יהדות התורה 31 8
ימינה 38 10
העבודה 32 8
ישראל ביתנו 23 6
המחנה הדמוקרטי 17 4
עוצמה לישראל 0 0
נועם 0 0
כל השאר 0 0
סך הכל 500 120

 

אנחנו יכולים לראות למשל שהסקר העניק לליכוד ולכחול לבן 34 מנדטים כל אחת, בעוד שלפי “תוצאות האמת” הן קיבלו 36 מנדטים ו-35 מנדטים בהתאמה. לכן הטעויות לגבי שתי המפלגות האלה שוות ל-1 ו-2. תוכלו לוודא כי הטעות המקסימלית שנצפתה בסקר הזה היא 2, הטעות החציונית היא 1 והטעות הממוצעת היא 0.91. הסקר הזה לא העלה את עוצמה לישראל ונועם אל מעל אחוז החסימה, ולא הוריד אף מפלגה שעברה בפועל את אחוז החסימה אל מתחת לו.
את התרגיל הזה ביצעתי 2000 פעם עבור מדגם בגודל 500, וגם עבור מדגמים בגדלי 1000, 2000, 4000, ו-8000.

תוצאות הסימולציה

תוצאות גדלי הטעות שחושבו בסימולציה מופיעות בטבלה הבאה:

גודל המדגם טעות ממוצעת טעות מקסימלית טעות חציונית
500 1.52 4.58 1.12
1000 1.13 3.82 0.80
2000 0.92 3.42 0.60
4000 0.77 3.18 0.39
8000 0.67 3.06 0.23

 

אנו רואים כי הטעות הממוצעת בסקר בגודל 500 היא כמנדט וחצי, והיא כמובן קטנה ככל שגודל המדגם עולה. הטעות החציונית בסקר כזה היא קצת יותר ממנדט, אבל הטעות המקסימלית היא יותר מ-4.5 מנדטים. זה קורה בגלל המפלגות שקרובות לאחוז החסימה. כשמפלגה שלא עוברת את אחוז החסימה בפועל אבל עוברת אותו במדגם הטעות היא 4 מנדטים, וכך גם במקרה ההפוך.
עד כמה נפוצים המקרים האלה? בדוגמא הזאת זה קורה די הרבה, מכיוון שיש בו שתי מפלגות שקרובות מאוד לאחוז החסימה:

גודל המדגם הועברו בטעות לא עברו בטעות
500 44.8 76.8
1000 44.9 56.2
2000 43.7 51.9
4000 44.5 46.9
8000 42.4 47.3

 

חוץ מהאנומליה של 76.8% למדגם בגודל 500, אנחנו רואים כי בדרך כלל הסיכויים קרובים ל-50%.
ניתן לערוך כמובן ניתוחים יותר מתוחכמים: לחשב סטיות תקן ורווחי סמך, לבדוק מה הסיכויים לטעות במעבר אחוז החסימה עבור גדלים שונים של מפלגות, ועוד. מי שמעוניין מוזמן להוריד את קוד הסימולציה שכתבתי בשפת R ולנסות לשחק עם הנתונים.

סיכום

  • בסקרי מנדטים קטנים, כאשר גודל המדגם הוא 500, ייתכנו טעויות משמעותיות בחיזוי מספר המנדטים האמיתי. הטעות הממוצעת היא כמנדט וחצי, והטעות המקסימלית עaויה להיות גבוהה באופן משמעותי.
  • עבור מפלגות המתנדנדות באיזור אחוז החסימה, גם מדגם גדול הרבה יותר אינו יכול לתת תשובה אמינה לגבי השאלה האם מפלגות אלה יעברו את אחוז החסימה.

 

ראו גם את שאר הרשימות שכתבתי בנושא הסקרים.


הערות
  1. אני שם את הביטויים האלה במרכאות מכיוון שאינם מדוייקים ואף מטעים. אתייחס לכך בפוסט נפרד בעתיד. []
  2. מדוע? []

10 שנים למותו של אריק להמן

היום, 12 בספטמבר 2019, מלאו 10 שנים למותו של הסטטיסטיקאי אריק לאו להמן. כאשר מלאו שלושים לפטירתו כתבתי כאן פוסט אישי אודותיו. כעת ברצוני לכתוב גם על חייו ופועלו.

אריק לאו להמן (1917-2009)להמן נולד ב-1917 בעיר שטרסבורג בחבל אלזס לוריין, וגדל בפרנקפורט שבגרמניה. ב-1933, כאשר היטלר מונה לקאנצלר גרמניה, נמלטה משפחתו לשוויץ. לאחר שסיים את לימודיו בתיכון למד מתמטיקה במשך שנתיים בקולג’ טריניטי שבאוניברסיטת קיימברידג’. ב-1940 היגר לארצות הברית, וב-1941 התקבל ללימודי דוקטורט באוניברסיטת ברקלי בקליפורניה, למרות שפורמלית לא החזיק באף תואר אקדמי. הוא קיבל תואר שני במתמטיקה בשנת 1942, ותואר הדוקטור הוענק לו ב-1946. מדריך עבודת הדוקטורט שלו, שעסקה במבחנים אופטימליים על ערכו של מקדם המתאם, היה ג’רזי ניימן. במהלך מלחמת העולם השניה עסק בחקר ביצועים בבסיס חיל האוויר האמריקני בגואם.

לאחר שסיים את לימודי הדוקטורט המשיך להמן בתפקידו כמרצה לסטטיסטיקה באוניברסיטת ברקלי. בשנים 1950-1951 היה מרצה באוניברסיטאות קולומביה ופריסטון, וב-1952 היה פרופסור חבר באוניברסיטת סטנפורד. לאחר מכן חזר לאוניברסיטת ברקלי, שם כיהן כפרופסור למתמטיקה ולסטטיסטיקה עד לפרישתו ב-1988, אך המשיך בעבודתו המדעית גם לאחר מכן. בין השנים 1950 עד 1984 להמן היה מדריך עבודה הדוקטורט של 46 סטודנטים. ב-1977 נישא להמן לסטטיסטיקאית ג’ולי שייפר. הוא נפטר בשיבה טובה ב-12 בספטמבר 2009.

להמן תרם תרומות משמעותיות לתורת האמידה ולתיאוריה של בדיקת השערות אי פרמטרית. הוא נודע גם בזכות משפט להמן-שפה ואמד הודג’ס-להמן לחציון של אוכלוסייה. כמו כן עסק במחקר אודות ההיסטוריה והפילוסופיה של הסטטיסטיקה. בין שותפיו למחקר נמנו הנרי שפה, צ’ארלס סטיין, גו’זף הודג’ס, אוולין פיקס, פרסי דיאקוניס, וויליאם קראסקל, ג’ולייט פופר שייפר, ג’ודית טאנור, וחתן פרס נובל לכלכלה קנת’ ארו. בסך הכל פירסם להמן 123 מאמרים מדעיים.

בנוסף לכך, להמן ידוע גם בזכות הספרים שכתב. הוא כתב שבעה ספרי לימוד שעסקו בעיקר בנושאים מתקדמים בסטטיסטיקה. הספר “מושגים בסיסיים בהסתברות וסטטיסטיקה” שכתב יחד עם ג’וזף הודג’ס, תורגם לחמש שפות, כולל תרגום לעברית. בסך הכל תורגמו ספריו לתשע שפות שונות.

ב-2007 פרסם להמן ספר אוטוביוגרפי בו תיאר את זכרונותיו מעבודות משותפות, קשרי ידידות ומפגשים עם סטטיסטיקאים, כולל פגישה קצרה ולא נעימה עם רונלד פישר. ב-2011  פרסם ספר שעסק בעבודות המוקדמות של פישר וניימן, בו הבהיר את חילוקי הדיעות העקרוניים שהיו בין השניים לגבי הכיוון אליו צריך מדע הסטטיסטיקה להתפתח.

להמן נבחר לחבר כבוד של האיגוד האמריקני לסטטיסטיקה, המכון לסטטיסטיקה מתמטית, והחברה המלכותית לסטטיסטיקה. כן נבחר להיות חבר במכון הבינלאומי לסטטיסטיקה, באקדמיה האמריקנית לאמנויות ומדעים, ובאקדמיה הלאומית למדעים של ארצות הברית. להמן כיהן כנשיא המכון לסטטיסטיקה מתמטית בשנים 1960-1961 . הוא זכה במספר מענקי מחקר יוקרתיים, כולל מענק מקרן גוגנהיים, והוזמן לשאת את ההרצאות על שם רונלד פישר, סם וילקס ואברהם ולד. הוענקו לו שני תוארי דוקטור לשם כבוד מטעם אוניברסיטת ליידן ואוניברסיטת שיקגו. לכבוד יום הולדתו ה-80 ב-1997, אוניברסיטת ברקלי הקימה קרן מילגות על שמו. בשנת 2000 היה לזוכה הראשון בפרס על שם גוטפריד נתר.

לקריאה נוספת

 

הקשר בין אכילת בשר ותחלואה בסרטן השד – יחסי סיכונים

דרך מקובלת לבטא אפקט של טיפול או התערבות רפואית היא מה שמכונה “יחס הסיכויים”[1] או באנגלית odds ratio. המונח העברי מופיע במרכאות מכיוון, כפי שאסביר מייד, התרגום הוא לא מדוייק עד לא נכון, תלוי את מי שואלים.

השאלה שנשאלה בשאלון היא מאוד פשוטה. נתונה קובייה הוגנת, כלומר כאשר מטילים אותה לכל התוצאות יש סיכוי שווה להופיע. לכן, מהו ה-odds של הטלת המספר 6?

מי שעוסק בהימורים יבין מייד את התשובה. יש 6 תוצאות אפשריות, לכולן אותו סיכוי. חמש תוצאות אפשריות אינן שוות ל-6, יש רק תוצאה אחת השווה ל-6, לכן ה- odds, היחס בין מספר התוצאות הרצויות לבין מספר התוצאות הלא רצויות הוא 1:5. יחס זה מכונה לעיתים בשם “יחס ההימורים”.

שימו לב ש-1:5 אינו אומר כי ההסתברות להטלת 6 היא חמישית. ההסתברות להטלת 6 היא שישית. המשמעות של היחס  1:5 היא שההסתברות להטלת 6 קטנה פי 5 מההסתברות לא להטיל 6. בנוסף לכך, אם נחלק 1 ל-5 נקבל חמישית. נקבל חמישית גם את נחלק את הסיכוי לקבל 6, שהוא שישית, בסיכוי לא לקבל שש, שהוא חמש שישיות. זה תמיד נכון, ולכן יחס זה הוא יחס בין שני סיכויים.

ה-odds ratio, כפי ששמו מעיד עליו, הוא יחס בין שני odds, ומכיוון שה-odds הוא יחס, הרי שה-odds ratio הוא יחס בין שני יחסים, שכל אחד מהם הוא יחס בין שני סיכויים. לכן הביטוי “יחס הסיכויים” בעייתי בעיניי. לעיתים מכנים אותו בשם “יחס צולב”, ואסביר מדוע בהמשך הפוסט.

הנה דוגמה שתסביר מהו ה-odds ratio, ואת הקשר בינו ובין הסיכון היחסי והסיכון המוחלט.

הדוגמה לקוחה מידיעה שפורסמה באתר Medical News Today, בה נאמר כי הסיכון לחלות בסרטן השד אצל נשים הניזונות מתפריט מוטה בשר אדום גבוה ב-23% מהסיכון של נשים הניזונות מתפריט מוטה בשר עוף.

מדובר במחקר תצפיתי בו התבצע מעקב אחרי 42016 אלף נשים הנמצאות בקבוצת סיכון לתחלואה בסרטן השד – לכל אחת מנשים אלו יש אחות שחלתה כבר בסרטן השד. המחקר עקב אחרי הרגלי האכילה שלהן, כולל אכילת סוגי בשר שונים ובשר מעובד. במשך תקופת המעקב, כשבע וחצי שנים, 1536 נשים אובחנו כחולות בסרטן השד. מדובר באשה אחת מתוך כל 27 בערך[2], סיכון לא מבוטל של כ-3.7%. מהו יחס הסיכונים לתחלואה בסרטן השד שנצפה באוכלוסייה זו במשך תקופת המעקב? 1536 נשים אובחנו כחולות בסרטן השד, 40480 נשים לא אובחנו. יחס הסיכונים הוא לכן 1536 ל-40480, או כ-1 ל-26. שימו לב כי הסיכון שונה מיחס הסיכונים.

החוקרים דיווחו כי הסיכון לתחלואה בקרב נשים שאוכלות בעיקר בשר עוף נמוך לעומת הסיכון בקרב נשים האוכלות בעיקר בשר אדום ב-28%.

למעשה הם ביצעו ניתוח הישרדות ודיווחו כי יחס הסיכונים במובן של Hazard Ratio בין אוכלות העוף ואוכלות הבשר האדום הוא 0.72[3]. נתון זה מתקבל מחישוב המתקנן בתוכו משתנים נוספים, כגון גיל, BMI, עישון ומוצא אתני, וכמובן משך הזמן שעבר מתחילת המעקב ועד האבחון.

אבל (על פי החישובים שאפרט בהמשך):

יחס הסיכונים הוא 0.8 לומר הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר עוף נמוך רק ב-20% מהסיכון עבור נשים הניזונות מתפריט מוטה בשר אדום.

הפרש הסיכונים הוא 0.6% בלבד. הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר אדום הוא 3.1% ועבור אלה הניזונות מתפריט מוטה בשר עוף הוא 2.5%.[4]

התובנה שלי: נתוני ה-odds ratio הם בעייתיים, ואין להם פירוש משמעותי ברור. הנתונים של הסיכון היחסי והפרש הסיכונים נותנים תובנה הרבה יותר טובה באשר לגורמי הסיכון.

למי שמעוניין בכל החישובים: עיון יותר מעמיק בנתונים מעלה כי הנתון המתוקנן של  0.72 נגזר מהנתונים הבאים (קישור לקובץ וורד).

מתוך כ-10500 נשים (כרבע מהאוכלוסייה) שאכלו בעיקר בשר אדום, היו 329 מקרי סרטן, ומתוך כ-10500 נשים שאכלו בעיקר בשר עוף היו 258 מקרים.

נסדר את כל הנתונים בטבלה יפה:

תחלואה בסרטן השד
הטיית התפריט כן לא סך הכל
בשר עוף 258 10242 10500
בשר אדום 329 10171 10500
סך הכל 587 20413 21000

 

מה אנחנו יכולים ללמוד מהמספרים האלה?

ה-odds, יחס הסיכונים לחלות בסרטן השד עבור נשים שאוכלות בעיקר בשר עוף הוא 258 ל-10242. עבור נשים שאוכלות בעיקר בשר בקר יחס הסיכונים הוא 329 ל-10171. נחלק את היחסים ונקבל כי היחס בין היחסים הוא 0.78:

 

 

 

תוצאה זו שונה מעט מהתוצאה שדווחה מכיוון שכאמור החוקרים ביצעו תקנונים שאנחנו לא ביצענו.

אבל שימו לב לחישוב: למעשה הכפלנו את שני המספרים שבאלכסון הראשי של הטבלה וחילקנו אותם במכפלת המספרים שבאלכסון המשני של הטבלה. ציירנו מין צלב כזה על הטבלה, ולכן יחס הסיכונים, ה-odds ratio נקרא לפעמים בשם יחס צולב.

 

.רשימה זו היא הרשימה החמישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:

 

 


הערות
  1. ולפעמים – יחס הסיכונים – תלוי בהקשר []
  2. למי שישאל איך קיבלו 1 ל-27 כאשר הנתון שכולם מכירים הוא 1 מתוך 9: הנתון של 1 מתוך 9 מתייחס לסיכון של אישה לחלות בסרטן השד במהלך חייה. תוחלת החיים של אישה ברוב העולם המערבי היא כשמונים שנה. הנתון של 1 מתוך 27 מתייחס אמנם לנשים בסיכון, אך במשך תקופת זמן קצרה בהרבה – רק כשבע וחצי שנים. []
  3. ראו את הרשימה “איך יודעים כמה אנשים מתים מנזקי העישון” להסבר קצת יותר רחב על המושג של ה- Hazard []
  4. שאלה מעניינת: אם אחוז התחלואה הכולל הוא 3.7%, אך התחלואה בעל אחת משתי הקבוצות האלה לחוד נמוכה מ-3.7%? []

הקשר בין טיפול הורמוני חליפי והתפתחות קרישי דם

בתחילת 2019, פורסמה ידיעה בעיתון דיילי מייל לפיה כי טיפול הורמונלי חליפי (Hormone Replacement Therapy) בזמן המנאופוזה מכפיל את הסיכון לקרישי דם מסוכנים, כלשון הכותרת..

בניגוד למה שקורה בדרך כלל, הידיעה ציטטה גם את הנתון הבאשמסרו החוקרים מאוניבריטת נוטינגהאם: “על כל 10000 נשים המקבלות טיפול החלפת הורמונים, יש רק 9 מקרים נוספים של קרישי דם מדי שנה”. זוהי פיסת מידע חשובה. מהו בעצם הנתון הזה?

אני אתעלם מהתשובות הלא נכונות שהוצעו (שינוי באחוזים, מספר החולים שיש לטפל בהם,[1] וקצב קפלן-מאייר) ואעבור מייד להסבר.

הנתון שדווח הוא הגידול המוחלט בסיכון.

לפני שנגיע לדיון, קצת פרופורציות: לפי הכותרת, הסיכון להתפתחות קרישי דם בקרב נשים המקבלות טיפול הורמונלי גבוה פי שניים מהסיכון אצל נשים שלא מקבלות טיפול כזה. זה לא ממש מדוייק. קריאה זהירה במאמר שפורסם ב-BMJ מעלה כי הנתונים שמדווחים אינם סיכונים יחסיים אלא יחסי סיכונים (odds ratios).  אני אדון ביחסי הסיכונים בהמשך הסדרה. כמו כן, יחסי הסיכונים משתנים על פי סוג הטיפול ודרך המתן. מדווחות תוצאות שונות לגבי סוגים שונים של טיפולים הורמונליים, ואכן עבור אחד מהם יחס הסיכונים נאמד כ-2.1, ולטיפולים אחרים היו יחסי סיכונים נמוכים יותר. עבור אחד הטיפולים המקובלים יחס הסיכונים היה נמוך באופן משמעותי מ-1, כלומר לטיפול הספציפי הזה היה אפקט מונע נגד הופעת קרישי דם. יחס הסיכונים המשוקלל על פני כל סוגי הטיפולים היה 1.6 בערך. עד כאן בנוגע לפערים בין כותרות זורעות בהלה ובין המציאות.

מה המשמעות של הגידול המוחלט בסיכון? נניח שאצל כל 10000 נשים שאינן מקבלות טיפול הורמונלי, יש מקרה אחד של היווצרות קרישי דם בכל שנה. הסיכון המוחלט הוא לכן 1 מתוך 10000, (או 0.01%, למי שאוהב אחוזים). לפי דברי החוקרים, עקב הטיפול ההורמונלי יש 9 מקרים נופים בשנה. כלומר, עוד 9 נשים מתוך 10000 יפתחו קרישי דם עקב הטיפול. באחוזים, ובסך הכל יהיו 10 נשים מתוך 10000 שיפתחו קרשי דם.

מה אם ההנחה הראשונה שלנו לא נכונה, ולמעשה מבין במקום אישה אחת, מבין כל 10000 נשים שאינן מקבלות טיפול הורמונלי, קרישי דם מתפתחים אצל 9 נשים? זה לא משנה – הנתון שנמסר עדיין אומרי כי יהיו 9 מקרים נוספים, ובסך הכל 18 במקום 9.

למעשה, אם נפרש את הכותרת של הדיילי מייל כמדווחת על סיכון יחסי, ונניח כי הנתון של תוספת 9 מקרים הוא נתון המשקלל את כל סוגי הטיפולים, נוכל לעשות חישוב לאחור. תוספת של 9 מקרים פירושה הכפלת הסיכון[2], כלומר ללא טיפול יש 9 מקרים ועם טיפול יש 18 מקרים מתוך 10000. אם נבטא את הסיכון באחוזים, נקבל כי הסיכון עלה מ-0.09% ל-0.18%. הפרש הסיכונים הוא רק 0.09%.

 

רשימה זו היא הרשימה הרביעית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:

הנכם מוזמנים לקרוא:


הערות
  1. במדד זה אדון בהמשך הסדרה []
  2. וזה כאמור לא נכון []

הגלולה למניעת הריון והסיכון למוות עקב פקקת ורידים

מחקר משנת 1995 דיווח כי שימוש בגלולה למניעת הריון הכפיל את הסיכון למוות עקב פקקת ורידים. איזה נתון סטטיסטי דווח כאן?

השאלון מציע ארבע תשובות אפשריות: המצאות (prevalence), סיכון מוחלט (Absolute risk), מדד g של כהן  למדידת גודל האפקט[1], וגם את התשובה הנכונה שהיא הסיכון היחסי (relative risk) המכונה לעיתים בשם יחס הסיכונים (risk ratio).

אסביר תחילה את נושא הסיכונים באמצעות דוגמה[2], ואחר כך אתייחס לנושא הקשר בין הגלולה למניעת הריון לפקקת הורידים.

כשאנחנו מדברים על סיכונים, יש שני מושגי יסוד: הראשון הוא גורם הסיכון: למשל עישון, שימוש בגלולה למניעת הריון או השתתפות בקורס מבוא לסטטיסטיקה. המושג השני הוא התוצא הבריאותי, כגון תחלואה בסרטן, פקקת ורידים או היהפכות לזומבי.

הסיכון המוחלט הוא ההסתברות שהתוצא הבריאותי יארע. בדרך כלל אומדים אותו כפרופורציה באוכלוסייה. נניח לדוגמה כי באוכלוסייה של  10000 אנשים בריאים 20 אנשים הפכו לזומבים. אם נחלק 20 ב-10000 ואחר כך נכפיל במאה נקבל כי הסיכון המוחלט להפיכה לזומבי הוא 0.2%.

לעומת זאת, בקבוצה של 10000 סטודנטים שנחשפו לקורס מבוא לסטטיסטיקה, 40 סטודנטים הפכו לזומבים, וזה סיכון של 0.4%. החשיפה לקורס הכפילה את הסיכון פי 2, מ-0.2% ל-0.4%. אנו אומרים לכן כי הסיכון היחסי הוא 2.

אבל צריך להיזהר מסיכונים יחסיים, כי הם לא משקפים את העלייה בסיכון. בדוגמת הזומבים, הסיכון הוכפל אבל עלה רק ב-0.2%. לא צריך לזלזל, אבל צריך גם לשמור על פרופורציות. לטעמי, דיווח של הפרש הסיכונים מועיל יותר להערכת סיכונים מאשר דיווח על הסיכון היחסי.

מה בקשר לפקקת הורידים?

אזהיר תחילה כי אין להסתמך על הנתונים שאביא כאן כדי לקבל החלטה כזו או אחרת או כדי להמליץ המלצות. יש כאן הערכות שרמת הדיוק שלהן לא ידועה, והנחות שרירותיות שאניח לצורך ההדגמה.

על פי ויקיפדיה, הסיכון המוחלט לפקקת ורידים אצל נשים המשתמשות בגלולה למניעת הריון הוא 60 מקרים ל-100000 שנות חיים, לעומת 30 אצל נשים שלא משתמשות בגלולה.[3] כלומר, הסיכון אכן מוכפל, והסיכון היחסי לתחלואה הוא 2. הסיכון היחסי למוות כנראה דומה, אך לא ברור האם יש הבדל בשיעורי התמותה בין נשים המשתמשות בגלולה ונשים שאינן משתמשות בגלולה. שיעורי התמותה תוך שנה מאירוע הפקקת נעים בין 50% ל-90%, תלוי במקרה הספציפי. על פי מכון קוקריין, יחס הסיכונים גבוה יותר ומגיע במקרים מסויימים עד ל-3.5 – תלוי בהרכב הגלולה ומשך השימוש. בהחלט אין להקל ראש בסיכון הזה, אבל כפי שציינתי קודם, חשוב יותר לדעת את הפרש הסיכונים. אני אשתמש בנתוני ויקיפדיה כדי להדגים זאת.

מה הכוונה ב-100000 שנות חיים? הסיכון משתנה עם רמת החשיפה. אין דין אישה שהשתמשה בגלולה במשך שנתיים כדין אישה שהשתמשה בגלולה 15 שנה. לכן יש לשקלל את נתוני התחלואה במשך השימוש בגלולה. בואו נניח, לצורך הדוגמה בלבד, כי אישה ממוצעת משתמשת בגלולה במשך 20 שנים. לכן מאה אלף שנות חיים שקולות ל-5000 נשים[4]. 30 מקרים מתוך 5000 הם 6 מתוך 1000, כלומר ניתן, תחת ההנחה הנ”ל,[5] כי בקרב נשים שלא משתמשות בגלולה, 6 מתוך כל 1000 יחלו בפקקת העורקים, ובקרב הנשים המשתמשות בגלולה 12 מתוך כל 1000 יחלו. בדוגמה זו, השימוש בגלולה יוסיף עוד 6 נשים חולות לכל 1000. זהו נתון שממחיש את רמת הסיכון: עוד 6 נשים מכל 1000 יחלו, ובסיכוי גבוה גם ימותו, אם ישתמשו בגלולה למניעת הריון במשך 20 שנה. לדעתי מידע זה מאפשר החלטה מושכלת יותר לגבי נטילת הסיכון.

 

רשימה זו היא הרשימה השלישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:


הערות
  1. אין דבר כזה: יש Cohen’s d וגם Hedegs’ g []
  2. לא אתייחס כאן לנושאי ההמצאות וגודל האפקט []
  3. הנתון של 60 מקרים הוא למעשה ממוצע, כיוון שהסיכון משתנה בהתאם לסוג הגלולה והרכבה []
  4. 5000×20=100000 []
  5. שימוש ממוצע של 20 שנה בגלולה []