חיפוש באתר

קישורים

עמודים

קטגוריות

ארכיב עבור 'מה אומרת הסטטיסטיקה'

מהי טעות הדגימה האמיתית בסקרי הבחירות

בסקרי בחירות ודעת קהל נהוג לפרסם את “טעות הדגימה”, ולפעמים אפילו את “טעות הדגימה המירבית”.[1] אבל כאשר מדובר בסקרי מנדטים, הנתון הזה בעייתי.
נניח כי פורסם סקר לפיו מפלגה מסויימת מקבלת 30 מנדטים, וכי מצויין כי טעות הדגימה היא 4.5%. מה משמעות הדבר? 4.5% מ-30 הם 1.35. מה זה אומר? שמספר המנדטים יהיה בין 28.65 ל-31.35? אף אחר לא ידווח בסקר כי הוא חוזה למפלגה הזו 30.68 מנדטים. ומה המשמעות של טעות הדגימה הזו לגבי מפלגה שעל סף אחוז החסימה?

מה יכול להשתבש?

בסקרי מנדטים יש שלוש טעויות שמעניינות אותנו:
סוג הטעות הראשון מתייחס אל ההפרשים בין מספר המנדטים שמפלגה מקבלת בפועל ובין מספר המנדטים שהסקר חוזה כי יקבלו, או באופן יותר מדוייק – ההפרש המקסימלי שמתקבל. כמובן שאם נסתכל על כל ההפרשים של כל המפלגות הם יקזזו זה את זה וסכומם יהיה תמיד 0[2], הנתונים המעניינים הם הערכים המוחלטים של ההפרשים האלה. לדוגמא, אם מפלגה מסויימת מקבל בפועל 10 מנדטים, סקר אחד חוזה לה 12 מנדטים וסקר אחר חוזה לה 8 מנדטים, בשני הסקרים הטעות שווה ל-2.
מה הטעות המירבית האפשרית כאן? התשובה היא 120. ייתכן בהחלט כי על פי סקר מסויים מפלגה מסויימת תקבל 120 מנדטים אך בפועל היא לא תעבור את אחוז החסימה. הסיכוי לכך אפסי, אך עדיין גדול מאפס. זו הסיבה לכך ששמתי קודם את הביטוי “טעות הדגימה המירבית” במרכאות כפולות. אבל מייד נראה כמה מדדים מעניינים שכן יכולים לתת לנו מבט אל רמת הדיוק של הסקר.
סוג הטעות המעניין השני הוא הסיכוי שהסקר יראה כי מפלגה מסויימת עברה את אחוז החסימה למרות שלא עברה אותו בפועל. זה כמובן תלוי במרחק של המפלגה מאחוד החסימה. אחוז החסימה הוא כיום כ-134 אלף קולות. הסיכוי שהסקר יטעה ביחס למפלגה שבפועל קיבלה רק 70 אלף קולות בוודאי נמוך מהרבה מהסיכוי הדומה למפלגה שקיבלה 133 אלף קולות.
סוג הטעות המעניין השלישי הוא הסיכוי שהסקר יראה כי מפלגה מסויימת לא עברה את אחוז החסימה למרות שעברה אותו בפועל. זוהי תמונת המראה של הטעות השניה.
הכל טוב ויפה, אבל איך מחשבים את כל הדברים האלה?

איך אפשר להעריך את גדולי הטעויות?

דרך אפשרית לקבל הערכות לגדלי הטעויות האלה היא לבצע סימולציה. הרעיון מאוד פשוט והוסבר כבר בעבר. מניחים הנחה על התוצאה האמיתית הבחירות. אחר כך לוקחים מדגם ורואים מה קורה. חוזרים על כך הרבה פעמים, ולבסוף ממצעים הכל.
הסימולציה שלי מתייחסת לתוצאות ההיפותטיות הבאות לגבי הבחירות לכנסת ה-22. המספרים כמובן לא אמיתיים. הם מתבססים על תוצאות הבחירות לכנסת ה-21 בתוספת כמה שינויים שהכנסתי כדי להתאים אותם למה שאני רוצה להדגים. הנה טבלת “תוצאות האמת” שלי:

מפלגה מספר הקולות מספר המנדטים
הליכוד 1140370 36
כחול לבן 1125881 35
הרשימה המשותפת 337108 10
ש”ס 258275 8
יהדות התורה 249209 8
ימינה 283910 8
העבודה 190870 6
ישראל ביתנו 173004 5
המחנה הדמוקרטי 135529 4
עוצמה לישראל 133211 0
נועם 75223 0
כל השאר 33333 0
סך הכל 4102590 120

 

בישלתי את המספרים כך שאחוז החסימה עומד על 134417 קולות. עוצמה לישראל נמצאת קצת מתחת לאחוז החסימה, המחנה הדמוקרטי קצת מעליו. המרחק של נועם מאחוז החסימה הוא כ-59 אלף קולות, בדומה למרחק של מפלגת העבודה (54 אלף). המרחק של ישראל ביתנו מאחוז החסימה הוא כ-39 אלף קולות.
עכשיו אני יכול לקחת מדגם, של 500 איש נניח, מתוך האוכלוסייה שמונה כ-4.1 מיליון מצביעים. אני פשוט אבחר באופן מקרי 500 איש מתוכם. המדגם שלי יהיה מושלם: אין הטיה כי לכל האנשים מהאוכלוסייה יש את אותו הסיכוי להיכלל במדגם, ואף אחד לא ישקר לי כאן.

הנה מדגם לדוגמה, וחלוקת המנדטים כפי שחישבתי על פי תוצאותיו:

מפלגה מספר הקולות מספר המנדטים
הליכוד 130 34
כחול לבן 132 34
הרשימה המשותפת 37 9
ש”ס 28 7
יהדות התורה 31 8
ימינה 38 10
העבודה 32 8
ישראל ביתנו 23 6
המחנה הדמוקרטי 17 4
עוצמה לישראל 0 0
נועם 0 0
כל השאר 0 0
סך הכל 500 120

 

אנחנו יכולים לראות למשל שהסקר העניק לליכוד ולכחול לבן 34 מנדטים כל אחת, בעוד שלפי “תוצאות האמת” הן קיבלו 36 מנדטים ו-35 מנדטים בהתאמה. לכן הטעויות לגבי שתי המפלגות האלה שוות ל-1 ו-2. תוכלו לוודא כי הטעות המקסימלית שנצפתה בסקר הזה היא 2, הטעות החציונית היא 1 והטעות הממוצעת היא 0.91. הסקר הזה לא העלה את עוצמה לישראל ונועם אל מעל אחוז החסימה, ולא הוריד אף מפלגה שעברה בפועל את אחוז החסימה אל מתחת לו.
את התרגיל הזה ביצעתי 2000 פעם עבור מדגם בגודל 500, וגם עבור מדגמים בגדלי 1000, 2000, 4000, ו-8000.

תוצאות הסימולציה

תוצאות גדלי הטעות שחושבו בסימולציה מופיעות בטבלה הבאה:

גודל המדגם טעות ממוצעת טעות מקסימלית טעות חציונית
500 1.52 4.58 1.12
1000 1.13 3.82 0.80
2000 0.92 3.42 0.60
4000 0.77 3.18 0.39
8000 0.67 3.06 0.23

 

אנו רואים כי הטעות הממוצעת בסקר בגודל 500 היא כמנדט וחצי, והיא כמובן קטנה ככל שגודל המדגם עולה. הטעות החציונית בסקר כזה היא קצת יותר ממנדט, אבל הטעות המקסימלית היא יותר מ-4.5 מנדטים. זה קורה בגלל המפלגות שקרובות לאחוז החסימה. כשמפלגה שלא עוברת את אחוז החסימה בפועל אבל עוברת אותו במדגם הטעות היא 4 מנדטים, וכך גם במקרה ההפוך.
עד כמה נפוצים המקרים האלה? בדוגמא הזאת זה קורה די הרבה, מכיוון שיש בו שתי מפלגות שקרובות מאוד לאחוז החסימה:

גודל המדגם הועברו בטעות לא עברו בטעות
500 44.8 76.8
1000 44.9 56.2
2000 43.7 51.9
4000 44.5 46.9
8000 42.4 47.3

 

חוץ מהאנומליה של 76.8% למדגם בגודל 500, אנחנו רואים כי בדרך כלל הסיכויים קרובים ל-50%.
ניתן לערוך כמובן ניתוחים יותר מתוחכמים: לחשב סטיות תקן ורווחי סמך, לבדוק מה הסיכויים לטעות במעבר אחוז החסימה עבור גדלים שונים של מפלגות, ועוד. מי שמעוניין מוזמן להוריד את קוד הסימולציה שכתבתי בשפת R ולנסות לשחק עם הנתונים.

סיכום

  • בסקרי מנדטים קטנים, כאשר גודל המדגם הוא 500, ייתכנו טעויות משמעותיות בחיזוי מספר המנדטים האמיתי. הטעות הממוצעת היא כמנדט וחצי, והטעות המקסימלית עaויה להיות גבוהה באופן משמעותי.
  • עבור מפלגות המתנדנדות באיזור אחוז החסימה, גם מדגם גדול הרבה יותר אינו יכול לתת תשובה אמינה לגבי השאלה האם מפלגות אלה יעברו את אחוז החסימה.

 

ראו גם את שאר הרשימות שכתבתי בנושא הסקרים.


הערות
  1. אני שם את הביטויים האלה במרכאות מכיוון שאינם מדוייקים ואף מטעים. אתייחס לכך בפוסט נפרד בעתיד. []
  2. מדוע? []

הקשר בין אכילת בשר ותחלואה בסרטן השד – יחסי סיכונים

דרך מקובלת לבטא אפקט של טיפול או התערבות רפואית היא מה שמכונה “יחס הסיכויים”[1] או באנגלית odds ratio. המונח העברי מופיע במרכאות מכיוון, כפי שאסביר מייד, התרגום הוא לא מדוייק עד לא נכון, תלוי את מי שואלים.

השאלה שנשאלה בשאלון היא מאוד פשוטה. נתונה קובייה הוגנת, כלומר כאשר מטילים אותה לכל התוצאות יש סיכוי שווה להופיע. לכן, מהו ה-odds של הטלת המספר 6?

מי שעוסק בהימורים יבין מייד את התשובה. יש 6 תוצאות אפשריות, לכולן אותו סיכוי. חמש תוצאות אפשריות אינן שוות ל-6, יש רק תוצאה אחת השווה ל-6, לכן ה- odds, היחס בין מספר התוצאות הרצויות לבין מספר התוצאות הלא רצויות הוא 1:5. יחס זה מכונה לעיתים בשם “יחס ההימורים”.

שימו לב ש-1:5 אינו אומר כי ההסתברות להטלת 6 היא חמישית. ההסתברות להטלת 6 היא שישית. המשמעות של היחס  1:5 היא שההסתברות להטלת 6 קטנה פי 5 מההסתברות לא להטיל 6. בנוסף לכך, אם נחלק 1 ל-5 נקבל חמישית. נקבל חמישית גם את נחלק את הסיכוי לקבל 6, שהוא שישית, בסיכוי לא לקבל שש, שהוא חמש שישיות. זה תמיד נכון, ולכן יחס זה הוא יחס בין שני סיכויים.

ה-odds ratio, כפי ששמו מעיד עליו, הוא יחס בין שני odds, ומכיוון שה-odds הוא יחס, הרי שה-odds ratio הוא יחס בין שני יחסים, שכל אחד מהם הוא יחס בין שני סיכויים. לכן הביטוי “יחס הסיכויים” בעייתי בעיניי. לעיתים מכנים אותו בשם “יחס צולב”, ואסביר מדוע בהמשך הפוסט.

הנה דוגמה שתסביר מהו ה-odds ratio, ואת הקשר בינו ובין הסיכון היחסי והסיכון המוחלט.

הדוגמה לקוחה מידיעה שפורסמה באתר Medical News Today, בה נאמר כי הסיכון לחלות בסרטן השד אצל נשים הניזונות מתפריט מוטה בשר אדום גבוה ב-23% מהסיכון של נשים הניזונות מתפריט מוטה בשר עוף.

מדובר במחקר תצפיתי בו התבצע מעקב אחרי 42016 אלף נשים הנמצאות בקבוצת סיכון לתחלואה בסרטן השד – לכל אחת מנשים אלו יש אחות שחלתה כבר בסרטן השד. המחקר עקב אחרי הרגלי האכילה שלהן, כולל אכילת סוגי בשר שונים ובשר מעובד. במשך תקופת המעקב, כשבע וחצי שנים, 1536 נשים אובחנו כחולות בסרטן השד. מדובר באשה אחת מתוך כל 27 בערך[2], סיכון לא מבוטל של כ-3.7%. מהו יחס הסיכונים לתחלואה בסרטן השד שנצפה באוכלוסייה זו במשך תקופת המעקב? 1536 נשים אובחנו כחולות בסרטן השד, 40480 נשים לא אובחנו. יחס הסיכונים הוא לכן 1536 ל-40480, או כ-1 ל-26. שימו לב כי הסיכון שונה מיחס הסיכונים.

החוקרים דיווחו כי הסיכון לתחלואה בקרב נשים שאוכלות בעיקר בשר עוף נמוך לעומת הסיכון בקרב נשים האוכלות בעיקר בשר אדום ב-28%.

למעשה הם ביצעו ניתוח הישרדות ודיווחו כי יחס הסיכונים במובן של Hazard Ratio בין אוכלות העוף ואוכלות הבשר האדום הוא 0.72[3]. נתון זה מתקבל מחישוב המתקנן בתוכו משתנים נוספים, כגון גיל, BMI, עישון ומוצא אתני, וכמובן משך הזמן שעבר מתחילת המעקב ועד האבחון.

אבל (על פי החישובים שאפרט בהמשך):

יחס הסיכונים הוא 0.8 לומר הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר עוף נמוך רק ב-20% מהסיכון עבור נשים הניזונות מתפריט מוטה בשר אדום.

הפרש הסיכונים הוא 0.6% בלבד. הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר אדום הוא 3.1% ועבור אלה הניזונות מתפריט מוטה בשר עוף הוא 2.5%.[4]

התובנה שלי: נתוני ה-odds ratio הם בעייתיים, ואין להם פירוש משמעותי ברור. הנתונים של הסיכון היחסי והפרש הסיכונים נותנים תובנה הרבה יותר טובה באשר לגורמי הסיכון.

למי שמעוניין בכל החישובים: עיון יותר מעמיק בנתונים מעלה כי הנתון המתוקנן של  0.72 נגזר מהנתונים הבאים (קישור לקובץ וורד).

מתוך כ-10500 נשים (כרבע מהאוכלוסייה) שאכלו בעיקר בשר אדום, היו 329 מקרי סרטן, ומתוך כ-10500 נשים שאכלו בעיקר בשר עוף היו 258 מקרים.

נסדר את כל הנתונים בטבלה יפה:

תחלואה בסרטן השד
הטיית התפריט כן לא סך הכל
בשר עוף 258 10242 10500
בשר אדום 329 10171 10500
סך הכל 587 20413 21000

 

מה אנחנו יכולים ללמוד מהמספרים האלה?

ה-odds, יחס הסיכונים לחלות בסרטן השד עבור נשים שאוכלות בעיקר בשר עוף הוא 258 ל-10242. עבור נשים שאוכלות בעיקר בשר בקר יחס הסיכונים הוא 329 ל-10171. נחלק את היחסים ונקבל כי היחס בין היחסים הוא 0.78:

 

 

 

תוצאה זו שונה מעט מהתוצאה שדווחה מכיוון שכאמור החוקרים ביצעו תקנונים שאנחנו לא ביצענו.

אבל שימו לב לחישוב: למעשה הכפלנו את שני המספרים שבאלכסון הראשי של הטבלה וחילקנו אותם במכפלת המספרים שבאלכסון המשני של הטבלה. ציירנו מין צלב כזה על הטבלה, ולכן יחס הסיכונים, ה-odds ratio נקרא לפעמים בשם יחס צולב.

 

.רשימה זו היא הרשימה החמישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:

 

 


הערות
  1. ולפעמים – יחס הסיכונים – תלוי בהקשר []
  2. למי שישאל איך קיבלו 1 ל-27 כאשר הנתון שכולם מכירים הוא 1 מתוך 9: הנתון של 1 מתוך 9 מתייחס לסיכון של אישה לחלות בסרטן השד במהלך חייה. תוחלת החיים של אישה ברוב העולם המערבי היא כשמונים שנה. הנתון של 1 מתוך 27 מתייחס אמנם לנשים בסיכון, אך במשך תקופת זמן קצרה בהרבה – רק כשבע וחצי שנים. []
  3. ראו את הרשימה “איך יודעים כמה אנשים מתים מנזקי העישון” להסבר קצת יותר רחב על המושג של ה- Hazard []
  4. שאלה מעניינת: אם אחוז התחלואה הכולל הוא 3.7%, אך התחלואה בעל אחת משתי הקבוצות האלה לחוד נמוכה מ-3.7%? []

הקשר בין טיפול הורמוני חליפי והתפתחות קרישי דם

בתחילת 2019, פורסמה ידיעה בעיתון דיילי מייל לפיה כי טיפול הורמונלי חליפי (Hormone Replacement Therapy) בזמן המנאופוזה מכפיל את הסיכון לקרישי דם מסוכנים, כלשון הכותרת..

בניגוד למה שקורה בדרך כלל, הידיעה ציטטה גם את הנתון הבאשמסרו החוקרים מאוניבריטת נוטינגהאם: “על כל 10000 נשים המקבלות טיפול החלפת הורמונים, יש רק 9 מקרים נוספים של קרישי דם מדי שנה”. זוהי פיסת מידע חשובה. מהו בעצם הנתון הזה?

אני אתעלם מהתשובות הלא נכונות שהוצעו (שינוי באחוזים, מספר החולים שיש לטפל בהם,[1] וקצב קפלן-מאייר) ואעבור מייד להסבר.

הנתון שדווח הוא הגידול המוחלט בסיכון.

לפני שנגיע לדיון, קצת פרופורציות: לפי הכותרת, הסיכון להתפתחות קרישי דם בקרב נשים המקבלות טיפול הורמונלי גבוה פי שניים מהסיכון אצל נשים שלא מקבלות טיפול כזה. זה לא ממש מדוייק. קריאה זהירה במאמר שפורסם ב-BMJ מעלה כי הנתונים שמדווחים אינם סיכונים יחסיים אלא יחסי סיכונים (odds ratios).  אני אדון ביחסי הסיכונים בהמשך הסדרה. כמו כן, יחסי הסיכונים משתנים על פי סוג הטיפול ודרך המתן. מדווחות תוצאות שונות לגבי סוגים שונים של טיפולים הורמונליים, ואכן עבור אחד מהם יחס הסיכונים נאמד כ-2.1, ולטיפולים אחרים היו יחסי סיכונים נמוכים יותר. עבור אחד הטיפולים המקובלים יחס הסיכונים היה נמוך באופן משמעותי מ-1, כלומר לטיפול הספציפי הזה היה אפקט מונע נגד הופעת קרישי דם. יחס הסיכונים המשוקלל על פני כל סוגי הטיפולים היה 1.6 בערך. עד כאן בנוגע לפערים בין כותרות זורעות בהלה ובין המציאות.

מה המשמעות של הגידול המוחלט בסיכון? נניח שאצל כל 10000 נשים שאינן מקבלות טיפול הורמונלי, יש מקרה אחד של היווצרות קרישי דם בכל שנה. הסיכון המוחלט הוא לכן 1 מתוך 10000, (או 0.01%, למי שאוהב אחוזים). לפי דברי החוקרים, עקב הטיפול ההורמונלי יש 9 מקרים נופים בשנה. כלומר, עוד 9 נשים מתוך 10000 יפתחו קרישי דם עקב הטיפול. באחוזים, ובסך הכל יהיו 10 נשים מתוך 10000 שיפתחו קרשי דם.

מה אם ההנחה הראשונה שלנו לא נכונה, ולמעשה מבין במקום אישה אחת, מבין כל 10000 נשים שאינן מקבלות טיפול הורמונלי, קרישי דם מתפתחים אצל 9 נשים? זה לא משנה – הנתון שנמסר עדיין אומרי כי יהיו 9 מקרים נוספים, ובסך הכל 18 במקום 9.

למעשה, אם נפרש את הכותרת של הדיילי מייל כמדווחת על סיכון יחסי, ונניח כי הנתון של תוספת 9 מקרים הוא נתון המשקלל את כל סוגי הטיפולים, נוכל לעשות חישוב לאחור. תוספת של 9 מקרים פירושה הכפלת הסיכון[2], כלומר ללא טיפול יש 9 מקרים ועם טיפול יש 18 מקרים מתוך 10000. אם נבטא את הסיכון באחוזים, נקבל כי הסיכון עלה מ-0.09% ל-0.18%. הפרש הסיכונים הוא רק 0.09%.

 

רשימה זו היא הרשימה הרביעית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:

הנכם מוזמנים לקרוא:


הערות
  1. במדד זה אדון בהמשך הסדרה []
  2. וזה כאמור לא נכון []

הגלולה למניעת הריון והסיכון למוות עקב פקקת ורידים

מחקר משנת 1995 דיווח כי שימוש בגלולה למניעת הריון הכפיל את הסיכון למוות עקב פקקת ורידים. איזה נתון סטטיסטי דווח כאן?

השאלון מציע ארבע תשובות אפשריות: המצאות (prevalence), סיכון מוחלט (Absolute risk), מדד g של כהן  למדידת גודל האפקט[1], וגם את התשובה הנכונה שהיא הסיכון היחסי (relative risk) המכונה לעיתים בשם יחס הסיכונים (risk ratio).

אסביר תחילה את נושא הסיכונים באמצעות דוגמה[2], ואחר כך אתייחס לנושא הקשר בין הגלולה למניעת הריון לפקקת הורידים.

כשאנחנו מדברים על סיכונים, יש שני מושגי יסוד: הראשון הוא גורם הסיכון: למשל עישון, שימוש בגלולה למניעת הריון או השתתפות בקורס מבוא לסטטיסטיקה. המושג השני הוא התוצא הבריאותי, כגון תחלואה בסרטן, פקקת ורידים או היהפכות לזומבי.

הסיכון המוחלט הוא ההסתברות שהתוצא הבריאותי יארע. בדרך כלל אומדים אותו כפרופורציה באוכלוסייה. נניח לדוגמה כי באוכלוסייה של  10000 אנשים בריאים 20 אנשים הפכו לזומבים. אם נחלק 20 ב-10000 ואחר כך נכפיל במאה נקבל כי הסיכון המוחלט להפיכה לזומבי הוא 0.2%.

לעומת זאת, בקבוצה של 10000 סטודנטים שנחשפו לקורס מבוא לסטטיסטיקה, 40 סטודנטים הפכו לזומבים, וזה סיכון של 0.4%. החשיפה לקורס הכפילה את הסיכון פי 2, מ-0.2% ל-0.4%. אנו אומרים לכן כי הסיכון היחסי הוא 2.

אבל צריך להיזהר מסיכונים יחסיים, כי הם לא משקפים את העלייה בסיכון. בדוגמת הזומבים, הסיכון הוכפל אבל עלה רק ב-0.2%. לא צריך לזלזל, אבל צריך גם לשמור על פרופורציות. לטעמי, דיווח של הפרש הסיכונים מועיל יותר להערכת סיכונים מאשר דיווח על הסיכון היחסי.

מה בקשר לפקקת הורידים?

אזהיר תחילה כי אין להסתמך על הנתונים שאביא כאן כדי לקבל החלטה כזו או אחרת או כדי להמליץ המלצות. יש כאן הערכות שרמת הדיוק שלהן לא ידועה, והנחות שרירותיות שאניח לצורך ההדגמה.

על פי ויקיפדיה, הסיכון המוחלט לפקקת ורידים אצל נשים המשתמשות בגלולה למניעת הריון הוא 60 מקרים ל-100000 שנות חיים, לעומת 30 אצל נשים שלא משתמשות בגלולה.[3] כלומר, הסיכון אכן מוכפל, והסיכון היחסי לתחלואה הוא 2. הסיכון היחסי למוות כנראה דומה, אך לא ברור האם יש הבדל בשיעורי התמותה בין נשים המשתמשות בגלולה ונשים שאינן משתמשות בגלולה. שיעורי התמותה תוך שנה מאירוע הפקקת נעים בין 50% ל-90%, תלוי במקרה הספציפי. על פי מכון קוקריין, יחס הסיכונים גבוה יותר ומגיע במקרים מסויימים עד ל-3.5 – תלוי בהרכב הגלולה ומשך השימוש. בהחלט אין להקל ראש בסיכון הזה, אבל כפי שציינתי קודם, חשוב יותר לדעת את הפרש הסיכונים. אני אשתמש בנתוני ויקיפדיה כדי להדגים זאת.

מה הכוונה ב-100000 שנות חיים? הסיכון משתנה עם רמת החשיפה. אין דין אישה שהשתמשה בגלולה במשך שנתיים כדין אישה שהשתמשה בגלולה 15 שנה. לכן יש לשקלל את נתוני התחלואה במשך השימוש בגלולה. בואו נניח, לצורך הדוגמה בלבד, כי אישה ממוצעת משתמשת בגלולה במשך 20 שנים. לכן מאה אלף שנות חיים שקולות ל-5000 נשים[4]. 30 מקרים מתוך 5000 הם 6 מתוך 1000, כלומר ניתן, תחת ההנחה הנ”ל,[5] כי בקרב נשים שלא משתמשות בגלולה, 6 מתוך כל 1000 יחלו בפקקת העורקים, ובקרב הנשים המשתמשות בגלולה 12 מתוך כל 1000 יחלו. בדוגמה זו, השימוש בגלולה יוסיף עוד 6 נשים חולות לכל 1000. זהו נתון שממחיש את רמת הסיכון: עוד 6 נשים מכל 1000 יחלו, ובסיכוי גבוה גם ימותו, אם ישתמשו בגלולה למניעת הריון במשך 20 שנה. לדעתי מידע זה מאפשר החלטה מושכלת יותר לגבי נטילת הסיכון.

 

רשימה זו היא הרשימה השלישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:


הערות
  1. אין דבר כזה: יש Cohen’s d וגם Hedegs’ g []
  2. לא אתייחס כאן לנושאי ההמצאות וגודל האפקט []
  3. הנתון של 60 מקרים הוא למעשה ממוצע, כיוון שהסיכון משתנה בהתאם לסוג הגלולה והרכבה []
  4. 5000×20=100000 []
  5. שימוש ממוצע של 20 שנה בגלולה []

כמה חיים מצילה הבדיקה לגילוי מוקדם של סרטן הערמונית?

פציינט שואל את הרופא שלו האם כדאי לו לעבור בדיקת PSA  לגילוי מוקדם של סרטן הערמונית. מהו הנתון שהרופא צריך להציג לחולה כדי שיוכל לקבל החלטה מושכלת?

מוצעות ארבע תשובות אפשרויות.

התשובה האפשרית הראשונה היא כי על הרופא להציג את מספר מקרי הסרטן באוכלוסיית חולים שעברו בדיקה לגילוי מוקדם, ומספר מקרי הסרטן באוכלוסיית של חולים שלא עברו בדיקה לגילוי מוקדם. יש שתי סיבות לכך שההצעה הזו לא נכונה. ראשית, אני מקווה שמובן מאליו כי יש להציג מספרים מתוקננים לגודל האוכלוסייה. הסיבה השנייה גם היא ברורה מאליה, לדעתי: מספר מקרי הסרטן אינו מושפע מעצם קיום או אי קיום בדיקות לגילוי מוקדם.

תשובה אפשרית נוספת מוצעת היא כי על הרופא להציג את שיעור/אחוז השורדים כעבור חמש שנים מעת גילוי המחלה עבור חולים שעברו בדיקה לגילוי מוקדם ועבור אלה שלא עברו בדיקה כזו. ההסבר המפורט לכך שהשוואה זו הינה חסרת משמעות הופיע בפוסט קודם. בקצרה: אצל חולים שלא עברו בדיקה לגילוי מוקדם עבר זמן רב יותר מאז הופעת המחלה בהשוואה לאלה שכן עברו בדיקה לגילוי מוקדם, ולכן בסיס ההשוואה אינו זהה בין שתי הקבוצות.

הצעה נוספת היא להציג בפני הפציינט את ההסתברות כי הנבדק אכן חולה בסרטן הערמונית בהינתן כי תוצאת הבדיקה חיובית.[1] בהצעה זו יש שתי בעיות. ראשית, האומדנים להסתברויות מסוג זה הינם מאוד לא מדוייקים. יש צורך לדעת כמה מבין התוצאות החיוביות הינן חיוביות אמיתיות (כלומר, הבדיקה זיהתה מחלה והנבדק אכן חולה) וכמה הן חיוביות שגויות (כלומר, הבדיקה זיהתה מחלה והנבדק אינו חולה). בפועל, ברוב מוחלט של המקרים בהם תוצאת הבדיקה חיובית מבוצעת פרוצדורה רפואית, ולכן אי אפשר לדעת אם התוצאה שגויה או לא – כדי לדעת זאת צריך לא לטפל בנבדק ולראות מה יקרה לו, וזה כמובן לא קביל.

שנית: ההסתברות הזאת לא אומרת דבר על סיכויי ההישרדות/החלמה אם הפציינט אכן חולה. היא רק מעידה על רמת הדיוק של הבדיקה.

הנתון שיאפשר לחולה לקבל החלטה הוא שיעורי התמותה בקרב חולים שעברו בדיקה לגילוי מוקדם ובקרב אלה שלא עברו בדיקה כזו, כאשר שתי האוכלוסיות הן בנות השוואה (comparable), למשל: גברים שעברו בדיקה לגילוי מוקדם בגיל 50 לעומת גברים בני 50 שלא עברו בדיקה כזו. אם הבדיקה אכן מצילה חיים, נצפה לפחות מקרי מוות עקב סרטן הערמונית בקבוצה הראשונה.

 

רשימה זו היא הרשימה השניה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על השאלון של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג’.

ראו גם:


הערות
  1. נתון זה נקרא ערך הניבוי החיובי של הבדיקה ונדון בו ביתר פירוט בהמשך הסדרה []