נסיכת המדעים

ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד

אשה בת 50 עברה בדיקת לגילוי מוקדם של , והתקבלה תוצאה חיובית. (( התוצאה חיובית אך המשמעות לנבדקת היא שלילית מאוד )) עם זאת, החולה והרופאה יודעות כי הבדיקה אינה מדוייקת ב-100% ותיתכן תוצאה שגויה.

השאלון שואל איזו פרופורציה של נשים שתוצאת הממוגרפיה שלהן חיובית אכן חולות בסרטן השד, וזאת על פי נתוני ה-NHS, שירותי הבריאות הלאומיים של בריטניה. את התשובה קל למצוא בגוגל: בערך אחת מכל ארבע נשים בגילאי 50 עד 70 שנקראות לבירור נוסף עקב תוצאה שאינה שלילית באופן חד משמעי, אחת אכן חולה בסרטן השד. נתון זה נקרא של הבדיקה. פורמלית, נאמר כי ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד בקרב נשים בגילאי 50 עד 70 הוא 25%. (אני מציע שתעצרו רגע לחשוב האם ערך הניבוי החיובי של 25% הוא סביר בעיניכם. אין תשובה אובייקטיבית לשאלה הזו.)

מכאן שאם תוצאת הבדיקה חיובית, עדיין יש סיכוי של 75% בערך שהנבדקת אינה חולה. כלומר: מתוך כל ארבע נשים בגילאי 50 עד 70 שתוצאת הממוגרפיה שלהן חיובית, שלוש אינן חולות.

לנשים צעירות יותר, ערך הניבוי החיובי נמוך יותר, ולכן ארגוני הבריאות לא ממליצים לנשים מתחת לגיל 50 שאינן נמצאות בקבוצת סיכון לעבור בדיקת ממוגרפיה.

שתי הפסקאות האחרונות עשויות לעורר בכן תמיהה, ובצדק. בדיקת הממוגרפיה היא אותה בדיקה, לא משנה מה גיל האישה שעברה את הבדיקה. אז למה ערך הניבוי החיובי משתנה עם הגיל?

כדי להבין זאת דרוש תחילה הסבר קצר על בניית כלים דיאגנוסטיים כגון בדיקת ממוגרפיה לגילוי מוקדם של סרן השד, או כל בדיקה אחרת.

כאשר מפתחים בדיקה כזו, מסתמכים על נתונים אמיתיים, שבהם אנחנו יודעים גם את תוצאת הבדיקה: חיובית או שלילית, וגם את המצב האמיתי של הנבדק: חולה או בריא. למעשה, הקריטריון לפיו קובעים האם תוצאת הבדיקה חיובית או שלילית נקבע בדרך כלל על סמך המצב הרפואי של הנבדק ותוצאת הבדיקה. כך למשל, אם עורכים בדיקת דם יכולים לקבל טווח של ערכים, ואז קובעים איזשהו קו מפריד כך שהערכים הגבוהים מהקו נחשבים לחיוביים ואלה שמתחת לקו נחשבים שליליים (או להיפך) ((כיצד קובעים את ערך הקו המפריד? זה נושא לרשימה אחרת)) . בבדיקות ממוגרפיה זה קצת יותר מסובך כי אין תוצאה מספרית, אבל העיקרון דומה.

לאחר שנקבע הקריטריון לפיו מחליטים האם תוצאת הבדיקה חיובית או שלילית, ניתן לחשב כל מיני מדדים המאפיינים את הבדיקה. שני מדדים נפוצים הם (specificity) (sensitivity) של הבדיקה, והם, כאמור, מאפיינים של הבדיקה עצמה.

ערך הניבוי החיובי של הבדיקה נקבע על פי שלושה ערכים. שניים מהם הם הסגוליות והרגישות. הערך השלישי הוא (prevalence) של המחלה, כלומר עד כמה המחלה שכיחה באוכלוסייה הנבדקת. (( למי שמעוניין בנוסחה – הנה קישור )) . עם קצת אלגברה אפשר לראות כי ככל שהמחלה נפוצה יותר באוכלוסייה, כך ערך הניבוי החיובי של הבדיקה עולה.

מכאן ברור הקשר בין ערך הניבוי החיובי של בדיקת הממוגרפיה ובין הגיל של הנבדקת. בקבוצת האוכלוסייה של נשים צעירות, מתחת לגיל חמישים לצורך הדיון, מחלת סרטן השד נפוצה פחות, ולכן ערך הניבוי החיובי נמוך יותר עבור נשים צעירות יותר. מסיבה זו (ומסיבות נוספות) ארגוני הבריאות לא ממליצים על בדיקת ממוגרפיה לנשים מתחת לגיל 50 שאינן בקבוצת סיכון.

רשימה זו היא הרשימה השמינית והאחרונה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 15 באוקטובר, 2019 נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: 5 | טראקבק

מה מספר הכדורים האדומים בכד? – אמידת נראות מירבית

בכד יש 90 כדורים, חלקם אדומים וחלקם לבנים. נאמר לכם כי מספר הכדורים האדומים הוא 45 או 60 (אין אפשרות אחרת).

אתם מוציאים מהכד 300 כדורים עם החזרה, כלומר: מערבבים היטב את תכולת הכד, מוציאים כדור, רושמים את צבעו, ומחזירים אותו לכד. אחר כך מערבבים שוב את תכולת הכד, מוציאים שוב כדור, רושמים את צבעו ומחזירים אותו לכד, כך 300 פעמים.

בסך בכל הוצאתם 175 כדורים אדומים מתוך 300. מהי ההערכה שלכם לגבי מספר הכדורים האדומים בכד?

הנה התשובות שקיבלתי לחידה הזו בטוויטר:

בואו נעשה קצת סדר.

ראשית, לגבי הבקשה להעריך את מספר הכדורים האדומים בכד: בשפה יותר "סטטיסטית", הבקשה היא לאמוד את מספר הכדורים האדומים בכד, ולכן אשתמש מעתה בביטויים כגון "לאמוד" ו-"אומדן".

אם בכד יש 45 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 45 מתוך 90, כלומר חצי. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, מחציתם היו אדומים, כלומר הייתם שולפים 150 כדורים אדומים.

באופן דומה, אם בכד יש 60 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 60 מתוך 90, כלומר שני שליש. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, שני שליש מתוכם היו אדומים, כלומר הייתם שולפים 200 כדורים אדומים.

כאן אתם יכולים כבר להבין למה הנתון שנתתי לכם הוא שהוצאו 175 כדורים אדומים: 175 הוא הממוצע של 150 ו-200, כלומר אתם נמצאים באמצע הדרך בין שני העולמות המושלמים ההיפותטיים. או שלא?

בקשה שקולה לבקשה שלי היא לאמוד את ההסתברות להוציא כדור אדום מהכד: האם ההסתברות הזו היא חצי או שני שליש. אם לא הייתי אומר לכם מראש שההסתברות הזו חייבת להיות חצי או שני שליש, הייתם בוודאי אומרים כי ההסתברות היא 175 מתוך 300, כלומר 0.5833. בסוף הפוסט הזה אסביר מדוע.

אחת הדרכים האפשריות לאמוד את מספר הכדורים האדומים בכד, או באופן שקול, לאמוד את ההסתברות להוציא כדור אדום מהכד היא להניח שאם ראינו משהו, זה אומר שההסתברות שנראה את אותו משהו גבוהה. העיקרון הזה נקרא . (( זו לא הגישה האפשרית היחידה. יש עוד גישות אפשריות, וייתכן ואדון בהן בפעם אחרת))

נדגים את העיקרון בעזרת דוגמא יותר קיצונית. נניח ששלפתם 300 כדורים מהכד וכל הכדורים שנשלפו היו אדומים. אם בכד היו 45 כדורים אדומים, אז ההסתברות למאורע הזה היא חצי בחזקת 300. אם בכד היו 60 כדורים אדומים, ההסתברות לשלוף 300 כדורים אדומים היא שני שליש בחזקת 300. לא צריך לדעת הרבה מתמטיקה כדי לדעת שחצי בחזקת 300 הרבה יותר קטן משני שליש בחזקת 300. לכן, אם הוצאתם 300 כדורים אדומים, האפשרות הסבירה יותר היא שיש בכד 60 כדורים אדומים, וזה יהיה האומדן שלכם למספר הכדורים האדומים בכד.

ההמשך ברור: יש לחשב את ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 45 כדורים אדומים, ואת ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 60 כדורים אדומים. אם ההסתברות הראשונה יותר גבוהה, אז האומדן שלכם יהיה 45. אם ההסתברות השנייה תהיה יותר גבוהה, אז האומדן שלכם למספר הכדורים האדומים יהיה 60.

את שתי ההסתברויות האלה אפשר לחשב על ידי נוסחת . אל תטרחו לנסות. רוב הסיכויים הם שהמחשב שלכם לא יצליח לחשב את ההסתברויות האלה באופן מדוייק. אפשרות שניה היא לנסות לחשב את ההסתברויות האלה על ידי להתפלגות הבינומית. הסברתי זאת בעבר כאן בבלוג, ראו למשל את הדוגמה הזו לחיזוי מספר הזוכים בלוטו.

אבל הדרך הכי קלה ומהירה היא לחשב את היחס בין שתי ההסתברויות (( אני מדלג על החישובים כי זה לא החלק החשוב כאן. למי שמעוניין, החישובים נמצאים כאן )). מספרים שצריך לחשב בדרך, כמו 300 עצרת (מספר בן 615 ספרות) יצטמצמו, ולבסוף תקבלו כי ההסתברות להוציא 175 כדורים אדומים כאשר יש בכד 45 כדורים אדומים גדולה פי 1.4 מההסתברות להוציא להוציא 175 כדורים אדומים כאשר יש בכד 60 כדורים אדומים. לכן האומדן שלי למספר הכדורים האדומים בכד הוא 45.

אומדן זה הוא . הגעתי אליו על ידי כך שחישבתי את ההסתברות לקבל 175 כדורים אדומים בשני המצבים האפשריים, ובחרתי במצב שבו ההסתברות להוציא 175 כדורים אדומים הייתה גבוהה יותר.

מה היה קורה אילו לא אמרתי לכם כי מספר הכדורים בכד הוא בהכרח 45 או 60?

אין בעיה: פשוט צריך לחשב את כל ההסתברויות האפשריות לכל המקרים, החל מ-0 כדורים אדומים ועד ל-90 כדורים אדומים. בסך הכל מדובר כאן ב-91 חישובים, ואז למצוא את הערך שעבורו מתקבלת ההסתברות המקסימלית. אם תעשו את החישובים תמצאו כי הערך הזה הוא 59.

אבל יש דרך יותר קלה. אפשר לכתוב את ההסתברות להוציא 175 כדורים אדומים כפונקציה של ההסתברות להוציא כדור אדום אחד מהכד בשליפה בודדת. בעזרת קצת אפשר למצוא את הערך שיביא את ההסתברות הזו למקסימום, וזה יהיה אמדן הנראות המירבית להסתברות להוציא כדור אדום מהכד.

שיטת האמידה על ידי נראות מקסימלית היא אחת משיטות האמידה החשובות ביותר בסטטיסטיקה. זאת מכיוון שלאמדי נראות מקסימלית יש תכונות מתמטיות העושות אותם לעדיפים במספר מובנים על פני אמדים אחרים. לכן השימוש בשיטה הזו נפוץ מאוד, וכל תכנה סטטיסטית מאפשרת את החישוב שלהם עבור כמעט כל מודל סטטיסטי.

נשלח: 7 באוקטובר, 2019 נושאים: מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

יעילות טיפול חדש לאוסטאורופוזיס

נניח כי זה עתה אושר טיפול חדש . נתוני הניסויים הקליניים מראים כי 10% מהחולים שלא טופלו סבלו במהלך 3 שנות מעקב, בעוד שבקבוצה דומה של חולים שטופלו בקביעות בטיפול החדש, רק 5% סבלו משבר כזה.

בכמה חולים צריך לטפל בטיפול החדש כדי למנוע שבר אחד?

מתוך 100 חולים לא מטופלים, אנחנו מצפים כי 10 חולים יסבלו משבר. אם נטפל ב-100 חולים, יהיו בממוצע רק 5 חולים שיסבלו משבר. לכן טיפול ב-100 חולים מונעים 5 שברים, ומכאן שכדי למנוע שבר אחד יש צורך לטפל ב-20 חולים.

מדד זה ידוע בשם NNT: ראשי תיבות של Number needed to Treat. ככל שערכו נמוך יותר כך הטיפול יעיל ביותר. הערך הטוב ביותר הוא 1: טיפול כזה ימנע את השבר אצל כל החולים במשך שלוש שנים.

נשווה מדד זה למדדים אחרים. נסדר את הנתונים ההיפותטיים בטבלה:

	שבר
טיפול חדש	כן	לא	סך הכל
כן	5	95	100
לא	10	90	100
סך הכל	587	20413	200

היעילות היחסית של הטיפול (( בדומה לסיכון יחסי של גורם סיכון )) היא 50%, מכיוון שהסיכון לשבר הופחת מ-10 מתוך 100 (10%) ל-5 מתוך 100 (50%).
היעילות המוחלטת של הטיפול היא 5%: זהו ההפרש בין 10% ו-5%. שימו לב כי ה-NNT שווה ל-1 חלקי היעילות המוחלטת.
יחס הסיכויים הוא 0.47. הערך של יחס הסיכויים נמוך מ-1 וזה מציין כי הטיפול החדש עדיף על הטיפול הישן (( כאן מדברים על "יחס סיכויים" ולא על "יחס סיכונים" כדי לציין שמדובר בתוצאה חיובית. מבחינה מתמטית אין הבדל, כמובן. ))

בדוגמא זו, היעילות היחסית ויחס הסיכויים קרובים זה לזה בערכם, וזאת מכיוון שמספר הסובלים משבר בשתי הקבוצות דומה (90 מול 95), אולם כפי שכבר ראינו, לא תמיד זה המקרה.

רשימה זו היא הרשימה השביעית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

הנכם מוזמנים לקרוא:

נשלח: 2 באוקטובר, 2019 נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

מה הסיכון באכילת בשר מעובד?

בשנת 2014, המכון הבינלאומי לחקר הסרטן הודיע כי כל סוגי הבשר המעובד, ובכלל זה בייקון, סווגו כגורמי סרטן בדרגה 1. סיווג זה מתייחס לרמת העדויות המחקריות הקיימות המעידות על הקשר בין אכילת בשר מעובד ותחלואה בסרטן, אולם לא על רמת הסיכון. נוסף לכך נמסר כי אכילת בשר מעובד באופן קבוע מגדילה את הסיכון לחלות ב-18%. אני ממליץ לכם לקרוא את דף המידע של האיגוד האמריקני לחקר הסרטן בנושא. הנתון של 18% נשמע מפחיד, לא?

כמו כן, ידוע כי בבריטניה הסיכון הכללי לחלות בסרטן המעי הגס במהלך החיים הוא בערך 6% לנשים ו-7% לגברים. המשמעות היא כי מתוך כל 100 נשים אנו מצפים כי כשש נשים יאובחנו כחולות בסרטן המעי גס בשלב כלשהו של מהלך חייהן. מתוך 100 נשים האוכלות בקביעות בשר מעובד, לאיזה מספר של אבחונים נצפה?

החשבון הוא פשוט: 18% מתוך 6 הם 1.08 (( החישוב הוא: 6×18/100 )) , ולכן מתוך כל 100 נשים האוכלות בשר מעובד נצפה לבערך מקרה נוסף של סרטן המעי הגס, כלומר 7 מתוך מאה במקום 6. הסיכון המוחלט הוא בערך אחוז אחד. לא סיכון שניתן לזלזל בו, אבל הוא הרבה פחות מפחיד מ-18%.

במילים אחרות:

אם את אישה, ואוכלת כל יום 100 גרם בייקון או בשר מעובד אחר במשך כל ימי חייך, הסיכון שלך לחלות בסרטן המעי הגס יהיה בערך 7%, לעומת סיכון של 6% לו היית נמנעת כלל מאכילת בשר מעובד. הפרש הסיכונים הוא בערך 1%.

אם אתה גבר ואוכל מדי יום 100 גרם בייקון או בשר מעובד אחר במשך כל ימי חייך, הסיכון שלך לחלות בסרטן המעי הגס יהיה בערך 9.4%, לעומת סיכון של 8% לו היית נמנע כלל מאכילת בשר מעובד. הפרש הסיכונים הוא בערך 1.4%.

אל תבינו אותי לא נכון: אני לא מזלזל בסיכון המוגדל לתחלואה בסרטן המעי הגס. עליה בסיכון מ-6% ל-7% או מ-8% ל-9.4% היא משמעותית. האיגוד האמריקני לחקר הסרטן אכן ממליץ להפחית את הצריכה של בשר מעובד. עם זאת, הם לא ממליצים להפחית את צריכת הבשר באופן כללי. לא נמצא קשר בין אכילת בשר לא מעובד לבין תחלואה בסרטן, ולאכילת בשר יש גם יתרונות בריאותיים מסויימים. אבל חשוב להבין באילו תנאים העלייה הזו מתרחשת ומה סדר הגודל שלה. הנתון של 18% זורע היסטריה מיותרת, לדעתי.

ועוד הערה: יש הטוענים כי יש להפסיק כלל צריכת בשר מטעמים מוסריים. אני מכבד את כל מי שחושב כך, אבל כאן לא המקום לעריכת הדיון הזה. תגובות ברוח זו יימחקו.

בתיאבון.

רשימה זו היא הרשימה השישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

רשימות נוספות בסידרה:

נשלח: 20 בספטמבר, 2019 נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

מהי טעות הדגימה האמיתית בסקרי הבחירות

בסקרי בחירות ודעת קהל נהוג לפרסם את "טעות הדגימה", ולפעמים אפילו את "טעות הדגימה המירבית". (( אני שם את הביטויים האלה במרכאות מכיוון שאינם מדוייקים ואף מטעים. אתייחס לכך בפוסט נפרד בעתיד. )) אבל כאשר מדובר בסקרי מנדטים, הנתון הזה בעייתי.
נניח כי פורסם סקר לפיו מפלגה מסויימת מקבלת 30 מנדטים, וכי מצויין כי טעות הדגימה היא 4.5%. מה משמעות הדבר? 4.5% מ-30 הם 1.35. מה זה אומר? שמספר המנדטים יהיה בין 28.65 ל-31.35? אף אחר לא ידווח בסקר כי הוא חוזה למפלגה הזו 30.68 מנדטים. ומה המשמעות של טעות הדגימה הזו לגבי מפלגה שעל סף אחוז החסימה?

מה יכול להשתבש?

בסקרי מנדטים יש שלוש טעויות שמעניינות אותנו:
סוג הטעות הראשון מתייחס אל ההפרשים בין מספר המנדטים שמפלגה מקבלת בפועל ובין מספר המנדטים שהסקר חוזה כי יקבלו, או באופן יותר מדוייק – ההפרש המקסימלי שמתקבל. כמובן שאם נסתכל על כל ההפרשים של כל המפלגות הם יקזזו זה את זה וסכומם יהיה תמיד 0 ((מדוע?)), הנתונים המעניינים הם הערכים המוחלטים של ההפרשים האלה. לדוגמא, אם מפלגה מסויימת מקבל בפועל 10 מנדטים, סקר אחד חוזה לה 12 מנדטים וסקר אחר חוזה לה 8 מנדטים, בשני הסקרים הטעות שווה ל-2.
מה הטעות המירבית האפשרית כאן? התשובה היא 120. ייתכן בהחלט כי על פי סקר מסויים מפלגה מסויימת תקבל 120 מנדטים אך בפועל היא לא תעבור את אחוז החסימה. הסיכוי לכך אפסי, אך עדיין גדול מאפס. זו הסיבה לכך ששמתי קודם את הביטוי "טעות הדגימה המירבית" במרכאות כפולות. אבל מייד נראה כמה מדדים מעניינים שכן יכולים לתת לנו מבט אל רמת הדיוק של הסקר.
סוג הטעות המעניין השני הוא הסיכוי שהסקר יראה כי מפלגה מסויימת עברה את אחוז החסימה למרות שלא עברה אותו בפועל. זה כמובן תלוי במרחק של המפלגה מאחוד החסימה. אחוז החסימה הוא כיום כ-134 אלף קולות. הסיכוי שהסקר יטעה ביחס למפלגה שבפועל קיבלה רק 70 אלף קולות בוודאי נמוך מהרבה מהסיכוי הדומה למפלגה שקיבלה 133 אלף קולות.
סוג הטעות המעניין השלישי הוא הסיכוי שהסקר יראה כי מפלגה מסויימת לא עברה את אחוז החסימה למרות שעברה אותו בפועל. זוהי תמונת המראה של הטעות השניה.
הכל טוב ויפה, אבל איך מחשבים את כל הדברים האלה?

איך אפשר להעריך את גדולי הטעויות?

דרך אפשרית לקבל הערכות לגדלי הטעויות האלה היא לבצע סימולציה. הרעיון מאוד פשוט והוסבר כבר בעבר. מניחים הנחה על התוצאה האמיתית הבחירות. אחר כך לוקחים מדגם ורואים מה קורה. חוזרים על כך הרבה פעמים, ולבסוף ממצעים הכל.
הסימולציה שלי מתייחסת לתוצאות ההיפותטיות הבאות לגבי הבחירות לכנסת ה-22. המספרים כמובן לא אמיתיים. הם מתבססים על תוצאות הבחירות לכנסת ה-21 בתוספת כמה שינויים שהכנסתי כדי להתאים אותם למה שאני רוצה להדגים. הנה טבלת "תוצאות האמת" שלי:

מפלגה	מספר הקולות	מספר המנדטים
הליכוד	1140370	36
כחול לבן	1125881	35
הרשימה המשותפת	337108	10
ש"ס	258275	8
יהדות התורה	249209	8
ימינה	283910	8
העבודה	190870	6
ישראל ביתנו	173004	5
המחנה הדמוקרטי	135529	4
עוצמה לישראל	133211	0
נועם	75223	0
כל השאר	33333	0
סך הכל	4102590	120

בישלתי את המספרים כך שאחוז החסימה עומד על 134417 קולות. עוצמה לישראל נמצאת קצת מתחת לאחוז החסימה, המחנה הדמוקרטי קצת מעליו. המרחק של נועם מאחוז החסימה הוא כ-59 אלף קולות, בדומה למרחק של מפלגת העבודה (54 אלף). המרחק של ישראל ביתנו מאחוז החסימה הוא כ-39 אלף קולות.
עכשיו אני יכול לקחת מדגם, של 500 איש נניח, מתוך האוכלוסייה שמונה כ-4.1 מיליון מצביעים. אני פשוט אבחר באופן מקרי 500 איש מתוכם. המדגם שלי יהיה מושלם: אין הטיה כי לכל האנשים מהאוכלוסייה יש את אותו הסיכוי להיכלל במדגם, ואף אחד לא ישקר לי כאן.

הנה מדגם לדוגמה, וחלוקת המנדטים כפי שחישבתי על פי תוצאותיו:

מפלגה	מספר הקולות	מספר המנדטים
הליכוד	130	34
כחול לבן	132	34
הרשימה המשותפת	37	9
ש"ס	28	7
יהדות התורה	31	8
ימינה	38	10
העבודה	32	8
ישראל ביתנו	23	6
המחנה הדמוקרטי	17	4
עוצמה לישראל	0	0
נועם	0	0
כל השאר	0	0
סך הכל	500	120

אנחנו יכולים לראות למשל שהסקר העניק לליכוד ולכחול לבן 34 מנדטים כל אחת, בעוד שלפי "תוצאות האמת" הן קיבלו 36 מנדטים ו-35 מנדטים בהתאמה. לכן הטעויות לגבי שתי המפלגות האלה שוות ל-1 ו-2. תוכלו לוודא כי הטעות המקסימלית שנצפתה בסקר הזה היא 2, הטעות החציונית היא 1 והטעות הממוצעת היא 0.91. הסקר הזה לא העלה את עוצמה לישראל ונועם אל מעל אחוז החסימה, ולא הוריד אף מפלגה שעברה בפועל את אחוז החסימה אל מתחת לו.
את התרגיל הזה ביצעתי 2000 פעם עבור מדגם בגודל 500, וגם עבור מדגמים בגדלי 1000, 2000, 4000, ו-8000.

תוצאות הסימולציה

תוצאות גדלי הטעות שחושבו בסימולציה מופיעות בטבלה הבאה:

גודל המדגם	טעות ממוצעת	טעות מקסימלית	טעות חציונית
500	1.52	4.58	1.12
1000	1.13	3.82	0.80
2000	0.92	3.42	0.60
4000	0.77	3.18	0.39
8000	0.67	3.06	0.23

אנו רואים כי הטעות הממוצעת בסקר בגודל 500 היא כמנדט וחצי, והיא כמובן קטנה ככל שגודל המדגם עולה. הטעות החציונית בסקר כזה היא קצת יותר ממנדט, אבל הטעות המקסימלית היא יותר מ-4.5 מנדטים. זה קורה בגלל המפלגות שקרובות לאחוז החסימה. כשמפלגה שלא עוברת את אחוז החסימה בפועל אבל עוברת אותו במדגם הטעות היא 4 מנדטים, וכך גם במקרה ההפוך.
עד כמה נפוצים המקרים האלה? בדוגמא הזאת זה קורה די הרבה, מכיוון שיש בו שתי מפלגות שקרובות מאוד לאחוז החסימה:

גודל המדגם	הועברו בטעות	לא עברו בטעות
500	44.8	76.8
1000	44.9	56.2
2000	43.7	51.9
4000	44.5	46.9
8000	42.4	47.3

חוץ מהאנומליה של 76.8% למדגם בגודל 500, אנחנו רואים כי בדרך כלל הסיכויים קרובים ל-50%.
ניתן לערוך כמובן ניתוחים יותר מתוחכמים: לחשב סטיות תקן ורווחי סמך, לבדוק מה הסיכויים לטעות במעבר אחוז החסימה עבור גדלים שונים של מפלגות, ועוד. מי שמעוניין מוזמן להוריד את קוד הסימולציה שכתבתי בשפת R ולנסות לשחק עם הנתונים.

סיכום

בסקרי מנדטים קטנים, כאשר גודל המדגם הוא 500, ייתכנו טעויות משמעותיות בחיזוי מספר המנדטים האמיתי. הטעות הממוצעת היא כמנדט וחצי, והטעות המקסימלית עaויה להיות גבוהה באופן משמעותי.
עבור מפלגות המתנדנדות באיזור אחוז החסימה, גם מדגם גדול הרבה יותר אינו יכול לתת תשובה אמינה לגבי השאלה האם מפלגות אלה יעברו את אחוז החסימה.

ראו גם את שאר הרשימות שכתבתי בנושא הסקרים.

נשלח: 13 בספטמבר, 2019 נושאים: מה אומרת הסטטיסטיקה, סקרים, על סדר היום.
תגובות: 2 | טראקבק

10 שנים למותו של אריק להמן

היום, 12 בספטמבר 2019, מלאו 10 שנים למותו של הסטטיסטיקאי אריק לאו להמן. כאשר מלאו שלושים לפטירתו כתבתי כאן פוסט אישי אודותיו. כעת ברצוני לכתוב גם על חייו ופועלו.

אריק לאו להמן (1917-2009) להמן נולד ב-1917 בעיר שטרסבורג בחבל אלזס לוריין, וגדל בפרנקפורט שבגרמניה. ב-1933, כאשר היטלר מונה לקאנצלר גרמניה, נמלטה משפחתו לשוויץ. לאחר שסיים את לימודיו בתיכון למד מתמטיקה במשך שנתיים בקולג' טריניטי שבאוניברסיטת קיימברידג'. ב-1940 היגר לארצות הברית, וב-1941 התקבל ללימודי דוקטורט באוניברסיטת ברקלי בקליפורניה, למרות שפורמלית לא החזיק באף תואר אקדמי. הוא קיבל תואר שני במתמטיקה בשנת 1942, ותואר הדוקטור הוענק לו ב-1946. מדריך עבודת הדוקטורט שלו, שעסקה במבחנים אופטימליים על ערכו של מקדם המתאם, היה ג'רזי ניימן. במהלך מלחמת העולם השניה עסק בחקר ביצועים בבסיס חיל האוויר האמריקני בגואם.

לאחר שסיים את לימודי הדוקטורט המשיך להמן בתפקידו כמרצה לסטטיסטיקה באוניברסיטת ברקלי. בשנים 1950-1951 היה מרצה באוניברסיטאות קולומביה ופריסטון, וב-1952 היה פרופסור חבר באוניברסיטת סטנפורד. לאחר מכן חזר לאוניברסיטת ברקלי, שם כיהן כפרופסור למתמטיקה ולסטטיסטיקה עד לפרישתו ב-1988, אך המשיך בעבודתו המדעית גם לאחר מכן. בין השנים 1950 עד 1984 להמן היה מדריך עבודה הדוקטורט של 46 סטודנטים. ב-1977 נישא להמן לסטטיסטיקאית ג'ולי שייפר. הוא נפטר בשיבה טובה ב-12 בספטמבר 2009.

להמן תרם תרומות משמעותיות לתורת האמידה ולתיאוריה של בדיקת השערות אי פרמטרית. הוא נודע גם בזכות משפט להמן-שפה ואמד הודג'ס-להמן לחציון של אוכלוסייה. כמו כן עסק במחקר אודות ההיסטוריה והפילוסופיה של הסטטיסטיקה. בין שותפיו למחקר נמנו הנרי שפה, צ'ארלס סטיין, גו'זף הודג'ס, אוולין פיקס, פרסי דיאקוניס, וויליאם קראסקל, ג'ולייט פופר שייפר, ג'ודית טאנור, וחתן פרס נובל לכלכלה . בסך הכל פירסם להמן 123 מאמרים מדעיים.

בנוסף לכך, להמן ידוע גם בזכות הספרים שכתב. הוא כתב שבעה ספרי לימוד שעסקו בעיקר בנושאים מתקדמים בסטטיסטיקה. הספר "מושגים בסיסיים בהסתברות וסטטיסטיקה" שכתב יחד עם ג'וזף הודג'ס, תורגם לחמש שפות, כולל תרגום לעברית. בסך הכל תורגמו ספריו לתשע שפות שונות.

ב-2007 פרסם להמן ספר אוטוביוגרפי בו תיאר את זכרונותיו מעבודות משותפות, קשרי ידידות ומפגשים עם סטטיסטיקאים, כולל פגישה קצרה ולא נעימה עם . ב-2011 פרסם ספר שעסק בעבודות המוקדמות של פישר וניימן, בו הבהיר את חילוקי הדיעות העקרוניים שהיו בין השניים לגבי הכיוון אליו צריך מדע הסטטיסטיקה להתפתח.

להמן נבחר לחבר כבוד של האיגוד האמריקני לסטטיסטיקה, המכון לסטטיסטיקה מתמטית, והחברה המלכותית לסטטיסטיקה. כן נבחר להיות חבר במכון הבינלאומי לסטטיסטיקה, באקדמיה האמריקנית לאמנויות ומדעים, ובאקדמיה הלאומית למדעים של ארצות הברית. להמן כיהן כנשיא המכון לסטטיסטיקה מתמטית בשנים 1960-1961 . הוא זכה במספר מענקי מחקר יוקרתיים, כולל מענק מקרן גוגנהיים, והוזמן לשאת את ההרצאות על שם רונלד פישר, סם וילקס ואברהם ולד. הוענקו לו שני תוארי דוקטור לשם כבוד מטעם אוניברסיטת ליידן ואוניברסיטת שיקגו. לכבוד יום הולדתו ה-80 ב-1997, אוניברסיטת ברקלי הקימה קרן מילגות על שמו. בשנת 2000 היה לזוכה הראשון בפרס על שם גוטפריד נתר.

לקריאה נוספת

Erich Leo Lehmann, 1917-2009, David R. Brillinger, Journal of the Royal Statistical Society, 2010.
A conversation with Erich L. Lehmann, M. DeGroot, Statistical Science, 1986.
In Memory of Erich Lehmann, University of California, Berkeley, Department of Statistics
Erich Leo Lehmann—A glimpse into his life and work, Rojo, J., The Annals of Statistics, 2011.
גנאלוגיה מתמטית של אריק לאו להמן

נשלח: 12 בספטמבר, 2019 נושאים: האנשים שמאחורי הסטטיסטיקה.
תגובות: אין | טראקבק

הקשר בין אכילת בשר ותחלואה בסרטן השד – יחסי סיכונים

דרך מקובלת לבטא אפקט של טיפול או התערבות רפואית היא מה שמכונה "יחס הסיכויים" ((ולפעמים – יחס הסיכונים – תלוי בהקשר)) או באנגלית odds ratio. המונח העברי מופיע במרכאות מכיוון, כפי שאסביר מייד, התרגום הוא לא מדוייק עד לא נכון, תלוי את מי שואלים.

השאלה שנשאלה בשאלון היא מאוד פשוטה. נתונה קובייה הוגנת, כלומר כאשר מטילים אותה לכל התוצאות יש סיכוי שווה להופיע. לכן, מהו ה-odds של הטלת המספר 6?

מי שעוסק בהימורים יבין מייד את התשובה. יש 6 תוצאות אפשריות, לכולן אותו סיכוי. חמש תוצאות אפשריות אינן שוות ל-6, יש רק תוצאה אחת השווה ל-6, לכן ה- odds, היחס בין מספר התוצאות הרצויות לבין מספר התוצאות הלא רצויות הוא 1:5. יחס זה מכונה לעיתים בשם "יחס ההימורים".

שימו לב ש-1:5 אינו אומר כי ההסתברות להטלת 6 היא חמישית. ההסתברות להטלת 6 היא שישית. המשמעות של היחס 1:5 היא שההסתברות להטלת 6 קטנה פי 5 מההסתברות לא להטיל 6. בנוסף לכך, אם נחלק 1 ל-5 נקבל חמישית. נקבל חמישית גם את נחלק את הסיכוי לקבל 6, שהוא שישית, בסיכוי לא לקבל שש, שהוא חמש שישיות. זה תמיד נכון, ולכן יחס זה הוא יחס בין שני סיכויים.

ה-odds ratio, כפי ששמו מעיד עליו, הוא יחס בין שני odds, ומכיוון שה-odds הוא יחס, הרי שה-odds ratio הוא יחס בין שני יחסים, שכל אחד מהם הוא יחס בין שני סיכויים. לכן הביטוי "יחס הסיכויים" בעייתי בעיניי. לעיתים מכנים אותו בשם "יחס צולב", ואסביר מדוע בהמשך הפוסט.

הנה דוגמה שתסביר מהו ה-odds ratio, ואת הקשר בינו ובין הסיכון היחסי והסיכון המוחלט.

הדוגמה לקוחה מידיעה שפורסמה באתר Medical News Today, בה נאמר כי הסיכון לחלות אצל נשים הניזונות מתפריט מוטה בשר אדום גבוה ב-23% מהסיכון של נשים הניזונות מתפריט מוטה בשר עוף.

מדובר במחקר תצפיתי בו התבצע מעקב אחרי 42016 אלף נשים הנמצאות בקבוצת סיכון לתחלואה בסרטן השד – לכל אחת מנשים אלו יש אחות שחלתה כבר בסרטן השד. המחקר עקב אחרי הרגלי האכילה שלהן, כולל אכילת סוגי בשר שונים ובשר מעובד. במשך תקופת המעקב, כשבע וחצי שנים, 1536 נשים אובחנו כחולות בסרטן השד. מדובר באשה אחת מתוך כל 27 בערך (( למי שישאל איך קיבלו 1 ל-27 כאשר הנתון שכולם מכירים הוא 1 מתוך 9: הנתון של 1 מתוך 9 מתייחס לסיכון של אישה לחלות בסרטן השד במהלך חייה. תוחלת החיים של אישה ברוב העולם המערבי היא כשמונים שנה. הנתון של 1 מתוך 27 מתייחס אמנם לנשים בסיכון, אך במשך תקופת זמן קצרה בהרבה – רק כשבע וחצי שנים.)), סיכון לא מבוטל של כ-3.7%. מהו יחס הסיכונים לתחלואה בסרטן השד שנצפה באוכלוסייה זו במשך תקופת המעקב? 1536 נשים אובחנו כחולות בסרטן השד, 40480 נשים לא אובחנו. יחס הסיכונים הוא לכן 1536 ל-40480, או כ-1 ל-26. שימו לב כי הסיכון שונה מיחס הסיכונים.

החוקרים דיווחו כי הסיכון לתחלואה בקרב נשים שאוכלות בעיקר בשר עוף נמוך לעומת הסיכון בקרב נשים האוכלות בעיקר בשר אדום ב-28%.

למעשה הם ביצעו ניתוח הישרדות ודיווחו כי יחס הסיכונים במובן של Hazard Ratio בין אוכלות העוף ואוכלות הבשר האדום הוא 0.72 (( ראו את הרשימה "איך יודעים כמה אנשים מתים מנזקי העישון" להסבר קצת יותר רחב על המושג של ה- Hazard)). נתון זה מתקבל מחישוב המתקנן בתוכו משתנים נוספים, כגון גיל, BMI, עישון ומוצא אתני, וכמובן משך הזמן שעבר מתחילת המעקב ועד האבחון.

אבל (על פי החישובים שאפרט בהמשך):

יחס הסיכונים הוא 0.8 לומר הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר עוף נמוך רק ב-20% מהסיכון עבור נשים הניזונות מתפריט מוטה בשר אדום.

הפרש הסיכונים הוא 0.6% בלבד. הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר אדום הוא 3.1% ועבור אלה הניזונות מתפריט מוטה בשר עוף הוא 2.5%. (( שאלה מעניינת: אם אחוז התחלואה הכולל הוא 3.7%, אך התחלואה בעל אחת משתי הקבוצות האלה לחוד נמוכה מ-3.7%? ))

התובנה שלי: נתוני ה-odds ratio הם בעייתיים, ואין להם פירוש משמעותי ברור. הנתונים של הסיכון היחסי והפרש הסיכונים נותנים תובנה הרבה יותר טובה באשר לגורמי הסיכון.

למי שמעוניין בכל החישובים: עיון יותר מעמיק בנתונים מעלה כי הנתון המתוקנן של 0.72 נגזר מהנתונים הבאים (קישור לקובץ וורד).

מתוך כ-10500 נשים (כרבע מהאוכלוסייה) שאכלו בעיקר בשר אדום, היו 329 מקרי סרטן, ומתוך כ-10500 נשים שאכלו בעיקר בשר עוף היו 258 מקרים.

נסדר את כל הנתונים בטבלה יפה:

	תחלואה בסרטן השד
הטיית התפריט	כן	לא	סך הכל
בשר עוף	258	10242	10500
בשר אדום	329	10171	10500
סך הכל	587	20413	21000

מה אנחנו יכולים ללמוד מהמספרים האלה?

ה-odds, יחס הסיכונים לחלות בסרטן השד עבור נשים שאוכלות בעיקר בשר עוף הוא 258 ל-10242. עבור נשים שאוכלות בעיקר בשר בקר יחס הסיכונים הוא 329 ל-10171. נחלק את היחסים ונקבל כי היחס בין היחסים הוא 0.78:

תוצאה זו שונה מעט מהתוצאה שדווחה מכיוון שכאמור החוקרים ביצעו תקנונים שאנחנו לא ביצענו.

אבל שימו לב לחישוב: למעשה הכפלנו את שני המספרים שבאלכסון הראשי של הטבלה וחילקנו אותם במכפלת המספרים שבאלכסון המשני של הטבלה. ציירנו מין צלב כזה על הטבלה, ולכן יחס הסיכונים, ה-odds ratio נקרא לפעמים בשם יחס צולב.

.רשימה זו היא הרשימה החמישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 10 בספטמבר, 2019 נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

הקשר בין טיפול הורמוני חליפי והתפתחות קרישי דם

בתחילת 2019, פורסמה ידיעה בעיתון דיילי מייל לפיה כי טיפול הורמונלי חליפי (Hormone Replacement Therapy) בזמן המנאופוזה מכפיל את הסיכון לקרישי דם מסוכנים, כלשון הכותרת..

בניגוד למה שקורה בדרך כלל, הידיעה ציטטה גם את הנתון הבאשמסרו החוקרים מאוניבריטת נוטינגהאם: "על כל 10000 נשים המקבלות טיפול החלפת הורמונים, יש רק 9 מקרים נוספים של קרישי דם מדי שנה". זוהי פיסת מידע חשובה. מהו בעצם הנתון הזה?

אני אתעלם מהתשובות הלא נכונות שהוצעו (שינוי באחוזים, מספר החולים שיש לטפל בהם, (( במדד זה אדון בהמשך הסדרה )) וקצב קפלן-מאייר) ואעבור מייד להסבר.

הנתון שדווח הוא הגידול המוחלט בסיכון.

לפני שנגיע לדיון, קצת פרופורציות: לפי הכותרת, הסיכון להתפתחות קרישי דם בקרב נשים המקבלות טיפול הורמונלי גבוה פי שניים מהסיכון אצל נשים שלא מקבלות טיפול כזה. זה לא ממש מדוייק. קריאה זהירה במאמר שפורסם ב-BMJ מעלה כי הנתונים שמדווחים אינם סיכונים יחסיים אלא יחסי סיכונים (odds ratios). אני אדון ביחסי הסיכונים בהמשך הסדרה. כמו כן, יחסי הסיכונים משתנים על פי סוג הטיפול ודרך המתן. מדווחות תוצאות שונות לגבי סוגים שונים של טיפולים הורמונליים, ואכן עבור אחד מהם יחס הסיכונים נאמד כ-2.1, ולטיפולים אחרים היו יחסי סיכונים נמוכים יותר. עבור אחד הטיפולים המקובלים יחס הסיכונים היה נמוך באופן משמעותי מ-1, כלומר לטיפול הספציפי הזה היה אפקט מונע נגד הופעת קרישי דם. יחס הסיכונים המשוקלל על פני כל סוגי הטיפולים היה 1.6 בערך. עד כאן בנוגע לפערים בין כותרות זורעות בהלה ובין המציאות.

מה המשמעות של הגידול המוחלט בסיכון? נניח שאצל כל 10000 נשים שאינן מקבלות טיפול הורמונלי, יש מקרה אחד של היווצרות קרישי דם בכל שנה. הסיכון המוחלט הוא לכן 1 מתוך 10000, (או 0.01%, למי שאוהב אחוזים). לפי דברי החוקרים, עקב הטיפול ההורמונלי יש 9 מקרים נופים בשנה. כלומר, עוד 9 נשים מתוך 10000 יפתחו קרישי דם עקב הטיפול. באחוזים, ובסך הכל יהיו 10 נשים מתוך 10000 שיפתחו קרשי דם.

מה אם ההנחה הראשונה שלנו לא נכונה, ולמעשה מבין במקום אישה אחת, מבין כל 10000 נשים שאינן מקבלות טיפול הורמונלי, קרישי דם מתפתחים אצל 9 נשים? זה לא משנה – הנתון שנמסר עדיין אומרי כי יהיו 9 מקרים נוספים, ובסך הכל 18 במקום 9.

למעשה, אם נפרש את הכותרת של הדיילי מייל כמדווחת על סיכון יחסי, ונניח כי הנתון של תוספת 9 מקרים הוא נתון המשקלל את כל סוגי הטיפולים, נוכל לעשות חישוב לאחור. תוספת של 9 מקרים פירושה הכפלת הסיכון (( וזה כאמור לא נכון )), כלומר ללא טיפול יש 9 מקרים ועם טיפול יש 18 מקרים מתוך 10000. אם נבטא את הסיכון באחוזים, נקבל כי הסיכון עלה מ-0.09% ל-0.18%. הפרש הסיכונים הוא רק 0.09%.

רשימה זו היא הרשימה הרביעית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 6 בספטמבר, 2019 נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

הגלולה למניעת הריון והסיכון למוות עקב פקקת ורידים

מחקר משנת 1995 דיווח כי שימוש הכפיל את הסיכון למוות עקב . איזה נתון סטטיסטי דווח כאן?

השאלון מציע ארבע תשובות אפשריות: המצאות (prevalence), סיכון מוחלט (Absolute risk), מדד g של כהן למדידת גודל האפקט ((אין דבר כזה: יש Cohen's d וגם Hedegs' g)), וגם את התשובה הנכונה שהיא הסיכון היחסי (relative risk) המכונה לעיתים בשם יחס הסיכונים (risk ratio).

אסביר תחילה את נושא הסיכונים באמצעות דוגמה (( לא אתייחס כאן לנושאי ההמצאות וגודל האפקט )), ואחר כך אתייחס לנושא הקשר בין הגלולה למניעת הריון לפקקת הורידים.

כשאנחנו מדברים על סיכונים, יש שני מושגי יסוד: הראשון הוא גורם הסיכון: למשל עישון, שימוש בגלולה למניעת הריון או השתתפות בקורס מבוא לסטטיסטיקה. המושג השני הוא התוצא הבריאותי, כגון תחלואה בסרטן, פקקת ורידים או היהפכות לזומבי.

הסיכון המוחלט הוא ההסתברות שהתוצא הבריאותי יארע. בדרך כלל אומדים אותו כפרופורציה באוכלוסייה. נניח לדוגמה כי באוכלוסייה של 10000 אנשים בריאים 20 אנשים הפכו לזומבים. אם נחלק 20 ב-10000 ואחר כך נכפיל במאה נקבל כי הסיכון המוחלט להפיכה לזומבי הוא 0.2%.

לעומת זאת, בקבוצה של 10000 סטודנטים שנחשפו לקורס מבוא לסטטיסטיקה, 40 סטודנטים הפכו לזומבים, וזה סיכון של 0.4%. החשיפה לקורס הכפילה את הסיכון פי 2, מ-0.2% ל-0.4%. אנו אומרים לכן כי הסיכון היחסי הוא 2.

אבל צריך להיזהר מסיכונים יחסיים, כי הם לא משקפים את העלייה בסיכון. בדוגמת הזומבים, הסיכון הוכפל אבל עלה רק ב-0.2%. לא צריך לזלזל, אבל צריך גם לשמור על פרופורציות. לטעמי, דיווח של הפרש הסיכונים מועיל יותר להערכת סיכונים מאשר דיווח על הסיכון היחסי.

מה בקשר לפקקת הורידים?

אזהיר תחילה כי אין להסתמך על הנתונים שאביא כאן כדי לקבל החלטה כזו או אחרת או כדי להמליץ המלצות. יש כאן הערכות שרמת הדיוק שלהן לא ידועה, והנחות שרירותיות שאניח לצורך ההדגמה.

על פי ויקיפדיה, הסיכון המוחלט לפקקת ורידים אצל נשים המשתמשות בגלולה למניעת הריון הוא 60 מקרים ל-100000 שנות חיים, לעומת 30 אצל נשים שלא משתמשות בגלולה. ((הנתון של 60 מקרים הוא למעשה ממוצע, כיוון שהסיכון משתנה בהתאם לסוג הגלולה והרכבה)) כלומר, הסיכון אכן מוכפל, והסיכון היחסי לתחלואה הוא 2. הסיכון היחסי למוות כנראה דומה, אך לא ברור האם יש הבדל בשיעורי התמותה בין נשים המשתמשות בגלולה ונשים שאינן משתמשות בגלולה. שיעורי התמותה תוך שנה מאירוע הפקקת נעים בין 50% ל-90%, תלוי במקרה הספציפי. על פי מכון קוקריין, יחס הסיכונים גבוה יותר ומגיע במקרים מסויימים עד ל-3.5 – תלוי בהרכב הגלולה ומשך השימוש. בהחלט אין להקל ראש בסיכון הזה, אבל כפי שציינתי קודם, חשוב יותר לדעת את הפרש הסיכונים. אני אשתמש בנתוני ויקיפדיה כדי להדגים זאת.

מה הכוונה ב-100000 שנות חיים? הסיכון משתנה עם רמת החשיפה. אין דין אישה שהשתמשה בגלולה במשך שנתיים כדין אישה שהשתמשה בגלולה 15 שנה. לכן יש לשקלל את נתוני התחלואה במשך השימוש בגלולה. בואו נניח, לצורך הדוגמה בלבד, כי אישה ממוצעת משתמשת בגלולה במשך 20 שנים. לכן מאה אלף שנות חיים שקולות ל-5000 נשים (( 5000×20=100000 )). 30 מקרים מתוך 5000 הם 6 מתוך 1000, כלומר ניתן, תחת ההנחה הנ"ל, (( שימוש ממוצע של 20 שנה בגלולה )) כי בקרב נשים שלא משתמשות בגלולה, 6 מתוך כל 1000 יחלו בפקקת העורקים, ובקרב הנשים המשתמשות בגלולה 12 מתוך כל 1000 יחלו. בדוגמה זו, השימוש בגלולה יוסיף עוד 6 נשים חולות לכל 1000. זהו נתון שממחיש את רמת הסיכון: עוד 6 נשים מכל 1000 יחלו, ובסיכוי גבוה גם ימותו, אם ישתמשו בגלולה למניעת הריון במשך 20 שנה. לדעתי מידע זה מאפשר החלטה מושכלת יותר לגבי נטילת הסיכון.

רשימה זו היא הרשימה השלישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 2 בספטמבר, 2019 נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

כמה חיים מצילה הבדיקה לגילוי מוקדם של סרטן הערמונית?

פציינט שואל את הרופא שלו האם כדאי לו לעבור בדיקת PSA לגילוי מוקדם של . מהו הנתון שהרופא צריך להציג לחולה כדי שיוכל לקבל החלטה מושכלת?

מוצעות ארבע תשובות אפשרויות.

התשובה האפשרית הראשונה היא כי על הרופא להציג את מספר מקרי הסרטן באוכלוסיית חולים שעברו בדיקה לגילוי מוקדם, ומספר מקרי הסרטן באוכלוסיית של חולים שלא עברו בדיקה לגילוי מוקדם. יש שתי סיבות לכך שההצעה הזו לא נכונה. ראשית, אני מקווה שמובן מאליו כי יש להציג מספרים מתוקננים לגודל האוכלוסייה. הסיבה השנייה גם היא ברורה מאליה, לדעתי: מספר מקרי הסרטן אינו מושפע מעצם קיום או אי קיום בדיקות לגילוי מוקדם.

תשובה אפשרית נוספת מוצעת היא כי על הרופא להציג את שיעור/אחוז השורדים כעבור חמש שנים מעת גילוי המחלה עבור חולים שעברו בדיקה לגילוי מוקדם ועבור אלה שלא עברו בדיקה כזו. ההסבר המפורט לכך שהשוואה זו הינה חסרת משמעות הופיע בפוסט קודם. בקצרה: אצל חולים שלא עברו בדיקה לגילוי מוקדם עבר זמן רב יותר מאז הופעת המחלה בהשוואה לאלה שכן עברו בדיקה לגילוי מוקדם, ולכן בסיס ההשוואה אינו זהה בין שתי הקבוצות.

הצעה נוספת היא להציג בפני הפציינט את ההסתברות כי הנבדק אכן חולה בסרטן הערמונית בהינתן כי תוצאת הבדיקה חיובית. (( נתון זה נקרא של הבדיקה ונדון בו ביתר פירוט בהמשך הסדרה )) בהצעה זו יש שתי בעיות. ראשית, האומדנים להסתברויות מסוג זה הינם מאוד לא מדוייקים. יש צורך לדעת כמה מבין התוצאות החיוביות הינן חיוביות אמיתיות (כלומר, הבדיקה זיהתה מחלה והנבדק אכן חולה) וכמה הן חיוביות שגויות (כלומר, הבדיקה זיהתה מחלה והנבדק אינו חולה). בפועל, ברוב מוחלט של המקרים בהם תוצאת הבדיקה חיובית מבוצעת פרוצדורה רפואית, ולכן אי אפשר לדעת אם התוצאה שגויה או לא – כדי לדעת זאת צריך לא לטפל בנבדק ולראות מה יקרה לו, וזה כמובן לא קביל.

שנית: ההסתברות הזאת לא אומרת דבר על סיכויי ההישרדות/החלמה אם הפציינט אכן חולה. היא רק מעידה על רמת הדיוק של הבדיקה.

הנתון שיאפשר לחולה לקבל החלטה הוא שיעורי התמותה בקרב חולים שעברו בדיקה לגילוי מוקדם ובקרב אלה שלא עברו בדיקה כזו, כאשר שתי האוכלוסיות הן בנות השוואה (comparable), למשל: גברים שעברו בדיקה לגילוי מוקדם בגיל 50 לעומת גברים בני 50 שלא עברו בדיקה כזו. אם הבדיקה אכן מצילה חיים, נצפה לפחות מקרי מוות עקב סרטן הערמונית בקבוצה הראשונה.

רשימה זו היא הרשימה השניה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 27 באוגוסט, 2019 נושאים: בריאות, מה אומרת הסטטיסטיקה.
תגובות: 5 | טראקבק