מה אומרת הסטטיסטיקה | נסיכת המדעים

ארכיב עבור תגית מה אומרת הסטטיסטיקה

האם מכוני כושר הם מקור להתפרצות קורונה?

אני אתחיל בהתנצלות: אין לי מושג מה התשובה לשאלה שבכותרת. אני לא חושב שלמישהו יש מושג. אבל משום מה, הנושא של סגירת מכוני הכושר הפך בימים האחרונים לוויכוח ציבורי לוהט, ולכן החלטתי להפסיק את שתיקתי בעניינים הקשורים למגיפת הקורונה. אבל אם הגעתם עד לכאן, אודה לכם אם תקראו לפחות את הפיסקה הבאה.

מה תמצאו בפוסט הזה? ראשית אביא סקירה מאוד קצרה למה שידוע לנו על הנושא נכון לעכשיו. לאחר מכן אדון בשאלה איך למצוא תשובה לשאלה שבכותרת (או שאלות דומות). לסיום אביא את דעתי האישית בנושא.

מה ידוע על הקשר בין פעילות מכוני הכושר והתחלואה בקורונה?

מה אנחנו יודעים על הקשר בין הדבקות בקורונה ובין פעילות חדרי הכושר? בשתי מילים: כמעט כלום.

הלכתי לשאול את ד"ר גוגל מה הוא חושב. מילות החיפוש שלי היו "covid-19 gym reopening". אסקור כאן את שלוש התוצאות הראשונות (( לאחר מכן המקורות מתחילים להיות מפוקפקים. התוצאה הרביעית הייתה מאתר בשם mindbodyonline נקודה קום, והחמישית מאתר מסחרי בשם europeactive נקודה אי.יו. שעוסק בקידום פעילויות ספורט. ))

תוצאת החיפוש הראשונה היא כתבה בכתב העת science ב-26.6.2020. הנה הכותרת: It’s safe to go back to the gym—if there’s little COVID-19 around, study suggests ובעברית: אין בעיה להתאמן במכוני הכושר אם אין שם חולי קורונה. מדובר במחקר שנעשה בנורבגיה (( קישור למחקר – קובץ פדף )). החוקרים גייסו לניסוי כ-4000 איש, כולם מנויים בחדרי כושר בעיר אוסלו וכולם לא עברו בדיקות קורונה בחודשים מאי עד יוני 2020. כמחצית מהנבדקים קיבלו אפשרות להתאמן במשך שבועיים בחמישה חדרי כושר שנפתחו במיוחד לצורך המחקר. בחדרי הכושר האלה נשמרו כל התנאים הנדרשים: מרחק של שני מטר, מסיכות, וניקוי המכשירים בסיום השימוש. שאר המשתתפים בניסוי היוו את קבוצת הביקורת. מלבד המשתתפים בניסוי היחידים ששהו בחדרי הכושר היו אנשי הצוות. התוצאות: כעבור שבועיים זוהה חולה אחד בקבוצת המתאמנים, ואף לא אחד בקבוצת הביקורת. נחמד. הבעיה: במשך תקופת הניסוי מספר החולים החדשים באוסלו היה נמוך מאוד: 105 בסך הכל, כ-8 חולים ליום בממוצע. יותר מכך: מספר החולים המאושפזים בעיר, שמהווה אינדיקציה למספר החולים הכללי, ירד מ-35 בתחילת תקופת המחקר ל-21 בסיומה. לסיכום, הכותרת של הכתבה אכן מאוד מדוייקת: אם אין חולים אז אין ממי להידבק, אפילו לא בחדר הכושר. השורה התחתונה של המחקר הזה: לא למדנו ממנו שום דבר משמעותי.

תוצאת החיפוש השניה היא מהאתר של השידור הציבורי בארצות הברית, NPR. מתאריך 5.7.2020. הכותרת: My Gym Is Reopening. Is It Safe To Work Out There? עיקר הכתבה הוא ראיונות עם מומחים שונים. המסרים: כל אחד צריך להעריך את הסיכון שלו, עדיף להתאמן בבית או באוויר הפתוח, אם בכל זאת הולכים לחדר כושר לבדוק איזה אמצעי זהירות הם נוקטים, לשים לב לזרימת האוויר ועוד ועוד. ההמלצה המודגשת ביותר: אם יש באיזור שבו אתה נמצא הרבה חולים, הסיכון שלך להידבק בחדר הכושר גדול יותר. ממש כמו שהמחקר הנורבגי גילה. בכתבה יש גם הפניה למחקר תצפיתי בהיקף קטן שנעשה בדרום קוריאה (( מצאתי אותו גם בגוגל סקולר )). ההמלצה של המחקר הזה אינה שונה מההמלצות הקודמות.

התוצאה השלישית היא מהוול-סטריט ג'ורנל: Gyms Reopening May Not Facilitate Coronavirus Infections, Study Finds. הכתבה נמצאת מאחורי חומת תשלום, אבל מהמעט שאפשר לקרוא עולה כי היא מתייחסת לאותו מחקר נורבגי. העורכים של העיתון, כפי שאני מסיק מהכותרת, סבורים כי התוצאות של המחקר הזה דווקא מעודדות, למרות ההסתייגות שהוכנסה שם (( "may not…" ))

בגוגל סקולאר, מלבד מהמחקר הקוריאני, לא מצאתי שום מחקר שמביא נתונים כמותיים בעניין בין עשר התוצאות הראשונות.

איך אפשר לאסוף נתונים על הסיכון לתחלואה בקורונה בחדרי הכושר?

מי שהגיע לכאן, ובפרט מי שעוקב אחרי הבלוג הזה לאורך השנים, כבר יודע את התשובה: צריך לעשות ניסוי מבוקר. הנורבגים עשו בדיוק את זה.

אני מסתייג מהמחקר הזה בגלל מספר סיבות. הסיבה הראשונה היא כל מיני עניינים שקשורים לתכנון המחקר. למשל, המתאמנים לא התאמנו בחדרי הכושר שבהם הם מתאמנים בדרך כלל אלא חדרי כושר שנפתחו במיוחד עבור המחקר. זה יוצר הטיה, כי מכונים אלה לא בהכרח מייצגים את כל המכונים. לא נאמר איך חמשת המכונים האלה נבחרו. כמו כן, לא נמסרו פרטים על גודלם של המכונים, מספר האנשים שכל מכון יכול להכיל, ועד כמה צפיפות המתאמנים במהלך הניסוי הייתה דומה לצפיפות בזמן שגרה. בעיה נוספת שאני רואה היא משך תקופת המעקב – שבועיים בלבד. החוקרים לא לקחו את משך תקופת המעקב בחשבון כאשר חישבו את גודל המדגם. אם חדרי הכושר היו נפתחים לתקופה ארוכה יותר סביר להניח שהיינו רואים יותר הדבקות, וייתכן שההבדלים בין הקבוצות יהיו שונים. כמו כן, לא נעשה שקלול על פי מספר הפעמים שבהם כל אחד מהנבדקים בקבוצת הניסוי התאמן, אבל בדיעבד זה לא משנה לאור התוצאה של מקרה הדבקה בודד בכל הניסוי.

בעיה שניה: הניסוי השווה בין מתאמנים ללא מתאמנים, ולא בדק את ההשפעה הכוללת של הפתיחה על כלל האוכלוסייה. קשה להאשים כאן את החוקרים. אני לא רואה דרך סבירה לבדוק את זה.

בעיה שלישית: המחקר לא עונה, ולא יכול לענות, על השאלה האם יש קשר בין שיעור התחלואה הכולל ושיעור ההדבקה בין המתאמנים. כן, ראינו כי כאשר שיעור התחלואה באוכלוסייה נמוך אז שיעור ההדבקה בחדרי הכושר על משך תקופה של שבועיים הוא אפסי. אבל מה יקרה אם שיעור התחלואה באוכלוסייה יעלה? סביר להניח שגם שיעור ההדבקות בחדרי הכושר יעלה, אבל אין לנו מידע על מספיק על אופי הקשר.

עם זאת, אני מבין את הקשיים בפניהם עמדו החוקרים. אולי היה אפשר לתכנן את הניסוי טוב יותר, אבל זו חכמה של צופה מהצד.

אני רוצה להציע תכנון אחר, שנראה לי יותר הגיוני: לדגום אוכלוסיית מחקר של מכוני כושר, ולא של מתאמנים. לאחר מכן, נקבע על ידי הקצאה רנדומלית איזה מכונים ייפתחו ואיזה יישארו סגורים (( אני לא אכנס כאן לפרטי הדגימה וההקצאה. אני מודע לכך שאני כותב כאן בצורה פשטנית, והתהליך הרבה יותר מורכב)). אני בהחלט חושב שתקופת מעקב של שבועיים אינה מספיקה, והתחושה שלי היא שהתקופה צריכה לארוך לפחות חודש, אם לא יותר מכך. ההשוואה תהיה דומה להשוואה שעשו הנורבגים: השוואת שיעור הנדבקים בין המנויים בחדרים שנפתחו לבין המנויים במכונים שנשארו סגורים.

יש עוד אפשרות, פחות טובה. יש לנו כבר את נתוני ההדבקה מהתקופה שבה מכוני הכושר היו סגורים. בואו נפתח עכשיו את חדרי הכושר ונראה אם יחול שינוי. הבעיה היא כמובן שאנחנו לא חיים בחלל ריק. אי אפשר רק לפתוח את מכוני הכושר ולהשאיר את כל הגורמים האחרים קבועים. עם זאת, אנחנו עושים את זה הלכה למעשה כל הזמן. אנחנו מסתכלים על השינויים בתחלואה ומנסים למצוא קשר לכל מיני דברים: בתי ספר סגורים, אוטובוסים עם חלונות פתוחים, בתי הספר שוב נפתחים, ושוב נסגרים, 100 מטר, 500 מטר, חתונות קטנות, חתונות עד 250 איש, חתונות עד 100 איש, אני אעצור כאן ברשותכם.

אז מה לעשות עם חדרי הכושר?

רק אתמול קראתי באתר ynet כי חדרי הכושר, הבריכות וחלק מהמסעדות נסגרו כחלק מהגבלות הקורונה החדשות – אבל יו"ר ועדת הקורונה יפעת שאשא-ביטון דורשת קבלת נתונים לפני שתאשר את אותן הגבלות. שאשא-ביטון אמרה בריאיון לאולפן ynet כי הממשלה קיבלה את ההחלטה מבלי להציג נתונים – ובשלב זה אין בכוונתה לאשר את צו הסגירה. "נקבל את הנתונים ונחליט עד מחר", הוסיפה.

אני לא בא להשמיץ את ח"כ שאשא-ביטון. לדרוש נתונים זו דרישה סבירה לגמרי. אני תומך נלהב של קבלת החלטות על סמך נתונים.

אבל היא גם אמרה, בראיון לרדיו 103FM (קישור לראיון המוקלט), כי "אם משרד הבריאות לא יוכיח שבריכות, חדרי כושר ומסעדות הם מקור התפרצות, נבטל ההנחיות".

אז הנה הבעיה: אין נתונים על חדרי כושר, וכנראה שגם לא על מסעדות ובריכות ((מי שמעוניין מוזמן לבדוק)), ובטח שאין נתונים אמינים על מה שקורה בישראל. משרד הבריאות לא יכול להוכיח שחדרי כושר הם מקור התפרצות, אבל גם לא יכול להוכיח שלא. והחלטה צריך לקבל בכל מקרה. שאשא-ביטון החליטה למעשה שאם אין נתונים שמראים כי חדרי כושר הם מקור התפרצות, אז בהכרח חדרי כושר אינם מקור התפרצות. אני חולק על דעתה. אבל אל תטעו, אפשר גם לטעון את הטענה ההפוכה: שאם אין נתונים שמראים כי חדרי כושר אינם מקור התפרצות, אז בהכרח חדרי כושר הם מקור התפרצות. שתי הטענות סובלות מאותו כשל לוגי.

ושוב, אין לי שום דבר אישי נגד חברת הכנסת, כולנו עומדים בפני אותה הדילמה, לכל אחד יש דיעה, ומאוד סביר להניח שרבים חושבים כמו שאשא-ביטון, לכיוון כזה או אחר. היא פשוט בולטת בגלל התפקיד שהיא ממלאת והאחריות שהיא נושאת על כתפיה. וגם אם פורמלית יש כאן כשל לוגי, אי אפשר לומר שאין הגיון במה שהיא אומרת. אני בטוח כי היא חשבה על הנושא ולקחה בחשבון עוד שיקולים שצריך לקחת בחשבון, כמו שיקולים כלכליים ודאגה לרווחת הציבור.

אין נתונים, אין ברירה וצריך להחליט בלעדיהם. אפשר לבצע ניסוי כמו שעשו בנורבגיה. אפשר לנסות להניח הנחות, לבנות מודל, לבדוק עד כמה הוא עמיד. ואפשר, כמו שעשו ב-NPR, להתייעץ עם מומחים, בעיקר אפידמיולוגים ומומחים לבריאות הציבור אבל בהחלט גם עם אנשים שיש להם מומחיות בתחומים אחרי שרלוונטיים לדיון.

דעתי האישית היא שאת חדרי הכושר יש לסגור. אנחנו בישראל ולא בנורבגיה, ואני לא מאמין שדווקא שם ישמרו על ההנחיות של ריחוק חברתי, היגיינה וחבישת מסיכות. אדרבא. כאן לדעתי יש להפעיל את עיקרון הזהירות המונעת. לגבי בריכות ומסעדות? אין לי מושג, מצטער.

מאחל לכולכם רק בריאות.

נשלח: 10 ביולי, 2020. נושאים: ביוסטטיסטיקה, בריאות, ניהול סיכונים, על סדר היום, קבלת החלטות.
תגובות: 9 | טראקבק

ויזואליזציה של נתוני יחס חוב/תוצר

לפני מספר ימים ראיתי את הגרף הזה בטוויטר: (( הערה: ביצעתי כמה עריכות מינוריות בגרף לצורך ההדגמה בהמשך הפוסט ))

גיגול קצר העלה כי מדובר בגרף ישן יחסית מאוקטובר 2017. מצד אחד, זהו באמת גרף מאוד יפה ומרשים. מצד שני, מקומו בדפי פייסבוק כגון Trust me, I’m a Statistician או Trust me, I’m a Data Scientist.

גרף זה הוא סוג של דיאגרמת עוגה (pie chart). בדיאגרמת עוגה קלאסית הפרוסות הן בצורת "משולשים", או גזרות של עיגול אם רוצים לדייק. כאן לפרוסות יש צורות אחרות, הכוללות משולשים, מרובעים, מצולעים אחרים, וצרות שאין לי מושג מה שמן (( ראו לדוגמא את בריטניה בתחתית הדיאגרמה))

אני מודה שהגרף הזה די בילבל אותי. מדובר בנתונים של חוב לאומי ויחס חוב/תוצר. בתחילה התייחסתי לנתון של יחס חוב/תוצר, ומשום מה חשבתי שהשטח של כל פרוסה בעוגה הזו מייצג את יחס החוב/תוצר של כל מדינה. זאת כנראה בגלל שהעין שלי תפסה קודם כל את הכותרת התחתונה.

בפועל, כל פרוסה מראה את החלק של המדינה מתוך סך כל החובות הלאומיים בעולם, ולכן סך כל השטחים אמור להסתכם ל-100%. (( לא בדקתי את הנתונים האלה, אני מאמין למי שיצר את הדיאגרמה, וזה גם לא כל כך משנה לדיון כאן)).ניתן לראות בבירור כי המדינה עם החלק הגדול ביותר מתוך סך החובות היא ארצות הברית, ומכאן ג ניתן להסיק כי לארצות הברית יש את החוב המוחלט הגבוה ביותר במונחים דולריים. המדינה עם החלק השני הכי גדול בסך החובות היא יפן, וסין שלישית. מצאו בעוגה את הפרוסות של איטליה, גרמניה, צרפת ובריטניה. לאיזה מדינה מבין הארבע יש חלק יותר גדול בעוגת סך החובות? האם אתם יכולים לקבוע זאת על ידי השוואת השטחים של הפרוסות?

יחס החוב/תוצר של כל מדינה מבוטא על ידי הצבע של הפרוסה בעוגה. ככל שהצבע בהיר יותר, כך יחס החוב/תוצר גבוה יותר. אפשר לראות מייד כי ליפן יש יחס חוב/תוצר גבוה מאוד. ניתן להבחין כי גם ביוון היחס הזה גבוה, למעשה השני בגובהו. האם אתם יכולים לזהות את המדינה עם היחס השלישי בגובהו? זוהי לבנון. חפשו אותה בפינה הימנית עליונה. איטליה ופורטוגל, שתופסות את המקום הרביעי והחמישי, בולטות יותר. האם אתם יכולים לראות לאיזה מדינה יש את יחס החוב/תוצר הנמוך ביותר?

לאחר שהבנו את הנתונים המוצגים בדיאגרמה הזו, אנו יכולים לנסות למצוא תובנות.

דיאגרמה זו היא למעשה גרף דו-מימדי, במובן שמוצגים בה שני משתנים שונים. בדרך כלל גרפים כאלה אמורים להראות את הקשר בין שני המשתנים. אז מה הקשר בין יחס החוב/תוצר ובין חלק החוב בסך כל החובות? אתם יכולים לראות? כי אני לא יכול. לזכותם של הכותבים ייאמר שהם לא ניסו לדון בכלל בעניין.

האם יש דרך טובה יותר להציג את הנתונים האלה באופן גרפי? כמובן שיש. בואו נשכח את כל מה שראינו עד עכשיו ונשחק קצת בנתונים.

לקחתי את נתוני יחס החוב/תוצר של כל מדינות העולם וגם את נתוני התוצר עצמם מויקיפדיה. לצורך ההדגמה, התמקדתי בנתוני מדינות ה-OECD משנת 2017. מנתוני יחס החוב/תוצר ונתוני התוצר אפשר כמובן לחשב את גובה החוב, משם את סך החובות, ולבסוף את חלקה של כל מדינה מתוך סך החובות. הנתונים נמצאים כאן.

האפשרות הפשוטה ביותר היא לשרטט תרשים פיזור (scatter plot) משרטטים את הנתונים במערכת צירים, כשכל מדינה מיוצגת על ידי נקודה. המרחק של הנקודה מכל אחד מהצירים מייצג את הערך המתאים של הנתון.

הנה דיאגרמת פיזור בסיסית המציגה את הנתונים שלנו. למעוניינים, קוד R נמצא בגרסה האנגלית של הפוסט הזה.

בדיאגרמה ניתן לראות בבירור כי יש שתי נקודות/מדינות חריגות: אחת מהן עם יחס חוב/תוצר גדול מ-200%, חלקה של השניה בסך כל החובות גבוה מ-30%.

עיון נוסף מגלה מדינה שיחס החוב/תוצר שלה גבוה מ-150%, ועוד שתי מדינות שיחס החוב/תוצר שלהן באיזור ה-130%.

מאחר ויש כלכלנים שסבורים כי חוב גבוה זה רע, וחוב גבוה ביחס לתוצר הוא עוד יותר רע, החלטתי לחלק את הנקודות/מדינות לשלוש קבוצות:

בקבוצה הראשונה נכללות המדינות שיחס החוב/תוצר שלהן גבוה מ-100% או שחלקן בסך החובות גבוה מ-10%. אלה המדינות שמצבן הכלכלי "רע" על פי הפרמטרים האלה.
בקבוצה השניה נכללות המדינות שיחס החוב/תוצר שלהן נמוך מ-50% וגם חלקן בסך החובות נמוך מ-2%. אלה המדינות שמצבן הכלכלי "טוב" על פי הפרמטרים האלה.
הקבוצה השלישית כוללת את כל שאר המדינות.

קווי הגבול בין הקבוצות (2%, 10% וכולי) הם שרירותיים משהו. קבעתי אותם על פי מיטב שיפוטי. (( אם אתם מכירים כלכלן שיכול לקבוע את קווי הגבול באופן יותר מדוייק (במובן accuracy, לא במובן precision) , אשמח אם תכירו לי אותו ))

שרטטתי מחדש את הגרף: את הנקודות של המדינות שמצבן "רע" צבעתי באדום, והוספתי לגרף גם את שמה של כל מדינה מקבוצה זו. את הנקודות של המדינות שמצבן "טוב" צבעתי בירוק, ואת שאר הנקודות צבעתי בכתום:

עכשיו ניתן לראות כי:

יחס החוב/תוצר של המדינות שמצבן "טוב" משתרע על כל הטווח מ-0 עד 50, אם כי יש בקבוצה זו יותר מדינות שיחס החוב/תוצר שלהן מתקרב ל-50%.
מדינות הביניים מתחלקות בערך לשתי קבוצות: קבוצה אחת עם רמת חובות מוחלטת (כאחוז מסך החוב) נמוכה ויחס חוב/תוצר בין 50 ל-75 בערך, וקבוצה שניה של חמש מדינות עם רמת חובות מוחלטת גבוהה יותר, כאשר לא ניתן לומר אמירה ברורה על מכנה משותף ביניהן לגבי יחס חוב/תוצר.

נשלח: 7 בפברואר, 2020. נושאים: דטה סיינס, ויזואליזציה, כלכלה וחברה, מה אומרת הסטטיסטיקה, סטטיסטיקה רעה.
תגובות: 6 | טראקבק

הליידי הטועמת תה קר

הקוראים הוותיקים של הבלוג זוכרים בוודאי את סיפור הליידי הטועמת תה. השאלה שעמדה אז על הפרק הייתה הם ניתן להבדיל בין הטעם של תה שנמזג לתוכו חלב ובין הטעם של חלב שנמזג לתוכו תה. הניסוי שהוכיח כי אכן ניתן להבדיל בין הטעמים הוא אחד הניסויים הקלאסיים בתולדות המדע בכלל והסטטיסטיקה בפרט.

אנוכי הקטן ניסיתי היום לברר את התשובה לשאלה לא פחות חשובה.

בבית הספר של בני הצעיר נערך מדי שנה "יום ההורה המעשיר", בו הורים מגיעים לבית הספר ומעבירים לתלמידים שיעורים בנושאים שונים לפי בחירתם, רצוי בנושאים שהם מבינים בהם משהו. ואני מה אני מבין? בקושי קצת סטטיסטיקה. לכן החלטתי לשחזר את ניסוי הליידי הטועמת תה.

השאלה שעמדה על הפרק היא האם יש הבדלים בין הטעם של שני המותגים המובילים של תה קר בישראל: נסטי ופיוז טי. וזו שאלה קריטית, מכיוון שבני הוא חסיד של אחד המותגים האלה ומסרב בכל תוקף לצרוך את המותג השני, דבר שמטיל על משפחתנו הקטנה מגבלות בלתי סבירות.

כמובן שאת השיעור התחלתי בסקירה קצרה של נושא תכנון הניסויים ותיאור הניסוי הקלאסי של , אבל גולת הכותרת הייתה הניסוי עצמו.

תכנון הניסוי היה כדלקמן: בכל שלב, הוצגו לאחד התלמידים ((אני נצמד לכללי האקדמיה ללשון העברית, אבל אני גם חייב לציין כי מספר הבנות היה גדול פי 3 ממספר הבנים)) שתי כוסות תה קר. לעיתים בשתי הכוסות נמזג אותו מותג תה, לעיתים בכל כוס נמזג מותג אחר. לאחר טעימה ורחרוח היה על שפן הניסוי לומר האם הוא חש בהבדל טעמים בין הכוסות או לא.

ההחלטה האם למזוג לתוך שתי הכוסות את אותו סוג תה או האם למזוג לכל כוס סוג אחר נקבעה על ידי הטלת מטבע. במקרה שהגורל קבע כי לשתי הכוסות יימזג אותו מותג תה, הטלת מטבע נוספת קבעה את המותג שיימזג לשתי הכוסות.

הזמן שלנו הספיק לביצוע של 17 טעימות, והנה התוצאות:

		האם הטועם צדק
		כן	לא	סך הכל
האם תכולת הכוסות זהה	כן	5	5	10
האם תכולת הכוסות זהה	לא	4	3	7
	סך הכל	9	8	17

המסקנה שלי היא כי לא נמצאה עדות להבדלים בטעמים בין שני המותגים ((אתם מוזמנים לערוך מבחן חי בריבוע או מבחן פישר)). הבן שלי שוכנע. בארוחת הצהריים הוא שתה להנאה מהמותג שעד כה הוחרם. הניסוי הוכתר כהצלחה.

נשלח: 20 בדצמבר, 2019. נושאים: בנימה אישית, מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

ממתאם לסיבתיות – הקשר בין עישון ותחלואה בסרטן הריאה

עדויות בדבר הקשר בין עישון ותחלואה בסרטן הריאה החלו להופיע כבר בתחילת המאה העשרים, ומספר רב של מחקרים שנערכו בשנות הארבעים והחמישים של המאה העשרים סיפקו עדויות נוספות לקשר הזה. בפוסט זה אני סוקר את העדויות המחקריות שהראו את הקשר בין עישון סיגריות ותחלואה בסרטן, ואת השיקולים שהובילו לביסוס הקשר הסיבתי לפיו עישון הוא גורם הסיכון העיקרי לתחלואה בסרטן הריאה, וגיבוש הקונצנזוס המדעי התומך בטענה זו.

עדויות בדבר הקשר בין עישון ותחלואה בסרטן הריאה

בסוף המאה ה-19 התחלואה בסרטן הריאה הייתה נדירה. בבית החולים של אוניברסיטת דרזדן, מקרי סרטן הריאה היוו כאחוז אחד מבין כל הסרטנים שזוהו בניתוחים שלאחר המוות. שיעור זה עלה ל-10% בשנת 1918, ול-14% ב-1927.

הועלו מספר השערות לגורמים סביבתיים אשר עשויים להסביר את הזינוק בתחלואה: עליה בזיהום תעשייתי, התרחבות השימוש באספלט לסלילת כבישם, זיהום אויר ממכוניות שמספרן עלה בהדרגה, חשיפה לגז במלחמת העולם הראשונה, ואפילו מגיפת השפעת של 1918. עם זאת, עליה בתחלואה נצפתה גם כאשר לא הייתה חשיפה לגורמים אלה.

הראשון שהצביע על הקשר בין העלייה בתחלואה בסרטן והריאה ובין העלייה בפופולריות של עישון סיגריות היה ככל הנראה המדען הגרמני פריץ ליקינט, שהראה ב-1929 כי שיעור המעשנים בקרב חולים בסרטן הריאה גבוה משיעורם באוכלוסייה הכללית. ממצאיו של ליקינט שוחזרו בשני מחקרים שפורסמו בגרמניה ב-1940 ו-1943. במחקרים אלה נצפה כי מספר המעשנים בקבוצה של חולי סרטן הריאה היה גבוה בערך פי 30 ממספר המעשנים בקבוצת ביקורת שהורכבה מאנשים בעלי רקע דומה, אך אינם חולים בסרטן הריאה. חמישה מחקרים שונים שנערכו בבריטניה ובארצות הברית בשנת 1950 הגיעו למסקנות דומות. מחקרים מסוג זה הינם מחקרים רטרוספקטיביים; נבחרו בהם שתי קבוצות: קבוצה אחת של חולים בסרטן הריאה וקבוצת ביקורת של אנשים, חולים או בריאים, מרקע דומה ((מבחינת גיל, מין וכדומה)) שאינם חולים ברטן הריאה. המסקנה שעלתה ממחקרים אלה היא שהסיכוי כי אדם שחולה בסרטן הריאות הינו מעשן גבוה מהסיכוי שאדם שאינו חולה בסרטן הריאה הינו מעשן. מחקרים אלה לא עונים על השאלה מהו הסיכון של אדם מעשן לחלות בסרטן היראות לעומת אדם שאינו מעשן. נגיע לסוגיה זו בהמשך.

עדויות נוספות לקשר בין טבק וסיגריות לבין תחלואה בסרטן הגיעו מניסויים בבעלי חיים. ניסויים שערך החוקר הגרמני ברוש בשנת 1900 העלה כי חשיפה לתמצית המופקת מעלי טבק העלתה את התחלואה בסרטן אצל עכברים בהשוואה לקבוצת הביקורת. תוצאות אלה אושרו במספר רב של מחקרים שנערכו בשנות ה-30 ובתחילת שנות ה-40, שכללו מינם שונים של בעלי חים וסוגי חשיפה שונים, כולל חשיפה לעשן סיגריות. רוב המחקרים בנושא בוצעו על ידי החוקר הארגנטינאי/גרמני אנגל רופו. ב-1953, ניסוי בו "נמרח" משקע (tar) הנוצר על ידי עישון סיגריות על עורם של עכברים זכה לתהודה רבה. הניסוי הראה כי העכברים ש-"זכו לטיפול" זה פיתחו מספר גדול באופן משמעותי של גידולים סרטניים בהשוואה לקבוצת הביקורת. המגזין Time הכריז כי ניסוי זה הוכיח את הקשר בין עישון ותחלואה בסרטן מעבר לכל ספק.

סוג שלישי של עדויות לקשר בין עישון בתחלואה בסרטן הריאה היו עדויות פתולוגיות. בניתוחים שלאחר המוות אצל מעשנים, לאו דווקא כאלה שחלו בסרטן הריאה, נצפו הבדלים פתולוגיים בתאי הריאה בין מעשנים ובין לא מעשנים. המחקר הראשון שהצביע על הבדלים כאלה התפרסם בשנת 1932.

כמו כן, מחקרים הראו כי מספר כימיקלים הנמצאים במשקעים הנוצרים על ידי העישון (tar) ובעשן הסיגריות הינם קרצינוגניים, כלומר חשיפה אליהם גורמת לסרטן. שוב, תגליות רבות אודות קיומם של חומרים כאלה בעשן ובמשקע נעשו על ידי אנגל רופו, שפרסם את המממצא הראשון שלו ב-1939. מחקרים שנעשו בסוף שנות ה-40 ותחילת שנות ה-50 חשפו כימיקלים קרצינוגניים נוספים הקשורים בסיגריות.

עם זאת, עדיין לא הייתה תשובה לשאלה החשובה מכולן: האם הסיכון של אדם מעשן לחלות בסרטן הריאה גבוה מהסיכון של אדם שלא מעשן, ואם כן, עד כמה ההבדל בין הסיכונים משמעותי?

כדי לענות על שאלה זו, יש צורך במחקר פרוספקטיבי. במחקר כזה מתחילים לעקוב אחרי שתי קבוצות של אנשים: מעשנים ולא מעשנים, ועוקבים אחריהם לאורך זמן. שני מחקרים גדולים מסוג זה נערכו בשנות ה-50.

המחקר הראשון נערך בארצות הברית בין 1952 ל-1955, ותוצאותיו פורסמו בתחילת 1958. הוא כלל כ-187 אלף נבדקים, גברים בגילאים 50 עד 70. תקופת המעקב הראשונית הייתה קצרה יחסית, 44 חודשים, אולם המדגם הגדול איפשר זיהוי הבדלים בין קבוצת המעשנים וקבוצת הלא מעשנים, אם יש כאלה במסגרת הזמן הזה. המחקר, שהובילו החוקרים האמונד והורן, העלה כי שיעור התמותה הכולל (מכל סיבה שהיא) בקרב המעשנים היה גבוה ב-57% משיעור התמותה בקרב לא מעשנים. גם שיעור התמותה במחלות לב היה גבוה ב-50%. שיעור התמותה מסרטן בקרב המעשנים היה גבוה כמעט פי 2 בהשוואה לאותו נתון בקרב הלא מעשנים. כאשר מדובר במוות עקב מחלה ריאתית כלשהי (לא כולל סרטן), שיעור התמותה בקרב מעשנים היה גבוה פי 2.85 בהשוואה ללא מעשנים. במחלות אחרות לא נצפו הבדלים משמעותיים. תקנון על פי גיל לא הביא לשינוי משמעותי בתוצאות. עם זאת, עלה כי בקרב מעשני סיגרים או מקטרת, וכן בקרב מעשנים מזדמנים, ההבדלים בשיעורי התחלואה והתמותה היו נמוכים יותר בינם ובין הלא מעשנים. המחקר הראה גם כי שיעורי התחלואה והתמותה עולים עם כמות העישון היומי – יותר סיגריות ביום = סיכון גבוה יותר. שיעור מקרי המוות בין אלה המעשנים חבילת סיגריות או יותר ביום כמעט כפול משיעור המקרים בקרב אלה המעשנים פחות מחבילה ביום.

מחקר נוסף נערך בבריטניה על ידי ריצ'רד דול ואוסטין ברדפורד היל. זה היה מחקר בהיקף קטן יותר, כ-40 אלף איש, כולם רופאים. עם זאת, תקופת המעקב הייתה ארוכה יותר. תוצאות ראשוניות שפורסמו ב-1956, העלו ממצאים דומים לאלה שנצפו במחקר של האמונד והורן. המעקב אחרי הרופאים נמשך עד שנת 2001. נמצא כי עישון מקצר את תוחלת החיים בכ-10 שנים. יותר מ-50% מהמעשנים מתו מסרטן או ממחלות לב. גם מחקר זה הראה כי הסיכון עולה עם כמות הסיגריות שהחולה מעשן.

ממתאם לסיבתיות – האם עישון הוא גורם סיכון לתחלואה בסרטן הריאה?

ג'רום קורנפילד

כל המחקרים שתוארו עד כה אינם מוכיחים סיבתיות, לפחות ברובם. אמנם הניסויים בבעלי חיים היו ברובם ניסויים מבוקרים, בהקצאה פחות או יותר רנדומלית, אולם האם ניתן לגזור מהם מסקנות לגבי בני אדם? גם המחקרים הפרוספקטיביים שצפו בבני אדם לאורך זמן, היו, ובכן, ניסויים תצפיתיים. לא הייתה הקצאה רנדומלית לקבוצת מעשנים וקבוצת לא מעשנים: זה בלתי אפשרי לא מבחינה אתית ולא מבחינה מעשית. שתי הקבוצות היו שונות זו מזו באופן מהותי: אלה בחרו לעשן ואלה לא, ולא ניתן לשלול את האפשרות שיש ביניהן הבדלים מהותיים נוספים.

את המשימה לענות לכל דברי הביקורת שנמתחו על רוב המחקרים לקחו על עצמם ג'רום קורנפילד מהמחלקה לביוסטטיסטיקה באוניברסיטת ג'ונס הופקינס ועמיתיו. במאמר שפורסם ב-1959, הביאו קורנפילד ועמיתיו סקירה של כל העדויות בדבר הקשר בין עישון ותחלואה בסרטן וענו לכל הביקורת שנמתחו על המחקרים השונים. הביקורות סווגו לחמישה נושאים מרכזיים: ארבעה מהם עוסקים בנתונים ולאוכלוסיות במחקרים השונים, בתקפות של המחקרים הרטרוספקטיביים והפרוספקטיביים, בתקפות של הממצאים הפתולוגיים ובתקפות של תוצאות ניסויי המעבדה. אני לא אסקור כאן את כל הנושאים האלה. אני בהחלט ממליץ לכל מי שמתעניין בסטטיסטיקה ובאפידמיולוגיה לקרוא את המאמר.

אסקור כאן רק את התגובה של קורנפילד ועמיתיו לביקורת העוסקות בפרשנות לתוצאות שהתקבלו. (מעתה אתייחס רק לקורנפילד כאל מייצג הכותבים).

קורנפילד מסביר כי ישנן שלוש פרשנויות אפשריות לנתונים. האפשרות הראשונה היא כי עישון גורם לסרטן. האפשרות השניה היא כי סרטן גורם לעישון, דבר שניתן להצדיק על ידי הנחה של קיום מצב "קדם-סרטני", המתבטא בתחילה על ידי צורך לניקוטין ומאוחר יותר בסרטן עצמו. האפשרות השלישית היא קיומו של גורם משותף, אולי גנטי, אשר גורם לאנשים גם לעשן וגם לחלות בסרטן.

מי שהציע את האפשרות השניה היה . המשמעות של האפשרות הזו היא קיומם של גידולים סרטניים שאובחנו רק בגיל 50 אבל החלו להתפתח לפני גיל 18, שהוא הגיל החציוני לתחילת העישון. מכיוון שאין שום עדות או ממצא התומכים בכך, קורנפילד דוחה את הטענה על הסף.

באשר להשערת הגורם במשותף, קורנפילד טוען כי הנתונים והעדויות שנאספו עד כה הינם קונסיסטנטיים עם הטענה כי עישון גורם לסרטן אך לא עם הטענה של קיום גורם משותף. טענתו היא כי תיאוריית הגורם המשותף אינה עולה בקנה אחד עם: השינוי והעליה בתפוצה של סרטן הריאה ב-50 השנים האחרונות, העדויות לקרצינגוניות של משקעי העישון בניסויים בחיות, התמותה הפחותה מסרטן הריאה בקרב מעשנים שהפסיקו לעשן, וההבדלים שנצפו בין מעשני סיגריות ובין מעשני סיגרים או מקטרות. גם אם כל אחד מארבעת הנימוקים אינו טיעון מספק נגד השערת הגורם המשותף, טוען קורנפילד, צירופם יחד אינו מאפשר "התייחסות רצינית" לטענת הגורם המשותף. קורנפילד מבהיר למעשה כי נטל הוכחת טענת הגורם המשותף מוטל על הטוענים את הטענה.

לבסוף עובר קורנפילד לדון בביקורת על "השערת הסיבתיות", כלומר הטענה כי עישון גורם לתחלואה בסרטן הריאה. בתחילה הוא מטפל ברונלד פישר, שטען כי אין התאמה בין ההבדלים בעליית התחלואה בסרטן הריאה בין נשים וגברים, כאשר בקרב הגברים התחלואה גבוה יותר, ובין קצב העליה בשיעור הנשים המעשנות שהינו גבוה מקצב העליה בשיעור הגברים המעשנים. תשובתו של קורנפילד היא שטענתו של פישר לא נתמכת על ידי הנתונים הקיימים.

טענה נוספת נגד הקשר הסיבתי בין עישון ותחלואה ותמותה מסרטן הריאה, היא כי במחקרים נאספו למעשה נתוני תמותה ולא נתוני תחלואה, כאשר יש סיבות רבות לתמותה. בקרב מעשנים נצפתה עליה בתמותה גם ממחלות לב, מחלות ריאתיות ואחרות, אך לא מסיבות אחרות כגון תאונות. לכן, טען ארקין ((כל ההפניות נמצאות במאמר של קורנפילד ועמיתיו)) עישון אינו הגורם לתחלואה אלא רק סימפטום: אנשים אלה לא שומרים על בריאותם באופן כללי, ובפרט מעשנים. גם ברקסון העלה טענה דומה. בנוסף לטענת "העישון הוא סימפטום" שהעלה ארקין, טוען ברקסון כי אין זה סביר שגורם אחד יהווה גורם סיכון למספר מחלות. ברקסון טוען למעשה כי העקרונות של רוברט קוך מופרים.

קורנפילד משיב כי אין שום בעיה בטענה שגורם סיכון אחד יכול לגרום למספר תוצאות. הוא מביא כדוגמה את הערפל הגדול בלונדון שאירע ב-1952, אשר גרם לעליה בתמותה ממספר סיבות, בעיקר מחלות נשימתיות ומחלות לב כליליות. הוא מסביר כי עשן הסיגריות אינו חומר אחיד, אלא תערובת של מאות כימיקלים שונים, שרק התכונות של חלק מהם נחקרו עד כה. לדעת קורנפילד, אין זה מתקבל על הדעת כי כל החומרים האלה גורמים לאותה תוצאה. עולם שבו יש התאמה חד-חד-ערכית בין סיבה לתוצאה הינו ללא ספק יותר קל יותר להבנה, אך אנו איננו חיים בעולם כזה.

קורנפילד מודה כי אכן יש צורך במחקר נוסף כדי להבין את המנגנון המקשר בין העישון ובין התפתחות הסרטן ומחלות אחרות. אולם הוא מסביר כי אין די בכך כדי לשלול את קיומו של קשר סיבתי, מה גם שהנתונים שנאספו עד כה עולים בקנה אחד עם קיומו של קשר סיבתי.

לסיום מתייחס קורנפילד לשאלה מדוע ישנם מעשנים שאינם חולים בסרטן הריאה ומאידך יש אנשים שאינם מעשנים ובכל זאת חולים, ומודה שהתשובה לכך לא ידועה. הוא מביא לדוגמה את "אסון ליבק", מקרה בו 251 תינוקות קיבלו חיסון לשחפת אשר היה מזוהם בזן פעיל של חיידק הגורם למחלה. למרות זאת, כעשירית מהתינוקות לא פיתחו כלל תסמינים של דלקת ריאות. האם נתון זה סותר את הטענה כי אותו חיידק דורם לדלקת ריאות?

קורנפילד מסיים ואומר כי למרות שהנתונים אינם מושלמים, כמעט ואין מחלוקת על כך שהנתונים מראים כי עישון הוא גורם סיכון בריאותי, וכי הוא ועמיתיו אינם יכולים לקבל את הטענה כי עישון הוא הרגל בלתי מזיק.

מקורות

Proctor, R. N. (2012). The history of the discovery of the cigarette–lung cancer link: evidentiary traditions, corporate denial, global toll. Tobacco control, 21(2), 87-91. (pdf)
Witschi, H. (2001). A short history of lung cancer. Toxicological sciences, 64(1), 4-6. (pdf)
Cornfield, J., Haenszel, W., Hammond, E. C., Lilienfeld, A. M., Shimkin, M. B., & Wynder, E. L. (1959). Smoking and lung cancer: recent evidence and a discussion of some questions. Journal of the National Cancer institute, 22(1), 173-203. (pdf)

הפוסטים הקודמים בסדרה

הפוסטים הבאים בסדרה

נשלח: 16 בדצמבר, 2019. נושאים: ביוסטטיסטיקה, בריאות, האנשים שמאחורי הסטטיסטיקה, הסקה סיבתית, מדע, מה אומרת הסטטיסטיקה.
תגובות: 11 | טראקבק

ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד

אשה בת 50 עברה בדיקת לגילוי מוקדם של , והתקבלה תוצאה חיובית. (( התוצאה חיובית אך המשמעות לנבדקת היא שלילית מאוד )) עם זאת, החולה והרופאה יודעות כי הבדיקה אינה מדוייקת ב-100% ותיתכן תוצאה שגויה.

השאלון שואל איזו פרופורציה של נשים שתוצאת הממוגרפיה שלהן חיובית אכן חולות בסרטן השד, וזאת על פי נתוני ה-NHS, שירותי הבריאות הלאומיים של בריטניה. את התשובה קל למצוא בגוגל: בערך אחת מכל ארבע נשים בגילאי 50 עד 70 שנקראות לבירור נוסף עקב תוצאה שאינה שלילית באופן חד משמעי, אחת אכן חולה בסרטן השד. נתון זה נקרא של הבדיקה. פורמלית, נאמר כי ערך הניבוי החיובי של בדיקת ממוגרפיה לגילוי מוקדם של סרטן השד בקרב נשים בגילאי 50 עד 70 הוא 25%. (אני מציע שתעצרו רגע לחשוב האם ערך הניבוי החיובי של 25% הוא סביר בעיניכם. אין תשובה אובייקטיבית לשאלה הזו.)

מכאן שאם תוצאת הבדיקה חיובית, עדיין יש סיכוי של 75% בערך שהנבדקת אינה חולה. כלומר: מתוך כל ארבע נשים בגילאי 50 עד 70 שתוצאת הממוגרפיה שלהן חיובית, שלוש אינן חולות.

לנשים צעירות יותר, ערך הניבוי החיובי נמוך יותר, ולכן ארגוני הבריאות לא ממליצים לנשים מתחת לגיל 50 שאינן נמצאות בקבוצת סיכון לעבור בדיקת ממוגרפיה.

שתי הפסקאות האחרונות עשויות לעורר בכן תמיהה, ובצדק. בדיקת הממוגרפיה היא אותה בדיקה, לא משנה מה גיל האישה שעברה את הבדיקה. אז למה ערך הניבוי החיובי משתנה עם הגיל?

כדי להבין זאת דרוש תחילה הסבר קצר על בניית כלים דיאגנוסטיים כגון בדיקת ממוגרפיה לגילוי מוקדם של סרן השד, או כל בדיקה אחרת.

כאשר מפתחים בדיקה כזו, מסתמכים על נתונים אמיתיים, שבהם אנחנו יודעים גם את תוצאת הבדיקה: חיובית או שלילית, וגם את המצב האמיתי של הנבדק: חולה או בריא. למעשה, הקריטריון לפיו קובעים האם תוצאת הבדיקה חיובית או שלילית נקבע בדרך כלל על סמך המצב הרפואי של הנבדק ותוצאת הבדיקה. כך למשל, אם עורכים בדיקת דם יכולים לקבל טווח של ערכים, ואז קובעים איזשהו קו מפריד כך שהערכים הגבוהים מהקו נחשבים לחיוביים ואלה שמתחת לקו נחשבים שליליים (או להיפך) ((כיצד קובעים את ערך הקו המפריד? זה נושא לרשימה אחרת)) . בבדיקות ממוגרפיה זה קצת יותר מסובך כי אין תוצאה מספרית, אבל העיקרון דומה.

לאחר שנקבע הקריטריון לפיו מחליטים האם תוצאת הבדיקה חיובית או שלילית, ניתן לחשב כל מיני מדדים המאפיינים את הבדיקה. שני מדדים נפוצים הם (specificity) (sensitivity) של הבדיקה, והם, כאמור, מאפיינים של הבדיקה עצמה.

ערך הניבוי החיובי של הבדיקה נקבע על פי שלושה ערכים. שניים מהם הם הסגוליות והרגישות. הערך השלישי הוא (prevalence) של המחלה, כלומר עד כמה המחלה שכיחה באוכלוסייה הנבדקת. (( למי שמעוניין בנוסחה – הנה קישור )) . עם קצת אלגברה אפשר לראות כי ככל שהמחלה נפוצה יותר באוכלוסייה, כך ערך הניבוי החיובי של הבדיקה עולה.

מכאן ברור הקשר בין ערך הניבוי החיובי של בדיקת הממוגרפיה ובין הגיל של הנבדקת. בקבוצת האוכלוסייה של נשים צעירות, מתחת לגיל חמישים לצורך הדיון, מחלת סרטן השד נפוצה פחות, ולכן ערך הניבוי החיובי נמוך יותר עבור נשים צעירות יותר. מסיבה זו (ומסיבות נוספות) ארגוני הבריאות לא ממליצים על בדיקת ממוגרפיה לנשים מתחת לגיל 50 שאינן בקבוצת סיכון.

רשימה זו היא הרשימה השמינית והאחרונה בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 15 באוקטובר, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: 5 | טראקבק

מה מספר הכדורים האדומים בכד? – אמידת נראות מירבית

בכד יש 90 כדורים, חלקם אדומים וחלקם לבנים. נאמר לכם כי מספר הכדורים האדומים הוא 45 או 60 (אין אפשרות אחרת).

אתם מוציאים מהכד 300 כדורים עם החזרה, כלומר: מערבבים היטב את תכולת הכד, מוציאים כדור, רושמים את צבעו, ומחזירים אותו לכד. אחר כך מערבבים שוב את תכולת הכד, מוציאים שוב כדור, רושמים את צבעו ומחזירים אותו לכד, כך 300 פעמים.

בסך בכל הוצאתם 175 כדורים אדומים מתוך 300. מהי ההערכה שלכם לגבי מספר הכדורים האדומים בכד?

הנה התשובות שקיבלתי לחידה הזו בטוויטר:

בואו נעשה קצת סדר.

ראשית, לגבי הבקשה להעריך את מספר הכדורים האדומים בכד: בשפה יותר "סטטיסטית", הבקשה היא לאמוד את מספר הכדורים האדומים בכד, ולכן אשתמש מעתה בביטויים כגון "לאמוד" ו-"אומדן".

אם בכד יש 45 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 45 מתוך 90, כלומר חצי. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, מחציתם היו אדומים, כלומר הייתם שולפים 150 כדורים אדומים.

באופן דומה, אם בכד יש 60 כדורים אדומים, אז ההסתברות להוציא מתוכו כדור אדום היא 60 מתוך 90, כלומר שני שליש. לכן בעולם מושלם, מתוך 300 כדורים ששלפתם, שני שליש מתוכם היו אדומים, כלומר הייתם שולפים 200 כדורים אדומים.

כאן אתם יכולים כבר להבין למה הנתון שנתתי לכם הוא שהוצאו 175 כדורים אדומים: 175 הוא הממוצע של 150 ו-200, כלומר אתם נמצאים באמצע הדרך בין שני העולמות המושלמים ההיפותטיים. או שלא?

בקשה שקולה לבקשה שלי היא לאמוד את ההסתברות להוציא כדור אדום מהכד: האם ההסתברות הזו היא חצי או שני שליש. אם לא הייתי אומר לכם מראש שההסתברות הזו חייבת להיות חצי או שני שליש, הייתם בוודאי אומרים כי ההסתברות היא 175 מתוך 300, כלומר 0.5833. בסוף הפוסט הזה אסביר מדוע.

אחת הדרכים האפשריות לאמוד את מספר הכדורים האדומים בכד, או באופן שקול, לאמוד את ההסתברות להוציא כדור אדום מהכד היא להניח שאם ראינו משהו, זה אומר שההסתברות שנראה את אותו משהו גבוהה. העיקרון הזה נקרא . (( זו לא הגישה האפשרית היחידה. יש עוד גישות אפשריות, וייתכן ואדון בהן בפעם אחרת))

נדגים את העיקרון בעזרת דוגמא יותר קיצונית. נניח ששלפתם 300 כדורים מהכד וכל הכדורים שנשלפו היו אדומים. אם בכד היו 45 כדורים אדומים, אז ההסתברות למאורע הזה היא חצי בחזקת 300. אם בכד היו 60 כדורים אדומים, ההסתברות לשלוף 300 כדורים אדומים היא שני שליש בחזקת 300. לא צריך לדעת הרבה מתמטיקה כדי לדעת שחצי בחזקת 300 הרבה יותר קטן משני שליש בחזקת 300. לכן, אם הוצאתם 300 כדורים אדומים, האפשרות הסבירה יותר היא שיש בכד 60 כדורים אדומים, וזה יהיה האומדן שלכם למספר הכדורים האדומים בכד.

ההמשך ברור: יש לחשב את ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 45 כדורים אדומים, ואת ההסתברות שנשלפו 175 כדורים אדומים בהנחה שיש בכד 60 כדורים אדומים. אם ההסתברות הראשונה יותר גבוהה, אז האומדן שלכם יהיה 45. אם ההסתברות השנייה תהיה יותר גבוהה, אז האומדן שלכם למספר הכדורים האדומים יהיה 60.

את שתי ההסתברויות האלה אפשר לחשב על ידי נוסחת . אל תטרחו לנסות. רוב הסיכויים הם שהמחשב שלכם לא יצליח לחשב את ההסתברויות האלה באופן מדוייק. אפשרות שניה היא לנסות לחשב את ההסתברויות האלה על ידי להתפלגות הבינומית. הסברתי זאת בעבר כאן בבלוג, ראו למשל את הדוגמה הזו לחיזוי מספר הזוכים בלוטו.

אבל הדרך הכי קלה ומהירה היא לחשב את היחס בין שתי ההסתברויות (( אני מדלג על החישובים כי זה לא החלק החשוב כאן. למי שמעוניין, החישובים נמצאים כאן )). מספרים שצריך לחשב בדרך, כמו 300 עצרת (מספר בן 615 ספרות) יצטמצמו, ולבסוף תקבלו כי ההסתברות להוציא 175 כדורים אדומים כאשר יש בכד 45 כדורים אדומים גדולה פי 1.4 מההסתברות להוציא להוציא 175 כדורים אדומים כאשר יש בכד 60 כדורים אדומים. לכן האומדן שלי למספר הכדורים האדומים בכד הוא 45.

אומדן זה הוא . הגעתי אליו על ידי כך שחישבתי את ההסתברות לקבל 175 כדורים אדומים בשני המצבים האפשריים, ובחרתי במצב שבו ההסתברות להוציא 175 כדורים אדומים הייתה גבוהה יותר.

מה היה קורה אילו לא אמרתי לכם כי מספר הכדורים בכד הוא בהכרח 45 או 60?

אין בעיה: פשוט צריך לחשב את כל ההסתברויות האפשריות לכל המקרים, החל מ-0 כדורים אדומים ועד ל-90 כדורים אדומים. בסך הכל מדובר כאן ב-91 חישובים, ואז למצוא את הערך שעבורו מתקבלת ההסתברות המקסימלית. אם תעשו את החישובים תמצאו כי הערך הזה הוא 59.

אבל יש דרך יותר קלה. אפשר לכתוב את ההסתברות להוציא 175 כדורים אדומים כפונקציה של ההסתברות להוציא כדור אדום אחד מהכד בשליפה בודדת. בעזרת קצת אפשר למצוא את הערך שיביא את ההסתברות הזו למקסימום, וזה יהיה אמדן הנראות המירבית להסתברות להוציא כדור אדום מהכד.

שיטת האמידה על ידי נראות מקסימלית היא אחת משיטות האמידה החשובות ביותר בסטטיסטיקה. זאת מכיוון שלאמדי נראות מקסימלית יש תכונות מתמטיות העושות אותם לעדיפים במספר מובנים על פני אמדים אחרים. לכן השימוש בשיטה הזו נפוץ מאוד, וכל תכנה סטטיסטית מאפשרת את החישוב שלהם עבור כמעט כל מודל סטטיסטי.

נשלח: 7 באוקטובר, 2019. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

יעילות טיפול חדש לאוסטאורופוזיס

נניח כי זה עתה אושר טיפול חדש . נתוני הניסויים הקליניים מראים כי 10% מהחולים שלא טופלו סבלו במהלך 3 שנות מעקב, בעוד שבקבוצה דומה של חולים שטופלו בקביעות בטיפול החדש, רק 5% סבלו משבר כזה.

בכמה חולים צריך לטפל בטיפול החדש כדי למנוע שבר אחד?

מתוך 100 חולים לא מטופלים, אנחנו מצפים כי 10 חולים יסבלו משבר. אם נטפל ב-100 חולים, יהיו בממוצע רק 5 חולים שיסבלו משבר. לכן טיפול ב-100 חולים מונעים 5 שברים, ומכאן שכדי למנוע שבר אחד יש צורך לטפל ב-20 חולים.

מדד זה ידוע בשם NNT: ראשי תיבות של Number needed to Treat. ככל שערכו נמוך יותר כך הטיפול יעיל ביותר. הערך הטוב ביותר הוא 1: טיפול כזה ימנע את השבר אצל כל החולים במשך שלוש שנים.

נשווה מדד זה למדדים אחרים. נסדר את הנתונים ההיפותטיים בטבלה:

	שבר
טיפול חדש	כן	לא	סך הכל
כן	5	95	100
לא	10	90	100
סך הכל	587	20413	200

היעילות היחסית של הטיפול (( בדומה לסיכון יחסי של גורם סיכון )) היא 50%, מכיוון שהסיכון לשבר הופחת מ-10 מתוך 100 (10%) ל-5 מתוך 100 (50%).
היעילות המוחלטת של הטיפול היא 5%: זהו ההפרש בין 10% ו-5%. שימו לב כי ה-NNT שווה ל-1 חלקי היעילות המוחלטת.
יחס הסיכויים הוא 0.47. הערך של יחס הסיכויים נמוך מ-1 וזה מציין כי הטיפול החדש עדיף על הטיפול הישן (( כאן מדברים על "יחס סיכויים" ולא על "יחס סיכונים" כדי לציין שמדובר בתוצאה חיובית. מבחינה מתמטית אין הבדל, כמובן. ))

בדוגמא זו, היעילות היחסית ויחס הסיכויים קרובים זה לזה בערכם, וזאת מכיוון שמספר הסובלים משבר בשתי הקבוצות דומה (90 מול 95), אולם כפי שכבר ראינו, לא תמיד זה המקרה.

רשימה זו היא הרשימה השביעית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

הנכם מוזמנים לקרוא:

נשלח: 2 באוקטובר, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

מה הסיכון באכילת בשר מעובד?

בשנת 2014, המכון הבינלאומי לחקר הסרטן הודיע כי כל סוגי הבשר המעובד, ובכלל זה בייקון, סווגו כגורמי סרטן בדרגה 1. סיווג זה מתייחס לרמת העדויות המחקריות הקיימות המעידות על הקשר בין אכילת בשר מעובד ותחלואה בסרטן, אולם לא על רמת הסיכון. נוסף לכך נמסר כי אכילת בשר מעובד באופן קבוע מגדילה את הסיכון לחלות ב-18%. אני ממליץ לכם לקרוא את דף המידע של האיגוד האמריקני לחקר הסרטן בנושא. הנתון של 18% נשמע מפחיד, לא?

כמו כן, ידוע כי בבריטניה הסיכון הכללי לחלות בסרטן המעי הגס במהלך החיים הוא בערך 6% לנשים ו-7% לגברים. המשמעות היא כי מתוך כל 100 נשים אנו מצפים כי כשש נשים יאובחנו כחולות בסרטן המעי גס בשלב כלשהו של מהלך חייהן. מתוך 100 נשים האוכלות בקביעות בשר מעובד, לאיזה מספר של אבחונים נצפה?

החשבון הוא פשוט: 18% מתוך 6 הם 1.08 (( החישוב הוא: 6×18/100 )) , ולכן מתוך כל 100 נשים האוכלות בשר מעובד נצפה לבערך מקרה נוסף של סרטן המעי הגס, כלומר 7 מתוך מאה במקום 6. הסיכון המוחלט הוא בערך אחוז אחד. לא סיכון שניתן לזלזל בו, אבל הוא הרבה פחות מפחיד מ-18%.

במילים אחרות:

אם את אישה, ואוכלת כל יום 100 גרם בייקון או בשר מעובד אחר במשך כל ימי חייך, הסיכון שלך לחלות בסרטן המעי הגס יהיה בערך 7%, לעומת סיכון של 6% לו היית נמנעת כלל מאכילת בשר מעובד. הפרש הסיכונים הוא בערך 1%.

אם אתה גבר ואוכל מדי יום 100 גרם בייקון או בשר מעובד אחר במשך כל ימי חייך, הסיכון שלך לחלות בסרטן המעי הגס יהיה בערך 9.4%, לעומת סיכון של 8% לו היית נמנע כלל מאכילת בשר מעובד. הפרש הסיכונים הוא בערך 1.4%.

אל תבינו אותי לא נכון: אני לא מזלזל בסיכון המוגדל לתחלואה בסרטן המעי הגס. עליה בסיכון מ-6% ל-7% או מ-8% ל-9.4% היא משמעותית. האיגוד האמריקני לחקר הסרטן אכן ממליץ להפחית את הצריכה של בשר מעובד. עם זאת, הם לא ממליצים להפחית את צריכת הבשר באופן כללי. לא נמצא קשר בין אכילת בשר לא מעובד לבין תחלואה בסרטן, ולאכילת בשר יש גם יתרונות בריאותיים מסויימים. אבל חשוב להבין באילו תנאים העלייה הזו מתרחשת ומה סדר הגודל שלה. הנתון של 18% זורע היסטריה מיותרת, לדעתי.

ועוד הערה: יש הטוענים כי יש להפסיק כלל צריכת בשר מטעמים מוסריים. אני מכבד את כל מי שחושב כך, אבל כאן לא המקום לעריכת הדיון הזה. תגובות ברוח זו יימחקו.

בתיאבון.

רשימה זו היא הרשימה השישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

רשימות נוספות בסידרה:

נשלח: 20 בספטמבר, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

מהי טעות הדגימה האמיתית בסקרי הבחירות

בסקרי בחירות ודעת קהל נהוג לפרסם את "טעות הדגימה", ולפעמים אפילו את "טעות הדגימה המירבית". (( אני שם את הביטויים האלה במרכאות מכיוון שאינם מדוייקים ואף מטעים. אתייחס לכך בפוסט נפרד בעתיד. )) אבל כאשר מדובר בסקרי מנדטים, הנתון הזה בעייתי.
נניח כי פורסם סקר לפיו מפלגה מסויימת מקבלת 30 מנדטים, וכי מצויין כי טעות הדגימה היא 4.5%. מה משמעות הדבר? 4.5% מ-30 הם 1.35. מה זה אומר? שמספר המנדטים יהיה בין 28.65 ל-31.35? אף אחר לא ידווח בסקר כי הוא חוזה למפלגה הזו 30.68 מנדטים. ומה המשמעות של טעות הדגימה הזו לגבי מפלגה שעל סף אחוז החסימה?

מה יכול להשתבש?

בסקרי מנדטים יש שלוש טעויות שמעניינות אותנו:
סוג הטעות הראשון מתייחס אל ההפרשים בין מספר המנדטים שמפלגה מקבלת בפועל ובין מספר המנדטים שהסקר חוזה כי יקבלו, או באופן יותר מדוייק – ההפרש המקסימלי שמתקבל. כמובן שאם נסתכל על כל ההפרשים של כל המפלגות הם יקזזו זה את זה וסכומם יהיה תמיד 0 ((מדוע?)), הנתונים המעניינים הם הערכים המוחלטים של ההפרשים האלה. לדוגמא, אם מפלגה מסויימת מקבל בפועל 10 מנדטים, סקר אחד חוזה לה 12 מנדטים וסקר אחר חוזה לה 8 מנדטים, בשני הסקרים הטעות שווה ל-2.
מה הטעות המירבית האפשרית כאן? התשובה היא 120. ייתכן בהחלט כי על פי סקר מסויים מפלגה מסויימת תקבל 120 מנדטים אך בפועל היא לא תעבור את אחוז החסימה. הסיכוי לכך אפסי, אך עדיין גדול מאפס. זו הסיבה לכך ששמתי קודם את הביטוי "טעות הדגימה המירבית" במרכאות כפולות. אבל מייד נראה כמה מדדים מעניינים שכן יכולים לתת לנו מבט אל רמת הדיוק של הסקר.
סוג הטעות המעניין השני הוא הסיכוי שהסקר יראה כי מפלגה מסויימת עברה את אחוז החסימה למרות שלא עברה אותו בפועל. זה כמובן תלוי במרחק של המפלגה מאחוד החסימה. אחוז החסימה הוא כיום כ-134 אלף קולות. הסיכוי שהסקר יטעה ביחס למפלגה שבפועל קיבלה רק 70 אלף קולות בוודאי נמוך מהרבה מהסיכוי הדומה למפלגה שקיבלה 133 אלף קולות.
סוג הטעות המעניין השלישי הוא הסיכוי שהסקר יראה כי מפלגה מסויימת לא עברה את אחוז החסימה למרות שעברה אותו בפועל. זוהי תמונת המראה של הטעות השניה.
הכל טוב ויפה, אבל איך מחשבים את כל הדברים האלה?

איך אפשר להעריך את גדולי הטעויות?

דרך אפשרית לקבל הערכות לגדלי הטעויות האלה היא לבצע סימולציה. הרעיון מאוד פשוט והוסבר כבר בעבר. מניחים הנחה על התוצאה האמיתית הבחירות. אחר כך לוקחים מדגם ורואים מה קורה. חוזרים על כך הרבה פעמים, ולבסוף ממצעים הכל.
הסימולציה שלי מתייחסת לתוצאות ההיפותטיות הבאות לגבי הבחירות לכנסת ה-22. המספרים כמובן לא אמיתיים. הם מתבססים על תוצאות הבחירות לכנסת ה-21 בתוספת כמה שינויים שהכנסתי כדי להתאים אותם למה שאני רוצה להדגים. הנה טבלת "תוצאות האמת" שלי:

מפלגה	מספר הקולות	מספר המנדטים
הליכוד	1140370	36
כחול לבן	1125881	35
הרשימה המשותפת	337108	10
ש"ס	258275	8
יהדות התורה	249209	8
ימינה	283910	8
העבודה	190870	6
ישראל ביתנו	173004	5
המחנה הדמוקרטי	135529	4
עוצמה לישראל	133211	0
נועם	75223	0
כל השאר	33333	0
סך הכל	4102590	120

בישלתי את המספרים כך שאחוז החסימה עומד על 134417 קולות. עוצמה לישראל נמצאת קצת מתחת לאחוז החסימה, המחנה הדמוקרטי קצת מעליו. המרחק של נועם מאחוז החסימה הוא כ-59 אלף קולות, בדומה למרחק של מפלגת העבודה (54 אלף). המרחק של ישראל ביתנו מאחוז החסימה הוא כ-39 אלף קולות.
עכשיו אני יכול לקחת מדגם, של 500 איש נניח, מתוך האוכלוסייה שמונה כ-4.1 מיליון מצביעים. אני פשוט אבחר באופן מקרי 500 איש מתוכם. המדגם שלי יהיה מושלם: אין הטיה כי לכל האנשים מהאוכלוסייה יש את אותו הסיכוי להיכלל במדגם, ואף אחד לא ישקר לי כאן.

הנה מדגם לדוגמה, וחלוקת המנדטים כפי שחישבתי על פי תוצאותיו:

מפלגה	מספר הקולות	מספר המנדטים
הליכוד	130	34
כחול לבן	132	34
הרשימה המשותפת	37	9
ש"ס	28	7
יהדות התורה	31	8
ימינה	38	10
העבודה	32	8
ישראל ביתנו	23	6
המחנה הדמוקרטי	17	4
עוצמה לישראל	0	0
נועם	0	0
כל השאר	0	0
סך הכל	500	120

אנחנו יכולים לראות למשל שהסקר העניק לליכוד ולכחול לבן 34 מנדטים כל אחת, בעוד שלפי "תוצאות האמת" הן קיבלו 36 מנדטים ו-35 מנדטים בהתאמה. לכן הטעויות לגבי שתי המפלגות האלה שוות ל-1 ו-2. תוכלו לוודא כי הטעות המקסימלית שנצפתה בסקר הזה היא 2, הטעות החציונית היא 1 והטעות הממוצעת היא 0.91. הסקר הזה לא העלה את עוצמה לישראל ונועם אל מעל אחוז החסימה, ולא הוריד אף מפלגה שעברה בפועל את אחוז החסימה אל מתחת לו.
את התרגיל הזה ביצעתי 2000 פעם עבור מדגם בגודל 500, וגם עבור מדגמים בגדלי 1000, 2000, 4000, ו-8000.

תוצאות הסימולציה

תוצאות גדלי הטעות שחושבו בסימולציה מופיעות בטבלה הבאה:

גודל המדגם	טעות ממוצעת	טעות מקסימלית	טעות חציונית
500	1.52	4.58	1.12
1000	1.13	3.82	0.80
2000	0.92	3.42	0.60
4000	0.77	3.18	0.39
8000	0.67	3.06	0.23

אנו רואים כי הטעות הממוצעת בסקר בגודל 500 היא כמנדט וחצי, והיא כמובן קטנה ככל שגודל המדגם עולה. הטעות החציונית בסקר כזה היא קצת יותר ממנדט, אבל הטעות המקסימלית היא יותר מ-4.5 מנדטים. זה קורה בגלל המפלגות שקרובות לאחוז החסימה. כשמפלגה שלא עוברת את אחוז החסימה בפועל אבל עוברת אותו במדגם הטעות היא 4 מנדטים, וכך גם במקרה ההפוך.
עד כמה נפוצים המקרים האלה? בדוגמא הזאת זה קורה די הרבה, מכיוון שיש בו שתי מפלגות שקרובות מאוד לאחוז החסימה:

גודל המדגם	הועברו בטעות	לא עברו בטעות
500	44.8	76.8
1000	44.9	56.2
2000	43.7	51.9
4000	44.5	46.9
8000	42.4	47.3

חוץ מהאנומליה של 76.8% למדגם בגודל 500, אנחנו רואים כי בדרך כלל הסיכויים קרובים ל-50%.
ניתן לערוך כמובן ניתוחים יותר מתוחכמים: לחשב סטיות תקן ורווחי סמך, לבדוק מה הסיכויים לטעות במעבר אחוז החסימה עבור גדלים שונים של מפלגות, ועוד. מי שמעוניין מוזמן להוריד את קוד הסימולציה שכתבתי בשפת R ולנסות לשחק עם הנתונים.

סיכום

בסקרי מנדטים קטנים, כאשר גודל המדגם הוא 500, ייתכנו טעויות משמעותיות בחיזוי מספר המנדטים האמיתי. הטעות הממוצעת היא כמנדט וחצי, והטעות המקסימלית עaויה להיות גבוהה באופן משמעותי.
עבור מפלגות המתנדנדות באיזור אחוז החסימה, גם מדגם גדול הרבה יותר אינו יכול לתת תשובה אמינה לגבי השאלה האם מפלגות אלה יעברו את אחוז החסימה.

ראו גם את שאר הרשימות שכתבתי בנושא הסקרים.

נשלח: 13 בספטמבר, 2019. נושאים: מה אומרת הסטטיסטיקה, סקרים, על סדר היום.
תגובות: 2 | טראקבק

הקשר בין אכילת בשר ותחלואה בסרטן השד – יחסי סיכונים

דרך מקובלת לבטא אפקט של טיפול או התערבות רפואית היא מה שמכונה "יחס הסיכויים" ((ולפעמים – יחס הסיכונים – תלוי בהקשר)) או באנגלית odds ratio. המונח העברי מופיע במרכאות מכיוון, כפי שאסביר מייד, התרגום הוא לא מדוייק עד לא נכון, תלוי את מי שואלים.

השאלה שנשאלה בשאלון היא מאוד פשוטה. נתונה קובייה הוגנת, כלומר כאשר מטילים אותה לכל התוצאות יש סיכוי שווה להופיע. לכן, מהו ה-odds של הטלת המספר 6?

מי שעוסק בהימורים יבין מייד את התשובה. יש 6 תוצאות אפשריות, לכולן אותו סיכוי. חמש תוצאות אפשריות אינן שוות ל-6, יש רק תוצאה אחת השווה ל-6, לכן ה- odds, היחס בין מספר התוצאות הרצויות לבין מספר התוצאות הלא רצויות הוא 1:5. יחס זה מכונה לעיתים בשם "יחס ההימורים".

שימו לב ש-1:5 אינו אומר כי ההסתברות להטלת 6 היא חמישית. ההסתברות להטלת 6 היא שישית. המשמעות של היחס 1:5 היא שההסתברות להטלת 6 קטנה פי 5 מההסתברות לא להטיל 6. בנוסף לכך, אם נחלק 1 ל-5 נקבל חמישית. נקבל חמישית גם את נחלק את הסיכוי לקבל 6, שהוא שישית, בסיכוי לא לקבל שש, שהוא חמש שישיות. זה תמיד נכון, ולכן יחס זה הוא יחס בין שני סיכויים.

ה-odds ratio, כפי ששמו מעיד עליו, הוא יחס בין שני odds, ומכיוון שה-odds הוא יחס, הרי שה-odds ratio הוא יחס בין שני יחסים, שכל אחד מהם הוא יחס בין שני סיכויים. לכן הביטוי "יחס הסיכויים" בעייתי בעיניי. לעיתים מכנים אותו בשם "יחס צולב", ואסביר מדוע בהמשך הפוסט.

הנה דוגמה שתסביר מהו ה-odds ratio, ואת הקשר בינו ובין הסיכון היחסי והסיכון המוחלט.

הדוגמה לקוחה מידיעה שפורסמה באתר Medical News Today, בה נאמר כי הסיכון לחלות אצל נשים הניזונות מתפריט מוטה בשר אדום גבוה ב-23% מהסיכון של נשים הניזונות מתפריט מוטה בשר עוף.

מדובר במחקר תצפיתי בו התבצע מעקב אחרי 42016 אלף נשים הנמצאות בקבוצת סיכון לתחלואה בסרטן השד – לכל אחת מנשים אלו יש אחות שחלתה כבר בסרטן השד. המחקר עקב אחרי הרגלי האכילה שלהן, כולל אכילת סוגי בשר שונים ובשר מעובד. במשך תקופת המעקב, כשבע וחצי שנים, 1536 נשים אובחנו כחולות בסרטן השד. מדובר באשה אחת מתוך כל 27 בערך (( למי שישאל איך קיבלו 1 ל-27 כאשר הנתון שכולם מכירים הוא 1 מתוך 9: הנתון של 1 מתוך 9 מתייחס לסיכון של אישה לחלות בסרטן השד במהלך חייה. תוחלת החיים של אישה ברוב העולם המערבי היא כשמונים שנה. הנתון של 1 מתוך 27 מתייחס אמנם לנשים בסיכון, אך במשך תקופת זמן קצרה בהרבה – רק כשבע וחצי שנים.)), סיכון לא מבוטל של כ-3.7%. מהו יחס הסיכונים לתחלואה בסרטן השד שנצפה באוכלוסייה זו במשך תקופת המעקב? 1536 נשים אובחנו כחולות בסרטן השד, 40480 נשים לא אובחנו. יחס הסיכונים הוא לכן 1536 ל-40480, או כ-1 ל-26. שימו לב כי הסיכון שונה מיחס הסיכונים.

החוקרים דיווחו כי הסיכון לתחלואה בקרב נשים שאוכלות בעיקר בשר עוף נמוך לעומת הסיכון בקרב נשים האוכלות בעיקר בשר אדום ב-28%.

למעשה הם ביצעו ניתוח הישרדות ודיווחו כי יחס הסיכונים במובן של Hazard Ratio בין אוכלות העוף ואוכלות הבשר האדום הוא 0.72 (( ראו את הרשימה "איך יודעים כמה אנשים מתים מנזקי העישון" להסבר קצת יותר רחב על המושג של ה- Hazard)). נתון זה מתקבל מחישוב המתקנן בתוכו משתנים נוספים, כגון גיל, BMI, עישון ומוצא אתני, וכמובן משך הזמן שעבר מתחילת המעקב ועד האבחון.

אבל (על פי החישובים שאפרט בהמשך):

יחס הסיכונים הוא 0.8 לומר הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר עוף נמוך רק ב-20% מהסיכון עבור נשים הניזונות מתפריט מוטה בשר אדום.

הפרש הסיכונים הוא 0.6% בלבד. הסיכון לחלות בסרטן השד עבור נשים הניזונות מתפריט מוטה בשר אדום הוא 3.1% ועבור אלה הניזונות מתפריט מוטה בשר עוף הוא 2.5%. (( שאלה מעניינת: אם אחוז התחלואה הכולל הוא 3.7%, אך התחלואה בעל אחת משתי הקבוצות האלה לחוד נמוכה מ-3.7%? ))

התובנה שלי: נתוני ה-odds ratio הם בעייתיים, ואין להם פירוש משמעותי ברור. הנתונים של הסיכון היחסי והפרש הסיכונים נותנים תובנה הרבה יותר טובה באשר לגורמי הסיכון.

למי שמעוניין בכל החישובים: עיון יותר מעמיק בנתונים מעלה כי הנתון המתוקנן של 0.72 נגזר מהנתונים הבאים (קישור לקובץ וורד).

מתוך כ-10500 נשים (כרבע מהאוכלוסייה) שאכלו בעיקר בשר אדום, היו 329 מקרי סרטן, ומתוך כ-10500 נשים שאכלו בעיקר בשר עוף היו 258 מקרים.

נסדר את כל הנתונים בטבלה יפה:

	תחלואה בסרטן השד
הטיית התפריט	כן	לא	סך הכל
בשר עוף	258	10242	10500
בשר אדום	329	10171	10500
סך הכל	587	20413	21000

מה אנחנו יכולים ללמוד מהמספרים האלה?

ה-odds, יחס הסיכונים לחלות בסרטן השד עבור נשים שאוכלות בעיקר בשר עוף הוא 258 ל-10242. עבור נשים שאוכלות בעיקר בשר בקר יחס הסיכונים הוא 329 ל-10171. נחלק את היחסים ונקבל כי היחס בין היחסים הוא 0.78:

תוצאה זו שונה מעט מהתוצאה שדווחה מכיוון שכאמור החוקרים ביצעו תקנונים שאנחנו לא ביצענו.

אבל שימו לב לחישוב: למעשה הכפלנו את שני המספרים שבאלכסון הראשי של הטבלה וחילקנו אותם במכפלת המספרים שבאלכסון המשני של הטבלה. ציירנו מין צלב כזה על הטבלה, ולכן יחס הסיכונים, ה-odds ratio נקרא לפעמים בשם יחס צולב.

.רשימה זו היא הרשימה החמישית בסדרת רשימות העוסקות בהערכת נתונים סטטיסטיים רפואיים, ומסתמכת על של מרכז וינטון לתקשורת סיכונים ועדויות כמותיות באוניברסיטת קיימברידג'.

ראו גם:

נשלח: 10 בספטמבר, 2019. נושאים: ביוסטטיסטיקה, בריאות, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק