מאז התפרצות מגיפת הקורונה נזרקים לאוויר המון נתונים על אחוזי התמותה מהמחלה. אייך מחשבים את האחוזים האלה? לכאורה זה מאוד פשוט: לוקחים את מספר המתים ומחלקים אותו ב-… במה בדיוק? אנסה לעשות קצת סדר.
אציין כי לא אתייחס במפורש ליתרונות, החסרונות, המשמעות והפרשנות של כל מדד, אלא רק כאשר אראה צורך בכך. אתם מוזמנים לקיים דיון ולשאול שאלות בתגובות כאן או בקבוצת הפייסבוק “חפירות על סטטיסטיקה“.
עדכון (15.4.2020): לאחר שקראתי חלק מהתגובות כאן ובדף הפייסבוק של נסיכת המדעים, אני רוצה להבהיר שאין כאן שום כוונה או ניסיון להסביר את המצב הנוכחי של המגיפה. המטרה היא רק להסביר את אופן חישוב המדדים השונים. הדוגמאות שכאן מייחסות לנתונים של האוכלוסייה הכללית, ויש להבהיר כי תמונת המצב האמיתית תלויה בעוד הרבה גורמים והפוסט הזה נמנע מלהתייחס אליהם.
מהו מספר מקרי המוות?
נתחיל במונה, כלומר במספר המתים. בדרך כלל מופיע שם מספר מקרי המוות המאומתים – confirmed deaths. זהו מספר האנשים שאובחנו כחולי קורונה ומתו סמוך לזמן האבחון. לרוב זהו מספר האנשים שמתו לאחר האבחון, אם כי תיאורטית ניתן לבדוק לאחר המוות אם המנוח היה חולה.
יש אנשים הטוענים כי לא צריך להביא במניין המתים אנשים שהיו מתים “ממילא”, כמו אנשים עם מחלות רקע או אנשים בגיל מופלג. אני חושב זה לא נכון. שיעור מקרי המוות בקרב חולי קורונה שהינם חולי סכרת או מחלות אחרות כגון מחלות לב, לחץ דם גבוה ומחלות דומות אכן גבוה יותר משיעור מקרי המוות באוכלוסייה הכללית, כמו גם בקרב אנשים מבוגרים – שיעור מקרי המוות עולה עם הגיל. אבל אנשים יכולים לחיות שנים רבות עם מחלות רקע כאשר הם מקבלים טיפול רפואי מתאים, ולכן לדעתי לא צריך לגרוע אותם ממספר המתים.
גם לגבי אנשים מבוגרים – הם לא היו “מתים ממילא” עקב גילם. תוחלת החיים של גברים בישראל היא בערך 80 שנה (( זה כמובן תלוי מין, מגזר וגורמים נוספים, כגון הרגלי עישון )). אבל למי שהגיע לגיל 80 לא נותרו בממוצע אפס שנות חיים אלא הרבה יותר. אם תבדקו בנתוני הלמ”ס, תראו כי תוחלת שארית החיים של גבר שהגיע לגיל 80 היא 8.9 שנים (קישור לקובץ pdf). אם תחשבו על זה קצת תראו שזה הגיוני לגמרי: כל מי שהגיע לגיל 80 מת אחרי גיל 80, ולכן גיל המוות הממוצע של האנשים שהגיעו לגיל 80 בהכרח גבוה מ-80. (( אני לא אדון כאן באופן חישוב תוחלת החיים ))
הבעיה השניה בחישוב מספר המתים עקב תחלואה בקורונה היא שכאמור – נספרים רק אנשים שאובחנו כחולים. סביר להניח שיש עוד אנשים שמתו עקב תחלואה בקורונה אך לא אובחנו כחולים באופן “רשמי”, כלומר הם לא confirmed. כמה אנשים כאלה יש? אף אחד לא יודע. בכל מקרה, מספר המתים מקורונה אינו קטן ממספר ה- confirmed deaths, וסביר להניח שהוא יותר גבוה.
נעבור למכנה: יש לנו את מספר מקרי המוות – במה מחלקים אותו? כאן יש מספר אפשרויות.
חישוב שיעור התמותה הבסיסי
המדד הבסיסי ביותר הוא פשוט “שיעור התמותה”, ה-mortality rate שמכונה לפעמים בשם crude mortality rate. זהו מספר המתים, בתקופת זמן מסויימת, מתוך כלל האוכלוסייה, כולל אלה שלא חולים או לא אובחנו כחולים. מדד זה מצלם תמונת מצב. ניקח דוגמה. בעת כתיבת שורות אלה, יש בישראל 103 מתים עקב חולי בקורונה בחודשיים האחרונים. האוכלוסייה בישראל היא בערך 9 מיליון איש. אז מחלקים 100 ב-9000000 ומקבלים 0.001% או, כפי שמקובל בקרב האפידמיולוגים, שיעור תמותה של 1.1 אנשים ל-100,000 בחודשיים האחרונים (( אני מעגל את כל המספרים לצורך ההדגמות )). עד כמה המדד הזה משקף את המציאות? זה תלוי כמובן בגודל המדגם, שבמקרה שלנו הוא משך הזמן בו מתבצעת המדידה. הדבר דומה במובן מסויים להערכת רמת הבטיחות של רכבים אוטונומיים.
מדדים המתייחסים לאוכלוסייה החולה
מדדים יותר רלוונטיים מתייחסים לאוכלוסייה החולה. לדוגמה, שיעור התמותה עקב סרטן הלבלב באוכלוסייה הכללית הוא נמוך כיוון שזו מחלה נדירה יחסית. אבל בקרב החולים, שיעור התמותה הוא מאוד גבוה (והוא תלוי כמובן בתקופת הזמן אליה מתייחסים, שיכולה להיות חודש מאז האבחון או שנה ממועד האבחון או כל תקופת זמן אחרת).
Case fatality rate
מדד אחד שמתייחס למספר החולים המאומתים הוא ה- case fatality rate או בקיצור CFR. (( אין לי מושג איך זה מתורגם לעברית )). כאן לוקחים את מספר המתים המאומתים, ומחלקים אותו במספר החולים המאומתים. בעת כתיבת שורות אלה, יש בישראל קצת יותר מ-11000 חולים מאומתים. נחלק 100 ב-11000 ונקבל 0.9%, או 909 ל-100000. ((ההצגה של מספר מקרים ל-100000 היא קצת בעייתית במקרה הזה, כי לפחות כרגע יש רק 100 מתים. זה קצת דומה לחישוב מספר האפיפיורים לקמ”ר בוותיקן, ששטחו רק כחצי קמ”ר. )). הבעיות? כפי שציינו קודם, מספר מקרי המוות גדול ממספר מקרי המוות המאומתים. לפי אותו הגיון, גם מספר החולים בפועל גדול ממספר החולים המאומתים. שלישית, במדד זה גם חולים אסימפטומטיים נכנסים למכנה. אלה הם האנשים שנדבקו ווירוס ולא פיתחו סימפטומים קליניים של המחלה.
Infection fatality rate
אם אתם חושבים שחולים אסימפטומטיים אינם צריכים להילקח בחשבון אלא רק חולים עם תסמינים, המדד שמעניין אתכם הוא ה-infection fatality rate, או בקיצור IFR. כאן מחלקים את מספר מקרי המוות במספר החולים שפיתחו תסמינים קליניים. למיטב הבנתי, הנתון של 11000 חולים מאומתים בישראל כולל גם חולים אסימפטומטיים. ההערכה משלי מבוססת על נתוני החולים לפי מצבם: קל, בינוני, קשה ומונשם. חיברתי את המספרים וקיבלתי קצת יותר מ-9500. נכון לעכשיו ה-IFR הוא בערך 100 חלקי 9500, כלומר קצת יותר מאחוז.
הסיכון למות
למדדי ה-CFR וה-IFR יש משמעות ותועלת במעקב אחרי הדינמיקה של המגיפה. ה-“בעיה” במדדים אלה היא שלמרבה השמחה רוב החולים לא ימותו. לכן מדדים זה אינם הסיכון של חולה במחלה למות. וזה מה שבאמת מעניין את מי שחולה, או מי שהסיכון הזה טורד את מנוחתו, ועם יד הלב, יש כאן מישהו שלא מוטרד מזה?
לפי הנתונים העכשוויים של האתר worldometers, יש כרגע בעולם כ-1.8 מיליון חולים. מה יהיה גורלם? אנחנו לא יודעים עדיין מה יהיה הגורל של רובם. אבל אנחנו כן יודעים מה עלה בגורלם של כ-549 אלף חולים המהווים כ-30% מסך החולים: כ-115 אלף מחולים אלה מתו, וכ-434 אלף חולים הבריאו. 115 מתוך 549 הם 21%. זהו הסיכון של חולה למות. אם לא לוקחים את החולים שבסין בחשבון, הסיכון למות הוא 23%. אם מישהו בעולם שמחוץ לסין חולה בקורונה, ואנחנו לא יודעים פרטים נוספים אודותיו, אז הסיכון שלו למות הוא 23%, וזה הרבה מאוד. זאת כמובן, בתנאי שה-549 אלף שמהלך המחלה שלהם הסתיים בהבראה או מוות מייצגים את שאר 1.3 מיליון החולים שמהלך המחלה שלהם לא הסתיים. אני חושב שהם כן מייצגים. אני עוקב אחרי הנתונים האלה כמעט שלושה שבועות, והיחסים נשארים קבועים כאשר מספר החולים הכולל, מספר המתים ומספר המחלימים גדל. אחוז המתים מתוך החולים שמהלך המחלה שלהם הסתיים במשך הזמן הזה הוא קצת יותר מ-20%.
מה הסיכון למות בישראל?
אני מודה שלא עקבתי אחרי הנתונים האלה בישראל לאורך זמן, אבל אני כן יודע את תמונת המצב הנוכחית: נכון למועד כתיבת שורות אלה, 103 מתו ו-1627 החלימו. כלומר אנחנו יודעים מה עלה בגורלם של 1730 חולים. 103 מתוך 1730 זה כמעט 6%. מצבנו טוב ביחס לעולם, לפחות כרגע. זה גם מדגם קטן יחסית. מוקדם לקבוע.
תודה רבה!
אני חושב שהחישוב של מתו\(הבריאו+מתו) בעייתי מכיוון ההגדרה של הבריאו.
מכיוון שההגדרה היא סט בדיקות מחמירות אזי לוקח יותר זמן להגיע למצב הבריא מאשר למצב מת.
לכן מספר הבריאים מאחר מול מספר המתים והאחוזים הם ככל הנראה נמוכים הרבה יותר (לפחות בישראל כאן הגדרת הבריאים היא כזו).
כאן אנחנו כבר נכנסים לדיון על הגדרות רפואיות, וזה לא התחום שלי.
תודה רבה לך על פוסט מסקרן מאוד ורלוונטי מתמיד לתקופה.
לבושתי, נדמה לי שהכללתי באופן אינטואטיבי את אחוז התמותה “הרגיל” (Case fatality rate) כסיכוי למות מ- COVID-19…
פשוט כך.
אני קורא לו ה”סיכוי למות” (להבדיל מ”הסיכון למות”?).
נניח והוא 1% (עיגלתי מעלה מ- 0.9%), אז הנחתי שמתוך 100 אנשים “רגילים” בכלל האוכלוסיה (חולים ולא חולים), אדם אחד ימות מ- COVID-19.
ומסתבר שיש מדד אחר שלא הכרתי, שהוא “הסיכון למות” במידה ואתה נדבק ב- COVID-19, והסיכון הזה הוא 20%~ שזה פשוט המון.
כלומר, מתוך 100 איש שכן ידבקו ב- COVID-19, עם או בלי סימפטומים, אזי 20 מהם ימותו.
כמובן שלא לוקחים בחשבון את כל מי שלא נבדק וכן נדבק, ואת כל מי שמת מ- COVID-19 אבל לא נבדק ולא יודעים עליו שמת מ- COVID-19.
זה אכן נתון מאוד מלחיץ, כי אם אתה נדבק, הסיכון שלך למות הוא 20% וזו כבר אופרה אחרת לגמרי…
הבנתי נכון?
כן. אני רוצה רק להדגיש ש-20% הוא הנתון העולמי,והוא כמובן שונה ממדינה למדינה. בישראל נכון לעכשיו הסיכון בכלל האוכלוסיה הוא קצת פחות מ-6%, ושוב צריך לסייג ולומר כי אם מפלחים את האוכלוסיה לתת אוכלוסיות מקבלים סיכונים שונים בקבוצות שונותץ
נראה לי שכשאנשים אומרים ש”אבל מת בן 80, באמת צריך לספור את זה?”
הם מתכוונים שכמות שנות החיים שאבדו עקב המחלה היא נמוכה יחסית.
אפשר תיאורטית לחשב את כמות שנות החיים שאבדו ולא את כמות המתים, וכך לראות שהפגיעה היא יחסית באוכולוסייה יותר מבוגרת וחולה.
אני לא בטוח שכולם מתכוונים לזה. נכון, מייקל לויט אמר בדיעבד שהוא התכוון לזה אחרי שמספר המתים עלה על התחזית הראשונית שלו (10).
אבל כן אפשר לחשב גם מדד של שנות חיים: לאמוד כמה שנות חיים אבדו, כמה ניצלו, ולבצע חישוב אריתמטי פשוט. ואז כמובן, כפי שפועלים על כל מדד אחר, יש לנקוט בפעולות שיקטינו את המונה ויגדילו את המכנה.
אבל יש כאן בעיות אתיות לא פשוטות שצריך לקחת בחשבון. אני לא מומחה לפילוסופיה, אבל יש לי בעיה עם הגישה התועלתנית, לפיה יש להשקיע את המשאבים במה שייתן את התועלת הגבוה ביותר. זו גישה סבירה במקרים מסויימים, אבל לי יש בעיה עם הגישה הזו כשמדובר בחיי אדם. לפי ההגיון הזה צריך למשל לתת משקל יותר גבוה להייטקיסט, למשל, בהשוואה למנקה רחובות, נניח, כי התרומה שלהם לתוצר גבוהה יותר. מכאן יש גם לגזור כי יש להשקיע יותר בבדיקות ובטיפול בהייטקיסטים ואולי להזניח לגמרי את מנקי הרחובות כי אם מישהו מהם ימות לא תהיה בעיה למצוא לו מחליף.
נראה לי שהסיכוי למות בין החולים כאן מוגזם. כדי לבצע חישוב נכון יש לבצע חישוב בנפרד לגבי קבוצות גיל, כאשר הרוב המכריע מאוד של החולים בארץ צעירים ושיעור התמותה שם ידוע כנמוך, גם בארצות אחרות.
אני בטוח שבניתוח שרידות צגיע למסקנות יותר מדויקות. אני סומך עליך שגם תעשה זאת …
1) ברור שחישובים לפי מין, קבוצות גיל וקבוצות סיכון למיניהן ושילובים של כל הדברים האלה יתנו סיכונים יותר ממוקדים, וזה נכון, אגב, לכל המדדים. יש כאן שתי בעיות עיקריות: אין נתונים זמינים לציבור על הפילוח של החולים, וכמו כן ככל שמפלחים יותר גדלי המדגם קטנים יותר ולכן במקביל האמדנים יהיו פחות מדוייקים.
2) לגבי מודלים של ניתוח הישרדות, קודם כל יש את אותה הבעיה של זמינות הנתונים. הבעיה השניה היא הגדרת ה-censoring ומה עושים עם החולים שמהלך המחלה שלהם טרם הסתיים. גם אם נוציא את אלה שעדיין חולים מהתמונה, אנחנו עדיין נותרים עם הבעיה הכי גדולה: היא בכך שהחלוקה בין מבריאים למתים אינה רנדומלית, בעוד שהמודלים המקובלים של ניתוח השרדות (ובכלל) מניחים חלוקה רנדומלית. יש כל מיני דרכים להתמודד גם עם הבעיה הזו. בעמוד המצגות יש הפניה למצגת Causal Inference for Survival Analysis שעוסקת בגישות אפשריות לניתוח נתוני השרדות תצפיתיים.
יש במדדים המון הטיות/הטעיות.
נתחיל מהסוף: כאשר משווים בין אלו שמתו לאלו שהחלימו וטוענים שהסיכוי של חולה מאומת למות הוא 23 אחוז מניחים שמשך הזמן בין אבחנה למוות זהה לזה אבחנה והחלמה. במידה ומשך הזמן למות קטן יותר אז יש הטייה כלפי מעלה.
הטייה נוספת מובלעת בהנחה שבמידה וחולה מאומת מת, אז הוא מת בעקבות הקורונה ולא מת עם קורונה (ומן הסתם עם וירוסים ובעיות רפואיות נוספות). זה כמובן לא משנה את הנתון של המתים, אבל משנה את האינטרפרטציה של הנתון.