חיפוש באתר

קישורים

עמודים

קטגוריות

איך יודעים כמה אנשים מתים מנזקי העישון

מחדליו של סגן שר הבריאות בנושא המלחמה בעישון, תוארו בדו"ח של מבקר המדינה מחודש מאי 2018. בין היתר נאמר כי בכל שנה מתים בישראל כ-8,000 בני אדם כתוצאה ממחלות הנגרמות מעישון. יש לי הרבה מה לומר על אוזלת היד וחוסר המעש של מקבלי ההחלטות בנושא, אבל כאן אני מדבר בעיקר על סטטיסטיקה, והנושא שיעלה היום לדיון הוא הנתון בדבר המוות של 8000 בני אדם בשנה כתוצאה מעישון. איך יודעים את זה?

זהו כמובן אומדן שמתבסס על איסוף נתונים ויישום של שיטות סטטיסטיות. גם זה, כמו הרבה דברים אחרים, מתחלק לשלושה חלקים. החלק הקשה הוא החלק שבו אוספים את הנתונים. החלק הקל הוא החלק שבו מחשבים את החישובים (מזינים את הנתונים למחשב ולוחצים על הכפתור). וביניהם יש את החלק בו צריכים להבין מה עושים, ובאופן עקרוני זה לא מסובך.

כמה אנשים מתים?

נתחיל באיסוף הנתונים. נתון אחד שצריך לדעת הוא כמה אנשים מתים בכל שנה. זה לא קשה, לפחות במדינה מסודרת שבה נאספים נתונים כאלה באופן מסודר וקבוע. נתוני תמותה נאספים בדרך כלל במשך שנים רבות. הלשכה המרכזית לסטטיסטיקה מפרסמת בכל חמש שנים לוחות תמותה המבוססים על הנתונים שנאספו בחמש השנים שקדמו לשנת הפרסום. מייד נעיין באחד הלוחות (קישור לקובץ pdf). הנה קטע מלוחות התמותה של הלשכה המרכזית לסטטיסטיקה, המתייחס לגברים יהודים ואחרים (כלומר – לא ערבים), בין השנים 2011 ל-2015:

 

 

 

 

 

 

 

אני יודע שהסיכוי שלי למות בסופו של דבר הוא 100%. אבל אני בעזרת לוח התמותה יכול לדעת יותר מזה. אני גבר יהודי בן 55, ומהשורה האחרונה של לוח התמותה שבתמונה אני יכול ללמוד כי בהיעדר כל מידע נוסף, הסיכוי כי אמות בשנה הקרובה הוא 0.00425. לחילופין, על פי נתוני הלשכה, מתוך כל 100000 גברים יהודים, 95506 יגיעו לגיל 56, ו-4494 לא יזכו לכך. אני יודע שיש חוסר תיאום בין שני המספרים האלה, וזה נובע מתוך דקויות סטטיסטיות שלא אכנס אליהן כאן[1]. אני גם יכול ללמוד מהלוח כי תוחלת החיים שלי, בהינתן שכבר הגעתי לגילי המופלג, היא 27.6 שנים פלוס מינוס סטיית תקן ואירועים לא צפויים. יש גם סיכוי שאגיע לגיל 100, אך הוא קטן למדי.

לעומת זאת, לגבר ערבי בגיל 55 במדינת ישראל, הסיכוי למות לפני גיל 56 יותר גבוה: 0.00595, ותוחלת החיים שלו נמוכה יותר: נותרו לו, בממוצע, רק עוד 24.9 שנים לחיות.

איזה נתונים צריך כדי לאמוד את סיכוני העישון?

הנתון השני צריך לאפשר לנו לאמוד כמה אנשים מתו מנזקי עישון. זה כבר יותר מסובך. כולם מתים בסוף, גם אלה שמעשנים וגם אלה שלא. אדם יכול לעשן ולמות מסיבה שלא קשורה לעישון (אולי ממחלה זיהומית, אולי מתאונה, ואולי אפילו מסרטן שעישון אינו גורם סיכון שלו – יש סרטנים כאלה). אדם יכול לא לעשן ובכל זאת למות מסרטן הריאות או מחלת לב – כאשר עישון הוא גורם סיכון ידוע לשני המצבים הבריאותיים האלה.[2] ובכל זאת, הנתונים שיש לאסוף הם כמה אנשים מתים, כמה מהם מעשנים, וכמה לא.

במקומות רבים בעולם נערכים מחקרים תצפיתיים ארוכי טווח העוקבים אחרי מהלך החיים של אוכלוסיות, ואוספים נתונים על התנהגויות העשויות להשפיע על מצב הבריאות של הפרטים באוכלוסייה, כגון הרגלי אכילה ועישון. המחקר הידוע ביותר נערך בעיר פראמינגהם במדינת מסצ'וסטס בארצות הברית. החל משנת 1948 נאספים נתונים כאלה על אלפים מתושבי העיר שהסכימו להשתתף במחקר, והוא עוקב כעת אחרי הדור השלישי של התושבים. באתר המחקר תוכלו למצוא מחשבונים שבעזרתם תוכלו לדעת מה הסיכון שלכם ללקות במחלת לב. המחקר הזה הראה כי עישון הוא גורם סיכון משמעותי לסיכוי לחלות במחלת לב.

מחקר אחר, קצת ישן (משנת 1999) שערכו יעקובס ועמיתיו, עקב אחרי אוכלוסייה של כ-12000 איש בשבע מדינות במשך 25 שנים. המחקר אסף נתוני תמותה מכל סיבה שהיא, וכמובן נתונים נוספים. אחת המסקנות של המחקר הזה הייתה כי הסיכון למות של מעשנים המעשנים עד 10 סיגריות ביום גבוה פי 1.3 מהסיכון של לא מעשנים, והסיכון למות של אלה המעשנים יותר מ-10 סיגריות ליום גבוה פי 1.8 מאלה של הלא מעשנים. ללא הסבר המספרים האלה נראים תמוהים. מה זאת אומרת שהסיכון למות גבוה פי 1.8? כולם מתים בסוף. הסיכון למות הוא 100% לכולם. לא? לא. הסיכוי שאדם ימות בסופו של דבר הוא אכן 100%. הסיכון הוא לא סיכוי. אז בואו נעשה סדר.

איך מודדים את הסיכון

הסיכון נגזר מהסיכוי למות (או לחוות אירוע אחר כלשהו, כמו התקף לב למשל) במשך יחידת זמן מוגדרת, ומתייחס לנקודה ספציפית בזמן (או לתקופת זמן קצרה מאוד). אל תיבהלו, אבל אני אומר לכם שהסיכון הוא הנגזרת של ההסתברות המותנה למות (אתם יכולים לעבור הלאה בלי חשש). הסיכוי, לעומת זאת, מתייחס לתקופות זמן ארוכות יותר.

אני לא אכנס כאן להגדרה המתמטית המדוייקת של הסיכון. אומר רק שאם יודעים את הסיכוי למות במשך תקופת מסויימת, נניח שנה, אפשר לחשב מכך את הסיכון למות במשך אותה תקופת זמן. גם ההיפך נכון: אם יודעים את הסיכון אז יודעים את הסיכוי. כמו כן, באופן לא מפתיע, אם הסיכוי שלך למות בשנה הקרובה גבוה יותר, אז גם הסיכון שלך גבוה יותר.

ואם אפשר לעשות את האבחנה הזו בין יהודים וערבים, ובין גברים לנשים, בוודאי שאפשר לחשב את הסיכון של המעשנים ולהשוות אותו לסיכון של הלא מעשנים.

הכלי הסטטיסטי שמאפשר לבצע את התרגילים האלה הוא מודל הסיכונים הפרופורציונליים שפותח בשנת 1972 על ידי הסטטיסטיקאי הבריטי סיר דויד קוקס, וידוע גם בשם מודל קוקס. קשה להמעיט בחשיבות של המודל הזה. המאמר שבו הוצג המודל נמנה עם 100 המאמרים המדעיים המצוטטים ביותר בכל הזמנים – לא מאמרים בסטטיסטיקה, אלא כל המאמרים המדעיים.  המודל מאפשר לזהות גורמי סיכון  להתרחשות אירועים כגון מוות, ולמדוד מה פוטנציאל הסכנה בכל גורם סיכון כזה. בנוסף לכך, קוקס הציג במאמר שלו חידושים סטטיסטיים נוספים שהשפיעו רבות גם על תחומים אחרים בסטטיסטיקה. אילו היה פרס נובל לסטטיסטיקה, סיר דויד קוקס היה זוכה בו ללא צל של ספק. סיר קוקס אכן זכה כמעט בכל פרס אפשרי בתחום הסטטיסטיקה. המודל שלו בפירוש מאפשר הצלת חיים. לדעתי סיר קוקס ראוי לזכייה בפרס נובל לרפואה.

להלן נוסחת המודל. מייד אסביר הכל. ניתן לראות כי זהו למעשה מודל רגרסיה.

 

 

נתחיל בצד שמאל. שם מופיע הסיכון כפי שהוא מושפע מגורמי הסיכון – אותו אנחנו רוצים לאמוד. הוא מסומן באות למבדה – האות היוונית שדומה לאות ג. בצד ימין יש מכפלה של שני חלקים. חלק אחד מתאר את הסיכון הבסיסי – כאשר אין שום אינפורמציה. הוא מסומן בלמבדה אפס טי. הסיכון הבסיסי נקבע רק על פי נתוני התמותה. לכל אדם במדגם נתון האם הוא מת, אם כן, מתי, ואם לא, כמה שנים הוא חי עד למועד שבו הוחלט להפסיק את המעקב ולהזין את הנתונים למודל. החלק השני מכיל את גורמי הסיכון האפשריים, כגון גיל, מין, הרגלי אכילה, וגם כמובן משתנה המציין האם האדם שבמדגם מעשן או לא. גורמי הסיכון מסומנים באיקסים. לכל X יש מקדם שמסומן באות ביתא. אם ביתא שונה באופן משמעותי מאפס זה אומר שלמשתנה X יש השפעה משמעותית על הסיכון. אם ביתא חיובי זה אומר שהסיכון גדל ככל ש-X גדל, ואם ביתא שלילי זה אומר של-X יש דווקא השפעה חיובית. רמת הסיכון עולה (או יורדת) באופן פרופורציוני לערכו של .X[3] מכאן נובע שם המודל – מודל הסיכונים הפרופורציוניים. לאחר שאומדים את הפרמטרים של המודל אפשר, באופן תיאורטי, לחשב את הסיכון לאדם מעשן ולאדם לא מעשן.[4] בפועל, המודל מספק ישירות אומדן ליחס שבין הסיכונים, ה-hazard ratio. היחס הזה מתבטא במקדם הביתא של משתנה העישון.

למודל יש כמובן גם הנחות. החשובה שביניהן היא ההנחה כי יחס הסיכונים נשאר קבוע לאורך כל תקופת המעקב. זו הנחה חזקה, ובדרך כלל היא נכונה, וגם אם יש סטייה לא גדולה מההנחה הזו המודל מספיק עמיד (robust) כדי לספק אומדן טוב של הסיכון. יש הרחבות למודל שבהן מחליפים את ההנחה הזו בהנחה יותר גמישה אם יש צורך. אחד המודלים הידועים שמרחיבים את מודל קוקס פותח על יד שילה בירד.

איך מתרגמים את הנתונים למספרים

עכשיו נוכל לעשות את החישובים.

יש לנו את ההסתברויות למות בכל גיל מלוחות התמותה. יש לנו את גם יחס הסיכונים שהוא כזכור היחס בין הסיכון למות של אנשים המעשנים יותר מ-10 סיגריות ביום ובין הסיכון של לא מעשנים. זכרו כי זהו יחס הסיכונים לנקודה ספציפית בזמן. מתוך יחס הסיכונים אפשר לחשב את  יחס הסיכויים: היחס בין ההסתברויות למות במשך תקופת זמן מוגדרת, שנה למשל. בשביל זה יש נוסחה. אני אחסוך לכם אותה. יש בה אינטגרלים ואקספוננטים, וזה בדרך כלל לא טוב לבריאות. אם אתם ממש רוצים  אז אתם יכולים לקרוא כאן, למשל, אבל זה על אחריותכם (קישור לקובץ  pdf). אני חוסך את זה גם לעצמי, ואשתמש בנתון מתוך מאמר אחר מאת מהטה ופרסטון משנת 2012. לפי הנתונים במאמר הזה, יחס הסיכויים למוות בתקופת זמן של שנה, בין גברים מעשנים וגברים לא מעשנים הוא בערך 2.3 (לקחתי את הגבול התחתון של רווח הסמך, כדי לקבל הערכה שמרנית), לאחר תקנון לגיל, וזאת בארצות הברית, בשנים 1987 עד 2006.

אנחנו צריכים עוד נתון אחד והוא שיעור המעשנים באוכלוסייה. לצורך הדוגמה אשתמש בנתונים של משרד הבריאות משנת 2017, לפיהם כ-30% מהגברים מעל גיל 21 הינם מעשנים..

כשיש לנו את כל הנתונים מה שנשאר זה קצת אלגברה של בית ספר תיכון.[5]

נניח שהסיכוי של מעשן בן 55 למות לפני גיל 56 הוא X, והסיכוי של לא מעשן הוא Y. לפני הנתון של מהטה ופרסטון, X גדול פי 2.3 מ-Y, כלומר X=2.3Y. זה נותן לנו משוואה אחת המקשרת בין X ל-Y.

את המשוואה השנייה נגזור מתוך מה שידוע בשם נוסחת ההסתברות השלמה.  ניתן להציג את החישוב בצורת עץ הסתברויות:

 

 

 

 

 

 

 

 

 

מהי ההסתברות של גבר בן 55 למות? ההסתברות הזו שווה להסתברות שלו למות אם הוא מעשן שהיא כאמור X כפול ההסתברות שהוא מעשן, שהיא 30%, ולכך יש להוסיף את ההסתברות שלו למות אם הוא לא מעשן, Y, כפול ההסתברות שהוא לא מעשן, שהיא 70%.  כל זה צריך להיות שווה ל-0.00425, כלומר 0.3x+0.7y=0.00425.

עכשיו יש לנו שתי משוואות בשני נעלמים ואפשר לפתור אותן. הפתרון הוא ש-X, ההסתברות שגבר יהודי מעשן בן 55 ימות לפני שיגיע לגיל 56 – שווה ל-0.00703237, ואילו Y, ההסתברות שגבר יהודי בן 55 שאינו מעשן ימות לפני שיגיע לגיל 56 היא הרבה יותר נמוכה: 0.00305755.

כזכור, על פי לוח התמותה, ההסתברות שגבר בן 55 ימות לפני שיגיע לגיל 56 היא 0.00425. זה אומר שאם יש לנו 100000 גברים כאלה, אז בממוצע ימותו במהלך השנה 425 מהם. אם לעישון אין השפעה על ההסתברות למות, אז 30% מהמתים יהיו מעשנים: בערך 128 איש.

אבל אנחנו יודעים שההסתברות למות שונה למעשנים ולא מעשנים.

בין 100000 הגברים יש 30000 מעשנים, ולכל אחד מהם הסתברות למות השווה כאמור ל- 0.00703237. זה אומר שמתוכם ימותו 210 איש – 82 איש יותר ממה שהיה צריך להיות אילו לעישון לא הייתה השפעה. 82 האנשים האלה מתו לכן בגלל שהיו מעשנים.

כך אפשר לערוך את החישוב לכל מין, לכל גיל, ולכל קבוצת אוכלוסייה למעשה. אם עושים את החשבון עם כל הנתונים המדוייקים (שלא היו בידיי), אז מגיעים ל-8000.

כמה מילים בנימה אישית

וכאן אני רוצה לומר כמה מילים אישיות.

אני חושב שהנתון כי בכל שנה מתים בישראל 8000 איש מנזקי עישון הוא מזעזע. אם מחר תפרוץ חלילה מלחמה וימותו בה 8000 איש העם יצא לרחובות. אם השנה ייהרגו 8000 איש בתאונות דרכים, שר התחבורה והשר לביטחון פנים לא יוכלו להתחמק מאחריות. 8000 מתים בשנה פירושם יותר מ-20 מתים כל יום. אם חלילה יתרחש פיגוע וייהרגו בו 20 איש, אף אחד לא יחכה שהמספר יצטבר ל-8000 לפני שיידרשו לעשות משהו, ובצדק.

כמו שאמר סטאלין, מוות אחד הוא טרגדיה אבל 8000 מתים הם כנראה רק סטטיסטיקה. לסטטיסטיקה הזו אחראים המנהיגים שלנו ומקבלי ההחלטות. בשנת 2011 הוכרזה תכנית לאומית למלחמה בעישון ובנזקיו. בפועל לא קרה כמעט כלום. הגיע הזמן לתכנית חדשה, והפעם זו צריכה להיות תכנית חירום לאומית למלחמה בעישון. עכשיו.

 

 

 


הערות
  1. אתם מוזמנים לקרוא את דברי ההסבר בקובץ לוחות התמותה []
  2. נשאלת כמובן השאלה איך יודעים שאלה גורמי סיכון, והתשובה תתברר מייד []
  3. באופן יותר מדוייק: ההשפעה היא פרופורציונית לגבי הלוג של יחס הסיכונים []
  4. את זה עושים על ידי כך שקובעים ש-X הוא משתנה שמקבל שני ערכים: 0 אם האדם לא מעשן, 1 אם הוא כן מעשן. כאשר X שווה ל-1 נוסף הערך ביתא לסכום המשוקלל של גורמי הסיכון []
  5.  אני יודע שאני עושה פה סלט: נתונים מארצות הברית מסוף המאה העשרים ותחילת המאה העשרים ואחת, ונתונים מישראל. הכל נעשה לצורך הדגמה. אל תסיקו מסקנות מהמספרים שתראו בהמשך. []

איך לא לתפוס רוצח בעזרת התאמת DNA

לקראת סוף אפריל 2018 דווח כי משטרת סקרמנטו בקליפורניה עצרה אדם החשוד כי הוא ה-Golden State Killer, רוצח סידרתי שפעל באיזור בשנות ה-70 וה-80 של המאה העשרים. החשוד זוהה בעקבות התאמה של דגימות DNA שנלקחו בזמן חקירות מעשי הרצח ונתוני DNA שפורסמו באתר של אחת החברות המציעות לקהל הרחב ניתוח בסיסי של ה-DNA שלהם. כיצד מתבצעת ההתאמה ומה המשמעות של התוצאות? מכיוון שלא נמסרו נתונים לגבי תהליך הזיהוי במקרה זה, אסביר את הנושא בעזרת מקרה אחר, בעזרתו אדגים את תפקידה של הסטטיסטיקה בתהליך.

רצח דיאנה סילבסטר

דיאנה סילבסטר, אחות במקצועה, נרצחה בדירתה בסן פרנציסקו מספר ימים לפני חג המולד ב-1972, לאחר שנאנסה באכזריות. אישה ששהתה בדירה אחרת בבניין שמעה צעקות, ולאחר המתנה של כעשרים דקות החליטה לצאת מדירתה ולבדוק מה קורה. היא ראתה כי דלת דירתה של סילבסטר פתוחה, ואדם שעמד בפתח הדירה. לשאלתה ענה לה כי "אנחנו עושים אהבה", ולאחר מכן הלך לדרכו. האישה נכנסה לדירה ושם מצאה את גופתה העירומה של סילבסטר. המשטרה הוזעקה, האישה מסרה את עדותה כולל תיאורו של האדם שראתה. מגופתה של דיאנה נלקחו דגימות זרע, בין היתר. לאחר מספר ימים עצרה המשטרה אדם חסר בית שתיאורו התאים לתיאור שמסרה העדה כחשוד ברצח. המשטרה לא הצליחה למצוא ראיות מספיקות נגד החשוד והוא שוחרר. חשוד זה, אגב, הורשע באונס מספר חודשים לאחר מכן. נבדקו עוד כעשרים חשודים נוספים, אך לא בוצעו מעצרים נוספים. תיק הרצח, ובתוכו דגימות הזרע, נגנז והועבר לארכיון.

בשנת 2003, לאחר שפותחה טכנולוגיה לניתוח והתאמה של דגימות DNA, בדקה משטרת סן פרנציסקו האם יש התאמות בין דגימות DNA שנאספו ונשמרו במקרי רצח לא פטורים ובין דגימות DNA במאגר של עברייני מין שהורשעו במדינת קליפורניה. אמנם ה-DNA שנאסף מגופתה של סילבסטר לא נשמר היטב, ומתוך 13 האללים המשמשים לזיהוי (פרטים בהמשך) ניתן היה לקבל אינפורמציה רק על 5.5 אללים, עם זאת, נמצא במאגר אדם עם DNA התואם את אותם 5.5 אללים. אדם זה, ג'ון פאקט, נעצר כחשוד ברצח, הועמד לדין והורשע.

איך מבצעים התאמת DNA?

ההסבר שאתן מאוד פשטני ולא מדוייק, אך הוא מספיק לצורך הדיון בבעיה הסטטיסטית. DNA הוא מולקולה, שרשרת של חלבונים, הנמצאת בכל תא בגוף. כל התכונות הביולוגיות של האדם נקבעות על ידו. ה-DNA מתחלק ליחידות שנקראות אללים. יותר מ-99.9% מה-DNA זהה אצל כל בני האדם. השונות בין בני אדם (נניח צבע עיניים) נקבעת על ידי שאר ה-DNA. למרות הזהות של99.9% מה-DNA בין כל בני אדם, אין למעשה שני אנשים עם DNA זהה לחלוטין, אלא אם הם תאומים זהים.

מבחינה משפטית ופלילית, זיהוי של אדם נקבע על ידי 13 אללים ספציפיים. כדי לבדוק האם שתי דגימות DNA נלקחו מאותו אדם, משווים את 13 האללים בין שתי הדגימות. אם אין התאמה אפילו באלל אחד מבין השלושה עשר – מדובר בשני אנשים שונים. מצד שני, אם הדגימות נלקחו משני אנשים שונים – הסיכוי כי תהיה התאמה מלאה בין כל 13 האללים נמוך מאוד. עד כמה נמוך? יש כל מיני הערכות לכך. לפי ה-FBI, ההסתברות לכך היא בערך 1 ל-13 מיליארד.

ההשוואה מתבצעת על ידי השוואת שני גרפים המתקבלים מעיבוד דגימת ה-DNA במכשיר ייחודי. הגרף דומה לגרף המתקבל מדגימת א.ק.ג. 13 האללים המדוברים מתבטאים בגרף כ-"פיקים". ההשוואה נעשית בדרך כלל "לפי העין" על ידי מומחים בתחום.[1] לדוגמא אני מביא כאן גרפים של שתי דגימות DNA ממשפט אחר[2] מה דעתכם? האם יש זהות בין שתי הדגימות?

 

 

 

 

 

המומחים המטעם התביעה באותו משפט אמרו שכן. הטענה נדחתה על ידי השופט שטעה טעות סטטיסטית שאינה קשורה לניתוח ה-DNA עצמו.

אציין גם הקביעה שזיהוי אדם מתבסס של 13 האללים האלה מתבססת על הנחות ביולוגיות/גנטיות וכן על הנחות סטטיסטיות. לא אכנס כאן לדיון מפורט בעניין משתי סיבות: ראשית, אני לא ממש מתמצא בנושא, ושנית, במקרה של הנחות אחרות היה נקבע קריטריון זיהוי אחר, אבל הבעיה הסטטיסטית של הרשעה על ידי זיהוי DNA נשארת אותה בעיה.

משפט הרצח

במקרה הרצח של סילבסטר הייתה כאמור רק התאמה חלקית, בגלל תהליך ההתפרקות של דגימת הזרע במשך 30 השנים בהן הוא נשמר בארכיון. התובע במשפט ציין שההסתברות כי תהיה התאמה כזו בין שתי דגימות DNA שנלקחו משני בני אדם שונים נאמדה כ-1 ל-1.1 מיליון, ואני מניח כי נתון זה נכון. השופט החליט כי במשפט לא יובאו מומחים שידונו בפרשנות של ההסתברות שהתובע ציין להתאמת ה-DNA ובהשלכות הנובעות מכך, ובפרט לא הוצגו עדויות של סטטיסטיקאים מטעם ההגנה, וכפי שנראה מייד, היה להם מה לומר. כמו כן, הוא החליט כי לא המושבעים לא יקבלו מידע על הדרך בה אותר החשוד. הם הונחו לשקלל את הנתון על הסתברות ההתאמה עם עדויות "רגילות". עדת הראיה שראתה ככל הנראה את הרוצח כבר מתה. בפני המושבעים הוצגו, פרט לנתון של 1 ל-1.1 מיליון, תיאור של שלושת מקרי האונס בהם הורשע פאקט בעבר ותמונה ישנה של הנאשם משנות השבעים בה הוא נראה דומה לתיאור של הרוצח שמסרה העדה. במהלך הדיונים ביקשו המושבעים מהשופט כי יימסר להם עוד מידע לגבי האופן שבו הגיעו אל החשוד בעזרת דגימת ה-DNA, אך השופט סירב למסור אינפורמציה זו. הנאשם, כאמור, הורשע ברצח.

ניתוח סטטיסטי

הניתוח שאתאר כאן מתייחס רק לראיית ה-DNA, ואינו לוקח בחשבון ראיות אחרות. כדי לקבוע אשמה יש לשקלל, כפי שטען השופט בצדק, את הראיה הזו עם הראיות האחרות שהוצגו במשפט. אם זאת, אני טוען כי האופן בו הוצגה ראיית ה-DNA למושבעים היה מטעה, והשופט שגה בכך שלא הרשה לצדדים להציג את טיעוניהם, ולכן גרם לכך שהמושבעים יפרשו את הנתון הזה באופן שגוי.

טיעוני התביעה

המסר של התביעה בעניין התאמת ה-DNA היה פשוט: הסיכוי שתהיה התאמה בין שתי הדגימות הוא 1 ל-1.1 מיליון. לכן השתמע מדברי התובע כי הסיכוי שפאקט אינו הרוצח הוא 1 ל-1.1 מיליון. זה לא נכון. זוהי ההסתברות כי אם נבחר שני בני אדם באופן מקרי תהיה ביניהם התאמה באותם 5 וחצי אללים ספציפיים. זה נכון גם כאשר נשווה את ה-DNA שלי ל-DNA שלך.

ההסתברות שהתביעה צריכה להציג היא הסתברות מותנית: ההסתברות שהנאשם הוא הרוצח כאשר ידוע לנו כי קיימת התאמת DNA. זה נראה פשוט, אבל צריך להיזהר: בהחלט ייתכן כי הנאשם אינו הרוצח גם אם קיימת התאמת DNA. ייתכן כי יש אדם נוסף שקיימת בינו ובין דגימת ה-DNA התאמה, ואולי אפילו יותר מאחד, ואם כך, ייתכן כי האדם הנוסף הזה הוא הרוצח. וזה מה שההגנה התכוונה לטעון.

טיעוני ההגנה (שלא הוצגו למושבעים)

למעשה היו להגנה שני טיעונים עיקריים. ראשית הם טענו כי יש עדויות אמפיריות וחישוביות לכך שהתאמת DNA חלקית נפוצה למדי. הם הסתמכו על מחקר שנערך באריזונה. חוקרת בשם קתרין טרויר בדקה כ-65,000 דגימות DNA. היא מצאה 122 זוגות של דגימות בהם הייתה התאמה ב-9 אללים, ו-20 זוגות בהם הייתה התאמה של 10 אללים. ההסתברויות להתאמות כאלה הרבה יותר קטנות מ-1.1 מיליון. סביר להניח כי במדגם כזה יימצאו אפילו יותר זוגות תואמים ב-5.5 אללים.

קל לחשב את ההסתברות הזו. זוהי למעשה בעיית ימי ההולדת. הקוראים הוותיקים שלי יודעים כי אם בחדר אחד מתאספים 23 איש, ההסתברות כי יהיה בחדר זוג אנשים שחולקים יום הולדת משותף גדולה מ-50%. בבעיית התאמת ה-DNA, מוחלף יום ההולדת בפרופיל ה-DNA. בבעיית ימי ההולדת ההסתברות ששני בני אדם יחלקו יום הולדת היא 1 ל-365. כל מה שצריך זה להחליף את ההסתברות להתאמת ימי הולדת בהסתברות להתאמת DNA ולערוך את החשבון.  ההסתברות היא כמעט 1. למעשה, ההסתברות כה קרובה ל-1 עד כדי כך שתכנת R בה השתמשתי לחישוב נתנה את התוצאה 1, מכיוון שרמת הדיוק המקסימלית שלה היא רק כ-300 ספרות לאחר הנקודה העשרונית. ה-DNA שנלקח מזירת הרצח נבדק מול מאגר DNA שהכיל כ-338000 דגימות של עברייני מין מורשעים, גברים לבנים, שהיו מבוגרים מספיק כדי לבצע את הרצח בשנת 1972. אפשר לומר בביטחון כמעט מוחלט שיש ביניהם שני אנשים שה-DNA שלהם תואם ב-5.5 אללים. אז לכאורה אפשר לומר שסביר מאוד כי תימצא התאמה בין ה-DNA של פאקט ובין הדגימה שנלקחה מזירת הרצח. אבל רק לכאורה, כי גם האמירה הזו אינה נכונה. אנחנו חישבנו את ההסתברות כי יימצא זוג אנשים כלשהו שביניהם יש התאמת DNA. השאלה הנכונה היא מה ההסתברות כי במאגר יימצא אדם שה-DNA שלו תואם ל-DNA שנלקח מזירת הרצח.

גם בשאלה הזו דנתי בפוסט על בעיית ימי ההולדת[3], וההגנה ביקשה להציג את ההסתברות הזו בפני המושבעים. הטיעון שלהם השתמש באנלוגיה של הגרלה (כגון הגרלת מפעל הפיס). האנלוגיה לכרטיס הגרלה היא אדם כלשהו, וה-DNA מזירת הפשע הוא המספר הזוכה. אם אתה קונה כרטיס אחד להגרלה שבה יש 1.1 מיליון כרטיסים, הסיכוי כי תזכה הוא 1 ל-1.1 מיליון. אם אתה קונה שני כרטיסים, הסיכוי שלך לזכות הוא 2 ל-1.1 מיליון, וכן הלאה. המשטרה בדקה מאגר של 338000 דגימות. הם קנו 338000 כרטיסים. הסיכוי שלהם לזכות הוא לכן 338000 ל-1.1 מיליון, שזה בערך 0.31. ההגנה טענה לכן כי הסיכוי שיימצא במאגר מישהו שה-DNA שלו מתאים לדגימה הוא בערך 1 מתוך 3. פאקט החזיק למזלו (הרע) בכרטיס הזוכה. לכן, גם אם זכה, אין למהר להסיק כי הוא הרוצח. ייתכן והיו מוצאים מישהו אחר. הסיכוי שימצאו מישהו הוא 30%.  יותר מכך: במטרופולין סן פרנציסקו גרים מעל 3 מיליון איש, כמחציתם גברים. גם אם ניקח בחשבון רק את הגברים הלבנים שהינם די מבוגרים כדי לבצע את הרצח 30 שנה קודם לכן, חייב להיות שם מישהו עם DNA תואם לדגימה[4]. אבל גם החישוב הזה לא מדוייק.

החישוב האחרון מניח כי לכל אדם במאגר יש DNA שונה מזה של כל האחרים. שוב, ההנחה הזו לא נכונה. למעשה ראינו כי ההסתברות שיש במאגר שני אנשים עם DNA תואם ב-5.5 אללים היא כמעט ודאית.

כמו כן, ייתכן כי יש במאגר 2, 3 או אפילו יותר אנשים עם DNA תואם לדגימה. זו לא בעיית מפעל הפיס. זו בעיית לוטו. ה-DNA של כל אדם הוא המספרים שבחר. בהגרלת לוטו ייתכן מאוד כי שני אנשים ייבחרו את אותם המספרים, ופעמים רבות הפרס הראשון מתחלק בין מספר זוכים. אותנו מעניינת ההסתברות כי יהיה לפחות זוכה אחד.

אפשר לחשוב על הבעיה גם באופן הבא: יש לכם מטבע שהסיכוי שלו ליפול על עץ הוא 1 ל-1.1 מיליון. אתם מטילים אותו 338000 פעמים. מה הסיכוי כי המטבע ייפול פעם אחת על עץ? מה הסיכוי כי הוא ייפול על עץ יותר מפעם אחת? מה הסיכוי כי הוא לא ייפול על עץ אפילו פעם אחת (כלומר 338000 פעמים תקבלו פלי)? אפשר לחשב את הסיכויים האלה על ידי שימוש בהתפלגות פואסון, או בניסוח יותר מדוייק, הקירוב הפואסוני להתפלגות הבינומית, כאשר הפרמטר של ההתפלגות הוא 0.31. כאשר עורכים את החישוב מקבלים כי ההסתברות שהמטבע ייפול על עץ בדיוק פעם אחת, כלומר יש בדיוק אדם אחד במאגר אשר ה-DNA שלו מתאים לדגימה מזירת הפשע, היא 0.226. ההסתברות כי במאגר לא יימצא אפילו אדם אחד עם DNA תואם היא 0.736, וההסתברות כי יש במאגר לפחות אדם אחד עם DNA תואם לדגימה מזירת הפשע היא לכן רק 0.265 ולא 0.31 כפי שההגנה רצתה לטעון. יותר קרוב ל-1 מתוך 4 מאשר ל-1 מתוך 3, אך עדיין הסתברות גבוהה למדי.

המשמעות של התוצאה הזו כי יש הסתברות של מעל 25% כי הנאשם זכאי בהינתן ההתאמה בין ה-DNA שלו ובין ה-DNA שנלקח מזירת הפשע, ולא 1 ל-1.1 מיליון, כמו שהתובע רצה שהמושבעים יחשבו. לדעתי החישוב הזה מספיק כדי לעורר ספק סביר.

גישה בייסיאנית

יש עוד דרך להסתכל על הבעיה. אני לא חסיד של הגישה הזו, אבל אציג אותה בכל זאת. הבעתי בהרחבה את דעתי על הגישה הזו בפוסט שעסק במה שכונתה "מכונת האמת המוחלטת".

הדיון עד כה נערך תחת ההנחה שהנאשם זכאי, כפי שמקובל במערכות משפט במדינות דמוקרטיות. ראינו כי תחת ההנחה הזו ההסתברות כי הנאשם אשם היא כ-74%. אבל, מה הסתברות שתהיה התאמת DNA תחת ההנחה שהנאשם אשם? התשובה לשאלה הזו היא כמובן 100%, כלומר 1.

כזכור, אנחנו מתעניינים בהסתברות כי הנאשם אשם בהינתן התאמת ה-DNA. כאן המקום לקרוא לדגל את נוסחת בייס:

 

 

 

 

 

 

ולאחר שעשינו את כל התרגיל הזה, כל מה שצריך זה להציב בנוסחה את ההסתברות שהנאשם אשם ואת ההסתברות המשלימה שהנאשם זכאי, ולהחליט האם התוצאה מעלה ספק סביר.

הנה הבעיה שלי: אם הנאשם אשם, ההסתברות שהוא אשם, לדעתי לפחות, שווה ל-1, ואז אם נציב את זה בנוסחה נקבל 1. ואם הנאשם זכאי, אז לדעתי ההסתברות שהוא אשם היא אפס, ואם נציב את זה בנוסחה נקבל אפס. זה לא ממש עוזר.

כאן יבוא הסטטיסטיקאי הבייסיאני ויאמר לכם כי ההסתברות שהנאשם אשם היא הסתברות סובייקטיבית, והיא למעשה ביטוי לרמת האמונה האפריורית שלנו כי הנאשם אשם (או זכאי). כאמור, אני לא מקבל את הטיעון הזה. לדעתי עלינו להניח כי הנאשם זכאי עד שתוכח אשמתו. במילים אחרות, אני אומר לסטטיסטיקאי הבייסיאני כי עליו להאמין מראש כי ההסתברות שהנאשם אשם היא אפס, ומכאן אני ממשיך את הטיעון ואומר כי כל התרגיל הזה חסר משמעות.

אבל יש מי שחושבים אחרת. יבוא מישהו ויגיד: "אני לא יודע אם הוא זכאי או אשם, ולכן אציב בנוסחה את הערך 0.5 להסתברות כי הנאשם אשם". החישוב ייתן לכן כי ההסתברות שהנאשם אשם בהינתן התאמת ה-DNA היא בערך 57.5%. אבל יכול לבוא מישהו אחר ולומר כי הנאשם ביצע בעברו שלושה מעשי אונס הדומים לאונס שבוצע בנרצחת סילבסטר, ולכן הוא מאמין כי ההסתברות שהנאשם אשם היא 0.75 (למה? ככה). עכשיו החישוב ייתן תוצאה של 80%. ספק סביר? אני לא יודע אבל מניח שכן.  ברור שככל שנאמין יותר באשמת הנאשם, כך נקבל כי ההסתברות שהוא אשם בהינתן התאמת ה-DNA גבוהה יותר. במילים אחרות: אם מאמינים שהנאשם אשם מסיקים כי הוא אשם.

במקום אחר ברשת נתקלתי בטיעון בייסיאני אחר, שטוען כי יש לקחת בחשבון את ההסתברות כי הרוצח נמצא בכלל בתוך המאגר של 338000 הדגימות. אם ההסתברות כי הרוצח נמצא בתוך המאגר שווה לאפס, אז ברור כי הנאשם זכאי. אם ההסתברות הזו שווה ל-1, אז הנאשם אשם (בהנחה שאין עוד אדם במאגר שה-DNA שלו תואם לדגימה מזירת הרצח). מה קורה אם ההסתברות הזו נמצאת איפשהו בין אפס לאחד?

אם נסמן את ההסתברות הזאת ב-x, ונזכור כי ההסתברות שהנאשם אשם אם הרוצח לא נמצא במאגר היא בערך 0.27, נקבל בעזרת נוסחת בייס כי ההסתברות שהנאשם אשם היא:

 

 

ואנחנו שוב עומדים בפני השאלה: מהי ההסתברות כי הרוצח נמצא במאגר? במילים אחרות: מה ההסתברות כי הרוצח הוא מישהו שהורשע בעבירת מין נוספת/אחרת בקליפורניה ונלקחה ממנו דגימת DNA? עד כמה הידיעה כי ה-DNA של החשוד שנעצר זמן קצר לאחר הרצח ושוחרר לא נצא במאגר (כי הוא מת לפני שהחלו באיסוף דגימות DNA מעבריינים מורשעים)[5] תשפיע על ההערכה שלכם ל-x?

כמו קודם – הניתוח הזה לא מוביל אותנו לשום מקום, כי אין לנו שום דרך אמינה לאמוד את x.

סיכום

זיהוי רוצחים או פושעים אחרים על ידי השוואת דגימות DNA שנלקחו מזירת הפשע למאגרי DNA הוא בעייתי, וטמן בחובו בעיות סטטיסטיות לא פשוטות, וזאת בנוסף לבעיות משפטיות ואחרות.

לקריאה נוספת

 


הערות
  1. אני מניח כי במשך הזמן פותחו שיטות יותר אובייקטיביות להשוואה או שלפחות נעשה מאמץ לפתח שיטות כאלה. []
  2. הגרפים נלקחו מהספר Math on Trial. ראו הפניות לקריאה נוספת בסוף הפוסט. []
  3. זוכרים מה קרה לג'וני קארסון? []
  4. או באופן יותר מדוייק: ההסתברות כי יש שם אדם כזה גבוהה []
  5. איש לא העלה בדעתו להוציא את הגופה מהקבר ולקחת ממנה דגימת DNA []

איך מחשבים את תאריכי התוקף של התרופות

לכל תרופה יש תאריך תוקף, שלאחריו השימוש בה אינו מומלץ. הסיבה לכך היא שבמשך הזמן שעובר מאז הייצור החומר הפעיל שבתרופה[1] עובר תהליכי פירוק, כך שתיאורטית קיימת נקודת זמן בה רמת החומר הפעיל כבר לא תספיק לפעולה יעילה של התרופה.
ברשימה זו אסקור את המשמעות של תאריך התוקף ותהליכי הפירוק, את האינטרסים של בעלי העניין, ואת הדרך הסטטיסטית בה אומדים את משך חיי המדף של התרופה.

מה המשמעות של תאריך התוקף?

המונח המקובל לתיאור המצב בו התרופה ראויה לשימוש הוא "יציבות". בהנחיות ה-FDA נאמר כי משך חיי המדף של התרופה הוא הזמן המקסימלי בו הערכים של מאפייני היציבות מקיימים את הקריטריונים ליציבות. זוהי הגדרה מעגלית במקצת, ולכן אנסה להסביר באמצעות דוגמה.
אחד המדדים המקובלים לפיהם מודדים את היות התרופה מיועדת לשימוש, הוא אחוז החומר הפעיל. כאשר התרופה יוצאת מקו הייצור, אחוז החומר הפעיל מוגדר כ-100%. במשך הזמן יש, כאמור תהליכי פירוק, ואחוז החומר הפעיל יכול לרדת ל-99%, או 98% וכולי. אם נטען כי התרופה יעילה כל עוד אחוז החומר הפעיל גבוה מ-90%, ובדרך כלשהו מעריכים כי משך הזמן שלוקח עד שאחוז החומר הפעיל יורד מ-90% הוא שנתיים, אז משך חיי המדף של התרופה יכול להיות לכל היותר שנתיים מתאריך הייצור.
הסבר גרפי: בגרף שלפניכם ציר ה-x מייצג את הזמן, וציר ה-y מציין את ערכו מדד היציבות, במקרה זה מדד שלילי (ככל שהוא גבוה יותר התרופה פחות טובה), למשל, שיעור הזיהומים (impurity). הקו הירוק מציין את השינוי במדד לאורך הזמן, והקו האדום את הקריטריון, הקו שאם המדד עולה מעליו התרופה מוגדרת כלא ראויה לשימוש. הנקודה בזמן בה הקו הירוק חוצה את הקו האדום היא משך חיי המדף של תרופה.

 

 

 

 

 

 

 

כמובן שיש עוד מדדים שצריך להתחשב בהם, ומשך חיי המדף נקבע לפי המקרה הגרוע ביותר. לדוגמה, אם בתרופה שלנו מדד אחר חורג מהקריטריונים שלו אחרי שנה, אז משך חיי המדף יוגדר כשנה, למרות שאחוז החומר הפעיל הינו ברמה ראויה למשך שנתיים.
כאן עולות שתי שאלות. שאלה אחת היא כיצד קובעים הקריטריון לפיו התרופה ראויה לשימוש כל עוד אחוז החומר הפעיל גבוה מ-90%. ההצדקות לקריטריונים אלה מבוססות בדרך כלל על מודלים כימיים או ביולוגיים ועל ידי ניסויים בחיות.
שאלה שניה היא כיצד מעריכים כי אחוז החומר הפעיל הינו ברמה סבירה (acceptable) כעבור זמן מה לאחר הייצור. למשל, כיצד יודעים כי אחרי שנתיים אחוז החומר הפעיל יורד אל מתחת לקו של 90 האחוזים. כאן הסטטיסטיקה נכנסת לפעולה.

מהם האינטרסים של בעליי העניין?

יש למעשה שלושה בעלי אינטרסים: הצרכנים/החולים, חברות התרופות, והרשות הרגולטורית.
לרשות הרגולטורית, לחברות התרופות ולצרכנים יש אינטרס משותף. שלושתם רוצים כי הצרכן יוכל לסמוך על כך שהתרופה תהיה יעילה ובטוחה לשימוש כל עוד תאריך התוקף לא פג. כאן אולי צריך להדגיש כי גם חברת התרופות מעוניינת בכך: מי רוצה שהלקוח שלו ישתמש במוצר פגום ועקב כך ייגרם לו נזק?
בעניין משך חיי המדף/תאריך התוקף של התרופה הדברים קצת יותר מסובכים.
הרשויות הרגולטוריות (בעיקר ה-FDA) רוצות ללכת על בטוח, ולכן מגבילות באופן מעשי את משך חיי המדף לשלוש שנים (אם כי לפי ההנחיות של ה-FDA יש אפשרות תיאורטית לקביעה של משך חיי מדף ארוכים יותר). כמו כן, הרשויות מכתיבות אומדנים שמרניים למשך חיי המדף. בכל שלב בתאריך קביעת משך חיי המדף, משתמשים בתרחיש הגרוע ביותר (worst case scenario) כבסיס להמשך לשלב הבא. זהירות יתר זו גורמת לכך שבדרך כלל משך חיי המדף הרשמי נמוך ממשך חיי המדף האמיתיים.
הצרכנים מעוניינים בחיי מדף ארוכים. זה נכון בעיקר כאשר מדובר בתרופות ללא מרשם לשימוש מזדמן, פאראצטמול למשל. אם אתה קונה את הפאראצטמול כדי שיהיה לך משכך כאבים זמין למקרה של כאב ראש מדי פעם, אתה לא מעוניין שתאריך התוקף יעבור ותצטרך לזרוק לפח את המלאי שנשאר לך. מצד שני, ייתכן כי הצרכנים יפקפקו בתאריכי תוקף רחוקים במיוחד.
גם חברות התרופות, בניגוד למה שמקובל לחשוב, מעוניינות בתאריכי תוקף ארוכים ככל האפשר. הסיבה לכך היא שתאריכי תוקף ארוכים יותר מאפשרים יותר גמישות בתהליכי הייצור והלוגיסטיקה, ומכך נגזר רווח גדול יותר.
קו ייצור טיפוסי משמש לייצור של סוגים שונים של תרופות. לאחר שמייצרים אצווה של תרופה א, יש לנקות את קו הייצור לפני שעוברים לייצור של תרופה ב. זה יכול לקחת יום או יומיים, שבהם הייצור מושבת. אם תאריך התוקף של התרופות הוא נמוך, שנה למשל, אצוות הייצור יהיו קטנות, כי צריך לשנע את התרופות לנקודות המכירה ולדאוג כי הן יימכרו לפני סוף השנה. מכיוון שבמצב כזה נאלצים לייצר אצוות קטנות, פירוש הדבר הוא שיש צורך במספר יותר גדול של תהליכי ניקוי, כלומר יש יותר ימים בהם קו הייצור מושבת. וכפי שציינתי, לוחות הזמנים לשינוע התרופה לנקודות המכירה והמכירה עצמה יהיו לחוצים יותר. חיי מדף ארוכים מאפשרים ייצור יעיל יותר.

איך קובעים את משך חיי המדף?

התשובה פשוטה להפליא: מניחים את התרופה על המדף ורואים מה קורה לה. הפרטים, לעומת זאת, לא כל כך פשוטים.
קודם כל, ברור כי לא ניתן לצפות בכל התרופות שיוצרו, אז לוקחים מדגם של אצוות ייצור. גודל המדגם המקובל הוא 3 אצוות. זה מדגם קטן, לכן השונות בו תהיה גבוהה. כפי שנראה מייד, שונות גבוהה מובילה לאומדנים שמרניים יותר של משך חיי המדף, כלומר, האומדן שיחושב למשך חיי המדף יהיה בדרך כלל קטן ממשך חיי המדף בפועל.
מכל אצווה דוגמים מלאי מספיק של תרופות/טבליות שיאפשר את המדידה של כל הפרמטרים במשך תקופת התצפית.
כעת מאכסנים את הטבליות שנדגמו בתנאי אחזקה שונים. אם מדובר למשל בטבלייה שאמורה להיות מוחזקת בטמפרטורת החדר, אז מאכסנים חלק מהמדגם בטמפרטורת החדר – 25 מעלות צלזיוס ו-60 אחוזי לחות. חלק אחר מהמדגם מאוכסן בתנאים פחות נוחים: 30 מעלות צלזיוס ו-65 אחוזי לחות. החלק השלישי מאוכסן בתנאים קשים/מואצים: 40 מעלות צלזיוס ו-75 אחוזי לחות.
הציפיה היא כי הטבליות המאוכסנות בתנאים של 30 עד 35 מעלות יחזיקו מעמד לאורך כל חיי המדף המבוקשים, כלומר אם החברה רוצה לקבוע חיי מדף של שלוש שנים, הן צריכות להחזיק מעמד בתנאים האלה במשך שלוש שנים. כן מצפים כי התרופות המאוכסנות בתנאים המואצים יחזיקו מעמד במשך חצי שנה.
מודדים את ערכי הפרמטרים של הטבליות (כגון אחוז חומר פעיל ורמת הזיהומים) מייד לאחר הייצור. זה בדרך כלל גורם להשמדתן. לאחר מכן, בתקופות זמן שנקבעו מראש מוציאים עוד טבליות מהאחסון, ומודדים את ערכי הפרמטרים בנקודת זמן זו. לאחר שנאספו כל הנתונים אפשר לאמוד את הפרמטרים של תהליך הפירוק, למשל על ידי רגרסיה לינארית. הנה דוגמה פשטנית:

 

 

 

 

 

 

הנקודות הכחולות בגרף הן הערכים שנמדדו לאורך תקופת זמן של 24 חודשים עבור אצווה בודדת. הקו הירוק הוא קו הרגרסיה: המודל התיאורטי שמתאר את תהליך הפירוק. הקווים האדומים הם רווחי הסמך של קו הרגרסיה. רווחי הסמך רחוקים יותר מקו הרגרסיה ככל שהשונות במדגם גדולה יותר. אם מדובר במדד שקטן עם הזמן, למשל אחוז החומר הפעיל, משך חיי המדף ייקבע על ידי הנקודה בזמן בה הקו האדום התחתון יורד אל מתחת לקריטריון. זה עוד אמצעי זהירות המוביל לכך שמשך חיי המדף המדווח על אריזות התרופות נמוך בדרך כלל ממשך חיי המדף האמיתיים.
יש כמובן שלוש אצוות, והנתונים מכל אצווה מנותחים בנפרד, והתוצאה הרשמית היא התוצאה הגרועה ביותר מבין התוצאות שהתקבלו. במקרים מסויימים מותר לאחד את כל הנתונים מהאצוות ולנתח אותם ביחד. שוב, המקרים בהם מותר לבצע את האיחוד מוכתבים על ידי הרשויות הרגולטוריות, והכלל של התרחיש הגרוע ביותר נשמר.

מה עושים אם תאריך התוקף עבר?

ההמלצה היא לא להשתמש בתרופה שתאריך התוקף שלה עבר, למרות שראינו כי תאריך התוקף המדווח הוא בדרך כלל נמוך יותר מתאריך התוקף האמיתי. יש מספר סיבות לכך. ראשית, תאריך התוקף האמיתי אינו ידוע, וייתכן כי הוא לא גדול בהרבה מתאריך התוקף המדווח. שנית, ייתכן כי התרופה הספציפית שברשותך יוצרה באצווה פחות "טובה", ותהליכי הפירוק באצווה הזו הינם מהירים יותר. ולבסוף, סביר להניח כי תנאי האכסון של התרופה שלך היו פחות טובים מתנאי האכסון המומלצים. מי שמחליט להשתמש בתרופות שתאריך התוקף שלהן פג (בעקבות כתבות קונספירטיביות על "הסודות השמורים של חברות התרופות" עושה זאת על אחריותו.
עם זאת ארגונים גדולים, כגון צבא ארצות הברית וצה"ל, מחזיקים מחסני חירום בהם נשמרות תרופות למשכי זמן ארוכים יותר מתאריך התוקף המדווח. זה אפשרי אם אכן התרופות מאוכסנות בתנאי האכסון המומלצים, וכמובן שארגונים אלה עורכים בדיקות משל עצמם למעקב אחרי אחוז החומר הפעיל, אחוז הזיהומים וכולי.

לקריאה נוספת


הערות
  1. וגם החומרים הלא פעילים []

שילה בירד

שילה בירד (נולדה בשם שילה מקדונלד גור, ב-1952) היא ביוסטטיסטיקאית סקוטית. היא ידועה בזכות תרומתה לפיתוח תהליכי חשיבה סטטיסטית במחקרים העוסקים בבריאות הציבור.

שילה בירד

שילה בירד

בירד למדה באוניברסיטת אברדין וסיימה בהצטיינות את לימודי המוסמך במתמטיקה וסטטיסטיקה. בין 1974 ל-1976 הייתה עוזרת מחקר ביחידה לסטטיסטיקה רפואית של אוניברסיטת אדינבורו. במקביל ביצעה מחקר לעבודת דוקטורט בהדרכתו של סטיוארט פוקוק. בין 1976 ל-1980 עבדה כמרצה לסטטיסטיקה במשרה חלקית באוניברסיטת אדינבורו, וב-1980 הצטרפה ליחידה לביוסטטיסטיקה של המועצה למחקר רפואי (MRC) באוניברסיטת קיימברידג',

ב-1999 נישאה לאימונולוג חוקר מחלת האיידס גרהם בירד עימו עבדה בשיתוף פעולה. שישה שבועות לאחר שנישאו, אובחן אצל גרהם בירד גידול סרטני במוח מסוג גליובלסטומה מולטיפורמה, והוא נפטר לאחר כשלושה חודשים. בירד, שפירסמה עד מות בעלה את עבודתה תחת שם נעוריה, גור, החליטה לפרסם מאז והלאה את עבודתה בשם בירד, לזכרו של בעלה המנוח.

עבודתה המדעית של בירד עסקה התחומים רפואיים רבים. עבודת הדוקטורט שלה עסקה בניתוח סיכונים לא פרופורציונליים במחלת סרטן השד. עבודתה בראשית שנות ה-80, בשיתוף פעולה עם גילק ובראדלי, שעסקה בסטטיסטיקה של השתלת האיברים היוותה את הבסיס להתאמה אופטימלית בין תורמי כליות ובין הנזקקים להשתלה. היא הייתה מעורבת במספר מחקרים שעסקו באפידמיולוגיה של מחלת האיידס (כאמור, בשיתוף פעולה עם בעלה לעתיד, גרהם בירד). וכן במחקרים שעסקו במחלת ספגת המוח  ("מחלת הפרה המשוגעת") ובמחלת קרויצפלד-יעקב, ובקשר בין שתי המחלות, ובסיבוכים של מחלת הצהבת מסוג C, בהתמכרות ובתמותה כתוצאה משימוש באופיואידים, ניסוי קליני שתכננה בשיתוף פעולה עם רופא הילדים ד"ר קולין מורלי הוכיח כי ניתן להפחית ב-35% את תמותת התינוקות עקב מצוקה נשימתית על ידי טיפול בתרופה ALEC. כמו כן פירסמה 20 מאמרים שעסקו בשפעת החזירים.

בנוסף לעבודתה המדעית בירד פעלה לקידום השימוש המושכל בסטטיסטיקה במחקר הרפואי. במאמר שפירסמה ביחד עם ג'ונס וריטר ב-1977 חשפה כי ב-52% מהמאמרים בכתב העת BMJ יש טעויות סטטיסטיות. בתחילת שמנות ה-80 פירסמה כ-BMG סידרה של 23 מאמרים שתיארו טעויות נפוצות בשימוש בסטטיסטיקה. בעקבות סדרת המאמרים גובשו הנחיות לחוקרים בדבר אופן השימוש בסטטיסטיקה ודיווח התוצאות, כאשר עמידה בהנחיות אלה מהווה תנאי לפרסום המחקרים במספר רב של כתבי עת מדעיים. היא הייתה חברה במספר ועדות של החברה המלכותית לסטטיסטיקה שעסקו בגיבוש המלצות סטטיסטיות לתחומים שונים, ובהם רגולציה של תרופות ודיווחים עיתונאיים.

עבור הישגיה המדעיים צורפה בירד למסדר האימפריה הבריטית (OBE) בשנת 2011. החברה המלכותית לסטטיסטיקה העניקה לה את מדליית הארד על שם גאי, מדליית הכסף על שם אוסטין ברדפורד היל, ומדליית הזהב על שם צ'יימברס. היא האישה הראשונה שהוענקו לה שלוש מדליות מטעם החברה.

לקריאה נוספת

קראו על עוד נשים בסטטיסטיקה

לין בילארד

לין בילארד (נולדה ב-1943) היא סטטיסטיקאית אוסטרלית המתגוררת בארצות הברית. בנוסף למצויינותה במחקר בסטטיסטיקה, היא ידועה בזכות פעילותה למען קידום נשים במדע.

לין בילארד

לין בילארד

בילארד למדה באוניברסיטת ניו סאות וולס, שם קיבלה תואר ראשון במדעים בשנת 1966 ותואר דוקטור לסטטיסטיקה בשנת 1969. במהלך לימודיה שם זכתה במספר פרסי הצטיינות. עבודת הדוקטורט שלה עסקה בבדיקת סדרתית של השערות דו כיווניות.

בילארד החזיקה במספר משרות אקדמיות באוסטרליה, בריטניה, וארצות הברית. היא כיהנה כפרופסור לסטטיסטיקה באוניברסיטת המדינה של פלורידה, וכראש המחלקה לסטטיסטיקה ומדעי המחשב באוניברסיטת ג'ורג'יה. כן הייתה מרצה אורחת ועמיתת מחקר במספר רב של מוסדות אקדמיים, ביניהם אוניברסיטת סטנפורד, אוניברסיטת ברקלי בקליפורניה, ואימפריאל קולג' בלונדון.

עבודתה המדעית של בילארד הייתה גם תיאורטית וגם יישומית. היא חקרה היבטים תיאורטיים של תהליכים מקריים, ניתוח סדרתי של בדיקת השערות, אמידה, סדרות עיתיות וניתוח נתונים סימבולי.

במקביל, הייתה מעורבת במחקרים יישומיים, בעיקר בתחום הביוסטטיסטיקה. בין היתר חקרה תהליכי התפתחות של מגיפות, את ההשפעה של הופעת האיידס על  מערכת הבריאות ועל תעריפי ביטוח הבריאות, וניתוח נתוני שרידות של אוטם שריר הלב בעזרת אנליזה סימבולית.

בילארד כתבה עשרה ספרים ופירסמה מעל 100 מאמרים מדעיים.

 

פעילות ציבורית ומקצועית

בילארד הייתה פעילה למען קידום נשים במדע, ובין השנים 1988 ל-2004 הדריכה בסדנה שנתית שאורגנה על ידי המוסד הלאומי למדעים (NSF) בה השתתפו נשים צעירות שזה עתה סיימו את הדוקטורט בסטטיסטיקה ועשו את צעדיהן הראשונים בעולם האקדמי. כן חקרה את התהליכים המשפיעים על התפתחות הקריירה של נשים באקדמיה בתחומים המתמטיים. המסקנות שלה מעודדות: הפערים בין גברים ונשים באקדמיה הולכים ומצטמצמים.

בילארד כיהנה כנשיאת החברה הבינלאומית לביומטריקה בין 1994 ל-1995, וכנשיאת האיגוד האמריקני לסטטיסטיקה בין  1995 ל-1996. היא האדם השלישי שכיהן בשני תפקידים אלו. כמו כן נבחרה כחברת כבוד של האיגוד האמריקני לסטטיסטיקה ב-1980, והיא חברה במכון הבינלאומי לסטטיסטיקה ובמכון לסטטיסטיקה מתמטית. היא זכתה בפרסים נוספים, וביניהם המדליה על שם סם וילקס ופרס המייסדים של האיגוד האמריקני לסטטיסטיקה.

עבור פעילותה למען קידום נשים במדע זכתה בפרס על שם אליזבת סקוט ב-2008, בפרס על שם ג'אנט נורווד ב-2011, ובפרס על שם פ. נ. דייויד ב-2013.

לקריאה נוספת

קראו על עוד נשים בסטטיסטיקה