כינוס הפתיחה החגיגי של העמותה לקידום המחקר והניסויים הקליניים בישראל
העמותה הזו אמנם נתמכת על ידי גורם מסחרי (חברת ביופורום), אבל זה לא אומר שהיא פסולה מלכתחילה – אני מכיר חלק מהאנשים בביופורום והם בהחלט מקצועיים. אמנם לא החלטתי אם אשתתף בכנס הזה, אבל תוכלו להסיק שאם טרחתי לפרסם את דבר קיומו כאן, אני בהחלט מייחס חשיבות לקיומו.
למעוניינים בפרטים, הנה לינק לדף הבית של העמותה והכנס.
נשלח: 31 באוגוסט, 2009. נושאים: כללי.
תגובות: 3
| טראקבק
הספר החדש ב-wish list שלי
מה שאני אוהב במיוחד בנסיעות לארה"ב זה את חנויות הספרים. אני אוהב להכנס ל-Border's או ל-Barnes and Nobles, לשבת בנחת ולעיין בספרים שאספתי מהמדפים. הנסיעה האחרונה לא היו לי הרבה הזדמנויות לכך. המלון שבו שהיתי במיאמי היה בדאון-טאון, ולמעשה מרוחק מכל מקום, כאשר חנות הספרים הקרובה ביותר הייתה במרחק 15 מייל. למרבה המזל, בשדה התעופה של ניוארק יש חנות גדולה למדי (יחסית לשדות תעופה) של Border's, וביליתי בה כשעה לפני ההמראה חזרה לארץ ביום חמישי האחרון. אספתי מהמדפים שלושה ספרים, אך בסופו של דבר הקדשתי את רוב הזמן לעיון בספר אחד, שמצא בסופו של דבר את דרכו אל ה-Wish List שלי באמזון.
הספר הזה נשא את הכותרת Traffic, עם כותרת המשנה (בתרגום חופשי שלי): "מדוע אנו נוהגים כך ומה זה אומר עלינו". הספר מנסה לענות על שאלות מעניינות רבות, ואני מנחש שכבר שאלתם את עצמכם חלק מהשאלות האלה (למשל: מדוע התנועה בנתיב הסמוך מהירה יותר, או מדוע כשסוללים עוד כבישים פקקי התנועה גדלים), וגם שאלות שלא חשבתם כי הן רלוונטיות עבורכם (האם אתם באמת נהגים טובים כמו שאתם חושבים?).
עורך הספר, טום ונדרבילט, מעיד כי הרעיון לכתיבתו עלה במוחו כאשר נתקע בפקק בניו-גרזי, עקף טור שלם של מכוניות, והשתחל לתוך הנתיב ברגע האחרון לחרדתה של אשתו שישבה לידו. נשמע מוכר?
אני ממליץ לכם לעיין בדף של הספר באמזון, וגם באתר הרשמי של הספר ובבלוג של טום ונדרבילט. לעצמי גם המלצתי לקרוא את הספר בהזדמנות הקרובה.
נשלח: 31 באוגוסט, 2009. נושאים: הממ... מעניין....
תגובות: 5
| טראקבק
הכוכב, הסמים והכומר
לפני כחודשיים דיווחתי כאן על השעייתו של סופרסטאר הבייסבול מני רמירז ל-50 משחקים, לאחר שבבדיקת סמים שנערכה לו התקבלה תוצאה חיובית. עם הדיווח העליתי נקודה למחשבה: לאור העובדה שבבדיקה התקבלה תוצאה חיובית, מה ההסתברות כי רמירז אכן השתמש בסמים אסורים? נתתי גם רמז עבה לפתרון: מספר 4 ברשימת 15 הסטטיסטיקאים הגדולים.
הבטחתי רשימה בנושא, והנה אני סוף סוף מקיים. לזירוז העניין תרם דוברמן, שפרסם בבלוג שלו את החידה הזו. ההקשר היה שונה (שפעת החזירים במקום סמים אסורים), אבל העקרון זהה. מי שמעוניין לקרוא את הפתרון של דוברמן יכול לקרוא אותו בלינק הזה, אם כי אני מייד אתן הסבר משלי וגם ארחיב על הנושא.
ובכן, מה ההסתברות כי רמירז אכן השתמש בסמים אסורים אם בדיקת הסמים שלו הייתה חיובית? התשובה האמיתית והכנה ביותר שאני יכול לתת לכם היא שאני לא יודע. חסרים נתונים. אז בואו ונמציא נתונים לצורך התרגיל. בדיקת הסמים יכולה לטעות. יכול להיות שנבדק כלשהו משתמש בסמים אסורים, ובכל זאת מתקבלת תוצאה שלילית בבדיקה. גם יכול להיות שהנבדק לא השתמש בסמים אסורים ותוצאת הבדיקה בכל זאת הייתה חיובית משום מה (רמירז לא טען זאת, דרך אגב). אלה הן שתי הטעויות שעשויות לקרות בכל תהליך קבלת החלטות. אבל באיזה סיכוי עשויה כל טעות להתרחש? אני אניח, כמו דוברמן בחידה שלו, כי לכל טעות יש סיכוי של אחוז אחד, כלומר 0.01. (את הסיכויים האמיתיים יודעים מן הסתם יצרני ערכת הבדיקה). עדיין אין מספיק נתונים. כדי לענות על השאלה צריך גם לדעת מהו אחוז משתמשי הסמים באוכלוסיה הרלוונטית, ואת האחוז הזה קשה מאוד לברר. אני מעריך את המספר הזה ב-5 עד 10 אחוז. מסמך פנימי של ליגת ה-MLB שהודלף לאחרונה אמר כי בשנת 2003 התקבלו תוצאות חיוביות אצל 104 שחקנים שנבדקו (אשמח ללינק – לא מצאתי את הידיעה המקורית). בליגה יש כ-1000 שחקנים, ולכן אחוז המשתמשים הוא בסביבות 10. יש הסבורים כי "תקופת הסטרואידים" שהחלה לקראת סוף שנות התשעים של המאה הקודמת כנראה חלפה כבר מן העולם. אני סבור כי השחקנים פשוט עברו להשתמש בחומרים חדשים, שבבדיקות הנוכחיות לא מזהות. יש להם תמריץ כלכלי לכך. בואו ניקח את המספר העגול של 10% לצורך התרגיל.
נניח שכל 1000 השחקנים נבדקים. מתוכם 100 משתמשים בסמים אסורים, על פי הנחתנו, ומכיוון שהבדיקה תתן תוצאה חיובית אם הנבדק משתמש בסמים ב-99 אחוז מהמקרים, נקבל (תיאורטית) 99 תוצאות חיוביות ותוצאה שלילית אחת. 900 השחקנים האחרים נקיים, ועבור 99% מהם תוצאת הבדיקה תהיה שלילית. כלומר, יתקבלו 891 תוצאות שליליות , ואילו 9 שחקנים חסרי מזל יקבלו תוצאה חיובית (ואלי יושעו) הגם שלא השתמשו בסמים אסורים. נרכז את המספרים האלה בטבלה:
|
|
|
תוצאת הבדיקה |
|
|
|
|
|
חיובית |
שלילית |
סה"כ |
|
משתמש בסמים אסורים? |
משתמש |
99 |
1 |
100 |
|
לא משתמש |
9 |
891 |
900 |
|
|
|
סה"כ |
108 |
892 |
1000 |
מתוך 108 שחקנים עבורם התקבלה תוצאה חיובית, 99 אכן משתמשים בסמים, ולכן ההסתברות כי שחקן שתוצאת הבדיקה שלו חיובית אכן משתמש בסמים היא 99/108 כלומר כמעט 92%.
שימו לב כי התוצאה תלויה בהנחה הראשונית על אחוז השחקנים המשתמשים בסמים, שאינו ידוע לנו. אם האחוז הזה הוא רק 5% ולא 10%, אז ההסתברות כי השחקן "שלנו" אכן השתמש בסמים תהיה "רק" 84%.
עכשיו בואו נעזוב את החישובים, ונעבור לדיון עקרוני בתרגיל שנעשה. אנו התמקדנו בשני מאורעות. צפינו במאורע "בבדיקת הסמים התקבלה תוצאה חיובית" והתעניינו במאורע "השחקן שנבדק משתמש בסמים אסורים". כמו כן היו נתונות לנו מספר הסתברויות. הייתה ידועה לנו, בין היתר ההסתברות כי תוצאת בדיקת הסמים היא חיובית כאשר ידוע כי השחקן הנבדק משתמש בסמים אסורים. אבל ההסתברות שעניינה אותנו באמת הייתה ההסתברות כי השחקן הנבדק משתמש בסמים אסורים כאשר ידוע כי תוצאת בדיקת הסמים היא חיובית. שתי ההסתברויות שתיארתי הן הסתברויות מותנות, אבל מתארות מצבים שונים. אחת מתארת הסתברות של מאורע שקורה בהווה (תוצאת הבדיקה חיובית) בהנתן מאורע שקרה בעבר (השחקן השתמש בסמים אסורים). השניה מתארת הסתברות של מאורע שקרה בעבר בהנתן מאורע שקרה בהווה. החישוב שלנו "הפך" את כיוון זרימת הזמן: מההווה לעבר במקום מעבר להווה. וכזכור, כל התרגיל שלנו לא היה מתאפשר ללא הנחה אפריורית כלשהי על אחוז השחקנים המשתמשים בסמים אסורים. הבדיקה אפשרה לנו לעדכן את ההסתברות האפריורית לכך שהשחקן השתמש בסמים אסורים, ולהחליף אותה בהסתברות אפוסטריורית.
הנה תיאור אפשרי אחר של התהליך: בהתחלה לא היה לנו כל ידע לגבי הרגלי השימוש של השחקן המסוים בסמים אסורים, ולכן הנחנו כי הסיכוי לכך שהוא משתמש בסמים כאלה שווה לפרופורציית השחקנים המשתמשים בסמים. הבדיקה שנערכה ותוצאתה נתנו לנו אינפורמציה חדשה, וממנה למדנו כי ההסתברות שהשחקן משתמש בסמים גבוהה הרבה יותר. החישוב שעשינו הוא מעין ביטוי מתמטי לתהליך למידה.
הראשון שניסח את התרגיל ההסתברותי הזה בכתובים היה כומר אנגלי שחי לו במאה ה-18, ושמו תומאס בייס. בייס היה ידוע כמי שעוסק במתמטיקה, ואף היה חבר החברה המלכותית, אם כי בימי חייו לא פרסם אף לא מאמר אחד שתיעד את עבודתו. המאמר המתמטי היחיד שהתפרסם תחת שמו הופיע רק שנתיים לאחר מותו, וזהו למעשה מכתב ששלח לידידו ג'ון קאנטון. במכתב תיאר בייס את הדרך לחשב "הסתברות מותנה הפוכה" (שתיארתי זה עתה). הדוגמא שהביא בייס עסקה, אגב, בסיכויי הנצחון במשחק ביליארד, במיטב המסורת של התפתחות תורת ההסתברות בהתאם לצרכיהם של המהמרים. למעוניינים לקרוא את המאמר עצמו, הנה קישור לקובץ pdf. עותק מקורי של המאמר, דרך אגב, יעלה לכם כ-4200 דולר, אם תמצאו מישהו שמוכן למכור.
הקוראים הותיקים של הבלוג הזה אמורים לדעת כי הזכרתי את בייס בעבר. הוא מופיע במקום ה-4 ברשימת 15 הסטטיסטיקאים הגדולים שערכתי. בעבר קוננתי על כך שמשפט בייס לא הופיע ברשימת 100 המשפטים הגדולים של המתמטיקה שערך מישהו. במסגרת התחקיר לרשימה זו הגעתי ל"פרוייקט מילניום" שנערך על ידי המרכז למדעים קוגניטיביים אוניברסיטת מינסוטה, שניסה לבחור ולדרג את 100 העבודות המשפיעות ביותר על המדעים הקוגניטיביים. מאמרו של בייס היה בין 306 העבודות המועמדות, אך פאנל המומחים שביצע את מלאכת הדירוג לא חשב שהעבודה ראויה דיה כדי להכלל ב-Top 100.
כפי שציינתי כאן בעבר, על הבסיס שהניח בייס צמח ענף שלם של הסטטיסטיקה שנקרא כמובן "סטטיסטיקה בייסיאנית". לסטטיסטיקה הבייסיאנית שימושים מרחיקי לכת. היא עומדת בבסיסן של מערכות הבינה המלאכותית למינהן, ומיושמת במגוון תחומים, החל בגנטיקה וכלה בסינון דואר זבל. אני מסתפק כאן בהפניה למאמר שפרסם פרופ' ישראל בנימיני ב-Ynet לפני מספר שנים, בו יש סקירה נאה של המשפט ושימושיו.
נשלח: 19 באוגוסט, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, המשפטים הגדולים של הסטטיסטיקה.
תגובות: 6
| טראקבק
עקבו אחרי בטוויטר
נשלח: 17 באוגוסט, 2009. נושאים: כללי.
תגובות: 1
| טראקבק
על חוסר-התועלת של הקיום וסרבנות חיסון
רועי צזנה, בבלוג "מדע אחר" בתפוז, כתב אתמול "על חוסר-התועלת של הקיום, על המקור לדת ולמה השימפנזים חכמים יותר מבני-האדם". הוא מתאר חב"דניק שניסה לשכנע אותו להניח תפילין, ואת הדו-שיח ההזוי שהתפתח בינם.
וויינט מדווח היום כי ישראל מצטרפת לרשימת המדינות שמטילה סנקציות על סרבני החיסון,. במסגרת הכתבה מובאים דבריו של איש הייטק מסרב לחסן את ילדיו ומתנגד ליוזמה, שבוטלה בינתיים, לחייב את ההורים לחסן את ילדיהם לפני גיל הגן או בית הספר.
שני פריטי רשת לא קשורים, ובכל זאת, הדמיון בין טיעוני איש ההייטק וטיעוני החב"דניק גדול מכדי שיהיה אפשר להתעלם.
נשלח: 17 באוגוסט, 2009. נושאים: בריאות, מדע.
תגובות: 10
| טראקבק
קמיל פוקס וחנוך מרמרי מתדיינים על הטיות בסקרים
בשבוע האחרון מתנהל דיון מעניין בין העיתונאי חנוך מרמרי והסטטיסטיקאי קמיל פוקס.
הכל החל בסקר שערך פוקס ו תוצאות ראשוניות ממנו פורסמו בעיתון "הארץ" (אותו ערך מרמרי בעבר) בתאריך 6.8.2009. לפי הסקר שבוצע בפיקוחו של פוקס, 46% השיבו בחיוב על השאלה "האם הומוסקסואליות היא בעיניך סטייה?". 42% השיבו שלא מדובר בסטייה. יתר הנשאלים השיבו שאינם יודעים.(הערה: לא הצלחתי למצוא באתר הארץ את התוצאות המלאות של הסקר, שהתפרסמו ביום שישי, 7.8.2009. אשמח ללינק).
הסקר העלה את חמתו של מרמרי, שפרש את טענותיו באתר "העין השביעית" בתאריך 9.8.2009, תחת הכותרת "מהי סטייה? מהי הטיה". מרמרי טען כי השאלה שעמדה בבסיס סקר שיזם "הארץ", יוצרת בעיה בפרשנות המשיב, בעיה בתשובתו, בעיה בפרשנות העיתונאית לתשובה ובעיה בפרשנות קורא העיתונים. לדעתו, אילו נוסחה השאלה באופן אחר, היו מתקבלות תוצאות שונות באופן משמעותי מהתוצאות שהתקבלו בסקר, והיה מתברר כי הציבור הישראלי אולי סובלני יותר מכפי שהשתקף בסקר של פוקס. (פורמלית מרמרי בודאי צודק: אם שואלים שאלה אחרת, מקבלים תשובה אחרת). מרמרי תוקף לא רק את פוקס, אלא גם את עיתון "הארץ" שאותו ערך בעבר, וטוען כי העיתון בחר לנצל את הסקר ולפרש את תוצאותיו באופן המעודד הומופוביות.
אתמול התפרסמה באתר העין השביעית תגובתו של פוקס לטענותיו של מרמרי. "לא הטיה ולא הטעיה. אם בכלל, שיקול דעת שאפשר להתווכח עליו. בוודאי לא רצון לסנסציה ול'צהבת" – ענה פוקס למרמרי, והראה כי ההבדלים בין תשובות לסקר שערך ובין התשובות לסקר אחר שהשתמש ב-"שאלה הנכונה" (לדעת מרמרי) מזעריים.
נשלח: 11 באוגוסט, 2009. נושאים: מה אומרת הסטטיסטיקה, סקרים.
תגובות: 5
| טראקבק
סטטיסטיקה זה סקסי
סטטיסטיקה זה סקסי. אני ידעתי את זה מאז ומתמיד, אבל עכשיו כולם (כנראה) מתחילים לראות את האור.
האל וריאן הוא פרופסור למדעי המידע, עסקים וכלכלה באוניברסיטת קליפורניה בברקלי. הוא גם הכלכלן הראשי של חברה שאולי שמעתם עליה, שנקראת בשם המוזר גוגל. בראיון שנתן וריאן בתחילת השנה לכתב העת של חברת הייעוץ מקינזי, אמר וריאן:
.I keep saying the sexy job in the next ten years will be statisticians
והסביר את דבריו (תרגום חופשי שלי):
"היכולות לקחת נתונים, להבין אותם, לעבד אותם, להעניק להם ערך, להציג אותם, לתקשר אותם – יהיו כישורים בעלי חשיבות עצומה בעשורים הקרובים, לא רק ברמה המקצועית, אלא גם ברמה החינוכית מבית הספר היסודי ועד לאוניברסיטה. הנתונים זמינים לכולנו באופן חפשי. היתרון נמצא ביכולת להבין את הנתונים ואת ערכם.
דבריו של וריאן הגיעו במהירות אל הניו-יורק טיימס, שם הופיעה אתמול כתבה תחת הכותרת: "For Today’s Graduate, Just One Word: Statistics", ובה מתוארים השימושים המתקדמים של הסטטיסטיקה בתחומים שונים, החל ממדעי המחשב וכלה בארכיאולוגיה. אתם מוזמנים לקרוא.
ובכל זאת, אני לא התרגשתי מהדברים. וריאן רק חזר, במלים אחרות, על דבריו של סופר המדע הבדיוני ה. ג'. וולס:
"Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write." – H. G. Wells
ששימשו אותי כמוטו להרצאה שנתתי לפני כשנתיים וחצי ביום העיון של האיגוד הישראלי לסטטיסטיקה שעסק בנושא "הסטטיסטיקה בתעשייה לאן?".
תודה לכל מי ששלח לי את הלינקים לשתי הכתבות.
נשלח: 7 באוגוסט, 2009. נושאים: האנשים שמאחורי הסטטיסטיקה, הממ... מעניין..., על סדר היום.
תגובות: 4
| טראקבק
אה באיזה צבע?
הכותרת היא בדיחה משפחתית, אבל הבעיה שתוצג כאן היא אמיתית.
נניח שאני רוצה להציג תוצאות של ניסוי קליני בו היו 3 קבוצות: התרופה הנסיונית, תרופה פעילה ופלסבו. כמובן שאני רוצה להדגיש את היתרונות של התרופה הנסיונית לעומת התרופה הפעילה והפלסבו. איזה צבע כדאי לבחור לכל קבוצה?
נראה כי הבחירה הטובה היא ירוק לטיפול הנסיוני, אדום לתרופה הפעילה (שמן הסתם מתחרה בתרופה הנסיונית "שלנו") וכחול או שחור לפלסבו.
הבחירה הזו עולה מתוך מחקר של חברת HP אשר בדק את ההשפעה של שימוש בצבעים שונים על ההיענות של הנבדקים להיגדים שונים יכול לשפוך אור חדש על הבעיה הזו.
טל גלילי הציג את טקסט המחקר בבלוג "המדריך לטרמפיסט בסטטיסטיקה". אני ממליץ לקרוא.
נשלח: 29 ביולי, 2009. נושאים: הממ... מעניין....
תגובות: 1
| טראקבק
כמה שווים יחסי משפחה טובים?
אין לי אחות, אבל מי שיש לו (או לה) אחת, מוזמן לשאול את עצמו תמורת כמה כסף הוא מוכן להרוס את היחסים בינהם.
כלכלנים סבורים שכל דבר ניתן לכימות כספי, והכל שאלה של מחיר. אני ממש לא מסכים עם הדיעה הזו, אבל בדה-מרקר של אתמול מצאתי דוגמא נאה שמאפשרת למדוד, כספית, את שווי היחסים שבין אחות לרעותה.
בכתבה שכותרתה "איך לכתוב צוואה ולהימנע מעימותים?", סיפר עו"ד בועז קראוס, מומחה לדיני ירושות וצוואות, על מקרה בו אדם הורה בצוואתו לחלק את רכושו, שכללו כ-20 דונם קרקע באיזור רמת השרון, באופן שווה בין נכדיו. לאיש היו ארבע נכדים, שניים מכל בת, כך שמבחינתו הצוואה הייתה הוגנת ושוויונית. אולם, אחת הבנות גילתה את הכתוב בצוואה כשאביה עדיין היה בחיים, ומיהרה להביא לעולם שני ילדים נוספים. מי שמעוניין לדעת איך הסתיים המקרה הנ"ל (מבחינה משפטית) מוזמן לקרוא את הכתבה. מה היה טיב היחסים בין האחיות לפני הפרשה ואחריה, לא נדע, וכל אחד חופשי לערוך את הספקולציות שלו. את השווי הכספי של מערכת היחסים, אפשר להעריך בצורה לא רעה.
מלכתחילה, כל אחות הייתה אמורה לקבל מאביה 10 דונם, אולם בזכות שני הילדים הנוספים שהביאה אותה אחות לעולם, עלה חלקה בעזבון ממחצית לשני שלישים, כלומר ל-13.3 דונם בערך. הכפילו את הרווח, 3.3 דונם ברמת השרון, במחירו של דונם, ותקבלו את התשובה.
נשלח: 21 ביולי, 2009. נושאים: הממ... מעניין..., חשבון פשוט.
תגובות: 4
| טראקבק
כשלים סטטיסטיים אפשריים בניסויים קליניים – סקירת ספרות
כפי שכתבתי בהקדמה לסדרת הרשימות הזו, הופתעתי לגלות כי יש מעט מאוד פרסומים בנושא זה. ברשימה זו אסקור את המעט שמצאתי. אם מי מהקוראים מכיר או נתקל בעוד פרסומים בנושא, אשמח לקבל הפניה.
המשך הרשימה עלול להיות סתום בעיני חלק מהקוראים. לא להבהל – אני אסביר את הכל ברשימות הבאות בסדרה.
בשנת 2000 פרסמו Assmann, Pocock, Enos ו- Kasten מאמר שכותרתו "Subgroup analysis and other (mis)uses of baseline data in clinical trials" בכתב העת היוקרתי The Lancet. הם בחנו 50 מאמרים שמציגים תוצאות מניסויים קליניים, ופורסמו בארבעה כתבי עת מובילים בתקופה של שלושה חודשים בשנת 1997., ובחנו את האופן בו הוצגו ונותחו נתוני הבסיס (baseline data) של הניסויים האלה., וכן את הדרך בו השתמשו בנתונים אלה לפילוח אוכלוסיית הניסוי (subgrouping). המסקנות של קסטן ועמיתיה עגומות: מחצית המחקרים השתמשו בשיטות סטטיסטיות"לא מתאימות"; שני שליש מהמחקרים דיווחו תוצאות לגבי תתי-אוכלוסיות, שוב ללא שימוש במבחנים סטטיסטיים מתאימים. הארבעה פרסמו גם סקירה טכנית יותר של ממצאיהם המיועדת לסטטיסטיקאים בכתב העת Statistics in Medicine בשנת 2002.
Zlowodzki, Jönsson, ו- Bhandariפרסמו ב-2005 מאמר שכותרתו "Common Pitfalls in the Conduct of Clinical Research". הם מתייחסים שם למחלקה רחבה של מחקריים קליניים, ובפרט לניסויים קליניים מבוקרים. הכשלים האפשריים שהם מונים בניסוי קליני מבוקר הם: חוסר סמיות (lack of blinding), כשלים ברנדומיזציה, השמטת חולים שלא סיימו את הניסוי (dropouts) מניתוח הנתונים, עצמה סטטיסטית נמוכה עקב מדגם קטן מדי, והגדלת הטעות מהסוג הראשון עקב בדיקת השערות מרובות וניתוח משתנים מרובים.
Helberg פרסם ברשת מאמר שכותרתו "Pitfalls of Data Analysis", עם כותרת המשנה "How to Avoid Lies and Damned Lies". הלברג לא עוסק בניסויים קליניים אלא מתייחס לנושא באופן כללי. המאמר שלו מזכיר בסגנונו את הספר הקלאסי של דארל האף "How to lie with statistics", שגם נכלל ברשימת המקורות שלו. בין הכשלים שהוא מונה: הטיה עקב דגימה לא נכונה, חוסר תקפות של הנחות המודל הסטטיסטי, עצמה נמוכה, בדיקת השערות מרובות, טעויות מדידה. הוא מקדיש חלק שלם במאמר לכשלים בפירוש התוצאות של המחקר, ובפרט: ההבדל בין משמעות סטטיסטית למשמעות מעשית, אי התייחסות לדיוק התוצאות (הן במובן של precision והן במובן של accuracy), והפרשנות של מתאם כסיבתיות. בנוסף, הוא מביא דוגמאות להצגות גרפיות מטעות.
Strasak, Zaman, Pfeiffer, Gobel ו- Ulmerפרסמו ב-2007 מאמר שכותרת ו"Statistical errors in medical research – a review of common pitfalls" (הקישור לקובץ pdf). בעבודתם הם סקרו עשרות מאמרים שפורסמו בכתבי עת שונים, וזיהו בסך הכל 47 סוגי כשלים שונים. הם מיינו את הכשלים לחמש קבוצות לפי שלבי המחקר הרפואי: תכנון המחקר, ניתוח הנתונים, תיעוד המחקר, הצגת הנתונים, ופירוש התוצאות (interpretation). החלוקה הראשונית שלהם משמשת כבסיס לסדרת הרשימות הזו.
Young התייחס ב-2007 לעבודה של Strasak ועמיתיו במאמר שכותרתו "Statistical errors in medical research – a chronic disease?" (קישור לקובץ pdf), והוסיף תובנות משלו, בעיקר לגבי שלב ניתוח הנתונים. הוא אמנם משבח את עבודתם, אך מסתייג מקביעתם כי "אין צורך לקרוא ספרי לימוד שלמים בנושא הסטטיסטיקה". הוא מציין, ובצדק, כי "קריאה של טקסטים בסטטיסטיקה בהחלט שווה את המאמץ", וישנם ספרי לימוד שאינם כה קשים לקריאה.
הנושא של משמעות סטטיסטית מול משמעות קלינית הוא נושא כאוב למדי. לעיתים ניתן לגלות במחקר אפקט כלשהו מובהק סטטיסטית, אך האם יש לו גם משמעות מבחינה קלינית/רפואית? לא תמיד. בפגישת עבודה שהייתה לי ולעמיתיי לפני מספר חודשים עם פרופ טום פלמינג, מבכירי הסטטיסטיקאים של דורנו, הוא אמר (ציטוט חופשי מהזכרון): "מטרת הניסוי הקליני אינו השגת אפקט מובהק סטטיסטית, אלא השגת עדות סטטיסטית לאפקט משמעותי מבחינה קלינית". הדברים האלה ברורים לכל ביוסטטיסטיקאי, אך לא תמיד לחוקרים. לשמחתי, גיליתי מספר לא מועט של התייחסויות לנושא. פירוש מיידי של אפקט מובהק סטטיסטית כאפקט משמעותי מבחינה קלינית הוא לא רק כשל באינטרפרטציה. זה מעיד גם על כשל בשלב התכנון של הניסוי, וגם על כשל בניתוח של כלל הנתונים שהצטברו. שני דיונים טובים בנושא ניתן למצוא במצגת של Pazdur מ-FDA (זמינה ברשת בלינק הזה), וגם במאמר שפרסם בכתב העת The Oncologist איש FDA נוסף, Kane, ב-2008, שכותרתו "The Clinical Significance of Statistical Significance".
עוד ראוי לציין בסקירה קצרה זו את השקפים מסדרת הרצאות בביוסטטיסטיקה לקהל הרחב שניתנו על ידי המרצים באוניברסיטת ג'ונס הופקינס, שכבר דיווחתי עליהם לפני מספר שבועות.
הרשימות הקודמות בסדרה
– כשלים סטטיסטיים אפשריים בניסויים קליניים – הקדמה
נשלח: 20 ביולי, 2009. נושאים: ביוסטטיסטיקה, מדע.
תגובות: 4
| טראקבק