הקדמה
בתאריך 25.3.2008 הרציתי ביום עיון בנושא ” Conducting clinical trials in Israel: strategies for compliance with regulatory requirements ” שאורגן על ידי חברת ביופורום. להלן עיקרי הדברים שאמרתי בהרצאתי, שנשאה את הכותרת ” תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני”.
תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני
תהליך הפיתוח הקליני מורכב בדרך כלל מסדרה של ניסויים קליניים. לצורך הפשטות אתייחס במהלך הדברים אל ניסוי קליני יחיד, אך הדברים תקפים לכל תהליך הפיתוח.
לתהליך הפיתוח שלושה שלבים עיקריים: תכנון הניסוי הקליני (design), ביצועו (conduct) וניתוח תוצאותיו עם סיומו (analysis). אני סבור שאין צורך להכביר מלים על תפקיד הסטטיסטיקה והסטטיסטיקאי בשלב ניתוח התוצאות,. אולם, הסטטיסטיקאי יכול לתרום תרומה משמעותית, ואף מכרעת, בכל אחד משלבי הפיתוח הקליני.
כדי להסביר את דברי עלי להידרש לשני מושגי יסוד (concepts) העומדים בבסיסה של המתודולוגיה הסטטיסטית. אחד המושגים האלה הוא השונות (variation) הקיימת באופן טבעי בכל תהליך שאינו דטרמינסטי, וניסויים קליניים בהחלט טומנים בחובם כמות רבה של שונות. לולא השונות, לא היה צורך בניסויים קליניים. פשוט היה ניתן לבחון את התרופה המיועדת על חולה אחד, ועל פי התוצאה ניתן היה לקבוע האם היא יעילה.
מושג היסוד השני הוא קיומם של שני סוגי טעויות בכל תהליך החלטה. כאשר מוצעת מולקולה כטיפול אפשרי למחלה מסויימת, קיימות שתי אפשרויות: או שהמולקולה יעילה לטיפול במחלה, או שלא. אנו לא יודעים מראש איזה אפשרות נכונה, ולכן אנו מתכננים ניסוי קליני, בסופו תתקבל אחת משתי תוצאות. או שתוצאות הניסוי יספקו עדות כי המולקולה אכן יעילה לטיפול במחלה, או שלא. ניתן להציג את שני המצבים האפשריים במציאות יחד עם שתי התוצאות האפשריות של הניסוי, באופן סכמאטי בטבלה הבאה:
אם התרופה המוצעת אכן יעילה, ותוצאת הניסוי אכן מעידה על כך, הרי שמצבנו מצויין. אם התרופה לא יעילה, ותוצאת הניסוי אכן מאשרת כי התרופה אינה יעילה, זו כמובן תוצאה פחות משמחת, אך עדיין התוצאה טובה, שכן כך לפחות נחסכים משאבים שהיו יכולים להיות מבוזבזים על המשך פיתוח של תרופה לא יעילה, וניתן להפנות משאבים אלה למטרות אחרות.
הבעיה היא שישנם עוד שני מצבים אפשריים. מצב בו התרופה אינה יעילה אך תוצאת הניסוי מספקת עדות ליעילות קלינית מכונה מצב של “False Positive” בפי הקלינאים, והסטטיסטיקאים נוהגים לכנות מצב זה בשם “טעות מסוג ראשון”. המצב הלא פחות נעים בו תוצאת הניסוי אינה מספקת עדות ליעילות התרופה למרות יעילותה נקרא “False Negative” או “טעות מסוג שני”. נהוג לסמן את ההסתברות לטעות מסוג ראשון באות היוונית אלפא, ולכנות אותה בשם “רמת המובהקות” של הניסוי. את ההסתברות לטעות מסוג שני נהוג לסמן באות היוונית ביתא. כמו כן, יותר נוח מבחינה סטטיסטית לא לדון בהסתברות לטעות מסוג שני אלא בהסתברות לא לעשות טעות מסוג שני. הסתברות זו מכונה בשם העוצמה של הניסוי.
לאחר שהבהרתי מושגים אלה, אני יכול לנסח את תפקיד הסטטיסטיקאי במשפט אחד: תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני הוא לדאוג כי רמת המובהקות והעוצמה של הניסוי יהיו תמיד ברמה הרצויה.
ההגדרה הזו מוזרה – הרי ברור תמיד כי אנו נרצה שרמת המובהקות תהיה 0, וכי העוצמה תהיה 1! למרבה הצער, הדבר אינו אפשרי. אם נוריד את רמת המובהקות ל-0, גם העוצמה תצנח ל-0, ואם נעלה את העוצמה ל-1, גם רמת המובהקות תעלה ל-1.
מה שאנו יכולים לעשות זה לשמור על רמת מובהקות נמוכה יחסית, ועל ידי כך להשיג עוצמה סבירה.
מהי רמת מובהקות נמוכה יחסית? הרשויות הרגולטוריות (כגון ה-FDA ומקבילו האירופי, EMEA) מגבילות את יצרני התרופות ודורשות כי בכל ניסוי קליני רמת המובהקות לא תעלה על 5%. (כיוון שלצורך אישור תרופה נדרשים בדרך כלל לפחות 3 ניסויים קליניים, הסיכוי שתרופה לא יעילה תאושר הוא מכפלת רמות המובהקות של שלושת הניסויים, כלומר 0.000125 לכל היותר). כיוון שכך, החברה המפתחת את התרופה מעוניינת כי רמת המובהקות בפועל של הניסוי תהיה קרובה ככל האפשר ל-5% המותרים, אך לא גבוהה מערך זה. כל ניסוי יש לתכנן על סמך מגבלה זו.
בקורסי מבוא לסטטיסטיקה מלמדים בדרך כלל כי עתה יש לנסח השערה סטטיסטית, ולחשב את גודל המדגם שיאפשר את העוצמה הרצויה. אך המציאות שונה משיעורי המבוא לסטטיסטיקה. ישנם גורמים רבים שיכולים להשפיע על רמת המובהקות, העוצמה וגודל המדגם של הניסוי. ברשימתי “שיקולים סטטיסטיים בתכנון ניסויים בבעלי חיים” התייחסתי לדרכים להקטנת גודלי המדגם בניסויים פרה-קליניים. חלק מהדברים שנאמרו שם תקפים גם בניסויים קליניים. בודאי נכונה הטענה כי יש להקפיד על תכנון סטטיסטי נכון של הניסוי.
בשלב תכנון הניסוי הקליני יש לקחת בחשבון את:
- מבנה הניסוי (Experimental design): האם מדובר בניסוי השוואת טיפול לפלסבו, או השוואתו לטיפול אחר, או בדיקתו כתוסף אפשרי לטיפול מקובל? ניסוי בו ננסה להראות כי הטיפול שלנו עדיף על טיפול אחר (superiority) אינו נופל ממנו (Non-inferiority) או שקול לו (Bioequivalence)? האם מדובר בניסוי בו כל קבוצת חולים מקבלת טיפול אחר(Parallel arm), ניסוי בו יש כל החולים מטופלים ללא קבוצת ביקורת (Single arm), או ניסוי בו יש החלפת טיפול במהלך הניסוי (Cross over)? האם תהיה אנליזת ביניים (Interim/futility analysis) במהלך הניסוי? ואם לא, למה לא? האם הניסוי יהיה אדפטיבי (Adaptive design- על כך תהיה רשימה נפרדת בעתיד)?
- בחירת הפרמטר הקליני (Clinical endpoint) לפיו תקבע יעילות הטיפול. ככלל, יש לבחור תמיד בפרמטר האינפורמטיבי ביותר. לדוגמא, במחלות המתבטאות בהתקפים (כגון אפילפסיה או טרשת נפוצה), מייחסים הרופאים משמעות קלינית רבה לתקופה נטולת התקפים, ולכן הם נוטים להמליץ על אחוד החולים שלא סבלו מהתקפים במהלך הניסוי כעל המדד הקליני העיקרי להצלחת הטיפול. הבעיה היא שמדד כזה טומן בחובו איבוד אינפורמציה, ומדד עדיף הוא מספר ההתקפים שחווה כל חולה (היכול להיות גם אפס). מדד זה הינו אינפורמטיבי יותר: אם אנו יודעים את מספר ההתקפים שחווה החולה, אנו בודאי יודעים אם היה נטול התקפים במהלך תקופת הטיפול. לעומת זאת, אם אנו יודעים כי החולה לא היה נטול התקפים, אין באפשרותנו לדעת כמה התקפים עבר. לכן המדד של מספר ההתקפים אינפורמטיבי יותר ממדד ה-“seizure free”. משפט יסודי בסטטיסטיקה אומר כי משתנה מחקר אינפורמטיבי יותר מבטיח עוצמה גבוהה יותר, ולכן עדיף להשתמש בו.
- בחירת אוכלוסיית הניסוי, כלומר בחירת הקריטריונים לפיהם חולה יכול להשתתף בניסוי יכולה להשפיע גם היא על התוצאה. הסטטיסטיקאי יכול לנתח את ההשפעה האפשרית של הכללת סוגים שונים של חולים בניסוי, ולעזור לצוות הקליני בקביעת הקריטריונים.
- השפעת המצב הקליני של החולים על האפקט התרפויטי הצפוי: תכנון הניסוי מבוסס במידה רבה על הנחות לגבי אוכלוסיית החולים, ובדרך כלל הידע עליו מתבססות ההנחות מועט. הסטטיסטיקאי יכול וצריך לבדוק מה יקרה לעוצמת הניסוי במקרה שההנחות לא משקפות את המציאות, ועל ידי כך לסייע להעריך את הסיכון הגלום בביצוע הניסוי.
- למתודולוגית ניתוח הנתונים יש השפעה עצומה על העוצמה הסטטיסטית של הניסוי. ניתן כמובן להשתמש בשיטות ניתוח סטנדרטיות המבוססות על ההנחה כי התפלגות הנתונים היא נורמלית, גם כאשר ברור כי ההתפלגות אינה כזו (לדוגמא – מספר ההתקפים בודאי אינו מפולג נורמלית). אולם כיום קיימים כלים סטטיסטיים ומיחשוביים לניתוח נתונים ממגוון התפלגויות, ועוצמתם גבוהה יותר מהשיטות הסטנדרטיות המיושנות יוותר. כמובן, בפרוטוקול הניסוי יש לפרט את המתודולוגיה הסטטיסטית לניתוח תוצאות הניסוי. כאשר הניסוי מתחיל כבר מאוחר מדי לדון בשיטות לניתוח התוצאות! אם מעוניינים להשתמש בשיטות ניתוח בייסיאניות, יש לקבל את אישור הרשויות הרגולטוריות לפני תחילת הניסוי.
עד כאן תיארתי את תפקיד הסטטיסטיקאי במהלך תכנון הניסוי.
לאחר תחילת הניסוי, על הסטטיסטיקאי לעקוב באופן שוטף אחר הנתונים המצטברים, ולוודא כי ההנחות על פיהן תוכנן הניסוי אכן מתקיימות. זו משימה בעייתית, כיוון שכל עוד הניסוי לא הסתיים, לא ניתן לדעת איזה טיפול מקבל כל חולה. קיימות שיטות סטטיסטיות שאינן נצרכות למידע זה, והסטטיסטיקאי מוגבל לשימוש בשיטות אלה בלבד. במקרה ויש סטייה משמעותית מההנחות, העלולה להשפיע על עוצמת הניסוי (ועל תוצאתו), על הסטטיסטיקאי להתריע על כך ולהציע דרכים לתיקון המצב. סטטיסטיקאי טוב יצפה מצבים כאלה מראש ויציין בפרוטוקול הניסוי את הפעולות שיינקטו במצבים כאלה.
בסיום הניסוי, לסטטיסטיקאי יש כמובן תפקיד מכריע בניתוח תוצאותיו.
לסיכום: הסטטיסטיקאי יכול לתרום תרומה משמעותית לכל אחד משלבי הפיתוח הקליני, אך השלב בו תרומתו היא המשמעותית ביותר היא שלב התכנון.
פורסם לראשונה באתר “רשימות” בתאריך 28 במרץ 2008 שם התקבלו 2 תגובות
nachum בתאריך 3/29/2008 11:17:09 AM
ללא נושא
it must be–shnei sugei tauiot.and please explain your opinion what is–lama.
יוסי לוי [אתר] בתאריך 3/30/2008 7:25:07 AM
נחום
?????