כפי שסיפרתי ברשימה הקודמת, הנחיתי בכנס האיגוד הישראלי לסטטיסטיקה האחרון פאנל שנשא את הכותרת “סטטיסטיקה בשטח”. הפאנל ביקש לעמוד על הקשיים העומדים בפני הסטטיסטיקאי היישומי שצריך לעבוד מול לקוחות, ולהציג אותם בפני הקהל בכנס. הקשיים רבים ומגוונים, וכוללים בעיות בתקשורת, ציפיות בלתי ריאליות מהסטטיסטיקאי, ולעיתים (נדירות, אני שמח לציין) גם בעיות אתיות.למעוניינים בדעתי בנושא, התייחסתי אליו כבר לפני ארבע שנים, ברשימה “הסטטיסטיקה בתעשייה – לאן?”
כפתיח לדיון הקרנתי סרטון קצר, הממחיש את רוב הבעיות שנדונו בפאנל. שתי הדמויות בסרטון הם ביוסטטיסטיקאי וחוקר, המדברים בשתי שפות שונות לחלוטין. לבקשת הקהל, הנה הוא:
רק לי נשמע שמדגם של 3 חולים אף פעם לא יספיק? גם אם סטיית התקן של 3 חולים היא 0, בלתי אפשרי להסיק בעזרתה על החולה הרביעי.
אין לי בעיה עם מחקרים שמשתמשים ב-3 חולים, אבל לפחות שלא יציגו שום נתון סטטיסטי (אפילו לא ממוצע). שיתנו לקורא להסיק בעצמו את המסקנות.
טוב, מה שקובע זה לא השונות של נתוני שלושת החולים, אלא השונות באוכלוסיה, וקצת קשה לאמוד אותה בדרך כלל על פי מדגם קטן.
כמובן, יש דוגמאות למשתנים שבהם השונות באוכלוסיה היא 0 או קרובה ל-0, ואז מדגם קטן יספיק, אבל הן די טריוויאליות.
לדילברט היה את רטברט, עכבר הניסוי, הם היו עושים ניסוי אחד והולכים למחלקת הסטטיסטיקה. במחלקת הסטטיסטיקה ביו משתמשים בשעות האקסטרפולציה ומרחיבים את המדגם מניסוי אחד לאלף ניסויים. אחת השאלות שהיו שואלים היא ״מה אתה רוצה שהתוצאה תהייה״