אתמול הייתה תכנית הסיום של הסדרה.
חיים הכט טען לאורך כל שאפשר לשנות את המציאות בישראל, ואתמול בחר להביא כדוגמא את כביש חוצה ישראל. בין היתר טען כי הטענה שלו מוכחת על ידי “המדגם הגדול ביותר שנערך בארץ … מיליון ורבע נבדקים… במדגם כזה אין טעות סטטיסטית” (הציטוטים הם מזיכרוני וייתכן שאינם מדוייקים).
בהמשך הוא הסביר למה התכוון: המיליון ורבע הם מיליון ורבע נסיעות שבוצעו בכביש 6 מאז פתיחתו, 95% מהנוסעים בכביש שילמו את אגרת הנסיעה.
מה קורה כאן?
ראשית, הכט מתייחס לאוכלוסיה אחת, שהפרטים בה הם נסיעות, ומסיק ממנה לגבי אוכלוסיה אחרת – אוכלוסיית אזרחי ישראל.
ואם הוא מעוניין בנהגים שביצעו את הנסיעות הרי שמספר הנהגים קטן בוודאות ממספר הנסיעות בכביש. אז יש כאן מדגם עם חזרות. אבל זו בעיה שהסטטיסטיקה יודעת להתמודד עימה.
אבל הבעיה העיקרית היא שקבוצת הנהגים שהשתמשו בכביש חוצה ישראל אינה מהווה מדגם אקראי של קבוצת הנהגים הישראלים – שהרי רובם ככולם בחרו במודע לנסוע בכביש שהנסיעה בו כרוכה בתשלום. אני סבור שקבוצה זו אינה מייצגת את קבוצת הנהגים בישראל, ואם הכט חושב אחרת, עליו להסביר מדוע. הכט נופל במלכודת הגודל – בדגימה הגודל הוא לא הגורם היחידי שקובע. במדגם מוֱּטה, גודל מדגם גדול רק יעצים את הטעות המובנה בהטייה של המדגם.
השורה התחתונה – הטענה כי במדגם כזה אין טעות סטטיסטית היא בלתי נכונה ומטעה. נזק רב לא נגרם אמנם, שכן הכט לא טרח להסיק כל מסקנה סטטיסטית מהנתון שהציג – הוא בסך הכל הראה שמערכת אכיפה משוכללת ומשומנת, משולבת בעונשים דרקוניים אכן תביא לציות לחוק (או יותר נכון, ל-95% ציות), וסביר להניח שזה יעבוד גם אם השיטה תורחב לתחומים ואוכלוסיות אחרות. בשביל זה באמת לא צריך סטטיסטיקה.
פורסם לראשונה באתר “רשימות” בתאריך 9 באוגוסט 2004 00:00 במדור מה אומרת הסטטיסטיקה שם התקבלו 2 תגובות