הקדמה
בעקבות דיון שהתפתח בתגובות לאחת הרשימות האחרונות שלי (וכן מספר חיפושים בגוגל על הנושא שהגיעו אל הבלוג) החלטתי להקדיש רשימה לנושא של סולמות המדידה.
עלי לציין כי במסגרת לימודיי הפורמליים מעולם לא למדתי את הנושא, ואיכשהו מניחים כי הוא ברור מאליו. אבל כשלימדתי קורסים במבוא לסטטיסטיקה מחוץ למסגרת האוניברסיטה העברית (במכללה למנהל ובאוניברסיטה הפתוחה) היה עלי ללמד את הנושא (כמובן, אחרי שלמדתי אותו היטב בכוחות עצמי), והתברר לי כי הוא גורם לקשיים אצל הסטודנטים. בחוברות המבוא לסטטיסטיקה של האוניברסיטה הפתוחה קיים טקסט ממצה של הנושא, ולכאורה, קריאה בו אמורה להקנות לקורא את כל הידע הבסיסי בנושא. אמנם האינטואיציה של הנושא ברורה לכל מי שיש לו אינטואיציה לסטטיסטיקה, כך שלי הנושא נראה טריוויאלי, אבל לא כך הדברים נראים מזוית המבט של סטודנט למדעי החברה/כלכלה/מנהל עסקים שצריך ללמוד קורס חובה בסטטיסטיקה בסיסית. כמו כן, למרות שמדובר בנושא בסיסי ופשוט יחסית, הוא דורש בכל זאת מעט חשיבה לא שגרתית, התגברות על הנטייה לייחס למושגים מתמטיים את משמעותם היומיומית, ומעל לכל, הבנה טובה של הנושא היא בסיס הכרחי להבנה של הכלים הסטטיסטיים אליהם נחשפים בהמשך.
הרשימה הזו כוללת את עיקרי הדברים המופיעים בכל טקסט בסיסי, עם מספר דוגמאות והבהרות שנהגתי לתת כהסברתי את הנושא לסטודנטים.
מהי מדידה?
כל אחד יכול לחשוב על דוגמא כלשהי למדידה. אפשר לקחת סרט מדידה ולמדוד את רוחב החלון בסנטימטרים. אנחנו לעמוד על מאזניים ביתיים ולמדוד את משקל גופנו (פעולה שאני נמנע מלבצע בדרך כלל). שוטרים משתמשים במערכות אלקטרוניות כדי למדוד את מהירות נסיעתה של מכונית. כל אלה דוגמאות נפוצות מחיי היום יום.
סטטיסטיקאי יכול לחשוב על דוגמאות נוספות שלא יעלו בדעתו של אדם רגיל, שלא נתקל בנושא סולמות המדידה באיזה קורס או טקסט. הסיבה? הגדרת המושג “מדידה”. “מדידה” בלשון הסטטיסטיקה היא התאמה של ערך מספרי לתכונה. ההתאמה יכולה להיות מבוססת על מערכת פיזיקלית כלשהי, או אולי מערכת קוגניטיבית, או שרירותית לחלוטין.
לדוגמא, אם אני רוצה לשמור במחשב נתונים של מינם של המשתתפים בניסוי קליני, אני יכול להצמיד לגברים את הערך המספרי “0” ולנשים את הערך המספרי “1”. “מדדתי” את מינו של כל משתתף בניסוי, על ידי כל שהתאמתי ערך מספרי (בדוגמא הזו 0 או 1) לתכונה (בדוגמא הזו: מין המשתתף בניסוי).
מנסיוני, זהו המוקש הראשון עליו עולים רוב סטודנטים. וזו בעיה ידועה, לא רק בסטטיסטיקה אלא בכל לימודי המדעים המדויקים. צריך לעשות הפרדה בין המושג האינטואיטיבי של “מדידה”, שתואר בפסקה הראשונה בסעיף זה, ובין המושג הסטטיסטי של מדידה, כפי שהוגדר בפסקה השניה.
לסיכום הסעיף הזה: בכל פעם שאתם משתמשים במספר כדי לתאר משהו – ביצעתם מדידה.
מהם סולמות מדידה?
אם מדידה היא התאמה של ערך מספרי לתכונה, אז מערכת מספרית ספציפית לפיה מתאימים מספר לתכונה נקראת “סולם מדידה”.
בדוגמא שנתתי בסעיף הקודם השתמשתי בסולם המדידה: גבר=0, אשה=1. לא הייתי חייב לבחור דווקא בסולם הזה. יש עוד סולמות אפשריים למדידת התכונה של מין המשתתף בניסוי, למשל: גבר=2, אשה=1. או: גבר=17, אשה=23, וכולי וכולי. חדי העין שבין הקוראים ישימו לב בודאי שיש תכונה משותפת לשלוש הדוגמאות שנתתי לסולם המדידה למין המשתתף בניסוי.
אנחנו יכולים לנסות לבדוק את כל ההתאמות האפשריות ולנסות לסווג אותן על פי תכונותיהן. מייד אציג דרך אפשרית לסווג את כל סולמות המדידה (כלומר את כל ההתאמות האפשריות של מערכות מספריות לתכונות) לארבע קבוצות עיקריות המכונות: סולם שמי, סולם סודר, סולם רווח וסולם מנה. מתברר כי החלוקה הגסה הזו מספיקה לרוב צרכי הסטטיסטיקה.
סולם המדידה השמי
סולם המדידה השמי הוא סולם בו הערך המספרי משמש לזיהוי בלבד של התכונה נמדדת, ואין כל משמעות נוספת לערך המספרי מעבר לכך. סולמות המדידה שהצגתי למין המשתתפים בניסוי הוא דוגמא לכך (חשבו מדוע לפני שתמשיכו לקרוא, ואח”כ חישבו איזה הסתייגות אפשר להוסיף לדברים האלה).
הנה עוד מספר דוגמאות:
- מספרים של קווי אוטובוסים
- מספרי תעודת זהות
- מספרים אישיים בצה”ל
- מספרי החולצות של שחקנים בקבוצת ספורט
- סוג הקפה הנמס (המבוטא על יד בר-קוד) שקנה לקוח בסופרמרקט
בכל המקרים האלה (כמעט) אין משמעות למספרים מעבר למתן האפשרות לזיהוי. אם בקבוצת כדורסל מסוימת מיקי לובש את הגופיה מספר 9 ומוטי את הגופיה מספר 7, זה לא אומר בהכרח כי מיקי שחקן טוב יותר ממוטי (אולי כן, אבל זה לא נובע ממספר החולצה). אם אפשר לנסוע מבת-ים לתל-אביב במספר קווי אוטובוס, כולל 10, 18, 25 ו-26, זה לא אומר שנסיעה בקו 25 עדיפה על נסיעה בקו 18 (אלא אם אתה רוצה להגיע לרמת אביב). נסיעה בקו 44 בודאי שאינה עדיפה כפליים על נסיעה בקו 22, והאמירה לפיה קו האוטובוס הממוצע הנוסע בבת-ים הוא 53.12 (סתם המצאתי) חסרת כל משמעות. אין משמעות לטענה המתייחסת לטיב החבטות של שחקני בייסבול שמספר החולצה שלהם קטן מ-17.
עם זאת, קיים מקרה מיוחד בו לממוצע של משתנה שמי יש משמעות. נסו לגלות מהו. התשובה תופיע בהמשך הרשימה.
המדדים הסטטיסטיים היחידים שיש להם משמעות בהקשר של מדידה שמית הם נתוני שכיחות ושכיחות יחסית. יש משמעות לטענות כמו “34% מהלקוחות קנו קפה נמס מסוג X”, או “סוג הקפה הנרכש ביותר הוא קפה נמס מסוג Y”. עם זאת, הניתוח הסטטיסטי של נתונים מסולם מדידה שמי, המכונים לעיתים “נתונים קטגוריים” אינו מוגבל רק ליצירת טבלאות שכיחות, וקיימות שיטות סטטיסטיות מתוחכמות לניתוח נתונים כאלה (עבודת הדוקטורט של כותב שורות אלה עסקה בניתוח נתונים קטגוריים).
קוראים ששירתו בצבא יאמרו בודאי כי הדוגמא של מספרים אישיים אולי אינה מתאימה: מי שהתגייס קודם, המספר האישי שלו קטן יותר, ואכן קיימת בצבא תרבות שלמה של “ותיקות” ששלוש הספרות הראשונות במספר האישי, המהוות אינדיקציה למחזור הגיוס, הן אחד הסממנים שלה. זה מביא אותנו אל הסולם הבא בתור.
סולם המדידה הסודר
סולם מדידה סודר הוא סולם בו הערכים המספריים מבטאים סדר טבעי של התכונה הנמדדת.
סולמות כאלה נפוצים מאוד גם במדעי החברה וגם ברפואה. כל מי שמילא שאלון או השתתף בסקר כלשהו בודאי ענה לשאלה בסגנון הבא: “בסולם של 1 עד 5, כאשר 1 מבטא חוסר הסכמה מוחלטת ו-5 מבטא הסכמה מלאה, עד כמה אתה מסכים עם המשפט הבא….”. מדדים קליניים רבים לחומרת מחלה מבוססים על סולם סדר. חומרת המחלה של טרשת נפוצה, למשל, נמדד על ידי סולם בן 21 שלבים, המכונה EDSS. סולם זה מתחיל ב-0 ועולה בקפיצות של 0.5 עד 10.
מה משותף לסולמות האלה? קודם כל, הם מזהים את כל אחד מהנמדדים כשייכים לקבוצה מסויימת. סולם ההסכמה 1-5 מזהה כל נסקר כשייך לאחת מחמש קבוצות: קבוצת הנסקרים שמבטאים חוסר הסכמה מוחלטת (1), קבוצת הנסקרים שמבאים חוסר הסכמה מסויים (2) וכך הלאה. גם סולם EDSS מחלק את כל חולי הטרשת הנפוצה ל-19 קבוצות על פי חומרת מחלתם. במלים אחרות, כל סולם מדידה סודר הוא גם סולם מדידה שמי. ההיפך לא נכון. מדוע? כי אנו יכולים לדעת שחולה עם ערך EDSS השווה ל- 4, למשל, הוא חולה שמצבו הקליני חמור יותר מחולה שערך ה-EDSS שלו הוא 3.
וכאן המקום להזהיר: למספרים שבסולם המדידה הסודר אין משמעות מעבר לסדר שהם מגדירים. את הסולם ההסכמה “1-5” אנו יכולים להפוך לסולם “0-4” או “12-16” או להצמיד לחוסר הסכמה מוחלטת את המספר 1, לאי הסכמה חלקית את 3.14, לאדישות את 17, להסכמה חלקית את 100 ולהסכמה מלאה את המספר מליון ואחת עשרה. על המערכות האלה שקולות, ושינוי מערכת המספור לא ישנה את האינפורמציה הטמונה בנתונים. מכאן שעדיין אין משמעות למשפטים כמו “דרגת ה-EDSS הממוצעת של החולים היא 4.1” או “רמת ההסכמה הממוצעת לטענה היא 2.7 עם סטיית תקן 0.3”. אם תחליפו את הסולם בסולם אחר השומר על הסדר המספרי בין התכונות, הנתונים המספריים ישתנו למרות שמהותית לא השתנה דבר.
לעומת זאת, יש בהחלט מדדים סטטיסטיים בעלי משמעות לתיאור משתנים סודרים. הידוע שבהם הוא החציון, ואליו מתלווים אחיו האחוזונים. יש משמעות לטענות כמו “70% מהמשיבים לסקר לא הביעו חוסר הסכמה (מוחלטת או חלקית) עם הטענה”, או “דרגת החומרה החציונית של החולים שהשתתפו בניסוי הייתה 3.5 בסולם EDSS”.
סולם הרווח
זהו הסולם הראשון בו יש משמעות כמותית לערכים המספריים הנמדדים, ולכן מותר לבצע עליהם פעולות אריתמטיות מסוימות. המגבלה שמוטלת על סולם הרווח היא שיש משמעות להפרשים (רווחים) שבין הערכים הנמדדים, אך לא ליחסים שבין הערכים. בסולם זה גם יש לראשונה התאמה בין המשמעות האינטואיטיבית של המילה “מדידה” ובין המשמעות הסטטיסטית שלה.
הדוגמא העיקרית המוכרת לי היא סולמות המדידה של הטמפרטורות. אם היום הטמפרטורה היא 20 מעלות צלזיוס, ומחר הטמפרטורה היא 25 מעלות צלזיוס, אז לגיטימי לומר כי הבדלי הטמפרטורות בין שני הימים הם חמש מעלות צלזיוס. כמי שגר בשיקגו כמה שנים טובות, אני יכול בהחלט להעיד כי ההבדל בין טמפרטורה של 25 מעלות צלזיוס וטמפרטורה של 10 מעלות צלזיוס זהה להבדל בין הטמפרטורות מינוס 10 מעלות ומינוס 25 מעלות, מבחינת ההרגשה.
אבל, אם היום הטמפרטורה הייתה 20 מעלות ולפני שבוע היא הייתה 10 מעלות, האם פירוש הדבר כי היום חם כפליים מאשר אתמול? לא ולא. אילו מדדנו את הטמפרטורות בסולם פרנהייט, כמו ידידינו שמעבר לאוקיינוס האטלנטי, היינו מודדים היום 68 מעלות פרנהייט, ולפני שבוע 50 מעלות פרנהייט, ו-68 אינו גדול כפליים מ-50. החום הוא אותו חום, אך הטמפרטורות שונות. אין משמעות ליחס שבין הטמפרטורות (מדוע – נראה מייד).
מבחינה מעשית, רוב המדדים הסטטיסטיים והשיטות הסטטיסטיות ניתנים ליישום על גבי נתונים שנמדדו בסולם הרווח. לממוצע טמפרטורת יש משמעות, גם לסטיית התקן שלהן. עם זאת, יש להיזהר באינטרפרטציה של התוצאות.
סולם המנה
בסולם המנה יש משמעות כמותית לערכים המספריים הנמדדים, כולל ליחסים ביניהם. זה אפשרי רק כאשר ערך האפס של הסולם הינו מוחלט. לכן אם משקלו של אדם אחד הוא 100 ק”ג ומשקלו של חברו רק 50 ק”ג, אפשר בהחלט לומר כי משקל האדם הראשון גדול כפליים ממשקל חברו. אתם יכולים לחשוב על המון דוגמאות למדדים כאלה: משקל, גובה, מרחק, מהירות, מחירים ועוד. כל המדדים הסטטיסטיים ניתנים לחישוב עבור נתונים שנמדדים בסולם מנה, וכל השיטות הסטטיסטיות ניתנות בעיקרון ליישום על נתונים אלה.
יוצא הדופן
ציינתי למעלה כי יש מקרה מיוחד בו לממוצע של משתנה שמי יש משמעות. מי שהייתה לו סבלנות להגיע עד כאן יגלה עכשיו את התשובה. כזכור, משתנה שמי הוא משתנה בו הערך המספרי משמש לזיהוי בלבד של התכונה נמדדת, ואין כל משמעות נוספת לערך המספרי מעבר לכך. כך למשל, אם המשתנה הוא מינו של הנבדק בניסוי הקליני, אז סימון של 0 לגבר ו-1 לאשה הוא פשוט קידוד שרירותי המתאים ערך מספרי למין הנבדק. ובכל זאת, נניח שעכשיו אנו מחשבים את הממוצע של המשתנה הזה. מה נקבל? נניח שבניסוי שלנו היו 500 משתתפים ומתוכם 300 נשים. כדי לחשב את הממוצע, נחבר 300 אחדים (אחד לכל אישה) ו-200 אפסים (עבור 200 גברים). את התוצאה, 300, נחלק ב-500. נקבל כי המין הממוצע הוא 0.6, וזו בדיוק פרופורציית הגברים באוכלוסיה.