הנה צילום מסך של ידיעה מרגיזה שפורסמה אתמול בגלובס:
הידיעה מרגיזה ממספר סיבות.
קודם כל, הניתוח הכלכלי בידיעה הוא בסך הכל נכון, ומראה כי יש ירידה לאורך זמן ביחס בין השכר החציוני לשכר הממוצע במשק, מה שמעיד (מייד אסביר מדוע) על הגידול באי השוויון ובפערים החברתיים. ואותי זה מרגיז.
שנית, מצויין כי הלשכה המרכזית לסטטיסטיקה אינה מפרסמת את השכר החציוני במשק מדי חודש, ולצערי גם זה נכון. בכתבה צויין כי “מהלמ”ס נמסר כי אין הם מחשבים נתון זה”, וסביר להניח כי זה נכון. זה גם מרגיז, כי ראוי שנתון השכר החציוני ייאמד ויפורסם מדי חודש, ובלשכה המרכזית לסטטיסטיקה יש הרבה סטטיסטיקאים מוכשרים שיודעים כיצד לבצע את המשימה הזו. למיטב ידיעתי, ההחלטה לא לפרסם את השכר החציוני מדי חודש נובעת ממדיניות, וזה כבר מאוד מרגיז. השכר החציוני מפורסם רק פעם בשנה, ומוחבא היטב בתוך השנתון הסטטיסטי.
שלישית, הגרפים בכתבה מטעים ומראים את הירידה ביחס חציון/ממוצע כיותר חדה מכפי שהיא באמת, וגם ההשוואה של היחס הזה בין ישראל למדינות אחרות מוטה. זה נעשה על ידי הטריק הידוע של קיצוץ ציר ה-Y, וכבר כתבתי על כך בעבר (למשל ברשימה על מחקר האוצר על השפעת שכר המינימום על התעסוקה במשק).
אבל הפרט המרגיז ביותר הוא הפרשנות שניתנת בכתבה לשכר החציוני. בכתבה נאמר כי “החציון הוא מדד למיקום המרכז של קבוצת נתונים מספריים או מדגם, אך הוא טוב בהרבה לעומת הממוצע, שהרבה יותר רגיש לערכי קצה” וזה נכון. אבל נאמר גם כי “השכר של רוב השכירים הישראלים במשק (המכונה בספרות כ’שכר החציוני’) עומד על כ-6,655 שקל”, וזה ממש לא נכון. ומאוד מרגיז.
מדוע היחס בין השכר החציוני לשכר הממוצע מהווה מדד לאי שוויון? בואו ניזכר מה זה חציון. כאשר יש סדרת מספרים, כמו נתוני שכר של כ-2.5 מיליון שכירים בישראל, אפשר לסדר את הנתונים האלה בסדר עולה, מהקטן לגדול. המספר שנמצא באמצע הסדרה, בסביבת המקום המיליון ורבע, מחלק את נתוני השכר לשתי קבוצות שוות. בקבוצה אחת כל הנתונים גדולים ממנו או שווים לו, ובשניה כל הנתונים קטנים ממנו או שווים לו. המספר שבאמצע הוא החציון. אמנם זהו הסבר לא מדוייק, אבל לדעתי מבהיר את הנקודה העיקרית. המעוניינים יכולים לקרוא הסבר מפורט יותר בויקיפדיה.
האם רוב הנתונים בסדרה שווים לחציון? בדרך כלל לא. בואו ניקח דוגמא פשוטה, סדרה של 3 מספרים בלבד: 1,2,3. החציון הוא 2, אבל רוב הנתונים אינם שווים ל-2.
שימו לב כי גם הממוצע של שלושה מספרים אלה הוא 2, וזאת בגלל הסדרה סימטרית סביב 2. זה תמיד נכון: אם סדרת נתונים היא סימטרית, אז הממוצע של הסדרה שווה לחציון. גם ההיפך נכון: אם הממוצע שווה לחציון, אז הסדרה סימטרית סביבם (את זה קצת יותר קשה להוכיח). לכן, ההפרש או היחס בין החציון והממוצע מהווים מדד למידת הסימטריה של הנתונים. למשל, אם נשנה את הנתונים ונחליף את 3 בערך גדול יותר, נניח 6? החציון יישאר 2 אבל הממוצע יגדל מ-2 ל-3. באופן כללי, כאשר הממוצע גדול מהחציון, אז הסדרה אסימטרית עם יותר ערכים גבוהים, וכאשר הממוצע קטן מהחציון, אז הסדרה אסימטרית עם יותר ערכים נמוכים.
כשמדובר בנתוני שכר, יש עוד פרט שצריך לקחת בחשבון. שכר יכול להיות מאוד גבוה, אבל אינו יכול להיות נמוך יותר מדי. באופן חוקי השכר חייב להיות גבוה משכר המינימום, ובכל מקרה אינו יכול להיות נמוך מ-0. לכן, כשמדובר בנתוני שכר, האסימטריה יכולה להתבטא רק בקיומם של בעלי שכר גבוה במיוחד, והמשמעות הכלכלית של כך היא אי שוויון בחלוקת ההכנסות. (דנתי בנושא זה בעבר ברשימה על המנהל והפועלים).
ועכשיו ננסה לענות לשאלה מהו השכר של רוב השכירים בישראל. המונח הסטטיסטי למדד כזה הוא השכיח (mode) – הערך הנפוץ ביותר בסדרת הנתונים. למשל, בסדרה 1,2,2,2,3 השכיח הוא 2, כיוון ש-2 מופיע בסדרה 3 פעמים, יותר מכל נתון אחר בסדרה. האם בסדרה של כ-2.5 מיליון נתוני משכורת של שכירים בישראל המספר 6655 הוא הנפוץ ביותר? איך אפשר לברר זאת?
כאמור, הלמ”ס מספקת כל חודש רק נתונים חלקיים, אך אחת לשנה מתפרסם בשנתון הסטטיסטי לוח התפלגות שכר לפי עשירונים (קישור לקובץ pdf באתר הלמ”ס). השנה האחרונה עבורה התפרסמו נתונים אלה היא 2010. לכן נמשיך את הדיון תוך כדי שימוש בנתונים אלה. הנה הנתונים הרלוונטיים לדיון שלנו:
גבול עליון (₪) |
סך הכל שכירים (אלפים) |
עשירון |
2069 |
252.2 |
1 |
3501 |
252.3 |
2 |
4316 |
252.1 |
3 |
5049 |
252.2 |
4 |
5984 |
252.2 |
5 |
7051 |
252.2 |
6 |
8587 |
252.4 |
7 |
11229 |
252.0 |
8 |
16290 |
252.2 |
9 |
– |
252.2 |
10 |
אנו רואים כי בכל עשירון יש כרבע מליון שכירים. הגבול העליון הוא השכר הגבוה ביותר בעשירון. כך למשל, בעשירון הראשון הגבול העליון הוא 2069 ₪. פירוש הדבר הוא כי 252.2 אלפי השכירים שבעשירון זה השתכרו לא יותר מ-2069 ₪ לחודש בשנת 2010.
הגבול העליון של העשירון ה-5 הוא השכר החציוני החודשי, 5984 ₪ בשנת 2010. 50% מהשכירים השתכרו 5984 ₪ לחודש או פחות מכך בשנת 2010 (אלה הנמצאים בעשירונים 1 עד 5) ו- 50% מהשכירים השתכרו יותר מ-5984 ₪ לחודש בשנת 2010 (אלה הנמצאים בעשירונים 6 עד 10). סביר מאוד כי מספר השכירים שהרוויחו בדיוק 5984 ₪ לחודש הוא נמוך למדי, וסביר שזה לא השכיח.
האמת היא שלשכיח עצמו אין כאן הרבה משמעות. מה כבר ההבדל בין 5986 ₪ ל-5986 או אפילו 6000? מעניין יותר לדעת מהי הקטגוריה השכיחה, אם נחלק את טווח השכר בקטגוריות ברוחב 1000 ₪, למשל. לשם כך עלינו למלא את הטבלה הבאה:
סך הכל שכירים (אלפים) |
קטגוריית שכר |
??? |
0-999.99 |
??? |
1000-1999.99 |
??? |
2000-2999.99 |
??? |
3000-3999.99 |
??? |
… |
??? |
… |
??? |
… |
איך נעשה זאת?
לשם כך נצטרך להניח הנחה גסה, לפיה הפיזור של השכר בכל עשירון הוא אחיד. כך למשל, בעשירון הראשון, שתחומו 0 עד 2069, נניח כי מספר השכירים ששכרם בין 0 ל-1000 ₪ (תסלחו לי על האגורה) שווה למספר השכירים ששכרם בין 1000 ל-2000 ₪, ואילו מספר השכירים ששכרם בין 2000 ל-2069 ₪ שווה ל-6.9% ממספר השכירים בקטגוריית השכר 1000-2000 ₪. וכעת, תוך כדי שימוש בתרגילי ערך משולש נוכל להסיק כי מספר השכירים בקטגוריות 0-1000 ₪ ו-1000-2000 ₪ הוא 121.9 אלף, וכי 8.4 אלפי שכירים היו בעלי שכר חודשי בין 2000 ל-2069 ₪. בעזרת חישובים דומים (קישור לקובץ אקסל עם החישובים) נוכל לאמוד את מספר השכירים ששכרם החודשי היה בין 2069 ל-3000 ₪ ב-164.0 אלפים, ולכן מספר השכירים בקטגוריית השכר 2000-3000 ₪ נאמד בסך הכל ב-172.4 אלפים. כך נוכל להמשיך את החישוב, ובסופו של דבר נקבל את התפלגות השכר הבאה:
ומכאן נוכל לראות כי קטגוריית השכר השכיחה היא זו שבין 4000 ל-5000 ₪; זה היה שכרם החודשי של 333.3 אלפי שכירים, המהווים 13.2% מסך כל השכירים במשק. שכר הקרוב לשכר החציוני, נניח בטווח 5500 עד 6500 ₪ קיבלו בערך 254.6 אלף שכירים, כ-10.1% מהשכירים במשק. השכר הממוצע במשק ב-2010 היה 8100 ₪. שכר קרוב לשכר הממוצע, בין 7500 ל-8500 ₪, קיבלו כ-202.2 אלף שכירים, שהם כ-8% מהשכירים במשק.
ואם ננסה להקיש מנתוני 2010 לנתוני 2012, ובהנחה שההתפלגות נשארה דומה ביסודה, נוכל לשער כי קטגוריית השכר השכיחה במשק ב-2012 נמצאת גם היא ככל הנראה כ-1000 ₪ מתחת לחציון, ורוב השכירים במשק משתכרים בתחום 4500-5500 ₪. עצוב.
מה שבאמת מרתיח הוא שלא צריך סטטיסטיקאי מוכשר כדי לחשב את הנתונים.
הלמ”ס עושה סקר הכנסות חודשי; כדי לפרסם את החציון הם צריכים רק להריץ את הפונקציה המתאימה ב-SPSS (בהנחה שיש שם ניפוחים ואשכולות וכו’, זה כנראה טיפה יותר מסובך, אבל לא הרבה יותר)
נדב, אני משתדל להיות מנומס ולשמור על אנדרסטטיטמנט.
היי יוסי,
פוסט מעולה באופן כללי, אך ספציפית יש לי אליו רק השגה אחת (מלבד שגיאות כתיב שמתפלקות לכולנו פה ושם):
אי חישוב החציון על ידי הלמ”ס הוא לא באשמתם (למרות שכולם אוהבים להאשים אותם), אלא באשמת משרדים ממשלתיים אחרים שלא מעבירים להם את הנתונים.
נתון השכר הממוצע מבוסס על עיבוד חודשי שעורכת הלשכה המרכזית לסטטיסטיקה (למ”ס) לנתונים שמגיעים מדיווחי החברות למוסד לביטוח לאומי. בהסתמך על הדיווחים הללו, מחשבים בלמ”ס את מספר משרות השכיר באותו חודש ואת השכר הכולל ברוטו ששולם. לבסוף מחלקים את השכר הכולל ברוטו למספר המשרות ומגיעים לנתון השכר הממוצע.
כדי לדעת מה הסכום הפרטני ששולם לכל שכיר, יש להמתין עוד חודשים רבים עד שיגיע קובץ של מס הכנסה, שבו קיים פירוט מדויק של השכר השנתי שקיבל כל שכיר בישראל. הקובץ מגיע למוסד לביטוח לאומי בתחילת כל שנה, כאשר הוא מתייחס לנתונים של השנה שלפניה.
מקור:
http://www.ynet.co.il/articles/0,7340,L-4136886,00.html
טל, יש עוד דרכים לאמוד את החציון. באמת. אם רוצים אפשר.
תודה על הפוסט המעניין.
תיקון קל לגבי המינוח. העובדה שהשכיח הוא 4500-5500 אינה אומרת ש”רוב השכירים במשק משתכרים 4500-5500 ₪”. מדובר עדיין במיעוט של בערך 13.2%. למיטב ידיעתי רוב מתייחס רק לשכיחות של מעל 50%.
עוז, מבחינה סמנטית אני מסכים שאתה צודק.
רוב השכירים, אם כך, מרוויחים בין 2069 ל-7051 ש”ח. זה הטווח הכי מצומצם שעדיין כולל 50% מהשכירים.
מה שבאמת מרתיח* זה ההשואה של לולבים לקלמנטינות. בנתוני השכר כל המשכורות זהות למרות שצריך להיות די ברור ששכר של סטודנט שעובד 10 שעות בשבוע יהיה נמוך מהמינימום (למרות שטענת שאין נמוך ממינימום) ויוריד את ממוצע וחציון השכר ולכן אינו בר השואה לצרכי חישובי פערי שכר. שלא לדבר על זה שיש הבדל בין שכר והכנסה וכמובן שיש אנשים כמו עובדי חברת החשמל וקיבוצניקים שיש להם הכנסות בשווה כסף שהערך שלהן לא מדווח כלל (ואיפה ההכנסה מביטוח לאומי?, ואיפה חישובי השכר נטו? רב האנשים לא יכולים לקנות לחם בכסף שהלך למס הכנסה).
לפחות בשביל השואת שכר גולמי צריך להעיף מהנתונים את כל מי שעובד פחות מ80% משרה, אלא אם הטענה הסוציאליסטית הנוכחית היא שאסור לאנשים להסתפק מראש בפחות מסיבותיהם הם. הדרך הפשוטה היא להתעלם מכל אלו שמרויחים פחות ממינימום – ורק על אלו שמרויחים יותר לבצע חישובי ממוצע חציון ושכיח.
*לא באמת מרתיח, אבל הרגשתי צורך להגיד את זה 🙂
זה נכון רק אם אתה מתעלם מסקרי תעסוקה שמראים שלא מעט שכירים במשרה חלקית היו מעדיפים לעבוד במשרה מלאה (בעיקר נשים אבל לא רק). כמו כן, איך צריך להתייחס למי שמקושש 4-5 משרות חלקיות (כמוני) ועדיין לא מגיע לשכר ראוי?
“גם ההיפך נכון: אם הממוצע שווה לחציון, אז הסדרה סימטרית סביבם (את זה קצת יותר קשה להוכיח).”
אכן קשה יותר להוכיח, בעיקר משום שזה פשוט לא נכון. למשל הסדרה:
1, 4, 5, 7, 8.
המממ,
מוזר, אבל אני זוכר במעומעם איזה טענה כזו מתקופת הלימודים…. ככל הנראה יש עוד איזה תנאי (זאת אומרת:אם הממוצע שווה לחציון וגם XXX).
תודה על ההערה. מחקתי את המשפט הזה לעת עתה מהטקסט, ואם אמצא את הטענה הנכונה אוסיף אותה.
אני לא בטוח איזו טענה בדיוק נכונה – רק שים לב שבמקרה שבו החציון הוא אקסטרפולציה, יש הרבה שיטות שונות להחליט כיצד לחשבו…
תודה על הניתוח יוסי. אך נדמה לי שאם היו משנים את הכותרת ל”הרוב מרוויחים 6,655 ש’ או פחות” או “הרוב מרוויחים פחות מ-6,655 ש'” לא היית מתרעם.
מהיכרותי עם עורכי עיתונים וכותרות, כל תו נחשב (ולראייה, ש’ במקום ש”ח) ולכן יתכן והכותרת אינה מדוייקת, אבל היא לא מטעה אם הקורא לוקח בחשבון את אילוצי העריכה.
לגבי הועבדה שהשכיח גם כן לא מציג את המשכורת של רוב העובדים אלא לכל היותר מספר קרוב לשכר של קבוצה גדולה של כ-13.2% כתב עוז מעלי. שימוש בכותרת זהה עם הנתון שחישבת גם כן לא תהיה מדוייקת.
אלעד
הבעיה לא הייתה רק בכותרת אלא גם בטקסט. והאמת, בהתחלה לא חשבתי כלל להתייחס לעניין, אבל ביקשו ממני כל כך יפה לכתוב פוסט על זה, אז כתבתי 🙂
גם הטענה של עוז נכונה מבחינה פורמלית. בצורה מדוייקת יש לכתוב כי קטגוריית השכר השכיחה היא 4000-5000 ש”ח. אני אכן צריך לתקן את המשפט האחרון בפוסט, וכך אעשה.
תודה לך ולעוז.
אפשר היה גם לכתוב “הרוב מרוויחים 6,655 ש”ח או יותר” וזה גם היה נכון.
ולעצם העניין: לדעתי הצגת השכיח כמספר מייצג אינה נכונה, ודווקא הצגת החציון היא הרבה יותר נכונה. אם נמצא ש-0.1% מהאוכלוסיה מרוויחה בדיוק 13,024 שקל, כי זה שכרו של עובד מסוג X, אבל כל שאר האוכלוסיה מרוויחה מספר בין 0 ל-10,000 שקל בהתפלגות אחידה, אז 13,024 יהיה השכר השכיח, אבל בהחלט לא מייצג.
אני מניח שהשכיח הוא בדיוק שכר מינימום, פשוט כי זה מאד גמיש אם לתת לעובד 5,000 או 5,001 ש”ח, אבל משכר מינימום אסור לרדת לפי החוק אפילו בשקל.
רוב המגיבים מתייחסים למשמעויות הסטטיסטיות, ומתווכחים עם כותב המאמר המופלא לכשעצמו, אם זה נכון או לא נכון, ומפספסים את העיקר. מבחינה חברתית ההתפלגות מוכיחה שאנו מדינה דפוקה, והולכים לקראת שבר שאת סופו מי ישורנו.
שלום לכולם,
צריך לחתוך לפי גיל יתכן שישראל שהיא מדינה צעירה האוכלוסיה הצעירה מקפיצה את העמודה של 3-4 ו 4-5 .
קיצבת זיקנה אינה מספת למחיה ובמיוחד לכאלה שאין להם הכנסה נוספת ולצורכי תרופות קבועות.
יש להעלות את סכום הקיצבה בדחיפות כדי שאפשר יהיה להמשיך לחיות.
מצויין
תודה שהארת את עינינו
“כאשר הממוצע גדול מהחציון, אז הסדרה אסימטרית עם יותר ערכים גבוהים, וכאשר הממוצע קטן מהחציון, אז הסדרה אסימטרית עם יותר ערכים נמוכים.” –
ממש לא נכון. כאשר הממוצע גדול מהחציון הסדרה לא חייבת להכיל יותר ערכים גבוהים. לדוגמה – סדרה שמכילה איבר אחד שערכו מיליון ומיליון איברים שערכם 0. כמו שאמרת, לא נכון ומרגיז 🙂
ההתפלפלות על איך מחשבים חציון מחמיצה את העיקר ומרוב עצים לא רואים את היער. ברור שמדיניות הממשלה תחת הכותרת “יצירת מקומות עבודה” פשוט פיצלה את המקומות שהיו לחלקי משרה בשם משרה (ובנוסף יש קבלן מאנ”ש הגוזר קופון) ואז גם הממוצע וגם החציון יורדים. ומאחר במדיניות לנסות להעלות אותם ע”י איפשור למקורבי סגולה לגנוב סכומים לא הגיונים בשם שכר ולעוות בכך את התוצאות. הרי שהחישוב היחיד החשוב הוא האם שכרם של 99% מהשכירים הנמוכים עולה או יורד ??
תודה רבה על המאמר המעניין והמעשיר.
ברור שחלק מהסקרנות של כל אחד בנושא הזה היא לגלות איפה הוא ממוקם ביחס לאחרים, ובהקשר הזה הנתונים לדעתי חסרים. למה? כי כשאנחנו מדברים על פערים כלכליים בין משפחות צריך להכניס למשוואה את משכורות שני בני הזוג, ופה אני מניח שיש התאמה גבוהה בין שכר הבעל לשכר האישה, כלומר כשאחד מבני הזוג מרוויח מעט – סיכוי טוב שגם השני ירוויח מעט. עובדה זו מגדילה את הפערים בהכנסה המשפחתית מעבר למה שהנתונים שהוצגו כאן מראים.
האם למישהו יש נתונים שיכולים לשפוך אור ניתוח לפי הכנסה משפחתית?
תאר לעצמך שממשלה רדיקלית בישראל היתה הופכת בצו את השכר הממוצע במשק לשכר המינימום, ומעבירה בכנסת חוק שעל פיו חברי הכנסת ירויחו את השכר הממוצע במשק (כשכר מינימום), ושבכל מוסד ממשלתי או פרטי, גובה השכר הגבוה ביותר לא יעלה על פי 10 מגובה שכר המינימום, בצמוד לביטול כל המיסים העקיפים, למעט שני מיסים בלבד: מס הכנסה אישי פרוגרסיבי, ומס חברות.
.
עכשיו תוכל לנסות לגלגל מה יקרה בארץ אם נעמוד כולנו בפני התיאור הזה כעובדה מוגמרת:
.
א’. יהיה גל פיטורים מיידי שייאלץ הרבה חברות להתייעל בהתאם, אבל בהמשך ייתחילו להסתגל לתהליך המוני של דיפרנציאציה איטת ברמות השכר, מתוך נקודת-איפוס משותפת.
.
ב’. יהיה צורך המוני להחליף דיסקט בראש למציאות שבה כולם מרויחים שכר דומה
.
ג’ לא עוד אינסוף מיסים סמוייים ומיסים עקיפים – כל ההכנסות הממשלתיות ייתנקזו לשני מיסים גלויים ושקופים, פרטי ומסחרי.
זלדה, זה סוג של בדיחה, התגובה הזו?
עצוב שמאמר חשוב כזה לא נמצא בעמוד הראשי של כל האתרים בארץ.
זה מאמר מאוד חשוב שמראה את האמת על השכר בארץ ולא רק את המדד השיקרי שמושפע מערכי קצה שנקרא ממוצע.
חייבים להציג את החציון ואת השכיח בכל חודש.
תודה, איש. התפרסמה ידיעה בכלכליסט:
http://www.calcalist.co.il/local/articles/0,7340,L-3587685,00.html
זה גם משהו.
“באופן כללי, כאשר הממוצע גדול מהחציון, אז הסדרה אסימטרית עם יותר ערכים גבוהים, וכאשר הממוצע קטן מהחציון, אז הסדרה אסימטרית עם יותר ערכים נמוכים.” האמנם?
למשל: מליון, 1, 2, 3, 4.
חציון – 3.
ממוצע – קצת יותר מ-200 אלף.
כמה ערכים גבוהים? (מהממוצע, אני מניח) – אחד (מליון).
היי יוסי,
יופי של מאמר.
מה דעתך לפרסם חישוב מעודכן של השכיח, על נתוני 2016 או 2017?
זו לא בעיה לחשב את זה. הסברתי איך החישוב נעשה, ועכשיו כל אחד יכול לעשות את זה עם אקסל.