אדם יצא לדרך של 240 ק”מ במכוניתו. את המחצית הראשונה של הדרך, 120 ק”מ, נסע במהירות של 40 קמ”ש. את המחצית השניה נסע במהירות 60 קמ”ש. מה הייתה מהירותו הממוצעת לאורך הדרך?
ברשימתי הקודמת הבאתי דברים שכתב סבר פלוצקר בעיתון “ידיעות אחרונות” לפני כשבוע. הוא הביא דוגמא בה הציג משרד האוצר ממוצע פשוט של נתונים מ-28 מדינות, ובכך קיבל נתון מטעה ושונה מהנתון המקביל של ארגון OECD, שהציג ממוצע משוקלל. הקוראים אייל ב.ד. ושחר הצביעו בתגובות לרשימה על מאמר באתר העוקץ, שבו הייתה תלונה הפוכה: אותו מאמר התלונן על כך שכשהאוצר משווה את נטל המס הוא משתמש בממוצע משוקלל.
אז מתי נכון להשתמש בממוצע משוקלל? האם רק כשנוח לך? או שאולי יש הגיון מאחורי הממוצע המשוקלל והשימוש בו?
בואו נחזור לנהג בדוגמא המלאכותית שפתחה את הפרק.
אם נחשב את מהירותו הממוצעת כממוצע פשוט, נקבל כי מהירות הממוצעת הייתה 50 קמ”ש לאורך הדרך. אבל אני משוכנע שכולכם תשתכנעו כי משהו לא בסדר בחישוב הזה. כדי לחשב את המהירות הממוצעת יש לחלק את הדרך הכוללת שעבר אותו אדם בסך הזמן הכולל שבו שהה בדרך. הדרך שהוא עבר שווה ל-240 ק”מ. את 120 הק”מ הראשונים עבר במהירות 40 קמ”ש, כלומר דרכו ארכה 3 שעות. את החלק השני עבר במהירות 60 קמ”ש, ולכן עבר את החלק הזה בשתי שעות. בסה”כ עבר האיש 240 ק”מ ב-5 שעות, ולכן מהירותו הממוצעת הייתה 48 קמ”ש (240 חלקי 5). החישוב שעשינו כעת הוא ממוצע משוקלל: שיקללנו את המהירויות בשני חלקי הדרך לפי משך הזמן בו שהה אותו אדם בכל אחד מחלקי הדרך.
מכאן אפשר לעשות אנלוגיה מהמהירות אל היחס החוב לתוצר.
המהירות הממוצעת אינה אלא היחס בין הדרך הכוללת לזמן הכולל. את המהירות הממוצעת על פני מספר קטעי דרך,יש לחשב על ידי חלוקת סך הדרך בסך הזמן, או, באופן שקול, על ידי חישוב ממוצע משוקלל של המהירויות, כשאר הזמנים מהווים את המשקלות.
באותו אופן, את היחס הממוצע בין החוב הציבורי לתוצר על פני מספר מדינות, יש לחשב על ידי חלוקת סך החוב הציבורי בסך התוצר, או, באופן שקול, על ידי חישוב ממוצע משוקלל של יחסי החוב-תוצר, כשאר התוצרים מהווים את המשקלות.
המסקנה ברורה: בחישוב היחס בין החוב הציבורי לתוצר ב-28 מדינות OECD, משרד האוצר של ישראל שגה (ואולי אף הטעה), סבר פלוצקר וארגון OECD צדקו.
נותר רק לברר מה קרה באתר העוקץ. האם תלונתם על שימוש האוצר בממוצע המשוקלל היא קנטרנית? צריך לבדוק. המאמר באתר העוקץ מצטט כתבה בעיתון הארץ שבה נאמר: ” “ממשרד האוצר נמסר כי נטל המס בישראל עדיין גבוה מהממוצע במדינות ה-OECD, שאליו עתידה ישראל להתקבל כחברה. נטל המס בישראל ב-2005 היה כ-37% מהתמ”ג, לעומת כ-32% מהתמ”ג במדינות ה-OECD. מצב זה נובע מנטל מס עקיף של 18%, הכולל מסי קנייה, לעומת כ-10% מהתוצר במדינות המערב”. הבעיה היא שהנתון שמפרסם האוצר סותר את נתון ה-OECD. לפי נתוני האוצר, נטל המס הממוצע בארגון OECD הוא 32% מהתמ”ג, בעוד שלפי ארגון OECD הנטל הממוצע הוא 36.3% (ראו טבלה מספר 1 בעמוד 14 של קובץ ה-pdf הזה (לינק מת) שנמצא באתר מכון ון-ליר, גם תרשים מספר 1 בעמוד 13 של המסמך, יראה לכם כי הטל המס בישראל דומה לזה של מדינות OECD מאז 1990). אנחנו יודעים ש-OECD משתמש בממוצע משוקלל על פי התוצר, ומהדיון שנערך עד כה, אנו יודעים כי זהו השקלול הנכון. כיוון שהחישוב של האוצר נתן תוצאה אחרת, הרי שהחישוב של האוצר שגוי. אם הוא משתמש בממוצע משוקלל, אז המשקלות אינם נכונים. הבעיה היא כמובן שאין אפשרות לדעת מה היו משקלות האוצר, שכן הנתון הזה נשאר חסוי (הוא לא פורסם בהודעה לעיתונות של האוצר). מה קורה כשמשתמשים במשקלות הלא נכונים? התמונה מתעוותת, כמובן. באתר העוקץ נרמז כאילו השקלול של האוצר היה לפי גודל האוכלוסיה (הייתה התייחסות אל ארה”ב ויפן כאל “מדינות גדולות”) אבל אני לא בטוח שזה אכן היה השקלול.
כדי להדגים מה קורה בשקלול לא נכון אחזור לדוגמא שבה פתחתי את הרשימה. נניח שהנהג שלנו נסע את 120 הק”מ הראשונים בתל-אביב שאוכלוסייתה היא כ-360,000 איש, ואת החלק השני של הדרך ברמת השרון שאוכלוסייתה היא כ-36,000 איש. שקלול לפי גודל האוכלוסיה הייה נותן לנו את התוצאה שמהירותו הממוצעת הייתה בערך 42 קמ”ש.
פורסם לראשונה באתר “רשימות” בתאריך 2 בדצמבר 2007 שם התקבלו 47 תגובות
אדם בתאריך 12/1/2007 8:54:39 PM
יוסי היקר
הרשומה מיושרת לצד שמאל של המסך, (או שמא זה המצב רק אצלי?) – האם תוכל לתקן אותה כך שניתן יהיה לקרוא בנוחות?
באותה הזדמנות – תודה על כל הרשימות הנפלאות, אני נהנה כל פעם.
אדם
הכלכלן המתוסכל [אתר] בתאריך 12/1/2007 9:08:57 PM
ללא נושא
מצטרף לאדם, זה לא רק אצלו. קשה מאד לקרוא ככה
דרור שניר בתאריך 12/1/2007 10:10:07 PM
ללא נושא
יש באמת בעיה עם היישור לימין בדף, אבל בינתיים אתם יכולים לטפל בבעיה בצד שלכם:
* עבור אינטרנט אקספלורר: לחיצה על כפתור ימני מעל הטקסט, בחירה בתת-תפריט Encoding [קידוד], ואז בחירה באפשרות Document right to left [מסמך מימין לשמאל]. זה הכל ועובד בכל מקום.
* פיירפוקס: לחיצה על כפתור ימני מעל הטקסט ובחירה באפשרות Switch page direction.
יוסי לוי [אתר] בתאריך 12/1/2007 11:24:34 PM
ללא נושא
לא ברור לי מה קרה. אנסה לתקן את זה בבוקר
יוסי לוי [אתר] בתאריך 12/2/2007 9:00:54 AM
העימוד תוקן
תודה לכל מי שהעיר את תשומת ליבי.
דוגמא נגדית בתאריך 12/2/2007 5:49:59 PM
יוסי,
כפי שכבר אמרתי לך במאמר שעסק בפרסומי האוצר – אתה טועה מבחינת השאלה שאותה צריך לשאול.
כעת אומר לך – אתה טועה גם מהבחינה המתודית;
אין ספק שבמקרה של בעיית התנועה יש להשתמש בממוצע משוקלל: יש שני מ”מ שהם פונקציה של משתנה שלישי (דרך, מהירות וזמן בהתאמה). יש כאן עוד קשר והוא שהדרך קשורה פונקציונלית למהירות ולזמן, ולכן התפלגות המנה של דרך חלקי מהירות משרה התפלגות על הזמן שביחס אליה יש לערוך את המיצוע.
במקרה של הדו”ח שהזכרת יש את המ”מ התמ”ג והמנה בינהם (וההתפלגות של השניים הקודמים משרה עליה התפלגות חדשה). הבעיה שצומחת היא שאיננו יכולים להציג את החוב והתמ”ג כפונקציות של היחס בין החוב לתמ”ג בלבד. השדה של המ”מ השלישי לא נקבע באופן יחיד ע”י שני המ”מ הראשונים, ולכן צריך כאן איזו התפלגות על השדות. באיזה התפלגות נבחר? אלוהים יודע!
אבל – אפשר לשקול שיקולים שונים. שיקול של אינפורמציה (יחד עם העובדה שאפשר לשכן את הבעיה במרחב מדגם סופי, שכולל את המדינות האמורות), ללא כל ידיעה מוקדמת על מתאם בין המ”מ, יניב התפלגות אחידה (כמובן שמידע על מתאמים בין המ”מ משנים הכל…).
יוסי לוי [אתר] בתאריך 12/3/2007 7:58:05 AM
לדוגמא נגדית
אני מצטער אבל גיבוב של מלים גבוהות (כגון מ”מ, שדות, התפלגות וכולי) לא מהווים טיעון.
הנושא שעמד לדיון פשוט מאוד – יש תצפיות על נתון, שהוא יחס בין שני נתונים אחרים. איך למצע אותם? מה קשורה כאן ההתפלגות? המתאם בין המשתנים לא משנה את הממוצע.
דוגמא נגדית בתאריך 12/3/2007 11:19:13 AM
מה קשור?
אז הנה:
אתה נתת דוגמא לשני משתנים מקריים מעל מרחב מדגם שהוא הזמן, שיש בינהם קשר (נגזרת). הקשר הזה קובע באופן יחיד את ההתפלגות שצריך לשים על הזמן כדי לחשב את המהירות הממוצעת (כאן לזמןיש התפלגות ולדרך יש התפלגות ויש צפיפות יחידה על המהירות – “נגזרת רדון ניקודים”, כך שהדרך הממוצעת שווה לממוצע של הצפיפות ביחס לזמן).
המקרה השני שונה לחלוטין! המשתנה בו תלויים המשתנים הוא המדינות ולא איזו מן “נגזרת” שקיימת בינהם. לפיכך אין התפלגות אחת ויחידה שנגזרת מהנתונים על מרחב המדגם. כל התפלגות שנבחר תהייה שרירותית, משום שהנ”ל לא תקף עוד.
לעניין המתאם: כדאי שתנסה לקרוא קודם! אני הצעתי לבחור בהתפלגות שנוצרת משיקולי אנטרופיה, והיא (אם המשתנים תוצר וחוב ב”ת) ההתפלגות האחידה שנותנת את הממוצע האריתמטי. אם המשתנים חוב ותוצר תלויים, ההתפלגות שתיוצר (על המדינות!!) משיקולי האנטרופיה תהייה שונה (כי אפשר “ללמוד” ממשתנה אחד משהו על היחס), ובפרט הממוצע יהיה שונה.
נ.ב. – מקווה שלא גיבבתי יותר מדי מילים גבוהות הפעם…
דוגמא נגדית בתאריך 12/3/2007 11:20:37 AM
תיקון-
בסוף הפסקה הראשונה זה צריך להיות “דרך” ולא “דרך ממוצעת”…
דוגמא נגדית בתאריך 12/3/2007 11:37:31 AM
טעיון נוסף ופשוט
שיבהיר מדוע הטענה של יוסי מופרכת:
איך צריך לחשב את התמ”ג הממוצע של המדינות?
ובכן: לפי הטיעון של יוסי, התמ”ג הוא היחס בין החוב ל”חוב:תמ”ג”. לפיכך צריך לחשב את הממוצע כממוצע משוקלל כשהמשקולות מגיעות מההתפלגות של “חוב:תמ”ג”.
באותו האופן התמ”ג הוא היחס בין שער המטבע לבין “שער מטבע:תמ”ג”, ולכן יש לחשב את הממוצע לפי המשקולות שמגיעות מההתפלגות של “שער מטבע:תמ”ג”.
אבל, המשקולות בשני המקרים יכולות להיות שונות. אז באילו נשתמש? כאן אני מתערב ואומר ששתיהן שרירותיות, ולכן צריך למצוא שיקול מנחה אחר (או, לחילופין – לעבוד מאוד קשה על מציאת קשרים פונקציונליים בין המשתנים השונים).
יוסי לוי [אתר] בתאריך 12/3/2007 4:48:26 PM
סיכום הדיון עם דוגמא נגדית
סיכום הדיון עם דוגמא נגדית (מבחינתי לפחות):
אני עדיין סבור שהטיעון שלך הוא גיבוב של מילים, אבל מצד שני, אם אתה טוען שהסטטיסטיקאים בארגון OECD טועים ואתה דווקא צודק, אני לא מתכוון להמשיך להתווכח איתך בנושא הזה.
למעוניינים, אני מצרף לינק למאמר המתייחס לתופעה בה צפינו בתגובות לרשימה זו, שפורסם באתר האייל הקורא לפני מספר שנים:
http://www.haayal.co.il/story_1571
ילד ירוק [אתר] בתאריך 12/7/2007 3:16:16 PM
יוסי, אני דווקא מסכים עם דוגמה נגדית
למרות הסרבול המילולי של ההסבר שלו אני לא חושב שמדובר בטרחן מתמטי. ניתן להבין (אני לפחות הבנתי) את הטיעון שלו ולדעתי הוא כן תקף.
אני אסביר זאת באמצעות דוגמה אחרת. נניח שיש 4 ערים ושני איזורים (בכל איזור יש שני ערים), לכל עיר יש נטל מס אחר, ושטח אחר.
הנה נתונים:
עיר א’:
שטח: 1000 מ”ר
נטל מס: 90%
עיר ב’:
שטח: 0 מ”ר (נניח לשם הפשטות החישובים).
נטל מס: 0%
איזור 2:
עיר ג’:
שטח: 500 מ”ר.
נטל מס: 50%.
עיר ד’:
שטח: 500 מ”ר.
נטל מס: 50%.
עכשיו נניח שאתה אדם, שיכול לבחור באיזה מן האיזורים לחיות (אתה לא יכול לבחור באיזה עיר). כעת נניח שני דרכים שבהם אתה מוגרל בערים אחרי שאתה בוחר את האיזור:
א. אתה בוחר את האיזור ואז אתה מוגר רנדומלית לאחת הערים בו. במקרה הזה, כדי לחשב את תוחלת נטל המס, היגיוני מאוד להשתמש בממוצע פשוט של הערים:
איזור א’: ממוצע נטל המס הוא 45%.
איזור ב’: ממוצע נטל המס הוא 50%.
ב. נניח תרחיש אחר, במקום להיות מוגרל רנדומלית לאחת מהערים באיזור, אתה תטוס מלמעלה במטוס ותצנח באחת מהערים (ושם תישאר). במקרה הזה, יהיה מאוד לא היגיוני להשתמש בממוצע פשוט כדי לשקלל את נטל המס, מכיוון שגורם ההחלטה שלך מושפע מאוד מהשטח של העיר. במקרה הזה אם נשתמש בממוצע משוקלל לפי שטח, הרי ש:
הממוצע של איזור א’ הוא: 90%.
והממוצע של איזור ב’ הוא: 50%.
ותעדיף בהרבה את איזור ב’.
הנקודה שדוגמה נגדית ניסה להעביר וגם אני סמכים איתו, שבדוגמה הראשונה יש לך קשר מתמטי אינהרנטי בין ההגדרה של מהירות ממוצעת לזמן (ולכן אתה חייב להתחשב בו). מצד שני בדוגמה עם יחס החוב\תמ”ג, ברגע שאתה משתמש בתמ”ג כמשקולת לשקלל לפיה, הרי שזה שרירותי בדיוק כמו להשתמש בכמות האוכלוסיה בכל מדינה, או בשטח של כל מדינה. קודם נדרש להוכיח שיש כאן קשר למטרה שעבורה מובא החישוב, או שזאת דרך נכונה יותר למשקל לפיו.
ולצערי אין הסבר בפוסט הזה למה לשקלל דווקא לפי התמ”ג.
אשמח להתייחסותך, ואני מקווה שלא תקטלג גם אותי כטרחן 😉
יוסי לוי [אתר] בתאריך 12/13/2007 9:47:44 AM
תגובה לילד ירוק
אני לא מבין את הדוגמא, אך מבין שלא הובנתי.
אנחנו דנים ביחס בין שני משתנים. היחס הזה חושב במספר יחידות נפרדות (מדינות, – לצורך העניין). עכשיו אנחנו מעוניינים לחשב את היחס הכולל בכל היחידות יחד. אפשרות אית היא לחבר את כל המונים, לחבר את כל המכנים, ולחלק סכום בסכום. אפשרות שניה היא לשקלל את היחסים על פי המכנים. שתי הדרכים שקולות מתמטית (קל להוכיח) ויתנו את אותה התוצאה. כל שקלול אחר ייתן תוצאה שגויה.
אם אנחנו צדברים על יחס חוב תוצר, צריך לחבר את כל החובות ולחלק בסך כל התוצרים, או לחשב את היחס בכל מדינה לחוד, ולקלל את היחסים לפי התוצרים. אלגברית, זה אותו דבר, וזה שונה מכל שקלול אחר של יחסי החוב.תוצר.
ילד ירוק [אתר] בתאריך 12/14/2007 7:16:12 PM
ללא נושא
דווקא הבנתי את כוונתך יוסי, אך אני עדיין חושש שלא הבנת את שלי. אני אתן דוגמה מקבילה יותר כדי להראות שיש הבדל ערכי בין שימוש בממוצע פשוט לממוצע משוקלל.
נניח שאנחנו מעוניינים לראות האם מדינות ביבשת מסויימת נוטות לתת עונש מוות לפושעים שהורשעו ברצח. (כלומר לחשב את היחס בין רוצחים שניתן להם בעונש מוות לבין כלל הרוצחים)
יש לנו את הנתונים הבאים:
במדינה אחת היו מיליון מקרים מתוך מיליון מקרים של עונש מוות לרוצחים.
ב100 מדינות אחרות (קטנות הרבה יותר) היו 0 מקרים של עונש מוות מתוך 10 פושעים שהואשמו מרצח (כלומר לכל מדינה זה 0\10).
עכשיו אם תחשב את זה בממוצע משוקלל (כמו שאתה מציע לגבי יחס חוב\תוצר), יתברר שביבשת הזאת הממוצע של עונש מוותר לרוצחים הוא 99%, ולכן המדינות בו מאוד לא “הומניות” (למרות שהממוצע המשוקלל במקרה הזה משקר).
בעצם כשאתה מבצע ממוצע משוקלל אתה גורם לכך שאתה נותן סוג של משקל לגודל היחס המחושב במדינה. אני ממש לא בטוח שזה הדבר הנכון לעשות, במיוחד במקרה בו אנחנו מדברים על הבחירה של כמה חובות לקחת שהיא החלטה שכל ממשלה עושה בנפרד.
אשמח להתייחסות נוספת.
יוסי לוי [אתר] בתאריך 12/16/2007 10:51:08 AM
טוב
אתה מדבר על הבעייתיות הכללית של הממוצע – העובדה שהוא מושפע מתצפיות חריגות – וזה נכון גם לממוצע פשוט וגם לממוצע משוקקל.
כתבתי על זאת בהרחבה ברשימה על המנהל והפועלים, כאן: http://www.sci-princess.info/archives/40
וגם כאן: http://www.sci-princess.info/archives/60
זה לא נוגד את הטענה שאם משקללים, צריך לעשות זאת לפי המשקלות הנכונים
ילד ירוק [אתר] בתאריך 12/17/2007 7:28:03 PM
ללא נושא
לא אנחנו עדיין לא מסונכרנים, לא מדובר כאן על זה שממוצע לא מכסה את עניין השונות שהוא עניין חשוב בפני עצמו.
אלא כי השימוש בממוצע משוקלל (לפי גודל התופעה) הוא לא נכון יותר משימוש בממוצע פשוט. הכל מאוד תלוי בהקשר בו מסתכלים על הנתונים. בדוגמה שנתתי לך קודם ממוצע משוקלל יהיה נכון אם נשאל את השאלה
“בממוצע כמה אחוז מהמורשעים ברצח נהרגים ביבשת X”
לעומת זאת ממוצע פשוט יהיה נכון יותר אם נשאל את השאלה:
“בממוצע מה המדיניות של המדינות באיזור כלפי הוצאה להורג של מורשעים ברצח?”
הטיעון המרכזי שלי הוא שבמקרה המקורי של יחס חוב\תוצר. היגיוני יותר דווקא כן להשתמש בממוצע פשוט, מהסיבה הבאה:
כשאנחנו רוצים להשוות את ישראל לשאר המדינות בהקשר של יחס חוב\תוצר אנחנו מעוניינים לדעת בעצם איך ישראל מנהלת את המשמעת התקציבית שלה ביחס לשאר המדינות. מהסיבה הזאת היגיוני יותר להסתכל על התנהלות של כל מדינה בנפרד (ולתת אותו משקל לארה”ב ולוכסמבורג), כי כל מדינה עושה את “ההחלטה” של לאיזה גירעון להיכנס בנפרד.
יוסי לוי [אתר] בתאריך 12/18/2007 9:18:25 PM
תשובה לילד ירוק
חזרנו למשבצת הראשונה ממנה התחיל כל הדיון הזה: ההצדקה שלך לשימוש בממוצע פשוט במקרה הזה היא אידיאולוגית, לא סטטיסטית.
אליהו כץ בתאריך 12/19/2007 2:32:27 AM
ניסיון משלי
שלום יוסי,
כדי להפריך את הטענה (אם הבנתי אותה נכון) אתה צריך להסביר (דבר שלא עשית במאמר), מדוע בחרת דווקא במשקולת של תמ”ג לחישוב הממוצע המשוקלל ולא השתמשת בכל משקולת אחרת (לדוגמא החוב או גודל האוכלוסיה) ?
או במילים אחרות – למה לתת יותר משקל לכלכלות יותר גדולות?
יוסי לוי [אתר] בתאריך 12/19/2007 9:26:37 AM
אליהו
אתה קראת את המאמר? לפי התגובה שלך פה – לא נראה לי.
אליהו כץ בתאריך 12/19/2007 2:18:02 PM
כן יוסי קראתי
ואני גם מבין שכנראה את הצודק , אני רק אשמח אם גם תסביר מדוע
הדבר הלא מובן בטיעון שלך, הוא הקפיצה הלוגית מהפיסקה שמתחילה ב “המהירות אינה אלא היחס ” לפיסקה שבאה אחריה
אם לא ברורה לך הבעיה בקפיצה זו תעיין שוב בתגובה של “דוגמא נגדית” מתאריך 12/3/2007 11:37:31
(במיוחד תסתכל על הדוגמא שהוא נותן).
תודה על ההתיחסות.
ילד ירוק [אתר] בתאריך 12/20/2007 7:47:08 PM
לא חזרנו לאותה הנקודה
כי הטיעון שלי שהרעיון להשתמש בממוצע משוקלל לעומת ממוצע פשוט בהקשר הזה הוא מוטה אידיאולוגית לא פחות, אין כאן משהו “נכון” מבחינה סטטיסטית. השאלה היא איזה נתונים אנחנו מנסים להשיג.
ובהקשר הזה כפי שהסברתי, בהקשר של השאלה עליה אנחנו מנסים לענות (לתקף את מדיניות ישראל בהקשר החוב ביחס לתל”ג) השימוש בממוצע פשוט נותן לנו תשובה טובה יותר מאשר שימוש בממוצע משוקלל.
יוסי לוי [אתר] בתאריך 12/20/2007 9:00:49 PM
תשובה לאליהו
אני לא מתכוון להתייחס לטיעונים של “דוגמא נגדית” – כפי שציינתי מדובר בבליל של מלים שמנסות ליצור רושם.
יוסי לוי [אתר] בתאריך 12/20/2007 9:02:00 PM
שאלה לילד ירוק
האם גם חישוב המהירות הממוצעת שהצעתי הוא “מוטה אידיאולוגית”?
אוהד ק בתאריך 12/24/2007 9:41:32 PM
יוסי צודק
יש להשתמש בתמ”ג כמשקולת, ולא בפרמטרים אחרים כגון מספר התושבים. זאת פשוט מכיוון שהגורם הממוסה הוא התוצר המקומי (שהוא ביטוי של כלל ההכנסות במדינה) ולא התושבים. לכן כל שקלול אחר יניב תוצאה חסרת היגיון כלכלי.
יוסי לוי [אתר] בתאריך 12/25/2007 7:33:38 AM
לאוהד
תודה על התמיכה, אבל גם הנימוק שלך לא מתקבל על דעתי. השיקול אם לשקלל ובמה הוא סטטיסטי, לא כלכלי.
לכן יש רק שקלול אחד נכון.
בדרך כלל השקלול הנכון הוא גם בעל משמעות לתחום היישומי ממנו נלקיו הנתונים, אך לא תמיד.
ילד ירוק [אתר] בתאריך 12/25/2007 9:52:36 PM
ללא נושא
יוסי, כמו יהודי טוב אני אענה לך על שאלה בשאלה אחרת:
נניח שאתה רוצה לחשב את המהירות המקסימלית הממוצעת של כמה מכוניות (כלומר המהירות הכי גבוהה שבה המכונית הייתה אי פעם), האם אתה הולך לעשות ממוצע פשוט, או לשקלל את זה לפי כמות הקילומטרים שכל מכונית נסעה (והזמן שלה על הכביש כמובן)?
כשתענה על השאלה הזאת, אני מזמין אותך לחשוב למה הדוגמה הזאת יותר דומה למצב בו אנו עוסקים מאשר הדוגמה של המהירות שסיפקת במהלך הפוסט שלך.
עופר בתאריך 12/26/2007 12:46:14 PM
עוד דוגמה
נניח שקוראי בלוגים מתבקשים לתת ציון לבלוגים שהם קוראים.
קוראי הבלוג של יוסי נתנו לו ציון 8.5 (500 מדרגים)
קוראי הבלוגים של א’,ב’, וג’ נתנו להם את הציונים: 10, 6,5 ע”י 100000, 500 ו-1000 מדרגים בהתאמה.
איך נכון להעריך את הבלוג של יוסי ביחס לאחרים?
ממוצע הדירוגים של אתרים אחרים הוא 7, ולכן יוסי הוא מעל הממוצע, או ממוצע משוקלל של כמעט 10 לשאר האתרים ולכן הבלוג של יוסי הוא מתחת לממוצע?
התשובה באיזה ממוצע צירך להשתמש תלויה בשאלה שרוצים לקבל עליה תשובה. הסטטיסטיקה לא יכולה להחליט בשבילנו לאיזה שאלה אנחנו רוצים תשובה.
יוסי לוי [אתר] בתאריך 12/27/2007 9:53:58 AM
תשובה לילד ירוק
אתה בעצמך נתת את התשובה בשאלה שלך: הנתון מתייחס למכונית, ולכן יש לחשב את הממוצע לפי המכוניות. יש יכול להיות ממוצע “פשוט” או “משוקלל” כרצונך: נניח שיש 3 מכוניות, אחת מהן הגיע למהירות מקסימלית של 100 קמ”ש, ושתי האחרות ל-120 קמ”ש. אז אתה יכול לחבר 100 ל-120 ל-120 ולחלק ב-3, או לשקלל את 100 ו-120 במשקלות של 1 ו-2 בהתאמה.
יוסי לוי [אתר] בתאריך 12/27/2007 9:56:01 AM
הערה לתגובה של עופר
“התשובה באיזה ממוצע צירך להשתמש תלויה בשאלה שרוצים לקבל עליה תשובה. הסטטיסטיקה לא יכולה להחליט בשבילנו לאיזה שאלה אנחנו רוצים תשובה.”
זה נכון כמובן, אבל שאלה לא פחות חשובה היא היא לאיזה שאלה עונה התשובה שלך. אתה יכול לשאול איזה שאלה שאתה רוצה, ולתת גם איזה תשובה שאתה רוצה, אבל אם אתה רוצה להשתמש בסטטיסטיקה, אתה חייב לעשות את זה ללא שגיאות והטעיות.
ילד ירוק [אתר] בתאריך 12/28/2007 7:54:10 PM
מה ההבדל?
בשתי “הדרכים” שנתת אתה מבצע בעצם אותו דבר וזה ממוצע פשוט של המהירויות על סמך המכוניות (המשקולות שאתה נותן הן מנוונות ושקולות מתמטית למציאת מכנה משותף, זה לא הופך את הממוצע למשוקלל – זה ממוצע פשוט שבו כינסת איברים).
אם נחזור לדוגמה המקורית הרי שבאותה מידה אתה יכול לבצע ממוצע פשוט של יחסי החוב\תל”ג לפי כל מדינה בדיוק כפי שאתה מבצע ממוצע פשוט של המהירויות המקסימליות כאן. (כשמדינה שקולה למכונית)
גם בנושא המקורי עליו דיברנו כמו בדוגמת המהירות המקסימלית יחס החוב\תל”ג מהווה Snapshot רגעי של המצב ולא אינטגרל על פני זמן כמו הדוגמה של המכונית האחת שנוסעת הלוך וחזור. ולכן נכון יותר מבחינה רעיונית לבצע ממוצע פשוט לפי מדינות, ולא להשתמש בתל”ג כמשקולת לממוצע (להשתמש בתל”ג כמשקולת לממוצע בדוגמה המקורית זה קצת כמו להשתמש בזמן שכל מכונית הייתה על הכביש כדי לשקלל את המהירויות המקסימליות).
יוסי לוי [אתר] בתאריך 12/30/2007 5:36:52 PM
לילד ירוק – בראבו
נראה שהבנת סוף סוף שממוצע משוקלל הוא בסה”כ כתיבה מקוצרת של הממוצע ה”רגיל” – ואני כותב “רגיל” במרכאות כי יש רק ממוצע אמיתי אחד.
גם בנושא שקלול יחס החוב/תמג אין הבדל: שקלול
היחסים על פי המכנים (התמג) שקול מתמטית לסיכום כל החובות וחלוקתם בסך כל התמגים
ילד ירוק [אתר] בתאריך 12/31/2007 7:36:03 PM
אבל יוסי זה סתם להחטיא את הנקודה
למה זה יותר היגיוני מלחשב את כל יחסי החוב\תמ”ג וחלוקתם במדינות?
(אני חוזר איתך לדוגמה של הרוצחים וההוצאות להורג כי זה שקול בדיוק).
יוסי לוי [אתר] בתאריך 1/1/2008 7:58:53 AM
כמעט מרים ידיים
נסיון אחרון:
חישוב כל היחסים, אחד בכל מדיה, סיכומם וחלוקה במספר המדינות נותן את ממוצע היחסים.
שקלול יחסי החוב/תמג לפי התמג בכל מדינה, שקול לסיכום כל החובות וחלוקתו בסיכום כל התמגים, וזהנותן לך את היחס הממוצע של חוב/תמג על פני כל המדינות
ילד ירוק [אתר] בתאריך 1/5/2008 2:19:34 AM
עכשיו אנחנו מסונכרנים.
ועכשיו לשאלה הבאה, כפי שפלוצקר כתב בכתבה שלו:
לפי הגישה השניה, אתה נותן משקל יותר גדול בשקלול שלך למדינות עם תל”ג גבוה יותר. לעומת השיטה הראשונה בה בעצם כל היחסים משוקללים בנפרד וכל מדינה מקבלת משקל זהה.
למה כשאנחנו באים להשוות את היחס בישראל היגיוני יותר להשוות את זה למדד שנותן משקל גבוה יותר לארה”ב מאשר ללוכסמבורג, כאשר בעצם כל מדינה מקבלת את ההחלטה כמה חוב לקחת באופן עצמאי (ואין שום רלוונטיות לגודל המדינה בהחלטה הזאת).
כפי שכלכלני האוצר אמרו, יש כאן ללא ספק הטייה אידיאולוגית – לטעמי היגיוני יותר להשתמש דווקא בשיטה הראשונה. אבל זאת כבר יותר שאלה כלכלית מאשר סטטיסטית. הנקודה המרכזית שלי מלכתחילה שאין כאן דרך נכונה סטטיסטית לעשות את זה. כל דרך יכולה להיות נכונה, השאלה איזה מטרה היא באה לשרת.
יוסי לוי [אתר] בתאריך 1/5/2008 8:47:02 AM
תשובה אחרונה בהחלט
השאלה כיצד חשב ממוצע היא שאלה סטטיסטית, לא כלכלית.
יש דרך אחת ויחידה נכונה מבחינה סטטיסטיית
למיצוע – והיא שקלול על פי המכנה.
כמו שבחישוב מהירות ממוצעת יש לשקלל לפי הזמן (שנמצא במכנה של יחס המרחק לזמן) כך במיצוע יחסי חוב תוצר יש לשקלל לפי התוצר, שנמצא במכנה.
כל חישוב אחר הוא שגוי במובן שתוצאתו אינה היחס הממוצע.
לכן, הטענה (הפוסט-מודרניסטית) שכל דרך יכולה להיות נכונה היא טענת הבל.
ילד ירוק [אתר] בתאריך 1/5/2008 11:03:17 AM
פוסטמודרניזם או סמנטיקה?
אם אתה רוצה להמשיך להתעקש על כך שלפי ההגדרה המתמטית היבשה “ממוצע היחס חוב\תל”ג במדינות ה-OECD”, צריך להיות משוקלל לפי המכנים. Be My Guest.
אבל זאת ממש “הקטנת ראש”, מבחינתי המדד “ממוצע היחסים בין חוב\תל”ג במדינות ה-OECD” הוא מדד יותר רלוונטי להשוואה מאשר המדד הראשון (וההסבר מדוע כבר ניתן בכמה תגובות נפרדות).
אני לא מבין את פשר ההתקטננות על הסעיף הסמנטי בהתעלמות מהשאלה המהותית יותר שהיא איזה מן המדדים רלוונטי יותר.
בשורה התחתונה, האוצר משתמש במדד רלוונטי יותר – ואילו כלכלני ה-OECD משתמשים במדד שמוגדר טוב יותר סמנטית.
אני חושב שאני אלך עם כלכלני האוצר בהקשר הזה.
יוסי לוי [אתר] בתאריך 1/5/2008 3:17:01 PM
כלל וככל לא סמנטיקה
אין זה מקרה שהממוצע הינו סטטיסטי כה נפוץ בדיווח נתונים.
לממוצע יש תכונות מתמטיות לא טריויאליות ועל גבן (ובזכותן) נבנתה תיאוריה המאפשרת הסקה סטטיסטית מנתונים. למדדים סטטיסטיים אחרים (כגון החציון, או אותו “ממוצע יחסים” מוזר שאתה וכלכלני האוצר כה מחבבים) אין את התכונות האלה, ולכן הסקת מסקנות על פי מדדים אלה אינה אופטימלית.
ילד ירוק [אתר] בתאריך 1/6/2008 9:47:46 PM
טוב זה כבר באמת לא רציני
אתה קושר לממוצע איזשהן סגולות פלא לא ברורות לחלוטין שהופכות אותו למדד הכי רלוונטי בכל מצב? (אני יכול לתת לך מספיק דוגמאות שבהם זה לא נכון, קח לדוגמה את החיציון של המשכורות כמשקף טוב יותר את מצב העושר בחברה מאשר את הממוצע).
נימוקים והתייחסויות לגופו של עניין יהיו יותר רלוונטיות כאן, אם אתה חושב שממוצע משוקלל יהיה נכון יותר ממוצע יחסים, אתה צריך להסביר מדוע. אני כבר הסברתי מדוע ממוצע יחסים טוב יותר – אתה יכול להתחיל מלהתמודד עם הטיעונים שלי.
יוסי לוי [אתר] בתאריך 1/6/2008 10:33:09 PM
מילה אחרונה בהחלט (שלי)
ילד ירוק,
אני חושש שהדיון הזה הדרדר, ואני, בכל אופן, לא מוכן להמשיך אותו.
אני מציע שתפנה לאוניברסיטה הקרובה למקום מגוריך, תלמד שנתיים סטטיסטיקה, ואחרי שתסיים את קורס שנה ב הנקרא “תיאוריה סטטיסטית” יהיה לנו בסיס משותף מינימלי להמשך הדיון.
כל טוב.
ילד ירוק [אתר] בתאריך 1/7/2008 8:13:13 PM
קודם כל אני מתנצל
ההתנסחות שלי הייתה אכן לא הולמת ונכתבה בעיקר מתוך קלות דעת ותחושה רגעית, ועל כך אני מצטער.
מצד שני, אני סבור שאתה “נפטר” ממני קצת מהר מדי. בתואר שלי למדתי שלושה קורסים של סטטיסטיקה טהורה, מעבר לזה בשביל העשרה עשיתי את הקורס “הפילוסופיה של ההסתברות” (סילבוס כאן:
http://www.tau.ac.il/humanitie….llabi/science_philosophy.html)
(ואפילו אם יורשה לי להתרברב, קיבלתי את הציון הכי גבוה בקורס)
לא שאני רומז שהידע שלי משתווה לשלך, אבל דווקא בגלל זה – וכקורא ותיק של הבלוג שלך ושמחזיק ממך כבר סמכא בתחום הסטטיסטי הרגשתי במהלך הדיון הזה שהטיעונים שלך היו יותר ברוח מטיפה מאשר ברוח של התדיינות אמיתית, ומכך למען האמת התאכזבתי קצת.
מעבר לזה, אני מקווה שתסלח לי על גסות הרוח בהודעה הקודמת.
יום נעים.
דוגמא נגדית בתאריך 3/4/2008 12:57:19 AM
צר לי על האיחור בתשובה,
העניין הוא שעמית למקצוע (מתמטיקה) סיפר לי על איזה ד”ר לסטטיסטיקה שפרסם איזו שטות באתרו בעניין ממוצעים משוקללים. הוא די הופתע כששאלתי אותו “האם זה יוסי לוי?”. המשכנו לדון למשך דקה בקשקוש המקושקש הנ”ל וזהו בעצם.
מעבר לכך, אני רוצה רק לבקש ממך יוסי להסיר את הזבל הזה מאתרך. לא משום שאני נפגע באופן אישי מהקשקוש הזה, אלא שנראה לי שאתה עשוי להיפגע ממנו.
ואה, כן – אתה יכול אולי לספר לנו היכן אתה מועסק? אני פשוט רוצה לנסות ולהימנע ככל הניתן משימוש בתכשירים שמפתחת חברה שמעסיקה אדם שלא מבין מה המשמעות של תוחלת מותנית (וגם לא שהקשר בין דרך וזמן למהירות אינה מנה פשוטה אלא נגזרת)….
יוסי לוי [אתר] בתאריך 3/4/2008 8:27:43 AM
מר דוגמא נגדית
אני מאחל לך בריאות, ומודה לך על הדאגה למוניטין המקצועי שלי.
הייתי מציע לך לדאוג למוניטין המקצועי שלך, למרות שאתה עושה זאת בצורה לא רעה בכלל (על ידי הסתתרות מאחורי כינוי אנונימי).
דוגמא נגדית בתאריך 3/5/2008 11:52:43 PM
יוסי יקירי,
אני לא מסתתר מאחורי שום כינוי. זהו שמי כאן באינטרנט (תתעורר – זו המאה ה-21).
מעבר לכך – אני בהחלט מתכוון לדאוג ליוקרתך המקצועית, ואעשה זאת באופן הבא: מחר בבוקר אני מתכוון לתלות אצלנו במכון (למתמטיקה…) את יצירת הפאר שפרסמת כאן, כדי שכמה שיותר אנשים יתוודעו לגאונות הצרופה הזו!
יוסי לוי [אתר] בתאריך 3/6/2008 9:44:26 AM
תיהנה
רק תוודא שכולם שם אצלכם ידעו מי אתה, כדי שיראו שאתה לא יודע לחשב מהירות ממוצעת.
גילי נחום [אתר] בתאריך 3/10/2008 2:12:58 AM
עצוב לראות שהדיון הדרדר לרמה זו
נראה לי שאפשר לפטור את הוויכוח בתור ויכוח סמנטי ותו לא.
יוסי לוי [אתר] בתאריך 3/11/2008 3:30:55 PM
כן, גם אני מצטער
ומתנצל שנגררתי
יוסי לוי [אתר] בתאריך 3/11/2008 3:37:20 PM
בעניין הקשר בין דרך וזמן למהירות
נכון שאם מסתכלים עלאת המרחק שנגמא כפונקציה של הזמן, אז הנגזרת של הפונקציה הזו (אם היא קיימת) מבטא את המהירות של הגוף הנע כפונקציה של הזמן. אבל, והאבל הזה הוא גדול מאוד, מדובר במהירות הרגעית של הגוף. ןאם מעוניינים במהירות הממוצעת, ולא במהירות הרגעית, אז הביטוי הגיאומטרי.מתמטי הראוי הוא לא ה(פונקציה) הנגזרת, אלא… תחשבו בעצמכם.
ומלבד זאת, מי שמכיר את הגדרת הנגזרת יודע בודאי שהנגזרת היא גבול של מנה. ואם מסתכלים על המרחק כפונקציה של הזמן, אז במנה הזו מופיע מרחק במכנה, וזמן במונה. במלים אחרות, הקשר בין הדרך, הזמן והמהירות, מבוטא על ידי מנה. זו המציאות.
Comment on “ממוצע משוקלל – איך ולמה”