נסיכת המדעים » מה אומרת הסטטיסטיקה

ארכיב עבור 'מה אומרת הסטטיסטיקה'

מי בעד חיסול התלושים?

מאמר מעניין שהופיע בסופ"ש במוסף "הארץ" תחת הכותרת "מי בעד חיסול התלושים?", מספר על ההיסטוריה של סקרי דעת הקהל בישראל:

"סקרי דעת קהל הם באמת יבוא מאמריקה, אבל נמצאים איתנו כבר יותר מ-60 שנה. "מפתיע לגלות שחקר דעת הקהל בישראל קדם להקמת המדינה", כתבה ד"ר דנה בלאנדר, חוקרת במכון הישראלי לדמוקרטיה, במאמר שהתפרסם באתר של המכון. החלוץ של המחקר החברתי-שימושי בארץ היה פרופ' אליהו (לואיס) גוטמן, שממניעים ציוניים ויתר על קריירה אקדמית בארצות הברית ובא ארצה ביולי 47'. כעבור חצי שנה, בעיצומה של מלחמת העצמאות, יחד עם אוריאל פואה, חוקר במדעי החברה שבא מאיטליה, הקים גוטמן בירושלים יחידת מחקר פסיכולוגית קטנה, שהורכבה ממתנדבים ועסקה בחקר דעת קהל בשביל מחלקת ההסברה של "משמר העם"."

פורסם לראשונה באתר "רשימות" בתאריך 17 באוגוסט 2008

נשלח: 8 בדצמבר, 2008. נושאים: האנשים שמאחורי הסטטיסטיקה, היסטוריה, מה אומרת הסטטיסטיקה.
תגובות: 2 | טראקבק

מעטפת מזומנים מחליפה ידיים בחדר אפל

מוריס הניח את המעטפה על השולחן. א', שישב מולו בסבר פנים חמור נטל אותה לידיו והתכונן לפתוח אותה, אבל מוריס עצר בעדו. הוא שלף מכיסו מעטפה נוספת.

"לפני שבאתי לכאן הכנתי שתי מעטפות", סיפר. "סכום הכסף באחת המעטפות היה כפול מהסכום שבמעטפה השניה. בתחילה פשוט שלפתי את אחת המעטפות מהכיס באופן מקרי. האם אתה מעוניין להחליף את המעטפה שנתתי לך במעטפה הזו?"

"זה תלוי", אמר א', "נניח שבמעטפה הזו יש 1000 דולר. האם במעטפה השניה יש 2000 דולר, או רק 500?". "את זה", אמר מוריס, "תדע רק אם תחליף את המעטפות".

א' ניסה לחשוב: נניח שאכן יש כאן 1000 דולר. אם במעטפה השניה יש 2000 דולר, אז הוא ירוויח 1000 דולרים נוספים, אבל אם יש בה רק 500 דולר, הוא יפסיד 500 דולר. 50% סיכוי להרוויח 1000, 50% סיכוי להפסיד 500. הוא חישב את תוחלת הרווח: חצי מאלף הם 500, חצי ממינוס חמש מאות הם מינוס 250, לכן תוחלת הרווח היא 250 דולר. "אוקי, אני מחליף", אמר. הוא החזיר את המעטפה שבידו למוריס, וקיבל את המעטפה השניה לידיו.

מוריס חייך. "ועכשיו, האם אתה מעוניין להחליף את המעטפה שלך במעטפה שבידי?"

ההתרחשות שתוארה זה עתה לא קרתה מעולם. ובכל זאת, האם לדעתכם א' יחליף שוב את מעטפתו במעטפה השניה? אם תחשבו על כך, תהיו חייבים להודות כי אותם השיקולים שהובילו אותו להחלפה הראשונה, יוליכו אותו להחלפה נוספת, ולהחלפות נוספות, אם תוצע אפשרות ההחלפה שוב. גם אילו פתח א' את אחת המעטפות וגילה את הסכום שבתוכה, השיקול שהוצג לא היה משתנה, ושוב היה בוחר בהחלפה, ובעוד החלפה וחוזר חלילה. תמיד כדאי להחליף.

האם יש כאן פרדוקס? ממש לא. הסבר מעניין ניתן למצוא במאמרו של מריוס כהן שפורסם גם ב-Ynet: פרדוקס שתי המעטפות: איזו רווחית יותר? גדי אלכסנדרוביץ, שתיאר את הבעיה הזו בבלוג שלו לפני זמן לא רב, אמר כי "חישובי ההסתברויות הם בלוף אחד גדול". אני הייתי משתמש במלים קצת יותר עדינות, ואומר פשוט כי חישובי ההסתברות שהוצגו בשיקוליו של א' היו שגויים.

שימו לב: מוריס הכין את המעטפות מראש. אם במעטפה הראשונה יש 1000 דולר, אז ההסתברות שבמעטפה השניה יש 2000 דולר היא לא 0.5. הסכום שבמעטפה השניה אינו משתנה מקרי אלא קבוע. לכן ההסתברות הזו היא או 0, אם מוריס הכין מעטפות שבן 1000 דולר ו-500 דולר, או 1, אם מוריס הכין מעטפות שבן 1000 דולר ו-2000 דולר.

השיקול ההסתברותי הנכון שעל א' היה לעשות הוא כזה: "נניח שהיו שתי מעטפות, באחת מהן 1000 דולר ובשניה 2000 דולר. יש סיכוי של 50% שאני מחזיק את המעטפה עם 1000 הדולרים (כי מוריס הושיט לי את אחת משתי המעטפות ששלף באקראי מכיסו), ולכן אם אחליף ארוויח עוד 1000 דולר. יש גם סיכוי של 50% שאני כבר מחזיק את המעטפה עם הסכום הגבוה שהוא 2000 דולר, ולכן אם אחליף אפסיד 1000 דולר. מכאן שתוחלת הרווח מהחלפת המעטפות היא 0, ולכן לא משנה (בתוחלת) אם אחליף את המעטפה או לא אחליף אותה."

מה קורה כאשר הסכום במעטפה הוא משתנה מקרי?

מתברר שאפשר לקחת את הבעיה הזו ולסבך אותה עוד. לפני כשלושה חודשים כתבתי כאן על הרצאתו של פרופ' נוגה אלון שנשאה את הכותרת "חשיבה הסתברותית", והזכרתי בחטף את "בעיית המעטפות המוכללת" שאלון הציג במהלך ההרצאה. אלכסנדרוביץ שמע גם הוא את אלון מרצה על הנושא, ודן בבלוג שלו גם בבעיה המוכללת. אני ממליץ לכם לקרוא את הדיון של אלכסנדרוביץ בבלוג המצויין שלו , כיוון שבהמשך דברי אסתמך על חלק מדבריו.

אפתח בתיאור הבעיה המוכללת כפי שהציג אותה פרופ' אלון. הרעיון הוא שהסכומים המוכנסים למעטפות לא נקבעים באופן שרירותי, אלא על ידי מנגנון הסתברותי: תחילה בוחרים מספר טבעי באופן הבא: המספר 1 נבחר בהסתברות 0.5, 2 נבחר בהסתברות 0.25, 3 נבחר בהסתברות 0.125, וכן הלאה – המספר k נבחר בהסתברות 0.5 בחזקת k. (בניסוח סטטיסטי פורמלי – המספר שנבחר הוא משתנה מקרי גיאומטרי עם פרמטר 0.5). לאחר שנבחר המספר, שנסמנו ב-m, מכניסים למעטפה אחת 10 בחזקת m דולרים, ולשניה מכניסים 10 בחזקת m+1 דולרים. למשל, אם נבחר המספר 3 מכינים שתי מעטפות, באחת מהן יהיו 1000 דולר, בשניה 10000. כעת בוחרים את אחת משתי המעטפות ונותנים אותה לשחקן, עם האופציה להחליף אותה במעטפה השניה. האם כדאי לו להחליף?

שימו לב כי כעת שני הסכומים שבמעטפות הם משתנים מקריים, ולכן הטיעון שבו פתרתי את הבעיה הפשוטה שהוצגה בראית המאמר שוב אינו תקף. כעת דווקא שיקול הסתברותי הדומה לשיקול שהיה שגוי בבעיה ההתחלתית יהיה דווקא תקף.

קודם כל יש לשים לב כי אם תמיד מנצלים את אופציית ההחלפה תוחלת הזכיה תהיה שווה לתוחלת הזכיה במקרה שבו לא מנצלים את אופציית ההחלפה. הסיבה לכך הוא שאם תמיד מחליפים את המעטפה הראשונה בשניה – זה כאילו קיבלתם ישירות את המעטפה השניה. האם תמיד כדאי להחליף את המעטפות?

ברור שאם פותחים את המעטפה ומוצאים בה 10 דולר, הרי שבמעטפה השניה יש 100 דולר בהסתברות 1, וכדאי להחליף. מה קורה אם פותחים את המעטפה ומוצאים בה 100 דולר (ההסתברות לכך היא 3/8)? במקרה כזה יש שתי אפשרויות: או שבמעטפה השניה יש 10 דולר, או שיש בה 1000 דולר. קל לחשב (ואלכסנדרוביץ הסביר את החישוב) כי הסיכוי שבמעטפה השניה יש 10 דולר בלבד הוא 2/3 והסיכוי כי במעטפה השניה יש 1000 דולר הוא 1/3. לכן תוחלת תוספת הסכום המתקבל כתוצאה מההחלפה היא 240 דולר, וכדאי להחליף. הטיעון הזה תקף לכל סכום שנמצא במעטפה הראשונה, ולכן ניתן לסכם ולומר כי כאשר מקבלים מעטפה במשחק הזה כדאי להחליף אותה במעטפה השניה.

טוב, החלפנו את המעטפה הראשונה שקיבלנו במעטפה השניה, ועכשיו מוצע לנו להחליף שוב את המעטפות. האם כדאי להחליף שוב? התשובה שלילית. אם במעטפה הראשונה שקיבלנו לידנו היו 10 דולר, עכשיו אנחנו מחזיקים במעטפה שבה 100 דולר, ולא כדאי להחליף. ואם במעטפה הראשונה שקיבלנו לידנו הייתה חזקה גדולה מ-1 של 10, ואשאר שוב בדוגמא של 100 דולר במעטפה הראשונה שהוחלפה, הרי יש שתי אפשרויות: או שבידנו 1000 דולר ואם נחליף שוב נפסיד 900 דולר, וההסתברות לכך היא 1/3, או שבידנו 10 דולר ואם נחליף שוב את המעטפות נרוויח 90 דולר, וההסתברות לכך היא 2/3. ההחלפה השניה תוביל אותנו לתוחלת רווח שלילית של 240-, ולכן לא כדאי להחליף שוב את המעטפות. שימו לב כי הטיעון הזה תקף גם אם פותחים את המעטפה הראשונה, וגם אם לא.

את תוחלת הזכיה הכללית במשחק המעטפות הזה מחשבים על ידי שקלול הרווח המתקבל בכל מצב בהסתברות שלו. אלכסנדרוביץ עורך את החישוב ומוצא כי תוחלת הרווח היא אינסופית, גם כאשר מנצלים את אופציית ההחלפה, וגם כשלא. בנקודה הזו אלכסנדרוביץ מתבלבל: "הייתי שמח לומר שזה מסביר את הכל. שבגלל שבשני המקרים התוחלת היא אינסופית, אין פלא שנוצר הבלבול לפיו נראה שתמיד כדאי להחליף. להגיד שה'כדאי' הזה מבוסס, אי שם עמוק בפנים, על חיסור שתי התוחלות, חיסור שפשוט אינו מוגדר. לרוע המזל, למרות שמבחינה מתמטית כל זה כנראה נכון, האינטואיציה שלי לא משתפת פעולה…"

את הבעיה שבלבלה את אלכסנדרוביץ קל לפתור. בואו נחזור לבעיה המקורית, זו שבה יש שתי מעטפות עם סכומים שנקבעו מראש. האם זה משנה אם הסכום באחת המעטפות גדול פי 2 מהסכום שבמעטה השניה? לא ממש. גם אם הוא היה גדול פי 10, או רק פי 1.5 הניתוח לא היה משתנה. מה שמשנה באמת זה לא היחס בין שני הסכומים, אלא בכך שהם שונים זה מזה, ולכן אחד מהם גדול ממשנהו. זה הכל. אם השתכנעתם, תשתכנעו גם מהטענה הבאה: בעיית המעטפות הציג פרופ' אלון לא תשתנה בצורה עקרונית אם נשנה אותה כך שתוחלת הרווח של מקבל המעטפה תהיה סופית. ניתן לשנות את הבעיה כך שהתוחלת תהיה סופית בשתי דרכים: על ידי שינוי הפרמטר של ההתפלגות הגיאומטרית, או על ידי שינוי היחסים בין סכומי הכסף במעטפות. לכן, בואו נניח כי במקום חזקות של 10 יופיעו כעת בבעיה חזקות של 1.5.

כלומר, אם מוגרל המספר 1 מההתפלגות הגיאומטרית, נכין שתי מעטפות שבאחת מהן 1.5 דולרים (או אלפי דולרים, אם תרצו, זה לא משנה), ובשניה 2.25 דולרים, ואם יעלה המספר 5 נכין שתי מעטפות שבאחת מהן 7.59375 דולרים ובשניה 11.390625 דולרים. עכשיו נוכל לחזור על השיקול שערכנו קודם: אם במעטפה הראשונה שקיבלנו יש 1.5 דולר, כדאי להחליף כי במעטפה השניה יש בודאות סכום גבוה יותר של 2.25 דולר. לעומת זאת, אם במעטפה יש חזקה של 1.5 הגדולה מ-1, נניח 2.25, הרי שהחלפה תוביל לרווח של 1.25 דולר (3.375 פחות 2.25) בהסתברות 1/3, ולהפסד של 0.75 (2.25 פחות 1.5) בהסתברות 2/3. שקלול הרווח וההפסד על פי ההסתברויות מגלה כי החלפה תוביל להפסד של 0.125, ולכן לא כדאי להחליף.

שקלול על פני כל האפשרויות יראה כי אם תמיד מנצלים את אופציית ההחלפה תוחלת הרווח היא 3.75 (הנוסחה שפיתח אלכסנדרוביץ תעבוד אם תחליפו את 10 ב-1.5). זוהי כמובן גם תוחלת הרווח אם מותרים באופן גורף על אופציית ההחלפה. האסטרטגיה האופטימלית, בה מנצלים את אופציית ההחלפה רק במקרה שבמעטפה הראשונה יש 1.5 דולר, מובילה לתוחלת רווח של 3.9375.

עד כאן פתרון בעיית המעטפות המוכללת. אפשר להמשיך ולהשתעשע בנושא. אפשר, למשל, לבדוק מה קורה אם במקום חזקות של 10 או של 1.5 מכניסים למעטפות חזקות אחרות.

מתברר באופן לא מפתיע כי אם הסכומים שבמעטפות הן חזקות של 2 או יותר מכך, תוחלת הרווח במשחק היא אינסופית. זה בעצם מקרה יותר כללי של הבעיה שהציג אלון. באופן מקומי, כאשר מחשבים את התוחלת המותנה במספר שנבחר בתחילה, כדאי להחליף. כאשר משקללים כל פני כל המספרים הטבעיים (כלומר, מחשבים את התוחלת הבלתי מותנה) התוחלת אינסופית.

תוחלת הזכיה במשחק תהיה סופית אם הסכומים במעטפות הם חזקות של מספר הקטן מ-2. אם הסכומים במעטפות הם חזקות של מספר הנמצא בין 1 ל-2, כדאי להחליף רק במקרה בו יודעים בודאות כי במעטפה השניה יש סכום גדול יותר (זה הניתוח שעשיתי עבור הדוגמא של 1.5). אם במעטפות יש חזקות של 1, אז בכל המעטפות יש אותו סכום ולא משנה מה עושים. באופן מפתיע (לפחות האינטואיציה שלי הופתעה בתחילה, ובדקתי שוב ושוב את הפיתוח והפתרון של אי השוויון הריבועי עד שהשתכנעתי), אם הסכומים שבמעטפות הם חזקות של מספר הקטן מ-1, אז בדרך כלל כדאי להחליף. בואו ניקח חזקות של 0.5 כדוגמא. יש מקרה אחד בו יודעים בודאות כי הסכום במעטפה השניה קטן יותר. זהו המקרה בו פותחים את המעטפה ומוצאים בה 0.5 דולר, במעטפה השניה יש בהכרח 0.25 דולר ולא כדאי להחליף. בכל מקרה אחר כדאי להחליף.

פורסם לראשונה באתר "רשימות" בתאריך 11 באוגוסט 2008 שם התקבלו 11 תגובות

גדי אלכסנדרוביץ' [אתר] בתאריך 8/11/2008 11:12:09 PM

תגובה (שפרסמתי גם בבלוג שלי)

היי יוסי. ראשית, אתה יותר ממוזמן לקרוא לי "גדי" בבלוג שלך. אין כל צורך באלכסנדרוביץ הזה. שנית, לכבוד הוא לי שאתה טורח לקרוא את הבלוג שלי, לא כל שכן להגיב לו בפוסטים משלך. שלישית, תודה על זווית הראייה הנוספת שלך על הבעיה – בהחלט לא ניסיתי לתקוף אותה מהכיוון הזה עד עתה (והייתי צריך).
כעת, לעניין עצמו – ייתכן שאני מתבלבל בחשבון שלי, אבל הרושם שאני מקבל הוא שאכן, אם אתה בוחר בתור בסיס לכפולות של הכסף משהו שהוא קטן מ-2 אתה מקבל תוחלת רווח סופית, ולכן מפיל לקרשים את טיעון ה"תוחלת אינסופית" המדובר, אבל מצד שני, גם החישוב המקורי שממנו נובע שכדאי להחליף כבר לא עובד. שיחקתי עם זה קצת כרגע וקיבלתי שהנוסחה הכללית של "תוחלת הרווח מההחלפה", כש-a הוא הבסיס שלך, היא הנוסחה הבאה:
a^(n-1)*(a^2-3a+2)/3
בפרט, שים לב שאם מציבים a=10 מקבלים את הנוסחה שקיבלתי לעיל. הנוסחה הזו לא חיובית תמיד; עבור ערכים של a שקטנים מ-2 (וגדולים מ-1) מקבלים תוחלת רווח שלילית, כך שלא כדאי להחליף. מכאן שיש שתי בעיות – אחת עם a קטן מ-2, שהיא "מנוונת" – אמנם, התוחלת לא אינסופית בה, אך גם לא כדאי להחליף ולכן אין פרדוקס, ואחת עם a גדול מ-2, שבה התוחלת אינסופית ותמיד כדאי להחליף.
לסיכום, אני לא בטוח שאני מסכים עם הטענה שלך של "בעיית המעטפות הציג פרופ' אלון לא תשתנה בצורה עקרונית אם נשנה אותה כך שתוחלת הרווח של מקבל המעטפה תהיה סופית". ייתכן שאפשר לשנות את פרמטר ההתפלגות הגאומטרית; אבל שינוי היחס בין הסכומים הוא כן בעל חשיבות, לטעמי. מצד שני, ייתכן מאוד שאני סתם מתחרבש עם המתמטיקה.

דובי [אתר] בתאריך 8/12/2008 3:00:25 AM

ומה אם פותחים את המעטפה השניה?

הנה מה שהתקשיתי בו בדיון אצל גדי:
מציגים לי שתי מעטפות. אני בוחר אחת. עכשיו האיש שמולי פותח את המעטפה שהוא מחזיק, ומראה לי שיש שם 100 דולר. לפי החישוב שלך, לא כדאי לי להחליף בשלב הזה (זהה לשלב שאחרי ההחלפה בתיאור שלך). כלומר, השאלה אם כדאי לי להחליף או לא תלויה במשתנה הלכאורה לא רלוונטי של איזה מעטפה נפתחה. וזה לא נראה לי הגיוני.
נניח שאנחנו מוסיפים למשחק שלנו שלב נוסף לפני פתיחת המעטפה: מטילים מטבע. אם יוצא עץ, פותחים את המעטפה שלי וכדאי לי להחליף. אם יוצא פלי, פותחים את המעטפה שלא אצלי, ולא כדאי לי להחליף.
זה נשמע לי פסיכי לגמרי, אבל אני לא מצליח להבין איפה הטעות.

יוסי לוי [אתר] בתאריך 8/13/2008 9:30:49 AM

תגובה לגדי

חשבתי שהבהרתי את זה במאמר, אבל אנסה לחדד את הנקודה.
ההבדל העקרוני בין שתי הבעיות הוא שבבעיה הפשוטה הסכומים שבמעטפות אינם משתנים מקריים, בעוד שבבעיה השניה הסכומים הם כן משתנים מקריים. לכן בבעיה הראשונה השחקן אדיש לאופציה של ההחלפה – תוחלת הרווח מההחלפה היא 0, ולכן לא איכפת לו להחליף את המעטפות שוב ושוב עד שיימאס לו.
בבעיה המוכללת ייתכן שכדאי לשחקן להחליף, וייתכן שלא (זה תלוי בפונקציית ההסתברות של הסכומים, שנקבעת על ידי הפרמטר של ההתפלגות הגיאומטרית ובסיס החזקה). הנקודה העדינה היא שאם במצב מסויים כדאי להחליף את המעטפה, הרי שאחרי ההחלפה לא כדאי להחליף חזרה.
המצבים שבהם כדאי להחליף מתחלקים לשני סוגים – המקרה בו התוחלת הכללית (הבלתי מותנה) היא אינסופית – הבעיה המקורית שאלון הציג היא כזו. מתקבלת לכן תוצאה לא אינטואיטיבית, אך גם לא פרדוקסלית, לפיה התוחלת המותנה חיובית וסופית (כלומר כדאי להחליף) אך התוחלת הבלתי מותנה היא כבר אינסופית (ולכן לא משנה אם מחליפים או לא). איזה תוחלת היא "הנכונה" – המותנה או הבלתי מותנה? זה תלוי אם משחקים את המשחק פעם אחת או "הרבה" פעמים. במקרה של משחק בודד, התוחלת המותנה היא הרלוונטית, ובמקרה של סדרה ארוכה של משחקים, התוחלת הבלתי מותנה צריכה לקבוע את כלל ההחלטה.
אם בסיס החזקה קטן מ-1 אנו נהנים משני העולמות: גם תוחלת בלתי מותנה חיובית כמעט תמיד, וגם תוחלת בלתי מותנה סופית, ואז הכל מסתדר גם עם האינטואיציה. עדיין במקרה שבו כדאי להחליף, אחרי שמחליפים לא כדאי להחליף שוב.

דובי [אתר] בתאריך 8/13/2008 8:20:02 PM

ללא נושא

אני עדיין לא מבין איך זה שהסכומים נקבעים בצורה מקרית משנה משהו – הם נקבעו, ועכשיו הם במעטפות, וזהו. אין שתי אופציות למה שיש במעטפה השניה, יש רק אופציה אחת. זה שאנחנו לא יודעים מה הסכום לא משנה את זה.
אני חושב שהבעיה היא שאנחנו מקבלים את ההנחה שבמעטפה שלנו יש את ה-X, ולכן במעטפה השניה יש או 0.1*X או 10X. אבל זה לא נכון. יש שתי מעטפות, אחת מהן מכילה X, ואחת מהן מכילה 10X. אנחנו מחזיקים באחת מהן (בהסתברות של חצי) – אנחנו לא יודעים איזה, ולכן אין סיבה להחליף אף פעם: התוחלת של ההחלפה היא 0. יש רק מצב אחד שבו פתיחת אחת המעטפות מוסיפה לנו מידע – כשהיא מכילה 10 (כלומר, את המינימום) – ואז אנחנו יודעים שהמעטפה השניה עדיפה. זהו, בכל שאר המקרים, כמו שאומרת האינטואיציה שלנו, להחלפה אין משמעות.

יוסי לוי [אתר] בתאריך 8/14/2008 8:24:51 AM

תשובות לדובי

1) זה לא ממש משנה איזו מעטפה פותחים – זו שאצלך או זו שאצל מוריס, זה רק משנה את הכיוון של שיקולי ההחלפה.
2) בתגובה השניה שלך אתה נופל בכשל ידוע: זה שיש שתי תוצאות אפשריות, זה לא אומר שלכל תוצאה הסתברות שווה. האם ירד מחר שלג בירושלים (היום 14 באוגוסט, להזכירך)? או שכן, או שלא, כמובן, אבל הסיכוי שמחר ירד שלג בירושלים הוא ממש לא 50%. איך אתה יודע את זה? יש לך קצת אינפורמציה על מזג האויר בירושלים. גם כאן, אם אתה יודע את המנגנון לפיו נקבעו הסכומים שבמעטפות, אתה יכול לנצל את האינפורמציה הזו (על ידי שימוש במשפט בייס.
דוגמא קצת יותר מסובכת המדגימה את הכשל הזה – התעלמות מאינפורמציה המאפשרת להעריך מחדש את ההסתברויות – היא בעיית שלושת הדלתות (הידועה גם כבעיית מונטי הול), עליה כתבתי כאן בעבר:

דובי [אתר] בתאריך 8/14/2008 4:05:58 PM

ללא נושא

יוסי, אני מכיר את הכשל, אבל אני לא מצליח להבין איך הוא רלוונטי לפה. לפני שאני יודע איזה סכום יש במעטפה, כשאני בוחר אותן באופן רנדומלי, יש שתי אופציות, והסיכוי שלי לבחור כל אחת מהן שווה: או שאני אקח את המעטפה עם יותר כסף, או שאני אקח את המעטפה עם פחות כסף. אחרי שפתחתי את אחת המעטפות, אני יכול לחשב את הסיכוי שמבין אם המעטפה הזו משתייכת לזוג א' (היא הגבוהה יותר) או זוג ב' (היא הנמוכה יותר). אבל זה בדיוק מה שמוזר פה: שההחלטה שלי איזו מעטפה לפתוח קובעת אם כדאי לי להחליף או שכדאי למוריס להחליף.
כלומר, אם פתחתי את המעטפה שלי וגיליתי שיש לי אלף שקלים, כדאי לי להחליף (כי התוחלת חיובית). אבל אם במקום זה פתחתי את המעטפה של מוריס וגיליתי שם 100 שקלים, לא כדאי לי להחליף (ולמוריס כן כדאי), כי התוחלת שלי שלילית (כי זה מצב זהה למצב הראשון אחרי ההחלפה).
בוא נדמיין עוד משחק: בחרתי מעטפה אחת, החלפתי אותה בשניה בלי לפתוח, ואז פתחתי את המעטפה שבידיים שלי (כלומר, השניה). פתאום – שוב כדאי לי להחליף!

יוסי לוי [אתר] בתאריך 8/17/2008 8:29:46 AM

דובי – הסבר קצר על הסתברות מותה

אם פתחת מעטפה ויש בה 1000 שקלים (שער הדולר נמוך, אה?), אז יש אחת משתי אפשרויות: או שהמספר שעלה בגורל בשלב הראשון היה 2, או שהוא היה 3. מאחר ו-2 עולה בהסתברות גבוהה כפליים מההסתברות של שבה עולה 3 (רבע מול שמינית), הרי שגם ההסתברות המותנה של 2 (כלומר ההסתברות ש-2 עלה כאשר אתה כבר יודע כי המספר שעלה הוא 2 או 3) גדולה כפליים מההסתברות המותנה של 3. ההסתברות המותנה של כל המספרים האחרים היא 0 (למשל, אם אתה יודע כי המספר שעלה בגורל הוא 2 או 3, אז ההסתברות כי 4 עלה בגורל היא אפס), ולכן ההסתברות המותנה של 2 היא 2/3, שזה כפליים מההסתברות המותנה של 3 השווה לשליש.

יוסי לוי [אתר] בתאריך 8/17/2008 8:34:59 AM

דובי – הסבר אלטרנטיבי

הסבר אלטרנטיבי מדוע במקרה של 1000 שקלים במעטפה, ההסתברות המותנה של 100 שקלים במעטפה השניה היא 2/3:
בוא נניח שאתה עושה את התרגיל הזה מליון פעמים. בערך ברבע מהמקרים תגריל 2 ותכין מעטפות עם 100 שקלים ו-1000 שקלים, ובערך בשמינית מהמקרים תגריל 3 ותכין מעטפות עם 1000 שקלים ו-10000 שקלים. בשאר המקרים תקבל משהו אחר. עכשיו תזרוק את כל המקרים האחרים – תשאר עם 250000 זוגות של 100-1000 (בערך) ו-125000 זוגות של 1000-10000. עכשיו מתוך 375000 זוגות המעטפות האלה תבחר באופן מקרי זוג אחד. מה הסיכוי שייבחר זוג של 100-1000? בערך 250000 חלקי 375000 כלומר 2/3

דובי [אתר] בתאריך 8/17/2008 4:08:00 PM

ללא נושא

יוסי, באמת שאין ולא הייתה לי שום בעיה להבין למה הסיכוי לזוג מספרים 100-1000 היא 2/3 לעומת הסיכוי לזוג המספרים 1000-10000 בהנתן שאחד מהם הוא 1000. מה שאני עדיין לא מצליח להבין זה איך זה שכשאני פותח את המעטפה שלי כדאי לי להחליף, אבל אם אני פותח את המעטפה שלא בחרתי בה, לא כדאי לי להחליף.

יוסי לוי [אתר] בתאריך 8/17/2008 4:30:22 PM

אוקיי

אתה לוקח מעטפה, ופותחים את המעטפה השניה. יש בה 1000 דולרים קנדיים. לכן, בהסתברות 2/3 יש במעטפה שלך 100 דולר, ואם תחליף תרוויח 900 דולר, ובהסתברות 1/3 יש במעטפה שלך 10000 דולר, ואם תחליף תפסיד 9000 דולר. שקלל את הרווחים בהסתברויות, ותקבל כי תוחלת הרווח מההחלפה במקרה זה היא מינוס 2400 דולר, ולכן לא כדאי להחליף.

אותו 1 בתאריך 8/27/2008 1:40:38 PM

אבל אבל אבל

כל העוקץ בפרדוקס הוא שאתה נשאל אם ברצונך להחליף את המעטפה *לפני* שפתחת אותה בכלל.

נשלח: 8 בדצמבר, 2008. נושאים: הממ... מעניין..., חשבון פשוט, מה אומרת הסטטיסטיקה.
תגובות: 3 | טראקבק

ביצה או תרנגולת?

מה בא קודם – הביצה התרנגולת? זה לא ממש משנה, ובכל זאת הופתעתי לראות הבוקר באתר Ynet הכרזה חד משמעית: "הסקר קבע: התרנגולת היתה לפני הביצה".

סקרים לא קובעים כלום, כמובן, הם בסהך הכל משקפים את דעת האוכלוסיה שנסקרה. עיון יותר מעמיק בכתבה מראה שמדובר לא בסקר אלא בשאלה ששולבה בתוכנת ההתקנה של תכנה פופלרית. לאחר שנה של התקנות, סיכמה החברה את התוצאות, והפיצה אותן תוך ציון הסתייגות כי ":סקר, שנעשה ברוח הומוריסטית, אין שום משמעות סטטיסטית וודאי שלא מדעית". חבל שהעורך ב-Ynet שכח את זה כאשר נתן את הכותרת ההחלטית שקבעה כי "הסקר קבע".

עדכון: נכון לעכשיו, שעה 13:41, הכותרת המדוברת נעלמה מדף הבית של Ynet, ובמקומה מופיעה כותרת הבאה: "מה בא קודם – הביצה או התרנגולת? הנה התוצאות". נחמד להשתעשע במחשבה שהבלוג הזה משפיע על משהו 🙂

פורסם לראשונה באתר "רשימות" בתאריך 24 באפריל 2008 שם התקבלו 4 תגובות

אורן בתאריך 4/24/2008 12:01:11 PM

סקר עוד יותר מגוחך

פרסומת של חברת סוללות גדולה (נו, זאת עם הארנב) הכריזה שעל פי סקר דעת קהל הסוללות שלה מחזיקות הכי הרבה זמן.
כל מה שהסקר אומר זה איזו חברה הוציאה הכי הרבה כסף על שטיפת מח של האוכלוסיה עם המסר שהסוללה שלהם מחזיקה הכי הרבה זמן. מעניין שאותה חברה גם הפסיקה לציין את הקיבולת באמפר-שעה על גבי הסוללה. האם זה בגלל שאז כל אחד היה יכול לראות שבעצם אין שום הבדל בינה לבין כל סוללת אלקליין אחרת?

אדם בתאריך 4/24/2008 12:21:04 PM

הכתבה היא הומוריסטי וחביבה,

אבל הביעה שמתעוררת עם וויינט כבר מזו תקופה, הוא חוסר הפרדה בין כתבות כאלה לאלה הרציניות. כבר נתקלתי במקרים הרבה יותר קיצוניים של אי הבנות שנוצרו עקב המצב הזה.

אוזניון בתאריך 4/24/2008 12:50:54 PM

מה קדם למה

א: מה קדם למה, הביצה או התרנגולת?
ב: הביצה כמובן. היו לדינוזאורים ביצים הרבה לפני שהיו תרנגולות.
א: בסדר, מה קדם למה ביצה של תרנגולת או תרנגולת?
ב: כשאתה אומר ביצה של תרנגולת למה אתה מתכוון? לביצה שהוטלה ע"י תרנגולת או לביצה שממנה בוקעת תרנגולת?

מאיר הערות בתאריך 5/20/2008 8:30:42 PM

לאוזניון

קודם צריך להגדיר שונות גנטית מספיקה
כדי להבדיל בין תרנגולת ללא תרנגולות
(ובקיצור כמה קטן האפסילון שאתה נותן לי)

נשלח: 8 בדצמבר, 2008. נושאים: אותי זה מצחיק, מה אומרת הסטטיסטיקה, סקרים.
תגובות: אין | טראקבק

תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני

הקדמה

בתאריך 25.3.2008 הרציתי ביום עיון בנושא " Conducting clinical trials in Israel: strategies for compliance with regulatory requirements " שאורגן על ידי חברת ביופורום. להלן עיקרי הדברים שאמרתי בהרצאתי, שנשאה את הכותרת " תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני".

תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני

תהליך הפיתוח הקליני מורכב בדרך כלל מסדרה של ניסויים קליניים. לצורך הפשטות אתייחס במהלך הדברים אל ניסוי קליני יחיד, אך הדברים תקפים לכל תהליך הפיתוח.

לתהליך הפיתוח שלושה שלבים עיקריים: תכנון הניסוי הקליני (design), ביצועו (conduct) וניתוח תוצאותיו עם סיומו (analysis). אני סבור שאין צורך להכביר מלים על תפקיד הסטטיסטיקה והסטטיסטיקאי בשלב ניתוח התוצאות,. אולם, הסטטיסטיקאי יכול לתרום תרומה משמעותית, ואף מכרעת, בכל אחד משלבי הפיתוח הקליני.

כדי להסביר את דברי עלי להידרש לשני מושגי יסוד (concepts) העומדים בבסיסה של המתודולוגיה הסטטיסטית. אחד המושגים האלה הוא השונות (variation) הקיימת באופן טבעי בכל תהליך שאינו דטרמינסטי, וניסויים קליניים בהחלט טומנים בחובם כמות רבה של שונות. לולא השונות, לא היה צורך בניסויים קליניים. פשוט היה ניתן לבחון את התרופה המיועדת על חולה אחד, ועל פי התוצאה ניתן היה לקבוע האם היא יעילה.

מושג היסוד השני הוא קיומם של שני סוגי טעויות בכל תהליך החלטה. כאשר מוצעת מולקולה כטיפול אפשרי למחלה מסויימת, קיימות שתי אפשרויות: או שהמולקולה יעילה לטיפול במחלה, או שלא. אנו לא יודעים מראש איזה אפשרות נכונה, ולכן אנו מתכננים ניסוי קליני, בסופו תתקבל אחת משתי תוצאות. או שתוצאות הניסוי יספקו עדות כי המולקולה אכן יעילה לטיפול במחלה, או שלא. ניתן להציג את שני המצבים האפשריים במציאות יחד עם שתי התוצאות האפשריות של הניסוי, באופן סכמאטי בטבלה הבאה:

two types of errors

אם התרופה המוצעת אכן יעילה, ותוצאת הניסוי אכן מעידה על כך, הרי שמצבנו מצויין. אם התרופה לא יעילה, ותוצאת הניסוי אכן מאשרת כי התרופה אינה יעילה, זו כמובן תוצאה פחות משמחת, אך עדיין התוצאה טובה, שכן כך לפחות נחסכים משאבים שהיו יכולים להיות מבוזבזים על המשך פיתוח של תרופה לא יעילה, וניתן להפנות משאבים אלה למטרות אחרות.

הבעיה היא שישנם עוד שני מצבים אפשריים. מצב בו התרופה אינה יעילה אך תוצאת הניסוי מספקת עדות ליעילות קלינית מכונה מצב של "False Positive" בפי הקלינאים, והסטטיסטיקאים נוהגים לכנות מצב זה בשם "טעות מסוג ראשון". המצב הלא פחות נעים בו תוצאת הניסוי אינה מספקת עדות ליעילות התרופה למרות יעילותה נקרא "False Negative" או "טעות מסוג שני". נהוג לסמן את ההסתברות לטעות מסוג ראשון באות היוונית אלפא, ולכנות אותה בשם "רמת המובהקות" של הניסוי. את ההסתברות לטעות מסוג שני נהוג לסמן באות היוונית ביתא. כמו כן, יותר נוח מבחינה סטטיסטית לא לדון בהסתברות לטעות מסוג שני אלא בהסתברות לא לעשות טעות מסוג שני. הסתברות זו מכונה בשם העוצמה של הניסוי.

לאחר שהבהרתי מושגים אלה, אני יכול לנסח את תפקיד הסטטיסטיקאי במשפט אחד: תפקיד הסטטיסטיקאי בתהליך הפיתוח הקליני הוא לדאוג כי רמת המובהקות והעוצמה של הניסוי יהיו תמיד ברמה הרצויה.

ההגדרה הזו מוזרה – הרי ברור תמיד כי אנו נרצה שרמת המובהקות תהיה 0, וכי העוצמה תהיה 1! למרבה הצער, הדבר אינו אפשרי. אם נוריד את רמת המובהקות ל-0, גם העוצמה תצנח ל-0, ואם נעלה את העוצמה ל-1, גם רמת המובהקות תעלה ל-1.

מה שאנו יכולים לעשות זה לשמור על רמת מובהקות נמוכה יחסית, ועל ידי כך להשיג עוצמה סבירה.

מהי רמת מובהקות נמוכה יחסית? הרשויות הרגולטוריות (כגון ה-FDA ומקבילו האירופי, EMEA) מגבילות את יצרני התרופות ודורשות כי בכל ניסוי קליני רמת המובהקות לא תעלה על 5%. (כיוון שלצורך אישור תרופה נדרשים בדרך כלל לפחות 3 ניסויים קליניים, הסיכוי שתרופה לא יעילה תאושר הוא מכפלת רמות המובהקות של שלושת הניסויים, כלומר 0.000125 לכל היותר). כיוון שכך, החברה המפתחת את התרופה מעוניינת כי רמת המובהקות בפועל של הניסוי תהיה קרובה ככל האפשר ל-5% המותרים, אך לא גבוהה מערך זה. כל ניסוי יש לתכנן על סמך מגבלה זו.

בקורסי מבוא לסטטיסטיקה מלמדים בדרך כלל כי עתה יש לנסח השערה סטטיסטית, ולחשב את גודל המדגם שיאפשר את העוצמה הרצויה. אך המציאות שונה משיעורי המבוא לסטטיסטיקה. ישנם גורמים רבים שיכולים להשפיע על רמת המובהקות, העוצמה וגודל המדגם של הניסוי. ברשימתי "שיקולים סטטיסטיים בתכנון ניסויים בבעלי חיים" התייחסתי לדרכים להקטנת גודלי המדגם בניסויים פרה-קליניים. חלק מהדברים שנאמרו שם תקפים גם בניסויים קליניים. בודאי נכונה הטענה כי יש להקפיד על תכנון סטטיסטי נכון של הניסוי.
בשלב תכנון הניסוי הקליני יש לקחת בחשבון את:

מבנה הניסוי (Experimental design): האם מדובר בניסוי השוואת טיפול לפלסבו, או השוואתו לטיפול אחר, או בדיקתו כתוסף אפשרי לטיפול מקובל? ניסוי בו ננסה להראות כי הטיפול שלנו עדיף על טיפול אחר (superiority) אינו נופל ממנו (Non-inferiority) או שקול לו (Bioequivalence)? האם מדובר בניסוי בו כל קבוצת חולים מקבלת טיפול אחר(Parallel arm), ניסוי בו יש כל החולים מטופלים ללא קבוצת ביקורת (Single arm), או ניסוי בו יש החלפת טיפול במהלך הניסוי (Cross over)? האם תהיה אנליזת ביניים (Interim/futility analysis) במהלך הניסוי? ואם לא, למה לא? האם הניסוי יהיה אדפטיבי (Adaptive design- על כך תהיה רשימה נפרדת בעתיד)?
בחירת הפרמטר הקליני (Clinical endpoint) לפיו תקבע יעילות הטיפול. ככלל, יש לבחור תמיד בפרמטר האינפורמטיבי ביותר. לדוגמא, במחלות המתבטאות בהתקפים (כגון אפילפסיה או טרשת נפוצה), מייחסים הרופאים משמעות קלינית רבה לתקופה נטולת התקפים, ולכן הם נוטים להמליץ על אחוד החולים שלא סבלו מהתקפים במהלך הניסוי כעל המדד הקליני העיקרי להצלחת הטיפול. הבעיה היא שמדד כזה טומן בחובו איבוד אינפורמציה, ומדד עדיף הוא מספר ההתקפים שחווה כל חולה (היכול להיות גם אפס). מדד זה הינו אינפורמטיבי יותר: אם אנו יודעים את מספר ההתקפים שחווה החולה, אנו בודאי יודעים אם היה נטול התקפים במהלך תקופת הטיפול. לעומת זאת, אם אנו יודעים כי החולה לא היה נטול התקפים, אין באפשרותנו לדעת כמה התקפים עבר. לכן המדד של מספר ההתקפים אינפורמטיבי יותר ממדד ה-"seizure free". משפט יסודי בסטטיסטיקה אומר כי משתנה מחקר אינפורמטיבי יותר מבטיח עוצמה גבוהה יותר, ולכן עדיף להשתמש בו.
בחירת אוכלוסיית הניסוי, כלומר בחירת הקריטריונים לפיהם חולה יכול להשתתף בניסוי יכולה להשפיע גם היא על התוצאה. הסטטיסטיקאי יכול לנתח את ההשפעה האפשרית של הכללת סוגים שונים של חולים בניסוי, ולעזור לצוות הקליני בקביעת הקריטריונים.
השפעת המצב הקליני של החולים על האפקט התרפויטי הצפוי: תכנון הניסוי מבוסס במידה רבה על הנחות לגבי אוכלוסיית החולים, ובדרך כלל הידע עליו מתבססות ההנחות מועט. הסטטיסטיקאי יכול וצריך לבדוק מה יקרה לעוצמת הניסוי במקרה שההנחות לא משקפות את המציאות, ועל ידי כך לסייע להעריך את הסיכון הגלום בביצוע הניסוי.
למתודולוגית ניתוח הנתונים יש השפעה עצומה על העוצמה הסטטיסטית של הניסוי. ניתן כמובן להשתמש בשיטות ניתוח סטנדרטיות המבוססות על ההנחה כי התפלגות הנתונים היא נורמלית, גם כאשר ברור כי ההתפלגות אינה כזו (לדוגמא – מספר ההתקפים בודאי אינו מפולג נורמלית). אולם כיום קיימים כלים סטטיסטיים ומיחשוביים לניתוח נתונים ממגוון התפלגויות, ועוצמתם גבוהה יותר מהשיטות הסטנדרטיות המיושנות יוותר. כמובן, בפרוטוקול הניסוי יש לפרט את המתודולוגיה הסטטיסטית לניתוח תוצאות הניסוי. כאשר הניסוי מתחיל כבר מאוחר מדי לדון בשיטות לניתוח התוצאות! אם מעוניינים להשתמש בשיטות ניתוח בייסיאניות, יש לקבל את אישור הרשויות הרגולטוריות לפני תחילת הניסוי.

עד כאן תיארתי את תפקיד הסטטיסטיקאי במהלך תכנון הניסוי.

לאחר תחילת הניסוי, על הסטטיסטיקאי לעקוב באופן שוטף אחר הנתונים המצטברים, ולוודא כי ההנחות על פיהן תוכנן הניסוי אכן מתקיימות. זו משימה בעייתית, כיוון שכל עוד הניסוי לא הסתיים, לא ניתן לדעת איזה טיפול מקבל כל חולה. קיימות שיטות סטטיסטיות שאינן נצרכות למידע זה, והסטטיסטיקאי מוגבל לשימוש בשיטות אלה בלבד. במקרה ויש סטייה משמעותית מההנחות, העלולה להשפיע על עוצמת הניסוי (ועל תוצאתו), על הסטטיסטיקאי להתריע על כך ולהציע דרכים לתיקון המצב. סטטיסטיקאי טוב יצפה מצבים כאלה מראש ויציין בפרוטוקול הניסוי את הפעולות שיינקטו במצבים כאלה.

בסיום הניסוי, לסטטיסטיקאי יש כמובן תפקיד מכריע בניתוח תוצאותיו.

לסיכום: הסטטיסטיקאי יכול לתרום תרומה משמעותית לכל אחד משלבי הפיתוח הקליני, אך השלב בו תרומתו היא המשמעותית ביותר היא שלב התכנון.

פורסם לראשונה באתר "רשימות" בתאריך 28 במרץ 2008 שם התקבלו 2 תגובות

nachum בתאריך 3/29/2008 11:17:09 AM

ללא נושא

it must be–shnei sugei tauiot.and please explain your opinion what is–lama.

יוסי לוי [אתר] בתאריך 3/30/2008 7:25:07 AM

נחום

?????

נשלח: 8 בדצמבר, 2008. נושאים: ביוסטטיסטיקה, מדע, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

איך לזכות ב-52 מליון ש"ח בטוטו

האמת, עד שקיבלתי היום בצהריים טלפון מאיזה עיתונאית מידיעות אחרונות, בכלל לא ידעתי שבארץ רוחשת לה קדחת טוטו – מה שמוכיח כי אני לא ממש יודע כל דבר.

אבל יש קדחת טוטו. לאחר כמה ששבועות שבהם איש לא ניחש נכונה את תוצאות כל 16 המשחקים בטופס הטוטו הפרס הראשון הגיע לגובה של 52 מליון ש"ח.

למי שלא יודע: כל שבת נערכים משחקי כדורגל. בטפס הטוטו מופיעים 16 משחקים כאלה. לכל משחק יש 3 תוצאות אפשריות: או שקבוצה אחת תנצח, או שהקבוצה השניה תנצח, או שהמשחק יסתיים בתיקו. חשבון פשוט מראה כי לשני משחקים יש בסה"כ 9 צירופי תוצאות אפשריים (אפשר לצרף כל תוצאה אפשרית מהמשחק הראשון עם כל תוצאה אפשרית מהמשחק השני), ולכן ל-16 משחקים יש כ-43 מליון צירופי תוצאות אפשריים (המספר מתקבל מהכפלת המספר 3 בעצמו 16 פעמים).

המשמעות המעשית של המספר הזה הוא שאם אדם שלא מתמצא בנפתולי עולם הכדורגל (עקרת בית מקריית שמונה, למשל, או כותב שורות אלה) מחליט למלא טופס טוטו שבו יש ניחוש אחד לתוצאות כל אחד מ-16 המשחקים, אזי יש לו סיכוי של 1 ל-43 מליון לזכות בפרס הראשון. מדובר במספר כל כך קטן,עד שהסיכוי לזכות בפרס הראשון של הגרלת ה-50 מליון של הלוטו (1 ל-2 מליון) נראה פתאום ריאלי.

אלא שבין הטוטו ללוטו יש הבדל משמעותי. בניגוד ללוטו, לא לכל התוצאות האפשריות בטוטו יש אותו סיכוי להתקבל. בשבת הקרובה, למשל, תשחק בית"ר ירושלים מול קבוצת הפועל כפר סבא, המייצגת את עירי בליגת העל. גם בלי להבין יותר מדי בכדורגל אני יודע שהכף נוטה לטובת הירושלמים עתירי הממון והכוכבים, וכי הסיכוי שהם ינצחו במשחק גבוה הרבה יותר משליש. גם מהמרי הטוטו יודעים את זה. השאלה מה קורה במשחקים יותר מאוזנים, שבהם יחסי הכוחות בין הקבוצות לא ברורים כמו במקרה הזה. הסוד של הטוטו הוא ביכולת לשכנע את המהמרים שהם יכולים להגדיל את הסיכוי שלהם לזכות בזכות הידע וההתמצאות שלהם בתחום הכדורגל.

אם למשל, מומחה כדורגל יכול בעזרת הידע שלו להגדיל את הסיכוי לנחש נכונה את תוצאת כל משחק משליש לחצי, הרי שהסיכוי שלו לנחש נכונה את תוצאות כל 16 המשחקים מזנק ל-1 ל-65000 "בלבד", כלומר הסיכוי שלו גדול פי 660 בערך מהסיכוי של מנחש "רגיל".

השאלה היא, כמובן, עד כמה מגדיל הידע את הסיכוי לניחוש נכון. אני סבור שהתוספת לא משמעותית. לו היא הייתה כזו, היינו רואים הרבה יותר זכיות, ובודאי שהפרס הראשון לא היה מצטבר לגובה כזה. ייתכן וחלק מקוראיי יחלקו על דיעה זו, וכיוון שאין בידי כל נתונים לגבי אחוזי הזוכים ביחס למספר הטורים שנשלחו, אין באפשרותי לערוך ניתוח מדוייק יותר. נימוק נוסף שאני יכול לגייס הוא בכך שהטוטו מרוויח, ולכן לא ייתכן כי סיכויי הזכיה גבוהים מדי – הרי צריך לשמור על תוחלת רווח שלילית (למהמר).

אז איך בכל זאת אפשר לזכות בטוטו? יש עובדה אחת בדוקה: הסיכוי של מי ששולח טופס הימור גדול לאינסוף מהסיכוי של מי שלא מהמר. אז מי שרוצה – מוזמן להמר. רק זכרו נא כי מדובר בהימור, משחק, ולא בהשקעה. בהצלחה.

פורסם לראשונה באתר "רשימות" בתאריך 20 במרץ 2008 שם התקבלו 4 תגובות

עמית [אתר] בתאריך 3/21/2008 1:36:52 AM

רק הערה קטנה

הטוטו מרוויח בלי קשר לסיכויי הזכיה, כי הוא מקצה רק כ 50% מההכנסות ממכירת טפסים לצורכי פרס, והפרס הראשון (וגם הבאים האחריו) מתחלק בין המנחשים נכונה. כלומר, אן מצב שהטוטו ישלם יותר מ52 מיליון שקל עבור הפרס הראשון בלי קשר לכמות הזוכים. נהפוך הוא, בגלל שהפרס כה גדול, יש סיכוי שימולאו הרבה יותר טפסי טוטו, מה שיגדיל בהרבה את ההכנסות בלי להגדיל את ההוצאות, כך שלמרות שהסיכוי שמישהו יזכה גדל בעקבות כך, כך גם הסיכוי שהכנסות הטוטו יגדלו.

אלעד יאיר [אתר] בתאריך 3/22/2008 8:04:34 AM

אכן

בשבוע בו יצליחו רבים לנחש את תוצאות כל המשחקים, הפרס הראשון עדיין יהיה רק אחד והוא יתחלק בין כל המנחשים.
מאידך, הואיל וקיימים "מומחים" רבים, כאשר ישנה "הפתעה", ונגיד במקרה שהזכרת בית"ר ירושלים ינוצחו ע"י כפ"ס, הרי, רבים מהם ייפלו ולכן הסיכוי קטן (בכמה? אם כולם "מומחים", אזי כולם ייפלו. בפועל, זה יהיה שונה, אני מניח. בכל מקרה, יש להם 16 משחקים ליפול בהם).
ומעל לכל, ספורט, כתחביב לצפייה והימורים, בניגוד לעשייה ופעילות, הוא רע לדעתי.

נועם [אתר] בתאריך 3/24/2008 5:54:04 PM

יש גם כפולים ומשולשים

או איך שהם לא קוראים לזה. אתה יכול, בתוספת תשלום, לסמן שתיים או שלוש אפשרויות לאותו משחק. למשל, אם אתה חושב שביתר ינצחו או שיהיה תיקו, תסמן את שתי האפשרויות האלה, וכו'.
כמובן שיש הגבלה (אין לי מושג כמה, ההבנה שלי בטוטו/כדורגל דומה לשלך) לכמה משחקים אתה יכול למלא כך בטור, אחרת היית יכול לנצח תמיד.
בקיצור, כל מה שרציתי לומר – העניין הזה מוסיף קצת סיבוך כשבאים לחשב סיכויים ותוחלת.

יוסי לוי [אתר] בתאריך 3/25/2008 8:18:41 AM

כפולים ומשולשים

כפולים ומשולשים הם רק שיטת כתיבה מקוצרת – המשמעות של כפול הוא הכפלת סכום ההימור, ושל משולש – שילושו.

נשלח: 8 בדצמבר, 2008. נושאים: הימורים, מה אומרת הסטטיסטיקה, ספורט.
תגובות: 3 | טראקבק

שיקולים סטטיסטיים בתכנון ניסויים בבעלי חיים

בתאריך 6.1.2008, הרציתי בפני ועדת האתיקה של הפקולטה לרפואה באוניברסיטה העברית על הנושא "שיקולים סטטיסטיים בתכנון ניסויים בבעלי חיים". במאמר זה מובאים עיקרי הדברים שאמרתי.

גילוי נאות: אני עובד בארגון המבצע ניסויים בבעלי חיים בהתאם לדרישת רשויות הבריאות השונות (FDA וכדומה), ובמסגרת תפקידי אני שותף לתכנון ניסויים בבעלי חיים ולניתוח התוצאות. כמו כן, אני מסייע לחוקרים בכתיבת הבקשות לעריכת הניסויים המוגשות לועדת האתיקה.

הדברים המובאים כאן מבטאים את דעתי האישית בלבד.

עקרונות יסוד בהסקה סטטיסטית

כדי להבין את השיקולים הסטטיסטיים שיובאו להלן, יש צורך בהבנה של עקרונות בסיסיים של תהליך ההסקה הסטטיסטית.

כמו בכל מחקר מדעי, נקודת ההתחלה היא מצב נתון מוסכם, והמחקר מיועד לספק עדויות כי המצב הנתון אינו נכון, וכי קיים מצב אלטרנטיבי. אבהיר זאת באמצעות דוגמא. נניח שיש מחלה מסויימת, שלא מוכר טיפול יעיל עבורה. זהו המצב הנתון. חוקר בא ומשער כי טיפול מסויים בחולים ישפר את מצבם הרפואי. זהו המצב האלטרנטיבי. הסטטיסטיקאים נוהגים לכנות את המצב שבו הטיפול למחלה אינו יעיל בשם "השערת האפס", ואת המצב בו הטיפול יעיל בשם "ההשערה האלטרנטיבית".

לאחר הגדרת שני המצבים ניתן לתכנן ניסוי שיאשר שוב כי אכן אין בנמצא טיפול יעיל, או לחילופין, יביא עדויות כי השערת האפס אינה בהכרח נכונה והטיפול המוצע אכן יכול להועיל לחולים.

הניסוי שיבוצע לעולם לא יבטיח תשובה חד משמעית לשאלה שנשאלה. תמיד יכולה להיות טעות, ויש שתי טעויות אפשריות.

טעות אחת מכונה "טעות מסוג ראשון" בפי הסטטיסטיקאים, ו-"False positive" בפי הרופאים. זהו המצב בו תוצאת הניסוי תראה כי הטיפול שניתן יעיל, בעוד למעשה אין זה המצב. הסטטיסטיקאים מכנים את הסיכוי כי טעות כזו תקרה בשם "רמת המובהקות".

כמובן, תיתכן גם טעות מהסוג השני, בו הטיפול יעיל, אך תוצאות הניסוי לא יספקו עדות לכך. הרופאים מכנים טעות כזו בשם "False negative". מטעמי נוחות מתמטית, הסטטיסטיקאים מעדיפים להתייחס אל ההסתברות לא לטעות טעות מהסוג השני בשם "העצמה".

בכל ניסוי סטטיסטי ניתן להוריד את הסיכוי לאחת הטעויות ל-0, אך במחיר של הגדלת הסיכוי של הטעות השניה ל-1. כלן אין טעם בתכנון ניסוי כזה. גישה מקובלת היא לקבוע את הסיכוי לטעות מהסוג הראשון – רמת המובהקות – לרמה נסבלת, נניח 5%, ואז לתכנן ניסוי שיביא את העצמה לרמה מספקת, על ידי קביעת גודל מדגם מתאים. גודל המדגם עלול להיות גבוה מאוד, וישנם ניסויים קליניים אליהם מגייסים אלפי חולים.

חשוב לזכור כי רמת המובהקות של הניסוי, העצמה וגודל המדגם קשורים זה בזה. לאחר שתוכנן הניסוי ניתן לקבוע את גודלם של שניים בלבד מבין השלושה – השלישי ייקבע על ידי שני חבריו.

אולם, שלושה גדלים אלה נקבעים מצידם על ידי מבנה הניסוי שתוכנן ועל ידי השונות הקיימת בניסוי (שיכולה לבוא ממספר מקורות: טעויות מדידה, מיומנות החוקרים, שונות בין הפרטים הנבדקים, ועוד).

הקטנת מספר בעלי החיים המשתתפים בניסויים

בתנאים של מחסור במשאבים, כל חוקר מעוניין להקטין את כמות המשאבים בהם הוא משתמש במהלך המחקר, וזאת על מנת להשיג חסכון כלכלי. כמו כן, ניסויים קטנים הינם מהירים יותר לביצוע ומאפשרים התקדמות מהירה יותר של המחקר. מטבע הדברים, הגישות שיוצגו להלן תקפות לכל מערכת ניסויית המשתמשת במשאבים מוגבלים.

בעלי חיים הינם משאב כלכלי לכל דבר, וגם אילו לא הייתה כל בעיה אתית בקיום ניסויים בבעלי חיים, עדיין היה לחוקר אינטרס להקטין את מספר בעלי החיים המשתתפים בניסוי ככל האפשר. על אחת כמה וכמה מעוניינים החוקרים להקטין את היקף הניסויים בבעלי חיים בשל השיקולים האתיים העומדים לנגד עיניהם.

ניתן לנסות ולהקטין את מספר בעלי החיים המשתתפים הניסוי על ידי:

קביעה מתאימה של מטרות הניסוי – כלומר ניסוח מיטבי של השערות הניסוי – השערת האפס וההשערה האלטרנטיבית. ברוב ספרי הלימוד והקורסים הבסיסיים מקדישים את עיקר הזמן לצמד ההשערות הבסיסיות ביותר: השערת האפס אומרת כי אין הבדל בין הטיפולים, ההשערה האלטרנטיבית אומרת כי יש הבדל. אולם יש עוד צמדי השערות שנין לבדוק.

ראשית, מדוע לא לבדוק השערה אלטרנטיבית האומרת כי הטיפול החדש המוצע עדיף על חוסר טיפול (או על הטיפול הסטנדרטי)? בדרך כלל אין טעם לבדוק כי הטיפול המוצע פחות טוב מהטיפול הסטנדרטי (לפחות בשלבים הראשוניים של המחקר). ניסוח כזה של ההשערות יכול להביא להגברת העצמה הסטטיסטית של הניסוי, או לחלופין להקטנה גודל המדגם.

שאלה נוספת שיש לשאול היא איזה הבדל ייחשב להבדל משמעותי שיצדיק את המשך המחקר. האם שיפור של 10% בפרמטר הנבדק הינו משמעותי? אולי גם שיפור של 25% הינו חסר משמעות מבחינה רפואית, ורק שינוי של 40% הינו משמעותי? במקרה כזה אין טעם לתכנן ניסוי שיזהה שינוי של פחות מ-40% באופן מובהק מבחינה סטטיסטית. ככל שההבדל המשמעותי גדול יותר, כך היקף הניסוי הנדרש לזהות אותו קטן יותר.

איזון בין ההסתברויות לטעות (סוג ראשון מול סוג שני) : באופן מסורתי, קובעים את רמת המובהקות הסטטיסטית של הניסוי (ההסתברות ל-"False positive" ברמה של 5%. האם רמה כה נמוכה אכן הכרחית? הדגלת רמת המובהקות במעט יכולה להביא להגדלה משמעותית של העצמה הסטטיסטית של הניסוי, או לחלופין להקטנה גודל המדגם. לדעתי אין שום דבר קדוש במספר 5%, ובשלבים מוקדמים של המחקר ניתן להסתפק ברמת מובהקות גבוהה יותר, נניח 10%, ובכך להגדיל את העצמה של הניסוי, שהיא כזכור, ההסתברות לזהות אפקט חיובי אם אכן הוא קיים. בכל מקרה, תמיד יש לוודא מראש מהי העצמה הסטטיסטית של הניסוי המתוכנן, ולדעתי אין זה אתי לבצע ניסוי שעוצמתו נמוכה מדי.

הפחתת שונות יכולה להביא להקטנה משמעותית של גודל המדגם הדרוש לניסוי ולהגדת העצמה הסטטיסטית. ניתן להשיג זאת על ידי הקפדה על כיול המכשירים, מיומנות החוקרים המבצעים את הניסוי בפועל, ביצוע הניסוי בטווח זמן קצר ככל הניתן, חזרה על מדידות ככל הניתן, ושימוש במשתני בסיס מסבירים (covariates).

תכנון ניסוי אופטימלי, כולל בחירה נכונה של המשתנה הנמדד בניסוי (משתנה רציף עדיף של משתנה בדיד), בחירה של השיטה הסטטיסטית האופטימלית לניתוח התוצאות, וכן שימוש במתודולוגיית DOE (Design Of Experiments) – ניסויים פאקטוריאליים, מדידות חוזרות, וכדומה.

תכנון לטווח ארוך – מזעור מספר החיות בשימוש בטווח הארוך – גם אם בטווח הקצר יהיה שימוש ביותר חיות.

איסוף נתונים לשימוש בעתיד – מעקב אחרי הנתונים הנאספים לאורך סדרת ניסויים בעזרת המתודולוגיה של תרשימי בקרה (control charts). המידע שנאסף יכול לשמש לתכנון יעיל יותר של ניסויים בעתיד.

שימוש בנתונים היסטוריים במקום קבוצת הביקורת. נושא זה שנוי במחלוקת עזה, וכיום עדיין לא מקובל שימוש בנתונים היסטוריים.

בקרה נאותה על הניסויים

בהתאם לחוק, בכל מוסד המבצע ניסויים בבעלי חיים קיימת ועדת אתיקה שמתפקידה לפקח על ביצוע הניסויים. כדי לבצע את הניסויים דרוש אישור מראש של הועדה.

מומלץ כי בכל בקשה לניסויים בבעלי חיים יש לדרוש את הנתונים המלאים ששימשו כבסיס לתכנון הניסוי, תיאור מפורט של תכנון הניסוי הכולל את משתנה הניסוי, ההשערות הנבדקות, תיאור השיטות הסטטיסטיות שישמשו לניתוח התוצאות, חישובי גודל המדגם והעוצמה הסטטיסטית של הניסוי.

מומלץ כי ועדת האתיקה תעסיק סטטיסטיקאי בלתי תלוי שיבדוק כל בקשה.

פורסם לראשונה באתר "רשימות" בתאריך 19 בינואר 2008 שם התקבלו 30 תגובות

עמית [אתר] בתאריך 1/19/2008 6:17:34 PM

קודם כל

תודה רבה שהעלית את תוכן הרצאתך.
י ש לי מספר הערות שבאות מהמקום הבא: ועדת האתיקה אמורה להכריע האם לבצע ניסוי בבעלי חיים, ואילו הרצאתך נוגעת בעיקר בשאלה איך לתכנן ניסוי בבעלי חיים כך שיהיה יעיל (ל פחות מן הבחינה הסטטיסטית).
שתי השאלות האלה אינן בלתי קשורות. ברור שועדת אתי קה צריכה לאשר רק ניסויים שתוכננו באופן קפדני ושיעילותם גדולה. אולם גדולה ביחס למ ה?
אם להשתמש בהקבלה המקוממת שבעלי חיים הם משאב כלכלי, הדבר דומה לקביעה שאסטרטגיה עסקית טובה היא כזו שמנסה להביא ליעילות מקסימלית בעלויות היצור. יעילות כלכלית היא במקרה הטוב תנאי מקדים לאסטרטגיה עסקית טובה, במקרה הנפוץ ביותר פשוט לא רלוונטית לטיבה של האסטרטגיה.
מה שבעיני חסר בהרצאה הזו הוא מדד שמאפשר להבדיל בין חלופות – ניסוי מתוכנן לעילא בבעלי חיים מול ניסוי מתוכנן לעילא שלא משתמש בבעלי חיים.
הרי אם ועדת האתיקה כל תפקידה זה להכריע בין שתי חלופות ששתיהן משתמשות בבעלי חיים, אז בשביל מה הוועדה…. באמת כל מה שצריך זה ססטיסטיקאי טוב, או באופן כללי יותר, איש שיטות מחקר טוב שיכריע.
אבל ועדת האתיקה, מעצם הגדרתה עוסקת באתיקה לא בסטטיסטיקה. ולכן צריכה לבדוק חלופות שהן אינן מתחום הניסויים בבעלי חיים.
ולבדוק שתי חלופות כאלה קצת יותר קשה, והמדדים של עצמה ומובהקות אינם בהכרח מספיקים.
ובכל זאת ההרצאה מעלה רעיון נכון אחד שהלוואי ויהפוך נפוץ: חיפוש אפקטים חזקים בלבד. כלומר שההשערה האלטרנטיבית לא תהיה שטיפול X משפר את המצב. אלא שטיפול X משפר את המצב בלפחות 40%.
אלא שההצעה הזו, שרצוי שתהפוך מרכזית מאד, מובלעת בתוך דברים אחרים שמונעים מהמאזין להעריך את עוצמתה. למשל הרעיון להעלות את רמת המובהקות ל 10% שהוא אולי ראיון נכון סטטיסטית, אבל שום כתב עת בעולם לא יפרסם מחקר כזה.
אבל בסופו של דבר – הדבר העיקרי שמפריע לי בהרצאה הזו הוא לא פגם בהרצאה (שהיא, כאמור מצויינת) אלא דווקא היומרה המצומצמת שלה: להתעסק בשיקולים סטטיסטיים בלבד.
אין לי פה שום טענה ליוסי – שזה תחום התמחותו. אני מניח שועדת האתיקה שומעת הרצאו, ת דוגמת זו של יוסי, בתחום הסטיסטיקה, וגם שומעת (כך אני מקווה) הרצאות אחרות, מתחום האתיקה, הפילוסופיה ואנשי זכויות בעלי חיים. אלא שהעובדה שכל הרצאה כזו באה בנפרד, כיחידה סגורה ועצמאית, מקשה על האינטגרציה של השיקולים השונים. אם למשל בהרצאה על אתיקה ממליץ המרצה על אסטרטגיה מסויימת, אשר יש לה השלכות על תכנון ניסויים, ואחר כך ההרצאה על תכנון ניסויים לא נוגעת בנושא הזה כלל – עלול להיווצר הרושם שההרצאה על אתיקה אינה מעשית וכך המלצותיה ייזרקו לפח.
בכלל כשיש נתק בין סוגי שיקולים שונים, עלולה לקרות הטיה לסוג מסויים של שיקולם (בד"כ זה יהיה לטובת הסטטיסטיקה והשיקולים ה"מדעיים"), על חשבון האחרים.
וזה חבל, כי זה לא שאי אפשר לעשות הרצאות שיוצרות אינטגרציה בין הדברים האלה.

ערן בתאריך 1/19/2008 6:50:12 PM

ניסוי ללא בעלי חיים

אני רק רוצה להעיר שאין דבר כזה "ניסוי מתוכנן לעילא שלא משתמש בבעלי חיים". הדרך היחידה לעשות ניסויים ללא שימוש בבעלי חיים היא להשתמש בבני אדם, שהם גם סוג של בעלי חיים. אין בידינו מודל מושלם של איזשהו בעל חיים שיהפוך את הניסויים בבעלי חיים למיותרים. אני חושב שגם אף פעם לא יהיה בידינו מודל כזה – בעלי חיים הם פשוט מורכבים מדי.

עמית [אתר] בתאריך 1/19/2008 7:14:49 PM

להשתמש בבני אדם

הרבה יותר מוסרי בעיני מאשר להשתמש בבעלי חיים בניסויים. בני אדם יכולים להביע הסכמה להשתתפות בניסוי. בעלי חיים לא יכולים.
כיוון שזה בעיני הקריטריון העיקרי אם לא היחידי, אז לצורך העניין בני אדם הם לא בעלי חיים. או יותר נכון, אם אתה ממש מתעקש – אני נגד (עד כדי קריטריונים מסויימים) ניסויים בבעלי חיים שאינם יכולים להביע את הסכמתם המודעת להשתתפותם בניסוי.
מעבר לזה אתה רוצה להתווכח על סמנטיקה כזו או אחרת? סבבה – אבל זה נראה לי רק סוג של זריית חול בפנים ונסיון להתחמק מהבעיה המוסרית והאתית האמיתית של ניסויים בבעלי חיים (שהם לא בני אדם).

גיל בתאריך 1/19/2008 8:36:31 PM

יותר מוסרי בבני אדם ?

אז במקום להישתמש בבלי חיים נשתמש בעניים שבנינו ?
אני כבר רואה איך כל החברות תרופות מקימות באפריקה מעבדות חקר …

עמית [אתר] בתאריך 1/19/2008 8:50:30 PM

גיל –

ראשית אני לא בטוח שזה לא קיים כבר: בחקירותי בנוגע לחיסונים, רוב המחקרים על האפקטיביות של חיסונים נערכו על אוכלוסייה באפריקה.
שנית – אף אחד לא אמר על עניים כלום, זו אולי תחזיתך הקודרת, ולא ברור לי על מה היא מבוססת. אם לבדוק לפי מה שקורה היום בתחום טיפולים בסרטן (ובזה לצערי הרב מאד אני מתמצא), דווקא העשירים, אלה שהולכים לרופאים פרטיים, זוכים לנסות את הטיפולים החדשניים והניסויים.
שלישית, נניח ותחזיתך תתממש, והאנשים העניים ישתתפו בהסכמתם המלאה בניסויים קליניים תמורת כסף, וככה, על הדרך, הם יקבלו ייעוץ ומעקב רפואיים – נראה לי דווקא סיטואציה שכולם מרוויחים ממנה. העניים – שאין ידם משגת טיפול רפואי הולם מקבלים הן כסף והן טיפול רפואי, המחקר שיכול לאסוף נתונים, והאנושות בכלל שיהיו בה בעקבות כך פחות מחלות.
אז נכון – יכולה להתפתח סביב העניין שחיתות וניצול חולשתם של העניים, אבל זה יותר גרוע מהשחיתות שיש היום בטיפול הלא שווה בין מטופלים פרטיים ומטפלים רגילים בבתי חולים?
שחיתות וניצול יכולים להתפתח בכל מקום ובכל תנאי.

נינה [אתר] בתאריך 1/19/2008 9:20:38 PM

ללא נושא

הקביעה שלך ש"בעלי חיים הם משאב כלכלי לכל דבר" היא בדיוק הבעייה!!!
והרשה לי להאיר את עיניך: הקביעה הזו פירושה, שגם לבני אדם אנחנו מתייחסים כך!!!
מוסר הוא קביעות ערכיות בבחירה בין אפשרויות. החיים הם מעל לקביעות ערכיות, כי אין להם אלטרנטיבה. ליבוביץ' מסביר זאת בפירוט.
ברגע שאנחנו שמים תג ערך על חיים – נגמרה המוסריות שלנו.
ואנחנו רואים זאת היום: גם בני-אדם הם עבורינו משאב כלכלי.
עמית אמר זאת יפה: עצם העובדה שחיות לא יכולות להביע את הסכמתן לכך – הופכת את הניסויים בהן ללא מוסריים.
ואולי כדאי להתחיל לקרוא לילד בשמו:
בואו לא נסתתר מאחורי המילה "ניסויים", אלא נאמר במפורש: התעללות.
כי בשורה התחתונה – הכאב והסבל שנגרמים לבעלי החיים הללו זו התעללות.
ואולי, אם נתחיל להשתמש במילה המפורשת הזו – נפסיק את הזוועה הזו.

גיל [אתר] בתאריך 1/19/2008 9:46:28 PM

נינה, לי אין שום בעייה לקרוא לניסויים

התעללות, זה עניין סמנטי לא ממש חשוב. מה שחשוב הוא, האם הניסויים הללו יתרמו לרווחת ובריאות בני האדם (ולא, ניסויים לתעשיות הקוסמטיקה לא נחשבים כאלו). בעיניי, בעלי חיים אינם בני אדם ואני לא מעמיד אותם באותה קטגוריה עם אותם זכויות ולכן כשיש ניגוד אינטרסים ביניהם תמיד אעדיף את טובת בני האדם. זה כמובן לא אומר שצריך להשתית עליהם סבל מיותר אבל סבל כזה עדיין רע הכרחי.

מיכל [אתר] בתאריך 1/19/2008 10:35:30 PM

יש שני משפטים…

בפוסט הזה שאשתדל מאוד לזכור, בעניין ניסויים בבע"ח:
1) "הניסוי שיבוצע לעולם לא יבטיח תשובה חד משמעית לשאלה שנשאלה"
את זה כדאי לזכור פשוט כטיעון פרקטי. למרות שאני בין אלו שחושבים שגם אם הניסוי יביא תשובה 'חד משמעית', היא בוודאי לא תשובה סופית, וכשמדובר בניסויים בבעלי חיים, יש גם חלופות ניסוייות. יקרות יותר אמנם, אבל קיימות.
2) "בעלי חיים הינם משאב כלכלי לכל דבר, וגם אילו לא היתה כל בעיה אתית בקיום ניסויים בבעלי חיים…"
את המשפט הזה כדאי לזכור בגלל הסתירה הפנימית שבו. אם יש בעיה אתית בקיום ניסויים בבעלי חיים, הם לא יכולים להית משאב כלכלי לכל דבר. כסף הוא משאב כלכלי קלאסי, כן? ולכן אין שום בעיה אתית בלקחת ולבזבז אותו כשמתחשק. עם בעלי חיים יש בעיה אתית רצינית ביותר ב'לבזבז אותם', ולכן הם אינם משאב כלכלי לכל דבר. זה רק חלק מבני האדם שטועים בעניין הזה.

נינה [אתר] בתאריך 1/19/2008 10:56:56 PM

גיל

אם אין לך בעייה – אז קדימה. התחל להשתמש בשם המפורש: התעללות.
נראה כמה זמן תוכל לעשות זאת ועדיין להגן על עמדתך.
באשר לקטגורית זכויות – חבל שלא התייחסת ל-מה שכתבתי בעניין הזה. ואחזור שוב:
על פי הטיעון הזה אנחנו גם מעדיפים חיים של אדם אחד על חיי אדם אחר.
נראה לך שזו אבולוציה? לדעתי ההיפך הגמור.
ואסור לשכוח את מה שאמרה מיכל, וגם אני אמרתי זאת באחד הפוסטים:
יש חלופות. אלא שהן יקרות, ואנחנו הרי אוהבים זול ומהיר.
כך נראים גם חיי אדם בעיני מי שכוחם רב משל אחרים: זולים וזניחים.
חשוב על כך. כי יש פירושים שונים לאבולוציה. אחד מהם, לדעתי, הוא דווקא לצאת מדפוס החשיבה החייתי…

גיל [אתר] בתאריך 1/19/2008 11:05:08 PM

מיכל, זה שבעלי חיים הם משאב כלכלי

לא אומר שהם רק משאב כלכלי. גם בני אדם הם משאב כלכלי אבל זה לא סותר את העובדה שיש גם שיקולים אחרים שנכנסים לעניין. השיקול הכלכלי חשוב בקביעת הניסויים אבל הוא לא היחיד.
בקשר לזה שניסוי לעולם לא יבטיח תשובה חד משמעית, זה מזכיר לי אמירות כמו האבולוציה היא רק תיאוריה, מדענים משנים את דעתם כל הזמן וכו'. במדע אין שום דבר וודאי אף פעם ותיאוריות משתנות כל הזמן, אבל ואם היינו מתבססים רק על זה אז לא הייתה שום התקדמות מדעית בכלל.
לגבי חלופות מדעיות, זו טענה שטחית בעיניי. לא לכל הניסויים בבעלי חיים יש חלופות ולא כל החלופות יעילות באותה מידה. בוודאי שבמקום לנסות תרופה חדשה על בעלי חיים אפשר לנסות אותה גם על בני אדם ולגרום להם לנזקים קשים, אבל נדמה לי שרוב האנשים לא יקבלו את זה בתור חלופה מעשית.

גיל [אתר] בתאריך 1/19/2008 11:09:18 PM

נינה, לא הבנתי מה הקשר לאבולוציה

ואת מעוותת לגמרי את מה שאני אומר. אני שוב אומר שיש הפרדה עקרונית בין בני אדם לחיות אחרות, כאשר חיי אדם קודמים. אין לי מושג מאיפה הסקת שאני מעדיף חיי אדם אחד על אחר.
לגבי המחיר, אני בהחלט חושב שזה יכול להיות שיקול. אם החלופה לניסויים כאלו עולה פי אלף ומעבר לתקציב של המדענים, אז האלטרנטיבה היא לא לעשות שום דבר. באותה מידה, אם ניסויים שיכולים להציל חיים יתארכו זמן ארוך מדי יש סבירות גבוהה שהרבה אנשים יפגעו. לכן, אם חיי אדם חשובים לנו יותר אז זה בהחלט שיקולי לגיטימי.

בנטינג בתאריך 1/20/2008 8:56:48 AM

עמית

גם בעיני הרבה יותר מוסרי להשתמש בך כשפן ניסוי במקום בבעלי חיים

נינה [אתר] בתאריך 1/20/2008 9:23:46 AM

גיל

את ההפרדה האדם קובע, כך שזה לא כל כך עקרוני.
עקרונות כאלה יכולים להשתנות בקלות, כך שהם לא כל כך עקרונות…
ולא אמרתי שאתה אישית מעדיף חיי אדם אחד על אחר. אמרתי שכאשר מתחילים בהפרדות ערכיות כאלה – אין גבול. וכאשר אין גבול – מחילים הפרדות כאלה גם על בני אדם. והרי אנחנו יודעים שזה קורה היום. אז בוא לא ניתמם. במהות איני רואה כל הבדל בין העדפת חיי אדם על חיה לצורך ניסויים רפואיים, לבין העדפת חיי אדם אחד על אחר משיקולים כלכליים למשל.
ובאשר לאבולוציה – פשוט אולי כדאי שנחשוב על דרכים אחרות להתפתח, ולא להיתקע על ניצחון הכוח.

גיל [אתר] בתאריך 1/20/2008 9:44:47 AM

למה אין גבול?

קבעתי לך בפירוש ובצורה שאינה משתמעת לשתי פנים גבול ברור מאוד. טיעונים בסיגנון המדרון החלקלק הם כשלים לוגיים ידועים. זה שאנשים אחרים נוהגים בצורה מפלה או מחילים את העיקרון גם על בני אדם, תתקיפי אותם לא אותי. אני חושב שההעדפה שיש לי לבני אדם מעוגנת היטב במוסר שמבוסס על העדפת הקרובים אליך. ההבדלים בין כל שני בני אדם זניחים ביותר לעומת ההבדלים בין אנשים לכל בעל חיים אחר ולכן ההבדל הזה איכותי בעיניי.
אגב, אם כבר מדברים על גבולות, האם את שוללת ניסויים בכל בעל חיים? מה אם חולדות? או חיידקים? או תאי גזע עובריים?

יוסי לוי [אתר] בתאריך 1/20/2008 9:50:19 AM

תגובה לעמית

קודם כל, תודה על השבחים.
בעניין הביקורת: אכן, התרכזתי רק בהיבטים הסטטיסטיים. ועדת האתיקה עושה כמובן יותר מכך(כמתחייב על פי החוק). אני לא אכנס כאן לתיאור כל פעילויות הועדות כי איני חבר בועדה כזו.
לגבי מדד המאפשר להבדיל בין חלופות – הסטטיסטיקה אינה מסוגלת לתת לכך תשובה. מתי ראוי לבצע ניסוי בתרביות תאים, מתי דרושים עכברים ומתי אין ברירה וחייבים חבצע ניסוי בקופים – זו שאלה שמי שיכולים להכריע בה הם אנשי הדיסציפלינה המדעית הספציפית לניסוי.
לגבי האינטגרציה בין התחומים – אני סבור שאתה ממעיט בערכם של חברי הועדות. לדעתי הם מסוגלים בהחלט לשמוע אנשי מקצוע מתחומים שונים ולאחר מכן לשקלל את הנתונים שקיבלו ולקבל החלטה מושכלת.

יוסי לוי [אתר] בתאריך 1/20/2008 9:54:37 AM

תגובה למיכל

האם את סבורה שבהוצאת כסף אין בעיה אתית? על הדיונים של ועדת סל התרופות כבר שמעת?

יוסי לוי [אתר] בתאריך 1/20/2008 9:56:22 AM

תגובה לנינה

לא, בעצם אין טעם. אם את חושבת שעדיף למנוע סבל לבעלי חיים גם אם הדבר יגרום יותר סבל לבני אדם, אני בודאי לא אצליח לשכנע אותך.

עמית [אתר] בתאריך 1/20/2008 10:38:38 AM

ליוסי ולאחרים

אני נוטה להתייחס לטיעונים כמו "מניעת סב ל לאדם מצדיקה ניסויים בבעלי חיים" (על הטיותיהם השונות) בחשדנות יתרה. יש בהם בעינ י מידה רבה של דמגוגיה, ומידה מועטה של אמת.
ראשית, יש עניין של מידתיות. אני אולי אסכים להרוג 50 קופים בשביל למצוא תרופה לסרטן, אבל לא נשמע לי סביר להרו ג 50 מיליון קופים בשביל זה. גם לא נשמע לי סביר להרוג 50 קופים בשביל למצוא תרופה לנזלת.
אבל כל העניין הרבה יותר מורכב. כפי שגיל אוהב להגיד המדע (וגם הרפואה) נבנים נדבך על גבי נדבך. בגלל זה, לדעתי אין בכל ההיסטוריה הרפואית אפילו ניסוי אחד בבעלי חיים שהוא לבדו הציל אנשים. היו כאלה שיותר וכאלה שפחות, ולא מעט ניסויים נעשו כדי להראות אפקט קטנטן שרק בדיעבד הסתבר שאפשר לנצלו לטובת תרופה, ועוד כהנה וכהנה מיני מורכבויות.
אז לנפנף בטיעון הכוללני של חיי בעלי חיים מול חיי אדם זה נחמד, ואולי אפילו אני אקבל אותו – אבל מסופקני אם ועדות אתיקה נתקלות במקרים הקיצוניים האלה לעתים קרובות. הרבה יותר סביר שהטיעון נראה כמו "המחקר הזה (כלומר התעללות ב כך וכך חולדות – אבל אף אחד לא יכתוב את זה ככה) עשוי לתרום להבנת מנגנון הX אשר ידוע שהוא קשור ליצירת החומר Y שמשפיע על מחלה Z. תוצאות המחקר יוכלו לעזור במציאת חלבון, אשר ייתכן ויכול לשמש תרופה למחלה"
ועכשיו זה כבר יותר מסובך, כי נניח שהסכמנו שהתעללות בשלושים קופים מוצדקת אם היא מצילה 50 בני אדם בשנה. אבל האם היא מוצדקת אם יש סיכוי של 1 ל 200 שבעוד 5 שנים, אחרי עוד כמה מחקרים שהסתברויותיהם עוד לא ידועות, נציל 1000 אנשים בשנה?
זה כבר לא כל כך ברור.
ואני בכלל לא ממעיט בערכם של חברי הוועדה. אבל קשה לי לתת בהם אמון אם מעולם לא שמעתי אותם אומרים "בדיעבד, החלטתנו X היתה שגויה – בואו ננסה ללמוד ממנה כך שטעויות דומות לא יקרו שנית".
והנה, התפרסם המקרה ההוא עם הקופים במכון וייצמן, ואף אחד מחברי הועדה שאישרה את הניסוי לא בא והסביר את החלטת הועדה. הצדיק אותה, נימק אותה או הודה בטעות.
מזה אני מסיק שיש שיקולים אחרים, זרים לגמרי לשיקולים האתיים והמדעיים, אשר תורמים אף הם לקבלת ההחלטות. ואולי בכלל יש שם שיקולים של "כיסוי תחת".
אני אישית לא נגד ניסויים בבעלי חיים באופן גורף. בתגובה לפוסט אחר (נדמה לי של גיל) כתבתי מה הם בעיני שלושת הקריטריונים שצריכים להתקיים כדי שניסוי כזה יהיה מוצדק. נדמה לי שאחד מהם אפשר לשכלל לאור כמה מההצעות שיוסי נתן בהרצאתו. אבל כמו שהמצס נראה עכשיו, יש לי חשש סביר מאד שהוועדות האתיות הן במובנים רבים חותמות גומי מהבחינה האתית בחלק לא מבוטל מהמקרים. ויש לי חשש סביר שמתנהלים עשרות ניסויים מיותרים בבעלי חיים.

מיכל [אתר] בתאריך 1/20/2008 10:46:07 AM

יוסי, גיל

מכל התגובה שלי, זה מה שבחרת להתמקד בו?
נו טוב, על כל פנים: דיוני ועדת סל התרופות הם דוגמה בלתי רלוונטית בעליל, מאחד ויש כאן עניינים סוציאליים (או היעדרם). ובעיקר: זה אינו כסף של אדם פרטי, היכול לבזבז אותו כרצונו. כאן מדובר על שימוש בכספי משלם המיסים. זה עניין אחר לגמרי, ולא התחלתי לנגוע במאבקי הכוח השונים.
באשר פוסט שלך – מניחה שאת דעותי כבר הבהרתי, אבל אולי, כמו שכתבת לנינה, "בעצם אין טעם"
ואגב תגובתך לנינה, רק לציין שגרימת סבל לבעלי חיים לא תבטיח מציאת תרופה ומניעת סבל מבני אדם. היא תבטיח רק גרימת סבל לבעלי חיים. אה, כן, וגם כמה משכורות…
גיל – לנו יש כבר היכרות מעמיקה… – אבל בהמשך לתגובתך: אז זהו בדיוק, שאני חושבת שגם עבור בעלי חיים אמורים להיות שיקולים אחרים שנכנסים לעניין, ואז הם לא יראו בעיני חלק מהאנשים רק כמשאב כלכלי, אלא ברמה ערכית אחרת: כ ב ע ל י – ח י י ם, ליטרלי. ולא מקבלת את זה שאנשים הם משאב כלכלי. לא כאידיאל. לפחות לאנשים יש מימד מסויים של בחירה. אדם יכול לבחור בין מספר אפשרויות שקיימות עבורו, וגם אם כולן לא משביעות רצון עבורו, יכולה להיות לו בחירה בין גרוע לגרוע יותר, וגם זה משהו. לחיה ש'נבחרה' לניסוי אין בחירה. יתכן שלו היתה לה, היא היתה מעדיפה למות.
זהו, אני סיימתי כאן – אני לא אוהבת לבקר במקומות שבהן איני מרגישה רצויה על ידי בעל הבית.

יוסי לוי [אתר] בתאריך 1/20/2008 10:50:32 AM

עמית – לדעתי גלשת לדמגוגיה

"לדעתי אין בכל ההיסטוריה הרפואית אפילו ניסוי אחד בבעלי חיים שהוא לבדו הציל אנשים" זה משפט נכון כמובן, ולו מהעובדה הפשוטה שפיתוח תרופה הוא תהליך שאורך שנים רבות ובמהלכו נערכים מאות ניסויים מסוגים שונים, שכל אחד מהם תורם פיסה משלו לפאזל.
אבל זו דמגוגע=יה קלאסית, כיוון שזוהי חצי אמיתה.
האם תוכל להצביע על תרופה אחת (לא הומיאופתיה וכדומה) שפותחה ללא ניסויים בבעלי חיים? האם לדעתך ניתן היה לפתח את התרופות בהן מטופלים היום מאות אלפי חולי טרשת נפוצה ללא ניסויים בבעלי חיים? האם אתה סבור כי ניתן כיום לפתח טיפולים יעילים נגד גידולים סרטניים ללא ניסויים בבעלי חיים?
אם תשובתך חיובית, פרס נובל מחכה לך.

יוסי לוי [אתר] בתאריך 1/20/2008 10:59:58 AM

גם מיכל גלשה לדמגוגיה

"גרימת סבל לבעלי חיים לא תבטיח מציאת תרופה ומניעת סבל מבני אדם"
זה נכון. אין הבטחה שכל מחקר יוביל לתפיתוח תרופה. למעשה, 95% מהמולקולות העוברות את שלב המחקר הבסיסי ומגיעות לשלב הפיתוח נכשלות בפיתוח.
אבל לומר שהניסויים יבטיחו "רק גרימת סבל לבעלי חיים. אה, כן, וגם כמה משכורות" זה שקר גס, ודמגוגיה נחותה, שכן כל תרופה מאושרת לשימוש שאת יכולה להעלות בדעתך פותחה תוך כדי ניסויים בבעלי חיים.

עמית [אתר] בתאריך 1/20/2008 11:35:28 AM

יוסי – הפתעת אותי לרעה

להביא טיעון שכל התרופות השתמשו בין השאר בניסויים בעלי חיים? וזהו?
רגע רגע מה זה אומר? זה אומר שכל הניסויים הכרחיים (כי זה נראה כאילו זה מה שמשתמע מהדברים)?
מה שחשוב הוא לא איזה אחוז מהתרופות השתמש בניסויים בבעלי חיים שהיו הכרחיים (כלומר לא ניתן להחליפ בניסויים אחרים), אלא איזה אחוז מהניסויים בבעלי חיים היה הכרחי לצורך מציאת תרופות. פה האחוז לדעתי קטן באופן משמעותי מ100.
והשאלה היא לא אם אפשר למצוא תרופות בלי ניסויים בבעלי חיים (אני לא מכיר את הנושא לעומק, אבל אני לא רואה שום מניעה לוגית מדוע אי אפשר), השאלה היא האם אפשר להקטין את הכמות ולמזער את הנזקים שהניסויים האלה עושים.
אז הנה – גם אתה גלשת לדמגוגיה.

גיל [אתר] בתאריך 1/20/2008 11:46:56 AM

עמית, יש מחקר מדעי בודד שאומר משהו?

אני מסכים איתך שזה עניין מידתי ולא כל ניסוי בהכרח מוצדק, אבל מצד שני האם אתה מכיר איזו שהיא תרופה שהגיעו אליה על פי מחקר בודד, בלי קשר להאם היא נוסתה על בעלי חיים או לא? האם אתה מכיר איזה שהוא מחקר ברפואה שהוא לבד קבע משהו בצורה חד משמעית? מדע נבנה מהרבה מאוד מחקרים קטנים, ואם יש סיכוי סביר שמחקר על בעלי חיים יתרום משמעותית לפיתוח תרופה אזי הוא מוצדק בעיניי. אגב, פחות מאחוז אחד מהמחקרים נעשים בכלל על קופים אז אין שום סיבה להתמקד בהם. רוב המחקרים נעשים על חולדות מעבדה או עכברים. ככל שעולים במעלה הסולם האבולוציוני כך ההגבלות על מחקרים בבעלי חיים קשים יותר.
למיכל, בהחלט יש שיקולים אחרים שנדונים בנוגע לניסויים בבעלי חיים, זו בדיוק הסיבה שיש ועדות שמחליטות לגבי כל ניסוי בנפרד. יש הרבה מאוד ניסויים שנדחים. לכן האמירה שהניסויים הללו רק נועדו להתעלל בחיות היא אמירה דמגוגית, כי אם היא הייתה נכונה לא היו בכלל ועדות ופיקוח על הניסויים. ואני שואל שוב, איך אפשר להבטיח שתרופה חדשה שיוצאת לשוק תהיה בטוחה יחסית ושתעבוד בלי לעבור את שלב הניסויים בבעלי חיים? האם את היית מוכנה שיעשו עלייך ניסויים שלא ידוע מהם השפעות הלוואי שלהם? איזו דרך אחרת יש לבדוק תרופות?

גיל [אתר] בתאריך 1/20/2008 11:51:30 AM

עמית, הטיעון שלך בעייתי

מאותה סיבה סטטיסטית שאתה מצביע עליה. אתה יכול לדעת שניסוי היה מיותר כביכול רק בדיעבד. אם נניח נעשה ניסוי על בעלי חיים ולא נמצא שום תוצר לוואי של תרופה מסוימת תמיד תוכל לומר שהניסוי מיותר כי הוא לא גילה שום דבר חדש. מצד שני, לעולם לא תהיה בטוח בזה אם לא תבצע את הניסוי. אז גם אם נניח רק 10% מהניסויים בבעלי חיים חושפים בעיות קשות בתרופה, זה עדיין שווה את זה כי אחרת מספר גדול של אנשים יפגעו. ולמה אתה לא חושב שלא מנסים למזער את הנזק ככל שניתן? כנראה שאתה כן צריך להכיר את הנושא קצת יותר מקרוב.

One of the Crwod בתאריך 1/20/2008 11:52:27 AM

לעמית

ההעדפה שלך שניסויים יעשו על בני אדם עניים ש"מסכימים" לכך מזעזעת אותי עד כדי כך שאינני מסוגל אפילו לחשוב על תשובה נאותה. לצורך התייחסות, ראה נא מי מוכר כיום אברים "מרצונו החופשי". בני אדם חופשיים להסכים לניסויים רפואיים כמו שהם חופשיים לגור תחת גשרים.
לגבי ניסוי בבע"ח שהציל בני אדם, נסה לחפש "פוליו", עוד מחלה שכיום לא זוכרים שהיא קיימת

צ'יפופו בתאריך 1/20/2008 12:05:56 PM

לעמית

"לא נשמע לי סביר להרוג 50 קופים בשביל למצוא תרופה לנזלת"
הלואי שתהיה מנוזל כל חייך. מזל שלא ליצנים כמוך הם אלה שמנהלים את המחקרים.

גיל [אתר] בתאריך 1/20/2008 12:10:22 PM

הנה ראיון עם שני חוקרים

שלא רק עושים ניסויים בבעלי חיים אלא גם חברים בוועדות האתיקה שמאשרים ניסויים כאלו. הם מסבירים את השיקולים המורכבים לניסויים, את התועלת האפשרית מול הסבל ואיך מתמודדים עם העובדה שהחיות לא נותנות אישור לניסוי (במידה רבה וועדת האתיקה היא הקול שלהם). מעניין אגב שיש הרבה אנשים שנלחמים בניסויים בבעלי חיים אבל אין להם בעייה לנסות לפגוע במעבדות או פיסית בחוקרים שמבצעים ניסויים.
http://www.abc.net.au/rn/allin….es/2008/2105440.htm#transcript

איילת ברטוב בתאריך 1/20/2008 12:32:44 PM

אותו הגיון של "בחירה בחיים"

גם אלו "הבוחרים בחיים" (Pro life) בארה"ב המתנגדים להפלות בשם זכות העובר לחיים כוללים בין שורותיהם כמה קיצוניים המוכנים לרצוח רופאים ולהשמיד מרפאות ולפגוע בנשים שהפילו.
אבל עדיין, אלו הם קיצוניים פסיכיים ודומני שאיש מבין המתווכחים כאן אינו תומך באלימות כנגד חוקרים.

חולי [אתר] בתאריך 1/21/2008 1:16:21 PM

נושא חשוב

יש שני מישורים לבעיה.
מישור רגשי ומשור אמונות היסוד שלנו לגבי החיים.
בסופו של דבר אנחנו מתנהגים לפי רגשותינו ובעיקר לפי מה שנוח לנו.
במישור הרגשי, לא חשוב כמה הבנאדם תומך בניסויים בסופו של דבר כשיבקשו ממנו את הכלב או החתול שלו לעשות בהם ניסוי הוא ישתבץ…
במישור הנחות היסוד שלנו מי שמאמין בהיררכיה בדבר הזה חיים מחלק את הברואים לחשובים וחשובים פחות. אין גבולות כמו שכולם מכירים.
מי שטוען, ככתב שורות אלו, שאין היררכיה בין הברואים וכולם שווים בזכויות הבסיסיות שלהם, אין לו אלא דרך אחת ללכת בה.
מאמר בנושא נמצא בכתיבה ויפורסם בקרוב באתר החדש שלי…
.

Day-Walker בתאריך 1/24/2008 7:21:04 PM

לחולי

אתה צודק – יש 2 מישורים לבעיה:
במישור הרגשי, לא חשוב כמה הבנאדם נגד ניסויים, בסופו של דבר, שחייו יעמדו מנגד, הוא לא יהסס לקחת תרופה שפותחה כתוצאה מניסויים בבע"ח…
במישור הנחות היסוד שלנו מי שאיננו מאמין בהיררכיה בין המינים השונים אז בבקשה – אל דביר את הבית, אל תשים על חתולך משחה נגד פרעושים ואל תרפא אפריקאים מאבולה – הרי כול המינים שווים ולכולם מגיע צ'אנס במלחמת הקיום שבטבע. כל ניסיון לקבוע רף שרירותי לחיים או למוות (חוליות, כאב, מוח עילי, מערכת עצבים מרכית וכו') נידון לכישלון מעצם שרירותו

נשלח: 8 בדצמבר, 2008. נושאים: ביוסטטיסטיקה, מדע, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

ממוצע משוקלל – איך ולמה

אדם יצא לדרך של 240 ק"מ במכוניתו. את המחצית הראשונה של הדרך, 120 ק"מ, נסע במהירות של 40 קמ"ש. את המחצית השניה נסע במהירות 60 קמ"ש. מה הייתה מהירותו הממוצעת לאורך הדרך?

ברשימתי הקודמת הבאתי דברים שכתב סבר פלוצקר בעיתון "ידיעות אחרונות" לפני כשבוע. הוא הביא דוגמא בה הציג משרד האוצר ממוצע פשוט של נתונים מ-28 מדינות, ובכך קיבל נתון מטעה ושונה מהנתון המקביל של ארגון OECD, שהציג ממוצע משוקלל. הקוראים אייל ב.ד. ושחר הצביעו בתגובות לרשימה על מאמר באתר העוקץ, שבו הייתה תלונה הפוכה: אותו מאמר התלונן על כך שכשהאוצר משווה את נטל המס הוא משתמש בממוצע משוקלל.

אז מתי נכון להשתמש בממוצע משוקלל? האם רק כשנוח לך? או שאולי יש הגיון מאחורי הממוצע המשוקלל והשימוש בו?

בואו נחזור לנהג בדוגמא המלאכותית שפתחה את הפרק.

אם נחשב את מהירותו הממוצעת כממוצע פשוט, נקבל כי מהירות הממוצעת הייתה 50 קמ"ש לאורך הדרך. אבל אני משוכנע שכולכם תשתכנעו כי משהו לא בסדר בחישוב הזה. כדי לחשב את המהירות הממוצעת יש לחלק את הדרך הכוללת שעבר אותו אדם בסך הזמן הכולל שבו שהה בדרך. הדרך שהוא עבר שווה ל-240 ק"מ. את 120 הק"מ הראשונים עבר במהירות 40 קמ"ש, כלומר דרכו ארכה 3 שעות. את החלק השני עבר במהירות 60 קמ"ש, ולכן עבר את החלק הזה בשתי שעות. בסה"כ עבר האיש 240 ק"מ ב-5 שעות, ולכן מהירותו הממוצעת הייתה 48 קמ"ש (240 חלקי 5). החישוב שעשינו כעת הוא ממוצע משוקלל: שיקללנו את המהירויות בשני חלקי הדרך לפי משך הזמן בו שהה אותו אדם בכל אחד מחלקי הדרך.

מהירות ממוצעת

מכאן אפשר לעשות אנלוגיה מהמהירות אל היחס החוב לתוצר.

המהירות הממוצעת אינה אלא היחס בין הדרך הכוללת לזמן הכולל. את המהירות הממוצעת על פני מספר קטעי דרך,יש לחשב על ידי חלוקת סך הדרך בסך הזמן, או, באופן שקול, על ידי חישוב ממוצע משוקלל של המהירויות, כשאר הזמנים מהווים את המשקלות.

באותו אופן, את היחס הממוצע בין החוב הציבורי לתוצר על פני מספר מדינות, יש לחשב על ידי חלוקת סך החוב הציבורי בסך התוצר, או, באופן שקול, על ידי חישוב ממוצע משוקלל של יחסי החוב-תוצר, כשאר התוצרים מהווים את המשקלות.

המסקנה ברורה: בחישוב היחס בין החוב הציבורי לתוצר ב-28 מדינות OECD, משרד האוצר של ישראל שגה (ואולי אף הטעה), סבר פלוצקר וארגון OECD צדקו.

נותר רק לברר מה קרה באתר העוקץ. האם תלונתם על שימוש האוצר בממוצע המשוקלל היא קנטרנית? צריך לבדוק. המאמר באתר העוקץ מצטט כתבה בעיתון הארץ שבה נאמר: " "ממשרד האוצר נמסר כי נטל המס בישראל עדיין גבוה מהממוצע במדינות ה-OECD, שאליו עתידה ישראל להתקבל כחברה. נטל המס בישראל ב-2005 היה כ-37% מהתמ"ג, לעומת כ-32% מהתמ"ג במדינות ה-OECD. מצב זה נובע מנטל מס עקיף של 18%, הכולל מסי קנייה, לעומת כ-10% מהתוצר במדינות המערב". הבעיה היא שהנתון שמפרסם האוצר סותר את נתון ה-OECD. לפי נתוני האוצר, נטל המס הממוצע בארגון OECD הוא 32% מהתמ"ג, בעוד שלפי ארגון OECD הנטל הממוצע הוא 36.3% (ראו טבלה מספר 1 בעמוד 14 של קובץ ה-pdf הזה (לינק מת) שנמצא באתר מכון ון-ליר, גם תרשים מספר 1 בעמוד 13 של המסמך, יראה לכם כי הטל המס בישראל דומה לזה של מדינות OECD מאז 1990). אנחנו יודעים ש-OECD משתמש בממוצע משוקלל על פי התוצר, ומהדיון שנערך עד כה, אנו יודעים כי זהו השקלול הנכון. כיוון שהחישוב של האוצר נתן תוצאה אחרת, הרי שהחישוב של האוצר שגוי. אם הוא משתמש בממוצע משוקלל, אז המשקלות אינם נכונים. הבעיה היא כמובן שאין אפשרות לדעת מה היו משקלות האוצר, שכן הנתון הזה נשאר חסוי (הוא לא פורסם בהודעה לעיתונות של האוצר). מה קורה כשמשתמשים במשקלות הלא נכונים? התמונה מתעוותת, כמובן. באתר העוקץ נרמז כאילו השקלול של האוצר היה לפי גודל האוכלוסיה (הייתה התייחסות אל ארה"ב ויפן כאל "מדינות גדולות") אבל אני לא בטוח שזה אכן היה השקלול.

כדי להדגים מה קורה בשקלול לא נכון אחזור לדוגמא שבה פתחתי את הרשימה. נניח שהנהג שלנו נסע את 120 הק"מ הראשונים בתל-אביב שאוכלוסייתה היא כ-360,000 איש, ואת החלק השני של הדרך ברמת השרון שאוכלוסייתה היא כ-36,000 איש. שקלול לפי גודל האוכלוסיה הייה נותן לנו את התוצאה שמהירותו הממוצעת הייתה בערך 42 קמ"ש.

פורסם לראשונה באתר "רשימות" בתאריך 2 בדצמבר 2007 שם התקבלו 47 תגובות

אדם בתאריך 12/1/2007 8:54:39 PM

יוסי היקר

הרשומה מיושרת לצד שמאל של המסך, (או שמא זה המצב רק אצלי?) – האם תוכל לתקן אותה כך שניתן יהיה לקרוא בנוחות?
באותה הזדמנות – תודה על כל הרשימות הנפלאות, אני נהנה כל פעם.
אדם

הכלכלן המתוסכל [אתר] בתאריך 12/1/2007 9:08:57 PM

ללא נושא

מצטרף לאדם, זה לא רק אצלו. קשה מאד לקרוא ככה

דרור שניר בתאריך 12/1/2007 10:10:07 PM

ללא נושא

יש באמת בעיה עם היישור לימין בדף, אבל בינתיים אתם יכולים לטפל בבעיה בצד שלכם:
* עבור אינטרנט אקספלורר: לחיצה על כפתור ימני מעל הטקסט, בחירה בתת-תפריט Encoding [קידוד], ואז בחירה באפשרות Document right to left [מסמך מימין לשמאל]. זה הכל ועובד בכל מקום.
* פיירפוקס: לחיצה על כפתור ימני מעל הטקסט ובחירה באפשרות Switch page direction.

יוסי לוי [אתר] בתאריך 12/1/2007 11:24:34 PM

ללא נושא

לא ברור לי מה קרה. אנסה לתקן את זה בבוקר

יוסי לוי [אתר] בתאריך 12/2/2007 9:00:54 AM

העימוד תוקן

תודה לכל מי שהעיר את תשומת ליבי.

דוגמא נגדית בתאריך 12/2/2007 5:49:59 PM

יוסי,

כפי שכבר אמרתי לך במאמר שעסק בפרסומי האוצר – אתה טועה מבחינת השאלה שאותה צריך לשאול.
כעת אומר לך – אתה טועה גם מהבחינה המתודית;
אין ספק שבמקרה של בעיית התנועה יש להשתמש בממוצע משוקלל: יש שני מ"מ שהם פונקציה של משתנה שלישי (דרך, מהירות וזמן בהתאמה). יש כאן עוד קשר והוא שהדרך קשורה פונקציונלית למהירות ולזמן, ולכן התפלגות המנה של דרך חלקי מהירות משרה התפלגות על הזמן שביחס אליה יש לערוך את המיצוע.
במקרה של הדו"ח שהזכרת יש את המ"מ התמ"ג והמנה בינהם (וההתפלגות של השניים הקודמים משרה עליה התפלגות חדשה). הבעיה שצומחת היא שאיננו יכולים להציג את החוב והתמ"ג כפונקציות של היחס בין החוב לתמ"ג בלבד. השדה של המ"מ השלישי לא נקבע באופן יחיד ע"י שני המ"מ הראשונים, ולכן צריך כאן איזו התפלגות על השדות. באיזה התפלגות נבחר? אלוהים יודע!
אבל – אפשר לשקול שיקולים שונים. שיקול של אינפורמציה (יחד עם העובדה שאפשר לשכן את הבעיה במרחב מדגם סופי, שכולל את המדינות האמורות), ללא כל ידיעה מוקדמת על מתאם בין המ"מ, יניב התפלגות אחידה (כמובן שמידע על מתאמים בין המ"מ משנים הכל…).

יוסי לוי [אתר] בתאריך 12/3/2007 7:58:05 AM

לדוגמא נגדית

אני מצטער אבל גיבוב של מלים גבוהות (כגון מ"מ, שדות, התפלגות וכולי) לא מהווים טיעון.
הנושא שעמד לדיון פשוט מאוד – יש תצפיות על נתון, שהוא יחס בין שני נתונים אחרים. איך למצע אותם? מה קשורה כאן ההתפלגות? המתאם בין המשתנים לא משנה את הממוצע.

דוגמא נגדית בתאריך 12/3/2007 11:19:13 AM

מה קשור?

אז הנה:
אתה נתת דוגמא לשני משתנים מקריים מעל מרחב מדגם שהוא הזמן, שיש בינהם קשר (נגזרת). הקשר הזה קובע באופן יחיד את ההתפלגות שצריך לשים על הזמן כדי לחשב את המהירות הממוצעת (כאן לזמןיש התפלגות ולדרך יש התפלגות ויש צפיפות יחידה על המהירות – "נגזרת רדון ניקודים", כך שהדרך הממוצעת שווה לממוצע של הצפיפות ביחס לזמן).
המקרה השני שונה לחלוטין! המשתנה בו תלויים המשתנים הוא המדינות ולא איזו מן "נגזרת" שקיימת בינהם. לפיכך אין התפלגות אחת ויחידה שנגזרת מהנתונים על מרחב המדגם. כל התפלגות שנבחר תהייה שרירותית, משום שהנ"ל לא תקף עוד.
לעניין המתאם: כדאי שתנסה לקרוא קודם! אני הצעתי לבחור בהתפלגות שנוצרת משיקולי אנטרופיה, והיא (אם המשתנים תוצר וחוב ב"ת) ההתפלגות האחידה שנותנת את הממוצע האריתמטי. אם המשתנים חוב ותוצר תלויים, ההתפלגות שתיוצר (על המדינות!!) משיקולי האנטרופיה תהייה שונה (כי אפשר "ללמוד" ממשתנה אחד משהו על היחס), ובפרט הממוצע יהיה שונה.
נ.ב. – מקווה שלא גיבבתי יותר מדי מילים גבוהות הפעם…

דוגמא נגדית בתאריך 12/3/2007 11:20:37 AM

תיקון-

בסוף הפסקה הראשונה זה צריך להיות "דרך" ולא "דרך ממוצעת"…

דוגמא נגדית בתאריך 12/3/2007 11:37:31 AM

טעיון נוסף ופשוט

שיבהיר מדוע הטענה של יוסי מופרכת:
איך צריך לחשב את התמ"ג הממוצע של המדינות?
ובכן: לפי הטיעון של יוסי, התמ"ג הוא היחס בין החוב ל"חוב:תמ"ג". לפיכך צריך לחשב את הממוצע כממוצע משוקלל כשהמשקולות מגיעות מההתפלגות של "חוב:תמ"ג".
באותו האופן התמ"ג הוא היחס בין שער המטבע לבין "שער מטבע:תמ"ג", ולכן יש לחשב את הממוצע לפי המשקולות שמגיעות מההתפלגות של "שער מטבע:תמ"ג".
אבל, המשקולות בשני המקרים יכולות להיות שונות. אז באילו נשתמש? כאן אני מתערב ואומר ששתיהן שרירותיות, ולכן צריך למצוא שיקול מנחה אחר (או, לחילופין – לעבוד מאוד קשה על מציאת קשרים פונקציונליים בין המשתנים השונים).

יוסי לוי [אתר] בתאריך 12/3/2007 4:48:26 PM

סיכום הדיון עם דוגמא נגדית

סיכום הדיון עם דוגמא נגדית (מבחינתי לפחות):
אני עדיין סבור שהטיעון שלך הוא גיבוב של מילים, אבל מצד שני, אם אתה טוען שהסטטיסטיקאים בארגון OECD טועים ואתה דווקא צודק, אני לא מתכוון להמשיך להתווכח איתך בנושא הזה.
למעוניינים, אני מצרף לינק למאמר המתייחס לתופעה בה צפינו בתגובות לרשימה זו, שפורסם באתר האייל הקורא לפני מספר שנים:
http://www.haayal.co.il/story_1571

ילד ירוק [אתר] בתאריך 12/7/2007 3:16:16 PM

יוסי, אני דווקא מסכים עם דוגמה נגדית

למרות הסרבול המילולי של ההסבר שלו אני לא חושב שמדובר בטרחן מתמטי. ניתן להבין (אני לפחות הבנתי) את הטיעון שלו ולדעתי הוא כן תקף.
אני אסביר זאת באמצעות דוגמה אחרת. נניח שיש 4 ערים ושני איזורים (בכל איזור יש שני ערים), לכל עיר יש נטל מס אחר, ושטח אחר.
הנה נתונים:
עיר א':
שטח: 1000 מ"ר
נטל מס: 90%
עיר ב':
שטח: 0 מ"ר (נניח לשם הפשטות החישובים).
נטל מס: 0%
איזור 2:
עיר ג':
שטח: 500 מ"ר.
נטל מס: 50%.
עיר ד':
שטח: 500 מ"ר.
נטל מס: 50%.
עכשיו נניח שאתה אדם, שיכול לבחור באיזה מן האיזורים לחיות (אתה לא יכול לבחור באיזה עיר). כעת נניח שני דרכים שבהם אתה מוגרל בערים אחרי שאתה בוחר את האיזור:
א. אתה בוחר את האיזור ואז אתה מוגר רנדומלית לאחת הערים בו. במקרה הזה, כדי לחשב את תוחלת נטל המס, היגיוני מאוד להשתמש בממוצע פשוט של הערים:
איזור א': ממוצע נטל המס הוא 45%.
איזור ב': ממוצע נטל המס הוא 50%.
ב. נניח תרחיש אחר, במקום להיות מוגרל רנדומלית לאחת מהערים באיזור, אתה תטוס מלמעלה במטוס ותצנח באחת מהערים (ושם תישאר). במקרה הזה, יהיה מאוד לא היגיוני להשתמש בממוצע פשוט כדי לשקלל את נטל המס, מכיוון שגורם ההחלטה שלך מושפע מאוד מהשטח של העיר. במקרה הזה אם נשתמש בממוצע משוקלל לפי שטח, הרי ש:
הממוצע של איזור א' הוא: 90%.
והממוצע של איזור ב' הוא: 50%.
ותעדיף בהרבה את איזור ב'.
הנקודה שדוגמה נגדית ניסה להעביר וגם אני סמכים איתו, שבדוגמה הראשונה יש לך קשר מתמטי אינהרנטי בין ההגדרה של מהירות ממוצעת לזמן (ולכן אתה חייב להתחשב בו). מצד שני בדוגמה עם יחס החוב\תמ"ג, ברגע שאתה משתמש בתמ"ג כמשקולת לשקלל לפיה, הרי שזה שרירותי בדיוק כמו להשתמש בכמות האוכלוסיה בכל מדינה, או בשטח של כל מדינה. קודם נדרש להוכיח שיש כאן קשר למטרה שעבורה מובא החישוב, או שזאת דרך נכונה יותר למשקל לפיו.
ולצערי אין הסבר בפוסט הזה למה לשקלל דווקא לפי התמ"ג.
אשמח להתייחסותך, ואני מקווה שלא תקטלג גם אותי כטרחן 😉

יוסי לוי [אתר] בתאריך 12/13/2007 9:47:44 AM

תגובה לילד ירוק

אני לא מבין את הדוגמא, אך מבין שלא הובנתי.
אנחנו דנים ביחס בין שני משתנים. היחס הזה חושב במספר יחידות נפרדות (מדינות, – לצורך העניין). עכשיו אנחנו מעוניינים לחשב את היחס הכולל בכל היחידות יחד. אפשרות אית היא לחבר את כל המונים, לחבר את כל המכנים, ולחלק סכום בסכום. אפשרות שניה היא לשקלל את היחסים על פי המכנים. שתי הדרכים שקולות מתמטית (קל להוכיח) ויתנו את אותה התוצאה. כל שקלול אחר ייתן תוצאה שגויה.
אם אנחנו צדברים על יחס חוב תוצר, צריך לחבר את כל החובות ולחלק בסך כל התוצרים, או לחשב את היחס בכל מדינה לחוד, ולקלל את היחסים לפי התוצרים. אלגברית, זה אותו דבר, וזה שונה מכל שקלול אחר של יחסי החוב.תוצר.

ילד ירוק [אתר] בתאריך 12/14/2007 7:16:12 PM

ללא נושא

דווקא הבנתי את כוונתך יוסי, אך אני עדיין חושש שלא הבנת את שלי. אני אתן דוגמה מקבילה יותר כדי להראות שיש הבדל ערכי בין שימוש בממוצע פשוט לממוצע משוקלל.
נניח שאנחנו מעוניינים לראות האם מדינות ביבשת מסויימת נוטות לתת עונש מוות לפושעים שהורשעו ברצח. (כלומר לחשב את היחס בין רוצחים שניתן להם בעונש מוות לבין כלל הרוצחים)
יש לנו את הנתונים הבאים:
במדינה אחת היו מיליון מקרים מתוך מיליון מקרים של עונש מוות לרוצחים.
ב100 מדינות אחרות (קטנות הרבה יותר) היו 0 מקרים של עונש מוות מתוך 10 פושעים שהואשמו מרצח (כלומר לכל מדינה זה 0\10).
עכשיו אם תחשב את זה בממוצע משוקלל (כמו שאתה מציע לגבי יחס חוב\תוצר), יתברר שביבשת הזאת הממוצע של עונש מוותר לרוצחים הוא 99%, ולכן המדינות בו מאוד לא "הומניות" (למרות שהממוצע המשוקלל במקרה הזה משקר).
בעצם כשאתה מבצע ממוצע משוקלל אתה גורם לכך שאתה נותן סוג של משקל לגודל היחס המחושב במדינה. אני ממש לא בטוח שזה הדבר הנכון לעשות, במיוחד במקרה בו אנחנו מדברים על הבחירה של כמה חובות לקחת שהיא החלטה שכל ממשלה עושה בנפרד.
אשמח להתייחסות נוספת.

יוסי לוי [אתר] בתאריך 12/16/2007 10:51:08 AM

טוב

אתה מדבר על הבעייתיות הכללית של הממוצע – העובדה שהוא מושפע מתצפיות חריגות – וזה נכון גם לממוצע פשוט וגם לממוצע משוקקל.
כתבתי על זאת בהרחבה ברשימה על המנהל והפועלים, כאן: http://www.sci-princess.info/archives/40
וגם כאן: http://www.sci-princess.info/archives/60
זה לא נוגד את הטענה שאם משקללים, צריך לעשות זאת לפי המשקלות הנכונים

ילד ירוק [אתר] בתאריך 12/17/2007 7:28:03 PM

ללא נושא

לא אנחנו עדיין לא מסונכרנים, לא מדובר כאן על זה שממוצע לא מכסה את עניין השונות שהוא עניין חשוב בפני עצמו.
אלא כי השימוש בממוצע משוקלל (לפי גודל התופעה) הוא לא נכון יותר משימוש בממוצע פשוט. הכל מאוד תלוי בהקשר בו מסתכלים על הנתונים. בדוגמה שנתתי לך קודם ממוצע משוקלל יהיה נכון אם נשאל את השאלה
"בממוצע כמה אחוז מהמורשעים ברצח נהרגים ביבשת X"
לעומת זאת ממוצע פשוט יהיה נכון יותר אם נשאל את השאלה:
"בממוצע מה המדיניות של המדינות באיזור כלפי הוצאה להורג של מורשעים ברצח?"
הטיעון המרכזי שלי הוא שבמקרה המקורי של יחס חוב\תוצר. היגיוני יותר דווקא כן להשתמש בממוצע פשוט, מהסיבה הבאה:
כשאנחנו רוצים להשוות את ישראל לשאר המדינות בהקשר של יחס חוב\תוצר אנחנו מעוניינים לדעת בעצם איך ישראל מנהלת את המשמעת התקציבית שלה ביחס לשאר המדינות. מהסיבה הזאת היגיוני יותר להסתכל על התנהלות של כל מדינה בנפרד (ולתת אותו משקל לארה"ב ולוכסמבורג), כי כל מדינה עושה את "ההחלטה" של לאיזה גירעון להיכנס בנפרד.

יוסי לוי [אתר] בתאריך 12/18/2007 9:18:25 PM

תשובה לילד ירוק

חזרנו למשבצת הראשונה ממנה התחיל כל הדיון הזה: ההצדקה שלך לשימוש בממוצע פשוט במקרה הזה היא אידיאולוגית, לא סטטיסטית.

אליהו כץ בתאריך 12/19/2007 2:32:27 AM

ניסיון משלי

שלום יוסי,
כדי להפריך את הטענה (אם הבנתי אותה נכון) אתה צריך להסביר (דבר שלא עשית במאמר), מדוע בחרת דווקא במשקולת של תמ"ג לחישוב הממוצע המשוקלל ולא השתמשת בכל משקולת אחרת (לדוגמא החוב או גודל האוכלוסיה) ?
או במילים אחרות – למה לתת יותר משקל לכלכלות יותר גדולות?

יוסי לוי [אתר] בתאריך 12/19/2007 9:26:37 AM

אליהו

אתה קראת את המאמר? לפי התגובה שלך פה – לא נראה לי.

אליהו כץ בתאריך 12/19/2007 2:18:02 PM

כן יוסי קראתי

ואני גם מבין שכנראה את הצודק , אני רק אשמח אם גם תסביר מדוע
הדבר הלא מובן בטיעון שלך, הוא הקפיצה הלוגית מהפיסקה שמתחילה ב "המהירות אינה אלא היחס " לפיסקה שבאה אחריה
אם לא ברורה לך הבעיה בקפיצה זו תעיין שוב בתגובה של "דוגמא נגדית" מתאריך 12/3/2007 11:37:31
(במיוחד תסתכל על הדוגמא שהוא נותן).
תודה על ההתיחסות.

ילד ירוק [אתר] בתאריך 12/20/2007 7:47:08 PM

לא חזרנו לאותה הנקודה

כי הטיעון שלי שהרעיון להשתמש בממוצע משוקלל לעומת ממוצע פשוט בהקשר הזה הוא מוטה אידיאולוגית לא פחות, אין כאן משהו "נכון" מבחינה סטטיסטית. השאלה היא איזה נתונים אנחנו מנסים להשיג.
ובהקשר הזה כפי שהסברתי, בהקשר של השאלה עליה אנחנו מנסים לענות (לתקף את מדיניות ישראל בהקשר החוב ביחס לתל"ג) השימוש בממוצע פשוט נותן לנו תשובה טובה יותר מאשר שימוש בממוצע משוקלל.

יוסי לוי [אתר] בתאריך 12/20/2007 9:00:49 PM

תשובה לאליהו

אני לא מתכוון להתייחס לטיעונים של "דוגמא נגדית" – כפי שציינתי מדובר בבליל של מלים שמנסות ליצור רושם.

יוסי לוי [אתר] בתאריך 12/20/2007 9:02:00 PM

שאלה לילד ירוק

האם גם חישוב המהירות הממוצעת שהצעתי הוא "מוטה אידיאולוגית"?

אוהד ק בתאריך 12/24/2007 9:41:32 PM

יוסי צודק

יש להשתמש בתמ"ג כמשקולת, ולא בפרמטרים אחרים כגון מספר התושבים. זאת פשוט מכיוון שהגורם הממוסה הוא התוצר המקומי (שהוא ביטוי של כלל ההכנסות במדינה) ולא התושבים. לכן כל שקלול אחר יניב תוצאה חסרת היגיון כלכלי.

יוסי לוי [אתר] בתאריך 12/25/2007 7:33:38 AM

לאוהד

תודה על התמיכה, אבל גם הנימוק שלך לא מתקבל על דעתי. השיקול אם לשקלל ובמה הוא סטטיסטי, לא כלכלי.
לכן יש רק שקלול אחד נכון.
בדרך כלל השקלול הנכון הוא גם בעל משמעות לתחום היישומי ממנו נלקיו הנתונים, אך לא תמיד.

ילד ירוק [אתר] בתאריך 12/25/2007 9:52:36 PM

ללא נושא

יוסי, כמו יהודי טוב אני אענה לך על שאלה בשאלה אחרת:
נניח שאתה רוצה לחשב את המהירות המקסימלית הממוצעת של כמה מכוניות (כלומר המהירות הכי גבוהה שבה המכונית הייתה אי פעם), האם אתה הולך לעשות ממוצע פשוט, או לשקלל את זה לפי כמות הקילומטרים שכל מכונית נסעה (והזמן שלה על הכביש כמובן)?
כשתענה על השאלה הזאת, אני מזמין אותך לחשוב למה הדוגמה הזאת יותר דומה למצב בו אנו עוסקים מאשר הדוגמה של המהירות שסיפקת במהלך הפוסט שלך.

עופר בתאריך 12/26/2007 12:46:14 PM

עוד דוגמה

נניח שקוראי בלוגים מתבקשים לתת ציון לבלוגים שהם קוראים.
קוראי הבלוג של יוסי נתנו לו ציון 8.5 (500 מדרגים)
קוראי הבלוגים של א',ב', וג' נתנו להם את הציונים: 10, 6,5 ע"י 100000, 500 ו-1000 מדרגים בהתאמה.
איך נכון להעריך את הבלוג של יוסי ביחס לאחרים?
ממוצע הדירוגים של אתרים אחרים הוא 7, ולכן יוסי הוא מעל הממוצע, או ממוצע משוקלל של כמעט 10 לשאר האתרים ולכן הבלוג של יוסי הוא מתחת לממוצע?
התשובה באיזה ממוצע צירך להשתמש תלויה בשאלה שרוצים לקבל עליה תשובה. הסטטיסטיקה לא יכולה להחליט בשבילנו לאיזה שאלה אנחנו רוצים תשובה.

יוסי לוי [אתר] בתאריך 12/27/2007 9:53:58 AM

תשובה לילד ירוק

אתה בעצמך נתת את התשובה בשאלה שלך: הנתון מתייחס למכונית, ולכן יש לחשב את הממוצע לפי המכוניות. יש יכול להיות ממוצע "פשוט" או "משוקלל" כרצונך: נניח שיש 3 מכוניות, אחת מהן הגיע למהירות מקסימלית של 100 קמ"ש, ושתי האחרות ל-120 קמ"ש. אז אתה יכול לחבר 100 ל-120 ל-120 ולחלק ב-3, או לשקלל את 100 ו-120 במשקלות של 1 ו-2 בהתאמה.

יוסי לוי [אתר] בתאריך 12/27/2007 9:56:01 AM

הערה לתגובה של עופר

"התשובה באיזה ממוצע צירך להשתמש תלויה בשאלה שרוצים לקבל עליה תשובה. הסטטיסטיקה לא יכולה להחליט בשבילנו לאיזה שאלה אנחנו רוצים תשובה."
זה נכון כמובן, אבל שאלה לא פחות חשובה היא היא לאיזה שאלה עונה התשובה שלך. אתה יכול לשאול איזה שאלה שאתה רוצה, ולתת גם איזה תשובה שאתה רוצה, אבל אם אתה רוצה להשתמש בסטטיסטיקה, אתה חייב לעשות את זה ללא שגיאות והטעיות.

ילד ירוק [אתר] בתאריך 12/28/2007 7:54:10 PM

מה ההבדל?

בשתי "הדרכים" שנתת אתה מבצע בעצם אותו דבר וזה ממוצע פשוט של המהירויות על סמך המכוניות (המשקולות שאתה נותן הן מנוונות ושקולות מתמטית למציאת מכנה משותף, זה לא הופך את הממוצע למשוקלל – זה ממוצע פשוט שבו כינסת איברים).
אם נחזור לדוגמה המקורית הרי שבאותה מידה אתה יכול לבצע ממוצע פשוט של יחסי החוב\תל"ג לפי כל מדינה בדיוק כפי שאתה מבצע ממוצע פשוט של המהירויות המקסימליות כאן. (כשמדינה שקולה למכונית)
גם בנושא המקורי עליו דיברנו כמו בדוגמת המהירות המקסימלית יחס החוב\תל"ג מהווה Snapshot רגעי של המצב ולא אינטגרל על פני זמן כמו הדוגמה של המכונית האחת שנוסעת הלוך וחזור. ולכן נכון יותר מבחינה רעיונית לבצע ממוצע פשוט לפי מדינות, ולא להשתמש בתל"ג כמשקולת לממוצע (להשתמש בתל"ג כמשקולת לממוצע בדוגמה המקורית זה קצת כמו להשתמש בזמן שכל מכונית הייתה על הכביש כדי לשקלל את המהירויות המקסימליות).

יוסי לוי [אתר] בתאריך 12/30/2007 5:36:52 PM

לילד ירוק – בראבו

נראה שהבנת סוף סוף שממוצע משוקלל הוא בסה"כ כתיבה מקוצרת של הממוצע ה"רגיל" – ואני כותב "רגיל" במרכאות כי יש רק ממוצע אמיתי אחד.
גם בנושא שקלול יחס החוב/תמג אין הבדל: שקלול
היחסים על פי המכנים (התמג) שקול מתמטית לסיכום כל החובות וחלוקתם בסך כל התמגים

ילד ירוק [אתר] בתאריך 12/31/2007 7:36:03 PM

אבל יוסי זה סתם להחטיא את הנקודה

למה זה יותר היגיוני מלחשב את כל יחסי החוב\תמ"ג וחלוקתם במדינות?
(אני חוזר איתך לדוגמה של הרוצחים וההוצאות להורג כי זה שקול בדיוק).

יוסי לוי [אתר] בתאריך 1/1/2008 7:58:53 AM

כמעט מרים ידיים

נסיון אחרון:
חישוב כל היחסים, אחד בכל מדיה, סיכומם וחלוקה במספר המדינות נותן את ממוצע היחסים.
שקלול יחסי החוב/תמג לפי התמג בכל מדינה, שקול לסיכום כל החובות וחלוקתו בסיכום כל התמגים, וזהנותן לך את היחס הממוצע של חוב/תמג על פני כל המדינות

ילד ירוק [אתר] בתאריך 1/5/2008 2:19:34 AM

עכשיו אנחנו מסונכרנים.

ועכשיו לשאלה הבאה, כפי שפלוצקר כתב בכתבה שלו:
לפי הגישה השניה, אתה נותן משקל יותר גדול בשקלול שלך למדינות עם תל"ג גבוה יותר. לעומת השיטה הראשונה בה בעצם כל היחסים משוקללים בנפרד וכל מדינה מקבלת משקל זהה.
למה כשאנחנו באים להשוות את היחס בישראל היגיוני יותר להשוות את זה למדד שנותן משקל גבוה יותר לארה"ב מאשר ללוכסמבורג, כאשר בעצם כל מדינה מקבלת את ההחלטה כמה חוב לקחת באופן עצמאי (ואין שום רלוונטיות לגודל המדינה בהחלטה הזאת).
כפי שכלכלני האוצר אמרו, יש כאן ללא ספק הטייה אידיאולוגית – לטעמי היגיוני יותר להשתמש דווקא בשיטה הראשונה. אבל זאת כבר יותר שאלה כלכלית מאשר סטטיסטית. הנקודה המרכזית שלי מלכתחילה שאין כאן דרך נכונה סטטיסטית לעשות את זה. כל דרך יכולה להיות נכונה, השאלה איזה מטרה היא באה לשרת.

יוסי לוי [אתר] בתאריך 1/5/2008 8:47:02 AM

תשובה אחרונה בהחלט

השאלה כיצד חשב ממוצע היא שאלה סטטיסטית, לא כלכלית.
יש דרך אחת ויחידה נכונה מבחינה סטטיסטיית
למיצוע – והיא שקלול על פי המכנה.
כמו שבחישוב מהירות ממוצעת יש לשקלל לפי הזמן (שנמצא במכנה של יחס המרחק לזמן) כך במיצוע יחסי חוב תוצר יש לשקלל לפי התוצר, שנמצא במכנה.
כל חישוב אחר הוא שגוי במובן שתוצאתו אינה היחס הממוצע.
לכן, הטענה (הפוסט-מודרניסטית) שכל דרך יכולה להיות נכונה היא טענת הבל.

ילד ירוק [אתר] בתאריך 1/5/2008 11:03:17 AM

פוסטמודרניזם או סמנטיקה?

אם אתה רוצה להמשיך להתעקש על כך שלפי ההגדרה המתמטית היבשה "ממוצע היחס חוב\תל"ג במדינות ה-OECD", צריך להיות משוקלל לפי המכנים. Be My Guest.
אבל זאת ממש "הקטנת ראש", מבחינתי המדד "ממוצע היחסים בין חוב\תל"ג במדינות ה-OECD" הוא מדד יותר רלוונטי להשוואה מאשר המדד הראשון (וההסבר מדוע כבר ניתן בכמה תגובות נפרדות).
אני לא מבין את פשר ההתקטננות על הסעיף הסמנטי בהתעלמות מהשאלה המהותית יותר שהיא איזה מן המדדים רלוונטי יותר.
בשורה התחתונה, האוצר משתמש במדד רלוונטי יותר – ואילו כלכלני ה-OECD משתמשים במדד שמוגדר טוב יותר סמנטית.
אני חושב שאני אלך עם כלכלני האוצר בהקשר הזה.

יוסי לוי [אתר] בתאריך 1/5/2008 3:17:01 PM

כלל וככל לא סמנטיקה

אין זה מקרה שהממוצע הינו סטטיסטי כה נפוץ בדיווח נתונים.
לממוצע יש תכונות מתמטיות לא טריויאליות ועל גבן (ובזכותן) נבנתה תיאוריה המאפשרת הסקה סטטיסטית מנתונים. למדדים סטטיסטיים אחרים (כגון החציון, או אותו "ממוצע יחסים" מוזר שאתה וכלכלני האוצר כה מחבבים) אין את התכונות האלה, ולכן הסקת מסקנות על פי מדדים אלה אינה אופטימלית.

ילד ירוק [אתר] בתאריך 1/6/2008 9:47:46 PM

טוב זה כבר באמת לא רציני

אתה קושר לממוצע איזשהן סגולות פלא לא ברורות לחלוטין שהופכות אותו למדד הכי רלוונטי בכל מצב? (אני יכול לתת לך מספיק דוגמאות שבהם זה לא נכון, קח לדוגמה את החיציון של המשכורות כמשקף טוב יותר את מצב העושר בחברה מאשר את הממוצע).
נימוקים והתייחסויות לגופו של עניין יהיו יותר רלוונטיות כאן, אם אתה חושב שממוצע משוקלל יהיה נכון יותר ממוצע יחסים, אתה צריך להסביר מדוע. אני כבר הסברתי מדוע ממוצע יחסים טוב יותר – אתה יכול להתחיל מלהתמודד עם הטיעונים שלי.

יוסי לוי [אתר] בתאריך 1/6/2008 10:33:09 PM

מילה אחרונה בהחלט (שלי)

ילד ירוק,
אני חושש שהדיון הזה הדרדר, ואני, בכל אופן, לא מוכן להמשיך אותו.
אני מציע שתפנה לאוניברסיטה הקרובה למקום מגוריך, תלמד שנתיים סטטיסטיקה, ואחרי שתסיים את קורס שנה ב הנקרא "תיאוריה סטטיסטית" יהיה לנו בסיס משותף מינימלי להמשך הדיון.
כל טוב.

ילד ירוק [אתר] בתאריך 1/7/2008 8:13:13 PM

קודם כל אני מתנצל

ההתנסחות שלי הייתה אכן לא הולמת ונכתבה בעיקר מתוך קלות דעת ותחושה רגעית, ועל כך אני מצטער.
מצד שני, אני סבור שאתה "נפטר" ממני קצת מהר מדי. בתואר שלי למדתי שלושה קורסים של סטטיסטיקה טהורה, מעבר לזה בשביל העשרה עשיתי את הקורס "הפילוסופיה של ההסתברות" (סילבוס כאן:
http://www.tau.ac.il/humanitie….llabi/science_philosophy.html)
(ואפילו אם יורשה לי להתרברב, קיבלתי את הציון הכי גבוה בקורס)
לא שאני רומז שהידע שלי משתווה לשלך, אבל דווקא בגלל זה – וכקורא ותיק של הבלוג שלך ושמחזיק ממך כבר סמכא בתחום הסטטיסטי הרגשתי במהלך הדיון הזה שהטיעונים שלך היו יותר ברוח מטיפה מאשר ברוח של התדיינות אמיתית, ומכך למען האמת התאכזבתי קצת.
מעבר לזה, אני מקווה שתסלח לי על גסות הרוח בהודעה הקודמת.
יום נעים.

דוגמא נגדית בתאריך 3/4/2008 12:57:19 AM

צר לי על האיחור בתשובה,

העניין הוא שעמית למקצוע (מתמטיקה) סיפר לי על איזה ד"ר לסטטיסטיקה שפרסם איזו שטות באתרו בעניין ממוצעים משוקללים. הוא די הופתע כששאלתי אותו "האם זה יוסי לוי?". המשכנו לדון למשך דקה בקשקוש המקושקש הנ"ל וזהו בעצם.
מעבר לכך, אני רוצה רק לבקש ממך יוסי להסיר את הזבל הזה מאתרך. לא משום שאני נפגע באופן אישי מהקשקוש הזה, אלא שנראה לי שאתה עשוי להיפגע ממנו.
ואה, כן – אתה יכול אולי לספר לנו היכן אתה מועסק? אני פשוט רוצה לנסות ולהימנע ככל הניתן משימוש בתכשירים שמפתחת חברה שמעסיקה אדם שלא מבין מה המשמעות של תוחלת מותנית (וגם לא שהקשר בין דרך וזמן למהירות אינה מנה פשוטה אלא נגזרת)….

יוסי לוי [אתר] בתאריך 3/4/2008 8:27:43 AM

מר דוגמא נגדית

אני מאחל לך בריאות, ומודה לך על הדאגה למוניטין המקצועי שלי.
הייתי מציע לך לדאוג למוניטין המקצועי שלך, למרות שאתה עושה זאת בצורה לא רעה בכלל (על ידי הסתתרות מאחורי כינוי אנונימי).

דוגמא נגדית בתאריך 3/5/2008 11:52:43 PM

יוסי יקירי,

אני לא מסתתר מאחורי שום כינוי. זהו שמי כאן באינטרנט (תתעורר – זו המאה ה-21).
מעבר לכך – אני בהחלט מתכוון לדאוג ליוקרתך המקצועית, ואעשה זאת באופן הבא: מחר בבוקר אני מתכוון לתלות אצלנו במכון (למתמטיקה…) את יצירת הפאר שפרסמת כאן, כדי שכמה שיותר אנשים יתוודעו לגאונות הצרופה הזו!

יוסי לוי [אתר] בתאריך 3/6/2008 9:44:26 AM

תיהנה

רק תוודא שכולם שם אצלכם ידעו מי אתה, כדי שיראו שאתה לא יודע לחשב מהירות ממוצעת.

גילי נחום [אתר] בתאריך 3/10/2008 2:12:58 AM

עצוב לראות שהדיון הדרדר לרמה זו

נראה לי שאפשר לפטור את הוויכוח בתור ויכוח סמנטי ותו לא.

יוסי לוי [אתר] בתאריך 3/11/2008 3:30:55 PM

כן, גם אני מצטער

ומתנצל שנגררתי

יוסי לוי [אתר] בתאריך 3/11/2008 3:37:20 PM

בעניין הקשר בין דרך וזמן למהירות

נכון שאם מסתכלים עלאת המרחק שנגמא כפונקציה של הזמן, אז הנגזרת של הפונקציה הזו (אם היא קיימת) מבטא את המהירות של הגוף הנע כפונקציה של הזמן. אבל, והאבל הזה הוא גדול מאוד, מדובר במהירות הרגעית של הגוף. ןאם מעוניינים במהירות הממוצעת, ולא במהירות הרגעית, אז הביטוי הגיאומטרי.מתמטי הראוי הוא לא ה(פונקציה) הנגזרת, אלא… תחשבו בעצמכם.
ומלבד זאת, מי שמכיר את הגדרת הנגזרת יודע בודאי שהנגזרת היא גבול של מנה. ואם מסתכלים על המרחק כפונקציה של הזמן, אז במנה הזו מופיע מרחק במכנה, וזמן במונה. במלים אחרות, הקשר בין הדרך, הזמן והמהירות, מבוטא על ידי מנה. זו המציאות.

נשלח: 8 בדצמבר, 2008. נושאים: מה אומרת הסטטיסטיקה.
תגובות: 1 | טראקבק

ממוצע פוליטי

העורך הכלכלי של ידיעות אחרונות, סבר פלוצקר, מפרסם ב"בלוג"באתר ווינט חלק ממאמריו שהופיעו במהדורה המודפסת של העיתון. אני לא יודע מהם השיקלים לפיהם מוחלט מה מפורסם גם ברשת ומה לא, אבל אני מצטער על כך שלא פורסם הקטע שהופיע בעתון של יום ו האחרון, 23.11.07, תחת הכותרת "הממוצע הפוליטי". אביא כאן את עיקרי הדברים.

פלוצקר עיין בעמוד 29 של החוברת "עיקרי תקציב המדינה 2008" שהוציא משרד האוצר. בעמוד זה הופיע גרף שכותרתו "החוב הציבורי – השוואה בינלאומית, אחוזי תוצר 2006". עבור 28 מדינות מוצג היחס בין החוב הלאומי לתוצר הלאומי. ביפן היחס הזה הוא בערך 180% וזה ממש לא טוב. בלוקסמבורג היחס הוא פחות מ-10%, וזה מעולה. בישראל היה היחס הזה כ-87%. בעמודה הופיע עוד נתון אחד – היחס הממוצע במדינות OECD, ונאמר כי הוא שווה ל-58%. כלומר – המצב בישראל הרבה יותר גרוע מאשר במדינות OECD. יש רק בעיה אחת בנתון האחרון – הוא לא נכון.

הגרף שופיע בחוברת משרד האוצר, עם הנתון שמתאים לאידיאולגיה של האוצר - בעמודה הירוקה

הגרף שופיע בחוברת משרד האוצר, עם הנתון שמתאים לאידיאולגיה של האוצר – בעמודה הירוקה

פלוצקר בדק ומצא כי ארגון OECD בעצמו פרסם כי היחס הממוצע בין החוב לתוצר במדינות הארגון הוא 77%, כלומר, מצבנו לא הרבה יותר גרוע ממצב מדינה ממוצעת בארגון היוקרתי הזה.
אז איך משרד האוצר הגיע לממוצע שלו? הם לקחו את נתוני 28 המדינות החברות בארגון, חיברו, וחילקו ב-28. על ממוצע משוקלל הם לא שמעו שם. ליפן יש אותו משקל ואותה חשיבות כמו ללוכסמבורג. ארה"ב שווה במשקלה לאיסלנד, וגרמניה וניו-זילנד חד הם. OECD חושב שצריך לשקלל את המדינות על פי התוצר הריאלי שלהן, אבל אנשי משרד האוצר סבורים שחישוב ממוצע משוקלל הוא "הטיה אידיאולוגית". זה לא מפתיע – הרי הכל יודעים כי אידיאולוגיה היא עניין של גיאוגרפיה.

פורסם לראשונה באתר "רשימות" בתאריך 27 בנובמבר 2007 שם התקבלו 16 תגובות

ערן [אתר] בתאריך 11/27/2007 11:48:22 PM

הקלות הבלתי נסבלת של משחק בנתונים

אני לא יודע מה יותר עצוב, הקלות שבה גופים ממשלתיים עושים לנו מניפולציות או העובדה שכמעט אף אחד בודק את הנתונים שלהם.

אייל ב. ד בתאריך 11/28/2007 12:08:53 AM

לא אוהבים לשכלל?

אם אינני טועה, לפני זמן מה עלתה תלונה בדיוק הפוכה – על הטייה של האוצר ע"י שימוש בממוצע משוכלל כדי לחשב ממוצע הוצאה כאחוז מהתמ"ג (כמדומני), שמיקמה את ישראל במקום גבוה כי ניתן משקל יתר לארה"ב וסין.
בכל מקרה, ניתן לראות כי בניגוד לטענה הרווחת, נתונים לא מדברים בעד עצמם. אפשר גם לראות שהבעיות של שימוש בממוצע משוכלל מתאיידות משום מה כאשר השימוש תואם את האידיאולוגיה של האוצר.

אייל ב. ד בתאריך 11/28/2007 12:14:24 AM

ללא נושא

סליחה, נזכרתי – הנתון היה לגבי נטל המסים הממוצע ביחס לתמ"ג.

שמעון בתאריך 11/28/2007 5:13:19 AM

ללא נושא

ממליץ בחום לקרוא את טאפטי.

יוסי לוי [אתר] בתאריך 11/28/2007 9:19:21 AM

לאייל ב.ד.

לא ממש הבנתי את כוונתך, האם תוכל לפרט? וכמו כן – האם תוכל להפנות אל התלונה ההפוכה שהזכרת?

שחר בתאריך 11/28/2007 10:13:06 AM

ממוצע משוקלל

יוסי,
הנה לינק למאמר בהעוקץ, שבו תלונה הפוכה לשלך.
הוא מתלונן על כך שכשהאוצר משווה את נטל המס הוא משתמש בממוצע משוקלל.
http://www.haokets.org/mail-message.asp?ArticleID=2269

יואב בתאריך 11/28/2007 12:10:53 PM

ללא נושא

ברור למה ממוצע פשוט הוא לא נכון, אבל השאלה שאני לא מבין היא איזה משקול הוא הנכון. אולי, נשאל את זה אחרת, למה ממוצע פשוט נותן מספר נמוך יותר מממוצע משוקלל? האם יש סיבה שלמדינות גדולות (בכלכלה או באוכלוסיה) יהיה יחס גדול יותר ממדינות קטנות (שים לב שבריטניה ויפן מובילות, מצד שני, ארה"ב, קנדה, גרמניה וצרפת נמצאות באמצע)? אם כן, אז המספר עצמו חסר משמעות, והמספר הנכון הוא היחס בין היחס הזה למספר אחר שמייצג את הגודל של המדינה. אולי, מה שנכון לעשות זה ממוצע אחרי שמוציאים את החריגים (יפן ובריטניה), ואז ההבדל בין הממוצעים השונים לא יהיה כל כך משמעותי. בכל מקרה, לא השתכנעתי שה-77% ממוצע הוא האידיאל של המדינות המפותחות.

אייל ב. ד בתאריך 11/28/2007 1:06:05 PM

תודה לשחר!

חיפשתי וחיפשתי את הלינק, ושחר מצא אותו.

יוסי לוי [אתר] בתאריך 11/28/2007 1:24:35 PM

תשובה לשחר

תודה על הלינק. אני כמובן לא אחראי לכל מה שנכתב ברשת. בכל מקרה, אקרא את מה שנכתב שם ואחשוב על כך.
בעקרון, ממוצע משוקלל הוא הממוצע שיש להשתמש בו, אבל בתנאי שמשתמשים במשקלות הנכונים. אני מתכוון לכתוב על כך רשימה בקרוב.

יוסי לוי [אתר] בתאריך 11/28/2007 1:25:44 PM

רמז ליואב – עד הרשימה הבאה

תנסה לחשוב על מהירות ממוצעת.

יואב בתאריך 11/28/2007 2:20:11 PM

ללא נושא

מהירות ממוצעת? חשבתי. עדיין לא הבנתי למה צריך לבחור דווקא בגודל כמשקל.

דודי קינג בתאריך 11/28/2007 7:33:38 PM

השוואה לממוצע של מדינות ככ שונות אבסורדי

אני מאמין שזה מגוחך להתייחס לממוצע הכללי כאיזה שהוא מדד לכלכלה הישראלית, משוקלל או לא משוקלל. בארגון חברות מדינות שהכלכלה שלהן שונה מזו של ישראל כמזרח ממערב, ואין להשוואה אתן או לממוצע שכולל אותן כל משמעות. מה לישראל וללוקסמבורג? מה לישראל ולסין?
ההשוואה הנכונה היא למדינות שגודלן וכלכלתן דומות לאלו של ישראל. אירלנד, למשל. או דנמרק. או פורטוגל. או שוויץ. או ליטא. או יוון. כמובן שכל אחת מהן שונה גם היא מישראל, במובנים רבים, אבל לפחות יש בסיס כלשהו להשוואה, או לממוצע.

מוטי בתאריך 11/28/2007 8:52:51 PM

נטל המס – תשובה לשחר

לפי נתוני בנק ישראל, נטל המס בישראל דומה ואף נמוך מממוצע המדינות המפותחות, אלא שמשרד האוצר, בניגוד לחישוב שיעור החוב, טוען שהממוצע של בנק ישראל הינו ממוצע פשוט, וביחס לנטל המס יש לערוך ממוצע משוקלל המתבסס על מספר אזרחי המדינה.
השאלה אם כן, אינה מי צודק, אלא לאיזה חישוב אוצרי להאמין.

דוגמא נגדית בתאריך 11/29/2007 12:56:46 PM

השאלה שצריך

היה לשאול היא – מה הנתון בעצם אמור להראות?
החישוב של ארגון המדינות המפותחות מראה מה היחס בין החוב הכולל לתמ"ג הכולל. זה מאוד נחמד, אבל זה לא יכול לתת לנו מושג על ערכי החוב המקובלים. אם אנו רוצים ללמוד על ערכי החוב המקובלים. גם ממוצע משוכלל לא בהכרח יאמר לנו מהם ערכי החוב המקובלים במדינות שונות, אולם הוא יאמר הרבה יותר מהנתון של ה-OECD.
ובאותו עניין – אני מסכים עם דודי. צריך להסתכל על מדינות שגודלן וכלכלתן דומות.
במדינות הללו החוב הוא נמוך בהשוואה לישראל, וזה כל הסיפור!

נועה [אתר] בתאריך 4/24/2008 12:30:00 PM

איך מסמנים ממוצע

אני צריכה לעשות עבודה בממוצע אבל שכחתי את סימן הממוצע,
מישהו יכול להגיד לי בבקשה!!

נשלח: 8 בדצמבר, 2008. נושאים: כלכלה וחברה, מה אומרת הסטטיסטיקה, סטטיסטיקה רעה, על סדר היום.
תגובות: אין | טראקבק

מכתבים למערכת

להלן מספר מכתבים מעניינים שקיבלתי בתקופה האחרונה, ותשובותיי

איפה הכסף?

יובל כותב:
שלום, עקבתי אחר המאבק המוצדק שלך ברעיון להעלאת שכר הלימוד, וחשבתי שאולי תתעניין בכתבה הבאה. על פי הכתבה, קרן קיסריה שבבעלות משותפת של הברון רוטשילד והמדינה קיבלה ומקבלת הטבות מס עצומות, וכן סיוע בהשתלטות על קרקעות מדינה יקרות, אך מתחמקת מהתחייבויות לתמוך בהשכלה הגבוהה. התחיבויות אלו אינן "נדבה" של הקרן אלא הסיבה שהיא מקבלת את ההטבות ואת השליטה על אדמות מדינה כה יקרות. אולי אם במשרד האוצר היו לוקחים את הכסף המגיע להשכלה הגבוהה משם לא היה צורך לשלוח את ידי האוצר לכיסי הסטודנטים. בברכה, יובל

יובל,
הכתבה מדברת בעד עצמה. רבות מהבעיות שניצבות בפנינו, ובמיוחד סוגיית עתיד ההשכלה הגבוהה, אינן בעיות כספיות – יש הרבה כסף ציבורי פנוי להשקעה. טיפוח האקדמיה וההשכלה הגבוהה היא השקעה לכל דבר, ואף השקעה משתלמת במיוחד, כפי שכבר הבהרתי ברשימות קודמות שכתבתי כאן. מהכתבה מתברר שלאידיאולוגיה הניאו-ליברלית הקיצונית והמנטאליות של ניהול חנות מכולת השוררות בממשלתנו, חברה גם שחיתות פשוטה. זו ארצנו.

עץ או פלי?

איתי כותב:

אהלן יוסי, אני קורא את הרשימות שלך באופן קבוע ואני מאד נהנה מכך. יש לי שאלה שאני בטוח ששמעת עשרות פעמים בעבר,אך אני נאלץ לשאול אותה שוב, בשביל לסיים ויכוח עם חבר. נניח שיש מטבע שהסיכוי שלו לעץ ופלי הוא שווה, חצי וחצי. נניח שהטילו את המטבע עשרים פעמים ובכולם יצא פלי – האם: יש הבדל בין הסיכוי לעץ והפלי בהטלה ה 21 ? אחד מאיתנו אומר – ששניהם 50% וזה ממש לא משנה מספר ההטלות לפני לכן זה לא משנה אם הוא יאמר עץ או פלי שניהם באותו סיכוי בדיוק. השני אומר ששניהם 50% אבל בגלל שהסיכוי שרצף הטלות הפלי ימשיך, יורד אחרי כל הטלה נוספת, הוא היה מעדיף להמר על העץ אשמח לשמוע מקור בר סמכא שיפתור את המגבלות ההסבר והידע שלנו בנושא סטטיסטיקה והסתברות תודה רבה !
איתי,

אם המטבע אכן הוגן (סיכויים שווים לעץ ולפלי) אז גם בהטלה ה-21 הסיכויים שווים. השחקן שמטיל את המטבע זוכר את רצף ההטלות שהתקבל, אך למטבע עצמו אין זכרון. בתי קזינו מנצלים את זה כדי לעשות כסף. האסטרטגיה האופטימלית בהימור, למשל ברולטה, שם אפשר להמר בכל פעם על אדום או שחור, למשל, היא להגריל בכל פעם את הצבע עליו אתה מהמר. מי שיתפתה לעקוב אחרי סדרות ועל ידי כך יסטה מהאסטרטגיה האופטימלית, ירוויח פחות (או יותר נכון: יפסיד יותר).

אבל שאלה יותר מעניינת היא: אם אתה לא בטוח שהמטבע הוגן – מה הסיכוי שתמשיך להאמין בכך אחרי 20 הטלות רצופות של פלי? ומה אם ההטלה ה-21 תהיה בכל זאת עץ? מה תהיה עכשיו הערכתך לסיכוי של המטבע ליפול על פלי? יש ענף שלם בסטטיסטיקה שמנסה לענות על שאלות כאלה – סטטיסטיקה בייסיאנית. הסטטיסטיקאי הבייסיאני יאמר לך כי לאחר 20 הטלות רצופות של פלי, הוא לא מאמין כי המטבע הוגן, אלא כי ההסתברות שלו ליפול על פלי היא 0.954 בערך (שזה 21 חלקי 22). באם בהטלה ה-21 אכן יצא עץ, הוא יעדכן את ההסתברות של המטבע לפילו על פלי ל-0.913 וכן הלאה.

הסטטיסטיקה הבייסיאנית היא עולם בפני עצמו, והידע שלי בתחום מועט יחסית. אני מתכוון כבר זמן רב להקדיש רשימה לנושא, אבל לא מצליח להגיע לזה. אציין רק שלתחום יש יישומים רבים בתחומים מגוונים, החל במדעי המחשב וכלה בתכנון ניסויים קליניים.

דאבל לוטו

a8145060, שמנהל את הקומונה המעניינת לוטו ומשחקי מפעל הפיס בתפוז כותב:

הנה רעיון חדש לכתיבה באתר שלך. מפעל הפיס דאבל לוטו משחק הפיס הוציא משחק חדש,בשם דאבל לוטו, אם משתתפים במשחק במידה שזכית,סכום הפרס מוכפל פי 2. גם מחיר הטבלה מוכפל פי 2 והוא עומד על 5.4 ש"ח ומה כל זה אומר? אותי לימדו בסטטיסטיקה שאם הכל מוכפל פי 2 אז התוחלת נשארת אותו הדבר, כלומר אותו ,ותסלחו לי, זבל של משחק ששום דבר לא השתנה בו OK דבר אחד השתנה אנשים מוכנים לשלם על טבלת לוטו מחירים שעוררים ביחס לעולם. בעולם מחיר טבלת משחק כמו לוטו שווה דולר והפרס הנמוך ביותר שווה ל10 דולר בערך
תשובה,

השתנה הרבה מאוד. אם כולם יבחרו באופציית ההכפלה, אז תוחלת הזכייה (או יותר נכון, תוחלת ההפסד) גם היא תוכפל פי שתיים, וזה משמפעל הפיס רוצה בסופו של דבר. יותר הימורים, בסכומים גבוהים יותר, משמעותם רווחים גדולים יותר למפעל הפיס (והפסדים גבוהים יותר למהמרים).

סופר לוטו

חנוך כותב
למר לוי שלום שמי חנוך, וקראתי באתר כמה מהמאמרים שלך, בימים אלו אני עומד לפתוח במדינה מסויימת חברה להגרלות לוטו, מכיוון שכך הייתי מעוניין לקבל ממך מספר שיעורים בנושא (במידה ואתה יכול לעשות את זה) לגבי הסיכויים בהגרלות סטטיסטיקות וכל מה שקשור לנושא. אני מקוה שיש באפשרותך לעזור לי בנושא… בכבוד רב חנוך

שלום חנוך,

יש רק דרך אחת לעשות כסף מלוטו, ואתה עלית עליה – יש רק מרוויח אחד בלוטו – וזה מי שמפעיל אותו. אני מאחל לך הצלחה. עם זאת איני עוסק בייעוץ פרטי, ולכן לא אוכל לעזור לך, למרות הפיתוי הכספי הגדול (הייתי מבקש אחוזים, כמובן….)

איך לעשות כסף מסטטיסטיקה

רובי כותב
שלום שמי רובי ואני מאוד רוצה שתעזור לי או תכוון אותי למישהוא שיוכל לעזור לי במימוש חלומותי. אני מאמין שבעזרת סטטיסטיקה והסתברות אפשר לעשות כסף אני פשוט לא יודעה איך לשלב את הנוסחאות עים הנתונים שיש לי. מודה לך מראש רובי

רובי,

ראה תשובתי לחנוך. יש עוד דרכים לעשות כסף מסטטיסטיקה מלבד ניהול עסקי הימורים – אתה יכול למשל גם לפתוח חברת ביטוח (אופס, זה בעצם אותו דבר – הנה נושא לעוד רשימה) או קרן פנסיה. גם אני עושה כסף מסטטיסטיקה, דרך אגב. אמנם לא מיליונים, אבל בהחלט חי בכבוד.

פורסם לראשונה באתר "רשימות" בתאריך 10 באוקטובר 2007 שם התקבלו 13 תגובות

גיל [אתר] בתאריך 10/10/2007 11:37:26 PM

הסטטיסטיקה הבייסיאנית תשתלט בסופו של דבר

על הססטיסטיקה השכיחותית (זו המילה הנכונה לfrequencies?). כבר היום יש מעבר של יותר ויותר כתבי עת לסטטיסטיקה בייסינאית, ובעיקר הפחתה בחשיבותם של מבני מובהקות. מבחני מובהקות לא ממש בודקים את ההשערות שאנחנו מעוניינים בהם בצורה ישירה מה שהסטטיסטיקה הבייסינאית כן עושה. יש לה כמובן גם חסרונות והיא יותר קשה ל"עיכול" אבל אני חושב שהיא תנצח בעוד דור או שניים.

יובל אחר בתאריך 10/11/2007 8:45:16 AM

בעניין קרן קיסריה

נראה לי שיובל מסתמך על הכתבה הזו.

לשם ההגינות, יש לציין שקרן קיסריה תרמה למספר מוסדות השכלה גבוהה (ביניהם אוניברסיטת חיפה והאוניברסיטה הפתוחה).
למיטב הבנתי הויכוח הוא על שיעור התרומות, ולא על האם הן קיימות.

עופר בתאריך 10/11/2007 9:32:47 AM

ללא נושא

ברולטה אין שום הבדל בין להמר על אותו צבע כל הזמן או להגריל את הצבע כל פעם מחדש. בכל מקרה תוחלת הרווח (ליתר דיוק ההפסד …) היא קבועה.
אם אתה מחויב להמר ברולטה, נאמר על סכום מצטבר של 1000 שח ,האסטרטגיה הטובה ביותר היא להמר על כל ה1000 שח ביחד ולא לחלק אותם להרבה הימורים קטנים.תוחלת הרווח לא משתנה אבל ההסתברות שתזכה דווקא גדלה (חוק המספרים הגדולים לא משפיע)

דני [אתר] בתאריך 10/11/2007 4:46:40 PM

שתי הערות

קודם כל, אני מסכים עם עופר לגבי ההימור ברולטה. בניגוד למה שכתבת, כל עוד הרולטה אכן אקראית ואתה מהמר בסכום קבוע בכל סיבוב – אין משמעות לבחירת אסטרטגיית ההימור שלך.
דבר שני, לא הבנתי את החישוב הביסייאני שעשית. הבעיה בסטטיסטיקה בייסיאנית היא שכדי להעריך את ההסתברות הפוסטריורית (http://en.wikipedia.org/wiki/Posterior_probability) אתה צריך לדעת את ההסתברות הפריורית (http://en.wikipedia.org/wiki/Prior_probability), וזאת כמעט אף פעם לא ידועה כשבודקים השערות בעולם האמיתי. למשל, במקרה של הטלת המטבע אתה צריך לדעת את ההסתברות הפריורית שהמטבע מוטה לפלי בכל הסתברות שהיא (זו לא טעות… הכוונה היא להסתברות שמשהו יקרה בהסתברות).
למשל, תדמיין מצב שבו אומרים לך שיש שתי ערמות של מטבעות, אחת נופלת על פלי בסיכוי 90% ואחת נופלת על פלי בסיכוי של 10%. במקרה אחד בוחרים בסיכוי 50-50 מבין שתי הערמות האלה ואז מבצעים את הניסוי שמתואר בשאלה, ובמקרה השני בוחרים בסיכוי 75-25 מבין שתי הערמות (לטובת הראשונה) ואז ממבצעים את הניסוי.
ברור שבכל אחד מהמקרים האלה ההערכה שתינתן (אחרי הניסוי) למידת ההטיה של המטבע ע"י סטטסיטיקאי בייסיאני תהיה שונה. לכן, לא ברור לי מה ההסתברות הפריורית שהשתמשת בה עבור החישוב שעשית. אם השתמשת בהסתברות אחידה לכל הטיה – לא ברור בכלל מדוע זה הדבר הנכון לעשות.

יוסי לוי [אתר] בתאריך 10/22/2007 3:19:06 PM

תשובה לדני

החישוב הבייסיאני שערכתי מתבסס על התפלות אפריורית אחידה של ה-p- על הקטע [0,1[
כמובן שההנחה על ההתפלגות האפריורית היא בעייתית – זו אכן הביקורת העיקרית על הגישה הבייסיאנית, ולכן אני סבור, בניגוד לגיל, שהסטטיסטיקה הבייסיאנית לא "תנצח" בסופו של דבר.

יוסי לוי [אתר] בתאריך 10/22/2007 3:21:52 PM

ועוד תשובה לדני

בעניין אסטרטגיות ההימור: אכן, יש כמה אסטרטגיות שמביאות לאותה תוצאה "אופטימלית" – כלומר ממזערות את תוחלת ההפסד (ואני מתעלם כאן מהאסטרטגיה של המנעות מהימור). אסטרטגיה הלוקחת בחשבון את תוצאות העבר אינה אופטימלית.

דני [אתר] בתאריך 10/28/2007 2:25:11 AM

שאלה

אוקי, עכשיו סיקרנת אותי 🙂
בהינתן שמהמרים בכל סיבוב רולטה על סכום קבוע, תוכל בבקשה להסביר (או לתת הפניה) מדוע אסטרטגית הימור שבה מגרילים אדום או שחור מביאה לתוחלת רווח שונה מאסטרטגיה שבה בוחרים תמיד אדום, למשל? (או לחילופין, כל פונקציה שהיא על הטלות עבר)
על פניו נראה לי שתוחלת הרווח תהיה זהה בכל אחד מהמקרים, כיוון שתוצאת הרולטה אקראית.

אסף ברטוב [אתר] בתאריך 10/28/2007 9:41:06 AM

סטטיסטיקה בייסיאנית

אוסיף ששימוש נפוץ ומוצלח בסטטיסטיקה בייסיאנית בחיי היום-יום של רובנו הוא מנגנוני הסינון של דואר הזבל ("ספאם") שמסווגים דואר לפי הסתברות. ממציא היישום הזה של ס' בייסיאנית הוא פול גראם (Paul Graham).

אלעד בתאריך 11/8/2007 4:56:39 PM

השתגענו?!

בתור דוקטור למדמ"ח, שעוסק בהשתברות לא מעט, אני מסכים עם דני וחושב שיוסי לוי טועה. יוסי טען ש"אסטרטגיה הלוקחת בחשבון את תוצאות העבר אינה אופטימלית.". זה נראה שגוי לחלוטין. לא משנה אם בכל שלה בוחרים להמר על אדום או שחור, בלי תלות בהיסטוריה יש הסתברות בדיוק שווה לזכות בכל מקרה. לכן, גם אם ההחלטה שלנו על איזה צבע להמר תלויה בהיסטוריה, עדיין זה לא משנה ותוחלת הזכיה נשארת שווה.

יוסי לוי [אתר] בתאריך 11/10/2007 5:42:58 PM

תשובה לאלעד ולדני

במקום לצעוק שאני טועה, אני מזמין את כל מי שמעוניין להציג אסטרטגיית הימור שתשיג תוצאה טובה יותר (בתוחלת) מהאסטרטגיה לפיה בכל הימור בוחרים את הצבע עליו מהמרים בהסתברויות שוות לאדום ושחור.

דני [אתר] בתאריך 11/20/2007 4:43:42 AM

ובכל זאת

היי יוסי,
מדי פעם אני חוזר לפוסט הזה כדי לבדוק האם התחדש משהו בסוגית הרולטה (מסקרנות… אני אשמח להיות מופתע ולגלות פתרון שלא חשבתי עליו).
התגובה האחרונה שלך לא ברורה לי. הטענה של עופר, שלי ושל אלעד היא לא שיש אסטרטגיה טובה יותר מהימור בהסתברויות שוות, אלא שכל אסטרטגיה טובה באותה מידה.
למשל, תוחלת הרווח אם תהמר תמיד על אדום זהה בדיוק לתוחלת הרווח אם תהמר בכל פעם באקראי, וזו זהה בדיוק לתוחלת הרווח אם תהמר בהתאם לכל פונקציה שהיא על תוצאות העבר – כמובן, כל זאת בהנחה שהרולטה אכן אקראית ושמהמרים בכל סיבוב באותו סכום קבוע (הנק' האחרונה חשובה, למשל, כדי להמנע מפרדוקס סט. פטרסבורג).
בקיצור, אני טוען כי התשובה לאתגר שהעלית בתגובה האחרונה היא שלא קיימת כזו אסטרטגיה. לעומת זאת, אני מזמין אותך (או כל קורא אחר) להציג אסטרטגיה שתשיג תוצאה גרועה יותר מהימור אקראי, ותעמוד בשני התנאים שלמעלה (אקראיות הרולטה, סכום שווה בכל סיבוב).

אלעד בתאריך 11/28/2007 7:02:09 PM

אכן

אכן, גם אני קופץ מדי פעם לראות מה חדש, ואני מצטרף לאתגר של דני (שגם ניסח יפה את ה
setting
כדי להימנע מאי-הבנות).

אלעד בתאריך 11/28/2007 7:02:19 PM

אכן

אכן, גם אני קופץ מדי פעם לראות מה חדש, ואני מצטרף לאתגר של דני (שגם ניסח יפה את ה
setting
כדי להימנע מאי-הבנות).

נשלח: 8 בדצמבר, 2008. נושאים: הימורים, כלכלה וחברה, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק

זכיה נדירה

הידיעה הבאה התפרסמה בתחתית עמוד 19 של "ידיעות אחרונות" ביום רביעי שעבר (19.9.2007):

rare win

אי אפשר להתווכח עם העובדות – לאיש אכן היה מזל. מעניין אותי לדעת כמה אנשים הרגישו שלמספרים שלהם יש מזל ועקב כך הימרו עליהם בסכומים גבוהים, ולא זכו. את הנתון הסטטיסטי הזה, אני מניח, מפעל הפיס לא יספק לנו.

פורסם לראשונה באתר "רשימות" בתאריך 23 בספטמבר 2007 שם התקבלו 6 תגובות

גיל [אתר] בתאריך 9/23/2007 8:37:16 AM

לא הבנתי מה המזל בזה

מה זה משנה אם הוא שלח טופס אחד אם אותם מספרים או טפסים שונים? בסופו של דבר הוא היה זוכה באותו פרס כי הוא מתחלק בפרס הגדול עם עצמו לא? (אלא אם כן יש זוכים נוספים בפרס הראשון).

שגיאB [אתר] בתאריך 9/23/2007 9:56:10 AM

לי זה ישר הדליק אור אדום!!!

מי ממלא 20 טפסים עם אותם מספרים?

עידו בתאריך 9/23/2007 9:59:44 AM

לגיל

בהגרלת 777 הפרס הראשון הוא 70,000 על ניחוש כל המספרים. הפרס לא מתחלק בין הזוכים (כלומר, אם יש כמה כרטיסים זוכים אז כל אחד מכרטיסים זוכה ב-70,000 ש"ח).

יוסי לוי [אתר] בתאריך 9/23/2007 10:23:10 AM

תשובה לגיל

קל לודא שגם אם הפרס הראשון מתחלק בין כמה זוכים, עדיין מי שישלח שני טפסים זהים יזכה ביותר כסף (למשל, אם יש שני זוכים, הם יתחלקו חצי חצי, אבל אם אחד משני הזוכים שלח זני טפסים הוא יקבל שני שליש והזוכה השני רק שליש.

אורי כהן בתאריך 9/23/2007 1:23:15 PM

באמת נראה כמו התקפת מידע פנימי

אם מישהו גילה כי אפשר לרמות בהגרלת 777, ככה בדיוק זה אמור להראות:
– 777 היא הגרלה קטנה, בניגוד ללוטו, ולכן ייתכן שיש למפעל הפיס פחות מנגנוני הגנה.
– הוא מרוויח בה הרבה יותר משמפעל הפיס חוזה שמישהו ירוויח, וזה כבר נראה מספיק
כדי לשלם למי שעזר לו לרמות (שמסכן את משרתו + כמה שנים בכלא). עבור עשרות אלפי שקלים זה לא סביר, עבור מאות אלפי- אולי.
כמובן אין לי מידע… אם אני מפעל הפיס הייתי שוכר חוקר פרטי.

a81450606 בתאריך 10/8/2007 2:51:06 PM

הסתבריות פיס 777

באתר הזה תמצאו את ההסתבריות למשחק פיס 777
http://www.johnph77.com/keno/israel.html
השורה התחתונה היא שהתוחלת המשחק היא 60% בקירוב
פיס 777 הוא אחד מן המשחקים הרווחים של הפיס (מחוץ הלוטו)
מעוינינים בפורום לוטו?
http://www.tapuz.co.il/Communa/usercommuna.asp?CommunaId=2160

נשלח: 8 בדצמבר, 2008. נושאים: הימורים, מה אומרת הסטטיסטיקה.
תגובות: אין | טראקבק