נסיכת המדעים » קבלת החלטות

ארכיב עבור תגית קבלת החלטות

"המחשב טעה. שלא תדעו עוד צער."

האם מקצוע הרדיולוג עומד להיכחד? האם אלגוריתמים של בינה מלאכותית, כגון רשתות נוירונים, יחליפו את הרדיולוגים, ובהמשך את שאר הרופאים? ואיך כל זה קשור למכוניות אוטונומיות?

כל השאלות האלה עלו בעקבות פוסט בבלוג Toward Data Science שפרסם יו הארווי, רופא המתמחה ברדיולוגיה. הארווי טוען כי האלגוריתמים לא יחליפו את הרדיולוגים בעתיד הנראה לעין, אם בכלל. בדיון בקבוצת Machine & Deep learning Israel בפייסבוק הופיע הפניה לפוסט של לוק אוקדן-ריינר, גם הוא רופא המתמחה ברדיולוגיה. הפוסט של אוקדן-ריינר מתייחס למאמר שפורסם ממש לפני כמה חודשים (נובמבר 2017), מאת רג'פורקאר ועמיתיו, שתיאר אלגוריתם לפענוח תצלומי רנטגן. בין העמיתים החתומים על המאמר זה נמנה אנדרו אנג, מה שמחייב התייחסות רצינית ביותר למאמר.

ברשימה זו אביא את דבריהם של הארווי ואוקדן-ריינר, ואתייחס למאמר של רג'פורקאר. כמו כן, אומר מה לדעתי צריכים להיות הקריטריונים לפיהם יהיה ניתן לקבוע כי אלגוריתם כזה יכול להחליף רופא מומחה. בנוסף אענה באופן מסודר לטענות (הטובות) שהועלו בקבוצת הפייסבוק. ((עם זאת, לא אתייחס לטענה "תן תמונה היום לעשרה רדיולוגים ותקבל 11 חוות דעת" ))

זוהי רשימה ארוכה במיוחד. חילקתי אותה למספר פרקים כשלכל פרק כותרת נפרדת, כדי שתוכלו לדלג על הפרקים שלא מעניינים אתכם.

הארווי: אינטליגנציה מלאכותית לא תחליף את הרדיולוגים

ד"ר הארווי, שכנראה לא היה מודע למאמר של ראג'פורקאר כשכתב את דבריו ((שכן הוא לא התייחס אליו)) משיב לטענתו של ג'פרי הינטון, מומחה לרשתות נוירונים, שאמר כי "ברור שצריך להפסיק להכשיר רדיולוגים". הוא מביא שלושה טיעונים כתשובה להינטון.

ראשית, טוען הארווי, כי בניגוד לאלגוריתם, הרדיולוג עושה יותר מאשר להביט בהדמיות ((כגון תצלומי רנטגן, סריקות CT ו-MRI, ועוד)). הארווי מתאר בפירוט את תפקידיו של הרדיולוג בתהליכי האבחון, שאמנם מתבססים על הדמיות, אך גם על אינפורמציה נוספת. הוא אמנם מסכים כי אלגוריתמים למיניהם עשויים לסייע ולשפר כמה תחנות בתהליך האבחוני, אך אינם יכולים להחליף את שיקול הדעת של הרופא.

הנימוק השני של הארווי הוא שבסופו של דבר מי שנושא באחריות הסופית הם בני אדם. הארווי מציג אנלוגיה בין התעופה ובין הרפואה (לא מוצלחת, לדעתי), אולם בסופו של דבר מדגיש את הנקודה המהותית: כשהרופא טועה, ורופאים אכן עלולים לטעות, הרופא אחראי. מי יהיה אחראי במקרה שבו האלגוריתם טעה? האם החברה שמכרה לבית החולים את המערכת שמפענחת תצלומי רנטגן תהיה מוכנה לקחת אחריות על מקרה שבו חולה ימות כי האלגוריתם טעה ולא זיהה כי הפציינט חולה בדלקת ריאות? אולי החולה שהסכים להפקיד את בריאותו בידיו של האלגוריתם (בהנחה שהייתה לו ברירה) אחראי? הרי אף אחד לא יעלה בדעתו שהרופא ששלח את החולה הבייתה כי האלגוריתם אמר שהוא בריא יהיה אחראי. או שכן? הארווי טוען שאף מערכת AI לא תהיה מדוייקת ב-100%. זה נכון, אבל לדעתי הטענה הזו מחלישה את הטיעון שלו. הרי גם רופאים טועים. עם זאת טוען הארווי כי רופאים עשויים לתפקד טוב יותר מאלגוריתם במקרי קצה, וכאן אני נוטה להסכים איתו.

הטענה השלישית של הארווי פחות רלוונטית לנושא של השוואת הביצועים של רופאים ואלגוריתמים רפואיים. הוא טוען כי כאשר יוכנסו מערכות AI למיניהן ויחליפו חלק מהשלבים בתהליך האבחוני, התהליך אכן יתייעל, אולם זה רק ייצור יותר ביקוש לשירותי רדיולוגיה, הביקוש לרדיולוגים יעלה ויגבר הצורך בהכשרת רדיולוגים נוספים.

ראג'פורקאר: האלגוריתם יכול לאבחן דלקת ריאות יותר טוב מהרופאים

הפוסט של אוקדן-ריינר מתייחס למאמר של רג'פורקאר. לכן אסקור בקצרה את הרעיון הכללי של מאמר, ואחר כך אביא את דבריו.

ראג'פורקאר ועמיתיו (שמכאן והלאה אכנה בשם "החוקרים") נעזרו בבסיס נתונים שהכיל יותר מ-100 אלף תצלומי רנטגן של החזה, של כ-38 אלף חולים ב-14 מחלות שונות, וביניהן דלקת ריאות. כל חולה סווג כחולה בדלקת ריאות, או כלא חולה בדלקת ריאות. הנתונים חולקו לפי כל כללי הטקס ((כלומר, באופן רנדומלי)) לשלושה קובצי נתונים נפרדים.

ראשית הם השתמשו בנתונים של כ-29 אלף חולים, ובסך הכל כ-99 אלף תצלומים לצורך "אימון המודל" ((שזה תיאור מרשים לתהליך של אמידת פרמטרים)), כ-3.5 תצלומים לחולה, בממוצע.

לאחר שאימנו את המודל, עברו לקובץ השני, בו היו כ-6400 צילומים של כ-1700 חולים (3.8 צילומים לחולה, בממוצע). בעזרת קובץ זה הם ביצעו תיקוף (ולידציה) של המודל.

לסיום, בחנו את ביצועי המודל על הקובץ השלישי, שהכיל 420 צילומים של 389 חולים (כ-1.08 תצלומי רנטגן לחולה, בממוצע). ((אעיר ואומר כי יש כאן בעיה מסויימת – נתוני הבדיקה שונים באופן מהותי מנתוני האימון והתיקוף.))

בתהליך הבחינה 420 התצלומים נבדקו על ידי ארבעה רדיולוגים מאוניברסיטת סטנפורד שסיווגו את החולים לאחת מ-14 המחלות שהיו בקובץ המקורי, וכמובן שגם האלגוריתם אמר את דברו. לרדיולוגים לא היה כל מידע רפואי על החולים מעבר לתצלומי הרנטגן, וכמו כן הם לא ידעו את השכיחויות של כל אחת מ-14 המחלות בקובץ המקורי. במילים אחרות, היה להם בדיוק את אותו המידע שהיה לאלגוריתם.

החוקרים חישבו לכל אחד מהרדיולוגים, וגם עבור האלגוריתם, מדד ביצוע מקובל בשם F1. (( זהו הממוצע ההרמוני של הרגישות – recall ושל הדיוק – precision. ראו הגדרות בויקיפדיה )) הם הראו כי ההפרש בין המדד שהתקבל לאלגוריתם גבוה ב-0.051 מהמדד הממוצע של ארבעת הרדיולוגים, וכי ההפרש הזה מובהק סטטיסטית (רווח הסמך להפרש ברמת סמך של 95% הוא 0.005-0.084).

החוקרים מודים כי למודל שלהם יש שלוש מגבלות, אך מציינים רק שתיים ((השלישית ירדה בכביסה? יותר סביר להניח כי אחרי מחשבה נוספת הם הגיעו למסקנה כי המגבלה הנוספת שחשבו עליה אינה באמת מגבלה)). ראשית, הנתונים כללו רק צילומי חזה פרונטליים, בעוד שבכ-15% מהמקרים של דלקת ריאות יש צורך גם בתצלומי צד כדי לבצע אבחנה מדוייקת. שלישית ((או בעצם שנית, לא משנה)) , החוקרים מודים כי העובדה שהמודל והחוקרים לא נעזרו בנתונים נוספים, כגון היסטוריה רפואית, פוגעת בביצועים של הרופאים (ושל המודל כמובן).

אוקדן-ריידר: אלגוריתמים הם מגניבים, אבל…

ד"ר אוקדן-ריינר אכן סבור כי נוכל להגיע למצב בו לאלגוריתם יהיו ביצועים שווים לביצועים של רופא אנושי ואף יעלו עליו. עם זאת, הוא טוען כי האלגוריתם של רג'פורקאר אינו מתאים לבצע אבחון רפואי. הסיבה לכך נעוצה, לדבריו, בנתונים של ואנג ועמיתיו, בהם רג'פורקאר ועמיתיו השתמשו לצורך פיתוח המודל.

אוקדן-ריינר טוען כי יש בעייתיות בסיווגים של התצלומים בקובץ הנתונים המקורי של ואנג. לא ברור עד כמה הסיווגים מדוייקים, מה המשמעות הרפואית של הסיווגים, ועד כמה הסיווגים שימושיים לצרכים של ניתוח הצילומים. הוא מציין כי קובץ הנתונים והדוקומנטציה שלו עודכנו מספר פעמים מאז הפרסום המקורי. המאמר שמתאר את בניית הקובץ כמעט ואינו מתייחס להיבטים הקליניים של הנתונים, ומכיל רק פיסקה אחת שמתייחסת לרמת הדיוק של האבחונים שהותאמו לכל סט של תצלומים של חולה אחד.

עד כמה מדויקים הסיווגים? הם התקבלו בשיטות של text mining. הם לא התבוננו בתצלומים. אוקדן-ריינר טוען שרמת הדיוק של הסיווגים בקובץ אינה מספקת. הוא קבע זאת על ידי התבוננות בתצלומים. אמנם לא בכולם, אלא רק במדגם. הסיווגים שלו, כרדיולוג מומחה, היו שונים באופן מהותי מהסיווגים שבקובץ הנתונים.

השאלה השנייה היא מה המשמעות הרפואית/קלינית של הסיווגים. הנה הבעיה: הקביעה האם לחולה יש או אין דלקת ריאות היא קביעה קלינית. צילום רנטגן של החזה הוא נתון התומך באבחון (surrogate measure) ואינו מספיק לבדו לקבוע האם לחולה יש דלקת ריאות, או שה-"עננים" הנראים בצילום הם סימפטום לבעיה רפואית אחרת. המצב בו רואים "עננים" נקרא קונסולידציה. למעוניינים בהסבר רפואי מפורט יותר אני מפנה לפוסט אחר שלו. השורה התחתונה היא שהסיווג של ואנג ועמיתיו במקרה של "עננים" הוא סיווג של יש קונסולידציה או יש דלקת ריאות. אולם, מבחינה רדיולוגית קשה מאוד להחליט מתי קונסולידציה היא דלקת ריאות או משהו אחר. דלקת ריאות היא סוג של קונסולידציה. ההיפך לא נכון. כאשר ואנג ועמיתיו מציינים בנתונים שיש קונסולידציה, יכול להיות שלחולה יש דלקת ריאות. גם יכול להיות שלא. אוקן-ריינר טוען כי הנתונים שבדק מראים שהבעיה הזו קיימת.

וכאן עולה השאלה שלישית, והחשובה ביותר: אם הסיווגים של הנתונים בעייתיים, והמשמעות הקלינית שלהם מוטלת בספק, מה המודל באמת לומד? מה הערך של מודל המתבסס על נתונים בעייתיים?

מה הבעיה במאמר של רג'פורקאר?

אני סומך ב-100% על העבודה שעשו רג'פורקאר ועמיתיו. ההבנה שלי בתחום בו עוסקים היא בסיסית, ומבוססת בעיקר על לימוד עצמי. לצורך הדיון, אני מוכן להתעלם מהביקורת של אוקדן-ריידר על טיב הנתונים. זה לא משפיע על האיכות של המודל, שהרי התחרות בין ארבעת הרדיולוגים ובין המודל התבססה על אותם נתונים, והמודל ניצח. החוקרים מצאו כי במונחי F1, המודל היה יותר טוב מהרדיולוגים בשר ודם ב-0.051, וההבדל הזה מובהק סטטיסטית.

יש לי רק שאלה אחת: מה המשמעות הקלינית של ההבדל הזה? מה הערך המוסף הקליני של המודל? לצערי, אין לי מושג, ואני לא בטוח שלמישהו יש מושג. ברור שהשאלה הזו לא עלתה כלל על דעתם של החוקרים, כי אחרת הם היו לפחות מזכירים אותה בדיון המסכם. המילה clinical הופיעה במאמר רק פעמיים, שתיהן בפרק המבוא. זהו אחד משבעת החטאים של הסטטיסטיקה: אי הבחנה בין תוצאה מובהקת לתוצאה משמעותית.

מה הבעיה המרכזית במודל של רג'פורקאר?

הבעיה המרכזית במודל של רג'פורקאר היא אבחון חלקי. כשהמודל קובע שלחולה אין דלקת ריאות, הוא לא אומר מה כן יש לו. כאן יש לרדיולוג יתרון ברור על המודל. יש לו ידע קליני שמאפשר לו לקבוע מה מצבו של החולה.

נכון שזה רק מודל, ואנחנו בתחילת הדרך. אין לי ספק שהמודל הזה הוא צעד בכיוון הנכון, אבל זהו צעד קטן מאוד. כדי נגיע למצב בו מודל כזה יהיה ראוי להישקל לשימוש, הוא יהיה צריך לסווג את תצלומי החזה ל-15 קטגוריות לפחות. מישהו יכול להעריך עד כמה אנחנו רחוקים ממודל כזה?

איך צריך להעריך את הביצועים של מודל רג'פורקאר? (וגם את ביצועי הרופא)

תסלחו לי, אבל אני לא מבין מה המשמעות האינטואיטיבית של מדד F1, ומה זה אומר אם הוא שווה ל-0.435. אני ביוסטטיסטיקאי. אחד מתפקידיי הוא לתקשר את התוצאות לצוות הקליני, כדי שהם יוכלו להעריך את המשמעות שלהם. כשהמטרה היא להעריך כלי דיאגנוסטי ((כמו בדיקת דם חדשה, או אלגוריתם מגניב שפיתחו החבר'ה בסטנפורד)) אני בהחלט מציג בפניהם מדדים כמו accuracy, specificity, ו-sensitivity, למרות שבמקרים רבים גם להם אין משמעות אינטואיטיבית ברורה ((יש מחקרים שמראים כי הרבה רופאים מפרשים אותם באופן לא נכון, אבל לא ניכנס לזה עכשיו)). אבל כל המדדים האלה לא מספיקים. אלוהים נמצא בפרטים הקטנים, ולכן צריך להתעמק בהם.

מה יקרה אם המודל של רג'פורקאר ישמש ככלי אבחון עיקרי או יחיד למחלת ריאות? בואו נניח לצורך הדיון, כי המודל משמש כשלב הראשון בתהליך האבחוני, ויסווג את החולים כסובלים מדלקת ריאות, או לא סובלים מדלקת ריאות אלא ממשהו אחר, שהמודל לא יודע לזהות, ובמקרה כזה התהליך האבחוני יימשך. נניח גם כי זהו גם התהליך הרדיולוגי.

כאשר מודל או רדיולוג צופים בצילום חזה, יש ארבע אפשרויות.

קודם כל, יש מצב שבו המודל או הרדיולוג מאבחנים כי לחולה יש דלקת ריאות, ולחולה אכן יש באמת דלקת ריאות. זה מצויין. נותנים לחולה את הטיפול המתאים ושלום על ישראל. כאן יש תועלת.

ייתכן כי לחולה אין דלקת ריאות, והמודל או הרדיולוג יקבעו כי לחולה אין דלקת ריאות. זה אכן טוב, אבל לא יותר מדי טוב. החדשות הטובות הן שלא נעשה משהו רע. הבעיה היא שלא התקדמנו. אדם נשלח לביצוע צילום חזה כי הוא חולה במשהו. אם אין לו דלקת ריאות אז יש לו משהו אחר. מה? ובכן, יש צורך בבדיקות נוספות. כאן אין תועלת וגם אין נזק.

נמשיך. יכול להיות כי לחולה יש דלקת ריאות והמודל או הרדיולוג יקבעו כי אין לו דלקת ריאות. הרופאים ימשיכו בתהליך האבחוני. הטיפול בחולה מתעכב. כאן יש קצת נזק. במקרה הטוב, בחינה נוספת של הרופאים תעלה כי בכל זאת יש לו דלקת ריאות, והנזק מינימלי. במקרה הפחות טוב, אם כי לדעתי יותר נדיר, החולה יאובחן כסובל מבעיה אחרת, יקבל טיפול רפואי בלתי מתאים, יסבול מתופעות הלוואי והנזקים הבריאותיים שנגרמים מעצם הטיפול (ותמיד יש תופעות לוואי ונזקים בריאותיים), והבעיה הרפואית האמיתית שלו לא תטופל. עלול להיגרם נזק משמעותי.

ועכשיו נגיע למצב הגרוע ביותר: לחולה אין דלקת ריאות והמודל או הרדיולוג אומרים כי יש לו דלקת ריאות. החולה יקבל טיפול רפואי לדלקת ריאות, (אנטיביוטיקה, למשל) שאינו מתאים למצבו הרפואי, וכאמור לעיל, יסבול מתופעות הלוואי והנזקים הבריאותיים שנגרמים מעצם הטיפול (השגוי). שוב, החולה לא יקבל טיפול מתאים לבעיה הרפואית האמיתית שלו, שאינה דלקת ריאות, אלא ככל הנראה משהו יותר חמור. כאן נגרם נזק משמעותי. עד כמה הנזק משמעותי? זה כבר תלוי בהרבה גורמים, כמו למשל המצב הבריאותי האמיתי של החולה, ומשך הזמן שיעבור עד שיבחינו כי הטיפול הנוכחי שהחולה מקבל אינו יעיל ויבצעו הערכה מחדש של האבחון.

השאלה הגדולה היא: האם המודל והרדיולוג טועים את אותן הטעויות?

מדדים כגון F1 לא אומרים לנו מה השכיחות של כל מצב מארבעת המדדים שתיארתי, ובוודאי לא מספקים לנו הערכה של סך הנזק הפוטנציאלי, סך התועלת הצפויה, והערכה האם התועלת עולה על הנזק, ואם כן, עד כמה. אפשר לבצע את ההערכה הזו. אפשר לכנס צוות רופאים שיבחנו אחד לאחד את 389 התיקים ששימשו לבחינת המודל. סטטיסטיקאי טוב יוכל להקל עליהם את העבודה באמצעות הצגה בהירה של הנתונים. בסופו של דבר, תהיה לנו הערכה לגבי הביצועים הקליניים של המודל.

באותו אופן, אפשר להעריך את הביצועים הקליניים של ארבעת הרדיולוגים שהתחרו במודל.

כעת, נוכל לקבוע האם למודל יש באמת יתרון על הרופאים בשר ודם, ואם כן, האם היתרון משמעותי מבחינה קלינית.

הדיון בקבוצת הפייסבוק ותשובות לשאלות

חברי הקבוצה לא הקלו עלי את החיים כששיתפתי עימם את הפוסט של ד"ר הארווי, וטוב שכך. אני ציינתי שאני מסכים עם הטענות שלו, ומטבע הדברים היו חברים בקבוצה שלא הסכימו איתנו. הם העלו טיעונים טובים ושאלו אותי שאלות קשות ומצויינות. עניתי כמיטב יכולתי במסגרת המגבלות הטכניות של ממשק הפייסבוק. אביא כאן את עיקרי הדיון, אתייחס לשאלות שנשאלתי בכל הרצינות, ואענה כמיטב יכולתי. אם פיספסתי שאלה של מישהו, אנא הפנו את תשומת ליבי לכך ואתקן. אשמח גם להמשיך בדיון.

כמו כן, אני ממליץ לכם לקרוא את הדיון עצמו שכן מעבר לדיון הספציפי בטיעונים של ד"ר הארווי ולשאלות שנשאלתי נאמרו בו עוד דברים מעניינים וחשובים.

ערן פז טוען שאלגוריתמים יכולים ללמוד גם פעילויות אחרות שמבצע הרופא כולל אינטראקציה בין אישית, וחוזה בבדיחות הדעת כי גם באינטראקציה בין אישית ביצועי האלגוריתמים יהיו טובים יותר מאלה של הרופא. בסופו של דבר, אומר ערן, הרפואה תהיה אוטומטית כמעט לחלוטין.

האמת היא שאין לי מה לענות לטענה הזו. מדובר בהערכה סובייקטיבית. אני לא שולל את האפשרות שזה אכן יקרה ((כלומר, אני סבור כי ההסתברות לכך גדולה מאפס)), אבל יש לדעתי סיכוי הרבה יותר סביר שזה לא יקרה. בכל מקרה, אני משוכנע שהדור שלנו לא יזכה לראות את הרפואה האוטומטית, אם אכן החזון יתגשם. ההערכה הסובייקטיבית שלי היא כי זה לא יקרה בעתיד הנראה לעין.

ערן מתייחס גם לטיעון השני של ד"ר הארווי, ואומר כי זה נושא יותר פילוסופי/רגולטורי מאשר טכנולוגי, ובכך הוא צודק כמובן. הוא ממשיך וטוען כי הבעיה שגם אם המערכת היה טובה יותר מבן אדם, לנו כבני אדם קשה יותר לקבל טעות ספציפית שנעשתה ע"י מחשב, גם אם בסה"כ הוא טועה הרבה פחות מבן אדם.

לי יש בעיה עם האמירה הזו. המחשב לא טועה, גם לא המודל (או יותר נכון, האלגוריתם). ((מכאן הגיעה הכותרת הצינית והפרובוקטיבית של הפוסט הזה)) מקור הטעויות הן בפיתוח האלגוריתם.

כאן מתערב בדיון ים פלג ושואל מה אם יש רעש בדאטה.

התשובה המיידית שלי הייתה כי יש הבדל בין מודל שמנסה לחזות התנהגות של לקוח ובין מודל שעוסק בחיי אדם. עם זאת, ים בהחלט צודק. רעש בנתונים הוא בעיה שצריך להתמודד איתה. הדרך להתמודד, לדעתי, היא לבדוק את הביצועים הקליניים של המודל, כפי שהסברתי למעלה, ולהשוות אותו לביצועים של הרופאים, במונחים של סך תועלת מול סך נזק.

ים ממשיך ושואל האם סך התועלת הוא לא ההפרש בין ביצועי האלגוריתם לביצועי האדם.

עניתי מהמותן שלא, אבל אני מודה שהתשובה שלי לא הייתה מדוייקת. ים צודק עקרונית, אבל לקביעה שלו אין משמעות אם לא מגדירים היטב איך מודדים את ביצועי האלגוריתם וביצועי האדם. מי שקרא עד כאן יודע כבר שהתשובה הרבה יותר מסובכת, ו-F1 הוא לא המדד האולטימטיבי.

ים המשיך והקשה עלי. הוא טען כי אם יש לך אדם שמאבחן נכון X אנשים ומציל את חייהם ויש אלגוריתם שמאבחן נכון X+Y אנשים נכון (מהנתון שהוא יותר מדויק) ומציל את חייהם. יש לך Y יותר אנשים חיים.

זה כמובן נכון, אבל זה רק צד אחד של המטבע. מספר התוצאות החיוביות האמיתיות, או יותר מדוייק – שיעורן. ה-True Positive Rate הוא בהחלט מדד חשוב, אבל כפי שעניתי בקצרה בקבוצת הפייסבוק והסברתי כאן בפירוט, יש עוד צד למטבע, עוד שלושה צדדים למעשה. הבעיות העיקריות, כפי שהסברתי למעלה, נובעות מהאבחונים הלא נכונים: תוצאות חיוביות שגויות (False Positive) ותוצאות שליליות שגויות (False Negative).

ערן חוזר ושואל: בוא נניח לרגע שמודל לא יהיה יותר מדוייק, אלא יהיה יותר קרוב ל(1,1) על הROC או לכל מדד אחר שתבחר מבן אדם, עכשיו הטיעונים בסדר? כמו כן הוא מציין כי בדיון גם לא לקחנו בחשבון את העלויות של הקמת חוות GPU לעומת העלות של הכשרת רדיולוג, זה גם משפיע על התועלת?

אני טוען שבמצבים רפואיים התועלות והנזקים הם לא 0-1. נכון שאולי ב-ROC המודל יעשה טוב יותר, עם זה אני לא מתווכח. אני טוען שלטעויות שונות יש משמעויות שונות, וכמו כן, גם במצבים של חוסר טעות, TP ו-TN, עדיין יש משמעויות שונות. המצב נעשה הרבה יותר חמור אם עוברים מדלקת ריאות לסרטן, למשל. מי ייקח אחריות על חולה סרטן שלא יאובחן בזמן בגלל שהמודל היה רועש מדי?

אמיר רוזנפלד שואל: יהי המדד האולטימטיבי כפי שאתה מגדיר אותו. נניח שתחת מדד זה מכונה מתעלה על אדם. במי תבחר?

תשובתי היא שכשמדובר ברפואה אין דבר כזה "מדד אולטימטיבי". צריך לבצע הערכה כוללת של התועלת מול הנזק כי הנזקים עלולים להיות שונים מחולה לחולה. יש משמעויות לטעויות, והן שונות מחולה לחולה. חזרתי והבאתי את הדוגמה של חולה שמאובחן בטעות כחולה סרטן. הוא יקבל כימותרפיה שהוא לא צריך ((או אפילו יעבור ניתוח מיותר)). מילא התופעות לוואי של בחילות ונשירת שיער וכאלה – כימותרפיה גם גורמת נזקים בריאותיים ממשייים.

עם זאת, אני בהחלט מסכים שאם למודל יש יתרון קליני משמעותי על פני הרופאים בשר ודם, יש להעדיף את המודל, לפחות ברמה היישומית. עדיין יש לפתור את עניין האחריות.

ערן טוען כי אני סתם מתחמק מתשובה, ושואל: הנה, מודל, שעבור רמת הFP והFN של רופא נותן יותר TP מרופא אבל עדין טועה, מחליף את הרופא?

אני מודה שלא הבנתי את השאלה, אבל סבור שהבהרתי לחלוטין איך יש להעריך את הביצועים של המודל ולהשוות אותם לביצועים של הרופא.

סיכום

אני חושב שכולם מסכימים כי עדיין לא הגיע היום בו אלגוריתמים יכולים להחליף רופאים, אלא אם מדובר בתהליכים ממש פשוטים. למשל, אני סבור שאפשר להכניס לשימוש אלגוריתם שיקבל בתור קלט נתונים על חולה (כמו בדיקות דם, מדדי דופק ולחץ דם, וכולי) ויוציא התרעה לרופא המשפחה אם הנתונים בעייתיים. ייתכן ואלגוריתמים מסוג זה כבר קיימים ופועלים.

במקרים יותר ממוקדים, כמו אלגוריתם הפיענוח של רג'פורקאר הדברים הרבה יותר מסובכים. יש הסכמה כי הנתונים ששימשו ל-"אימון" המודל היו בעייתיים. אלגוריתם זה אמנם הראה יתרון מובהק סטטיסטית בביצועיו על פי מדד F1 לעומת ארבעה רופאים בשר ודם, אבל לא ברורה המשמעת הקלינית של יתרון זה (בלשון המעטה). כמו כן, האלגוריתם מוגבל בכך שבמקרה והוא מזהה כי לחולה אין דלקת ריאות, הוא לא מספק תובנה לגבי הבעיה האמיתית שיש לחולה. בסופו של דבר, האלגוריתם הזה הוא אמנם צעד בכיוון הנכון, אבל צעד זעיר מאוד, כמעט זניח.

יתר על כן, המקרה הרפואי של דלקת ריאות הוא קל יחסית מבחינה רפואית. מחלות אחרות, כגון סרטנים ומחלות לב, למשל, צופנות בחובן אתגרים הרבה יותר גדולים.

עם זאת, יש דרך טובה ויעילה לבחון האם הביצועים של אלגוריתמים כאלה עולים על הביצועים של רופא אנושי, ובכמה.

אבל הבעיה העיקרית אינה טכנולוגית אלא אתית.

מי אחראי במקרה שהאלגוריתם טועה? מספר הדעות יהיה כנראה כמספר המשיבים.

בואו נראה מה יכול לקרות בארצות הברית, מכיוון שסביר להניח כי היא תהיה בין המדינות הראשונות בהן יוכנסו אלגוריתמים כאלה לשימוש (בהנחה שבכלל יוכנסו). במדינה בה תביעות על רשלנות רפואית ((ובארצות הברית גם טעות בתום לב נחשבת כרשלנות)) נפוצות מאוד, הנפגעים לא יהססו לתבוע את החברה שמיישמת את האלגוריתמים, את בעלי הפטנט, ומי יודע את מי עוד. האם חברות הביטוח יסכימו לבטח את החברה שמיישמת את האלגוריתם? איש אינו יודע.

אני רוצה להרחיב את הדיון בשאלת האחריות, כי זו לדעתי השאלה המהותית, וממנה נגזרה הכותרת הפרובוקטיבית של הרשימה הזו.

בואו ניקח, כדוגמה פשוטה ביותר, אלגוריתם שצריך לזהות האם בתמונה שמוצגת לו יש חתול. לאף אחד לא איכפת באמת אם האלגוריתם יטען שתמונה של כלב מראה לדעתו חתול.

מה עם אלגוריתם שמחליט אם כדאי להציע לאדם שנכנס לאתר אינטרנט עיסקת קניה מסויימת? יכול להיות שאנשים שהעיסקה תוצע להם לא יבצעו את הקניה, וגם יכול להיות שיפוספסו קונים שהיו מבצעים את הרכישה אם העיסקה הייתה מוצעת. זה חבל, אבל בסך הכל מדובר פה בכסף.

אם מדובר בהרבה כסף, הבעיות יכולות להיות גדולות. בנקים שמנסים לזהות איזה לקוח עלול לא להחזיר את ההלוואה שיקבל עלולים לעמוד בפני בעיה אם האלגוריתם לא מספיק טוב. עם זאת, אני יודע שאלגוריתמים כאלה פועלים, וכנראה שיקול הדעת שלהם יותר טוב משיקול הדעת של הפקיד.

בואו נמשיך. מה עם אלגוריתם שמחליט על ביצוע עיסקות קניה ומכירה בבורסה? בסרט הזה כבר היינו בשנת 2008. אני מקווה שהאלגוריתמים האלה השתפרו מאז, כי לא מתאים לי עוד משבר כלכלי עולמי.

מה בקשר למכונית אוטונומית? כאן כבר מתחילים לדבר על חיי אדם. מישהו יודע כמה טעויות שליליות שגויות (False Negative) יש לאלגוריתם של מובילאיי? וכמה מהטעויות האלה מובילות לתאונות? וכמה מהתאונות האלה כוללות פגיעות בגוף? אני לא יודע. אני לא בטוח שיש מי שיודע.

נכון, מכוניות אוטונומיות כבר נוסעות בכל מיני מקומות בארצות הברית, במסגרת ניסויים לבחינת האלגוריתמים. מי יעריך את מאזן התועלת מול הנזק של האלגוריתמים שמפעילים את המכוניות האלה וישווה אותם לביצועים של נהג אנושי? ואיך? האם יהיה רגולטור, כמו שיש את ה-FDA בתחום הרפואי? האם חברות הביטוח יסכימו לבטח את המכוניות והאלה והנוסעים בהם? ואם כן, מה תהיה עלות הביטוח?

מה בקשר למטוס אוטונומי? מי מוכן לעלות על טיסה טרנס אטלנטית במטוס ללא טייס?

אני יודע שאי אפשר לעצור את הקידמה, ובניגוד למה שעלולים לחשוב אני בעד הקידמה. אני בהחלט חושב שעתיד בו אלגוריתם יוכל להחליף רופא ולבצע את מלאכתו באופן טוב יותר מהרופא האנושי, וכולנו ניסע במכוניות אוטונומיות, הוא עתיד טוב. אבל כדי להגיע לעתיד הזה עלינו להתגבר על הרבה מאוד בעיות, והבעיות הטכנולוגיות הרבה יותר פשוטות מהבעיות האתיות. אני גם חושב שהעתיד הזה רחוק מאוד מאיתנו ואנו לא נזכה לראות אותו, וגם לא בנינו ובני בנינו.

נשלח: 27 בינואר, 2018. נושאים: בריאות, דטה סיינס, מדע, ניהול סיכונים, קבלת החלטות.
תגובות: 19 | טראקבק

איך להמר (אם אתה מוכרח)

אתם חייבים 100 אלף דולר לשוק האפור, אבל יש לכם רק 50 אלף, וצריך לשלם בערב. זה לא משנה אם יהיו לכם 50 אלף דולר, או 90 אלף, או 99,999. כל סכום קטן מ-100 אלף יגרום לתוצאות הרות אסון. הסיכוי היחיד שלכם נמצא בקזינו. אתם ניגשים לשולחן הרולטה, שם אפשר להמר על אדום-שחור. אם הימרתם בדולר אחד על אדום, והתוצאה היא אדום, תקבלו בחזרה את הדולר שלכם ודולר אחד נוסף. אם התוצאה אינה אדום ((יש עוד שתי אפשרויות – שחור וירוק)) הפסדתם את הדולר. יש לציין כי הסתברות הזכיה כאשר מהמרים על אדום היא קצת פחות מ-50%. מה הכי כדאי לעשות? מהי האסטרטגיה שתביא למקסימום את ההסתברות שתצאו מהקזינו ובכיסכם 100 אלף דולר?

שאלה דומה לזו הוצגה בעמוד הראשון של הספר הקלאסי How to gamble if you must מאת Lester E. Dubins, ‎Leonard J. Savage, andb ‎William Sudderth. כותרת המשנה של הספר היא Inequalities for Stochastic Processes, ומעידה על כך שזהו בהחלט ספר מתמטי. ההוכחה לתשובה שמייד אציג נמצאת בפרק החמישי של הספר, למי שמתעניין. כאן אנסה לתת הסבר אינטואיטיבי לתשובה.

אבל לפני כן קצת שעשועים. בסקר שערכתי בטוויטר השתתפו 46 צייצנים. הדיעות התחלקו פחות או יותר שווה בשווה בין ארבע התשובות האפשריות שהוצעו:

לפני שנדון בתשובות קצת היסטוריה, על קצה המזלג. משחקי הימורים היו נפוצים כבר בזמנים קדומים, ויש תיעוד שלהם בכל התרבויות העתיקות. מחקרים אודות הימורים ומשחקי מזל שערכו מלומדים כקרדנו במאה ה-16, כריסטיאן הויגנס במאה ה-17, ואברהם דה-מואבר ויעקב ברנולי במאה ה-18, ואחרים, הניחו את היסודות לתורת ההסתברות. למעשה, הפתרון שאציג מייד נובע מעבודה של דה-מואבר משנת 1711.

ועוד אנקדוטה (אולי משעשעת): בראשית ימיה, עמדה חברת FedEx בפני משבר. היה עליה לשלם חוב של 24,000 דולר, כשבקופתה היו 5000 דולר בלבד. יו"ר החברה ומייסדה, נטל את הכסף שבקופה, טס ללאס וגאס, הימר בשולחן הבלאק ג'ק וזכה ב-27,000 דולר. כך ניצלה החברה, והשאר, כמו שאומרים, היסטוריה. תודה לשי אלקין שהסב את תשומת ליבי לסיפור.

למתעניינים בהיסטוריה של חקר ההימורים והנחת יסודות תורת ההסתברות, אמליץ לקרוא את הספר נגד האלים מאת פיטר ברנשטיין, או את הספר הקלאסי
Games, Gods and Gambling מאת פלורנס נייטיגייל דייויד (( שאין לבלבל בינה ובין פלורנס נייטינגייל )) .

ועכשיו לתשובות.

תשובה אפשרית אחת היא שלא משנה מה עושים כי ממילא נפסיד הכל. זה נכון. ההימור נוטה לטובת הקזינו. ההסתברות לזכיה ברולטה בהימור על אדום (או על שחור) היא 18/38, בערך 47%. מי שיהמר לאורך זמן יצבור אט אט הפסדים, ומי שימשיך להמר עוד ועוד יפסיד בסופו של דבר את כל כספו. את זה הוכיח כריסטיאן הויגנס. מי שענה את התשובה הזו בסקר צדק.

אבל חדי העין ישימו לב כי השאלה כפי שנוסחה כאן שונה מעט מהניסוח בטוויטר, גם בגלל מגבלת התוים בטוויטר ואולי גם בגלל חוסר דיוק מצידי. בואו נדון באסטרטגיה שתביא למקסימום את ההסתברות לצאת מהקזינו עם 100 דולר, כאשר מגיעים אליו עם 50 אלף דולר. כאן בגדול יש שתי אפשרויות. אפשרות אחת היא להמר מייד על כל הסכום, בתקוה שתזכה בהימור אדום-שחור וכספך יוכפל. ההסתברות לכך היא, כאמור, בערך 47%.

מה קורה אם מהמרים כל פעם על חלק מהסכום? בואו ניקח לדוגמא את האסטרטגיה הבאה: להמר על 25 אלף דולר, לקוות לזכות ועל ידי כך להגדיל את הונך ל-75 אלף דולר, ואחר כך להמר שוב על 25 אלף דולר, כאשר זכיה תביא אותך אל הסכום הנכסף של 100 אלף דולר. במקרה הטוב ביותר תגיע למטרה על ידי שתי זכיות רצופות של 25 אלף דולר כל אחת. ההסתברות לכך היא 0.47 כפול 0.47 ((בהנחה הסבירה לגמרי שאין תלות בין ההימורים )) , כלומר בערך 22.4%.

יש כמובן אפשרות שתפסיד בהימור הראשון את 25 אלפי הדולרים עליהם הימרת. עכשיו יהיה עליך להכפיל את הונך פי 4, וזה ידרוש שוב לפחות שתי זכיות רצופות ((להמר על 25, לזכות, ואז להמר על 50 ושוב לזכות )) , וההסתברות לכך היא שוב כ-22.4%.

אם מהמרים על סכומים קטנים יותר, יש צורך ביותר זכיות, וההסתברות להגיע ל-100 אלף דולר צונחת בהתאם.

זו האינטואיציה שעומדת מאחורי הקביעה כי האסטרטגיה האופטימלית היא להמר מייד על כל הסכום בתקווה להכפילו. ברנולי ודה-מואבר הבינו זאת כבר בראשית המאה ה-18. הוכחות מתמטיות מלאות לטענות קרובות הופיעו בתחילת המאה ה-20.

רק רגע, יש עוד אפשרות: לעשות משהו אחר. אפשר להמר בשיטת ההכפלות, הידועה גם בשם שיטת המרטינגייל.

הנה הרעיון: אתה מתחיל בהימור אדום שחור על דולר. אם זכית – קיבלת את הדולר שלך בחזרה ועוד דולר אחד כרווח. אם הפסדת, לא נורא. המר כעת על שני דולר. אם זכית, אתה מקבל את שני הדולרים שלך בחזרה, ועוד שני דולרים כרווח, בסך בכל ארבעה דולרים. אבל הימרת רק על שלושה דולרים! מכאן שהרווחת דולר.

ומה קורה אם הפסדת גם בהימור השני? אין בעיה. הכפל את סכום ההימור והמר כעת על ארבעה דולר. אם זכית, תקבל שמונה דולר, אבל הימרת רק על שבעה דולר (1+2+4). הרווחת דולר.

ומה אם הפסדת בהימור על ארבעת הדולרים? אין בעיה. הכפל את סכום ההימור ל-8 דולר. אם תזכה תקבל בחזרה 16 דולר, כשהימרת רק על 15 דולר – כלומר שוב הרווחת דולר.

ומה יקרה אם הפסדת בהימור על שמונת הדולרים? אולי עדיין אין בעיה, אבל בקרוב תהיה לך בעיה.

קודם כל נתייחס לבעיה הספציפית שלנו – להגיע מ-50 אלף דולר ל-100 אלף דולר. בשיטה הזו זה ייקח קצת זמן, ותצטרך לזכות בהרבה הימורים בדרך.

כמובן, אם עומד לרשותך סכום כסף בלתי מוגבל, השיטה הזו תוביל אותך לזכיה בהסתברות 1. אבל, הסכום שעומר לרשותך (( ולרשות כל אחד, בעצם )) מוגבל, וייתכן מאוד שתגיע למצב בו אין בידיך מספיק כסף כדי להכפיל את ההימור. למעשה, אפשר להוכיח כי אם תהמר בשיטה זו לאורך זמן, תגיע למצב בו אין בידיך די כסף כדי להכפיל את ההימור בהסתברות 1.

שלישית, ברוב בתי הקזינו יש הגבלה על גובה ההימור. שיטת ההכפלות תביא אותך בסופו של דבר אל המחסום הזה ואז לא תוכל למשיך ולהכפיל את ההימור גם אם יש בכיסך את הסכום הדרוש.

באופן אישי, אם היה לי קזינו, לא הייתי מתנגד לכך שיהמרו נגדי בשיטת ההכפלה. אדרבא. אמנם מדי פעם אפסיד דולר, אך ההפסד הזה יכוסה על ידי ההפסדים של כל המכפילים שיגיעו לגבול ההימור שלהם, והפסדים אלה יהיו יותר נפוצים ויותר גדולים מדולר אחד.

אז אם אתם רוצים להמר בשביל הכיף – סבבה. אם אתם רוצים להרוויח כסף מהימורים, כדאי שיהיה לכם קזינו. והכי חשוב, אל תסתבכו עם השוק האפור.

נשלח: 13 בנובמבר, 2017. נושאים: הימורים, הממ... מעניין..., מה אומרת הסטטיסטיקה, קבלת החלטות.
תגובות: 4 | טראקבק

האם כל תוצאה מובהקת היא משמעותית (ולהיפך)?

בכל מחקר כמותי בו נערך ניתוח סטטיסטי של הנתונים, מגיע הרגע הנכסף בו מחושב ה-P-value הנכסף. האם הוא קטן מ-0.05? שואל החוקר את עצמו בהתרגשות. אם כן – הידד! אפשר לפרסם את המאמר, או לרוץ ל-FDA להגיש לאישור תרופה חדשה, או להכניס מוצר חדש ל-production.

אבל, לפני שרצים, יש שאלה נוספת שצריך לשאול: האם התוצאה משמעותית?

נניח שערכנו ניסוי בו השתתפו 1000 איש, מחציתם נשים ומחציתם גברים. ערכנו לכל אחד ואחת מנבדקים מבחן IQ. התברר כי ה-IQ הממוצע של הנשים הוא 100, בעוד שה-IQ הממוצע של הגברים הוא 99. התוצאה מובהקת, עם פי-ואליו של 0.0016. (( בהסטיית התקן של כל קבוצה היא 5. תבדקו בעצמכם )) . לפני שתרוצו לפרסם מאמר סנסציוני בכתב העת המדעי החביב עליכם ((למשל Nature או סיינטיפיק טמקא)) ראוי שתעצרו ותשאלו את עצמכם: אז מה? ההבדל הוא כל כך קטן, האם יש לו משמעות? אם אתם חושבים שלהבדל יש משמעות, עליכם לנמק זאת.

בואו ניקח דוגמה קצת יותר מציאותית. מדען בילה ימים ולילות במעבדה, ופיתח תרופה חדשה לטיפול בטרשת נפוצה התקפית (( Relapsing Remitting Multiple Sclerosis )). התרופה מקטינה את תדירות ההתקפים ב-10%. הוא רושם פטנט, ומנסה למכור את התרופה לחברת תרופות. הסטטיסטיקאי של חברת התרופות יכול בקלות לתכנן ניסוי קליני, שיזהה את האפקט של התרופה בעוצמה של 90% ((כלומר ההסתברות לתוצאת False Negative תהיה 10%)) או אפילו 95% או 99%. האם החברה תקנה את התרופה ותפתח אותה? לא ולא. יש כבר תרופות לטיפול בטרשת נפוצה התקפית שמקטינות את תדירות ההתקפים ב-30, 40, ואפילו ב-50%. במצב זה, לתרופה עם אפקט של 10% אין משמעות, לא קלינית ולא מסחרית.

דוגמה שלישית: למשפחה נולד בשעה טובה בן בכור. האם הסיכוי כי הילד השני במשפחה זו יהיה (אם וכאשר יוולד) גם הוא בן, גדל? הנה מאמר שטוען שייתכן שכן. עיקרי הדברים: בדנמרק נאספו נתונים לגבי סדר הלידה ויחס המינים של כ-1.4 מיליון ילדים, בכ-700 אלף משפחות, במשך תקופה של כ-35 שנה. 51.2% מהבכורים היו בנים. בקרב המשפחות שבהן היו 3 בנים, והיה הבן ילד רביעי, 52.4% מקרב הילדים הרביעיים היו בנים. ההבדל מובהק, כמובן (p=0.009). בואו נתעלם מ-cherry picking אפשרי (( מה קרה במשפחות בנות שני ילדים? ומשפחות בנות 3 ילדים? למה זה לא מדווח? אם זה לא באבסטרקט של המאמר, כנראה שזה לא היה מובהק )). כמה משפחות בנות 4 ילדים יש בדנמרק? מחיפוש ראשוני שערכתי עולה כי מדובר בפחות מ-10%מהמשפחות. בואו נניח שזה 10%. אז עכשיו אנחנו מדברים על 70 אלף משפחות בנות 4 ילדים. ההסתברות ששלושת הילדים הראשונים הם בנים היא בעךך 0.013. נעגל את זה ל-0.02. זה מותיר לנו 1400 משפחות בנות ארבעה ילדים שבהן שלושת הילדים הראשונים הם בנים. 51.2% מקרב הילדים הצעירים היו "צריכים" להיות בנים, בפועל היו 52.4% – הפרש של 1.2%. 1.2% מ-1400 זה , 16.8, בואו נעגל ל-17, וזאת בתקופת זמן של 35 שנה, כלומר כל שנה נולדו 0.48 יותר בנים ממה שהיה "צריך" להיות. מי חושב שזה משמעותי?

דוגמה רביעית: חברת אינטרנט עושה AB testing, בה היא בודקת את השפעתו של פיצ'ר חדש במוצר שלה על ההסתברות שלקוח המשתמש במוצר יקנה את גירסת ה-PRO, בתשלום. מסתבר כי אחוז המשלמים יגדל מ-24.6% ל-24.8%, והתוצאה מובהקת (( כדי לזהות הבדל כזה כמובהק, יש צורך בגודל מדגם של כ-728000 נבדקים, אבל נעזוב את זה כרגע )). האם זה משמעותי? (( נתקלתי בחברה שמעדכנת גירסת תכנה כאשר ביצועי הגירסה החדשה גבוהים נומינלית ב-0.2% מביצועי הגירסה הישנה, על סמך מדגם בגודל 1000, כמובן בלי בדיקת מובהקות )) ובכן, אם נניח שהתשלום לגירסת הפרו הוא 5$ ויש 100000 משתמשים, הרי שמדובר בתוספת הכנסות של 100$. שווה? אם לעומת זאת יש מיליון משתמשים והתשלום הוא 50$, מדובר בתוספת הכנסה של 10000 דולר. 30 מיליון משתמשים ותשלום של 500$ יביאו את תוספת ההכנסות ל-3 מיליון דולר, וזה בהחלט משמעותי. תגידו: אם כבר השקענו את הכסף בפיתוח, אז ניקח את מה שיצא. יש בזה משהו. אבל אני מקווה שעושים קודם כל הערכה של עלויות הפיתוח ושל ההכנסות הצפויות מהפיצ'ר החדש. (( אפשר למשל לערוך סקר משתמשים, או לכנס focus group ))

נחזור לרגע לגודל המדגם הדרוש, כ-728 אלף נבדקים. אולי ענקית כמו גוגל יכולה להרשות לעצמה מדגם כזה. אני מניח שחברות קטנות יותר צריכות להסתפק בגודל מדגם קטן יותר. הן עומדות לכן בפני הברירה הבאה: אפשרות אחת היא לערוך מבחן סטטיסטי ואז רוב הסיכויים הם שאפקט כזה (ואפילו אפקט גדול יותר) לא יזוהה כמובהק. הן כמובן יכולות לשחק בסוגי הטעות, ולאפשר טעות מסוג ראשון (false positive) גבוהה יותר כדי להשיג עוצמה גבוהה יותר. אפשרות אחרת היא לוותר מראש על בדיקת המובהקות, ולסמוך ידיהם על האפקט הנומינלי. יש לכך תומכים, הבולט בהם הוא הסטטיסטיקאי אנדרו גלמן מאוניברסיטת קולומביה. (( אני מתכוון לסקור את הגישה של גלמן ואת הגישה הנגדית, שמוביל ג'ון יואנידיס ברשימה קרובה ))

מסקנות: לפני שרצים לחקור, צריך להעריך מראש איזה תוצאה תיחשב למשמעותית, ולחשוב מה דרוש לעשות כדי לבדוק האם התוצאה אכן מתקיימת. יש להעריך מראש מה ההסתברות לכל אחת משתי הטעויות האפשריות, שכן ההסתברויות האלה קיימות וחיוביות גם אם לא משתמשים במבחנים סטטיסטיים.

נשלח: 11 בנובמבר, 2017. נושאים: הממ... מעניין..., מדע, מה אומרת הסטטיסטיקה, סטטיסטיקה רעה.
תגובות: 2 | טראקבק

על מכבי תל אביב ורוג’ר פדרר

האמת, לא ראיתי את המשחק בין מכבי תל-אביב וצסק"א מוסקבה בפיינל פור 2014 של היורוליג. אני לא צופה במשחקי כדורסל מאז הזכיה האחרונה של שיקגו בולז באליפות ה-NBA, ב-1998. בלי מיקל ג'ורדן, אני פשוט משתעמם. אבל על מה שקרה במשחק של מכביי שמעתי גם שמעתי.

למי שלא שמע: כשקבוצתו בפיגור של 15 נקודות בסוף הרבע השלישי של המשחק, הורה דייויד בלאט, מאמן מכבי, לשחקניו לנסות ללכת על כל הקופה: לעבור למשחק מהיר, הגנה אגרסיבית, וזריקות לשלוש נקודות, תוך תקווה שהיריבה תעשה יותר טעויות מהרגיל.

במונחי ספורט, אולי זה היה הימור. במונחים סטטיסטיים, בלאט החליט להגדיל את השונות. לאחר 3 הרבעים הראשונים, המשחק כבר לא היה שקול. האסטרטגיה של בלאט הגדילה את ההסתברות לתבוסה: המשחק היה יכול להגמר ב-30 נקודות הפרש לטובת צסק"א, אבל במשחק של הכל או לא כלום, זה באמת לא משנה אם ההפסד הוא בהפרש של 15 נקודות או 30 נקודות. לעומת זאת, לקיחת הסיכון גם אפשרה הסתברות לרבע שייגמר ב-16 נקודות הפרש לטובת מכבי, בניגוד לאסטרטגיות של 3 הרבעים הראשונים במשחק שמהלכם לא היה טוב במיוחד מנקודת הראות של הצהובים.

איך זה קשור לרוג’ר פדרר?

הסבר קצר על משחק הטניס. המשחק הטיפוסי מורכב משלוש מערכות, וכדי לנצח על הזוכה לנצח בשתי מערכות מתוך ה-3 (( 1. ישנם טורנירים בהם המנצח נקבע בשיטת הטוב מ-5 מערכות)). כל מערכה מורכבת ממשחקונים, וכדי לנצח במערכה יש לנצח ב-6 (ולפעמים 7 או יותר) משחקונים. כך יכול להווצר מצב מוזר: שחקן שהפסיד 6:1 במערכה הראשונה (כלומר ניצח במשחקון אחד והפסיד ב-6), וניצח בשתי המערכות הבאות בתוצאה 6:4, זכה המשחק כי ניצח ב-2 מערכות מתוך ה-3, אבל ניצח בסך הכל ב-13 משחקונים, בעוד שיריבו ניצח ב-14 משחקונים. תופעה זו, המזכירה את פרדוקס סימפסון, קורה בערך ב-5% ממשחקי הטניס המקצועניים (( 2. Wright, B., Rodenberg, R. M., & Sackmann, J. (2013). Incentives in Best of N Contests: Quasi-Simpson's Paradox in Tennis.International Journal of Performance Analysis in Sport, 13(3), 790-802. )). דבר דומה קרה גם במשחק הכדורסל: צסק"א ניצחה ב-3 מתוך 4 רבעי המשחק, אך הפסידה במשחק כולו.

מסתבר כי אלוף העולם בהפסדים ב-"משחקי סימפסון" בענף הטניס הוא לא אחר מאשר רוג’ר פדרר, אחד מגדולי הטניס בכל הזמנים. הוא שיחק ב-28 משחקים בהם המפסיד זכה ביותר משחקונים מאשר המנצח. המאזן שלו? 24 הפסדים, רק 4 ניצחונות.

מעניין לציין כי השחקן בעל המאזן הטוב ביותר במשחקים כאלה הוא ג'ון אייזנר , עם מאזן של 19 נצחונות ו-5 הפסדים. אייזנר זכור גם כמנצח במשחק הארוך ביותר בהיסטוריה, בטוניר וימבלדון ב-2010, בו ניצח את יריבו בתוצאה 70:68 במערכה החמישית. במשחק הנ"ל, אייזנר זכה ב-24 נקודות פחות מאשר יריבו. (( 3. כדי לנצח במשחקון, יש לצבור יותר נקודות מאשר היריב)) אייזנר מבסס את כל משחקו על חבטת הגשה חזקה במיוחד שמותירה את היריב ללא מענה במקרים רבים. כאשר ליריב יש מענה, לאייזנר בדרך כלל אין.

למי שמשחק מול פדרר אין הרבה סיכויים לנצח; פדרר ניצח ביותר מ-80% המשחקים בהם השתתף. מעבר לכך – שיטת הניקוד בטניס מוטה לטובת השחקן הטוב יותר. יתרון קטן על היריב מתורגם על ידי שיטת הניקוד להבדל משמעותי בסיכויי הניצחון במשחק. הדרך הכמעט יחידה לנסות לנצח את פדרר היא להגדיל את הסיכון על ידי משחק אגרסיבי. אתה עלול להפסיד שתי מערכות בתוצאה 6:0, אבל יש לך גם סיכוי להפסיד פחות משחקונים מאשר בדרך כלל, ואם תנצח מספיק משחקונים, אולי זה יספיק לך לנצח בשתי מערכות צמודות, ואז למי איכפת מהמערכה בה פדרר הביס אותך?

נשלח: 17 במאי, 2014. נושאים: ניהול סיכונים, ספורט, קבלת החלטות.
תגובות: 1 | טראקבק

הערות על הבדלי תוחלת חיים ותהליך קבלת ההחלטות של שרת הבריאות

פייסבוק, כידוע, מהווה נדבך מרכזי בפוליטיקה החדשה שהפציעה במקומותינו. מדי כמה ימים הארץ סוערת בעקבות פוסט כזה או אחר של שר האוצר יאיר לפיד, וגם שר החינוך שי פירון זכה לכמה דקות תהילה מפוקפקת בעקבות טעות משעשעת (אך נטולת חשיבות אמיתית) בסטטוס שפירסם. הסטטוסים של שרת הבריאות יעל גרמן, לעומת זאת, עוברים עד כה מתחת לרדר הציבורי. זה גם מה שקרה לסטטוס שלה מתאריך 2.4.13, שעסק בהבדלי תוחלת החיים בין גברים ונשים. הוא לא זכה להתייחסות מחוץ לרשתות החברתיות, למרות 367 לייקים, 22 שיתופים ו-96 תגובות, נכון לרגע כתיבת שורות אלה.

כדי להבין למה נזעקתי לכתוב רשימה על הפוסט הזה תיאלצו לקרוא עד הסוף (או לדלג לסוף, אם כי אני לא ממליץ על כך). אני רוצה להתייחס קודם לפוסט עצמו, בו נאמרו הדברים הבאים:

מה הפוסט של גרמן מכיל? נתונים, פרשנות לנתונים, מקור מידע, וציון מטרה לפעולה.

נתחיל בנתונים: "תוחלת החיים של גברים בישראל (לשנת 2010), היא במקום השני בעולם, בעוד שתוחלת החיים של נשים בישראל היא במקום שמיני בעולם".

לפי נתוני הלשכה המרכזית לסטטיסטיקה, תוחלת החיים של גברים בישראל (מרגע לידתם) היא 79.0 שנים, והנתון המקביל לנשים הוא 82.8 שנים (הקישורים – לקבצי pdf). ב-2011 כבר עלו הנתונים ל-80.0 ו-83.6, בהתאמה).

איך הנתונים האלה מתייחסים לנתונים במדינות אחרות? על השאלה הזו מעט יותר קשה לענות. מקור ראשוני לחיפוש הוא ויקיפדיה. הערך על תוחלת חיים ויקיפדיה הוביל אותי לשני מקורות: המחלקה לכלכלה ועניינים חברתיים של האו"ם, וכן ה-CIA שלא סומך על האו"ם ומפרסם נתונים משלו. חברי דובי הפנה אותי בטוויטר למקור שלישי, אתר בשם World Life Expectany .

הנה כל הנתונים מרוכזים בטבלה

מקור	הלשכה המרכזית לסטטיסטיקה	האו"ם	ה-CIA	אתר World Life Expectancy
תוחלת חיים גברים בישראל	79.0	78.4	78.8	78.6
דירוג בעולם	–	9	14	6
המדינה עם תוחלת החיים הגבוהה ביותר לגברים	–	איסלנד	מונקו	אנדורה
תוחלת החיים לגברים במדינה זו	–	79.5	85.8	80.3
תוחלת חיים נשים בישראל	82.8	82.9	83.2	83.0
דירוג בעולם	–	11	21	13
המדינה עם תוחלת החיים הגבוהה ביותר לנשים	–	יפן	מונקו	סן מרינו
תוחלת החיים לנשים במדינה זו	–	86.1	93.7	85.7
שנת הנתונים	2010	2010	2011	לא נתון

הלמ"ס לא מפרסמת דירוג, אלא השוואה לנתוני ה-OECD (קישור לקובץ pdf) ומספר מדינות נבחרות נוספות.

ובכן, הנתונים של גרמן לא ממש מדוייקים, אבל גם לא רחוקים כל כך מהאמת. הבה לא נהיה קטנוניים בנושא. נעבור לפרשנות של הנתונים.

אפשר ללמוד מטבלה זו הרבה דברים, אבל המסר החשוב לצורך הדיון הוא שהקשר בין הדירוג העולמי ובין המצב הבריאותי כפי שהוא מתבטא בתוחלת החיים רופף ביותר. באיזה מדינה מעדיפה גרמן לחיות: בישראל של ה-CIA, בה תוחלת החיים לנשים היא 83.2 אבל מדורגת במקום ה-21 בעולם? או בישראל שבה תוחלת החיים לנשים נמוכה יותר ועומדת על 82.8 שנים, אבל מדורגת במקום "יוקרתי יותר", נניח מקום שמיני?

מה עוד אפשר ללמוד על ההבדל בין רמת הטיפול הרפואי לגברים ולנשים מהנתונים האלה? ראשית, ניתן להצביע על העובדה שתוחלת החיים של נשים בישראל, לא משנה על איזה מארבעת המקורות מסתמכים, גבוהה מתוחלת החיים של הגברים בכל מדינה אחרת בעולם, פרט לנסיכות מונקו (המדינה השניה בדירוג תוחלת החיים לגברים של ה-CIA היא המושבה הפורטוגזית/סינית מקאו, שם תוחלת החיים לגברים היא 81.5 שנים).

מעניין יותר להתבונן בהפרשים בין תוחלות החיים, לגברים ונשים, בין ישראל ובין המדינות שמדורגות מעליה. אם מתעלמים מהמדינות הזערוריות כמו אנדורה, סן מרינו, מונקו ודומותיהן מגלים כי בסך הכל ההפרשים דומים. בישראל יש לנשים יתרון של 3-4 שנים בתוחלת החיים על פני הגברים, ומצב דומה יש בשוויץ (כ-5 שנים), אוסטרליה (כ-4 שנים), איטליה (כ-5 שנים), שוודיה (כ-3 שנים) וקנדה (כ-4 שנים). יוצאת הדופן היא יפן, המדינה הגדולה ביותר בצמרת דירוג תוחלות החיים, עם יתרון של 7 שנים לנשים על פני הגברים. מכיוון שבאופן כללי תוחלת החיים של נשים גבוה יותר מזו של גברים (רק במספר מדינות אפריקניות לגברים יש תוחלת חיים גבוהה יותר), ניתן להסיק כי אין הבדלים משמעותיים ברמת הטיפול הרפואי לגברים ונשים בישראל. מעניין לציין כי יש מדינות בהן תוחלת החיים של נשים גבוהה באופן יוצא דופן לעומת הגברים, למשל: רוסיה (74 לנשים, 61.6 לגברים) או עירק (71.7 לנשים, 63.4 לגברים). אני מקווה ששרת הבריאות לא תשאף להגיע למצב כזה גם במדינתנו.

אם רוצה גברת גרמן, חברת מרץ עד לא מזמן, חומר למחשבה המבוסס על תוחלת חיים, אולי עדיף שתעיין בלוח תוחלת חיים לפי מין, דת וקבוצת אוכלוסייה (קישור לקובץ pdf). שם תגלה כי תוחלת החיים של גברים יהודים בישראל היא 80.7 שנים, ושל גברים ערבים רק 76.5. תוחלת החיים של נשים יהודיות היא 83.9, של נשים ערביות רק 80.9. הייתי שמח לו הלמ"ס פירסמה גם נתוני תוחלת חיים בישראל לפי חלוקה גיאוגרפית, כפי שהיא מפרסמת מדדים בריאותיים אחרים (לידות חי, פטירות ופטירות תינוקות, לפי מחוז ונפה, קבוצת אוכלוסייה ודת – קישור לקובץ pdf). אולי גרמן תוכל להשיג אותם וללמוד מהם משהו. רצוי גם שתתייעץ עם הסטטיסטיקאים המצויינים שעובדים במשרדה לגבי פרשנות הנתונים.

נעבור לנושא הבא: מהו מקור המידע של גרמן בקשר לנתונים הנ"ל? גרמן מציינת אותו: "דנה ויינברג כתבה לי מכתב גלוי בנושא". מיהי דנה ויינברג? ובכן, דנה ויינברג היא מייסדת ומנכ"לית עמותת "נשים לגופן". המכתב הגלוי שלה לשרת הבריאות החדשה פורסם באתר סלונה (תודה לחברתי שרון שהפנתה אותי אליו). אין בו התייחסות לנושא הבדלי דירוג תוחלת החיים, אך אני חייב לציין כי בהרצאה ששמעתי לפני כשנה מפי פעילה אחרת בעמותה זו, טל תמיר, הטיעון הזה הועלה גם הועלה. דנה ויינברג כן מביאה במכתבה, ללא כל הפניות למקורות, מבחר של נתונים סטטיסטיים אחרים, וטענה כי "שיעורי התחלואה והתמותה של נשים בישראל גבוהים ביחס לנשים במדינות המערב". אני מצטט טיעון זה כיוון שהוא עומד בסתירה גמורה לנתוני תוחלת החיים שהבאתי כאן. לגבי הטיעונים האחרים של ווינברג, כל שאני יכול לומר הוא שיש לבדוק אותם היטב ולראות האם יש להם ביסוס. לאחר שפירטה את כל טענותיה, מביאה ווינברג בפני השרה מספר המלצות שיישומן יביא לקידום בריאותן של נשים ונערות. קראתי את ההמלצות, אני ממליץ גם לכם לקרוא אותן בעיון. אני מסכים עם כל המלצה והמלצה, וסבור כי רוב הקוראים יסכימו כי אלה המלצות חשובות שיש ליישם, כיוון שיישומן יביא לשיפור במצב הבריאותי של כלל האוכלוסיה, נשים וגברים. אז למה, דנה, למה להביא נתונים סטטיסטיים תמוהים ולתת להם פרשנות שגויה? למה לשקר בעזרת סטטיסטיקה כשבכלל אין צורך בכך?

הרשימה תסתיים בהבעת דיעה אישית/פוליטית: מדוע נזעקתי לכתוב רשימה על כל הדברים האלה באיחור של כמעט שבועיים? גרמן כתבה בסוף הפוסט שלה כי תפעל לשפר את הבריאות של הנשים בארץ. אני לא מתנגד לכך באופן עקרוני, אם כי לא ברור כלל האם אכן הטיפול בבריאות הנשים בארץ אכן לקוי לעומת הטיפול בבריאות הגברים. אבל גרמן ראתה נתונים לא ברורים עם פרשנות מטעה, החליטה, ותפעל. האם מדובר במקרה חד פעמי או בתופעה? ביום חמישי אחר הצהריים פורסמו שתי ידיעות שדיווחו על פעולות של שרת הבריאות. באחת דווח כי שרת בריאות החליטה להפסיק את הפלרת מי השתיה, בניגוד לדעת אנשי מקצוע במשרדה. בשניה דווח כי החליטה להקים צוות חשיבה שיבחן דרכים לחיזוק הרפואה הציבורית – כולל אפשרות של הפעלת שר"פ (שירותי רפואה פרטית) בבתי חולים ציבוריים. סביר למדי שועדה שהשרה ממנה ומבקשת ממנה לבחון אפשרות של הפעלת שר"פ תמליץ על הפעלת שר"פ. לא ברור לי על סמך מה קיבלה גרמן את ההחלטות האלו. אני לא מטיל ספק בזכותה לקבל החלטות אלה מתוקף תפקידה, וכן, זכותה גם לקבל את ההחלטות מתוך האידיאולוגיה בה היא תומכת. בעניין ההפלרה, לא ברור לי איזה אידיאולוגיה מנחה אותה בנושא שלכל היותר שנוי במחלוקת מדעית, אם כי, ככל הידוע לי, יש רוב בקהילה המדעית לתומכי ההפלרה. אני תוהה מי הזין את השרה (עוד בהיותה ראש עירית הרצליה מטעם מרצ) בנתונים אודות הפלרת מי השתיה, מה היו הנתונים האלה ועד כמה הם היו מבוססים. וכן, אני גם מקווה שאותו פוסט בפייסבוק לא משקף את תהליך קבלת ההחלטות שלה השרה.

רק שנהיה בריאים.

נשלח: 13 באפריל, 2013. נושאים: בריאות, מה אומרת הסטטיסטיקה, סטטיסטיקה רעה, על סדר היום, קבלת החלטות.
תגובות: 13 | טראקבק

מה הסיכוי שקולך ישפיע בבחירות – המשך דיון

ברשימה הקודמת תיארתי תרגיל חישובי שביצעתי, ומטרתו הייתה לנסות להעריך מה ההסתברות כי קול בודד ישנה את תוצאת הבחירות. הרשימה זכתה לתגובות רבות וגם לביקורות רבות, והתייחסתי התייחסות חלקית אליהן בתגובות לתגובות. ברשימה זו אשתדל לענות באופן מפורט יותר לשואלים ולמבקרים. חילקתי את התגובות לשתי קטגוריות: שאלות לגבי התוצאות שהתקבלו ומשמעותן, ושאלות טכניות/סטטיסטיות.

שאלות לגבי התוצאות שהתקבלו ומשמעותן

הטענה החשובה ביותר היא כי תוצאות הבחירות לא נקבעות על ידי קול בודד אלא על ידי כלל הקולות, ולכן התשובה לשאלה האם להצביע צריכה לבוא מתחום תורת המשחקים ולא מתחום הסטטיסטיקה. אני מסכים בהחלט עם הטענה הזו. הרשימה לא נועדה לענות על השאלה האם להצביע, והחישובים שערכתי לא נותנים תשובה לשאלה זו אלא לשאלה ממוקדת מאוד. התשובה לשאלה האם כדאי להצביע בבחירות הרבה יותר מורכבת, ודנתי בה (באופן כללי ולא מעמיק) ברשימה קודמת. התרגיל החישובי שערכתי עונה לשאלה ספציפית ביותר: בהינתן תוצאה מסויימת של הבחירות, מה ההסתברות כי הוספת קול נוסף לאחת המפלגות תשנה את חלוקת המנדטים, ואין להסיק מתוצאותיו האם יש או אין טעם להצביע.

דובי שאל מה הסיכוי שהקול שלו יעביר מנדט מהגוש הנגדי אל הגוש שלו. התשובה המיידית היא כי הסיכוי הרבה יותר נמוך. התשובה היותר מעמיקה היא כי יש צורך להגדיר מהו גוש. קל אולי להעריך כי מפלגה כדוגמת הבית היהודי שייכת לגוש הימין, אבל האם אכן תתמוך מפלגה כזו בממשלה שיקים (אם יתבקש לכך על ידי הנשיא) בנימין נתניהו, והאם תצטרף לממשלה כזו? הם מישהו מוכן לערוב לכך שנפתלי בנט לא יצטרף לממשלה בראשות יחימוביץ? או ש"ס? מה בקשר ליהדות התורה – האם הם שמאל או ימין? בלד היא מפלגה לאומית ערבית – לא ימין יהודי אבל בהחלט ימין מדיני ערבי. לדידם הליכוד והעבודה חד הם. לאיזה גוש יש לשייך אותם? קטונתי מלענות על כל השאלות האלה, ומשום כך איני יכול לענות על השאלה של דובי. זיו ניסח את אותה שאלה באופן מדוייק יותר: "לאיזו מפלגה, מבין מרצ, העבודה, יש עתיד, התנועה וחד"ש, אני צריך להצביע כדי שיהיה כמה שיותר סיכוי שאני 'אגנוב' מנדט מהליכוד, ש"ס, יהדות התורה או הבית היהודי?". לא ערכתי את החישובים, אבל ברור למדי שהסיכוי כי מאורע כזה יקרה הינו קלוש, עקב הפער הגדול (בתחזית המנדטים) בין שני הגושים שהגדיר מתן, כ-20 מנדטים שהם יותר מחצי מליון קולות קולות.

אני כן יכול לענות על השאלה המשתמעת מתגובתו של מתן ק: האם רוב רובו העצום של הסיכוי להעביר מנדט הוא בין שתי רשימות שיש ביניהן הסכם עודפים? זה נראה כך כיוון שההסתברויות שחושבו דומות לכל זוג מפלגות הקשורות בהסכמי עודפים. הדמיון בהסתברויות נובע משיטת חישוב המנדטים, בה מאחדים כל זוג מפלגות שכרתו בינן הסכם עודפים ל-"מפלגת על" אחת, לצורך חלוקת המנדטים. עם זאת, העובדה שיש הסבר לדמיון בהסתברויות בזוגות המפלגות אינה אומרת כי מתן בהכרח טועה. בדקתי את תוצאות הסימולציה, והתברר כי מתן צודק בתחושתו, ואכן הסיכוי להעביר מנדט מרשימה לרשימה אחרת שאנה קשורה עימה בהסכם עודפים הינו אפסי.

שאלות טכניות/סטטיסטיות

טענה שהועלתה על ידי מספר מגיבים היא שהחישובים נערכו על סמך הערכה מסויימת של מספר המנדטים הצפויים לכל מפלגה, ולא נערך חישוב לגבי התפלגויות מנדטים אחרות. כמו כן נטען כי העובדה כי התפלגות המנדטים שבחרתי הייתה קבועה (בכל 2 מליון הסימולציות השתמשתי באותה התפלגות מנדטים כדי לסמלץ את מספר הקולות לכל מפלגה) גרמה להגדלה של ההסתברויות שחישבתי. זה נכון באופן עקרוני – ככל שההנחות מכילות יותר שונות, גם ההסתברויות למאורעות ספציפיים יקטנו. הסיבה פשוטה – יש יותר מאורעות (ותאמינו או לא, מרחב המדגם בסימולציה הוא סופי), ולכן ההסתברויות של המאורעות באופן כללי יותר קטנות, כי צריך לחלק את "עוגת ההסתברות" להרבה יותר פרוסות. השאלה היא לכן לא האם הייתה מספיק שונות בהנחות, אלא האם ההנחות שלי מתאימות לשאלה ששאלתי. השאלה הייתה פשוטה: בהינתן תוצאה מסויימת של הבחירות, מה ההסתברות כי הוספת קול נוסף לאחת המפלגות תשנה את חלוקת המנדטים. הדגש הוא על המלים "תוצאה מסויימת". הפירוש שנתתי למלים אלה הוא כי וקטור חלוקת המנדטים נתון וקבוע, והתוצאה שקיבלתי תקפה כמובן רק בהנחה זו. עם זאת, ערכתי מספר בדיקות. באחת מהן הוספתי בכל סימולציה עד פלוס/מינוס חצי מנדט לכל מפלגה (על ידי הוספת משתנה מקרי אחיד על הקטע בין -0.5 ל-0.5 למספר המנדטים של כל מפלגה, ולאחר מכן נרמול התפלגות המנדטים כך שיתקבל שוב וקטור הסתברות). בבדיקה נוספת לא הנחתי כלל התפלגות מנדטים, ובחרתי בכל סימולציה את וקטור ההסתברויות להתפלגות מולטינומית מתוך התפלגות דיריכלה אחידה. בשני המקרים קיבלתי תוצאות דומות, וההסתברויות היו אכן בסדר גודל של 1 ל-10000, כצפוי במקרה בו אין כל אינפורמציה מוקדמת על תוצאת הבחירות (וסקרתי מספר עבודות שהגיעו למסקנה דומה ברשימה שכתבתי על הטיעונים בעד הצבעה בבחירות).

טענה מעניינת העלה הקורא ליר: המודל שבניתי מניח את התפלגות המנדטים הנתונה לגבי בעלי זכות הבחירה שהחליטו להצביע, והסימולציה תחילה קובעת את מספר המצביעים (לפי ההנחה על אחוז ההצבעה) ואח"כ קובעת איך יתפלגו הקולות בין המצביעים בפועל. זה מתאר מצב בו אדם תחילה מחליט האם להצביע, ובמקרה שהאזרחית מחליטה להצביע, היא מחליטה לאחר מכן לאיזה מפלגה תיתן את קולה. ליר טוען כי המצב בפועל שונה: תחילה מחליטים באיזה מפלגה לתמוך, ולאחר מכן מתקבלת ההחלטה האם ללכת לקלפי ולהצביע בפועל עבור המפלגה או לוותר על הזכות להצביע. ליר טוען, ובצדק, שלפי מודל ההחלטה שלו יתקבלו תוצאות אחרות. תשובתי היא שאני מסכים כי המודל שלי פשטני במידה מסויימת, אך כך גם המודל שלו. תהליך ההחלטה האם להצביע ובעד מי הוא מורכב למדי. אני מניח שחלק מהאנשים פועלים לפי המודל הראשון שאני הצעתי (זה מודל ההחלטה שלי, דרך אגב), ואנשים אחרים פועלים לפי המודל של ליר. לא מן הנמנע כי לאנשים רבים יש עץ החלטות מורכב יותר. המודל שבחרתי נראה לי סביר, בין היתר בגלל העובדה שהסקרים (שתוצאותיהם שימשו כקלט לסימולציה שלי) משקפים מודל החלטה כזה (תחילה הסוקר שואל האם בכוונת הנסקר להצביע בבחירות, ורק במקרה של תשובה חיובית שואל הסוקר לאיזה מפלגה בכוונת הנסקר להצביע). כמו כן, אין תשובה חד משמעית לשאלה האם אחוז ההצבעה משתנה בין התומכים של מפלגות שונות, לא כל שכן נתונים שיאפשרו סימולציה על סמך המודל הזה. אם יש הבדלים משמעותיים באחוזי ההצבעה בין התומכים של מפלגות שונות, התוצאות עשויות להיות שונות. אם אין הבדלים משמעותיים התוצאות יהיו דומות.

ליר טען גם כי ההתבססות שלי על מודל של התפלגות מולטינומית שגוי, וכי יש להשתמש במודל של התפלגות נורמלית. אני דוחה טענה זו מכל וכל. התפלגות מספרי הקולות של המפלגות היא מולטינומית מעצם הגדרתה, ולכן סימולציה של התפלגות מולטינומית היא הדרך הנכונה. יש לזכור גם כי מספרי הקולות של המפלגות אינם בלתי תלויים, אלא יש בינם מתאם שלילי (כשמפלגה אחת מקבלת הרבה קולות, האחרות בהכרח יקבלו פחות, ולהיפך). בסימולציה כפי שליר מציע אין תלות בין מספרי הקולות שמקבלת כל מפלגה.

התוצאות לגבי בלד נראו לחלק מהמגיבים מוזרות. הנה הסבר מהיר: ב-2 מליון הסימולציות שנערכו, לא היה אף לא מקרה אחד כי הוספת קול נוסף לבלד העלתה את מספר המנדטים שקיבלה מפלגה זו. האמד הנקודתי למאורע כי הצבעה לבלד תשנה את תוצאת הבחירות הוא לכן אפס חלקי 2 מליון, כלומר אפס. נשאלת השאלה: האם העובדה שלא ראינו מאורע מסויים מעידה על כך שאין כל סיכוי שהמאורע יתרחש? כמובן שלא. לכן לא ציינתי לגבי בלד את ההסתברות הספציפית, אלא רווח סמך: ההסתברות למאורע קטנה מ-1 ל-667 אלף. רווח סמך זה הוא מקורב, ומבוסס על "כלל אצבע" המכונה בעגה הסטטיסטית "The rule of three", ולפיו רווח סמך עליון למאורע שלא נצפה הוא 3 חלקי מספר התצפיות, ובמקרה שלנו 3 חלקי 2 מליון.

נשלח: 14 בינואר, 2013. נושאים: מה אומרת הסטטיסטיקה, על סדר היום, קבלת החלטות.
תגובות: 4 | טראקבק

מה הסיכוי שקולך ישפיע אם תצביעי בבחירות

הקדמה

ברשימה הקודמת סקרתי את מגוון הטיעונים בעד הצבעה בבחירות, מעשה שעל פניו נראה "בלתי רציונלי", בהתחשב בעובדה שהסיכוי שקול בודד ישפיע על תוצאת הבחירות נמוך למדי. כמה נמוך? על פי דאגלס ואנדרוורקן, הסיכוי כי קול בודד במדינת מפתח כצפון-קרוליינה יכריע את גורל הבחירות לנשיאות ארצות הברית הוא כ-1 ל-10 מליון. לעומת זאת, הסיכוי כי קול בודד יכריע את תוצאת הבחירות למועצת עיר קטנה בקנטאקי הוא כ-1 ל-90, סיכוי גבוה למדי בעיני מספר אנשים.

הפתרון המקובל כיום הוא שהתועלת מההצבעה נובעת לא רק מהתועלת האישית המתבטאת בסיכוי כי קולו של המצביע ישנה את תוצאת הבחירות, אלא גם מהתועלת לכלל הנובעת מההצבעה. התועלת לכלל הרבה יותר גבוהה מהתועלת לפרט, כי על הכף מונחים הרבה יותר גורלות והרבה יותר כספים (תחשבו על מספר ההרוגים במלחמה אפשרית עם אירן לעומת האפשרות שאתן תהרגו, או על הוצאה ממשלתית לטובת תקציבים חברתיים של 138 מיליארד שקלים בחמש שנים לעומת העלות/רווח האישי שלכם עקב תוצאת הבחירות שלא תעלה ככל הנראה מעל סך של כמה עשרות או מאות אלפי שקלים).

יש הבדל גדול בין שיטת הבחירות בישראל לעומת ארה"ב: כפי שציין אביתר בתגובתו לרשימה הקודמת, ההשפעה של הצבעה (או המנעות מהצבעה) אינה מתבטאת בקביעת המנצח או המפסיד, אלא בקביעה כמה חברי כנסת יהיו לכל מפלגה. לכן בניתוח שמוכוון לבחירות בישראל, השאלה צריכה להיות: אם אצביע למפלגה מסויימת, מה הסיכוי שהיא תקבל מנדט נוסף שלא הייתה מקבלת לו לא הצבעתי בבחירות?

הבדל משמעותי נוסף בין ישראל וארצות הברית – מספר המצביעים בישראל נמוך בהרבה מאשר בארה"ב. מכיוון שמושב בכנסת שווה כ-20 עד 30 אלף קולות (לאחר מעבר אחוז החסימה), וראינו כי בבחירות רוב הסיכוי של קול בודד להשפיע הולך וקטן עם עליית מספר המצביעים, סביר להניח כי כאשר כמה אלפי קולות עשויים להטות את הכף, הסיכוי של קול בודד להשפיע גדול יותר.

מתי קול בודד יכול להשפיע על תוצאת הבחירות בישראל?

הנה מספר מצבים אפשריים בהם קול בודד עשוי להשפיע על תוצאת הבחירות. בכולם אניח כי את, הבוחרת, מתלבטת האם להצביע עבור מפלגה א, ואינך שוקלת להצביע למפלגה אחרת; האלטרנטיבה שלך היא להצביע בפתק לבן (קול לא כשר) או לא להצביע כלל. הנה תיאור של מספר מצבים בהם קולך עשוי להשפיע על תוצאות הבחירות:

א. מפלגה א מתנדנדת באזור אחוז החסימה. הקול שלך יכול להשפיע אם ללא קולך המפלגה לא תעבור את אחוז החסימה, ובעזרתו היא תעבור אותו. במקרה שתעבור, תזכה בשני מנדטים בכנסת במקום באפס.

ב. מפלגה א תעבור בוודאות את אחוז החסימה. המפלגה לא חתמה על הסכם עודפים עם מפלגה אחרת (או שחתמה על הסכם עודפים עם מפלגה אחרת שלא עוברת את אחוז החסימה). הקול שלך יכול להשפיע אם ללא קולך המפלגה לא תקבל מנדט נוסף בשלב השני של חלוקת המנדטים (כמפורט בחוק בדר-עופר), ובעזרתו היא תקבל אותו.

ג. מפלגה א קשורה בהסכם עודפים עם מפלגה ב. ברור כי שתי המפלגות יעברו את אחוז החסימה. הקול שלך יכול להשפיע אם:

1. ללא הקול שלך שתי המפלגות (א ו-ב) לא יזכו במנדט נוסף בשלב השני של חלוקת המנדטים, ויחד איתו זכו במנדט נוסף שמוענק למפלגה א.

2. ללא הקול שלך שתי המפלגות (א ו-ב) לא יזכו במנדט נוסף בשלב השני של חלוקת המנדטים, ויחד איתו זכו במנדט נוסף שמוענק למפלגה ב.

3. שתי המפלגות זוכות במנדט נוסף בשלב השני של חלוקת המנדטים גם ללא קולך, אך הצבעתך למפלגה א העניקה לה את המנדט הנוסף בשלב השלישי של חלוקת המנדטים, ולו לא הצבעת לה, המנדט הנוסף היה מוענק למפלגה ב.

4. שתי המפלגות זוכות במנדט נוסף בשלב השני של חלוקת המנדטים גם ללא קולך, אך הצבעתך למפלגה א יוצרת תיקו בין שתי המפלגות, ומפלגה א זוכה במנדט הנוסף בהגרלה; לו לא הצבעת למפלגה א, המנדט הנוסף היה מוענק למפלגה ב.

יכולות להיות עוד אפשרויות, אבל אני מסתפק בדוגמאות אלה.

איך מחשבים את ההסתברות כי קולך ישפיע?

קטע זה הוא טכני וניתן לדלג עליו ולעבור היישר אל חלק התוצאות.

הדרך הקלה והמהירה היא לבצע סימולציה של ההצבעה. מגרילים בעזרת המחשב תוצאה אפשרית של הבחירות ומחשבים את חלוקת המנדטים. לאחר מכן, מוסיפים קול נוסף לאחת המפלגות, ומחשבים מחדש את חלוקת המנדטים. אין הבדל בין שתי החלוקות? הקול לא השפיע. יש הבדל? הקול השפיע? חוזרים על התרגיל הזה הרבה מאוד פעמים, ומחשבים את הפרופורציה של מספר הפעמים הבן הקול הנוסף שינה את חלוקת המנדטים. פרופורציה זו היא אמדן להסתברות כי הקול הנוסף השפיע על תוצאת הבחירות.

כמובן שיש צורך להניח מספר הנחות:

אחוז ההצבעה: אני מניח כי אחוז ההצבעה בבחירות יהיה הין 60 ל-70 אחוזים, ובוחר את האחוז באופן מקרי ואחיד בתחום זה. מספר המצביעים יחושב על פי האחוז המוגרל מתוך מספר בעלי זכות הבחירה, שהוא 5656705.
לפי נתונים מבחירות קודמות, אני מניח כי 1.5% הקולות יפסלו מסיבות שונות, ועוד 3% משאר הקולות יינתנו למפלגות שלא עברו את אחוז החסימה. לכן מספר הקולות הכשרים (ממנו מחושב אחוז החסימה) יחושב כ-98.5% ממספר המצביעים, ומספר הקולות של המפלגות שעברו את אחוז החסימה (לפיו נקבע המודד למנדט) יחושב כ-95.5% ממספר המצביעים.
הסכמי עודפים: . למיטב ידיעתי, הסכמי העודפים שנחתמו כוללים את: הליכוד ביתנו והבית היהודי, העבודה ויש עתיד, התנועה ומרץ, עם שלם וקדימה (באתר ועדת הבחירות אין שום מידע על כך נכון למועד כתיבת שורות אלה). בבחירות הקודמות נחתמו גם הסכמי עודפים בין שס ויהדות התורה, ובין חד"ש ורע"מ-תע"ל, ואני מניח כי גם בבחירות אלה הסכמים אלה ייחתמו.

לאחר שקבעתי את מספר הקולות למפלגות שעברו את אחוז החסימה, אני מחלק אותם בין המפלגות האלה בעזרת סימולציה של התפלגות מולטינומית. את המפלגות שעברו את אחוז החסימה בחרתי לפי תחזית המנדטים הצפויים לכל מפלגה על פי תחזית אתר בטל בשישים (שאיני יכול להוות דעה על איכותה, אבל בכל זאת צריך להסתמך על משהו) כפי שפורסמה ביום 4.1.2013 בשעה 14.00:

הליכוד ביתנו	35
העבודה	18
הבית היהודי	13
ש"ס	12
התנועה	10
יש עתיד	10
יהדות התורה	6
רעם-תעל	5
מרצ	4
חדש	4
בלד	3

את ההסתברויות להתפלגות מולטינומית קבעתי על ידי חלוקת מספר המנדטים שבתחזית ב-120.

לכל חלוקת מנדטים ערכתי 11 חישובי השפעה, כאשר בכל פעם הוספתי קול אחד למפלגה אחרת.

הסימולציה הורצה 2000000 פעמים.

הנה תוצאה אחת לדוגמה מתוך 2000000 ההרצות:

אחוז ההצבעה הוגרל להיות 61.4% ולכן מספר המצביעים נקבע להיות 3470406, ומספר הקולות שניתנו ל-11 המפלגות שעברו את אחוז החסימה הוא 3314238. האופן בו התחלקו 3.3 מליון קולות אלה בין המפלגות מופיע בעמודה השניה בטבלה וחלוקת המנדטים לפי קולות אלה בעמודה השלישית. בעמודה הרביעית הוספתי עוד קול אחד לליכוד ביתנו, וחלוקת המנדטים לאחר הוספת קול זה מופיעה בעמודה האחרונה. בזכות קול אחד, הליכוד ביתנו זכו במנדט נוסף על חשבון הבית היהודי.

מפלגה	קולות	חלוקת המנדטים	קול נוסף לליכוד	חלוקת המנדטים עם קול נוסף לליכוד
הליכוד ביתנו	966349	34	966350	35
הבית היהודי	358956	14	358956	13
העבודה	497558	19	497558	19
יש עתיד	275354	9	275354	9
ש"ס	331066	11	331066	11
יהדות התורה	166104	7	166104	7
התנועה	276958	11	276958	11
מרצ	109864	3	109864	3
רעם-תעל	138728	6	138728	6
חדש	110507	3	110507	3
בלד	82794	3	82794	3
סך הכל	3314238	120	3314239	120

החישוב שונה במקצת לצורך חישוב ההסתברות כי קול הניתן למפלגה המתנדנדת על סף אחוז החסימה ישפיע על חלוקת המנדטים. לאחר חישוב מספר המצביעים, אני מגריל משתנה מקרי בינומי עם N שווה למספר המצביעים ו-p שווה למספר ערכים, בין 1.5 ל-2.5 אחוז. P מבטא את ההסתברות כי מצביע כלשהו יבחר במפלגה זו. כמו כן, אני מחשב את אחוז החסימה עצמו על ידי חלוקת מספר המצביעים ב-50 ועיגול כפי מטה. אם מספר המצביעים למפלגה א שווה בדיוק לאחוז החסימה, אז הקול הנוסף של המצביעה המתלבטת ישפיע ובזכותו תעבור המפלגה את אחוז החסימה.

התוצאות

א. ההסתברות כי קול למפלגה על סף אחוז החסימה (כלומר ההסתברות כי מצביע כלשהו יבחר במפלגה זו היא בדיוק 2%) יכריע ויעביר את המפלגה אל מעל אחוז החסימה הוא 0.00147 או כ-1 ל-685. מתברר כי תוצאה זו רגישה ביותר להסתברות כי מצביע כלשהו יבחר במפלגה זו. אם ההסתברות היא 1.99% במקום 2%, אז ההסתברות כי קול נוסף ישפיע עולה ל-1 ל-1685, ואם במפלגה תומכים 1.98% מהבוחרים, אז ההסתברות כי קול נוסף ישפיע תהיה קרובה ל-1 ל-23000.

במלים אחרות, אם את מתכוונת להצביע למפלגה המתנדנדת על סף אחוז החסימה, ההסתברות כי קולך ישפיע על התוצאה הסופית של הבחירות נמוכה למדי ברוב המקרים.

ב. התוצאות מפורטות בטבלה

מפלגה	ההסתברות כי קול למפלגה זו ישנה את חלוקת המנדטים
הליכוד ביתנו	0.001469 (1 ל-681)
הבית היהודי	0.001468 (1 ל-681)
העבודה	0.001783 (1 ל-561)
יש עתיד	0.001759 (1 ל-569)
ש"ס	0.002235 (1 ל-447)
יהדות התורה	0.002290 (1 ל-437)
התנועה	0.002542 (1 ל-393)
מרצ	0.002533 (1 ל-395)
רעם-תעל	0.002720 (1 ל-368)
חדש	0.002813 (1 ל-356)
בלד	0.0000015> (פחות מ-1 ל-667 אלף)

סיכום

הטענה כי "אין טעם להצביע כיוון שממילא קול אחד לא ישנה דבר" אינה נכונה בדרך כלל. במדינת ישראל, השילוב של המספר הקטן מאוד של קולות (כ-30 אלף או פחות מכך) המזכים במנדט בכנסת עם שיטת הבחירות (בחירות ארציות יחסיות עם חלוקת מנדטים לפי חוק בדר-עופר), יוצרת הסתברויות גבוהות מאוד לכך שקול בודד ישנה את חלוקת המנדטים – בין 1 ל-350 ל-1 ל-700, כל זאת כאשר המפלגה עבורה מצביעים עוברת את אחוז החסימה וקשורה בהסכם עודפים עם מפלגה אחרת שעוברת אף היא את אחוז החסימה.

עדכון – מרץ 2019

מאז שנכתבה הרשימה הזו חלו מספר שינויים: אחוז החסימה עלה בצורה משמעותית, וגם מספר בעלי זכות הבחירה עלה, ויחד איתו עלה בכ-10% גם המודד – מספר הקולות הדרושים כדי לקבל מושב אחד בכנסת. לכן, אני מעריך שבבחירות הקרובות הסיכוי שקול בודד ישנה את מפת המנדטים נמוך בצורה משמעותית ממה שהיה לפני כ-6 שנים. אולם, הסיכוי עדיין חיובי.

אני רוצה להבהיר כי אין לפרש את הדברים האלה כהמלצה לא להצביע, או כנימוק/תירוץ לאי הצבעה כי "ממילא הקול לא ישפיע". הקולות הבודדים מצטברים, ויש להם אפקט. כפי שצויין בתגובות לפוסט הזה וגם בפוסט ההמשך, ההחלטה האם להצביע לא אמורה להתבסס על ההסתברות שהקול הבודד ישנה משהו, אלא גם על גורמים נוספים. לשאלה האם להצביע יש אספקטים פילוסופיים ותועלתניים כאחד, ואם מוזמנים לקרוא את מגוון הדיעות בנושא. ההמלצה שלי היא להצביע, וכן אני ממליץ לכל אחד להצביע למפלגה שעמדתה היא הקרובה ביותר לדיעותיו, מבלי להתחשב בשיקולי הצבעה אסטרטגית למיניהם.

נשלח: 6 בינואר, 2013. נושאים: מה אומרת הסטטיסטיקה, על סדר היום, קבלת החלטות.
תגובות: 61 | טראקבק

למה להצביע ומה הסיכוי שקולך ישפיע

השאלה הזו עולה שוב ושוב: יש כל כך הרבה מצביעים, אז מה יקרה אם לא אלך להצביע? מה בכלל הסיכוי שהקול שלי ישפיע? למה בכלל להצביע?

הבחירות האחרונות בארה"ב סיפקו דוגמא מאלפת. בבחירות למועצת עיריית וולטון, קנטאקי שנערכו בנובמבר 2012 נוצר תיקו בין שני מועמדים: בובי מקדונלד ואוליביה באלו. כל אחד מהם זכה בדיוק ב-669 קולות. התוצאות היו יכולות להיות שונות, אבל אשתו של המועמד מקדונלד לא הצביעה (היא סיימה משמרת בבית החולים בו עבדה, ובעלה אמר לה כי אין צורך שתטרח להצביע, הרי קולה לא ישנה כלום ממילא). הטלת מטבע מינתה את הגברת באלו למועצת העיר.

פרופ' אייל וינטר טוען במאמר שפרסם כי "הצעתו של מקדונלד לאשתו הייתה רציונלית מאוד. גם כאשר מדובר בעיר קטנה בקנטקי הסיכוי שקול בודד יכריע את הבחירות זעום ביותר". אז למה בכל זאת טרחו יותר מ-1300 אזרחים ואזרחיות בעיר וולטון להצביע בבחירות למועצת העיר?

לשאלה האם להצביע יש אספקטים פילוסופיים ותועלתניים כאחד. בפוסט זה אנסה לסכם את מגוון הדיעות בנושא. בפוסט המשך אציג מספר חישובי סיכויים שערכתי.

דאגלס ואנדרוורקן, סטטיסטיקאי מאוניברסיטת דיוק בצפון קרוליינה, מונה מספר טיעונים "מוסריים" בעד הצבעה בבחירות, ומסביר את הבעייתיות שבהם (קישור לתקציר המאמר, לקריאתו דרוש מנוי): מה יקרה אם כולם יחליטו שאין טעם להצביע? הטיעון אמנם לא רלוונטי, כי לא כולם חושבים שאין טעם להצביע; ובכל זאת מסביר ואנדרוורקן כי עצם העובדה שהחלטה מסויימת (כמו לא להצביע) תגרום נזק לחברה אם כל הפרטים בחברה יישמו אותה, לא בהכרח הופך את עצם הפעולה לבלתי מוסרית. לטענה כי על כל אדם להצביע בבחירות מכיוון שזו זכותו, עונה ואנדרוורקן כי לפי אותו הגיון על כל אדם לקרוא ספר על משוואות דיפרנציאליות חלקיות, כי גם זכות זו מוקנית לכל (לינק לספריה למתמטיקה, למי שהשתכנע). הטענה כי הצבעה היא חובה אזרחית קוסמת, לדברי ואנדרוורקן, רק למי שמפיק הנאה וסיפוק ממילוי חובות אזרחיות; אחרים יכולים להפיק הנאה וסיפוק ממימוש זכותם האזרחית לא להצביע. ועם הטענה כי למי שאינו מצביע אין זכות להתלונן על המצב לאחר הבחירות הוא מסכים חלקית: אולי אין זכות מוסרית, אבל בודאי יש זכות חוקית.

כלכלנים נוטים להסביר כל דבר על ידי תועלת ותמריצים. וינטר אינו שונה בכך מאחרים. הצבעה כרוכה בטרחה משמעותית, לדבריו (צריך לצאת מהבית, ללכת עד הקלפי, לעמוד בתור, אח"כ לחזור הבייתה, אויש), והתועלת, המתבטאת בסיכוי שקולך ישנה משהו, נמוכה עד אפסית. הבעיה היא שאם כך הדבר, איש לא היה טורח להצביע. הכלכלן יענה כי ישנם אנשים עבורם התועלת שבהצבעה עולה על העלות/טרחה, ממגוון סיבות. וינטר כותב כי יש המפיקים תועלת נפשית מעצם ההצבעה ו/או משלמים מחיר נפשי/מוסרי עקב הימנעות מהצבעה. הצבעה בבחירות עשויה אפילו להיות סוג של בילוי לאנשים מסויימים. אהרון אדלין, אנדרו גלמן ונח קפלן טוענים במאמר משנת 2007 (קישור למאמר, קובץ pdf) כי הבוחרים (או חלקם) לוקחים בחשבון בשיקולי העלות/תועלת גם את התועלת החברתית, כלומר את התועלת שתיגרם לכלל כתוצאה מעצם ההצבעה של אדם בודד. במלים אחרות, הם טוענים כי הצבעה בבחירות היא תרומה לקהילה. גלמן, שהינו פרופסור לסטטיסטיקה ומדעי המדינה באוניברסיטת קולומביה בניו-יורק, מעלה הסבר אפשרי נוסף בבלוג שלו: גם אם הסיכוי כי קולך בבחירות ישפיע הוא קטן, הרווח הצפוי במקרה של השפעה הוא עצום. בפוסט שפרסם לקראת הבחירות של 2008, העריך כי הסיכוי שקול בודד ישפיע על תוצאת הבחירות הוא כ-1 למליון במדינה מתנדנדת כאוהיו, והרבה פחות מכך במדינה בה המירוץ אינו צמוד במיוחד, כמו ניו-יורק. אולם הפרס לקול הזוכה גדול במיוחד, כ-1.5 ביליון דולר לדעת גלמן, בהתחשב בגודל בתקציב הפדרלי. לדעתי מדובר בסכום גדול הרבה יותר, טריליון או יותר. (זוכרים את חבילת החילוץ שאובמה שחרר מייד בתחילת נשיאותו?) אתם מוכנים לקנות כרטיס לוטו עם סיכוי של 1 ל-10 מליון לזכיה בפרס של 1.5 ביליון דולר? כי בישראל, למשל, עשרות אלפי אנשים קונים מדי שבוע כרטיס לוטו עם סיכוי של 1 ל-14 מליון לזכות בכמה מליוני שקלים, וחושבים שזו עיסקה טובה. העיסקה של הצבעה בבחירות הרבה יותר טובה מעיסקת הלוטו, לדעתי לפחות.

כל זה טוב ויפה, אבל עדיין נשאלת השאלה מה הסיכוי שזה אכן יקרה, כלומר, מה הסיכוי שאם אצביע, קולי ישנה את תוצאת הבחירות? איזה סיכון לקח על עצמו ידידנו מוולטון, קנטאקי, בובי מקדונלד, כשאמר לרעייתו לא לטרוח להצביע, כי ממילא קול אחד לא ישנה דבר?

במאמר אחר שכתב גלמן, יחד עם ג'ונתן כץ וג'וזף באפומי, הם טוענים כי הסיכוי שקול בודד יכריע את תוצאת הבחירות הוא בסדר גודל של 1 למספר המצביעים (קישור למאמר, קובץ pdf). דאגלאס ואנדרוורקן הגיע לתוצאה אחרת. הוא ערך סימולציה של הבחירות לנשיאות ארה"ב ב-2012, במדינת צפון קרוליינה, בה יש כ-6.5 מיליון בעלי זכות בחירה, והסקרים הראו כי המירוץ בין אובמה לרומני במדינה זו היה צמוד ביותר. מסקנתו הייתה כי הסיכוי שקול בודד יכריע את גורל הבחירות במדינת מפתח זו הוא בערך 1 לרבע מליון. הסיכוי כי אותו קול יכריע את גורל כל הבחירות לנשיאות הוא כ-1 ל-10 מליון, תוצאה דומה לזו שקיבלו גלמן, סילבר ואדלין (קישור למאמר, קובץ pdf), וסילבר, אגב, הוא נייט סילבר, שהתפרסם לאחרונה בעניינים אחרים הקשורים לבחירות בארצות הברית.

נחזור לקנטאקי. אייל וינטר כתב כי "גם כאשר מדובר בעיר קטנה בקנטקי הסיכוי שקול בודד יכריע את הבחירות זעום ביותר”. האמנם?

ראשית, נזכור כי באותו יום נערכות בארה"ב, בה יש עשרות אלפי ערים, מאות אלפי מירוצי בחירות בגדלים שונים. הסיכוי שבמחוז בחירה קטן בעיירה נידחת בקנטאקי יהיה תיקו בבחירות הוא קטן, אבל הסיכוי כי באחד ממאות אלפי המירוצים הנערכים יהיה תיקו כבר אינו מבוטל. תיקו איפשהו אינו הפתעה גדולה (ראו רשימתי מה באמת קורה בלוטו הבולגרי? מאוקטובר 2009). גם את הסיכוי לתיקו באותו מירוץ ספציפי בקנטאקי קל לחשב בעזרת סימולציה. הסיכוי לתיקו הוא כ-1.1% או 1 ל-90. סיכוי זעום ביותר? הכל בעיני המתבונן, כמובן.

ומה הסיכוי כי קול בודד ישנה את תוצאת הבחירות בישראל? על כך בפוסט הבא.

נשלח: 26 בדצמבר, 2012. נושאים: מה אומרת הסטטיסטיקה, על סדר היום, קבלת החלטות.
תגובות: 16 | טראקבק

"הצבעה אסטרטגית" – כן או לא?

כמקובל בכל מערכת בחירות, גם עתה שב ועולה נושא "ההצבעה האסטרטגית". הרעיון הוא כזה: אני יכול להצביע למפלגה קטנה שדעותיי קרובות לעמדותיה, או למפלגה גדולה שדעותיי קרובות גם לעמדותיה, אבל פחות. למי להצביע?

תשובה אפשרית אחת היא להצביע למפלגה שאני הכי קרוב לעמדותיה, במקרה זה – המפלגה הקטנה.

גישה אחרת מציעה לבחור לפי שיקולים אסטרטגיים: המפלגה הגדולה ודאי תעבור את אחוז החסימה ותיוצג בכנסת, בעוד שזה לא ודאי לגבי המפלגה הקטנה. ואם המפלגה הקטנה לא תעבור את אחוז החסימה – הקול שלי יבוזבז. גם אם תעבור המפלגה הקטנה את אחוז החסימה, השפעתה תהיה קטנה יחסית להשפעת המפלגה הגדולה, וגרוע מכך – היא תגרע מכוחה של המפלגה הגדולה ובכך תגביל את השפעתה. המסקנה המתבקשת – עלי להתפשר ולהצביע למפלגה הגדולה.

עוד מילה על בזבוז הקולות: אם המפלגה לה הצבעתי לא עברה את אחוז החסימה – מדובר בהרבה קולות שמתבזבזים. שלשום פרסמה מיה בנגל סטטוס בטוויטר בו כתבה כי שלושה מנדטים בבחירות 2009 נזרקו לפח. הטענה מתבססת על חיבור הקולות שקיבלו 9 מפלגות שאינן מפלגות ימין שלא עברו את אחוז החסימה בבחירות אלה. מדובר בקצת יותר מ-88 אלף קולות, ומכיוון שבכנסת ה-18 המודד למנדט (מספר הקולות המזכים במנדט) היה 27246 קולות, הרי שאותם 88 אלף קולות הם קצת יותר משלושה מנדטים. עיון בתוצאות הבחירות לכנסת ה-18 מעלה כי בסך הכל ניתנו כ-104 אלף קולות למפלגות שלא עברו את אחוז החסימה. שאר 16 אלפי הקולות ניתנו למפלגות "ימין", אך 16 אלף קולות אינם מזכים במנדט. כיוון שגוש המרכז שמאל בתחילת כהונת הכנסת ה-18 מנה 55 מנדטים, לו לא היו מתבזבזים אותם 104 אלפי קולות, גוש המרכז שמאל היה מונה 58 מנדטים. עדיין לא מספיק כדי לשנות את התוצאה הסופית של הבחירות – הקמת ממשלת ימין בראשות נתניהו, אך מאזן הכוחות בכנסת היה שקול יותר, וזה מצב טוב יותר לאופוזיציה (במסגרת הגילוי הנאות אספר כי אני מצביע בקביעות לאחת ממפלגות האופוזיציה).

האמנם?

התשובה המיידית היא כמובן "לא". ההסבר פשוט: אם יצורפו אותם 88 אלף קולות למפלגות שעברו את אחוז החסימה, מספר הקולות הדרוש למנדט יגדל מ27246 ל-28100 בערך, וזה אוצר כי בחלוקה הראשונית של המנדטים וגם בהמשך החלוקה (בחישובי העודפים לפי חוק בדר-עופר) יקבלו חלק מהמפלגות פחות מנדטים. אלו מפלגות? זה כבר תלוי בפרטים.

קל לבדוק מה היה קורה אילו. נתוני ההצבעה קיימים, וכל מה שצריך זה "לקחת" את הקולות מהמפלגות שלא עברו את אחוז החסימה, להעביר אותן למפלגות שעברו אותו, ולחשב מחדש את חלוקת המנדטים לפי חוק בדר-עופר (זה דווקא מסובך, אבל אפשרי). אז עשיתי זאת.

החישובים שערכתי מתבססים על ההנחות הבאות:

1) רק המצביעים של ארבע המפלגות הגדולות ביותר שלא עברו את אחוז החסימה (התנועה הירוקה מימד, גיל – גמלאי ישראל לכנסת, עלה ירוק, מפלגת הירוקים) יצביעו "הצבעה אסטרטגית" בחישובים ההיפותטיים שלי. מפלגות אלה קיבלו 71 אלף קולות יחד. שהיו ככל הנראה מספיקים ל-3 מנדטים בכנסת (בזכות עודף הקולות הגדול שהיה נשאר לאחר חלוקת המנדטים הראשונית).

2) המצביעים של שאר המפלגות הקטנות (שכל אחת מהן קיבלה פחות מ-7000 קולות, ובדרך כלל הרבה פחות מכך) היו מצביעים עבורן בכל מקרה, וגם לו היו משנים את הצבעתם, זה לא היה משפיע על תוצאות הבחירות.

3) המצביעים של ארבע ה-"קטנות הגדולות" יתפלגו בין המפלגות הגדולות להם הם מצביעים בניתוח ההיפותטי שלי בהתאם ליחס מספר הקולות בין המפלגות הגדולות, ובפרט:

א. קולות התנועה הירוקה מימד יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.

ב. קולות גיל – גמלאי ישראל לכנסת יתחלקו בין קדימה, הליכוד, ישראל ביתנו, ומפלגת העבודה ביחס: 34% : 33% : 18% : 15%.

ג. קולות עלה ירוק לכנסת יתחלקו בין קדימה, ישראל ביתנו, ומפלגת העבודה ביחס: 51% : 27% : 23% .

ד. קולות מפלגת הירוקים יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.

לפי הנחות אלה, מבין 71 אלפי המצביעים ל-"קטנות הגדולות", כ-40 אלף מעבירים את קולם לקדימה, 6 אלפים לליכוד, 7 אלפים לישראל ביתנו ו- 18 אלף למפלגת העבודה.

בדקתי מספר תרחישים:

1) הצבעה אסטרטגית של כל מצביעי ארבע "הקטנות הגדולות", כלומר אותם 71 אלף קולות מתחלקים בין קדימה, הליכוד, ישראל ביתנו והעבודה כמפורט למעלה.

2) הצבעה אסטרטגית ימין-מרכז: קדימה, הליכוד וישראל ביתנו מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", 18 אלף קולות פוטנציאליים של מפלגת העבודה הולכים לאיבוד.

3) הצבעה אסטרטגית שמאל-מרכז: קדימה, והעבודה מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", אך הקולות הפוטנציאליים של הליכוד וישראל ביתנו הולכים לאיבוד.

4) הצבעה אסטרטגית ימין-שמאל: הליכוד, ישראל ביתנו, והעבודה מקבלות תוספת קולות ממצביעי ארבע "הקטנות הגדולות", אך הקולות הפוטנציאליים של קדימה הולכים לאיבוד.

5) הליכוד זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

6) העבודה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

7) קדימה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

התוצאות הלא מפתיעות: גוש ה-"שמאל-מרכז" (קדימה, העבודה, מרץ, חדש, רעם-תעל ובלד) שמנה בתחילת הכהונה של הכנסת ה-18 55 מנדטים אינו משתנה באופן משמעותי. ברוב התרחישים הוא גדל ל-56 מנדטים. הנה עיקרי התוצאות (השינויים הפרסונליים על פי רשימות המועמדים באתר הכנסת, הפירוט המלא בקובץ האקסל המצורף, וכן מצוךף לינק לתכנית ה-SAS שכתבתי לצורך חישובי המנדטים):

1) הצבעה אסטרטגית של כל מצביעי ארבע "הקטנות הגדולות": קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

2) הצבעה אסטרטגית ימין-מרכז קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

3) הצבעה אסטרטגית שמאל-מרכז: קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

4) הצבעה אסטרטגית ימין-שמאל: העבודה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף נכנסת לכנסת במקום אלכס מילר.

5) הליכוד זוכה בכל הקופה: הליכוד עולה בשני מנדטים על חשבון קדימה ושס; גוש השמאל-מרכז מונה 54 מנדטים. אללי אדמסו ויצחק דנינו נכנסים לכנסת במקום אורית זוארץ ואברהם מיכאלי.

6) העבודה זוכה בכל הקופה: העבודה עולה בשני מנדטים על חשבון קדימה וישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף וראלב מגאדלה נכנסים לכנסת במקום אורית זוארץ ואלכס מילר.

7) קדימה זוכה בכל הקופה: קדימה עולה בשני מנדטים על חשבון ישראל ביתנו ושס; גוש השמאל-מרכז מונה 57 מנדטים. יוליה שמאלוב- ברקוביץ ונינו אבסדזה נכנסים לכנסת במקום אלכס מילר ואברהם מיכאלי.

המסקנה שלי מהתרגיל התיאורטי שערכתי: ההשפעה של "הצבעה אסטרטגית" מוגבלת ביותר, ויש לה פוטנציאל מוגבל מאוד לשנות את התוצאות המהותיות של הבחירות, רק כאשר המאבק בין הגושים צמוד ביותר. לו לא היו הולכים אותם קולות שניתנו למפלגות שלא עברו את אחוז החסימה, המרוויחה הגדולה ביותר הייתה ככל הנראה יוליה שמאלוב-ברקוביץ.

את המסקנות לבחירות הקרובות מוזמן כל אחד להסיק בעצמו. אני, באופן אישי, אמשיך להצביע על פי צו מצפוני, ואתן את קולי לאותה מפלגה קטנה שקיבלה אותו מאז 1984 בכל גילגוליה.

נשלח: 17 בנובמבר, 2012. נושאים: הממ... מעניין..., חשבון פשוט, על סדר היום, קבלת החלטות.
תגובות: 25 | טראקבק

עצתו של אריאל רובינשטיין לברק ולבני בעניין המצב הכלכלי

וכך כתב היום בכלכליסט חתן פרס ישראל לכלכלה, פרופ' אריאל רובינשטיין:
יקיריי, מנהיגי ישראל. עצתי היחידה לכם היא שתפסיקו להאזין לכלכלנים. הרי, איך ייתכן שאחרי התמוטטות השיטה הכלכלית, שלחברי הפורום שזימנתם היה חלק בהאדרתו, אתם עדיין מאמינים שיש להם מה לומר על כלכלה יותר משבעה אנשים מקריים שתלקטו ברחוב? "טובי הכלכלנים" מודים שאין להם מושג מה קרה ומה יקרה. הידע המקצועי הכלכלי המוחזק במוחות השבעה הוא אותו ידע שביסס את הסברה שמחירי המקרקעין באמריקה לא יכולים לצנוח, שהמכשירים הפיננסיים ההזויים הם תעודת ביטוח של כלכלת העולם, ושהמצב הכלכלי בעולם לא היה טוב יותר מאז שאדם וחוה נזרקו משערי גן עדן.

פורסם לראשונה באתר "רשימות" בתאריך 7 באוקטובר 2008 שם התקבלו 15 תגובות

אלון בתאריך 10/7/2008 4:01:15 PM

ללא נושא

אז אולי כדאי לקחת את הפרס שלו ממנו,
בשביל מה לתת פרס למי שלא יודעים כלום על שום דבר…

מרק ק. [אתר] בתאריך 10/7/2008 4:49:47 PM

ללא נושא

ובאותם טיעונים ניתן לפסול את כל יתר "מדעי החברה". מתי פעם אחרונה שמעת על סוציולוג שמוכן לנבא משהו?
מעבר לזה מה שאלון אמר. אם אין שום מדע בכלכלה אז על מה הוא קיבל את הפרס ואם יש אז מאיפה הוא טוען שלא ניתן לתת עיצות משמעותיות?

אזרח. בתאריך 10/7/2008 5:20:17 PM

אריאל רובינשטיין הוא איש יקר.

http://arielrubinstein.tau.ac.il/articles/yedioth_071907.htm

http://arielrubinstein.tau.ac.il/
רובינשטיין צודק.קצת ענווה מצד כל ה"מומחים" לא תזיק.וכמו שאמר John Maynard Keynes,
If economists could manage to get themselves thought of as humble, competent people, on a level with dentists, that would be splendid.
John Maynard Keynes .
http://sedulia.blogs.com/sedul….s/2006/08/keynes_on_pract.html

עומר בתאריך 10/7/2008 6:07:17 PM

אליה וקוץ בה,

אם כדאי להפסיק לקבל עצות מכלכלנים כדאי גם להפסיק לקבל עצות מאריאל רובינשטיין ולכן לא כדאי לשמוע לעצתו להפסיק לשמוע לכלכלנים…
וברצינות – אריאל רובינשטיין הוא אחד מאריות תורת המשחקים. אלא שכמו רבים ששיקעו את עצמם בחקר התיאוריה הוא מנותק לחלוטין מהמציאות ולפעמים קצת מביך לשמוע אותו מתבטא בענייני דיומא או לראות איך הוא מנהל מחקר אמפירי; גם כאן הוא טועה. היו כלכלנים שחזרו והזהירו מפני חלוקת אשראי זול ובעיקר בתחום הנדל"ן במשך שנים ארוכות. אחד הקולניים שבינהם – פיטר שיף ספג עלבונות רבים כל אימת שהתראיין במהלך השנים 2005-2007 ואפילו כעת יש מי שמעזים להמשיך ולהתווכח. אני חושב שבניגוד לדעתו של רובינשטיין כדאי להקשיב לכלכלנים. פשוט צריך להקשיב לאלה שתחזיותיהם במספר תחומים התקיימו במדוייק ולא לאלה שהביאו אותנו אל עבר פי פחת. למרבה צערו של רובינשטיין (ואני מנחש שגם למרבה צערך) משמעות העניין שצריך להתחיל להקשיב לאנשי האסכולה האוסטרית בכלכלה. אתה חושב שאריאל ואתה מוכנים לכך?

אלעד-וו בתאריך 10/7/2008 6:08:48 PM

don't feed the trolls

אלון הוא טרול ברור (או לחילופין טיפש גמור, אבל ניתן לו להנות מהספק). אבל מרק ק. — אתה פשוט מדהים אותי כל פעם מחדש ביכולת שלך לנשום עמוק ולגרגר כל דבר שמישהו הפריח לחלל האוויר.
אז, רק כדי שיהיה ברור, אני רוצה לחזור על דברי אלון, שמרק תמך בהם, בשביל הפעם הבאה שמישהו אשכרה שוקל לנהל דיון עם מרק ק.: "אז אולי כדאי לקחת את הפרס שלו ממנו,
בשביל מה לתת פרס למי שלא יודעים כלום על שום דבר… "
(כדי לתת קונטקסט לאלה שלא יודעים: מרק ק. הוא מהח'ברה של הקפיטליסט היומי, בלוג שאני אפילו לא טורח לקרוא יותר מרוב הטפשות ונומך-המצח המופגנים שם. ראו את התגובה של מרק — כזה הוא פרצופם, כזו היא יכולתם.)
.
ואם מרק בכל זאת רוצה להפסיק להביך את עצמו, אז אני מוכן להסביר לו לאט, שיבין: כלכלה היא מדע שעוסק בחקר מדוייק של מודלים של שווקים, ולפעמים מנסה ליישם את העקרונות שנלמדו, על שווקים אמיתיים. החלק הראשון הוא מתימטי בעיקרו, ומתעסק במערכות פשוטות שנקראות toy models. אין קשר לכלכלה אמיתית שהיא מערכת כאוטית ומורכבת ביותר. החלק השני קרוב יותר למדעי החברה, והאמינות שלו שנויה במחלוקת. החלק השני מתעסק בפיתוח שיטות שונות לחיזוי השוק, להסדרתו, לקביעת מדיניות, ועוד.
נסיון לחזות אם מניה תעלה או תרד ביום מסויים דומה לנסיון לחזות אם בשכונה שלי מחק הטמפרטורה בצל בצהרי היום תהיה 33 או 34. הנסיון לחזות את כיוונו של שוק שלם דומה לנסיון לחזות היכן יפגע הוריקן: או שמצליחים, או שלא.
פרופסור רובינשטיין הזהיר את לבני וברק לא להיות קלולסים כמו מרק ק. ולהניח שכלכלנים יודעים לספק תחזיות מדוייקות ואמיתיות על שווקים אמיתיים. אני חוזר: או חישובים אמיתיים על מודלים דמיוניים, או תחזיות משוערות ולא-מבוססות על שווקים אמיתיים. אין גם וגם.

מרק ק. [אתר] בתאריך 10/7/2008 7:51:56 PM

ללא נושא

אלעד, אם זה לא היה ביתו של יוסי ולא היו כמה אנשים סוציאליסטים שאני מכבד את דעתם הייתי שואל אותך האם כל הסוציאליסטים מטומטמים כמוך.
השטויות שכתבת על כך שהתנהגות המניות היא רנדומלית רק מוכיחה את הצורך בלימודי כלכלה סטטיסטיקה וחשיבה מדעית בתיכון. אם היית נותן טיפה כבוד לאתר שאליו שלחת את התגובה המטופשת שלך היית חושב על הוכחה אמפירית לכך שהתנהגות המניות היא רנדומלית. הוכחה אפשרית אחד היא שלשתי מניות שהונפקו באותו זמן יש ערך שאין לו שום מתאם לרווחי החברה בחמש השנים האחרונות.
עכשיו לך ותוכיח את הטענה שלך.

אלעד-וו בתאריך 10/7/2008 8:39:33 PM

למרק

לא אגיב על המחמאות שלך.
לא טענתי שהתנהגות המניות לא רנדומלית, אלא שהיא כאוטית. חבל שאתה לא מבין את ההבדל.
בכל מקרה, ביקשת ממני להוכיח את טענתי. לא ניתן להוכיח שהתנהגות היא כאוטית (או רנדומלית, לצורך זה) יותר משניתן להוכיח שמזג האוויר הוא כאוטי, או שאין "תורה של הכל" פיזיקלית, או שאין לי אחות.
אני טענתי שלא ניתן לחזות בוודאות התנהגות של מניות בודדות. אתה לא מסכים איתי. נו, תצביע על תוכנה אחת או כלכלן אחד שמסוגלים לחזות התנהגויות בפרטנות כזאת. אם תעשה את זה, אני מבטיח בעצמי ללכת לאריאל רובינשטיין ולדרוש ממנו את פרס ישראל בחזרה. עד אז, תרד מהעץ ותודה שקשקשת, ושכלכלנים שמנסים לחזות את השוק לא אמינים בהרבה ממגדת עתידות.
אגב, כשאתה גומר להוכיח לי שצדקת, תנסה לפתח את הפסיכוהיסטוריה של אסימוב.

אבי בתאריך 10/7/2008 11:44:42 PM

ללא נושא

הנה תחזית של יצחק תשובה מלפני חצי שנה.
תשובה שהינו בעל הון שעשה הון עתק מנדל"ן אמור להבין את השוק, לנתח אותו במדיוק ולספק תחזית ראויה, אך במקום זאת הנה תחזיתו
http://www.ynet.co.il/articles/0,7340,L-3519858,00.html
פנינים מתוך תחזיתו: "משבר הנדל"ן בארה"ב יחלוף עד תום השנה, אין הרבה אופציות", "ברבעון השני של 2008 הבנקים כבר יתחילו לעשות עסקים ולמכור נכסים שבכינוס, והוא ייראה טוב יותר, גם אם עדיין לא רווחי מאוד. ברבעון השלישי כבר תתחיל התעוררות ממשית עם יותר הכנסות, והרבעון הרביעי יהיה מצוין. סביר להניח שמשבר הסאב־פריים יימחק מעל פני האדמה עד סוף השנה כלא היה, והערכים של הנדל"ן יעלו חזק למעלה" והאהוב עלי "אתה לא חושב שאחד מהבנקים יפשוט את הרגל?
"לא, לא הבנקים הגדולים. כפי שזה נראה היום, הם יחזיקו מעמד"

אלעד-וו בתאריך 10/8/2008 4:20:14 AM

אבי

תשובה הוא איש עסקים בעל רקע מפוקפק, הוא לא אילן אקדמי להיתלות בו. אין בעיה למצוא כלכלנים מכובדים שטעו והטעו. תשובה לא רלוונטי לדיון.

עמית [אתר] בתאריך 10/8/2008 5:05:56 AM

ועל זה נאמר:

"financial forecasting is a science that makes astrology respectable".
הציטוט הוא של ברטון מלקיאל, אחד מגדולי הכלכלנים החיים היום…

עמית [אתר] בתאריך 10/8/2008 5:12:42 AM

ואגב,

ישנם מחקרים שמאששים את "השערת השוק היעיל" בהקשר של ערכי מניות. כלומר שמראים שלא ניתן לחזות ערכי מניות על סמך ערכן בעבר. או במלים אחרות – התנהגות מחירי המניות מאד קרובה לרנדומלית.
השערת השוק היעיל היא השערה די מקובלת בכלכלה… לא הייתי מבטל אותה בהינף יד מזלזל.

דפנה לוי [אתר] בתאריך 10/8/2008 8:34:07 AM

הי יוסי

האם חזאים וכלכלנים אינם בעצם אלא ספקולטורים?. כלומר מדובר במדע ספקולטיבישהנחותיו והשערותיו מבוססות על צפיות ותחזיות וניתוח תנודות משקיעים.
אם כך, מכסה פשעיו לא יצליח, ומודה ועוזב ירוחם…
שנה טובה

מרק ק. [אתר] בתאריך 10/8/2008 10:34:44 AM

ללא נושא

אלעד, על גזים שמעת? איך מתנהגת מולקלות גז בודדת? נכון בצורה כאוטית. האם זה מנע ממשהו לפתח חוקי פיזיקה לגזים?
אתה יכול לטעון שההתנהגות של מחיר מניה בכל נקודת זמן ספציפית היא כאוטית אבל לאורך זמן מניה מתנהגת בצורה שמשקפת את השווי הריאלי של החברה, וכמו בתורת הגזים ובפסיכוהיסטוריה כאשר יש יותר שטרות שנסחרים של אותה מניה ההתנהגות שלה הופכת להיות יותר ויותר צפויה בכל נקודת זמן. אם ההתנהגות של מניות היא כיאוטית לחלוטין היא למעשה רנדומלית ואף בן אדם שפוי לא היה סוחר במניות אלא בקזינו, כי בקזינו לפחות יודעים את הסיכוי להפסיד.
למעשה כל הקישקוש הזה רלבנטי לכל דבר סחיר. איך מתנהג מחיר של עגבניה בכל יום? לא בצורה כאוטית? האם זה ימנה ממך מלהניח הנחות על המחיר של עגבניה בסופר ביום שישי? האם זה מונע מחקלאים לבצע חיזוי של מחירי העגבניות לפני שהם שותלים אותן? אם זה באמת כל כך כאוטי למה הם מתאמצים לבצע את החיזוי?
ואולי דוגמא מטופשת אחרת. האם העובדה שחזאי מזג האויר לא מסוגלים לחזות במדויק ולפעמים את הטמפרטורה והלחות למחרת אומרת שלא צריך לשדר את התחזית? (וזה בעצם הטיעון של רובינשטיין)
ובבקשה אל תעמיד פני קדוש נוצרי סלחני. אני מנהל פה דיאלוג עם יוסי כבר יותר מארבע שנים וזה אתה שהחלטת להפגין את הבורות שלך ולקרוא לי טרול והכפלת אותה כאשר החלטת שיש לי קשר כלשהו לקפיטליסט היומי (אני קורא לפעמים אבל אני לא אוהב כתיבה דתית אפילו אם אני מסכים איתה).

אלעד-וו בתאריך 10/9/2008 8:30:20 PM

ללא נושא

עכשיו נראה שאתה מסכים איתי שמחירה של מניה בודדת בכל זמן נתון לא ניתן לחזייה, אבל אתה טוען שבטווח הארוך "מניה מתנהגת בצורה שמשקפת את השווי הריאלי של החברה". זה קישקוש. במקרה הטוב, שינוי מחיר מנייה מייצג את הכיוון שספקולנטים חושבים שהמנייה תלך בו. (וראה ההסבר של הג'ונים הארוכים שאני מצרף למטה).
"היא למעשה רנדומלית ואף בן אדם שפוי לא היה סוחר במניות אלא בקזינו, כי בקזינו לפחות יודעים את הסיכוי להפסיד. "
עכשיו הצלחת להוכיח שאתה גם לא מבין בני אדם. אתה וחבריך שכנעתם אנשים שמניות מתנהגות באופן רציונאלי. פלא שהם משקיעים בבורסה ולא בקזינו? חוץ מזה, אאל"ט עמלת התיווך (כלומר האחוז שהולך למפעיל מתוך סך הכסף במחזור) קטנה בבורסה מאשר בקזינו. אז גם אם הבורסה רנדומלית לגמרי, יתכן עדיף להשקיע בה.
לבסוף, כשמישהו הרוויח בבורסה אז הוא נחשב חכם, וכשמישהו הפסיד אז הוא לא מספר. על מי שמרוויח בקזינו חושבים רק שיש לו מזל.
לגבי הפסקה השלישית שלך ("צריך לשדר גם את תחזית מזג האוויר וגם את תחזית המניות") היא נשמעת הגיונית מאד, ואכן מה שיצר את משבר הסאב-פריים אינו משקיעים בודדים, אלא התנהלות פסולה של גופים גדולים.
בכל מקרה, הנקודה של אריאל רובינשטיין היא שיועצים כלכליים מייחסים לעצמם יכולת גבוהה מיכולתם האמיתית. נראה לי שבשלב זה בדיון אפילו אתה לא תתווכח על זה. כל החוכמולוגים שאומרים שאם זה מה שרובינשטיין מאמין אז על מה הוא זכה בפרס ישראל הם קשקשנים. הוא זכה בפרס עשראל על עבודה תיאורטית, ב-toy models.
וההסבר של הלונג ג'והנס, שהגעתי אליו דרך לינק מהאתר של פרופ' רובינשטיין:
http://www.youtube.com/watch?v=UC31Oudc5Bg

יונתן בתאריך 10/21/2008 7:06:18 PM

ממשיכים למדל את טבע האדם

על הסיבות למשבר הסאב פריים בוודאי ייכתבו עבודות דוקטורט רבות, אך אני מקווה שנסכים שבבסיס הכשל הוא שילוב בין תאוות בצע, חוסר מקצועיות ותמימות.
אני מאמין שמוקדם מכדי להספיד את דעות הכלכלנים. נהפוך הוא- אני מאמין שנתחיל לראות מודלים כלכליים המביאים בחשבון גם חוסר מקצועיות ותמימות של ה"מקצוענים".

נשלח: 8 בדצמבר, 2008. נושאים: כלכלה וחברה, על סדר היום, קבלת החלטות.
תגובות: 1 | טראקבק