חיפוש באתר

קישורים

עמודים

קטגוריות

ארכיב עבור 'הממ… מעניין…'

בעיית המטריות: איך לא להירטב?

השבוע שוב פרסמתי בטוויטר חידה הסתברותית: לבנאדם יש המון מטריות, חלקן בבית וחלק במשרד. אם יורד גשם הוא לוקח איתו מטריה מהמלאי. אם לא, הוא הולך לדרכו בלי לקחת מטריה. האם הוא יירטב? מספר המשיבים היה קטן יחסית, אבל רובם ידעו את התשובה הנכונה: בסופו של דבר הוא יירטב.

פתרון החידה מתבסס על מודל הסתברותי הנקרא שרשרת מרקוב. בויקיפדיה יש הסבר פורמלי טוב של המושג ההסתברותי. כאן, כהרגלי, אנסה להסביר את המושג באופן יותר אינטואיטיבי. לאחר ההסבר הבסיסי אסביר מדוע שרשרת מרקוב היא מודל טוב עבור החידה, ואראה כיצד מגיעים לפתרון.

שרשרת מרקוב היא תהליך מקרי. לשרשרת יש מספר מצבים (שיכול להיות סופי או אינסופי), ובכל צעד בשרשרת, נמצאים באחד המצבים האפשריים, ובצעד הבא עוברים ממצב זה למצב אחר, או נשארים במקום. המעבר נקבע באופן מקרי על סמך הסתברויות קבועות.

לדוגמא, נניח שיש לנו שרשרת מרקוב שבה יש שלושה מצבים אפשריים. נסמן אותם בספרות 0, 1, ו-2. השרשרת יכולה להראות כך: 0, 2, 1, 0, 0, 2, 1, 2, … וכן הלאה. פירוש הדבר הוא שהתחלנו במצב 0, משם עברנו למצב 2, משם עברנו למצב 1, וכן הלאה.

התכונה החשובה של המודל ההסתברותי הזה היא שלא משנה באיזה מצב נמצאים, המעבר למצב הבא לא תלוי בהיסטוריה של השרשרת, אלא רק במצב הנוכחי. אם השרשרת נמצאת במצב 2, למשל, ההסתברות שהיא תעבור למצב 1 היא אותה הסתברות גם במקרה שהשרשרת הגיע למצב הנוכחי ממצב 0 וגם במקרה שהיא הגיע למצב הנוכחי ממצב 1 או 2. כלל המעבר הוא אותו כלל.

כלל מעבר אפשרי כאשר נמצאים במצב 0, הוא שעוברים ממנו למצב 1 בהסתברות 1/2, עוברים למצב 2 בהסתברות 1/3, או שנשארים במצב 0 בהסתברות 1/6.[1]. באופן דומה יש לנו כללי מעבר דומים כאשר נמצאים במצב 1 או במצב 2.

עכשיו נראה איך המושג של שרשרת מרקוב עוזר לנו לפתור את בעיית המטריות.

בואו נסתכל תחילה על מקרה פרטי, בו לאיש שלנו יש רק מטריה אחת. נגדיר את המצבים של השרשרת להיות מספר המטריות שעומדות לרשות האיש. זה פשוט: או שיש לו מטריה במקום שבו הוא נמצא, או שאין לו. לכן המצבים האפשריים יהיו 0 ו-1.

איך הוא עובר ממצב למצב? זה תלוי בהסתברות שירד גשם. ההסתברות הזו לא נתונה לנו, ולכן אניח כי ההסתברות שירד גשם במקום בו הוא נמצא ועומד לצאת לדרכו היא קבועה ושווה ל-P כאשר P הוא מספר כלשהו בין 0 ל-1 (לא כולל את 0 ו-1). בכך הגדרנו מודל המתאר את תנאי החידה.[2]

אם האיש שלנו נמצא במצב 1, כלומר יש לו מטריה בהישג יד, ויורד גשם, הוא ייקח עימו את המטריה למחוז חפצו, ושם שוב תעמוד המטריה לרשותו, כלומר הוא יישאר במצב 1. זה קורה בהסתברות P. אם לעומת זאת יש לו מטריה ולא יורד גשם, הוא הולך לדרכו בלי המטריה, ואז, במחוז חפצו, לא תעמוד לרשותו המטריה, כלומר הוא עובר ממצב 1 למצב 0 בהסתברות 1-P.

לעומת זאת, אם הוא נמצא במצב 0, אז הוא יעבור למצב 1 בהסתברות 1, כי לא משנה אם יורד גשם או לא יורד גשם, אין לו ברירה אלא לצאת לדרכו בלי מטריה, והמטריה תחכה לו במחוז חפצו.

כמובן, אם הוא נמצא במצב 0 ויורד גשם, אז הוא יירטב.

כעת אטען כי אם נסתכל על כל הפעמים שהוא נמצא במצב 1, בסופו של דבר הוא יעבור בודאות למצב 0. תחשבו על קוביה. אם תטילו אותה פעם אחת, ההסתברות שהיא תראה 6 היא 1/6. אבל ככל שתטילו אותה יותר ויותר פעמים גדל הסיכוי ש-6 יופיע בסופו של דבר. יתרה מזאת, אם נמשיך להטיל את הקוביה עוד ועוד, המספר 6 יופיע עוד ועוד פעמים. אם נטיל את הקוביה אינסוף פעמים, המספר 6 יופיע אינסוף פעמים, וזאת בהסתברות של 100%.[3].

באופן דומה אפשר להוכיח כי אם נסתכל על כל הפעמים שהוא נמצא במצב 0, ואם השרשרת תרוץ עד איסוף הוא יהיה במצב 0 איסוף פעמים, בסופו של דבר ירד שם גשם, ולכן הוא יירטב.

מה קורה אם יש לו יותר ממטריה אחת?

כעת המצבים הם 0, 1 , ו-2.

אם יש לו מטריה אחת (מצב 1), הוא יעבור למצב 2, בו יש לו שתי מטריות, בהסתברות P (יורד גשם, והוא לוקח איתו את המטריה למקום שיש בו כבר מטריה אחת) או שיישאר במצב 1 (לא יורד גשם, ולכן הוא הולך בלי מטריה למקום ששיש בו מטריה אחת).

אם יש לו 2 מטריות הוא נמצא במצב 2, ויכול לעבור משם למצב 0 (כאשר לא יורד גשם, ולכן הוא הולך למקום בו אין לא אף מטריה) או לעבור למצב 1 (יורד גשם, הוא לוקח עימו מטריה למקום בו אין מטריות, ולכן תעמוד שם לרשותו מטריה 1.

אם הוא במצב 0 ויורד גשם הוא יירטב.

אם השרשרת תרוץ מספיק זמן היא תגיע בסופו של דבר למצב 0, ובסופו של דבר ירד גשם כאשר הוא במצב 0, אז הוא יירטב.

ומה אם יש לו המון מטריות? 4, או 50 או 1000? זזה לא משנה. הטיעון עדיין עובד. בסופו של דבר הוא יגיע למצב 0 כאשר יורד גשם, כלומר בסופו של דבר הוא יירטב.

מסקנה: תמיד תקחו אתכם את המטריה.


הערות
  1. ודאו ששלושת ההסתברויות שציינתי מסתכמות ל-1! []
  2. אני סבור שגם כאשר P משתנה ואינו קבוע כל הזמן אפשר להגדיר שרשרת מרקוב מתאימה, עם מספר אינסופי של מצבים, ולהגיע לאותה תשובה, אך לא אכנס לזה כאן, או בכלל []
  3. אפשר להוכיח זאת באופן מתמטי []

אחד מהם הוא בן

לפני יומיים ערכתי סקר בטוויטר. שאלת הסקר הייתה: במשפחה יש שני ילדים. אחד מהם הוא בן. מה הסיכויים שגם הילד האחר הוא בן? הוצעו 4 תשובות אפשריות: חצי, רבע, שליש, או שאף תשובה אינה נכונה. בסקר השתתפו 205 צייצנים (שבשום אופן אינם מדגם מייצג), ולהלן התוצאות:

 

 

 

 

 

 

 

 

לאחר שהעליתי את הסקר נזכרתי כי העליתי בעבר רשימה שהציגה את החידה הזו ובנוסף הציגה ווריאציה קשה יותר של החידה, תחת הכותרת “ילדה ושמה יוספה“. אתם מוזמנים לעיין ברשימה שעסקה בפתרון שתי החידות. ברשימה זו אדון שוב בפתרון החידה שהוצגה בסקר והתוצאות  מפתיעות. מתברר שיש יותר מתשובה נכונה אחת.

בואו נדון בתשובות.

התשובה הנפוצה ביותר היא חצי. איני יודע מה הוביל 131 איש לענות “חצי”, אך מנסיוני אני סבור כי רובם שקלו את השיקול הבא: ילד אחד הוא בן. הילד השני יכול להיות בן או בת, וההסתברות לכך היא 50:50. הבעיה בתשובה הזו: התשובה מתעלמת מהנתון שאומר כי אחד מהילדים הוא בן. לא נאמר האם הילד הראשון הוא בן, או האם הילד השני הוא בן. צריך לקחת את זה בחשבון.

איך ניקח זאת בחשבון? צריך לשים לב כי יש ארבעה סוגי משפחות בנות שני ילדים:

  • הבכור בן, הצעירה בת
  • הבכור בן, הצעיר בן
  • הבכורה בת, הצעיר בן
  • הבכורה בת, הצעירה בת

לכל אחד מסוגי המשפחות יש הסתברות של 0.5*0.5=0.25 (תחת הנחות מסויימות, שמייד אדון בהן). המשפחה שלנו אינה משפחה עם שתי בנות (כי ידוע לנו שאחד מהילדים הוא בן). זה מותיר אותנו עם 3 סוגי משפחות אפשריות: בן-בן, בן-בת, ובת-בן. מתוכן ישש רק מבנה משפחה אחד עם שני בנים. לכן ההסתברות כי במשפחה יש שני בנים היא 1/3. וזו התשובה הנכונה (או שלא?)

כל זה נכון, בתנאי שמניחים מספר הנחות:

  1. כל ילד הוא בהכרח בן או בת
  2. הסיכוי ללידת בן שווה לסיכוי ללידת בת
  3. אין קשר בין מין הילד הבכור ומין הילד השני.

אפשר לטעון, ובהחלט בצדק כי ההנחות (או חלקן) אינן תקפות. ב-2017 כבר מכירים בעובדה שמגדר אינו הכרח בינארי[1], ולכן הנחה מספר 1 אינה בהכרח נכונה[2]. ידוע כי הנחה מספר 2 אינה נכונה. נולדים יותר בנים מבנות[3]. יש לכך סיבות רבות שלא יידונו כאן. אחת הצייצניות העלתה טענה כי אם במשפחה הילד הבכור הוא בן, אז יש סיכוי גבוה יותר כי הילד השני יהיה בן.[4]

אם מקבלים את הביקורת על תקפות ההנחות (או חלק מהביקורת) אז התשובה 1/3 אינה בהכרח נכונה, ואז התשובה ש-“אף תשובה אינה התשובה הנכונה” היא התשובה הנכונה, ותשובה זו קבילה בעיניי.

מכאן הדברים מתחילים להסתבך.

הנה טוויסט בעלילה: התשובה 1/2 יכולה להיות נכונה! אפנה אתכם לניתוח המפורט של ד”ר גדי אלכסנדרוביץ, או שאולי תעדיפו את ההסבר בויקיפדיה. ההסבר בקצרה: לא ידוע לנו איך נבחר הבן עליו נאמר לנו כי הוא בן. אם יש בן אחד במשפחה – ברור מיהו הבן עליו נמסרה האינפורמציה. אם זו משפחה עם שני בנים – אז יכול להיות שהבן עליו דיברו הוא הבכור, ויכול להיות כי הבן עליו דיברו הוא הבן הצעיר. בהנחה (שוב הנחה!) שבמקרה של שני בנים הבן עליו דיברה החידה נבחר באופן מקרי ואחיד (כלומר בהסתברות 1/2) מבין שני הבנים, החישוב ההסתברותי (שלא אפרט כאן) מראה כי ההסתברות שבמשפחה יש שני בנים היא 1/2.

אבל רגע: אם לוקחים בחשבון את אופן בחירת הבן שמדברים עליו (למרות שלא נאמר על כך דבר בניסוח החידה), למה שלא ניקח בחשבון משהו אחר שלא נזכר בחידה, נניח אם הילד שעליו מדובר נולד ביום שלישי או לא נולד ביום שלישי? תשאלו מה זה משנה. ובכן, זה משנה. הראיתי כבר כי אינפורמציה נוספת משנה את התמונה[5] אסביר. ההסבר טכני, ומי שלא מעוניין יכול לדלג על הדיון והנוסחאות..

ובכן יש לנו משפחה בה שני ילדים, ידוע לנו כי אחד הילדים הוא בן, אבל לא ידוע לנו אם נולד ביום שלישי, או שלא.  מכאן שיש 9 סוגי משפחות, אך כעת לכל סוג משפחה יש הסתברות שונה. אם נסמן את ההסתברות לכך שהבן נולד ביום שלישי באות היוונית ϵ (מסיבות שיובררו בהמשך). לדוגמא, ההסתברות שילד הוא בן וגם שהוא נולד ביום שלשי היא 0.5ε, כי אין תלות בין מין הילד והיום בו הוא נולד.תשעת סוגי המשפחות וההסתברויות שלהם הן[6]:

אז מה?

נחבר את ההסתברויות של סוגי המשפחות עם שני בנים שלפחות אחד מהם נולד ביום שלישי (מספר 1, 2, ו-4 ברשימה), ואחר כך נחבר את ההסתברויות של כל המשפחות שבהן יש לפחות בן אחד שנולד ביום שלישי (מספר 1, 2, 3, 4, ו-7 ברשימה) ונקבל, נחלק את ההסתברות הראשונה בהסתברות השנייה ונקבל כי ההסתברות שבמשפחה יש שני בנים אם ידוע שאחד מהם הוא בן שנולד ביום שלישי היא:

 

 

אם נציב במקום ϵ שביעית, נקבל כי ההסתברות היא 13/27.[7]

באופן דומה, נוכל לחשב כי ההסתברות  שבמשפחה יש שני בנים אם ידוע שאחד מהם הוא בן אבל אף בן לא נולד ביום שלישי היא:

 

 

בעזרת נוסחת ההסתברות השלמה נוכל לצרף את שתי ההסתברויות יחד ולמצוא את ההסתברות שבמשפחה יש שני בנים. הנוסחה משקללת את שתי ההסתברויות שחישבנו בהסתברויות התנאי: ההסתברות שלפחות אחד מהילדים הוא בן שנולד ביום שלישי (סכום ההסתברויות של מספרי 1, 2, 3, 4, ו-7 ברשימה)  וההסתברות המשלימה – של המאורע שאומר כי אין המשפחה ילד שנולד ביום שלישי.

על ידי סיכום ההסתברויות  1, 2, 3, 4, ו-7 נקבל כי ההסתברות שלפחות אחד מהילדים הוא בן שנולד ביום שלישי היא

 

 

ומכאן נקבל (על ידי הפחתת ההסתברות הזו מ-1) כי הסתברות המאורע המשלים (אין במשפחה בן שנולד ביום שלישי) היא 

 

כעת נוכל לשקלל את ההסתברויות ולקבל כי ההסתברות שבמשפחה יש שני בנים היא

 

 

עד כאן הנוסחאות.

 

נציב בנוסחה האחרונה שקיבלנו שביעית במקום ϵ ונקבל כי ההסתברות שבמשפחה יש שני בנים היא בערך 0.457. זה אומר שגם במקרה הזה תשובה ד בסקר היא התשובה הנכונה.

אבל למה לעצור כאן? לא ידועים על הילד עוד פרטים. למשל, לא ידוע לנו אם הילד נולד בין ה-1 בינואר ובין הארבעה בספטמבר, או שלא. אם נחליף את המאורע הזה במאורע “נולד ביום שלישי” נקבל כי ϵ הוא 248/365 או בקירוב 0.682. נציב 0.682 בנוסחה ונקבל כי ההסתברות שבמשפחה יש שני בנים היא 0.2501, כלומר גם תשובה ב נכונה!

מבולבלים? גם אני.[8] .

המסקנה שלי מכל הסיפור הזה היא שאסור לעשות שטויות. כשניצבת מולכם בעיה שכוללת נתונים מסויימים, עליכם להתמקד בנתונים של הבעיה, לבחון היטב את ההנחות, ולוודא כי מספר ההנחות שמניחים הוא קטן ככל האפשר.

 


הערות
  1. לא מצאתי מקור אמין הסוקר נושא זה. אשמח להפניות []
  2. היא אולי נכונה כשמדובר בשני ילדים קטנים, אבל הם יכולים להיות גם ילדים גדולים, בני 30 ו-32, למשל []
  3. קישור לנתוני הלשכה המרכזית לסטטיסטיקה – קובץ pdf []
  4. מצאתי מאמר אחד התומך בטענה הזו, אולם יש לי ביקורת עליו, ולדעתי התוצאה שלו חסרת משמעות. ראו כאן: http://www.sci-princess.info/archives/2055 []
  5. ילדה ושמה יוספה, זוכרים? []
  6. תחת שלוש ההנחות שצויינו למעלה, והנחה נוספת האומרת כן אין קשר בין מין הילוד ליום בשבוע בו נולד []
  7. זוהי, אגב, התשובה לחידה שפירסמתי כאן, ללא פיתרון []
  8. יכול להיות שיש לי טעות, ואם כן, אשמח אם מי מכם יגלה אותה ויספר לי מהי []

“הצבעה אסטרטגית” – כן או לא?

כמקובל בכל מערכת בחירות, גם עתה שב ועולה נושא “ההצבעה האסטרטגית”. הרעיון הוא כזה: אני יכול להצביע למפלגה קטנה שדעותיי קרובות לעמדותיה, או למפלגה גדולה שדעותיי קרובות גם לעמדותיה, אבל פחות. למי להצביע?

תשובה אפשרית אחת היא להצביע למפלגה שאני הכי קרוב לעמדותיה, במקרה זה – המפלגה הקטנה.

גישה אחרת מציעה לבחור לפי שיקולים אסטרטגיים: המפלגה הגדולה ודאי תעבור את אחוז החסימה ותיוצג בכנסת, בעוד שזה לא ודאי לגבי המפלגה הקטנה. ואם המפלגה הקטנה לא תעבור את אחוז החסימה – הקול שלי יבוזבז. גם אם תעבור המפלגה הקטנה את אחוז החסימה, השפעתה תהיה קטנה יחסית להשפעת המפלגה הגדולה, וגרוע מכך – היא תגרע מכוחה של המפלגה הגדולה ובכך תגביל את השפעתה. המסקנה המתבקשת – עלי להתפשר ולהצביע למפלגה הגדולה.

עוד מילה על בזבוז הקולות: אם המפלגה לה הצבעתי לא עברה את אחוז החסימה – מדובר בהרבה קולות שמתבזבזים. שלשום פרסמה מיה בנגל סטטוס בטוויטר בו כתבה כי שלושה מנדטים בבחירות 2009 נזרקו לפח. הטענה מתבססת על חיבור הקולות שקיבלו 9 מפלגות שאינן מפלגות ימין שלא עברו את אחוז החסימה בבחירות אלה. מדובר בקצת יותר מ-88 אלף קולות, ומכיוון שבכנסת ה-18 המודד למנדט (מספר הקולות המזכים במנדט) היה 27246 קולות, הרי שאותם 88 אלף קולות הם קצת יותר משלושה מנדטים. עיון בתוצאות הבחירות לכנסת ה-18 מעלה כי בסך הכל ניתנו כ-104 אלף קולות למפלגות שלא עברו את אחוז החסימה. שאר 16 אלפי הקולות ניתנו למפלגות “ימין”, אך 16 אלף קולות אינם מזכים במנדט. כיוון שגוש המרכז שמאל בתחילת כהונת הכנסת ה-18 מנה 55 מנדטים, לו לא היו מתבזבזים אותם 104 אלפי קולות, גוש המרכז שמאל היה מונה 58 מנדטים. עדיין לא מספיק כדי לשנות את התוצאה הסופית של הבחירות – הקמת ממשלת ימין בראשות נתניהו, אך מאזן הכוחות בכנסת היה שקול יותר, וזה מצב טוב יותר לאופוזיציה (במסגרת הגילוי הנאות אספר כי אני מצביע בקביעות לאחת ממפלגות האופוזיציה).

האמנם?

התשובה המיידית היא כמובן “לא”. ההסבר פשוט: אם יצורפו אותם 88 אלף קולות למפלגות שעברו את אחוז החסימה, מספר הקולות הדרוש למנדט יגדל מ27246 ל-28100 בערך, וזה אוצר כי בחלוקה הראשונית של המנדטים וגם בהמשך החלוקה (בחישובי העודפים לפי חוק בדר-עופר) יקבלו חלק מהמפלגות פחות מנדטים. אלו מפלגות? זה כבר תלוי בפרטים.

קל לבדוק מה היה קורה אילו. נתוני ההצבעה קיימים, וכל מה שצריך זה “לקחת” את הקולות מהמפלגות שלא עברו את אחוז החסימה, להעביר אותן למפלגות שעברו אותו, ולחשב מחדש את חלוקת המנדטים לפי חוק בדר-עופר (זה דווקא מסובך, אבל אפשרי). אז עשיתי זאת.

החישובים שערכתי מתבססים על ההנחות הבאות:

1) רק המצביעים של ארבע המפלגות הגדולות ביותר שלא עברו את אחוז החסימה (התנועה הירוקה מימד, גיל – גמלאי ישראל לכנסת, עלה ירוק, מפלגת הירוקים) יצביעו “הצבעה אסטרטגית” בחישובים ההיפותטיים שלי. מפלגות אלה קיבלו 71 אלף קולות יחד. שהיו ככל הנראה מספיקים ל-3 מנדטים בכנסת (בזכות עודף הקולות הגדול שהיה נשאר לאחר חלוקת המנדטים הראשונית).

2) המצביעים של  שאר המפלגות הקטנות (שכל אחת מהן קיבלה פחות מ-7000 קולות, ובדרך כלל הרבה פחות מכך) היו מצביעים עבורן בכל מקרה, וגם לו היו משנים את הצבעתם, זה לא היה משפיע על תוצאות הבחירות.

3) המצביעים של ארבע ה-“קטנות הגדולות” יתפלגו בין המפלגות הגדולות להם הם מצביעים בניתוח ההיפותטי שלי בהתאם ליחס מספר הקולות בין המפלגות הגדולות, ובפרט:

  א. קולות  התנועה הירוקה מימד יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.

  ב. קולות גיל – גמלאי ישראל לכנסת יתחלקו בין קדימה, הליכוד, ישראל ביתנו, ומפלגת העבודה ביחס: 34% : 33% : 18% : 15%.

  ג. קולות עלה ירוק לכנסת יתחלקו בין קדימה, ישראל ביתנו, ומפלגת העבודה ביחס: 51% : 27% : 23% .

  ד. קולות  מפלגת הירוקים יתחלקו בין קדימה ומפלגת העבודה ביחס של 69% ל-31%.

לפי הנחות אלה, מבין 71 אלפי המצביעים ל-“קטנות הגדולות”, כ-40 אלף מעבירים את קולם לקדימה, 6 אלפים לליכוד, 7 אלפים לישראל ביתנו ו- 18 אלף למפלגת העבודה.

בדקתי מספר תרחישים:

1) הצבעה אסטרטגית של כל מצביעי ארבע “הקטנות הגדולות”, כלומר אותם 71 אלף קולות מתחלקים בין קדימה, הליכוד, ישראל ביתנו והעבודה כמפורט למעלה.

2) הצבעה אסטרטגית ימין-מרכז: קדימה, הליכוד וישראל ביתנו מקבלות תוספת קולות ממצביעי ארבע “הקטנות הגדולות”, 18 אלף קולות פוטנציאליים של מפלגת העבודה הולכים לאיבוד.

3) הצבעה אסטרטגית שמאל-מרכז: קדימה, והעבודה מקבלות תוספת קולות ממצביעי ארבע “הקטנות הגדולות”, אך הקולות הפוטנציאליים של הליכוד וישראל ביתנו הולכים לאיבוד.

4) הצבעה אסטרטגית ימין-שמאל: הליכוד, ישראל ביתנו, והעבודה מקבלות תוספת קולות ממצביעי ארבע “הקטנות הגדולות”, אך הקולות הפוטנציאליים של קדימה הולכים לאיבוד.

5) הליכוד זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

6) העבודה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

7) קדימה זוכה בכל הקופה ומקבל את כל 71 אלפי הקולות.

התוצאות הלא מפתיעות: גוש ה-“שמאל-מרכז” (קדימה, העבודה, מרץ, חדש, רעם-תעל ובלד) שמנה בתחילת הכהונה של הכנסת ה-18 55 מנדטים אינו משתנה באופן משמעותי. ברוב התרחישים הוא גדל ל-56 מנדטים. הנה עיקרי התוצאות (השינויים הפרסונליים על פי רשימות המועמדים באתר הכנסת, הפירוט המלא בקובץ האקסל המצורף, וכן מצוךף לינק לתכנית ה-SAS  שכתבתי לצורך חישובי המנדטים):

1) הצבעה אסטרטגית של כל מצביעי ארבע “הקטנות הגדולות”: קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

2) הצבעה אסטרטגית ימין-מרכז קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

3) הצבעה אסטרטגית שמאל-מרכז: קדימה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. יוליה שמאלוב- ברקוביץ נכנסת לכנסת במקום אלכס מילר.

4) הצבעה אסטרטגית ימין-שמאל: העבודה עולה במנדט על חשבון ישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף נכנסת לכנסת במקום אלכס מילר.

5) הליכוד זוכה בכל הקופה: הליכוד עולה בשני מנדטים על חשבון קדימה ושס; גוש השמאל-מרכז מונה 54 מנדטים. אללי אדמסו ויצחק דנינו נכנסים לכנסת במקום אורית זוארץ ואברהם מיכאלי.

6) העבודה זוכה בכל הקופה: העבודה עולה בשני מנדטים על חשבון קדימה וישראל ביתנו; גוש השמאל-מרכז מונה 56 מנדטים. עינת וילף וראלב מגאדלה נכנסים לכנסת במקום אורית זוארץ ואלכס מילר.

7) קדימה זוכה בכל הקופה: קדימה עולה בשני מנדטים על חשבון ישראל ביתנו ושס; גוש השמאל-מרכז מונה 57 מנדטים. יוליה שמאלוב- ברקוביץ ונינו אבסדזה נכנסים לכנסת במקום אלכס מילר ואברהם מיכאלי.

המסקנה שלי מהתרגיל התיאורטי שערכתי: ההשפעה של “הצבעה אסטרטגית” מוגבלת ביותר, ויש לה פוטנציאל מוגבל מאוד לשנות את התוצאות המהותיות של הבחירות, רק כאשר המאבק בין הגושים צמוד ביותר. לו לא היו הולכים אותם קולות שניתנו למפלגות שלא עברו את אחוז החסימה, המרוויחה הגדולה ביותר הייתה ככל הנראה יוליה שמאלוב-ברקוביץ.

את המסקנות לבחירות הקרובות מוזמן כל אחד להסיק בעצמו. אני, באופן אישי, אמשיך להצביע על פי צו מצפוני, ואתן את קולי לאותה מפלגה קטנה שקיבלה אותו מאז 1984 בכל גילגוליה.

מיהו המדען המשפיע ביותר במאה ה-20?

מיהו המדען (או מדענית) המשפיע ביותר במאה ה-20? שאלתי שאלה זו את עוקביי בטוויטר וגם בפייסבוק. קיבלתי שפע של תשובות: זיגמונד פרויד, מילטון פרידמן, רוברט אופנהיימר, אלכסנדר פלמינג, ורנר פון בראון, “ההוא שהמציא את הטרנזיסטור” (מקובל לייחס את ההמצאה לשלושת הפיזיקאים שבשנת 1956 זכו במשותף בפרס נובל לפיזיקה על תרומתם לפיתוחו: ויליאם שוקלי, וולטר בראטיין וג’ון ברדין), מי שפיתח את הגלולה נגד הריון (הערה: אין אדם יחיד שניתן לייחס לו המצאה זו, אך מקובל כי האב ה”רשמי” של הגלולה הוא גרגורי פינקוס, שעמד בראש צוות שכלל גם את פרנק קולטון, מין צ’ה צ’אנג ואחרים), נורמן בורלוג, אלברט איינשטיין, אלן טיורינג, ריצ’ארד פיינמן, וייתכן שהיו עוד תשובות שאבדו בנשיה וגוגל לא הצליח לדלות, עם המשיבים הסליחה.

אני מוכרח לומר שלא הופתעתי מהתשובות (פרט להעלאת שמו של פרויד,  ואולי מאזכור שמו של מילטון פרידמן, שאותו אני לא נוטה לסווג כמדען – וראו את מה שכתבתי עליו לאחר מותו, הלינק למעלה). אפשר לזהות כאן ארבעה תחומים עיקריים בהם בלטו ודרכם השפיעו האנשים המכובדים שצויינו למעלה (וחלק גדול מהמוזכרים משתייכים ליותר מתחום אחד): אלקטרוניקה, מלחמת העולם השניה, רפואה/מדעי החיים, ומדעי המחשב. הקוראים מוזמנים לדון בתשובות שהועלו, בחלוקה הגסה שלי לתחומים, ולהעלות שמות אחרים.

הנסיון לקבוע מיהו המדען “המשפיע ביותר” נדון כמובן לכשלון מיידי, כיוון שלא ניתן לכמת את מידת ההשפעה. האם השפעתם של איינשטיין וטיורינג על מהלך מלחמת העולם השניה רבה או פחותה מהשפעתם על התפתחות עידן המידע? מה יותר חשוב: הטרנזיסטור או האנטיביוטיקה? התשובות לשאלות כאלה יהיו יותר מטופשות מהשאלות עצמן.

הנה שאלה אחרת, טובה יותר: לא שכחנו מישהו? סביר להניח ששכחנו עוד רבים וטובים. ועוד שאלה שאולי תרצו לשאול אותי: מי יופיע ברשימה שלך, יוסי? ובכן, בעיניי, רוב השמות שהוזכרו קודם ראויים להכלל בכל רשימה של “מדענים משפיעים”, אבל ברצוני להציע עוד שם אחד שלא הוזכר עד כה: רונלד א. פישר.

כן. הוא כבר הופיע ברשימת 15 הסטטיסטיקאים הגדולים שערכתי, במקום הראשון. אבל הוא היה רק סטטיסטיקאי, לא? טוב, גם גנטיקאי (הביולוג הגדול ביותר מאז דרווין – טוען ריצ’ארד דוקינס). את סיפורו, סיפור הליידי הטועמת תה סיפרתי לא מזמן ב-“סיפור נובה – ערב סיפורי מדע ומדענים“. אמרתי בפני עדים, ואף כתבתי זאת בבלוג זה ממש כי הוא “אחד המדענים המשפיעים ביותר של המאה ה-20“.

פישר הניח את היסודות (ובנה חלק ניכר מהקומות הראשונות) של התיאוריה של תכנון ניסויים מבוקרים. כל ניסוי מדעי הנערך כיום חייב לכלול את “השילוש הקדוש” – שלושת תנאי היסוד שהציב פישר להבטחת תקפות הניסוי ותוצאותיו: רנדומיזציה, בקרה, סמיות.

פישר המציא את הכלי העיקרי (ובמשך שנים רבות – הבלעדי) להערכת כמותית של משקל העדויות המתקבלות בניסוי: ה-p-value. פתחו כל מאמר מדעי בו מתואר ניתוח כמותי של נתונים. ה-p-value יופיעו שם, וערכי p קטנים מ-0.05 יזכו להתייחסות מיוחדת, שכן הם מעידים על תוצאות מובהקות. הערך הקריטי 0.05 מקורו גם הוא בהערכה של פישר כי מדובר בערך מתקבל על הדעת, אף כי פישר עצמו ידע היטב כי אין לכך כל הצדקה תיאורטית.

ופישר גם אחראי לפיתוח ושיפור של שיטות סטטיסטיות רבות לניתוח נתונים כמותיים, ובראשן ניתוח השונות (“אנובה”). למה לדעתכם סטטיסטי המבחן של ה-ANOVA מסומן באות F?

לו היו כותבי המאמרים המדעיים מקפידים על הפניה למקורות, פישר היה כנראה המדען המצוטט ביותר (וזהו עוד מדד מקובל לחשיבותה של עבודה מדעית): יש לצטט את עבודתו בכל מאמר מדעי המתאר ניסוי מבוקר, משתמש ב-p-value להערכת התוצאות, ובודאי אם נעשה שימוש בניתוח שונות, או במבחן המדוייק של פישר, או באחת מהשיטות הסטטיסטיות הרבות האחרות שפיתח ושיפר. מדוע עבודות אלה אינן מצוטטות? כי הן הפכו ל-“מובנות מאליהן”, כאילו ניתנו למשה בסיני, ולא היא.

עבודתו של פישר השפיע על כל המחקר המדעי מימיו והלאה. המדע במאה העשרים לאחר פישר אינו כשהיה לפניו, ולכן פישר הוא ללא ספק אחד המדענים המשפיעים ביותר של המאה ה-20.

 

השבוע הבא הולך להיות מלהיב מאוד

מקווה שלמרות שחלק הן הודעות של הרגע האחרון, הקוראים יוכלו להפיק מהן תועלת – השבוע הבא הולך להיות מלהיב מאוד!

  • ביום ראשון ירצה במרכז חמד”ע בתל-אביב המתמטיקאי הבריטי מרקוס דה-סוטוי, שחיבר שני ספרים פופולריים על נושאים מתמטיים עמוקים: “המוזיקה של המספרים הראשוניים” שעסק בהשערת רימן, ו-“סימטריה” שעסק, נכון, בנושא הסימטריה. ההרצאה שייתן דה-סוטוי, בשפה האנגלית, תישא את הכותרת “מסעו של מתמטיקאי בעולם הסימטריה”. נדרשת הרשמה מראש, ייתכן שעדיין יש מקומות פנויים. פרטים נוספים באתר חמד”ע. אני אהיה שם.
  • ביום שני בירושלים יתקיים אירוע נדיר ביותר: הרצאות של שני חתני פרס נובל – ישראל אומן ודניאל כהנמן. זאת במסגרת כנס בן יומיים שנושא את הכותרת “סדנת חשיבה מחדש על הרציונליות“, שמארגנים במשותף אוניברסיטת בן-גוריון והמרכז לחקר רציונליות באוניברסיטה העברית. נודע לי על האירוע הזה רק לפני כמה שעות, ועדיין לא ברור לי האם הוא פתוח לקהל הרחב, האם נדרשים דמי הרשמה, והאם בכלל עוד יש מקום פנוי באולם. אני שוקל ברצינות לקחת יום חופש ולנסוע. היום השני של הכנס יהיה למחרת (יום שלישי) בבאר שבע, לשם בכל מקרה לא אגיע, כי…
  • ביום שלישי בבוקר, במסגרת סמינר המחלקה לסטטיסטיקה של אוניברסיטת תל-אביב, ירצה אור צוק, ישראלי השוהה במכון ברואד בקיימברידג’ מסצוסטס, על נושא שבו אני מתעניין במיוחד – פרמקוגנטיקה. הוא ידבר על “הירושה החסרה” – הפער בין התכונות הגנטיות/תורשתיות (של בני אדם) ובין השונות הפנוטיפית, כלומר – הדרך בה מתבטאים בפועל ההבדלים בין בני האדם. (מקווה שהסברתי נכון את הנושא.. ) פרטים בדף הסמינרים של המחלקה.
  • ביום רביעי, למיטב ידיעתי, אפשר לנוח ולהתכונן ליום חמישי
  • ביום חמישי יתקיים בלשכה המרכזית לסטטיסטיקה בירושלים יום עיון המאורגן על ידי הלשכה והאיגוד הישראלי לסטטיסטיקה, לציון מאוחר של יום הסטטיסטיקה העולמי. יום העיון יתמקד בתחומי העיסוק של הלמ”ס בדגש על המידע העומד לרשות אנשי המקצוע. בין המרצים יהיו מורי ורבי (ומנחה עבודת הדוקטורט שלי) פרופ’ צבי גילולה מהאוניברסיטה העברית, שידבר על סולמות מדידה אורדינליים, ועבדכם הנאמן, שיסקור את הגישות העיקריות לניתוח לוחות שכיחות. פרטים על יום העיון בלינק זה לאתר הלשכה. אני לא בטוח שעדיין נשארו מקומות פנויים.

ואם כל זה לא מספיק, אז הנה הודעות על שתי סדרות הרצאות המיועדות לקהל הרחב, תחת הכותרת “מתמטיקה על כוס קפה”, שנותנת פרופ’ נצה מובשוביץ-הדר מהמחלקה לטכנולוגיה והוראת המדעים בטכניון. אמנם שתי הסדרות כבר החלו, אך עדיין נותרו שלוש הרצאות בכל אחת מהן, ולדעתי כדאי למצוא את הזמן ולהנות מהרצאות על שלל נושאים מרתקים. סדרה אחת נערכת במרכז להוראת הטכנולוגיה והמדעים טכניון בחיפה, והשניה במרכז המדעים בהרצליה.

תהנו!