חיפוש באתר

קישורים

עמודים

קטגוריות

יום הולדת 100 לק. ר. ראו

ק. ר. ראו

ק. ר. ראו

היום, 10.9.2020, הסטטיסטיקאי ק. ר. ראו, מחשובי הסטטיסטיקאים של המאה ה-20 חוגג את יום הולדתו ה-100.

בפוסט הזה לא תקראו על הביוגרפיה שלו ,עבודתו המדעית ,והפרסים ואותות הכבוד שקיבל. בשביל זה כתבתי לכם ערך בויקיפדיה אודותיו. כאן אני רוצה לספר סיפורים. למעשה אלה סיפורים שראו עצמו סיפר, בשלושה ראיונות שנערכו איתו שנערכו ב-1985, 2003 ו-2016.

ראו, כמו המון סטטיסטיקאים אחרים, הגיע לסטטיסטיקה במקרה. הוא מספר כי לאחר שסיים את לימודי התואר השני במתמטיקה נסע לכלכותה כדי להתראיין למשרה בצבא הוד מלכותו, כלומר להתגייס. הוא מספר כי הם חיפשו מתמטיקאים לכל מיני תפקידים. הוא לא התקבל לצבא בגלל גילו הצעיר. בכל מקרה, הוא פגש מישהו שסיפר לו על המכון לסטטיסטיקה שנמצא בעיר. הוא הגיע למכון ודיבר עם ראש המכון ומייסדו, פ. צ’. מהלנוביס. מהלנוביס קיבל אותו לעבודה במכון כחוקר, ובמקביל שלח אותו ללמוד לתואר שני בסטטיסטיקה באוניברסיטת כלכותה, שזה עתה פתחה תכנית ללימודי סטטיסטיקה. במכון עסק בניתוח נתונים במחקרים אנתרופולוגיים. כאשר מהלנוביס קיבל פניה לעזרה בניתוח נתונים דומים מהמוזיאון האנתרופולוגי של אוניברסיטת קיימברידג’, ראו נשלח לשם. מדובר היה באוסף גדול של עצמות ושלדים בני כאלף שנה שנחפרו בצפון אפריקה.

ראו עם אחד העכברים של רונלד פישר, 1947

במקביל לעבודתו שם, ראו פנה לרונלד פישר כדי שידריך אותו בעבודת דוקטורט. פישר הסכים, אולם התנה זו בכך שראו יערוך ניסויים במעבדה הגנטית שלו, ללא כל קשר לעבודת הדוקטורט. ראו מספר כי לפישר הייתה מעבדה ובה אלפי עכברים, והוא העסיק שם 10 עובדים, חלקם הגדול סטודנטים, שטיפלו בעכברים וערכו ניסויים בהכלאות בין העכברים. ניסויי העכברים לא נכללו לבסוף בעבודת בדוקטורט שלו, שהתבססה על השיטות שפיתח לניתוח נתוני העצמות במוזיאון. חלק לא מבוטל משיטות אלה היו הכללות של שיטות סטטיסטיות שפישר עצמו פיתח. ראו מספר כי פישר היה מאוד מרוצה מעבודתו. עם זאת, ראו מספר כי הציע גישה בייסיאנית לאחת הבעיות שהתמודד איתן. פישר שהיה אנטי-בייסיאני, ביקש מראו לנסות גישה אחרת, אבל ראו מספר בחיוך כי הוא התעלם מהבקשה.[1]

ראו מספר גם על החיים בקיימברידג’, ובעיקר בקינג’ס קולג’. הוא מספר כי באותה עת דווקא היו הרבה סטודנטים ממוצא הודי בקיימברידג’. באופן רשמי ראו למד בקינג’ס קולג’, אבל למעשה בילה את כל זמנו במוזיאון (חוץ מהזמן שבילה במעבדה של פישר, כמובן). הוא מספר כי רק לעמיתי המכללה[2]  מותר לדרוך על המדשאות שם, כלל שקיים עד עצם היום הזה. בסופו שלדבר ראו מונה לעמית במכללה לכל ימי חייו בשנת 1974, וכעת הוא יכול לדרוך שם על הדשא, לאכול משולחן הקולג’ ולשתות יין ככל שיחפוץ.

ראו ובלקוול, 1977

ראו ובלקוול, 1977

שמו של ראו קשור בשתי תוצאות חשובות בחום תורת האמידה: משפט ראו-בלקוול וחסם קרמר-ראו. ראו מספר כי כאשר חזר להודו ולימד באוניברסיטת כלכותה, הוכיח בכיתה משפט של פישר שהתייחס למדגמים גדולים, למעשה אינסופיים[3] . אחד הסטודנטים שאל אותו מדוע הוא לא מוכיח את התוצאה למדגמים סופיים. ראו מספר כי באותו לילה חשב על השאלה של התלמיד ומצא את ההוכחה עבור מדגם סופי. זה היה חסם קרמר-ראו. כאשר הוכיח את התוצאה בכיתה שבוע לאחר מכן, עלה בדעתו דבר נוסף. הדבר הנוסף הזה הוא משפט ראו-בלקוול. ראו פרסם את שתי התוצאות במאמר שהופיע בשנת 1945. קרמר פירסם את החסם שגילה באופן עצמאי בשנת 1946. בלקוול, שגילה את מה שנקרא כיום משפט ראו-בלקוול בכוחות עצמו, פרסם את התוצאה שלו ב-1947.

משפט ידוע נוסף הוא משפט פישר-ראו. כאן ראו מספר כי פישר כתב מאמר מאוד טכני וביקש ממנו לבדוק את החישובים, ואז הוא שיפר את התוצאות של פישר.

מעניין לציין כי כאשר ראו נשאל מהם לדעתו הישגיו החשובים ביותר, הוא לא מציין את שלושת המשפטים שעמם הוא מזוהה יותר מכל, אלא את עבודותיו בתחומים של מערכים אורתוגונליים ואנטרופיה ריבועית[4], וכן את ה-score test שפיתח.

באופן לא מפתיע ראו מספר כי שני האנשים שלהם הייתה ההשפעה הגדולה ביותר עליו הם מהלנוביס ופישר. את מהלנוביס הוא מתאר כאדם קשה, ולדבריו כל אנשי המכון חששו ממנו. איש לא קרא לו בשמו, גם שלא בנוכחותו. מהלנוביס היה “הפרופסור”. כינוי זה נשמר לו גם אחרי מותו. ראו מונה כמנהל המכון, אך לא החליף את מהלנוביס כפרופסור. גם בראיונות שנתן הוא מתייחס אל מהלנוביס כאל הפרופסור.

ראו ופישר, 1960

ראו ופישר, 1960

גם לפישר היה מוניטין של אדם קשה, ולפי מספר סיפורים די בצדק. מעניין לראות כי לראו היו יחסים מאוד טובים עם פישר. הוא משבח את פישר גם כמרצה וגם כמנטור, שהתייחס בכבוד לסטודנטים שלו . הוא מספר כי פישר תמיד דרש ממנו לא להסתפק בפיתוחים מתמטיים אלא גם ליישם אותם על נתונים. לכן, סיפר ראו, שיטת העבודה שלו הייתה לאסוף קודם כל נתונים ולפתח מתודולוגיה לבעיה שמציגים הנתונים. במובן הזה, ראו היה data scientist כבר בשנות הארבעים של המאה ה-20.[5] בראיון שנתן ב-2016 ראו מסביר כי זו למעשה הדרך שבה ה-data science פועל, וכאן אצטט את דבריו:

“Data science … is a scientific discipline because it uses an experiment-oriented scientific approach. Based on empirical evidence, a hypothesis is formulated, and evidence is gathered to perform the hypothesis testing”

ראו, מהלנוביס ואנדריי קולמוגורוב, 1962

ראו, מהלנוביס ואנדריי קולמוגורוב, 1962

ראו סיפר בהרחבה גם על קשרי העבודה שלו עם מתמטיקאים וסטטיסטיקאים מברית המועצות החל משנות ה-60 ועד אמצע שנות ה-80, בשיא המלחמה הקרה, שנמשכו גם כאשר עבר לאוניברסיטת פיטסבורג ב-1979. הוא מציין כי קיבל תמלוגים על ספריו שתורגמו לרוסית, אך הכסף כמובן רובלים שהופקדו בבנק בברית המועצות. כאשר ביקר שם, נהג להשתמש בכסף הזה כדי להזמין את כל חבריו שם למסיבות שערך.

מה מאחלים לאדם בן 100? עד 120? נאחל לו יום הולדת שמח.

מקורות


הערות
  1. כאן יש לציין כי הפעם הראשונה בה הוזכרה המילה “Bayesian” בספרות הסטטיסטית הייתה במאמר של פישר, בו הבהיר כי המתודולוגיה שבה עסק המאמר אינה בייסיאנית. []
  2. חברי הסגל האקדמי []
  3. בשפת המתמטיקה מדובר בתוצאה אסימפטוטית []
  4. לא להיבהל, גם אני לא מבין בזה כלום []
  5. את המונח data science טבע הסטטיסטיקאי ג’ון טוקי במאמר The Future of Data Analysis  שיצא לאור ב-1962 []

מה אומרת הסטטיסטיקה -הניוזלטר החדש של נסיכת המדעים

אני שמח להודיע על השקתו של הניוזלטר החדש של נסיכת המדעים. העדכון החודשי, ב-15 לכל חודש, יכלול לינקים והפניות לתכנים מעניינים העוסקים בנושאי הבלוג.
הנכם מוזמנים להירשם כאן:
http://www.sci-princess.info/updates

האם מכוני כושר הם מקור להתפרצות קורונה?

אני אתחיל בהתנצלות: אין לי מושג מה התשובה לשאלה שבכותרת. אני לא חושב שלמישהו יש מושג. אבל משום מה, הנושא של סגירת מכוני הכושר הפך בימים האחרונים לוויכוח ציבורי לוהט, ולכן החלטתי להפסיק את שתיקתי בעניינים הקשורים למגיפת הקורונה. אבל אם הגעתם עד לכאן, אודה לכם אם תקראו לפחות את הפיסקה הבאה.

מה תמצאו בפוסט הזה? ראשית אביא סקירה מאוד קצרה למה שידוע לנו על הנושא נכון לעכשיו. לאחר מכן אדון בשאלה איך למצוא תשובה לשאלה שבכותרת (או שאלות דומות). לסיום אביא את דעתי האישית בנושא.

מה ידוע על הקשר בין פעילות מכוני הכושר והתחלואה בקורונה?

מה אנחנו יודעים על הקשר בין הדבקות בקורונה ובין פעילות חדרי הכושר? בשתי מילים: כמעט כלום.

הלכתי לשאול את ד”ר גוגל מה הוא חושב. מילות החיפוש שלי היו “covid-19 gym reopening”. אסקור כאן את שלוש התוצאות הראשונות[1]

תוצאת החיפוש הראשונה היא כתבה בכתב העת science ב-26.6.2020. הנה הכותרת: It’s safe to go back to the gym—if there’s little COVID-19 around, study suggests ובעברית: אין בעיה להתאמן במכוני הכושר אם אין שם חולי קורונה. מדובר במחקר שנעשה בנורבגיה[2]. החוקרים גייסו לניסוי כ-4000 איש, כולם מנויים בחדרי כושר בעיר אוסלו וכולם לא עברו בדיקות קורונה בחודשים מאי עד יוני 2020. כמחצית מהנבדקים קיבלו אפשרות להתאמן במשך שבועיים בחמישה חדרי כושר שנפתחו במיוחד לצורך המחקר. בחדרי הכושר האלה נשמרו כל התנאים הנדרשים: מרחק של שני מטר, מסיכות, וניקוי המכשירים בסיום השימוש. שאר המשתתפים בניסוי היוו את קבוצת הביקורת. מלבד המשתתפים בניסוי היחידים ששהו בחדרי הכושר היו אנשי הצוות. התוצאות: כעבור שבועיים זוהה חולה אחד בקבוצת המתאמנים, ואף לא אחד בקבוצת הביקורת. נחמד. הבעיה: במשך תקופת הניסוי מספר החולים החדשים באוסלו היה נמוך מאוד: 105 בסך הכל, כ-8 חולים ליום בממוצע. יותר מכך: מספר החולים המאושפזים בעיר, שמהווה אינדיקציה למספר החולים הכללי, ירד מ-35 בתחילת תקופת המחקר ל-21 בסיומה. לסיכום, הכותרת של הכתבה אכן מאוד מדוייקת: אם אין חולים אז אין ממי להידבק, אפילו לא בחדר הכושר. השורה התחתונה של המחקר הזה: לא למדנו ממנו שום דבר משמעותי.

תוצאת החיפוש השניה היא מהאתר של השידור הציבורי בארצות הברית, NPR. מתאריך 5.7.2020. הכותרת: My Gym Is Reopening. Is It Safe To Work Out There?  עיקר הכתבה הוא ראיונות עם מומחים שונים. המסרים: כל אחד צריך להעריך את הסיכון שלו, עדיף להתאמן בבית או באוויר הפתוח, אם בכל זאת הולכים לחדר כושר לבדוק איזה אמצעי זהירות הם נוקטים, לשים לב לזרימת האוויר ועוד ועוד. ההמלצה המודגשת ביותר: אם יש באיזור שבו אתה נמצא הרבה חולים, הסיכון שלך להידבק בחדר הכושר גדול יותר. ממש כמו שהמחקר הנורבגי גילה. בכתבה יש גם הפניה למחקר תצפיתי בהיקף קטן שנעשה בדרום קוריאה[3]. ההמלצה של המחקר הזה אינה שונה מההמלצות הקודמות.

התוצאה השלישית היא מהוול-סטריט ג’ורנל: Gyms Reopening May Not Facilitate Coronavirus Infections, Study Finds. הכתבה נמצאת מאחורי חומת תשלום, אבל מהמעט שאפשר לקרוא עולה כי היא מתייחסת לאותו מחקר נורבגי. העורכים של העיתון, כפי שאני מסיק מהכותרת, סבורים כי התוצאות של המחקר הזה דווקא מעודדות, למרות ההסתייגות שהוכנסה שם[4]

בגוגל סקולאר, מלבד מהמחקר הקוריאני, לא מצאתי שום מחקר שמביא נתונים כמותיים בעניין בין עשר התוצאות הראשונות.

איך אפשר לאסוף נתונים על הסיכון לתחלואה בקורונה בחדרי הכושר?

מי שהגיע לכאן, ובפרט מי שעוקב אחרי הבלוג הזה לאורך השנים, כבר יודע את התשובה: צריך לעשות ניסוי מבוקר. הנורבגים עשו בדיוק את זה.

אני מסתייג מהמחקר הזה בגלל מספר סיבות. הסיבה הראשונה היא כל מיני עניינים שקשורים לתכנון המחקר. למשל, המתאמנים לא התאמנו בחדרי הכושר שבהם הם מתאמנים בדרך כלל אלא חדרי כושר שנפתחו במיוחד עבור המחקר. זה יוצר הטיה, כי מכונים אלה לא בהכרח מייצגים את כל המכונים. לא נאמר איך חמשת המכונים האלה נבחרו. כמו כן, לא נמסרו פרטים על גודלם של המכונים, מספר האנשים שכל מכון יכול להכיל, ועד כמה צפיפות המתאמנים במהלך הניסוי הייתה דומה לצפיפות בזמן שגרה. בעיה נוספת שאני רואה היא משך תקופת המעקב – שבועיים בלבד. החוקרים לא לקחו את משך תקופת המעקב בחשבון כאשר חישבו את גודל המדגם. אם חדרי הכושר היו נפתחים לתקופה ארוכה יותר סביר להניח שהיינו רואים יותר הדבקות, וייתכן שההבדלים בין הקבוצות יהיו שונים. כמו כן, לא נעשה שקלול על פי מספר הפעמים שבהם כל אחד מהנבדקים בקבוצת הניסוי התאמן, אבל בדיעבד זה לא משנה לאור התוצאה של מקרה הדבקה בודד בכל הניסוי.

בעיה שניה: הניסוי השווה בין מתאמנים ללא מתאמנים, ולא בדק את ההשפעה הכוללת של הפתיחה על כלל האוכלוסייה. קשה להאשים כאן את החוקרים. אני לא רואה דרך סבירה לבדוק את זה.

בעיה שלישית: המחקר לא עונה, ולא יכול לענות, על השאלה האם יש קשר בין שיעור התחלואה הכולל ושיעור ההדבקה בין המתאמנים. כן, ראינו כי כאשר שיעור התחלואה באוכלוסייה נמוך אז שיעור ההדבקה בחדרי הכושר על משך תקופה של שבועיים הוא אפסי. אבל מה יקרה אם שיעור התחלואה באוכלוסייה יעלה? סביר להניח שגם שיעור ההדבקות בחדרי הכושר יעלה, אבל אין לנו מידע על מספיק על אופי הקשר.

עם זאת, אני מבין את הקשיים בפניהם עמדו החוקרים. אולי היה אפשר לתכנן את הניסוי טוב יותר, אבל זו חכמה של צופה מהצד.

אני רוצה להציע תכנון אחר, שנראה לי יותר הגיוני: לדגום אוכלוסיית מחקר של מכוני כושר, ולא של מתאמנים. לאחר מכן, נקבע על ידי הקצאה רנדומלית איזה מכונים ייפתחו ואיזה יישארו סגורים[5]. אני בהחלט חושב שתקופת מעקב של שבועיים אינה מספיקה, והתחושה שלי היא שהתקופה צריכה לארוך לפחות חודש, אם לא יותר מכך. ההשוואה תהיה דומה להשוואה שעשו הנורבגים: השוואת שיעור הנדבקים בין המנויים בחדרים שנפתחו לבין המנויים במכונים שנשארו סגורים.

יש עוד אפשרות, פחות טובה. יש לנו כבר את נתוני ההדבקה מהתקופה שבה מכוני הכושר היו סגורים. בואו נפתח עכשיו את חדרי הכושר ונראה אם יחול שינוי. הבעיה היא כמובן שאנחנו לא חיים בחלל ריק. אי אפשר רק לפתוח את מכוני הכושר ולהשאיר את כל הגורמים האחרים קבועים. עם זאת, אנחנו עושים את זה הלכה למעשה כל הזמן. אנחנו מסתכלים על השינויים בתחלואה ומנסים למצוא קשר לכל מיני דברים: בתי ספר סגורים, אוטובוסים עם חלונות פתוחים, בתי הספר שוב נפתחים, ושוב נסגרים, 100 מטר, 500 מטר, חתונות קטנות, חתונות עד 250 איש, חתונות עד 100 איש, אני אעצור כאן ברשותכם.

אז מה לעשות עם חדרי הכושר?

רק אתמול קראתי באתר ynet כי חדרי הכושר, הבריכות וחלק מהמסעדות נסגרו כחלק מהגבלות הקורונה החדשות – אבל יו”ר ועדת הקורונה יפעת שאשא-ביטון דורשת קבלת נתונים לפני שתאשר את אותן הגבלות. שאשא-ביטון אמרה בריאיון לאולפן ynet כי הממשלה קיבלה את ההחלטה מבלי להציג נתונים – ובשלב זה אין בכוונתה לאשר את צו הסגירה. “נקבל את הנתונים ונחליט עד מחר”, הוסיפה.

אני לא בא להשמיץ את ח”כ שאשא-ביטון. לדרוש נתונים זו דרישה סבירה לגמרי. אני תומך נלהב של קבלת החלטות על סמך נתונים.

אבל היא גם אמרה, בראיון לרדיו 103FM (קישור לראיון המוקלט), כי “אם משרד הבריאות לא יוכיח שבריכות, חדרי כושר ומסעדות הם מקור התפרצות, נבטל ההנחיות”.

אז הנה הבעיה: אין נתונים  על חדרי כושר, וכנראה שגם לא על מסעדות ובריכות[6], ובטח שאין נתונים אמינים על מה שקורה בישראל. משרד הבריאות לא יכול להוכיח שחדרי כושר הם מקור התפרצות, אבל גם לא יכול להוכיח שלא. והחלטה צריך לקבל בכל מקרה. שאשא-ביטון החליטה למעשה שאם אין נתונים שמראים כי חדרי כושר הם מקור התפרצות, אז בהכרח חדרי כושר אינם מקור התפרצות. אני חולק על דעתה. אבל אל תטעו, אפשר גם לטעון את הטענה ההפוכה:  שאם אין נתונים שמראים כי חדרי כושר אינם מקור התפרצות, אז בהכרח חדרי כושר הם מקור התפרצות. שתי הטענות סובלות מאותו כשל לוגי.

ושוב, אין לי שום דבר אישי נגד חברת הכנסת, כולנו עומדים בפני אותה הדילמה, לכל אחד יש דיעה, ומאוד סביר להניח שרבים חושבים כמו שאשא-ביטון, לכיוון כזה או אחר. היא פשוט בולטת בגלל התפקיד שהיא ממלאת והאחריות שהיא נושאת על כתפיה. וגם אם פורמלית יש כאן כשל לוגי, אי אפשר לומר שאין הגיון במה שהיא אומרת. אני בטוח כי היא חשבה על הנושא ולקחה בחשבון עוד שיקולים שצריך לקחת בחשבון, כמו שיקולים כלכליים ודאגה לרווחת הציבור.

אין נתונים, אין ברירה וצריך להחליט בלעדיהם. אפשר לבצע ניסוי כמו שעשו בנורבגיה. אפשר לנסות להניח הנחות, לבנות מודל, לבדוק עד כמה הוא עמיד. ואפשר, כמו שעשו ב-NPR, להתייעץ עם מומחים, בעיקר אפידמיולוגים ומומחים לבריאות הציבור אבל בהחלט גם עם אנשים שיש להם מומחיות בתחומים אחרי שרלוונטיים לדיון.

דעתי האישית היא שאת חדרי הכושר יש לסגור. אנחנו בישראל ולא בנורבגיה, ואני לא מאמין שדווקא שם ישמרו על ההנחיות של ריחוק חברתי, היגיינה וחבישת מסיכות. אדרבא. כאן לדעתי יש להפעיל את עיקרון הזהירות המונעת. לגבי בריכות ומסעדות? אין לי מושג, מצטער.

מאחל לכולכם רק בריאות.


הערות
  1. לאחר מכן המקורות מתחילים להיות מפוקפקים. התוצאה הרביעית הייתה מאתר בשם mindbodyonline נקודה קום, והחמישית מאתר מסחרי בשם europeactive נקודה אי.יו. שעוסק בקידום פעילויות ספורט. []
  2. קישור למחקר – קובץ פדף []
  3. מצאתי אותו גם בגוגל סקולר []
  4. “may not…” []
  5. אני לא אכנס כאן לפרטי הדגימה וההקצאה. אני מודע לכך שאני כותב כאן בצורה פשטנית, והתהליך הרבה יותר מורכב []
  6. מי שמעוניין מוזמן לבדוק []

למה אין 180 חברי כנסת?

הנה שאלה שמישהו שאל בקבוצת “שאלה קטנה” בפייסבוק:

וגם ציוץ מטוויטר:[1]

.

מה המשמעות של גודל הכנסת/פרלמנט

בפייסבוק מישהו ענה לשאלה בדבר מספר חברי הכנסת כי יש 120 חברי כנסת בגלל שזה היה מספר החברים בסנהדרין שפעל בימי בית שני, וזה נשמע לי הגיוני, למרות שלא מצאתי סימוכין לכך לא בויקיפדיה ולא באתר הכנסת. אבל זה לא עונה לחלק השני של השאלה. מאז קום המדינה האוכלוסייה גדלה בהרבה: מ-650 אלף בעת הכרזת המדינה לבערך מ-9 מיליון. יותר מפי 10. זה כמעט פי 14. אז אולי 120 חברי כנסת באמת לא מספיקים?

מצד שני, ראיתי גם טענות בעבר[2] לפיהן החזקה של 120 חברי כנסת זה בזבוז כסף עצום וצריך להקטין את מספר חברי הכנסת ל-70. אז כמה חברי כנסת באמת צריך? ומהן ההשלכות הפוליטיות הנגזרות מבחירה כזו או אחרת?[3]

אני זוכר שדובי קננגיסר התייחס פעם לנושא בבלוג המצויין והלא פעיל שלו, אבל לא הצלחתי למצוא את הקישור. ההסבר שלו, וסלחו על אי הדיוקים, הוא שמדובר בעניין של ייצוג. בעת הקמת המדינה, כל חבר כנסת ייצג בערך 5400 אזרחים[4]. כיום כל חבר כנסת מייצג 75000 אזרחים. אם היינו רוצים לשמור על אותה רמת ייצוג שהייתה בכנסת הראשונה ב-1949, היינו צריכים כמעט 1700 חברי כנסת. זה כמובן לא סביר.

דבר שני שצריך להתייחס אליו הוא הכח הפוליטי של כל חבר כנסת. כשיש 120 חברי כנסת, הכח הפוליטי של חבר כנסת בודד הוא 1/120, כלומר 0.83% מסך הכח הפוליטי. בכנסת של 180 חברים, הכם הפוליטי של כל חבר כנסת קטן יותר: 0.55%, ובכנסת של 70 חברים, הכח הפוליטי של חבר כנסת בודד גבוה באופן משמעותי: 1.4%. יש לכך השלכות כמובן: בכנסת קטנה של 70 חברים, אם חבר כנסת מחליט למשל לעזוב את מפלגתו ולחבור למפלגה אחרת, יש לכך הרבה יותר משמעות פוליטית בהשוואה לכנסת גדולה עם 180 חברים.

מכאן שלפרלמנט גדול יש שני יתרונות: הוא מאפשר ייצוג יותר טוב של תתי אוכלוסיות, בייחוד אם יש אחוז חסימה לא גבוה מדי או בחירות איזוריות.[5]  נכון, זה כנראה יעלה יותר כסף, אבל אפשר לתמחר את זה, לפחות באופן עקרוני. מסיבה זו אני תומך בהגדלת מספר חברי הכנסת באופן משמעותי.

.

מה קורה בעולם?

עשיתי מחקר קטן. בדקתי מה קורה במדינות מערביות ודמוקרטיות שדומות לישראל מבחינת גודל האוכלוסייה. מדובר בכמה מדינות באירופה, כמה מדינות בארצות הברית, ובשלוש רפובליקות ברפובליקה הפדרלית של גרמניה. ברוב המדינות האלה יש שני בתים לפרלמנט[6], ובמקרים האלה לקחתי את נתוני הבית התחתון. הנתונים נמצאים כאן. גדלי האוכלוסייה מעוגלים פחות או יותר.

לכל מדינה חישבתי את כוחו הפוליטי של כל חבר פרלמנט כאחוז מסך מספר החברים בפרלמנט, ואת מספר התושבים המיוצגים על ידי כל חבר פרלמנט (בממוצע) על ידי חלוקת גודל האוכלוסייה במספר חברי הפרלמנט. נתונים אלה מוצגים בגרף הבא. חילקתי את המדינות לשלוש קבוצות על פי גודל האוכלוסייה, וצבעתי את הנקודות בהתאם. הנקודה של ישראל צבועה בכחול. (קוד R ליצירת הגרף נמצא כאן).

.

כצפוי אין הפתעות. גם הייצוגיות של האוכלוסייה וגם הכח הפוליטי של כל חבר פרלמנט תלויים במספר חברי הפרלמנט, ולכן הם הולכים ביחד. מקדם המתאם הוא 0.914.

מה שמעניין זו העובדה שהמתאם בין הכח הפוליטי ורמת הייצוגיות לא מושפע מגודל המדינה.  כאשר מחשבים את מקדמי המתאם לכל קבוצת מדינות בנפרד, כל השלושה גבוהים מ-0.97.

עובדה מעניינת נוספת היא שארבע המדינות בהן הייצוגיות נמוכה (כל חבר פרלמנט מייצג יותר ממאה אלף תושבים) או שהכח הפוליטי של כל חבר פרלמנט הוא לפחות אחוז אחד, הן מדינות בארצות הברית. שלוש המדינות בהן הייצוגיות גבוה והכח הפוליטי של כל חבר פרלמנט הוא פחות מחצי אחוז הן מדינות אירופאיות. אתם מוזמנים לדון במשמעות והסיבות של התוצאות האלה.

.

מה יכול לקרות בישראל

בדקתי שני תרחישים: תרחיש בו מספר חברי הכנסת מוגדל ל-180 או מוקטן ל-70. רמת הייצוגיות והכח הפוליטי של כל חבר כנסת במצב הנוכחי ובשני התרחישים מוצגים בטבלה הבאה:

מספר חברי כנסתכח פוליטירמת ייצוגיות
701.43%128500
1200.83%75000
1800.56%50000

.

חישבתי את מספר חברי הכנסת שהיו לכל סיעה בשתי הכנסות האחרונות בשני התרחישים (ללא שינויים בגובה אחוז החסימה) בשני התרחישים האלה, וכן את המפה הפוליטית בחלוקה לגושים.[7]

הנה, למשל, מפת הכנסת ה-22 אילו היו בה רק 70 חברים או 180 חברים:[8]

מפלגה/גודל הכנסת12018070
כחול לבן334819
ליכוד324719
הרשימה המשותפת13197
שס9146
יהדות התורה8135
העבודה7114
המחנה הדמוקרטי7114
ישראל ביתנו693
ימינה583

.

אבל מה שמשנה זה כמובן הגוש. הנה מפת הגושים בכנסת ה-22:[9]

גוש/ גודל הכנסת12018070
ימין548233
מרכז477027
הרשימה המשותפת13197
ישראל ביתנו693

.

וזו מפת הגושים בכנסת ה-23:[10]

גוש/ גודל הכנסת12018070
ימין588834
מרכז405923
הרשימה המשותפת15239
ישראל ביתנו7104

.

ושאלת השאלות: כמה מנדטים חסרים לגוש הימין כדי להשיג רוב בכנסת? התשובה בטבלה:

גודל הכנסתהרוב הדרושהכנסת ה-22הכנסת ה-23
1206173
1809193
703632

.

באופן לא מפתיע, בכנסת גדולה יותר חסרים לגוש הימין יותר קולות כדי להשיג רוב בכנסת. זה נכון גם עבור גוש המרכז כמובן. בכנסת ה-22 חסרו לגוש הזה 14 מנדטים כדי להשיג רוב, ואילו היו בכנסת 180 חברים היו חסרים לגוש זה 21 מנדטים.

כאשר תוצאות הבחירות צמודות ההבדל עשוי להיות משמעותי. אילו היו בכנסת הזו רק 70 חברי כנסת, אז גוש הימין היה צריך “להעביר” אליו רק 2 חברי כנסת מחוץ לגוש במקום שלושה.[11] לעומת זאת, אם היו בכנסת 180 חברים, המצב היה זהה מבחינת מספר הקולות החסרים לגוש הימין כדי להשיג רוב.


הערות
  1. כן, מישהו חסם אותי []
  2. אין לי הפניות. אני מסתמך על זכרוני. []
  3. אני נמנע בכוונה מדיון בהשלכות הכספיות במסגרת הפוסט. מי שמעוניין מוזמן לדון בכך בתגובות. []
  4. החישוב: 650000/120 []
  5. או שתיהן, כמו שנהוג למשל בגרמניה []
  6. כגון סנאט ובית הנבחרים במדינות ארצות הברית []
  7. הותרתי את ישראל ביתנו מחוץ לגוש הימין ואת הרשימה המשותפת מחוץ לגוש המרכז/שמאל, למרות שמקומן אמור להיות בשני הגושים האלה, בהתאמה []
  8. קוד R לחישובי המנדטים []
  9. הותרתי את ישראל ביתנו מחוץ לגוש הימין ואת הרשימה המשותפת מחוץ לגוש המרכז/שמאל, למרות שמקומן אמור להיות בשני הגושים האלה, בהתאמה []
  10. כן, אני יודע שגוש המרכז בכנסת הזו זה לא מה שהיה פעם []
  11. בסוף הם הצליחו להעביר כמעט 20, אבל זה סיפור אחר. []

משפט הקופים

קוף מקבל כל פעם כדור ומניח אותו באחד משני סלים בהסתברויות שוות. בכל סל יש מקום לשני כדורים ואם סל מתמלא מרוקנים אותו מייד. כאשר יש בדיוק כדור אחד בכל סל, הקוף מקבל בננה. הוא מתחיל עם שני סלים ריקים. כמה כדורים יניח בממוצע עד שיקבל בננה?

אפשר לגשת לחידה הזו בכמה צורות.

הגישה ה-“נאיבית”

מי שלא בקיא בסטטיסטיקה והסתברות, יכול לחשוב על הגישה הבאה: ברור שאחרי כדור אחד הוא לא יקבל בננה. אחרי שני כדורים הוא יקבל בננה בהסתברות חצי, או שלא יקבל בננה ואז הוא יעמוד שוב בפני שני סלים ריקים. אם לא קיבל אחרי 2 כדורים, זה בגלל שהוא שם את שני הכדורים הראשונים באותו סל, ואז הוא ניצב שוב בפני שני סלים ריקים ולכן ברור כי הוא לא יקבל בננה אחרי הכדור השלישי. אבל הוא יכול לקבל בננה אחרי הכדור רביעי אם ישים את הכדור הרביעי בסל הריק. מה הסיכוי שנגיע עד לכאן? רבע, כי הסיכוי שהקוף יגיע לכדור השלישי הוא חצי, ומכאן כמו קודם יש לו סיכוי של חצי להגיע לבננה בעוד שני כדורים, וחצי של חצי זה רבע.

מכל הדיון הזה אפשר להסיק כי מספר הכדורים עד קבלת הבננה חייב להיות זוגי, וכן כי הסיכוי לקבלת בננה אחרי שני כדורים הוא חצי, אחרי ארבעה כדורים הסיכוי הוא רבע, אחרי שישה כדורים – שמינית, וכך הלאה.

אפשר לקרוא לגישה הזו בהרבה שמות, אבל נאיבית היא לא. לאלה שהגיעו עד לכאן – אנא קבלו את התנצלותי על כך שהטעיתי אתכם בכותרת. אני קורא לגישה הזו בשם “הגישה הנכונה“. זה מה שצריך לעשות: למצוא את כל האפשרויות, ואת הסיכוי/הסתברות של כל אפשרות.

עכשיו רק צריך לשקלל את האפשרויות בהסתברויות שלהן. כלומר לחשב את זה:

זה דורש קצת אלגברה, ואני אדלג על החישוב ברשותכם. התוצאה היא 4.

גישה שניה: מציאת בעיה דומה

זו גישה מקובלת: אם עומדים בפני בעיה, מנסים למצוא בעיה דומה שכבר פתרנו, ובעזרת הפתרון הזה מגיעים לפתרון של הבעיה הנוכחית[1]

אפשר לנסח את הבעיה של הקוף באופן הבא: הוא מקבל שני כדורים, ושם כל אחד מהם בסל באופן אקראי. אם חילק אותם שווה בשווה בין שני הסלים, הוא מקבל בננה. אם לא – הוא יכול לנסות שוב.

כדי שהגישה הזו תעבוד צריך לשים לב לשני פרטים חשובים. קודם כל – שני הסלים שונים זה מזה. אני מניח שאף אחד לא יתווכח על זה. נקרא לסלים בשם הסל הימני והסל השמאלי.

הפרט השני בדרך כלל יותר בעייתי: גם שני הכדורים שונים זה מזה. אם כדור אחד היה אדום ואחד היה כחול, אז הטענה הזו הייתה ברורה לגמרי. אבל לפעמים קשה לשים לב להבדלים בין הכדורים. אולי ההבדלים הם רק בשריטות שיש על הכדורים. אפילו אם מדובר בשני כדורים חדשים מהניילון – הם עדיין שונים זה מזה. וגם אם הם זהים בכל פרט שאתם יכולים לדמיין – הם עדיין שונים זה מזה. אלה שני כדורים ולא כדור אחד. הם מורכבים מאטומים שונים. לכן נקרא לכדורים האלה בשם כדור א וכדור ב. מה יכול לקרות כשהקוף מקבל את שני הכדורים? יש ארבע אפשרויות

  • שני הכדורים בסל הימני
  • שני הכדורים בסל השמאלי
  • כדור א בסל הימני וכדור ב בסל השמאלי
  • כדור א בסל השמאלי וכדור ב בסל הימני

ומכיוון שהקוף בוחר באופן אקראי את הסל שבו יניח כל כדור, לכל ארבע האפשרויות האלה יש סיכוי שווה, והסיכוי הזה שווה לרבע. ומכיוון שבדיוק שתי אפשרויות שבהן הקוף יקבל בננה, הסיכוי שהוא יקבל בננה הוא חצי.

אז בעצם יכולנו להקל על הקוף ולתת לא להטיל מטבע. אם יצא פלי, מה חבל. אם יצא עץ, הקוף יכול לטפס על העץ ולקטוף לעצמו בננה.

וכך הפכנו את בעיית הקוף לבעיה שכולנו[2] מכירים. כמה פעמים בממוצע צריך להטיל מטבע הוגן עד קבלת עץ? התשובה היא אחד חלקי הסיכוי לקבלת עץ, כלומר אחד חלקי חצי, כלומר 2. אבל רגע, בכל “הטלת מטבע” כזו הקוף מקבל 2 כדורים, ולכן מספר הכדורים הוא 2 כפול 2, כלומר 4, אותה התשובה שקיבלנו קודם.

גישה שלישית: שרשרת מרקוב – לא להיבהל!

דיברתי כבר על שרשראות מרקוב כאשר דנתי בבעיית המטריות. שאלת הקוף היא עוד דוגמא נחמדה לשרשרת מרקוב.

ניזכר: שרשרת מרקוב היא קבוצה של מצבים, בצירוף ההסתברות לעבור ממצב למצב.

לשרשרת של הקוף יש שלושה מצבים:

  1. שני סלים ריקים. נסמן מצב זה ב-00.
  2. סל אחד ריק ובשני יש כדור. נסמן מצב זה ב-01.
  3. כדור אחד בכל סל. נסמן מצב זה ב-11.

אם הקוף במצב 00 הוא יכול לעבור רק למצב 01. יש שני סלים ריקים, הוא מקבל כדור ושם אותו באחד הסלים. זה כל מה שאפשר. ההסתברות לעבור ממצב 00 למצב 01 שווה ל-1.

אם הקוף במצב 01 יכולים לקרות שני דברים: או שהוא שם את הכדור הבא בסל שכבר יש בו כדור. בסל יש שני כדורים, מרוקנים אותו, והקוף חוזר למצב 00. זה קורה בהסתברות חצי. הדבר השני שיכול לקרות הוא שהקוף ישים את הכדור בסל הריק, יגיע למצב 11, יקבל בננה, והמשחק נגמר. גם זה יכול לקרות בהסתברות חצי.

אם הקוף במצב 11 הוא כבר לא מתעניין בנו, כי יש לו בננה. ההסתברות לעבור ממצב 11 למצב 00 או 01 היא 0. המצב הבא, אם נתעקש, יהיה שוב 11. כלומר, ממצב 11 עוברים למצב 11 בהסתברות 1.

הנה תיאור ציורי של השרשרת:

הקוף למעשה מטייל לו בין מצבים 00 ל-01 עד שבמקרה הוא מצליח לעבור למצב 11. בעזרת הציור קל לראות שמספר הכדורים שהקוף יניח עד קבלת הבננה הוא זוגי.

איך כל זה עוזר לנו?

נניח שממוצע מספר הצעדים/כדורים מ-00 ל-11 הוא X.

כפי שראינו קודם, X שווה ל-2 בהסתברות 0.5.

אבל אם בשני הצעדים הראשונים שלו הקוף יצא מ-00 וגם חזר לשם, אז ממוצע מספר הצעדים שנותרו לו מעכשיו הוא גם כן X! וזאת מכיוון שמצבו עכשיו, לאחר שני צעדים לא שונה מהמצב ההתחלתי. כלומר, ממוצע מספר הצעדים אם אנחנו יודעים שהוא כבר עשה סיבוב אחד של 00 ל-01 ל-00 הוא 2+X. ההסתברות שזה יקרה גם כן שווה לחצי. ולכן

פתרון המשוואה הזו הוא X=4.

משפט הקופים

המסקנה מתוך כל הדיון הזה: אם תתנו לקוף לתקתק מספיק זמן על מכונת כתיבה הוא ידפיס את כל כתבי שייקספיר.

רגע? מה?

בואו נחזור לבעיה המקורית, זאת עם הכדורים והבננה. מה הסיכוי שהקוף יטייל במשך כל חייו האינסופיים בין המצבים 00 ו-01?

קודם ראינו כי הסיכוי שהוא יגיע לבננה אחרי 2 צעדים הוא חצי, אחרי 4 צעדים – רבע, אחרי 6 צעדים – שמינית, וכך עד אינסוף. לכן הסיכוי שהוא יקבל בננה שווה לחצי ועוד רבע ועוד שמינית וכן הלאה. זהו סכום של טור גיאומטרי אינסופי, והסכום הזה שווה ל-1. ההסתברות שהקוף יקבל בננה היא 1.

עכשיו, בואו נרחם על הקוף שלנו, ולפני שנטיל עליו להדפיס את כל כתבי שייקספיר נבקש ממנו לתקתק את המילה “יוסי”. הקוף נמצא בעצם בשרשרת מרקוב בת שני מצבים. במצב אחד יש לו דף נייר חלק, ובמצב השני יש דף שעליו מתנוסס השם שלי.

הקוף מקבל דף חלק. זהו מצב 0. הוא מתקתק ארבע אותיות ובא אלי להראות לי מה הוא הצליח לעשות. אם כתוב “יוסי” אני נותן לו חיזוק חיובי ומשחרר אותו עד מחר. הוא הגיע למצב 1. אם לא, אני מקמט את הנייר, זורק לפח, ונותן לו דף נייר חדש, שינסה שוב, עד שיעשה את זה כמו שצריך.

זה כמו הטלת מטבע, רק שהסיכוי להטלת עץ הוא מאוד קטן. אבל לא אפס. נסמן את הסיכוי הזה באות p. הקוף מתחיל במצב 0, עובר למצב 1 בהסתברות p ונשאר במצב 0 בהסתברות p-1. אם הוא מגיע למצב 1 הוא נשאר שם בהסתברות 1.

כמו קודם, אם הוא יטיל את המטבע שוב ושוב בסוף יתקבל עץ. אפשר לחשב כמו קודם סכום של טור גיאומטרי אינסופי ולראות כי ההסתברות לקבל עץ או לתקתק את כל כתבי שייקספיר שווה ל-1. הקוף יצטרך בממוצע 1/p ניסיונות. כל מה שאתם צריכים זה לחכות.


הערות
  1. מכירים את הסיפור על המתמטיקאי והפיזיקאי שנתבקשו להרתיח מים בקומקום? []
  2. אני מקווה []