באיים המטריארכליים שבאוקיינוס השקט יש העדפה ברורה לבנות, ולכן כל משפחה מביאה ילדים לעולם עד שנולדת להם בת (לאחר שנולדת בת המשפחה מפסיקה להביא ילדים לעולם).
מהו יחס המינים באיים?
מתוך 47 איש שענו על שאלה זו בטוויטר, 36 ידעו את התשובה הנכונה: למרות שלכאורה יש משפחות עם הרבה בנים ורק בת אחת, עדיין יהיה מספר שווה בערך של גברים ונשים.
למה זה נכון?
כמקובל, יש צורך להניח מספר הנחות. ההנחות המקובלות הן:
- בכל לידה נולד רק ילד אחד
- כל ילד הוא בהכרח בן או בת
- הסיכוי ללידת בן שווה לסיכוי ללידת בת
- אין קשר בין המינים של הילדים השונים באותה המשפחה
ארבע ההנחות האלה יוצרות מודל: תיאור של המציאות, שייתכן שאינו מדוייק לגמרי, אבל הוא מספיק טוב כדי לתת תשובה אמינה לשאלה שלנו.
על ההנחות אפשר להתווכח. 3 ההנחות הראשונות יקלו עלינו את החישובים. 2 ההנחות הראשונות מתעלמות ממקרים של לידות תאומים, וממקרים נדירים בהם נולדים תינוקות שאינם זכר או נקבה ביולוגיים. ((ואני מערבב כאן בין המין הביולוגי ובין המגדר לצורך נוחות הדיון, אבקש את סליחתכם)) גם ההנחה השלישית אינה נכונה בטבע: ידוע כי נולדים יותר בנים מאשר בנות, והטבע “מאזן את עצמו” בכך ששיעור התמותה של תינוקות זכרים גבוה יותר. אפשר לבנות מודל יותר מורכב שייקח בחשבון הנחות יותר מורכבות, אבל זה רק יסבך את החישובים.
ההנחה הרביעית היא קריטית. אם היא לא נכונה, אז כל הניתוח שיוצג כאן אינו נכון. שוב, אפשר להחליף את ההנחה הזו בהנחה יותר מורכבת, אבל אין לנו שום סיבה לחשוד בכך שההנחה הזו לא נכונה.
עכשיו, כשיש לנו מודל, בואו ננסה לראות מה קורה. נסתכל על דור היפותטי באיים, שבו יש 1024 משפחות חדשות בתחילת דרכן. נניח גם כי בכל שנה יש לידה (במשפחות שאין בהן בת).
בשנה הראשונה, ל-512 משפחות תיוולד בת, ול-512 משפחות ייוולד בן ((באופן תיאורטי כמובן, הכל באופן תיאורטי)). בסוף השנה יש 512 בנות ו-512 בנים.
בשנה השניה, 512 המשפחות שלהן יש בן יביאו עוד ילד לעולם. ל-256 מהמשפחות האלה תיוולד בת, ול-256 משפחות ייוולד בן. כעת יש 768 בנים (512+256) וגם 768 בנות. יש 256 משפחות עם שני בנים ו-256 משפחות עם בן ובת.
בשנה השלישית, 256 המשפחות שלהן יש שני בנים יביאו עוד ילד לעולם. ל-128 מהמשפחות תיוולד בת, ול-128 מהמשפחות ייוולד בן. כעת יש 896 בנים (768+128) וגם 896 בנות. יש 512 משפחות עם בת אחת, 256 משפחות עם בן ובת, 128 משפחות עם שני בנים ובת, ו-128 משפחות עם שלושה בנים.
בשנה הרביעית, 128 המשפחות שלהן יש שלושה בנים יביאו עוד ילד לעולם. ל-64 מהמשפחות תיוולד בת, ול-64 מהמשפחות ייוולד בן. כעת יש 960 בנים (896+64) וגם 960 בנות. יש 512 משפחות עם בת אחת, 256 משפחות עם בן ובת, 128 משפחות עם שני בנים ובת, 64 משפחות עם שלושה בנים ובת, ו-64 משפחות עם ארבעה בנים.
וכן הלאה. אני אעצור את החישוב הזה כאן, כי ההמשך ברור.
ומכיוון שמשספר הבנים בסופו של דבר שווה למספר הבנות, במשפחה ממוצעת יש מספר שווה של בנים ובנות.
אפשר גם לחשב את גודלה של משפחה ממוצעת: יש לנו 512 משפחות עם ילד אחד (בת), 256 משפחות עם 2 ילדים, 128 משפחות עם שלושה ילדים, וכן הלאה. ולכן (בהנחה שאם יש 10 בנים מוותרים וזהו):
אז במשפחה ממוצעת יש למעשה שני ילדים, ילד אחד הוא בהכרח בת (פרט למשפחה חסרת המזל שבה יש 10 בנים) ובכל משפחה יש רק בת אחת, ולכן הילד הנוסף במשפחה הממוצעת הוא בהכרח בן. במילים אחרות, במשפחה ממוצעת יש בת אחת ובן אחד, ולכן כמובן מספר הבנים שנולדו ל-1024 המשפחות ההיפותטיות שלו שווה למספר הבנות.
אפשר ורצוי לערוך גם חישוב הסתברותי: ההסתברות שבמשפחה יש ילד אחד היא חצי, ההסתברות שבמשפחה יש שני ילדים היא רבע, ההסתברות שבמשפחה יש שלושה ילדים היא שמינית, וכן הלאה. לכן אפשר לחשב התוחלת של מספר הילדים במשפחה ולמצוא כי היא שווה ל-2:
את החישוב האחרון מבצעים בעזרת כמה תעלולים אלגבריים שכוללים בין השאר את הנוסחה לחישוב סכום של טור גיאומטרי/הנדסי שכנראה שמעתם עליה כשלמדתם מתמטיקה בבית הספר. זה לא מפתיע: סדרת ההסתברויות היא סדרה גיאומטרית: חצי, רבע, שמינית… כל הסתברות קטנה פי 2 מההסתברות הקודמת. לכן הסטטיסטיקאים מכנים את ההתפלגות שתוארה כאן בשם התפלגות גיאומטרית. מספר הילדים במשפחה הוא, בפי הסטטיסטיקאים, משתנה מקרי גיאומטרי. ושוב, מכיוון שעל פי תנאי השאלה תוחלת מספר הבנות במשפחה שווה ל-1, תוחלת מספר הבנים במשפחה חייבת גם היא להיות שווה ל-1, כלומר תוחלת מספר הבנים שווה לתוחלת מספר הבנות.
חישוב התוחלת הוא אולי מפחיד אבל התוצאה מאוד אינטואיטיבית. תחשבו על קוביה. אתם מטילים אותה ורוצים להוציא 5 ((נניח שהימרתם על 5, סתם)). כמה הטלות בממוצע צריך להטיל עד שתקבלו 5? ההסתברות להטלת חמש היא שישית, ולכן האינטואיציה אומרת שצריך בממוצע 6 הטלות. 6 זה אחד חלקי שישית. גם במקרה הלידות אותה האינטואיציה עובדת. ההסתברות ללידת בת היא חצי, ולכן מספר הלידות הממוצע על לידת בת הוא אחד חלקי חצי, כלומר 2.
להתפלגות הגיאומטרית יש שימוש בכל מקום שבו רוצים לדעת כמה ניסיונות צריך לנסות עד להצלחה, זאת בתנאי שאין תלות בין הניסיונות וההסתברות להצלחה קבועה. איש מכירות, למשל, מעוניין לדעת כמה ניסיונות מכירה הוא צריך בממוצע לבצע עד שתתקיים מכירה. חולה הממתין לתרומת איבר להשתלה מעוניין לדעת כמה תורמים “יצטרך לחכות” עד שיימצא תורם מתאים. במקרה הזה, בהנחה שהסיכוי להתאמה של 10%, ושאין קשר בין התורמים (הנחה סבירה), יצטרכו בממוצע למצוא 10 תורמים פוטנציאליים עד שתימצא התאמה. אם בכל חודש מאותר תורם פוטנציאלי אחד, אז זמן ההמתנה הממוצע עד להשתלה הוא 10 חודשים.
במקרה הנתון, זה הרבה, הרבה, הרבה יותר פשוט מכל החישובים שהובאו כאן.
ההנחה הרביעית קובעת שכלל הלידות מורכב מארועים בודדים שאינם תלויים זה בזה. נמצא שהיחס הכולל הוא כיחס של המקרה הבודד, בהגדרה.
מהנחה 3 נובע שיחסב זה הוא חצי-חצי.
שתי ההנחות הראשונות מיותרות ואינן רלוונטיות לתוצאה.
מה הבאג בטיעון הבא (המספרים ברורים כשמציירים עץ אפשרויות):
ההסתברות לבת אחת מתוך אחת – כלומר כל הילדים בנות היא חצי.
ההסתברות לבן ובת – חצי מהילדים הן בנות, היא רבע.
ההסתברות לשני בנים ובת , כלומר שליש מהמשפחה הן בנות היא שמינית
לכן מספר הבנות באוכלוסיה צריך להיות סכום (אינסופי) של כל המכפלות של אחוז הבנות במשפחה כפול הההסתברות לקבל את אותו אחוז. כלומר אחד חלקי ((2 בחזקת N) כפול N)
בעצם אני חושב שאני מבין את הבאג: מה שמחושב כאן הוא ממוצע אחוז הבנות במשפחה (יוצא LN2) ולא כמות הבנות הכללית. אבל זה מבלבל שזה לא אותו הדבר. לא?
מודה שלא הבנתי
“ההסתברות שבמשפחה יש שלושה ילדים היא רבע”
התכוונת לשמינית
ואם אתה כבר קורא את התגובה, אולי תענה “מה כתוב כאן”?
http://www.sci-princess.info/archives/1638
אה, זו הודעה על הרצאה בנושא פענוח צפנים שנתתי פעם באייקון.
התכוונתי לרבע. זה בקונטקסט של כל הסיפור בו הילד האחרון הוא תמיד בת, אז זו בעצם הסתברות מותנה.
ההנחה הרביעית- שאין קשר בין המינים של הילדים באותה משפחה היא לא נכונה. צריך להבדיל בין הסתברות שולית להסתברות מותנה. ההסתברות השולית ללידת זכר היא אכן כ 0.5, אך ההסתברות ללידת זכר עבור זוג הורים ספציפי היא בהחלט לא 0.5 – סביר להניח שיש אפקט מקרי נמשמעותי׳. אם מסירים את ההנחה הזו מקבלים סחף לטובת הזכרים כתלות ביחס בין השונות של האפקט המקרי לשונות של השאריות. הסחף הוא גם בתוך הדור וגם על פני דורות.
כן, הטענה הזו צצה שוב ושוב. היה אפילו מחקר שבדק את זה. הייחסתי אליו בפוסט “האם כל תוצאה מובהקת היא משמעותית (ולהיפך)?”
תקציר: במחקר שנערך בדנמרק עם גודל מדגם ענק – 700 אלף משפחות, 1.4 מיליון ילדים, התקבלה תוצאה “מובהקת” שתומכת בתיאוריית הסחף. אבל בדיקה יותר זהירה של הנתונים, עם הרבה מאוד עיגולים נדיבים כלפי מעלה, מעלה שכתוצאה מה-“סחף” הזה, במשך 35 שנה, כל שנה נולדו 0.48 יותר בנים ממה שהיה “צריך” להיות. זה רעש סטטיסטי. התוצאה מובהקת בגלל גודל המדגם הענק. זה הכל. המחקר הזה לא תומך בתיאוריית הסחף.