• חיפוש באתר

    קישורים

    עמודים

    RSS סטטיסטיקה ברשת

    תגים

    ארכיב עבור תגית היסטוריה

    הודעה: הרצאה בפטיבל אייקון

    אייקון TLV, הפסטיבל הבינלאומי למדע בדיוני ופנטזיה, נערך מדי שנה בתל אביב בחול המועד סוכות.

    במסגרת הפסטיבל שייערך השנה, אתן הרצאה על ההיסטוריה של הניסויים הקליניים, נושא שהיה בבחינת מדע בדיוני בהיסטוריה הלא ממש רחוקה שלנו. ההרצאה תתבסס על הרצאה "מהלימון ועד הקופקסון" שנתתי לפני כחצי שנה, אולם ההדגשים יהיו שונים, בהתאם לקהל היעד.

    פרטים על מועד ההרצאה יפורסמו בקרוב באתר הפסטיבל וגם כאן.

    מקבץ 3

    במקבץ השבוע גם כמה קישורים מהשבוע הקודם שנדחו בגלל פול התמנון.

    • ב-7 ביולי צוין יום השנה ה-104 להולדתו של הסטטיסטיקאי וחוקר תורת ההסתברות ויליאם פלר. צייצתי את המאורע בתוספת הערה כי "מי שלא ציטט את ספרו של פלר בעבודת המאסטר או הדוקטורט שלו, לא באמת עשה תואר בסטטיסטיקה". טוב, אולי קצת הגזמתי, אבל הספר אכן מצוטט בעבודת המוסמך שלי.
    • כאשר ערכתי את רשימת 15 הסטטיסטיקאים הגדולים כללתי בה 5 סטטיסטיקאים חיים.  אחד מהם הלך לעולמו ב-8 ביולי, בגיל 91. דויד בלקוול, בנו של פועל רכבת מדרום אילינוי, אשר לימד את עצמו לקרוא, הפך לאחד הסטטיסטיקאים המשפיעים ביותר במאה העשרים. בלקוול חקר גם את תורת המשחקים, וכתב ספר לימוד פופולרי בתחום. ויליאם בריגס כותב גם הוא בבלוג שלו על בלקוול, ומתאר שם את פתרונו של בלקוול לבעית ההימורים הידועה כ-"פרדוקס סנט-פטרסבורג".
    • נניח שאתם מתכנתים קוד מחשב. ודאי שיש בו באגים. איך תדעו כמה באגים יש בו? ג'ון ד. קוק מסביר בבלוג שלו איך לעשות את זה: אפשר לבקש ממישהו לבדוק את הקוד. נניח שימצא 20 באגים. זה אומר שיש בקוד לפחות 20 באגים, אבל לא מקדם אתכם הרבה. הפתרון – לתת לעוד מישהו לבדוק את הקוד. סביר להניח שימצא חלק מהבאגים שמצא הבודק הראשון, ואולי גם יעלה על באגים אחרים. עכשיו, בעזרת קצת סטטיסטיקה, תוכלו לאמוד את מספר הבאגים שנמצאים ועדיין לא התגלו.
    • מעולם לא כתבתי מכתב אהבה כזה, אבל מלים כאלה רק סטטיסטיקאי יכול לכתוב.
    • בהמשך לפול התמנון: האם העובדה כי מישהי זכתה ארבע פעמים בלוטו "סותרת את כל הסטטיסטיקות"? ממש לא.
    • חובבי הבייסבול יודעים כי קבוצת פיטסבורג פיראטס היא אחת הקבוצות החלשות ביותר בליגת הביססבול האמריקנית (MLB). ובכל זאת, הליגה מציעה לאוהדים לרכוש אופציה לרכישת כרטיס למשחק השביעי של הפיראטים  בסדרת הגמר (ה"וורלד סירייס"), אם יהיה משחק כזה, כמובן. האם כדאי לקנות את האופציה? ואם כן, האם המחיר המוצע "משתלם"? בלוג הבייסבול FanGraphs מציג שילוב של ניתוח סטטיסטי וכלכלי, עם הסבר נאה למושג התוחלת ומשמעות האופציה.

    מקבץ (2) – מוקדש לפול התמנון

    מקבץ השבוע מוקדש לפול התמנון.

    מי שלא יודע, פול התמנון חי לו בגן חיות אי שם במזרחה של גרמניה, ובמקביל לעיסוקים השגרתיים של גן החיות פיתח לו קריירה של אוראקל החוזה את תוצאות משחקיה של נבחרת גרמניה במונדיאל. לפני שעה קלה השלים פול מונדיאל מוצלח יחסית, בו ניבא ללא טעות את תוצאות כל שבעת המשחקים של נבחרת גרמניה. מוצלח "יחסית", כתבתי, כיוון שעתידו עדיין לוט בערפל, לאור הניבוי של הפסד גרמניה לספרד בחצי הגמר.

    עוד לפני המשחק הגורלי (לעתידו של פול) מול ספרד ביקש ממני במייל  גדי איידלהייט להתייחס לנושא בבלוג. הסתפקתי בטוויט, בו כתבתי כי יש סיכוי די גבוה שמתישהו איפהשהו תמנון או חיה אחרת תצליח לנחש סדרה של תוצאות משחקים. על הגירפה שלא הצליחה לנחש אף תוצאה, לעומת זאת,  אף אחד לא מדווח. וזה בסך הכל תמצות של 140 תווים לרשימה שכתבתי בעקבות האירוע "יוצא הדופן" שאירע בלוטו הבולגרי.

    הנה עוד כמה התייחסויות של פול השבוע ברשת:

    דויד שפיגלהלטר מהבלוג understanding uncertainty נטען טיעון דומה לשלי, לפיו יש כאן הטיית פרסום, ומשום מה כל היצורים הימיים החוזים כי צפון קוריאה תזכה בגביע סובלים מהתעלמות התקשורת.

    וילאים בריגס מדווח על מני, התוכי מסינגפור, שחזה נכונה את כל ארבע הנבחרות שהגיעו לחצי הגמר. אבל גם בריגס קובל על התעלמות התקשורת מבני הבולדוג וסמי הסנאי שהתחזיות שלהם היו קצת פחות מוצלחות. בריגס גם חישב ומצא כי אם יש 200 חיות המנסות לנחש תוצאות של שבעה משחקים, וכל אחת מהן מנחשת את התוצאה הנכונה של כל משחק בהסתברות של 50%, הרי יש הסתברות של 93% כי אחת מהן תצליח לנחש שבע תוצאות נכונות.

    ולסיום, הנה עוד מתחרים לפול התמנון: שני מתמטיקאים מאוניברסיטת לונדון פיתחו מודל המשתמש בתורת הגרפים כדי לחזות את נצחונה של ספרד על הולנד בגמר, מחר. כיוון שלפני שבוע דיווחתי כאן על מתמטיקאי סקוטי שחוזה את נצחונה של הולנד, אני מעז להעלות כאן תחזית שבודאי תתגשם: מישהו מהחוזים האלה יטעה.

    מקבץ

    מי שעוקב אחרי הבלוג הזה בטח כבר שם לב שלאחרונה אין לי כח לכתוב פוסטים מושקעים, עקב עייפות החומר והרוח. זה לא אומר שהבלוג הולך למות, ואני בהחלט מקווה לחזור ולכתוב בהרחבה על נושאים שברומו של הבלוג.

    זה לא אומר שנעלמתי לחלוטין. מי שעוקב אחרי בטוויטר רואה את הגיגיי ולינקים שונים שאני מפרסם. מאחר ואני יודע כי כאן בבלוג יש יותר קוראים מאשר עוקבים בטוויטר, הנה מקבץ לינקים שפרסמתי בזמן האחרון, שעוסקים בעיקר בשלושה נושאים: סטטיסטיקה, כדורגל (לכבוד המונדיאל), וסטטיסטיקה וכדורגל.

    נתחיל בסטטיסטיקה.

    ונעבור לכדורגל.

    • מתי שתי הקבוצות המשחקות רוצות להבקיע שער עצמי? הסיפור מתואר בבלוג הכלכלי "marginal revolution", ולמאותגרי אנגלית הוא מתורגם לעברית בבלוג של שמוליק.
    • 10 השערים המוזרים ביותר. מעניין לראות את הבדלי התרבויות בין הולנד (איפופה, לצורך העניין) וברזיל (או דרום אמריקה). בשער השני ברשימה, שחקן הולנדי מבקיע שער בטעות (הוא התכוון לבעוט את הכדור החוצה כדי לאפשר טיפול בשחקן פצוע של הקבוצה היריבה, אך הכדור נחת ברשת). כשהמשחק מתחדש, הקבוצה שהבקיעה נותנת ליריבה להבקיע שער משלה כדי להחזיר את המצב לקדמותו. בשער מספר שלוש, לעומת זאת, במשחק שנערך בברזיל, כדור שנבעט לשער יוצא החוצה, אך מישהו שעומד ליד השער לוקח את הכדור ומשליך אותו לתוך הרשת. השופט פספס את כל המהלך וראה רק כדור ברשת, וממהר לשרוק שער. שחקני הקבוצה שזכתה בשער מן ההפקר מרימים ידיים בשמחה. אף אחד לא מעלה בדעתו לגשת לשופט ולהגיד לו "שמע, זה לא באמת גול". אז מי שחשב שההצגה של ריוואלדו ב-2002 שגרמה להרחקת שחקן יריב על לא עוול בכפו, או השער שהבקיעה ברזיל במונדיאל הזה תוך שימוש ביד של אחד משחקניה הם סתם מקרים, שיחשוב שוב. זו תרבות. זה בא מלמטה.

    ואסיים, כמובטח, בסטטיסטיקה וכדורגל: מאמר שהופיע בעיתון סקוטי מתאר מודל סטטיסטי המנבא כי הולנד תזכה במונדיאל הקרוב. המאמר הופיע לפני הנצחון של הולנד על ברזיל. טוב, לנסים טאלב בטח יש מה להגיד על הניבוי הזה (וגם לי), אבל כרגע הסיכויים של הולנד הרבה יותר גדולים מאלה של ברזיל, וגם זה משהו.

    כמה עובדות על פיי

    לפני שבועיים פרסמתי כאן חידון על המספר פיי – π. לאלה מכם שלא ישנו בלילות בציפיה לתשובות (וגם לאלה שלא), הנה התשובות לרוב השאלות בחידון. אני מקווה שתסלחו לי , אבל מספר הספרות שחושב אחרי הנקודה העשרונית  של פיי משתנה מדי פעם, והדברים בבלוג הזה אמורים להיות נכונים לנצח.

    פיי בעולם העתיק

    מתברר כי הבבלים השיגו קירוב טוב מאוד לערך של פיי, שעולה אך במעט על הקירוב המצרי. התנ"ך, לעומת זאת. אינו מומלץ כטקסט ללימוד מתמטיקה.

    בתנ"ך, בספר מלכים א, פרק ז' בו מתואר המקדש שבנה שלמה, מתואר בפסוק כ"ג ים הנחושת שבמקדש:

    "וַיַעַשׂ אֶת הַיָם מוּצָק, עֶשֶר בָאַמָה מִשְפָתוֹ עַד שְפָתוֹ עָגֹל סָבִיב, וְחָמֵשׁ בָאַמָה קוֹמָתו וְקָו  שְלשִים בּאַמּה יָסב אתוֹ סָבִיב"

    כלומר היקפו של ים הנחושת 30 אמה וקוטר של 10 אמות, ומכאן שלפי נתוני ספר מלכים ערכו של פיי שווה ל-3. אמנם קיים איזה פלפול ולפיו הערך של פיי גם על פי ספר מלכים הוא 3.14, ומי שמעוניין יכול לחפש אותו ברשת ולהתרשם.

    המצרים (על פי התיעוד בפפירוס רינד) העריכו כי שטחו של מעגל החסום בריבוע שווה לשטחו של ריבוע שאורך צלעו  היא 8/9 מצלע הריבוע החוסם את המעגל (זוהי בעצם הערכה לפיה שטח המעגל שווה לשטח מתומן משוכלל החסום בתוכו), ומהערכה זו נובע כי ערכו של פיי הוא בערך 256/81 או 3.16. ערך זה גבוה ב-0.6% מהערך האמיתי.  אולם כבר 500 שנים קודם לכן השתמשו הבבלים בחישוביהם בערך  לקירוב היחס בין היקף המעגל וקוטרו, 25/8. ערך זה נמוך ב-0.5% מהערך האמיתי של פיי.

    גם תרבויות אחרות השיגו קירובים טובים לערך של פיי. האסטרונום ההודי יאגנואלקיה השתמש במאה התשיעית לפני הספירה בקירוב 339/108 (0.09% מתחת לערך האמיתי). ארכימדס שכלל את השטטה המצרית, וקירב את שטח המעגל של ידי מצולע משוכלל בן 96 צלעות. הוא השיג קירוב של 0.02% במאה השלישית לפני הספירה. כ-500 שנה מאוחר יותר, שיפר תלמי את קירוב ארכימדס על ידי שימוש במצולע משוכלל בן 360 צלעות, והשיג דיוק של יותר מ99.999%. קירוב דומה השיג גם המתמטיקאי הסיני ליו הוי.

    מי הנהיג את השימוש באות היוונית פיי לציון היחס בין היקף המעגל לקוטרו?

    ובכן, כיום סבורים כי השימוש הראשון באות היוונית פיי לסימון הקבוע המתמטי החשוב הזה נעשה בספרו של ויליאם ג'ונס, שיצא לאור ב-1706, אולם עדיין נהוג לייחס את הפצת השימוש באות פיי לליאונרד אוילר, שהשתתמש בו לראשונה במאמר שכתב ב-1737.

    הקשר בין פיי ובעיית ריבוע המעגל

    בעיית ריבוע המעגל (או יותר נכון, ריבוע העיגול) היא הבעיה של בניית ריבוע ששטחו שווה לשטח של עיגול נתון בעזרת מחוגה וסרגל.  בעיה זו אינה ניתנת לפתרון כיוון שפיי הוא מספר טרנסצנדנטי. אני לא ארחיב כאן מלים רבות על הנושא – פשוט משום שגדי אלכסנדרוביץ כבר עשה זאת בבלוג המצויין שלו, ואני פשוט אפנה אתכם לרשימה שכתב: "אז למה אי אפשר לרבע את העיגול?". המתמטיקאי שהוכיח כי הבעיה אינה ניתנת לפתרון, או יותר נכון, הוכיח כי פיי הוא מספר טרנסצנדנטי ומכך נבע כי בעיית ריבוע המעגל אינה ניתנת לפתרון, הוא פרדיננד פון-לינדמן, שפרסם את הוכחתו ב-1882. ההוכחה, אגב, מתבססת על הקשר המופלא שהראה אוילר בין פיי וקבועים מתמטיים אחרים – המספר e, המספר המדומה i, והמספרים 0 ו-1:

    תפקידו של פיי בסטטיסטיקה

    לפיי תפקיד חשוב בסטטיסטיקה כיוון שפיי מופיע בנוסחת ההתפלגות הנורמלית. שתי תשובות כאן נועדו לבלבל את המנסים לנחש ניחושים אינטליגנטיים. אין בכלל דבר כזה "עקומת צפיפות האוכלוסיה של אוילר". אני המצאתי את העקומה הזו כשכתבתי את החידון המקורי לפני חמש שנים. גם עניין נוסחת גודל המדגם הוא מופרך למדי. אין דבר כזה "נוסחה לחישוב גודל מדגם". זה עניין הרבה יותר מורכב משימוש בנוסחא.

    מה שמעניין הוא שאכן ניתן לקרב את ערכו של פיי באמצעות הטלת מחט על גיליון נייר,  בתנאי שעושים זאת הרבה מאוד פעמים. תוצאה זו ידועה בשם בעיית המחט של בופון (על שם הרוזן דה-בופון, שהציג לראשונה את הבעיה במאה ה-18). אם מטילים את המחט על גבי גליון נייר שעליו משורטטים קוים מקבילים, אז ההסתברות כי המחט תיפול כך שתחצה את אחד הקוים תלויה בפיי. למשל, אם המרחקים בין הקוים שווים לאורך המחט, אז ההסתברות כי המחט תחצה את אחד בקווים שווה ל-2 חלקי פיי. איך פיי מופיע כאן? ההסתברות תלויה במקום בו נמצא מרכז המחט ובזוית בין המחט ובין הקוים המקבילים. כאן נכנסת פונקציית הסינוס לתמונה, ועימה פיי. אם תטילו מחט כזו על דף פעמים רבות, אז תוכלו לקבל קירוב לערכו של פיי על ידי חלוקת 2 בפרופורציית הפעמים בהן המחט חצתה את אחד הקוים. חוק המספרים הגדולים מבטיח לכם כי הקירוב יהיה טוב יותר ככל שיגדל מספר הנסיונות.

    מי נולד ביום הפיי?

    המתמטיקאי שיום הולדתו הוא יום הפיי, ה-14 למרץ, הוא אלברט איינשטיין, שנולד ביום זה בשנת  1879. איינשטיין ידוע בראש ובראשונה כפיזיקאי, וזה אכן היה עיסוקו העיקרי. אולם ברור לכל שאין כל אפשרות לעסוק בפיזיקה ברמה שבה עסק איינשטיין ללא ידע מתמטי נרחב ויכולות בתחום. למעשה, איינשטיין נאלץ לפתח בעצמו (למעשה, בצוותא עם ידידו ושותפו למחקר גרוסמן) את הכלי המתמטי העיקרי בו השתמש בפיתוח תורת היחסות הכללית – אנליזה טנזורית. תורת היחסות הכללית פורסמה ב-1915, וממש באותו זמן פרסם המתמטיקאי דויד הילברט עבודה משלו בתחום האנליזה הטנזורית, שחפפה לחלק המתמטי של עבודתם של איינשטיין וגרוסמן. כאשר ב-1921 נסע איינשטיין לארה"ב יחד עם ד"ר חיים וייצמן, במטרה לגייס כספים להקמת האוניברסיטה העברית. ניצל את ההזדמנות כדי לתת הרצאה על תורת היחסות בפרינסטון. האולם היה מלא מפה לפה, ועל כך העיר איינשטיין: "לא ידעתי כי כל כך הרבה אנשים באמריקה מתעניינים באנליזה טנזורית".

    באיזה אופן מתנהגות הספרות בפיתוח העשרוני של פיי ?

    הטענה היחידה  שניתן לטעון בודאות בודאות לגבי הספרות בפיתוח העשרוני של פיי היא שהן מתנהגות באופן לא מחזורי, וזה נובע מאי הרציונליות של פיי. הן לא מתנהגות באופן סטטיסטי כי אין חיה כזו. האם הן מתנהגות באופן אקראי ? ההשערה היא שכן, אבל איש עדיין לא הוכיח זאת.

    איזה מהנוסחאות הבאות אינן מהוות קירוב טוב לפיי?

    אני לא זוכר למה בדיוק התכוונתי כשכתבתי את השאלה הזו לפני כמה שנים.

    הנוסחה שבסעיף א התגלתה/פותחה על ידי וייטה:

    בסעיף ב מופיעה הנוסחה שפיתח לייבניץ, אחד מאבות החשבון הדיפרנציאלי, לפיי:

    המכפלה האינסופית שבסעיף ג ידועה בשם מכפלת ואליס, ואינה מתכנסת לפיי, אלא לפיי חלקי 2.

    בסעיף ד מופיע מופיע טור הדומה לטור של לייבניץ – שימו לב לסימנים ההפוכים, ואם הוא מתכנס אז בודאי לא לפיי.