ארכיב עבור תגית סטטיסטיקה

בדיחות בלתי מובנות

היום בבוקר נערכה במקום עבודתי ישיבה שעסקה בעניינים שברומו של עולם. בתחילת הישיבה דווח כי אחד המשתתפים, רופא במקצועו, לא יוכל להשתתף מכיוון שהינו חולה. מייד הועפו באויר כל מיני הערות בסגנון "הסנדלר הולך יחף" וכדומה, ואני הערתי כי 40% מימי המחלה מדווחים בימי ראשון או חמישי. ההערה גרפה צחוק רועם, אך מייד לאחר מכן התפתח דיון בנושא ימי המחלה, וממנו התחוור לי כי הבדיחה כלל לא הובנה, והצחוק התעורר מהסיטואציה בה סטטיסטיקאי שולף בבטחון עצמי נתון סטטיסטי מהשרוול. בסופו של דבר מצאתי את עצמי נאלץ להסביר את הבדיחה לקהל, דבר שחיסל כל סיכוי לכך שמישהו יהיה משועשע מהבדיחה, וגרם לי להרהר בהמשך היום על המסר שעובר ממני ללקוחות שלי. מקווה לשתף אתכם  בהרהוריי אם אגיע לתובנה כלשהי.

בכל מקרה, אני לא מתכוון להסביר כאן את הבדיחה, אתם מוזמנים לדון בכך במסגרת התגובות.

גילוי נאות: הבדיחה בכלל אינה בדיחה מקורית שלי. נתקלתי בה פעם באחד מטורי דילברט, ובסיטואציה שתוארה שם התלונן הבוס מחודד השיער על התופעה (שהתייחסה לימי שני וששי, כנהוג בניכר), וניסה לנקוט באמצעים למיגורה. אודה למי שיצליח לאתר את הסטריפ.

פורסם לראשונה באתר "רשימות" בתאריך 31 בדצמבר 2006  שם התקבלו 7 תגובות

Morin  [אתר]  בתאריך 12/31/2006 10:53:32 PM

אני דווקא חושבת

שזה משעשע מאד.

יואב  בתאריך 1/1/2007 11:34:22 AM

לא רוצה להרוס את הבדיחה,

אבל, מעניין אם מישהו באמת בדק את זה (ההתפלגות של ימי מחלה מדווחים לפי היום בשבוע). יש לי הרגשה שלא מדובר בהתפלגות אחידה…

מתן  בתאריך 1/2/2007 5:51:24 PM

ללא נושא

לטעמי דווקא כן זה מאוד הגיוני שההתפלגות תהיי לפני הסופש ואחרי הסופש מה שנקרא בארהב ה-monday blues

איתיש  [אתר]  בתאריך 1/2/2007 8:20:32 PM

אני לא הבנתי. ):

איתיש  [אתר]  בתאריך 1/3/2007 9:28:35 PM

אל חשש: בסוף האסימון נפל.

אולי אני צריך לאהוב מתמטיקה כדי לצחוק מזה, לא…?

צליל  בתאריך 1/6/2007 12:46:17 PM

רגע

הפאנצ' הוא שמוציאים ימי מחלה בתחילת וסוף השבוע כדי להאריך את הסופ"ש, לא?
אבל אם 100 אחוז ימי מחלה מתחלקים בין חמישה ימים יש בכל יום 20 אחוז מימי המחלה, ואז בראשון וחמישי יחד יש 40 אחוז בלי שזה מצביע על שום מגמה.
או שאולי זה הפאנצ'?

אחד  בתאריך 1/14/2007 11:25:35 PM

יש לי יש לי

רשימת דילברט מה 18.4.06
יש לי אותה בספר הקרוי "highly defecred people" , עמ' 177

מגילת אסתר סמואל כהן

הבוקר נפתח בירושלים כנס מדעי הנושא את השם הבלתי שגרתי "מגילת אסתר סמואל כהן".  אם תחפשו את אסתר סמואל כהן בגוגל תקבלו רק 9430 תוצאות, ומתוך 50 התוצאות הראשונות רק כחמישית יהיו רלוונטיות. חיפוש אחרי שמה באנגלית יניב באופן טבעי מעט יותר תוצאות – 611 (כולן רלוונטיות), מספר זעום בהשוואה למליוני הדפים שגוגל מנפק בחיפושים יותר שגרתיים. אבל אל תתנו לנתון הסטטיסטי הזה להטעות אתכם: מדובר כאן באחת הסטטיסטיקאיות הגדולות של דורנו.

אנקדוטה משעשעת: אי שם בתחילת שנות ה-90, לימדתי קורס מבוא לסטטיסטיקה לקבוצה של עובדי מדינה. בפתיחת השיעור הראשון, ביקשתי מהתלמידים לומר לי מה עולה במוחם כאשר אומרים להם "סטטיסטיקה" (מתוך כוונה לרשום את כל האסוציאציות על הלוח כדי להסביר במה יעסוק הקורס). הנוכחים היו מופתעים מהפניה והיו כמה שניות של שקט בכיתה. ואז, אחד התלמידים, אדם בשנות החמישים לחייו שישב במרכז השורה הראשונה, הרים את ידו ואמר: "אסתר סמואל כהן".

esther samuel-cahn

סיפור אישי: בקיץ 1984 השתחררתי מהצבא, והתחלתי ללמוד כלכלה באוניברסיטה העברית. תלמידי שנה א נדרשו אז ללמוד במסלול דו-חוגי, וכברירת מחדל בחרתי בחוג לסטטיסטיקה כחוג השני שלי. המרצה של קורס המבוא לסטטיסטיקה, נכתב בשנתון, היה מישהו בשם "פרופ' א. סמואל כהן". בשיעור הראשון הופיע מרצה ג'ינג'י באולם ההרצאות, הודיע כי במשך הטרימסטר הראשון פרופ' אסתר סמואל כהן נמצאת בשבתון, ולכן בינתיים הוא ימלא את מקומה. הג'ינג'י, ד"ר (היום פרופסור) משה פולק, התגלה כמרצה כריזמטי ואהוב שכבש בסערה את לב כל הסטודנטים. בסוף הטרימסטר אף הייתה התארגנות סטודנטים שפנתה בעצומה אל ראש החוג בבקשה כי ד"ר פולק ימשיך ללמד את הקורס. אולם הבקשה לא נענתה, כמובן, ובתחילת הטרימסטר השני התייצבה בפנינו פרופ' א. סמואל כהן ללמד את המשך הקורס. האכזבה הייתה רבה. התייצבה בפנינו אשה מבוגרת, חובשת שביס, בעל קול גבוה שצרם את אזנינו. בהשוואה לד"ר פולק, היה ברור לנו שמדובר בנפילה.

בהמשך התברר, לי לפחות, כי בהחלט יש להסתכל לא רק בקנקן אלא גם במה שיש בו. פרופ' סמואל כהן הייתה מורה מצויינת, שטיפחה היטב את זרעי האהבה לסטטיסטיקה שנטע בי ד"ר פולק. במבט לאחור, 22 שנים לאחר מכן, אני יודע כי הפכתי לסטטיסטיקאי לא בזכות הבחירה המקרית של החוג לסטטיסטיקה כחוג שני, אלא בזכות המבט המעמיק אל תוך עולם הסטטיסטיקה שפרופ' סמואל כהן אפשרה לי באותו קורס מבוא בשנת הלימודים 1984/5.

צברתי לאחר מכן עוד הרבה "שעות אסתר". למדתי אצלה עוד קורסים רבים, כולל סמינר קריאה מודרכת, ואף זכיתי להיות עוזר הוראה בשני קורסים שהיא לימדה. אני גאה לומר על עצמי שאני אחד מתלמידיה.

הכנס הנפתח היום בירושלים נערך לכבודה של פרופ' אסתר סמואל כהן, כלת פרס ישראל, שפרשה לא מזמן מהוראה באוניברסיטה העברית. ברשימת הדוברים בכנס, שיימשך שלושה ימים, נמצאים החוקרים המובילים בתחומים המדעיים בהם פעלה, החל מהסקה בייסיאנית אמפירית ועד אי שוויון הנביא. גם חבריה ותלמידיה יהיו שם. וגם אני.

פורסם לראשונה באתר "רשימות" בתאריך 18 בדצמבר 2006  שם התקבלו 4 תגובות

איתי אשר  [אתר]  בתאריך 12/19/2006 8:00:44 AM

ומעלתה הגדולה ביותר הצניעות

מאת: תלמיד לשעבר בתיאוריה סטטיסטית
ושכן לבלוק השיכון בירושלים בו היא גרה

טלג  [אתר]  בתאריך 12/20/2006 5:37:41 PM

הכנס היה מאד מרגש

מבלי שהכרתי את פרופסור אסתר, הגעתי לכנס מתוך סקרנות סטטיסטית.
וזכתי להנאה רבה מהאווירה של כבוד וחיבה עצומה – שאנשים העניקו לאסתר.
החוויה בכללולתה הייתה מאד מעניינת ונעימה.
(אפילו שמההרצאות הצלחתי לקלוט רק כמות "מובהקת" של 5% מהחומר…)

יוסי לוי  [אתר]  בתאריך 12/20/2006 11:17:10 PM

טל – הנה עוד סיפור על אסתר – בשבילך

כאשר הייתי בשנה ב, הודיעה אסתר כי כנס האיגוד הישראלי לסטטיסטיקה של אותה שנה יתקיים בירושלים, והציעה כי ביום הכנס היא תבטל את ההרצאה שלה בקורס תיאוריה סטטיסטית, בתנאי שאנו, הסטודנטים, נבוא לכנס.
כאשר הבענו את חששותינו שמא לא נבין כלום, היא ענתה לנו: אל תדאגו, גם אני בדרך כלל מפסיקה להבין את ההרצאה אחרי חמש דקות.
אני השתכנעתי (היום אני יודע שהיא תמיד מבינה הכל עד הסוף…) וכך הגעתי לכנס הראשון שלי. אכן, הכנס היה חוויה בלתי נשכחת.

משהו  בתאריך 4/30/2008 6:04:15 PM

ללא נושא

אסתר סמואל ומשה פולק הם בני דודים

איך אומרים סודוקו בלטינית?

לטקס במטה הכללי הגיעו 36 קצינים משש אוגדות – שישה קצינים מכל אוגדה.יתר על כן, כל אוגדה שלחה לטקס סגן משנה אחד, סגן אחד, וכן סרן, רב-סרן, סגן-אלוף ואלוף-משנה. מנהל הטקס ביקש לסדר את הקצינים ב-6 שורות של ששה קצינים – כך שבכל שורה ובכל עמודה יעמוד קצין אחד מכל אוגדה וקצין אחד מכל דרגה. איך יסדר את הקצינים?

השעשוע של אוילר הפך לכלי שימושי בסטטיסטיקה המודרנית

בבעיה הזאת התחבט ליאונרד אוילר, מתמטיקאי שוויצרי, בשנת 1779. אוילר אמנם התעניין בבעיה כדי לשעשע את עצמו, אך משלא הצליח לפתור אותה החליט לתקוף אותה ביתר רצינות. ארבע שנים לפני מותו הובילה אותו בעיית הקצינים למחקר של יצור מתמטי חדש – הריבוע הלטיני.

מהו ריבוע לטיני? כל מי שיודע מהו סודוקו יודע גם מהו ריבוע לטיני: זהו ריבוע המחולק למשבצות: n שורות ו-n עמודות, כאשר בכל משבצת מופיע אחד המספרים בין 1 ל-n (או אחת מ-n האותיות הראשונות באלפבית הלטיני – ומכאן השם "ריבוע לטיני"). על האותיות להיות מסודרות כך שבכל שורה ובכל עמודה תופיע כל אות בדיוק פעם אחת. כדרכם של מתמטיקאים נבר אוילר בריבועים הלטיניים שהמציא, שיער השערות, גילה תכונות מעניינות, מיין את הריבועים הלטיניים למשפחות שונות, כיד הדמיון הטובה עליו. הוא חש כי בעיית הקצינים אינה ניתנת לפתרון, ואף ניסח השערה כללית לגבי התנאים בהם הבעיה פתירה. הבעיה הכללית נפתרה רק ב-1960, כאשר הוכח כי השערתו של אוילר הייתה מוטעית. הבעיה המקורית אמנם אינה פתירה, אך עבור מספרים אחרים של אוגדות ודרגות, קיימים פתרונות.

השאלה היחידה שבאמת לא עניינה את אוילר היא השאלה היישומית. איזה תועלת עשויה לצמוח מחקר הריבועים הלטיניים? עבור אוילר הדבר לא העלה ולא הוריד. אולם, כפי שקרה לא פעם, יתברר כי לריבועים הלטיניים יש יישומים מעשיים רבים, ושעשועון הסודוקו הוא רק אחד מהם. ריבועים לטיניים שימשו לפיתוח אלגוריתמים לפתרון בעיות של חלוקת משאבים והקצאתם, שצצות כמעט בכל תחום של ייצור, מחשוב, ואפילו בחלוקת עוגה בין ילדים. שימוש נוסף לריבועים לטיניים הוא בתחום ההצפנה. אולם השימוש העיקרי לריבועים לטיניים הוא בסטטיסטיקה.

הכימאי ממבשלת הבירה הניח את היסודות לענף מרכזי בסטטיסטיקה

ויליאם גוסט (Gosset), מחלוצי הסטטיסטיקה, היה כימאי שעבר לפרנסתו במבשלות הבירה של גינס. אחד מתפקידיו היה למצוא דרכים לשיפור כמות ואיכות השעורה שגודלה עבור מפעלי הבירה. גוסט התבקש לבחון חמישה סוגי דשן שהוצעו לשימוש בגידול השעורה. פתרון פשטני לבעיה הוא לבחור חמישה שדות, ובכל שדה לנסות סוג אחר של דשן. ניסוי כזה הוא בעייתי. אם יהיו הבדלים ביבולים השונים, לא יהיה אפשר להסיק בודאות כי ההבדלים נגרמו על ידי הדשנים. בשדות שונים יש תנאי גידול שונים: אדמה, אקלים מזיקים, כל אלה יכולים להשפיע על גידול השעורה. הניסוי חייב להיות מבוקר: כל תנאי הגידול, פרט לסוג הדשן, חייבים להיות זהים במידת האפשר. הפתרון של גוסט היה לבחור שדה ריבועי, ולחלק אותו ל-25 ריבועים קטנים. בכל אחד מחלקי הריבוע נעשה שימוש בדשן אחר, כך שבכל שורה ובכל עמודה נעשה שימוש בכל סוגי הדשן. אם נסמן את סוגי הדשן ב-A, B, C, D, ו-E, השדה של גוסט נראה בערך כך:

כלומר, התכנון של גוסט התבסס על הריבוע הלטיני של אוילר. הפיזור של הדשנים על כל השדה מנעו גם את האפקט האפשרי של המיקום בשדה (במרכז או סמוך לקצה) על גידול השעורה. כל שנותר לעשות הוא להמתין לקציר ולהשוות את היבול שהתקבל מכל אחד מהדשנים. הניסוי של גוסט הוביל מאוחר יותר לפיתוח ענף שלם בסטטיסטיקה – תכנון ניסויים.

 

פורסם לראשונה באתר "רשימות" בתאריך  17 ביוני 2005 שם התקבלה שם התקבלה שם התקבלו9 תגובות

סודוקון  בתאריך 6/18/2005 12:00:01 AM

שאלה ליוסי

האם יש אלגוריתם כללי לפתרון בעיות סודוקו (כלומר, האם הבעיה כריעה)?
אם כן, האם ידוע אלגוריתם יעיל? (פולינומיאלי בזמן ריצה)

אבנר  בתאריך 6/18/2005 8:36:20 AM

התנאי היותר מורכב של ריבוע לטיני

פרט לכך שכל עמודה וכל שורה תכלול כל אחד מהפריטים, ישנם מצבים שבהם נדרש שגם סדר הפריטים ישתנה, כך שאם א הופיע בשורה אחת לפני ובצמוד ל-ב באף אחת מהשורות הבאות לא נחזור על כך (אותו תנאי תקף גם לטורים). בסודוקו של תשע נדמה לי שזה בלתי אפשרי, זה בודאות אפרשרי בריבוע לטיני של שלושה טורים על שלוש שורות. איפשהו בדרך בין 3X3 ל-9X9 הבעייה הופכת לבלתי פתירה.

יוסי  [אתר]  בתאריך 6/18/2005 1:22:21 PM

תשובה לסודוקון

קיים אלגוריתם כללי כמובן.
כיוון שמספר הסידורים של 81 סימנים ב-81 משבצות הוא סופי, הרי שניתן "פשוט" לעבור על כולם, עד שיימצא הפתרון הנכון.
לעומת זאת, מי שניסה לפתור סודוקו "קשה" נוכח בודאי כי לפעמים יש צורך בבדיקת מספר אפשרויות עבור משבצת מסויימת, ולכן המסקנה היא כי בעיית פתרון הסודוקו נמצאת ב-NP, ומכאן שלא ידוע אם קיים אלגוריתם יעיל (פולינומיאלי( לפתרון הבעיה.

יוסי  [אתר]  בתאריך 6/18/2005 1:25:03 PM

תשובה לאבנר

התנאי שציינת יכול להתקיים בכל ריבוע לטיני מסדר זוגי, ואינו יכול להתקיים בריבוע לטיני מסדר אי זוגי.

בתאריך 6/19/2005 12:00:23 AM

ישנה הוכחה מסודרת יותר

ישנה הוכחה מסודרת יותר להיות הבעיה של הסודוקו NP-שלמה (כל הבעיות בP הן בNP זה לא עוזר לי כלום לדעת שהיא בNP השאלה היא אם היא NP שלמה או בP)
אפשר למצוא במאמר מסויים של סינים.

יוסי לוי  [אתר]  בתאריך 6/19/2005 7:40:44 AM

תשובה למגיב הקודם

תודה על ההערה הנכונה

הראל  בתאריך 7/5/2005 12:14:56 PM

לאונדר פולר, ידיהוט אחרונוט

בספרון שהוצאת ידיעות אחרונות הוציאה ונקרא משהו כמו "נפלאות הסודוקו", כתוב בהקדמה שהסודוקו הומצא תחת השם "משבצות לטיניות" על ידי מתמטיקאי שוויצרי משועמם בשם לאונרד פולר.
ידיעות אחרונות כבר קראתם??

הראל  בתאריך 7/5/2005 12:16:11 PM

NP-C

בערך האנגלי על סודוקו בויקיפדיה תמצאו קישור למאמר שמוכיח כי הבעייה היא NP שלמה.

ג. יפית  בתאריך 8/31/2005 11:47:37 AM

גם חבר שלך כותב פה על סודוקו

http://www.notes.co.il/ben-hateva/12445.asp
אבל עם כל הצרה נשגבה ממני הדרך שהוא הרכיב שם את המשחק. די מבולבל מה שהוא עשה שמה.

הסטטיסטיקה שהצילה חיים – סיפורה של פלורנס נייטינגייל

"כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה, משום שזהו כלי המדידה של כוונותיו" – פלורנס נייטינגייל

אני מניח שבסביבתכם הקרובה החגיגות לא מורגשות במיוחד, ובכל זאת, היום מצויין ברחבי העולם יום האחים והאחיות הבינלאומי. אל תרוצו לקנות מתנה לאחותכם הגדולה – מדובר כאן בהוקרה בינלאומית למקצוע הסיעוד. התאריך לא נבחר במקרה – ה-12 במאי הוא יום הולדתה של פלורנס נייטינגייל – הידועה בעיקר בזכות התרומה שתרמה להתפתחות מקצוע הסיעוד והפיכתו לדיסציפלינה מודרנית. פחות ידועה תרומתה של נייטינגייל לתחום הסטטיסטיקה. פלורנס נייטינגייל נמנית על חלוצי הסטטיסטיקה המודרנית.

פלורנס נייטינגייל נקראה על שם העיר פירנצה (פלורנס) באיטליה, שם נולדה היום לפני 186 שנה (12 למאי 1820), במהלך טיול באירופה שערכו הוריה. אביה, איש אצולה שלמד בקיימברידג´, נטל על עצמו להיות המורה הפרטי של פלורנס ושל אחותה הבכורה. השיעורים כללו לימוד יצירות קלאסיות, הפילוסופיה של אריסטו ואויקלידס, תנ"ך ופוליטיקה. בהיותה בת עשרים ביקשה מהוריה רשות ללמוד מתמטיקה, אך אמה התנגדה לכך, ואביה הציע כי תלמד תחום המתאים יותר לנשים, לדעתו. לאחר מאבקים הסכימו לבסוף, ונייטינגל החלה ללמוד מתמטיקה בהדרכתו של המתמטיקאי גוז´ף סילבסטר. היא גם עסקה בהוראת מתמטיקה לילדים.

Nightengale

נייטינגל התעניינה גם בנושאים חברתיים, וב-1845 החליטה לעסוק גם בטיפול בחולים כאחות, למרות שלא היה לה כל רקע בנושא. הוריה שוב התנגדו, שכן מקצוע זה לא נחשב למכובד באותם הימים. אך ב-1849 סיירה עם ידידים במצרים, ושם ביקרה במספר בתי חולים. ב-1850 החלה ללמוד בבית ספר לאחיות באלכסנדריה. ב-1853 חזרה ללונדון, והחלה לעבוד בהתנדבות באחד מבתי החולים שבעיר. כעבור שנה, כאשר הכריזה בריטניה מלחמה על רוסיה, התייצבה נייטינגייל יחד עם עוד 38 אחיות בקונסטנטינופול, ולמעשה כפתה על הצבא הבריטי להיעזר בשירותן בבתי חולים צבאיים. היא הנהיגה מספר רפורמות רפורמות בניהול בתי החולים, שהחשובה ביניהן היא שמירה על רמת סניטציה נאותה.

כדי להראות את חשיבות השמירה על רמת הסניטציה, נייטינגייל אספה בקפדנות נתונים סטטיסטיים אודות שיעורי התמותה בבתי החולים השונים.  היא ניצלה את ידיעותיה במתמטיקה כדי להראות כי שיעור התמותה צנח מיידית עקב הנהגת הסניטציה מ-80% ל-47%, ובמשך הזמן הלך וירד עד לשיעור של 2.2% בלבד. "כדי להבין את מחשבותיו של האלוהים עלינו לדעת סטטיסטיקה", אמרה נייטינגייל, "משום שזהו כלי המדידה של כוונותיו".

נייטינגייל גם פיתחה שיטות גרפיות להצגת הנתונים. הנה דיאגרמת "קוטב-שטח" (polar area) ששירטטה:

Polar-Area Diagram

הדיאגרמה מזכירה לכם את דיאגרמות העוגה המפורסמות – הלא כן? אולם הדיאגרמה הזו מתוחכמת בהרבה. נייטינגייל משלבת כאן מספר רעיונות. כל גזרה מייצגת קטגוריה של נתונים (בתי חולים במקרה הזה). אורך הגזרה (המרחק מהמרכז) מייצג שכיחות, וכל גזרה מחולקת בנוסף לכך לשלושה חלקים בשלושה צבעים (הדיאגרמה המקורית הייתה צבעונית) המייצגים סיבות תמותה. שטח הגזרות מבטא את השונות של התצפיות. כל זאת בשתי נקודות זמן. מדיאגרמה זו התפתחה בהמשך דיאגרמת העוגה הפשוטה יותר, וגם ההיסטוגרמה – בה השטח מבטא שכיחות.

כאשר חזרה ללונדון עם סיום מלחמת קרים ב-1856, המשיכה לאסוף נתונים על שיעורי התמותה בבתי החולים הצבאיים, כדי לקדם את שיטות הניהול שפיתחה. מאמציה נשאו פרי, ובהוראת המלכה ויקטוריה הוצאו המלצותיה לפועל. ב-1857 הייתה לאשה הראשונה שנבחרה אי פעם לחברה הסטטיסטית המלכותית בזכות תרומתה בתחום הסטטיסטיקה הרפואית. היא הוזמנה לייעץ לממשלות קנדה וארצות הברית בתחומים אלה. כמו כן, פתחה בית ספר לאחיות משל עצמה, בו נלמד מקצוע האח/ות על פי העקרונות והסטנדרטים החדשים שקבעה. כמו כן פרסמה למעלה מ-200 ספרים ומאמרים בנושאי סיעוד וסטטיטיקה רפואית. ב-1874 נבחרה לחברת כבוד באיגוד האמריקני לסטטיסטיקה. כמו כן הוענקו לה שני תארי אצולה, מידי המלכה ויקטוריה ב-1883 ומידי המלך אדוארד השביעי ב-1907. היא נפטרה ב-13 לאוגוסט 1910 בגיל 90.

פורסם לראשונה באתר "רשימות" בתאריך 12 במאי 2006 שם התקבלו 2 תגובות

yoni  בתאריך 5/17/2006 11:56:47 PM

מדהים

לא יאומן כמה רחבי אופקים היו אנשים בעולם ללא תקשורת ואינפומציה חופשית. תודה על המאמר

שרונה  בתאריך 5/6/2008 10:47:12 AM

תודה על האינפורמציה

אני אחות במקצועי ומאד הופתעתי לראות שפלורנס נייטינגל ניחנה בעוד כשרונות כמו סטטיסטיקה וניתוח מספרים. בתור אחות שמקווה לערוך מחקרים בעתיד זה רק מעודד ונותן דוגמא טובה ולכן תודה לך, שרונה

למי צלצל הפעמון?

במצפה הכוכבים שבגטינגן ישב קרל פרידיריך גאוס ועמל על חישוב מסלוליהם של גרמי השמיים. גאוס, גדול המתמטיקאים של המאה ה-17 (ואולי גדול המתמטיקאים אי פעם), היה מודע לטעויות המדידה של תצפיותיו. הוא הבחין כי להתפלגות של הטעויות המצטברות יש צורה פעמונית – רוב הטעויות מתרכזות סביב ערך מרכזי, אבל לעיתים ערכי הטעויות מצטברים לסכום גבוה או נמוך במיוחד. גאוס הצליח למצוא את הנוסחה המתמטית המאפיינת את ההתפלגות הפעמונית הזו ופרסם אותה במאמר בשנת 1809. אבל האם הבחין כי מדובר בחוק כללי הניתן ליישום גם לגבי תופעות אחרות? ייתכן שכן, אך הוא לא טרח לתעד זאת.

אברהם דה-מואבר - הראשון שהוכיח את קיומו של הגבול המרכזי

אברהם דה-מואבר, צרפתי הוגנוטי שגלה לאנגליה בסוף המאה ה-17, לא הצליח למצוא משרה אקדמית בארצו החדשה, ולכן נאלץ לעסוק בהוראה פרטית ובייעוץ למהמרים. הוא חקר את פרופורציית ההצלחות בסדרות של הימורים, וגילה כי להתפלגות הפרופורציות יש צורה פעמונית – בדרך כלל פרופורציית הזכיות קרובה לסיכוי הזכיה בהימור, אך לעתים פרופורציית הזכיות גבוהה במיוחד או נמוכה במיוחד. דה-מואבר הצליח למצוא את הנוסחה  המתמטית המאפיינת את ההתפלגות הפעמונית הזו, ואף הוכיח כי כאשר מספר ההימורים גדל, הולכת ההתפלגות ומתקרבת אל הנוסחה התיאורטית. הוא פרסם תוצאה זו בספר שהופיע בשנת 1718. למרבה הצער, ספרו של המתמטיקאי האלמוני לא היה לרב מכר, למרות שהופיע במספר מהדורות.

פייר סימון לפלס לא היה מתמטיקאי אלמוני כלל וכלל כאשר הופיע ספרו "התיאוריה האנליטית של ההסתברות" בשנת 1812. לפלס התעניין גם בהימורים וגם בתנועות הכוכבים, ולכן הכיר גם את עבודתו של גאוס בנושא, וגם את המשפט של דה-מואבר. לכן הבחין לפלס בקשר בין שתי העבודות, ויצר מהן משפט חדש – משפט הגבול המרכזי. עבודתו של לפלס הושלמה על ידי מתמטיקאים שבאו אחריו – פואסון, צ'ביצ'ב, מרקוב, ליאפונוב, לינדברג, פלר ולוי – כולם תרמו לניסוח ההוכחה המדוייקת של משפט זה.

על פי משפט הגבול המרכזי (בניסוח רשלני) – ההתפלגות של ממוצע תצפיות מקריות ובלתי תלויות שואפת לגבול מרכזי – וגבול זה הוא ההתפלגות הפעמונית המפורסמת. התפלגות זו ידועה בגרמניה בשם "התפלגות גאוסיאנית", בצרפת בשם "התפלגות לפלס" ובכל מקום אחר בשם "ההתפלגות הנורמלית". גרמניה הביעה את הערכתה לגאוס כאשר הדפיסה את דיוקנו על השטר של 10 מרק (שכבר אינו בשימוש). על השטר ניתן לראות את הפעמון המפורסם של העקומה הנורמלית ואת הנוסחה המתמטית המאפיינת אותה.

Gauss_banknote

המשפט הזה מקל עד מאוד את חייהם של הסטטיסטיקאים – במקרים רבים מאוד אין צורך לחשב הסתברויות מדוייקות – כיוון שעל ידי שימוש במשפט ניתן לערוך חישוב מקורב שהינו מדוייק דיו לכל צורך מעשי. שיטתו של גאוס להערכת שגיאות המדידה (שהוזכרה בראשית רשימה זו) משמשת עד היום כל חוקר במדעי הטבע והחברה – פשוט אין בנמצא שיטה טובה ממנה (על כך אכתוב ברשימה אחרת) ועקרונות המשפט המקורי שניסח דה-מואבר עומדים ביסודותיהם של כל סקרי הדגימה ומספקים פרנסה לכל מכוני הסקרי למינהם.

פורסם לראשונה באתר "רשימות" בתאריך 11 בספטמבר 2005

שלא יעבדו עליכם – רק לשטרסלר מותר

 2004 היא שנת המפנה – כותב שטרסלר ב"הארץ". אני לא רוצה להכנס לכל הטיעונים של אותו עורך בכיר לענייני כלכלה וחברה, אבל בסיכום שלו השקר זועק מייד בראש העמוד. שטרסלר מציג את הגרף הבא המראה כיצד צנחו שיעורי האבטלה בשנה שעברה – מה זה צנחו? האבטלה נעלמה. רואים את העמודה של אוקטובר 2004? כמה שהיא נמוכה. מצבנו לא היה מעולם טוב יותר.

לפי שטרסלר, 10.1% זה כמעט אפס.

את ההפניה לכתבה של שטרסלר ולתרגיל הגרפי השקוף שלו מצאתי באתר "העוקץ".

פורסם לראשונה באתר "רשימות" בתאריך 4 בינואר 2005  שם התקבלו 3 תגובות

דנה  [אתר]  בתאריך 1/4/2005 1:35:36 PM

מדהים

בתור אחת שעבדה פעם בתחום, בחיים לא הייתי מאשרת את הגרף הזה, בשל ההטעיה האדירה הזאת. כנראה שמי שערך את הכתבה הזאת לא היה מספיק מרוכז. וחבל.

רבינו  בתאריך 1/4/2005 5:42:59 PM

מדהים

מדהים שהטריק הזה תמיד עובד…

ערדי  בתאריך 1/5/2005 1:41:28 PM

נו

אתה באמת חושב ששטרסלר מצייר בעצמו את הגרפים?
(ל"הארץ" יש באופן כללי אובססיה משונה לגרפים – הכי מצחיקים הגרפים במדור הספורט כמו "שערים של קולאוטי למשחק")

כמה סטודנטים יש בכל כיתה, בממוצע?

החידה הזו הועלתה בפורום המתמטיקה של תפוז. אני מביא אותה לכאן. נשמע מה דעתכם 🙂

באוניברסיטה יש 500 תלמידים הלומדים קורס מסויים. לכן נפתחו ארבע קבוצות הרצאה לקורס זה. התברר כי ל-3 קבוצות נרשמו 100 סטודנטים לכל אחת, ולקבוצה הרביעית נרשמו 200 סטודנטים. הנהלת האוניברסיטה דיווחה כי בכל קבוצה יש בממוצע 125 סטודנטים, על פי החישוב:

eq271204a

הסטודנטים טענו כי מספר הסטודנטים הממוצע לכיתה גבוה יותר: אם נשאל כל סטודנט כמה סטודנטים יש בקבוצה שלו, 200 מהם יענו "200" ו-300 מהם יענו "100". לכן מספר הסטודנטים הממוצע הוא:

eq271204b

אז מי צודק?

פורסם לראשונה באתר "רשימות" בתאריך 27 בדצמבר 2004  שם התקבלו 3 תגובות

עומרון  בתאריך 12/27/2004 10:59:39 AM

אני כנראה ממש אהבל

אני לא מבין למה זה מעניין מה יגידו הסטודנטים ומה זו המכפלה הזו.
סופרים את כמות הסטודנטים ומחלקים בארבע.
(זה מה שלימדו אותי בבית ספר)

עומרון  בתאריך 12/27/2004 11:01:21 AM

אגב,

אם תשאל את אותו מספר סטודנטים בכל כיתה כמה תלמידים בכיתה שלהם ותחשב באותו האופן – תגיע ל-125.
נראה לי (באמת לא מבין בזה) שכשאתה שואל את הסטודנטים כולם אתה מטה את המדגם (יכול להיות?????)

בתאריך 12/27/2004 12:26:25 PM

ואם…

יהיו 10 קבוצות,
9 של סטודנט אחד ואחת של 491
אז הנהלת האוניברסיטה תרחץ כפיה בממוצע של 500/10
כלומר 50 סטודנטים לקבוצה.
אבל הרוב המוחלט של הסטודנטים יהיו תקועים בקבוצה ענקית.
המממ…

הכלכלה והסטטיסטיקה

ברכבת נפגשות שתי חבורות, ארבעה סטטיסטיקאים וארבעה כלכלנים. התברר כי כולם נוסעים לכנס בנושא אקונומטריקה. אחד הכלכלנים שם לב תוך כדי השיחה כי כל אחד מהכלכלנים מחזיק בידו כרטיס נסיעה, אבל רק לאחד מהסטטיסטיקאים יש כרטיס. הוא שאל אותם לפשר הדבר. "אל תדאג", אמרו לו הסטטיסטיקאים, "חכה ותראה". כאשר התקרב הכרטיסן אליהם, נכנסו כל ארבעת הסטטיסטיקאים לתא השירותים. הכרטיסן הגיע וניקב את כרטיסו של כל אחד מהכלכלנים. לאחר מכן ניגש אל דלת תא השירותים, דפק עליה ואמר "כרטיס בבקשה!". הסטטיסטיקאים הושיטו לו את הכרטיס דרך החריץ שמתחת לדלת.

כעבור שבוע נפגשו שוב שתי החבורות על הרכבת, בדרכן חזרה מהכנס הבייתה. ארבעת הכלכלנים קנו הפעם רק כרטיס אחד, אך להפתעתם שמו לב כי לסטטיסטיקאים אין כרטיס בכלל. כאשר התקרב הכרטיסן אליהם, נכנסו ארבעת הכלכלנים אל תא השירותים. מייד אחר כך פנו הסטטיסטיקאים אל תא השירותים השני. בדרכם, הקיש אחד מהם על דלת תא השירותים בו נמצאו הכלכלנים ואמר: "כרטיס בבקשה!".

מוסר השכל: אין להשתמש בשיטות סטטיסטיות אם לא מבינים היטב את הרעיון העומד מאחוריהן.

פורסם לראשונה באתר "רשימות" בתאריך 14 בדצמבר 2004

Technorati Tags: כלכלה,סטטיסטיקה

צריך פיס בחיים?

ב-Ynet ובידיעות פורסם היום כי יו"ר מפעל הפיס זכה במכונית בהגרלת המינויים של מפעל הפיס.
בידיעות (אך לא ב-Ynet דווח כי למפעל הפיס יש 450000 מינויים, וכי ב-5 השבועות האחרונים הוגרלו בין המינויים 180 מכוניות בכל שבוע (ובסך הכל 900 מכוניות).

1) מה הסיכוי של בעל כרטיס בודד לזכות במכונית בהגרלה אחת?
2) מה הסיכוי של בעל כרטיס בודד לזכות במכונית אחת לפחות בסדרה של 5 הגרלות?
3) ממפעל הפיס נמסר כי היו"ר מחזיק (ומשלם מכיסו) עבור 4 כרטיסי מנוי. מה סיכוייו של אדם המחזיק ב-4 כרטיסי מנוי לזכות במכונית אחת לפחות בסדרה של 5 הגרלות?
4) בפעם הבאה שיהיה מבצע הגרלות כזה (180 מכוניות בשבוע, במשך 5 שבועות), כמה כרטיסי מנוי צריך להחזיק כדי שהסיכוי לזכות במכונית יהיה גדול מ-50%? וגדול מ-p כלשהו נתון?
5) האם לדעתכם הסגנון התוקפני של הכתבה מוצדק לאור הנתונים הנ"ל?

התשובות כאן.

פורסם לראשונה באתר "רשימות" בתאריך 18 באוקטובר 2004  שם התקבלו 7 תגובות

פקקת   בתאריך 10/18/2004 11:06:57 AM

היה צריך להגריל בין האנשים תאונות דרכים, כדי לדלל קצת את המכוניות ולא להוסיף עליהן חדשות. בעצם זה מה שקורה פה כל יום. כל יום פה מצד אחד מגרילים כמה מכוניות של מפעל הפיס, ומצד שני מגרילים כמה תאונות, שישמר איזון המכוניות בטבע הפקקים.

מרק ק.  בתאריך 10/18/2004 1:56:28 PM

6. כמה כרטיסי מנוי יש לבכירים במפל הפיס?
7. בהתחשב ב6 מה הסיכוי שגם בשנה הבאה ידיעות יפרסמו אותה כתבה?
8. בהתחשב בחוסר היכולת של עיתונאים וסתם אנשים (לפי התגובות בYNET למרות ששם היו חסרים מספר נתונים מאוד משמעותיים) לבצע סטטיסטיקה פשוטה האם הגיע הזמן להנהיג בחינת בגרות חובה בסטטיסטיקה?

ותשובה ל5- ידיעות כבר זמן מה עסוק במסע ציבורי שמטרתו לשכנע את הציבור שהוא דפוק ומסכן והכל רע. מענין אם זה קשור לעובדה שסטיב כבר לא ממש מועמד לראשות הליכוד וזו דרך טובה להפחית את הסיכויים של נתניהו.

דרור  בתאריך 10/18/2004 2:31:44 PM

(180*4*5)/450,000=0.8% סיכוי למנכ"ל
סיכוי של 50% לזכות במכונית תקבל אם תרכוש 250 כרטיסי הגרלה. (עדיף לקנות אוטו, כמובן)
(180*5*X)/450,000=50%
X=250
סגנון תוקפני של כתבות באתר ההוא תמיד מוצדק. בדיוק כמו שרכילות במעריב זה תמיד נכון. זה הסגנון שלהם ולצערינו זה מה שה"עם" אוכל. משיחות מאחורי מכונת הקפה בעבודה הבנתי שאנשים באמת בולעים את הפיתיון ועושים מכל שטות שמפורסמת סנסציה במקרה הטוב וקונספירציה במקרה הפחות טוב.

זו ש  [אתר]  בתאריך 10/18/2004 9:40:30 PM

היות שלכל הגרלה בתחומים אחרים מוצמד תמיד משפט ההבהרה "ההשתתפות בהגרלה אסורה על עובדי איקס ובני משפחותיהם", ככה, בשביל שנקיון הכפיים ייראה, חשבתי שזה משהו בחוק. מסתבר שלא.

אבל מי צריך נקיון כפיים במפעל הפיס? הרי לרגע לא חשדנו בהם שהם כאלה.
ואכן, משכורתו של היו"ר ללא ספק אינה מספיקה לגמור את החודש, אני לא מתפלאת שהוא נאלץ להשלים הכנסה בהגרלות, כאחרון העניים.

האם החסידה מביאה ילדים לעולם?

האם החסידה מביאה ילדים לעולם? ניתן לאסוף שפע של נתונים שיתמכו בתיאוריה המעניינת הזו, אבל אני סבור כי שום מתאם בין תנועת החסידות מעל לעיר ובין שיעורי הלידה לא ישכנעו איש מכם כי אכן כך הדבר.

האם יש קשר בין מספר הנעליים ורמת הידע במתמטיקה? לכו לבית הספר הקרוב ותיווכחו בעצמכם. לילדים בכיתות הגבוהות בודאי יש ידע נרחב יותר במתמטיקה, והם גם גדולים יותר פיזית, ולכן מספרי הנעליים שלהם גבוהים יותר.

האם ככל שנשלחות יותר מכוניות כיבוי כדי לכבות שריפה, כך גדול יותר הנזק שנגרם בשריפה? כן, בודאי. האם עלינו להסיק מכך שניתן לבטל את שירותי הכבאות? לא ולא. שריפות גדולות מצריכות כח כיבוי גדול יותר, וכמובן גורמות נזקים גדולים יותר.

האם בבתי חולים גדולים ומשוכללים שיעורי התמותה גבוהים יותר מבתי חולים קטנים ופחות מצויידים? לפעמים זה אכן כך. אולם לכל חולה אמליץ תמיד לבחור בבית החולים הגדול והמשוכלל. אכן, לבתי חולים כאלה מגיעים חולים יותר קשים, ולכן גם שיעורי ההצלחה שלהם יותר נמוכים לפעמים.

טוענים כי קיים קשר בין תוצאות המשחקים של קבוצת הבייסבול ניו-יורק יאנקיס, ובין ביצועי מדד הבורסה של ניו-יורק. כאשר היאנקיס מנצחים, הבורסה עולה, ולהיפך. האם כדאי לבסס את אסטרטגיית הכספים שלך על הביצועים של היאנקיס במגרש? אפשר לטעון כי כאשר הקבוצה המקומית מנצחת, משקיעי ניו-יורק שמחים ואופטימיים יותר, והדבר מתבטא במסחר. תיאוריה נחמדה, אבל המשחקים נערכים בשעות אחר הצהריים והערב , בעוד שהמסחר בבורסה מתקיים בבוקר. מאידך ייתכן כי כאשר שערי הבורסה עולים, השחקנים יותר שמחים ומשחקים במרץ רב יותר. וייתכן גם כי המתאם הנצפה הוא מקרי בלבד.

דוגמא קיצונית סיפק לנו הסטטיסטיקאי רונלד פישר, שהיה מעשן כבד. באמצע שנות החמישים של המאה העשרים, התגלו המתאמים הראשונים בין העישון ובין הסיכוי לחלות בסרטן הריאות. תלמידיו של פישר פנו אליו, וביקשו ממנו שינסה לעשן פחות למען בריאותו. הם נימקו את בקשתם במתאם הסטטיסטי שזה עתה התגלה. פישר דחה אותם, בנימוק שהמתאם עצמו אינו מראה סיבה ותוצאה. ייתכן, אמר פישר, כי מחלת הסרטן גורמת בשלב הראשון של המחלה לצורך בניקוטין, המתבטא בכך שהחולה מעשן, ורק אחר כך מתפתחים הגידולים. פישר נפטר בשנת 1962. רק בשנות השבעים של המאה העשרים הוכיחו המדענים כי צריכה מוגברת של ניקוטין אכן גורמת לעליית הסיכון לחלות בסרטן הריאות.

יש אנשים שיאמרו כי פישר נהג בטיפשות, אולם מבחינה סטטיסטית, פישר צדק לחלוטין. המתאם הסטטיסטי מראה קשר בלבד, ולא סיבה ותוצאה. הסטטיסטיקה יכולה לספק עדויות לתופעות, אך לא לספק פירוש לתופעה הנצפית. את הפירוש חייבים לספק המומחים, בעזרת כלים מתחום מומחיותם. בדוגמא של העישון והסרטן, הוכח הקשר הסיבתי (עישון גורם סרטן, ולא סרטן ורם עישון) בניסויים בתנאי מעבדה.

האם יש קשר בין היד הדומיננטית ובין הכשרון למתמטיקה? ייתכן, איני יודע. יש הטוענים כי קיים מתאם סטטיסטי בין התופעות, וראיתי פה ושם קטעי עיתונות המצטטים מארים בהם "הוכיחו" כי אטרי יד ימינם מגלים כישורים מתמטיים מיוחדים. אולם, מי שטוען טענה כזו, צריך להביא נימוקים משכנעים, מתחום הפסיכולוגיה ו/או נוירולוגיה. הקשר הסטטיסטי הוא רק עדות לתופעה, אך לא מספק שום מידע על הסיבות לתופעה הנצפית.

כיום כאשר עומדים לרשותנו מאגרי נתונים עצומים, ומחשבים רבי עוצמה. קל מאוד לתת למחשב לעבוד ולחפש מתאמים. זה יותר קל מלחפש מטבע תחת הפנס. אולם יש תמיד לזכור כי גם אם צופים במתאם בין שני משתנים, אין הדבר אומר כי קיים קשר ישיר בינם.

לא אפרט כאן כיצד מחושב מקדם המתאם הסטטיסטי. אומר רק שזהו אכן כלי רב עוצמה, אבל גם בעל מגבלות שיש להכיר ולהיזהר מפניהן. שימוש לא נכון במתאם הסטטיסטי עלול להוביל למסקנות מגוחכות, במקרה הטוב, ואף למסקנות מסוכנות, במקרה הגרוע.

 

 פורסם לראשונה ב 27 ביוני 2004 באתר רשימות, שם התקבלו 4 תגובות

 

אביבה  [אתר]  בתאריך 7/12/2004 11:13:01 PM

ברוך הבא ובהצלחה.

יובל  בתאריך 7/15/2004 2:20:46 PM

אכן, מתאם אינו בהכרח קשור לקשר בין סיבה ותוצאה.
למרות זאת, יש חוקרים המנסים להסיק קשרים
סיבתיים באופן מבוסס בשיטות הסתברותיות.
אחד מהם הוא יהודה פרל, מדען מחשב ותיק ומוכשר:
http://bayes.cs.ucla.edu/jp_home.html

יוסי ל  בתאריך 7/15/2004 3:48:31 PM

מעניין.
תודה על הלינק.

תראזימאכוס   בתאריך 7/20/2004 4:55:43 PM

תודה ובהצלחה