כמה מצלמות אבטחה יש בבריטניה?
הנושא ישן (כפי שהתברר לי). הגעתי אליו משני כיוונים שונים. במגזין כלכליסט מהשבוע שעבר הובא ראיון עם נביא זעם בשם ג'ון קמפנר, שדן ב-"עיסקה הפופולרית בעולם", לדבריו, "במסגרתה אנחנו מוכרים את כל החירויות שלנו רק כדי לשמור על החופש להרוויח". דבריו של קמפנר אכן מעוררים מחשבה, וראויים לדיון נפרד, אבל אני רוצה להטפל רק לדוגמא אחת שהובאה בכתבה (כנראה על ידי הכתב אורי פסןבסקי, ולא על ידי קמפנר עצמו). בבריטניה, נטען, יש כ-5 מליון מצלמות אבטחה, מצלמה אחת לכל 12 תושבים. האח הגדול כבר כאן.
הידיעה הזו אינה חדשה. כבר ביולי 2008 דיווח יוסי גורביץ בכלכליסט כי "4.2 מיליון מצלמות במעגל סגור מותקנות בבריטניה, מצלמה על כל 14 תושבים". עברו שנתיים, נוספו עוד 800,000 מצלמות. נשמע הגיוני.
לנושא הזה הגעתי גם מכיוון אחר לגמרי. בכנס בואנקובר בו הייתי בשבוע שעבר חילקה הוצאת וויילי חוברות ישנות של המגזין Significance , שמוציאה לאור האגודה המלכותית לסטטיסטיקה (החל מהחודש, בשיתוף עם האיגוד האמריקני לסטטיסטיקה, וכך נעשיתי למנוי על המגזין). בחוברת של דצמבר 2009 הובאה כתבתה של אליס טרלטון מערוץ 4 של ה-BBC, שכותרתה: "כמה מצלמות אבטחה?". הכתבה זכתה בפרס למצויינות סטטיסטית בעיתונות המוענק על ידי האגודה המלכותית לסטטיסטיקה. הלינק האחרון מוביל לכתבה באתר של ערוץ 4. אני אתאר מייד את עיקר הממצאים.
ובכן, איך הגיעו למספר של 4.2 מליון מצלמות אבטחה?
הכל התחיל במאמר שפרסמו ביוני 2002 שני חוקרים (קישור לקובץ pdf), מייקל מקהייל מאוניברסיטת האל וקלייב נוריס מאוניברסיטת שפילד. כל מה שצריך זה לקרוא את המאמר, וזה בדיוק מה שעשתה טרלטון. החוקרים סקרו שני רחובות מרכזיים בלונדון: Putney High Street (פוטני) ו-Upper Richmond Road (ריצמונד). הם דגמו 211 בתי עסק בשני הרחובות, ומצאו כי ב-41% מהם מותקנות מצלמות אבטחה, ובממוצע יש בכל מערכת 4.1 מצלמות. בלונדון יש כרבע מליון בתי עסק. הכפלה של 3 מספרים נתנה תוצאה של כ-422 אלף מצלמות. למספר זה הוסיפו החוקרים את הערכתם למספר המצלמות הנמצאות באזורים ציבוריים : רחובות, תחבורה ציבורית, בתי חולים וכו'. הם העריכו את מספרן של מצלמות אלה (והשתמשו בפירוש במילה "guesstimate" – שילוב של אמדן וניחוש) בכ-80 אלף, וכך הגיעו למספר כולל של כחצי מליון מצלמות בלונדון. ומכיוון שבלונדון יש כ-7 מליון תושבים, המסקנה היא שיש בלונדון מצלמת אבטחה אחת לכל 14 תושבים. ואם זה בלונדון, זה גם בכל בריטניה, לא?
אז זהו, שלא.
קודם כל, יש לשים לב לשונות בין שני הרחובות שנסקרו. ברחוב פוטני נמצאו מצלמות ב-49% מבתי העסק, בריצמונד ב-34% בלבד. ייתכן כי רחוב ריצמונד הוא המייצג את המצב בלונדון, ואז נופלת הערכת מספר המצלמות בלונדון ב-30%, ל-350 אלף מצלמות בלבד. מצד שני, ייתכן כי דווקא רחוב פוטני הוא המייצג, ואז ההערכה של מצלמה ל-14 תושבים היא הערכת חסר. מה שיותר סביר הוא ששני הרחובות האלה גם יחד אינם מהווים מדגם מייצג מספיק. קל לברר, וטרלטון עשתה זאת, כי תמהיל העסקים בשני הרחובות האלה שונה מהותית מתמהיל העסקים הכללי בלונדון. ה"מדגם" לא ממש מייצג. מה ששני החוקרים קיבלו הוא לכל היותר הערכה של מספר המצלמות בשני הרחובות שסקרו (בהנחה שמדגם בתי העסק שלקחו ברחובות האלה היה מייצג). האקסטרפולציה שעשו משם אל לונדון, ואח"כ אל כל הממלכה המאוחדת, לא ממש ולידית.
טרלטון מצאה דרך אחרת להעריך את מספר מצלמות האבטחה בבריטניה. היא פנתה אל קבוצת משתמשי מצלמות האבטחה בבריטניה. הם הודו שהם לא יודעים את המספר המדויק, אך העריכו (שוב guesstimate) כי מספרן הוא לא יותר ממליון ורבע בכל בריטניה.
נשלח: 10 באוגוסט, 2010. נושאים: הממ... מעניין..., מה אומרת הסטטיסטיקה.
תגובות: 3
| טראקבק
ואנקובר – סיכום הכנס
הכנס נגמר היום (כאן עדיין יום חמישי), ורגע לפני הטיסה חזרה לארץ, הנה סיכום של הצד המקצועי של הכנס.
יום ראשון
היום הזה היה אמור להיות מוקדש כולו לקורס בכריית נתונים (data mining). הקורס היה מאכזב מאוד. שלושת המרצים עברו על השקפים שהכינו במהירות הבזק, אבל גרוע מכך – לא ממש תרמו לידע שלי. הם הקדישו זמן רב להסברים מדוע הנושא חשוב (אני יודע שזה חשוב, אחרת לא הייתי נרשם לקורס הזה), הרבה באזוורדס עפו באוויר, והוקדש המון המון זמן לרגרסיה לוגיסטית. רגרסיה לוגיסטית! זה קורס לסטטיסטיקאים מקצועיים, כמעט כולם בעלי תואר שני לפחות, אם לא שלישי. ציפיתי למשהו יותר מתוחכם. רגרסיה לוגיסטית אני יודע מהבית. לפני היציאה להפסקת צהריים הודיע המרצה הראשי כי סקירת החומר של הקורס הסתיימה, ושאר זמן הקורס (אחרי ההפסקה) יוקדש להדגמה של תוכנות שונות, "בעיקר SAS". ויתרתי על ההמשך. הייתי צריך לדרוש את כספי בחזרה.
מעז יצא מתוק. אחרי הצהריים הלכתי לשמוע מושב הרצאות בנושא אמידת משך חיי המדף (כלומר תאריכי התפוגה) של תרופות, תחום שאני עוסק בו רבות. המושב התחיל בסקירה של השיטה הנוכחית לקביעת תאריך התפוגה המוכתבת על הרשויות הרגולטריות, והבעייתיות שבשיטה זו. הבעיה העיקרית היא שהשיטה הנוכחית נותנת אמדן חסר של משך חיי המדף, ובמלים אחרות – חלק גדול מהתרופות עדיין טובות לשימוש זמן רב (בחלק מהמקרים שנים רבות) אחרי שעבר תאריך התפוגה הרשמי שלהם. זה אולי טוב לרשויות, אבל רע לכל השאר: לחברות התרופות, לצרכנים באופן ישיר, ולמי שמממן את העלויות של השלכת תרופות טובות לפח: חברות ביטוח, קופות חולים, ממשלות – וחלק נכבד מהעלויות האלה שוב מתגלגלות לצרכנים. בהמשך הוצגו דרכים בהם מנסים להתמודד עם הבעיה (שיחות בין חברות התרופות לרגולטורים), ושיטות סטטיסטיות חדשניות להערכת תאריכי התפוגה.
משם המשכתי למושב שעסק בתכנון ניסויים קליניים שלב I, המיועדים לזיהוי המינון המקסימלי האפשרי של תרופה חדשה (מה שנקרא בז'רגון MTD, ראשי תיבות של Maximal Tolerated Dose). היה מעניין למדי, זה תחום שאני לא ממש עוסק בו ולכן גם לא מתמצא.
יום שני
את היום הזה התחלתי בהרצאת סקירה שנשאה את הכותרת היומרנית "כיוונים עתידיים בניתוח נתוני גנום". ההרצאה הייתה מאכזבת. שני מרצים עם מבטאים נוראיים (אוסטרלי וסיני), שנתנו מצד אחד סקירה בסיסית ביותר של מבנה הגנום והדנ"א, התעכבו רבות על פרטים טכניים הקשורים לטכניקות של sequencing, ולא ממש פירטו מהם הכיוונים העתידיים. אה. הם אמרו שהמטרה היא לזהות גנים הקשורים למחלות.
המושב השני של אותו יום היה מושב לזכרו של הסטטיסטיקאי ג'ק גוּד (Good), שנפטר לפני מספר חודשים בגיל 91. שמעתי את שמו פעם, אולם לא הכרתי את עבודתו. הלכתי לשם בעיקר בגלל שאחד הדוברים היה סטיב פיינברג, שאת ספריו על ניתוח נתונים קטגוריים קראתי בשקיקה בצעירותי. מהר מאוד הבנתי למה לא הכרתי את פועלו של גוּד. הוא היה סטטיסטיקאי בייסיאני, ולא סתם סטטיסטיקאי בייסיאני, אלא אחד המייסדים של האסכולה, ולדידו אין סטטיסטיקה אחרת מלבד הבייסיאנית. שלושה מהמרצים היו חברים של גוּד (גוּד היה גם מדריך הדוקטורט של אחד מהם), והם סיפרו אודות עבודתו וחייו. הופתעתי, למשל, לגלות כי גוּד היה עבד בצוותא עם אלן טיורינג ביחידת פענוח הצפנים בבלצ'לי פארק במהלך מלחמת העולם השניה. ההרצאות היו מרתקות. אני בהחלט מתכוון לנסות להכיר עוד את האיש ופועלו, ואולי גם לקרוא את אחד מספריו.
אחר הצהריים הייתי במושב שעסק בתכנון וניתוח של ניסויי bioassay. ההרצאות היו טכניות מאוד, אבל בהחלט לא משעממות (זהו עוד תחום שאני עוסק בו, אז אני קצת משוחד).
יום שלישי
כל היום הזה הוקדש לקורס על שיטות לניתוח ניסויי Genome-Wide Association, הידועים בשמם המקוצר GWAS. הקורס היה מצויין. ההסברים על הרקע הביולוגי היו בהירים ולא-טכניים. המרצים הסבירו היטב את כל השיטות הסטטיסטיות הבסיסיות (שאני מכיר חלקית), ודנו בהרחבה במגוון שיטות לניתוח נתונים קטגוריים (שהן הלחם והחמאה של הקורס). גירדתי את החלודה מהידע שלי בתחום והופתעתי לגלות שאני עדיין זוכר לא רע את העקרונות (הדוקטורט שלי עסק בניתוח נתונים קטגוריים, ופעם שלטתי היטב ברזי המודלים הלוג-לינאריים). התחום גם התפתח מאז שסיימתי את הדוקטורט (לפני כמעט 15 שנה), ושמחתי לראות חלק מההתפתחויות בתחום – כולל גישות בייסיאניות. אני לא מגדיר את עצמי כסטטיסטיקאי בייסיאני, אבל בהחלט מוכן לנסות את השיטות האלה, מה גם שהמרצה שהציג את השיטת האלה נתן הצדקות טובות לשימוש בהן.
יום רביעי
המושב הראשון בו הייתי היה מושב לזכרו של אריק להמן, שנפטר לפני 11 חדשים, בגיל 92. אלמנתו של להמן, ג'ולי שפר, סטטיסטיקאית בזכות עצמה, סקרה את תרומותיו של בעלה לתחום ההשוואות המרובות, והראתה כיצד עבודותיו משנות החמישים של המאה הקודמת, שנדחקו מאוחר יותר לשוליים עם התקדמות המחקר בתחום, חזרו ונעשו רלוונטיות בשנים האחרונות לאור התקדמויות נוספות במחקר (בייחוד עלייתה של שיטת ה-FDR). פיטר ביקל, תלמידו של להמן ואחר כך עמיתו באוניברסיטת ברקלי, סקר את עבודתו לאורך השנים. את המושב נעל פרסי דיאקוניס, בהרצאה נפלאה על חשיבותו של המחקר בתיאוריה הסטטיסטית.
בחלק השני של הבוקר נכחתי במושב טכני אך חשוב שעסק בשיטת לניטור ניסויים קליניים.
את אחר הצהריים ביליתי באופן לא צפוי לחלוטין: הלכתי למושב שעסק בשיטות בייסיאניות לפיתוח פרמצבטי ומחקרים קליניים. ללא ספק, המושב לזכרו של גוּד והשיטות הבייסיאניות לניתוח נתונים קטגוריים אליהן נחשפתי ביום שלישי השפיעו עלי. היה מעניין.
יום חמישי
היום האחרון של הכנס – בו היו שני מושבים בלבד (הכנס ננעל בצהריים). המושב בראשון עסק בעוד תחום בו אני עוסק רבות – חישוב והערכה מחדש של גדלי מדגם (כתבתי על כך לפני כשנה). המושב השני של הבוקר עסק ב-GWAS, ובו הוצגו כמה מחקרים חדשים בתחום.
נשלח: 6 באוגוסט, 2010. נושאים: האנשים שמאחורי הסטטיסטיקה, מה אומרת הסטטיסטיקה.
תגובות: 5
| טראקבק
דש מואנקובר
למי שלא יודע, השבוע אני נמצא בואנקובר, קנדה, לרגל ה-Joint Statistical Meetings, הכנס המשותף לשישה ארגוני סטטיסטיקאים הנערך מדי שנה בשבוע הראשון של חודש אוגוסט, באחת מערי צפון אמריקה. חזרתי לכנס הזה אחרי 10 שנים שלא השתתפתי בו (כי העדפתי להגיע לכנסים קטנים יותר), ובסך הכל מדובר בחוויה.
על האספקטים המקצועיים של הכנס אכתוב ברשימה אחרת. יותר דחוף לי לשתף את ששת הקוראים שלי בחוויות מואנקובר. זו עיר גדולה למדי, בסדר גודל של תל אביב או של בוסטון (כ-2.5 תושבים במטרופולין), ומאוד מאוד נעימה. העיר שוכנת על כמה איים בתוך מפרץ, ומזג האוויר מאוד נעים בזכות הבריזה שנושבת כאן כל הזמן. הנוף יפהפה. הכנס נערך במרכז הכנסים שנמצא על חוף הים ממש, ובהפסקות אני פשוט נהנה לצאת מהבניין, להשען על המעקה ולהשקיף על המפרץ, הספינות והסירות ששטות בו, מטוסי הים הממריאים ונוחתים, וכמובן, ההרים הירוקים שמצידו השני של המפרץ.
המלון שלי שוכן בדאון טאון, מרחק חמש דקות הליכה ממרכז הכנסים (אין לי נוף לפרץ, התקציב לא מאפשר). מה שמדהים בדאון טאון של ואנקובר הוא שהוא לא עמוס. המדרכות רחבות, אנשים הולכים ברחובות, אבל לא צפוף. מספר המכוניות ברחובות קטן מאוד. ביומיים הראשונים (הגעתי לכאן בשבת בבוקר) חשבתי שזה בגלל סוף השבוע, אבל יום שני הגיע, וגם יום שלישי עבר, ותנועת המכוניות עדיין דלילה מאוד. מדהים מה שמערכת תחבורה ציבורית מעולה וחניה במחיר שערורייתי של 6 דולר לשעה יכולים לעשות.
מה עוד – העיר ירוקה מאוד – המון עצים וערוגות פרחים בכל מקום. נקיה להפליא, ויש המון דגש על מחזור – בכל מקום יש פחים מיוחדים לאיסוף נייר, פלסטיק, פחיות, זבל אורגני וזבל "אחר". גם בחדר המלון יש פח מיוחד למחזור.
כתבתי על יעילות התחבורה הציבורית. הנה הרחבה. בשבת, אחרי שהתארגנתי במלון, התקלחתי, והתאוששתי מ-18 שעות הטיסה, יצאתי אל Grouse Mountain, שמורת טבע הנמצאת כ-15 ק"מ מחוץ לעיר. התכוונתי להסתמך על התחבורה הציבורית, כמובן. מדריך התיירים ששאלתי מספריית רעננה טען שזה אפשרי. מסתבר שזה אכן אפשרי, מאוד פשוט, ומאוד יעיל. חציתי את המפרץ במעבורת הנקראת Seabus שיצאה מה-Waterfront, ממש ליד מרכז הכנסים. כל חמש דקות יוצאת מעבורת. בצד השני של המפרץ, ממש ביציאה ממזח המעבורת, ממוקמת תחנת אוטובוסים, משם יוצא כל 20 דקות אוטובוס שמביא אותך ממש לכניסה לשמורה. כל הדרך ארכה משהו כמו 40 דקות. פנטסטי. עלות התחבורה הציבורית, אגב, 9 דולר בסך הכל, עלות כרטיס יומי שתקף לכל אמצעי התחבורה הציבורית במטרופולין של ואנקובר. לשם השוואה, נסו לחשוב איך תגיעו אל, נניח, שמורת נחל אלכסנדר בתחבורה הציבורית.
Grouse Montain, דרך אגב, הוא הר בגובה כ-1300 מטר, אליו מעפילים ברכבל שהנסיעה בו היא חוויה בפני עצמה. בראש ההר יש נוף משגע, עצים, בעלי חיים, מופע lumberjack, דובי גריזלי, מרכז מבקרים בו מוקרנים סרטים על המקום, ופעילות אתגרית שלא מיועדת לאנשים כמוני. אם תגיעו לכאן אי פעם, אל תעזו להחמיץ.
זהו, עד כאן סיכום ממש לא מסודר של חוויות מארבעת הימים הראשונים כאן. יש לי עוד יומיים של כנס, וביום שישי בבוקר אצא בדרכי חזרה הבייתה. אני מקווה לכתוב מכאן עוד רשימה על הפן המקצועי של הכנס, ואולי גם להעלות כמה תמונות שצילמתי.
נשלח: 4 באוגוסט, 2010. נושאים: בנימה אישית.
תגובות: 7
| טראקבק
מקבץ 3
במקבץ השבוע גם כמה קישורים מהשבוע הקודם שנדחו בגלל פול התמנון.
- ב-7 ביולי צוין יום השנה ה-104 להולדתו של הסטטיסטיקאי וחוקר תורת ההסתברות ויליאם פלר. צייצתי את המאורע בתוספת הערה כי "מי שלא ציטט את ספרו של פלר בעבודת המאסטר או הדוקטורט שלו, לא באמת עשה תואר בסטטיסטיקה". טוב, אולי קצת הגזמתי, אבל הספר אכן מצוטט בעבודת המוסמך שלי.
- כאשר ערכתי את רשימת 15 הסטטיסטיקאים הגדולים כללתי בה 5 סטטיסטיקאים חיים. אחד מהם הלך לעולמו ב-8 ביולי, בגיל 91. דויד בלקוול, בנו של פועל רכבת מדרום אילינוי, אשר לימד את עצמו לקרוא, הפך לאחד הסטטיסטיקאים המשפיעים ביותר במאה העשרים. בלקוול חקר גם את תורת המשחקים, וכתב ספר לימוד פופולרי בתחום. ויליאם בריגס כותב גם הוא בבלוג שלו על בלקוול, ומתאר שם את פתרונו של בלקוול לבעית ההימורים הידועה כ-"פרדוקס סנט-פטרסבורג".
- נניח שאתם מתכנתים קוד מחשב. ודאי שיש בו באגים. איך תדעו כמה באגים יש בו? ג'ון ד. קוק מסביר בבלוג שלו איך לעשות את זה: אפשר לבקש ממישהו לבדוק את הקוד. נניח שימצא 20 באגים. זה אומר שיש בקוד לפחות 20 באגים, אבל לא מקדם אתכם הרבה. הפתרון – לתת לעוד מישהו לבדוק את הקוד. סביר להניח שימצא חלק מהבאגים שמצא הבודק הראשון, ואולי גם יעלה על באגים אחרים. עכשיו, בעזרת קצת סטטיסטיקה, תוכלו לאמוד את מספר הבאגים שנמצאים ועדיין לא התגלו.
- בהמשך לפול התמנון: האם העובדה כי מישהי זכתה ארבע פעמים בלוטו "סותרת את כל הסטטיסטיקות"? ממש לא.
- חובבי הבייסבול יודעים כי קבוצת פיטסבורג פיראטס היא אחת הקבוצות החלשות ביותר בליגת הביססבול האמריקנית (MLB). ובכל זאת, הליגה מציעה לאוהדים לרכוש אופציה לרכישת כרטיס למשחק השביעי של הפיראטים בסדרת הגמר (ה"וורלד סירייס"), אם יהיה משחק כזה, כמובן. האם כדאי לקנות את האופציה? ואם כן, האם המחיר המוצע "משתלם"? בלוג הבייסבול FanGraphs מציג שילוב של ניתוח סטטיסטי וכלכלי, עם הסבר נאה למושג התוחלת ומשמעות האופציה.
נשלח: 18 ביולי, 2010. נושאים: האנשים שמאחורי הסטטיסטיקה, הממ... מעניין....
תגובות: 1
| טראקבק
מקבץ (2) – מוקדש לפול התמנון
מקבץ השבוע מוקדש לפול התמנון.
מי שלא יודע, פול התמנון חי לו בגן חיות אי שם במזרחה של גרמניה, ובמקביל לעיסוקים השגרתיים של גן החיות פיתח לו קריירה של אוראקל החוזה את תוצאות משחקיה של נבחרת גרמניה במונדיאל. לפני שעה קלה השלים פול מונדיאל מוצלח יחסית, בו ניבא ללא טעות את תוצאות כל שבעת המשחקים של נבחרת גרמניה. מוצלח "יחסית", כתבתי, כיוון שעתידו עדיין לוט בערפל, לאור הניבוי של הפסד גרמניה לספרד בחצי הגמר.
עוד לפני המשחק הגורלי (לעתידו של פול) מול ספרד ביקש ממני במייל גדי איידלהייט להתייחס לנושא בבלוג. הסתפקתי בטוויט, בו כתבתי כי יש סיכוי די גבוה שמתישהו איפהשהו תמנון או חיה אחרת תצליח לנחש סדרה של תוצאות משחקים. על הגירפה שלא הצליחה לנחש אף תוצאה, לעומת זאת, אף אחד לא מדווח. וזה בסך הכל תמצות של 140 תווים לרשימה שכתבתי בעקבות האירוע "יוצא הדופן" שאירע בלוטו הבולגרי.
הנה עוד כמה התייחסויות של פול השבוע ברשת:
דויד שפיגלהלטר מהבלוג understanding uncertainty נטען טיעון דומה לשלי, לפיו יש כאן הטיית פרסום, ומשום מה כל היצורים הימיים החוזים כי צפון קוריאה תזכה בגביע סובלים מהתעלמות התקשורת.
וילאים בריגס מדווח על מני, התוכי מסינגפור, שחזה נכונה את כל ארבע הנבחרות שהגיעו לחצי הגמר. אבל גם בריגס קובל על התעלמות התקשורת מבני הבולדוג וסמי הסנאי שהתחזיות שלהם היו קצת פחות מוצלחות. בריגס גם חישב ומצא כי אם יש 200 חיות המנסות לנחש תוצאות של שבעה משחקים, וכל אחת מהן מנחשת את התוצאה הנכונה של כל משחק בהסתברות של 50%, הרי יש הסתברות של 93% כי אחת מהן תצליח לנחש שבע תוצאות נכונות.
ולסיום, הנה עוד מתחרים לפול התמנון: שני מתמטיקאים מאוניברסיטת לונדון פיתחו מודל המשתמש בתורת הגרפים כדי לחזות את נצחונה של ספרד על הולנד בגמר, מחר. כיוון שלפני שבוע דיווחתי כאן על מתמטיקאי סקוטי שחוזה את נצחונה של הולנד, אני מעז להעלות כאן תחזית שבודאי תתגשם: מישהו מהחוזים האלה יטעה.
נשלח: 11 ביולי, 2010. נושאים: הממ... מעניין..., מה אומרת הסטטיסטיקה, ספורט.
תגובות: 5
| טראקבק
מקבץ
מי שעוקב אחרי הבלוג הזה בטח כבר שם לב שלאחרונה אין לי כח לכתוב פוסטים מושקעים, עקב עייפות החומר והרוח. זה לא אומר שהבלוג הולך למות, ואני בהחלט מקווה לחזור ולכתוב בהרחבה על נושאים שברומו של הבלוג.
זה לא אומר שנעלמתי לחלוטין. מי שעוקב אחרי בטוויטר רואה את הגיגיי ולינקים שונים שאני מפרסם. מאחר ואני יודע כי כאן בבלוג יש יותר קוראים מאשר עוקבים בטוויטר, הנה מקבץ לינקים שפרסמתי בזמן האחרון, שעוסקים בעיקר בשלושה נושאים: סטטיסטיקה, כדורגל (לכבוד המונדיאל), וסטטיסטיקה וכדורגל.
נתחיל בסטטיסטיקה.
- בעיר סן-דייגו בקליפורניה ניתן לאסוף חתימות של 15% מבעלי זכות הבחירה ובכך לכפות העלאת נושא להצבעה במעין "משאל עם" עירוני. הצעה שעוסקת בהפרטת שירותים עירוניים זכתה לתמיכה של כ-135000 חתימות, כ-40000 יותר מהדרוש. האם הנושא יועלה להצבעה? לא. בדיקה מדגמית ל כ-4000 מהחתימות גילתה כ-30 חתימות כפולות. המסקנה המפתיעה את מי שלא מבין סטטיסטיקה: נאספו למעשה רק כ-74000 חתימות כשרות ההצעה נפלה.
- ג'ף סלואן, עורך במגזין compositesworld כותב "המלצה נדירה על ספר שיצא לאחרונה אודות אירועים נדירים שבקושי עונים על ציפיותינו" (באנגלית זה הרבה יותר טוב). הספר המדובר הוא "הברבור השחור" מאת נסים טאלב. אני קורא כרגע את הספר, ומתלהב פחות. מקוווה לכתוב על התרשמותי.
- מי רוצה להיות ביוסטטיסטיקאי? מאמר במגזין של האיגוד האמריקני לסטטיסטיקה.
- אנדרו גלמן מאוניברסיטת קולומביה סוקר כמה מהמאמרים הקלאסיים של הסטטיסטיקה.
- עוד מאמר על אשליית זיכויי הזכיה בלוטו, הפעם בוואנקובר סאן.
- מאמר על חייו ופועלו של ואלודי וייבול, האיש שהתפלגות וויבול קרויה על שמו, במלאות 123 להולדתו, וזאת באתר המוקדש להתפלגות וייבול ויישומיה.
- והנה מאמר על חייו ופועלו של סיר פרנסיס גאלטון, שהיה, בין היתר, אחד מחלוצי הסטטיסטיקה המודרנית.
- בנמל התעופה של וושינגטון הדלתות האוטומטיות נסגרות ומכות שוב ושוב במזוודות של הנוסעים. הנזק המצטבר על הדלתות הוא בצורת הפעמון המפורסם של ההתפלגות הנורמלית.
ונעבור לכדורגל.
- מתי שתי הקבוצות המשחקות רוצות להבקיע שער עצמי? הסיפור מתואר בבלוג הכלכלי "marginal revolution", ולמאותגרי אנגלית הוא מתורגם לעברית בבלוג של שמוליק.
- 10 השערים המוזרים ביותר. מעניין לראות את הבדלי התרבויות בין הולנד (איפופה, לצורך העניין) וברזיל (או דרום אמריקה). בשער השני ברשימה, שחקן הולנדי מבקיע שער בטעות (הוא התכוון לבעוט את הכדור החוצה כדי לאפשר טיפול בשחקן פצוע של הקבוצה היריבה, אך הכדור נחת ברשת). כשהמשחק מתחדש, הקבוצה שהבקיעה נותנת ליריבה להבקיע שער משלה כדי להחזיר את המצב לקדמותו. בשער מספר שלוש, לעומת זאת, במשחק שנערך בברזיל, כדור שנבעט לשער יוצא החוצה, אך מישהו שעומד ליד השער לוקח את הכדור ומשליך אותו לתוך הרשת. השופט פספס את כל המהלך וראה רק כדור ברשת, וממהר לשרוק שער. שחקני הקבוצה שזכתה בשער מן ההפקר מרימים ידיים בשמחה. אף אחד לא מעלה בדעתו לגשת לשופט ולהגיד לו "שמע, זה לא באמת גול". אז מי שחשב שההצגה של ריוואלדו ב-2002 שגרמה להרחקת שחקן יריב על לא עוול בכפו, או השער שהבקיעה ברזיל במונדיאל הזה תוך שימוש ביד של אחד משחקניה הם סתם מקרים, שיחשוב שוב. זו תרבות. זה בא מלמטה.
ואסיים, כמובטח, בסטטיסטיקה וכדורגל: מאמר שהופיע בעיתון סקוטי מתאר מודל סטטיסטי המנבא כי הולנד תזכה במונדיאל הקרוב. המאמר הופיע לפני הנצחון של הולנד על ברזיל. טוב, לנסים טאלב בטח יש מה להגיד על הניבוי הזה (וגם לי), אבל כרגע הסיכויים של הולנד הרבה יותר גדולים מאלה של ברזיל, וגם זה משהו.
נשלח: 3 ביולי, 2010. נושאים: הממ... מעניין..., מה אומרת הסטטיסטיקה, ספורט.
תגובות: 4
| טראקבק
הילד שנולד ביום שלישי
לפני כשנה העליתי כאן את החידה על הילדה ששמה יוספה:
במשפחת תפוחי שני ילדים. נתון לנו שאחד מהילדים האלו הוא (היא) בת, ושמה של אותה בת למשפחת תפוחי הוא יוספה. מהי ההסתברות כי גם הצאצא הנוסף של משפחת תפוחי היא בת?
הפתרון, למעוניינים, נמצא כאן.
מה שמעניין בכל הסיפור הזה הוא שהאינפורמציה בדבר שמה של הילדה הנחמדה הזו משנה את התשובה לשאלה שנשאלה, גם אם לכאורה הנתון לא נראה רלוונטי. אותה החידה, ללא הנתון על שמה של הילדה, הועלתה בבלוג של דוברמן (שאינו פעיל, למרבה הצער, תקופה ארוכה למדי), והפתרון שונה (בערכו המספרי, לא ממש בדרך הפתרון).
ומדוע אני נזכר בכל זה? היום ראיתי בבלוג של ויליאם בריגס גירסה אחרת לחידה הזו:
במשפחה יש שני ילדים, אחד מהם הוא בן, והוא נולד ביום שלישי. מה ההסתברות כי גם הילד השני במשפחה הוא בן?
התשובה, באופן לא מפתיע, שונה משתי התשובות לחידות שצוטטו כאן.
נשלח: 29 ביוני, 2010. נושאים: הממ... מעניין....
תגובות: 8
| טראקבק
המבנה הגנטי של העם היהודי
מאמר שפורסם בכתב העת Nature לפני ארבעה ימים, מתאר מחקר של המבנה הגנטי של העם היהודי.
במסגרת המחקר נבדקו רצפי DNA מ-14 קהילות יהודיות ברחבי העולם, וכן מ-69 קהילות לא יהודיות באיזורים בהם נמצאות אותן קהילות יהודיות. הגנום של היהודים והלא יהודים נותחו ניתוח סטטיסטי.
להלן מסקנות עיקריות מהמחקר:
- נראה שיש שתי קבוצות עיקריות של יהודים: האחת כוללת את האשכנזים, הספרדים, ויוצאי מרוקו. השניה כוללת את יוצאי עירק והסביבה.
- יהודי אתיופיה, כמו גם יהודי תימן וקהילות מהודו ("בני ישראל" וקהילת קוצ'ין) שונים יותר גנטית מהקבוצות היהודיות העיקריות.
- למרות ההבדלים בין שתי הקבוצות היהודיות הגדולות העיקריות, הדמיון בינן גדול יותר מהדמיון של כל קבוצה לאוכולוסיה הלא יהודית בסביבתן.
נראה כי תוצאות המחקר מפריכות את רוב טענות התיאוריה של שלמה זנד (שהציג בספרו "מתי ואיך הומצא העם היהודי?"), לפיה יהודי התפוצות הם מקומיים שהתגיירו במשך הדורות, וכי דוברי היידיש במזרח אירופה הם למעשה עם נפרד שמוצאו מהכוזרים.
נשלח: 13 ביוני, 2010. נושאים: מדע, מה אומרת הסטטיסטיקה.
תגובות: 7
| טראקבק
תורת המשחקים, הדברים החשובים והאינסוף – סקירה של ספרי חיים שפירא
למרות שחיים שפירא הוא מתמטיקאי וסטטיסטיקאי בן גילי, שלמד סטטיסטיקה בתל אביב בערך באותה תקופה בה אני למדתי בירושלים, ואחד מעמיתיי לעבודה למד יחד איתו, לא שמעתי את שמו עד לפני מספר שנים, כאשר הגיע לתת הרצאה באירוע שארגן מקום העבודה השלי.
כותרת ההרצאה הייתה "כשפו הדב פגש את וודי אלן", ואני זוכר היטב את המשפט שפתח אותה: "שמי חיים שפירא", אמר שפירא, "ואני מלמד את המקצוע הכי משעמם בעולם – סטטיסטיקה". רוב מכריע של הקהל צחק, אפילו אני חייכתי. ההרצאה הייתה מרתקת ומבדרת. שפירא יכול ללא ספק לפתח קריירה של סטנדאפיסט (והוא בעצם סוג של סטנדאפיסט כאשר הוא עולה על הבמה להרצות).
כשנתיים לאחר ההרצאה הזו, בספטמבר 2008, פצח שפירא גם בקריירה של סופר, והוציא לאור את ספרו הראשון (אם מתעלמים מספרון בהוצאת האוניברסיטה המשודרת שיצא לאור כמה שנים קודם לכן: "בעקבות אליס – מסעות לעולמו של לואיס קרול").
הספר נשא את הכותרת "שיחות על תורת המשחקים", ונראה מבטיח. הספר, שיצא לאור מספר שנים לאחר זכייתו של פרופ' ישראל אומן בפרס נובל לכלכלה, ענה ככל הנראה על צורך של הציבור להבין את התחום בו עוסק אומן, ולכן הפך לרב-מכר. אני מודה שלא רכשתי את הספר, בניגוד למנהגי לאסוף ספרי מתמטיקה פופולרית, והסתפקתי בשאילת הספר מהספריה לצורך קריאתו. לכן, עברו כבר שנתיים מאז שקראתי את הספר, ואף כי אתמול עיינתי בו בחטף באחד מדוכני שבוע הספר, הדברים שאכתוב עליו מבוססים על זכרוני.
בצדק נקרא הספר "שיחות על תורת המשחקים". הוא כתוב כאילו מישהו הקליט את שפירא משוחח על נושאים שונים, ואחר כך העלה את הדברים על הכתב. מי שיקרא את הספר ייהנה ללא ספק: הוא שזור סיפורים משעשעים ודוגמאות מעניינות. חלק מהדברים אכן עוסקים בתורת המשחקים. יש את הדיון הבלתי נמנע על דילמת האסירים, וגם על משחקים קשורים, כגון משחק השפן. יש הסבר אינטואיטיבי למדי על שיווי המשקל של נאש. יש דיון במשחקי מיקוח, ומשחק/תרגיל המכירה הפומבית של הדולר (ששודרג, ככל הנראה עקב האינפלציה, המשבר הכלכלי בארה"ב והתחזקות השקל, למכירה פומבית של 100 שקלים) נדון גם הוא. יש גם דוגמאות מעניינות מעולם הטבע – תופעות התנהגותיות של בעלי חיים שניתן להסביר באמצעות מודלים מתורת המשחקים.
אבל יש גם נושאים אחרים, שלא ממש קשורים. יש למשל, פרק שכותרתו "איך לשקר בעזרת סטטיסטיקה", ובו מביא שפירא שתי שיטות עיקריות לעיוות נתונים. מובאת החידה הנחמדה על חלוקת המטמון בין הפיראטים. בעיית שתי המעטפות זוכה גם היא לדיון, סיכויי הזכיה בהימורים שונים נדונים באריכות וגם בעיית מונטי הול נכנסה לספר הזה. נחמד מאוד, אבל מה לזה ולתורת המשחקים?
ההתרשמות שלי הייתה שהצורך למלא 200 ומשהו עמודים במהירות גבר על הרצון להוציא ספר פופולרי רציני שיסביר את תורת המשחקים בשפה שווה לכל נפש. והאמת, אין צורך בספר כזה, כי כבר קיימים מספר ספרים טובים מאוד על התחום שתורגמו לעברית: "דילמת האסיר" מאת ויליאם פאונדסטון ו-"תורת המשחקים" מאת דיקסיט וניילבאף, שני ספרים שכן נמצאים בספריה שלי.
ההצלחה של הספר הראשון הובילה את שפירא לכתיבת ספר שני, שנשא את הכותרת המעט יומרנית, אך בהחלט מוצדקת, "על הדברים החשובים באמת". לטעמי זהו ספרו הטוב ביותר של שפירא (עד כה). הלפר שלושה חלקים, וכל ספר עוסק באחת מבין שלוש היצירות הספרותיות הנפלאות, "סיפורי פו הדב" מאת א.א. מילן, "אליס בארץ הפלאות" (והמשכו, "מבעד למראה") שכתב המתמטיקאי צ'רלס דודג'סון, הידוע יותר בשמו הספרותי לואיס קרול, ו-"הנסיך הקטן" של אנטואן דה סנט-אכזופרי. גם הדברים שאכתוב על הספר הזה נכתבים מהזכרון, שכן עברה כמעט שנה מאז שקראתי אותו. החלק המוקדש לפו הדב הוא למעשה הרחבה של ההרצאה ששמעתי את שפירא נושא לפני מספר שנים.שפירא מדגים בעזרת פו, אליס, הנסיך, וכמה דמויות נוספות רעיונות מתחומי הפילוסופיה, ועשה זאת בהומור רב, ובשפה ברורה. עם זאת, אני חייב לציין, לצערי, כי חלקי הספר מהווים סדרה מונוטונית יורדת. בעוד שהחלק על פו הדב הוא מצויין, הפרק על אליס פחות טוב, ועדיף לקרוא את החוברת של האוניברסיטה המשודרת המבוססת על הרצאותיו של שפירא, או לפנות להערות הקלאסיות של מרטין גרדנר . החלק השלישי על הנסיך הקטן קצר מאוד, ועושה עוול גם לספר וגם לשפירא עצמו. הערך המוסף שלו קטן ביותר, לדעתי. עם זאת, אני בהחלט ממליץ לקרוא את הספר.
עוד שנה עברה, והנה, לקראת שבוע הספר, הוציא שפירא לאור ספר שלישי: "אינסוף המסע שאינו נגמר". עוד ספר עם כותרת יומרנית, והפעם, לצערי, היומרה ריקה מתוכן, ומוטב היה לו הספר לא נכתב. הספר לא עוסק באינסוף. זאת אומרת, חלק ממנו כן עוסק באינסוף. יש פרק שאכן עוסק בתורת הקבוצות, ובו בין היתר מביא שפירא את סיפור המלון של הילברט, מתאר את שיטת האלכסון של קנטור ומדגים כיצד מוכיחים כי המספרים הרציונליים בני מניה, אך הממשיים אינם ניתנים למניה, ועוד כהנה וכהנה. הספר גם עוסק בערב רב של נושאים אחרים: אנקדוטות מתורת המספרים, דיון במספרים הראשוניים, פרק על הקבועים פיי ו-e, ונוסחת אוילר המקשרת בינהם, מספרים מדומים, פתרון משוואות בעזרת שורשים, מספרי ארדש, המשפט האחרון של פרמה, פרקטלים, הפרדוקסים של זנון (ש"איש לא הצליח לפתור", טוען שפירא), מספרי פיבונצ'י, מספרים ראשוניים, ועוד ועוד ועוד.
הספר בעייתי מאוד. אין לו דרך. ההסברים מסורבלים, ולו הייתי צריך לנסות להבין את ההוכחה של אויקלידס לקיומם של אינסוף מספרים ראשוניים, למשל, מהטקסט של שפירא, הייתי מתקשה בכך. כאדם שעוסק במתמטיקה, הספר פשוט שיעמם אותי. אני לא כל כך יודע מה תהיה התגובה של מי ששנא מתמטיקה בלימודיו בבית הספר כאשר ינסה לקרוא אותו. חבל שהספר הזה יצא לאור, ואני ממליץ לכם לוותר עליו. יש מספיק ספרים טובים בעברית שעוסקים הנושאים האלה.
נשלח: 3 ביוני, 2010. נושאים: ספרים וסרטים.
תגובות: 10
| טראקבק
עוד דיאגרמת פיי
![]() |
כל מילה נוספת מיותרת. אציין רק שמצאתי את הגרף הזה בפריטים המשותפים של רותי מורין.
לחיצה על התמונה תוביל אתכם לאתר graphjam.com, שם תוכלו למצוא עוד גרפים משעשעים.
נשלח: 7 במאי, 2010. נושאים: אותי זה מצחיק, ויזואליזציה.
תגובות: אין
| טראקבק
