ראש השנה מתקרב, והעיתונים של מחר יהיו מלאים בתחזיות לשנה הבאה. הפרשנים המדיניים יחזו את תוצאות המשא ומתן שמנהל ראש הממשלה עם הרשות הפלסטינית, חלקם יקבעו כי הבחירות לכנסת יוקדמו וחלקם לא. חלקם יצדקו. פרשני הספורט ידושו בסיכויי ההצלחה של נבחרת הכדורגל במוקדמות אליפות אירופה. אסטרולוגים יודיעו כי אחמדניג’אד או נאסרללה או חוסני מובראק ילכו לעולמם השנה, וימליצו לכם (בין היתר) לרכז את השנה הבאה במאמצים לטפח את סביבת המגורים שלכם, או שלא (אני אתעלם מהעיצות האלה כי נולדתי במזל מאזניים, וידוע כי בני מזל מאזניים לא מאמינים באסטרולוגיה). נחמיה שטרסלר יתריע כי אם לא יתבצע קיצוץ משמעותי תקציב המדינה יתרגש עלינו אסון כלכלי.
אבל מה בקשר לשאלות החשובות באמת? מה תהיה תוצאת גמר היורוליג בכדורסל? מה יהיה השכר הממוצע במשק? כמה נוסעים יעברו בנתב”ג? כמה נקודות יקבל השיר הישראלי באירוויזיון? איזה תכנית טלויזיה תזכה לרייטינג הגבוה ביותר בט”ו בשבט?
על כל השאלות האלה, אתם, הקוראים, מוזמנים לענות. אתם יכולים לנחש את התשובות, לקרוא אותן בכוכבים, לפתוח בקלפים. יש לי גם הצעה רדיקלית: אפשר לנסות לאמוד את הערכים העתידיים מתוך נתונים היסטוריים, תוך שימוש בשיטת סטטיסטיות כלשהן, פשוטות או מתוחכמות, לבחירתכם.
הנה עשר שאלות. נסו את כוחכם. כדי להכנס לתחרות יש לענות לפחות על ארבע שאלות. מי שיענה על יותר שאלות, יילקחו בחשבון ארבע התשובות שיקבלו את הניקוד הגבוה ביותר, אז במובן מסויים כדאי “לנחש”, אם כי אני מקווה שהניחושים יהיו אינטליגנטיים.
יש גם מילכוד. כדי שאוכל להעריך את איכות התשובות ולהשוות בינהן, אני מבקש מהעונים לתת בעצמם הערכה לאיכות התשובות שלהם. אני מבקש כי לתחזית המנופקת תוצמד הערכה למידת אי הודאות שבתחזית: סטיית תקן. כלומר, אם אתם מעריכים כי השיר הישראלי באירוויזיון יזכה ב-100 נקודות, התשובה צריכה להיות משהו כמו “100 פלוס מינוס 10”, או “100 פלוס מינוס 20”. התשובה השניה מגלמת בתוכה מידה גדולה יותר של אי ודאות. העונה הראשון יוכל לומר כי צדק אם התוצאה תהיה 109, אך לא אם תהיה 111. העונה השני יוכל לטעון לצדקתו בשני המקרים. (הערה: ההסבר על סטיית התקן כרוך כאן בנפנוף ידיים מסויים ואינו מדוייק. עם הקוראים הבקיאים יותר בסטטיסטיקה הסליחה). לכל תשובה יינתן ניקוד שייקח בחשבון את איכות התחזית ואת nידת אי הודאות שלה. הניקוד יהיה טוב יותר ככל שהתחזית תהיה קרובה יותר לערך האמיתי וככל שסטיית התקן תהיה קטנה יותר. עם זאת, סטיית תקן קטנה מדי עלולה לגרום לכך שהערך האמיתי לא יהיה בתוך התחום המוגדר על ידי ה-“פלוס מינוס”, וזה יפחית את הניקוד. קחו זאת בחשבון. (כללי הניקוד נמצאים כאן).
שלושת המשתתפים בעלי הניקוד הטוב ביותר יזכו בפרסי ספרים. בנוסף לכך שמות החוזים המצטיינים יפורסמו כאן בבלוג, והם יזכו בדקת תהילה נוספת על 15 דקות התהילה המובטחות להם ממילא.
את התשובות לתחרות ניתן להגיש עד סוף היום, 31 בדצמבר 2010. שילחו אותן אלי, למייל jlevy13 ב-gmail.com.
הנה השאלות: בהצלחה!
1. מה יהיה השכר הממוצע במשק למשרת שכיר (כולל משרות של עובדים זרים), במחירם שוטפים, בחודש ינואר 2011, על פי פרסומי הלשכה המרכזית לסטטיסטיקה? נתונים אחרונים: מרץ 2010: 8473, אפריל 2010: 8077, מאי 2010: 8070. מקור: הירחון הסטטיסטי לישראל, לוח י”א/4. לינק: http://www.cbs.gov.il/yarhon/k4_h.htm
2. כמה נקודות יקבל השיר הישראלי בתחרות חצי הגמר של האירוויזיון ב-2011? ב-2010 הראל סקעת השיג 71 נקודות, ב-2009 השיגו אחינועם ניני ומירה עווד 75 נקודות, וב-2008 זכה בועז מעודה ב-124 נקודות. לינק לנתונים: http://www.eurovision.tv/page/history/by-country/country?country=18
3. כמה נקודות תקלע הקבוצה שתנצח השנה בגמר היורוליג בכדורסל, שייערך באביב 2011 בברצלונה? זוכת היורוליג בשנת 2010, ברצלונה, גברה בגמר 86-68 על אולימפיאקוס. ב-2009 גברה פאנאתינייקוס על צסקא מוסקבה 73-71, ואותה צסקא גברה על מכבי תל-אביב 91-77 בגמר של 2008. לינק לנתונים: http://en.wikipedia.org/wiki/Euroleague_Basketball
4. מה יהיה מחירה של מניית גוגל, בדולרים של ארה”ב, בסוף יום המסחר 14.4.2011? מחיר מניית גוגל בסוף יום המסחר 14.4.2010 היה 589.00 דולר. את הנתונים ההיסטוריים של מחיר המניה אפשר לראות בלינק הבא: http://www.google.com/finance/historical?q=NASDAQ:GOOG
5. מה יהיה מספר ההרוגים בתאונות דרכים הישראל בחודש פברואר 2011, על פי נתוני הלשכה המרכזית לסטטיסטיקה? בחודש פברואר 2010 היו 26 הרוגים בתאונות דרכים. לינק לנתונים: http://www.cbs.gov.il/www/yarhon/q5_h.htm
6. על פי נתוני הלשכה המרכזית לסטטיסטיקה, כמה נוסעים יעברו בנמל התעופה בן גוריון בחודש דצמבר 2010? בחודש דצמבר 2009 עברו בנתב”ג 692.4 אלפי נוסעים. הנתונים מתפרסמים ברבעון לסטטיסטיקה של תחבורה שהלמ”ס מוציאה לאור: http://www.cbs.gov.il/www/transport_q/t24.pdf
7. מה יהיה שיעור הצפיה בתכנית הטלוויזיה הנצפית ביותר בשבוע שבו יחול ט”ו בשבט תשע”א? (זהו השבוע שיתחיל ב-16.1.2011). נתוני הצפיה מופקים על ידי חברת טל-גאל (אי.ג’י.בי.) בע”מ ומפורסמים על ידי הועדה הישראלית למדרוג בלינק http://www.midrug-tv.org.il/scripts/public1.asp. ט”ו בשבט תש”ע חל ביום שבת, 30.1.2010. התכנית הנצפית ביותר באותו שבוע הייתה “האח הגדול 2009 – הדחה”, שזכתה לשיעור צפיה של 30.3.
8. מה יהיה גובה מפלס הכנרת בתאריך 2.1.2011? הנתונים השוטפים מפורסמים על ידי רשות המים בלינק http://www.water.gov.il/water/console/kinnert_history.aspx, אך לא מופיעים שם כל הנתונים ההיסטוריים. ניתן לעקוב אחרי הנתונים גם דרך http://twitter.com/kinbot .
9. מה תהיה טמפרטורת המקסימום היומית הממוצעת בחודש מרץ 2011 בקיבוץ נגבה? בחודש מרץ 2010, טמפרטורת המקסימום היומית הממוצעת בנגבה הייתה 24.2 מעלות. הנתונים מפורסמים בירחון הסטטיסטי לישראל: http://www.cbs.gov.il/www/yarhon/a2_h.htm
10. כמה תשובות יתקבלו לתחרות כדור הבדולח של “נסיכת המדעים”? זו שאלה קשה, ואין לי כל נתונים היסטוריים שיוכלו לסייע לכם. הנה כמה רמזים: לתחרות כדור הבדולח שערכה החברה המלכותית לסטטיסטיקה (ושימשה השראה לתחרות זו) התקבלו 51 תשובות. לבלוג “נסיכת המדעים” יש כ-200 קוראים ביום, וכ-50 מנויים לרשימת התפוצה.
סיבכת אותנו יוסי!!! בכל אופן אני אשתמש באימרה הידועה
שיש דברים שלא כדאי לחזות, ובמיוחד לא את העתיד (ביידיש ואפילו באנגלית זה נשמע יותר טוב).
סיבכתי? במה?
תחרות ראויה בהחלט, ובכוונתי להשתתף בה. ואולם, אני מוצא טעם קטן לפגם בשאלות 6 ו 8. חיזוי מפלס הכנרת בתאריך 2 בינואר כשאת התחזית צריך להגיש ב31 בדצמבר נשמעת לי כמו משימה קלה למדי. השינוי במפלס איטי למדי, ותלוי בגורם שניתן לחזות לא רע (כמות משקעים) בטווחים של 1-2 ימים קדימה. אולי עדיף להחליף בשאלה של חיזוי כמות מילימטרים של גשם שירדו במקום מסויים (נניח, קיבוץ דן – שמפרסם נתוני משקעים וטמפרטורה יומיים) במשך שבועיים בסוף ינואר או בפברואר יהוו מטרה הולמת יותר.
גם חיזוי כמות הנוסעים בדצמבר היא שאלה שעשויה להיות לא הוגנת. אמנם סטטיסטיקות מלאות יתפרסמו רק מאוחר יותר, אבל אנשים שמידע כזה נגיש להם יוכלו להסתמך על מידע חלקי באמצע דצמבר, ובכך לכייל טוב יותר את ההערכה שלהם. אולי פשוט להחליף את דצמבר 2010 בינואר או פברואר 2011?
כמו כן, חשוב להדגיש (למעו המתחרים האחרים) שהבנת שיטת הניקוד חשובה לא פחות להצלחה בתחרות מאשר יכולת ניבוי והבנה בתחומים עליהם נשאלות השאלות.
בהצלחה
מסכים עם עמית בכל מה שכתב, גם לגבי שאלות 6 ו-8 וגם לגבי החשיבות שיש לשיטת הניקוד.
בכל מקרה, יישר כוח יוסי על התחרות. זה כיף! מקווה שהרבה ישתתפו ושאמצא זמן בעצמי לספק ניבוי סטטיסטי מושכל. אם לא, נראה לי שבכל מקרה אתן ניחוש מושכל בשביל החוויה. העיקר ההשתתפות 🙂
תודה ובהצלחה לכולם