רק ב-20% מנתוני הדיור שמוקלדים על ידי רשות המסים אין טעויות

בתוך כל מהומת דוח הדיור של מבקר המדינה, הסתתר פרק אפרורי יחסית שמדבר על מספרים, על נתונים, על הבסיס. קראתי את הפרק הזה פעמיים. הוא מזעזע. המבקר מצא ליקויים מוטרפים ממש באיסוף נתוני הדיור הבסיסיים ביותר בידי רשות המסים, המלצות לטיוב נתונים שלא מתבצעות, ופערי מידע גדולים שיוצרים כמה מדדים ממשלתיים שסותרים זה את זה. הנה 1,486 מלים על העיוורון שבו פועלים מקבלי ההחלטות בתחום הדיור

בכמה עלו מחירי הדירות בשנים האחרונות? או בשנה האחרונה? התשובה היא שאף אחד לא באמת יודע. התשובה הזו נשמעת פנטסטית, אבל זו התשובה המדויקת שעולה מהפרק הראשון בדוח מבקר המדינה על מחדל הדיור.
למעשה, אם הדוח הזה היה גיליון ציונים, הרי שהוא היה מעניק בלתי מספיק מהדהד לכל רשויות המדינה שעוסקת באיסוף נתונים על שוק הדיור. לרשות המסים, ללשכה המרכזית לסטטיסטיקה, למשרד הבינוי, לשמאי הממשלתי ולמשרד האוצר.
הליקויים שמבקר המדינה מצא בעבודת רישום, איסוף ועיבוד נתוני הדיור בישראל הם שערורייתיים ממש, ולמעשה לא מאפשרים למקבלי ההחלטות לראות את התמונה המלאה. המחדלים באיסוף הנתונים, שיפורטו מיד, גורמים לפוליטיקאים ולפקידים הבכירים להתנהל בעיוורון נתונים, ולכן לגבש מדיניות בלתי מתאימה. אז בכמה עלו מחירי הדיור? התשובה היא שאף אחד לא באמת יודע. עכשיו בואו שמעו למה.


עלילות הכרמ״ן

הכירו את כרמ״ן – כרטסת מידע נדל״ן. הכרטסת הזו, מאגר הנתונים הזה, הוא הבסיס לכל נתוני הדיור שיש לממשלה בישראל. מי שאחראי על ניהול הכרמ״ן, כלומר על איסוף הנתונים ורישומם, היא רשות המסים. זאת משום שהדרך העיקרית בה המדינה מקבל מידע על נדל״ן הוא דרך חובת הדיווח לרשות המסים על כל עסקת נדל״ן שנערכת. לכן, פקידי רשות המסים מקבלים טפסים מהאנשים שמוכרים דירות ובהם הפרטים שהם מדווחים על הדירות האלה, ומקלידים את הנתונים במערכת הכרמ״ן.
למשל, אם מכרתם דירה מתישהו, בקובץ הכרמ״ן הדירה הזו אמורה להופיע, לרבות כל פרטיה – מה השטח שלה, כמה חדרים יש בה, באיזו קומה היא, מאיזו שנה הבניין, מה פרטי הגוש והחלקה של הדירה, מה היה מחיר המכירה בדולרים ובשקלים, איזה חלק מהדירה נמכר, ופרטים רבים נוספים. זו התיאוריה, בכל אופן.
הבעיה מתחילה בכך שלמרות שאנחנו בשנת 2015, כל הרישום הזה נעשה באופן ידני, ומתברר כי באופן בלתי מקצועי בעליל. הבעיה הזו ידועה, כך מתברר מדוח מבקר המדינה. מנהל הכנסות המדינה במשרד האוצר התריע עליה לא אחת, וגם הביא דוגמאות עד כמה קובץ הנתונים הבסיסי הזה שגוי, ועד כמה הדבר עלול להשפיע על טיב נתוני הדיור שרשויות המדינה מחשבות.
למשל, מנהל הכנסות המדינה דגם רחוב אקראי אחד בתל אביב ובדק את עסקות הנדל״ן שנעשו בו בשנים 2007-2008. לפי הנתונים שהופיעו בכרמ״ן, המחיר הממוצע של דירה ברחוב הזה עלה בין השנים הללו ב-5%. אבל, כשמנהל הכנסות המדינה בדק לעומק הוא גילה שב-44% מהעסקאות שנעשו באותו רחוב באותה שנה פקידי רשות המסים לא מילאו נתונים על איכות הדירות כמו שטחן ומספר החדרים שבהן. פשוט לא מילאו. ואז, כשהם השמיטו מהנתונים את הדירות שלגביהן פשוט לא היה קיים המידע, התברר כי המחיר הממוצע של דירה באותו רחוב לא רק שלא עלה, אלא בפועל ירד ב-9% בין השנים הללו. איך אפשר לנהל מדיניות ככה?
ביולי 2011, כשכבר היה ברור שמשהו בנתונים הבסיסיים דפוק, מנהל הכנסות המדינה עשה בדיקה מעמיקה עוד יותר. החוקרים שלו בדקו באופן ידני כ-10,000 טופסי הצהרה שהוגשו לרשות המסים בשנה הקודמת (טפסים של אנשים שמכרו דירות ודיווחו על כך לרשות המסים), והשוו אותם לנתונים שהוקלדו על ידי פקידי רשות המסים בכרמ״ן. החוקרים בדקו עד כמה הנתונים שהוקלדו בידי פקידי רשות המסים תאמו את מה שדווח בטפסים. הממצאים מבהילים ממש: רק בחמישית מהמקרים נמצאה התאמה מלאה בין הטפסים לבין מה שהוקלד בכרמ״ן. בכ-60% מהמקרים פקידי רשות המסים הקלידו פרטים שבכלל לא נרשמו בטפסים שהוגשו להם. ביתר המקרים פקידי רשות המסים טעו בהקלדת הנתונים שדווחו להם. שווה לקרוא את הנתונים האלה שוב – רק ב-20% מהמקרים פקידי רשות המסים הזינו למערכת נתונים אמיתיים. כלומר שבחלק הארי של הנתונים שהוזנו היתה טעות כזו או אחרת (בדיקה מעמיקה עוד יותר, גילתה, למשל, שב-26% מהמקרים היו לפקידים שתי טעויות).
בשורה התחתונה, רק 85% מעסקאות הנדל״ן בכלל נרשמות בכרמ״ן. ורק במחצית מהן מוקלדים כל הנתונים הפיזיים של הדירה שנמכרה. ובמקרים שהנתונים מוקלדים, הטעויות רבות. מבקר המדינה החליט לבדוק בעצמו את הנתונים. הוא השווה את הנתונים של דירות שנמכרו בשנת 2012 והוזנו לכרמ״ן, לבין הנתונים שכבר היו רשומים במערכת כתוצאה ממכירה של אותן הדירות עצמן בעשור קודם לכן (2003-2011), ובדק מה מידת ההתאמה.
התוצאות של בדיקת המבקר מזעזעות: רק במחצית מהמקרים מספר החדרים שנרשם במערכת לגבי הדירות האלה תאם את מספר החדרים שנרשם במערכת בפעמים הקודמות שהדירות האלה נמכרו, רק ב-15% מהמקרים היתה התאמת בשנת הבנייה של הבניין (לעיתים בפערים של 20 שנה), ורק ב-22% מהמקרים היתה התאמה לגבי השטח הכולל של הדירה.
נתונים כמו גיל הבניין, שטח הדירה ומספר החדרים שבה משמשים גופים כמו הלשכה המרכזית לסטטיסטיקה לחשב מה קרה למחירי הדירות עם השנים. אם הנתונים האלה רשומים בצורה כל כך רשלנית במחשבי רשות המסים, החישובים של הלשכה המרכזית לסטטיסטיקה וגופים אחרים יכולים להיות פשוט מוטעים לחלוטין.

המחדל – כולם ידעו, אבל מרחו את הזמן

אם חומרת הממצאים האלה לא מספיקה, הרי שמתברר כי כולם ידעו שזה המצב, ופעלו בכמה אפיקים במקביל בשביל לתקנו, אם כי עדיין ללא הצלחות גדולות.
האפיק הראשון החל בנובמבר 2011. אז, לאחר שכבר הובהר מעבר לכל ספק כי יש בעיות קשות בנתונים, רשות המסים הקימה ועדה מיוחדת ״לבחינה ויישום של דיווח מקוון במיסוי מקרקעין״. הוועדה ישבה ובחנה, ולבסוף המליצה כי במקום טפסים ידניים, אנשים שמוכרים דירות ידווחו על כך לרשות המסים במערכת מקוונת, להקטנת מספר הטעויות. עוד המליצה הוועדה כי רשות המסים תבנה מערכת שיכולה להצליב מידע ממקורות שונים – כמו מהרשות המקומית הגובה ארנונה או עם המערכת הבנקאית המחלקת את המשכנתאות – בשביל לוודא כי הנתונים מהימנים. ההמלצה הזו הייתה אמורה להיות מיושמת בתקציב המדינה לשנים 2013-2014, אבל היא דרשה תוספת כוח אדם לרשות המסים (לא ברור מדוע מעבר למערכת אינטרנטית מחייבת דווקא הוספת תקנים), והיא עדיין לא מיושמת בפועל (אם כי ברשות המסים אמרו לי שהם מתכוונים להתחיל להפעיל את המערכת עד סוף השנה).
בתשובתה למבקר המדינה, הסבירה הרשות כי העובדים שמזינים את הנתונים למערכת ״עוברים הכשרות ומעודכנים בנוגע לחשיבות המידע ולשימוש הנרחב שנעשה בו״ ושהפתרון המיטבי לטיוב הנתונים ״טמון בהקצאת משאבים ייעודיים לנושא כמו תגבור כוח אדם לצורך איתור חריגים ובדיקתם ועדכון הנתונים״.
במקביל, צוות מיוחד של אגף תקציבים נדרש לסוגיית הבעייתיות של הנתונים החל מינואר 2011 (בעקבות המלצה של הלמ״ס מ-2009). בתחילת 2012, אחרי שנה של דיונים הצוות הזה התפצל לשניים. חלקו השני, בהובלת המועצה הלאומית לכלכלה, עסק ב״שיפור ופיתוח של מתודולוגיה ושל מדדים נוספים לצורך קבלת החלטות״. כפי שגם פורסם ב״כלכליסט״ בזמן אמת, יו״ר המועצה הלאומית לכלכלה פרופ׳ יוג׳ין קנדל פרסם דוח ביניים בתחילת 2014 ובו הסביר כי גילה שאי אפשר לדעת באמת מה מחירי הדיור בישראל ומה קרה להם לאורך זמן. זאת בגלל שהאיכות הירידה של קובץ הכרמ״ן מביאה לכך שהלמ״ס צריכה להשמיט חלק מהנתונים, ולכן חלק ניכר מהדירות שנמכרות בכלל לא באות לידי ביטוי במדד מחירי הדירות. לפיכך, אחת ההמלצות של קנדל היתה שרשות המסים תשפר את איכות הנתונים.
בנוסף, קנדל המליץ ללמ״ס לטייב את הנתונים של רשות המסים על ידי הצלבתם עם נתונים משלימים מהבנקים המחלקים משכנתאות וממשרד הבינוי המחזיק אצלו נתונים המגיעים אליו במסגרת חוק המכר. מבקר המדינה בדק ומצא שהדבר לא נעשה, והוא מעיר בדוח ללמ״ס על כך שהיתה צריכה לעשות זאת, על מנת לטייב את הנתונים שבידיה ולשפר את איכותם.

התוצאה – כל גוף מפרסם איזה נתונים שבא לו, איך שבא לו

בשורה התחתונה, כפי שגם מעיר המבקר, גופים ממשלתיים שונים מפרסמים נתונים שונים לחלוטין על שוק הדיור, כשהם משתמשים בבסיס נתונים שונה ובמתודולוגיות שונות. לעיתים, הנתונים אפילו סותרים זה את זה. כך, למשל, בשנת 2012 מדד מחירי הדירות של הלמ״ס עלה בשיעור של 8.5%, אבל נתוני משרד השיכון הראו עליה של 2% בלבד, ואילו נתוני השמאי הממשלתי הציגו עליה של 5%. בשנים אחרות הפערים היו אפילו גדולים יותר.
איך זה עובד? הלשכה המרכזית לסטטיסטיקה לוקחת את נתוני הכרמ״ן, ומעבדת אותם על מנת לחשב מה המחיר של דירות בבעלות הדיירים ומה השינוי במחירים הללו מדי חודש.
משרד הבינוי, לעומת זאת, לוקח את הנתוני הכרמ״ן ומשמיט מהם נתונים שהוא מחשיב חריגים (למשל, שמחיר הדירה לא תואם לחלוטין את שטח הדירה) או עסקות עם נתונים חסרים מאוד, ואז מחשב מה המחיר הממוצע של דירות חדשות ושל דירות יד שניה.
השמאי הממשלתי לוקח רק דירות ארבעה חדרים, כי מבחינתו אלה מרבית הדירות שנמכרות בשוק ולכן הן מייצגות מספיק טוב את השוק כולו, ומחשב מה המחיר והשינוי במחירים, אחרי שהוא מוריד עסקאות שנראות לו חריגות.
מנהל הכנסות המדינה במשרד האוצר מתייחס רק לדירות חדשות, בהסתמך על הכרמ״ן, ומתבסס על מתדולוגיה אחרת, שהוא עצמו הגדיר כלא טובה מספיק ולכן כעת הוא פועל על מנת להחליף אותה באחרת. ובבנק ישראל בכלל מקימים מאגר נתונים חדש משל עצמו, שיסתמך גם על לוחות המודעות האלקטרוניים (כמו win-win ויד2) ויצליב אותם עם הנתונים של רשות המסים. המטרה של בנק ישראל היא לייצר מדד של לחץ בשוק הדיור, בשביל למדוד את פרק הזמן שחולף מפרסום מודעה ועד למכירתה, וההפרש בין המחיר המבוקש בתחילה לבין המחיר הסופי.
בשורה התחתונה, מדובר באוסף גדול של מדדים שונים שמסתמכים על שיטות חישוב שונות לחלוטין, ולכן לא בהכרח מאפשרות קבלת תמונה קוהרנטית למקבלי ההחלטות בשביל לגבש מדיניות מתאימה בשוק הדיור. וכל זה נעשה על בסיס מאגר נתונים רחוק מלהיות מיטבי. אין פלא שמבקר המדינה מעיר לסיכום הפרק הזה כי ״ריבוי נתונים, שלעיתים אף סותרים זה את זה, והיעדר ההסברים בגינם מביאים לידי אי בהירות המקשה על הממשלה ועל גופים אחרים לקבל החלטות בנושא״.
הגורמים השונים מסרו בתגובה כי בימים אלה הם מקיימים פורום בהובלת אגף תקציבים בשביל להכריע אחת ולתמיד מי יהיה הגוף שיהיה אחראי על פרסום המדדים המרכזיים בתחום הדיור, מה יהיו המדדים האלה וכיצד הם יחושבו, וכיצד אפשר לטייב את נתוני רשות המסים. אם לשפוט לפי הקצב שבו הדברים מתנהלים בנושא הזה בשנים האחרונות, ייתכן מאוד ששום דבר לא ישתפר עד דוח מבקר המדינה הבא בעוד כמה שנים.

גרסה מקוצרת של הטקסט הזה התפרסמה הבוקר בעיתון

תגובות

  1. אדם

    הנה הצעה – שיפרסמו את כל המידע הגולמי ויכריזו על תחרות לטיוב אוטומטי של המידע (data challenge) עם פרס שווה. אני בטוח שהמאגר יטויב באחוז מהזמן ובתוצאה יותר טובה מכל ועדה ממשלתית.

  2. גדי

    מה לגבי מדד קייס-שילר הישראלי? אני מתכוון למכון גזית גלוב לחקר הנדל"ן שמוציא מדד שמבוסס אך ורק על דירות שהיו בהם שתי עסקאות רשומות, בהפרש של כמה שנים. ככה הם משווים תפוזים לתפוזים (את אותה דירה לעצמה).
    כדאי לשאול מומחים האם המדד שלהם שווה משהו. הם עצמם הציגו גרפים של השוואה בינם לבין גרף הלמ"ס המוכר.

  3. D! פה

    גם אני, ומי לא? (מלבד שרים, חברי כנסת, נציגי ציבור ובני משפחותיהם)

    אבל תחרות עם פרס שווה זה הפרטה של משהו שהמדינה אמורה לעשות. אני לא אוטומטית נגד הפרטה, נהפוך הוא, יש מספיק רעות חולות שכמעט אין ברירה אלא להפריט כדי להפטר מהן, אבל ל אצריך לרוץ ישר לכל דבר שגרוע ולהפריט. אני עדין מאמין שיש דברים שאפשר לפתור בתוך מסדרונות השלטון. בטוח משהו טפשי שכזה.

  4. גדי וקסמן

    גם שקיפות לא תעזור פה, אני לא מאמין שזה מה שישנה את המערכת המלוכלכת..
    צריך שינוי אמיתי בהתנהלות של המדינה כלפי זה.

  5. פינגבאק: פברואר 2015 | *פודיום - ניוזלטר מנהל תכנון

  6. נילי

    גדי, כאן ניתן לראות מאמר של בנק ישראל, העוסק במדד קייס-שילר:
    http://www.boi.org.il/he/Research/DocLib1/pp1401h.pdf
    בעמוד 24, איור 7, יש השוואה של המדד ההדוני של הלמ"ס (המתבסס על תכונות הדירות) לבין מדד קייס-שילר (המתבסס על רכישות חוזרות של אותה דירה).
    בשורה התחתונה – הם דומים.

  7. פינגבאק: מבקר המדינה מוסיף כשלים משלו למשבר הדיור | עוד בלוג תל אביבי

  8. Michael

    די מפחיד. אגב, אם כבר מדברים על נתונים ואקסלים, מישהו בודק את המודלים והסימולציות שלהם? גם שם יכולות להתחבא שגיאות קשות. למשל, ב-74 מרטין פלדמן (במקבילה של הביטוח לאומי בארה״ב) הגיע למסקנה שקיומו של ביטוח לאומי גורם לאנשים להפסיק לחסוך. הנתונים היו טובים, אבל הייתה לו שגיאה בקוד, שהתגלתה רק ב-82.
    http://www.jstor.org/discover/10.2307/1831373?sid=21106114770573&uid=3738240&uid=2&uid=4

    יש עוד דוגמאות כאלו, למשל המאמר של ריינהרט ורוגוף (2010), שתמך במדיניות צנע.
    http://en.wikipedia.org/wiki/Growth_in_a_Time_of_Debt

להגיב זה מגניב