(מאת אלסנדרו קפזואולי, מנהל ISTAT ומנהל מצפה הכוח למקצועות Aidr ונתוני כישורים) פתוח, מעודכן, מובנה, קריא במכונה ומלווה במטא נתונים: הנתונים המופקים על ידי הממשל הציבורי, כדי להיות שמישים באמת, צריכים לכלול לפחות מאפיינים אלה . מזה עשרות שנים אנו שומעים על האפשרויות הרבות שמציעים הנתונים וההשלכות, מבחינת הידע והרווחה הקולקטיבית, הנובעות משיתופם. אף על פי שהערך המיוחס לנתונים ניכר במגזר הפרטי, עד כדי כך שהוא "משולם" בתמורה לשירותים בחינם מכל הסוגים, נראה שהמגזר הציבורי עדיין לא מודע לפוטנציאל המידע העומד לרשותו ולא מוכן לכך. המדיניות שיש ליישם. במציאות, חוסר ההיערכות הוא יותר מכל דבר אחר בשל מעין חסימה בירוקרטית ורשמית המונעת הגדרת הסכמים רזים ומהירים בין הממשלים.

מסיבה זו, שיתוף הנתונים, לפני ההגעה לנושאים הטכנולוגיים הנוגעים לשיתוף פעולה ביישומים, מונע על ידי מזכרי הבנה של מנזוניאן שנחתמו וחתומים על ידי מנהלים, דירקטורים ונשיאים, אשר, במיטב המקרים, נדרשים חודשים להתבסס עליהם. במקרה הגרוע, המשא ומתן מסתיים בלא כלום. הייתה תקופה, לפני כחמש עשרה שנה, שבה הדיבורים על שיתוף ונתונים פתוחים היו אופנתיים: כל מי שפתח בהרהורים דמיוניים והקרנות פזיזות מכל הסוגים, לפעמים אפילו מי שבאמת ידע משהו על זה נשאל ומי בדיוק בשביל זה סיבה, הוא הוצא מהפורומים החשובים.

ואז, האופנה עברה ושאלת הנתונים הפתוחים נחשבה לפתרון פחות או יותר. גם מכיוון שהופיעה מילה תקשורתית, מסתורית ומרתקת בהחלט, המונח "גדול", שהיה בכוחו לעצור את תהליך ההפצה ושיתוף הנתונים: הכל נעצר בכמה חוויות סגולות וכמה קבצי טקסט שעדיין מתנגדים. , תלויה בגבורה על דפי האתר הנשכח, כמו גופיית צלעות ישנה נמתחת על חוטי החלודה של בית נטוש. כפי שקורה לעתים קרובות, החקיקה קיימת וברור: מאמר I של ה- CAD קובע כי נתונים פתוחים חייבים להיות:

  • זמין עם רישיון או הוראה רגולטורית שמאפשרת את השימוש בהם על ידי כל אחד, כולל למטרות מסחריות, בפורמט מפורק;
  • נגיש באמצעות טכנולוגיות דיגיטליות, כולל רשתות טלמטיקה ציבוריות ופרטיות, בפורמטים פתוחים ומסופקות עם המטא-נתונים היחסיים;
  • הועמדו לרשותם ללא תשלום באמצעות טכנולוגיות דיגיטליות, או הועמדו לרשותם בעלויות השוליות שנגרמו לצורך שכפולם והפצתם (למעט הוראות סעיף 7 לצו חקיקה מספר 24 מיום 2006 בינואר 36).

עם זאת, למרות הכללים, המצב האמיתי שונה מאוד. ראשית, מכיוון שבתוך ה- PPAAs לא נראה שיש הרבה אנשים שמכירים את הנתונים ומעגל החיים שלהם לעומק ומסוגלים ליישם אסטרטגיות שיתוף יציבות וארוכות טווח. הנתונים המופקים ומשותפים על ידי המוסדות, לפחות אלה המהווים חלק מהמערכת הסטטיסטית הלאומית, צריכים להבטיח את איכותם, שלמותם של המטא-נתונים ועמידה בתקני הפצה בינלאומיים. כדי לייצר נתונים עם מאפיינים אלה, יש צורך לתעד את תהליך הייצור ולוודא שההפצה אינה המשימה של אדם מוכן שמכניס ידנית קובץ טקסט לאחד מהפורטלים הרבים, אלא מסקנה של זרימת מידע מעביר לאיסוף, אימות, ארכיב, פרסום ואולי גם תצוגה.

בניית "תעשיית הנתונים הציבוריים" היא מאוד מכבידה ותובענית: המגיפה הוכיחה היטב את חוסר המוכנות של מערכת המדינה, במיוחד במצב חירום, בבניית מתודולוגיית איסוף קפדנית ואמינה ומערכת אימות ושיתוף שקוף ומובנה. . גבולות אלה, במצב של נורמליות, נדרשים לעיתים קרובות להתמודד גם עם הנשמה הכפולה של המוסדות, המייצרים בו זמנית נתוני זרימה ונתוני מלאי. שני תהליכי הייצור, למרות היותם אלמנטים משותפים, נשלטים על ידי לוגיקה שונה מאוד ודורשים שימוש במתודולוגיות וטכנולוגיות שונות בכל הנוגע לשלבי האימות, ההפצה וההדמיה.

נתוני המלאי מעובדים באמצעות טכניקות מאוחדות ומצטברים במטרה לתאר תופעה מסוימת במלואה, נתוני הזרימה מתארים את ההתפתחות הזמנית של תופעה, ובנוסף להיותם עקביים יותר מבחינה מספרית, יש ספציפיים הדורשים טיפולים וטכניקות אימות והפצה למעט נתוני מלאי, גם ביחס ל- GDPR. אימות נתוני המניות, המתייחס בדרך כלל לשנה שלמה, לוקח זמן רב מכיוון שיש לאחד את הארכיונים והתהליך המדעי להבטחת איכותם מכביד מאוד: אילוץ זה אינו מאפשר לעדכן נתונים בזמן אמת, אך מאפשר לתאר את התופעות בדיוק רב. אימות נתוני הזרימה עוקב אחר תהליך שונה מאוד, שבאמצעותו לא ניתן כיום להבטיח את אותה איכות נתוני המלאי, אך מצד שני הוא עונה לצורך הגובר בתחומי מחקר רבים.

ואז יש שאלה עדינה הנוגעת להבחנה בין נתוני סיכום לנתונים דייקניים: ניתן לעבד ולשתף את הראשונים ללא מגבלות מיוחדות, האחרונים, ברוב המקרים, כפופים לתקנה על עיבוד נתונים ומטילים מגבלות רבות לא רק להפצה. אלא גם לטיפול וניתוח של חוקרים.

לאחר שהתגבר על המכשול הארגוני והמתודולוגי, שכשלעצמו מהווה מגבלה משמעותית, יש להתייחס לשאלה הפוליטית. למרות ההכרזות וההנחיות (שלעיתים קרובות מתעלמים מהם) של ה- AGID, הממשלים הציבוריים הם עדיין מחוזות שבהם שולטים הרגולטורים החברתיים של הישועים, כלומר הציות ללא תנאי לרצון הממונים ההיררכיים והכחשת הראיות, באמצעות השמטה של ​​התפשטות הידע, לכוון מחשבה באמצעות פקודות מדויקות המוכתבות על ידי השגחה אלוהית, שמשום מה, תמיד יש לה מראה אנושי מאוד. היבט זה הופך את ארכיוני המוסדות לדומים למבצרים בלתי ניתנים להספגה, המוגנים על ידי גדר המכונה "פרטיות", דבר המעניק לגיטימציה למעשה לבידודם.

אמנם נכון שבשנים האחרונות שיתוף הפעולה בין המוסדות התחזק, וכמה ארכיונים, במיוחד מניות, חולקו, אך נכון גם שהמתודולוגיות שאומצו לשיתוף נתונים אינן מספיקות ביחס לאמצעים הקיימים ועדיין לעשות שימוש. של שיטות העברה ידניות ישנות וחסרות ביטחון (העלאה או FTP). במילים אחרות, אין ממשל לאומי המגדיר אסטרטגיות שיתוף, שיטות ותשתיות, יש שיטות מיושבות יותר שאינן מביאות בחשבון את התפתחות העולם והטכנולוגיה ובעיקר את הצורך ליצור תעשיית נתונים ציבורית. .

עם זאת, למנהלות ציבוריות יש נכסי מידע עשירים מאוד, החל ממאפייני הפרטים וכלה בנתונים כלכליים, מצרכים כוח אדם ועד לתקציבים, מכישורים ועד מקצועות, שדרכם ניתן יהיה ליישם במודע את כל הרפורמות שהמדינה זקוקה לה. חידוש הרשות הפלסטינית עובר דרך גיוס כוח אדם יעיל ומודע יותר, אספקה ​​שוטפת ושקופה של תחרויות ציבוריות, שיפור הכשרון, הידע והניסיון של העובדים, אופטימיזציה של הוצאות ומבנים ארגוניים באמצעות "יישום של קיימא. מדיניות עבודה במונחים כלכליים, יצרניים וסביבתיים. קשה, אם לא בלתי אפשרי, לדמיין רפורמה, שמתעלמת שוב מערך הנתונים ונוקטת ברצון ההשגחה האלוקית. אם באמת יש צורך להיכנע לרעיון כי ישועת הגברים אינה תוצאה של תרומתו של כל אדם לרווחת הקהילה, אלא סוג של נס שביצע אחד מגואלי המולדת הרבים, אהוב מאוד על ההמונים, אנו יכולים גם לזהות את המושיע בנתונים ולא אצל איש קדוש מאולתר המחלק את שיקוי הרפורמות המושלמות.

תעשיית הנתונים הציבורית, המנוע של הרפורמה ברשות