(بقلم أليساندرو كيبزولي ، مسؤول ISTAT ومدير مهن ومهارات مرصد البيانات Aidr) هناك دائمًا القليل من الحديث عن البيانات الوصفية ، ربما لأن البادئة "meta" مرتبطة دون وعي بمعناها الأصلي (μετά "مع ، بعد") وما يترتب على ذلك من دلالة لمفهوم إلى المجالات الأثيري والمراوغة ، مثل الميتافيزيقا أو الاستعارات. من المحتمل أن الكلمة نفسها ، البيانات الوصفية ، لا تثير الكثير من الاهتمام مثل الكلمات blockchain والبيانات الضخمة والتعلم الآلي. التعريف الاختزالي الذي يُعطى للبيانات الوصفية ، المعلومات التي تصف البيانات ، لا يساعد على فهم وظيفتها بشكل كامل: يبدو أنه يشير إلى شيء ثانوي للبيانات ، والذي يمكن القيام به بدونه. يجب أن يضاف إلى التعريف أنه بدون البيانات الوصفية ، تفقد البيانات معناها ، ولم تعد متسقة ولا يمكن قراءتها بشكل صحيح.
إن تقليص وظيفة البيانات الوصفية إلى نطاق "وصفي" حصري هو تقليل خطير من التقدير. أولاً ، لأن الوظيفة الوصفية لا تشير إلى جانب واحد بل إلى عدة جوانب ، والتي قد تشمل المحتوى والهيكل والسياق المتعلق بالبيانات. لهذا السبب بالتحديد ، لا يوجد نوع واحد من البيانات الوصفية. توجد بيانات وصفية وصفية ، تتكون من مجموعة من الأوصاف المعيارية ، مفيدة لتحديد البيانات وفي أنظمة البحث الدلالي التي تستخدم البيانات المفتوحة المرتبطة. من ناحية أخرى ، تصف البيانات الوصفية الهيكلية البنية والعلاقات الداخلية وهي ضرورية لاستخدام البيانات بشكل صحيح. ثم هناك البيانات الوصفية للإدارة ، والتي تشمل المعلومات التقنية مثل الأشكال أو البيئة التكنولوجية المعتمدة.
هذه النظرة العامة ، وبالنسبة للمطلعين ، فإن الكلمات XSD و JSON Object ، كافية لفهم الإمكانات الهائلة المرتبطة بالبيانات الوصفية. إذا كان من السهل نسبيًا تخيل نظام يعتمد على البيانات ، فليس من السهل التفكير في استخدام البيانات الوصفية لاتخاذ القرارات. ومع ذلك ، يمكن للخيال أن يتخذ شكلاً محددًا ، إذا كان مدعومًا بمثال عملي. لنفترض ، من الناحية الافتراضية ، أنه يوجد في مكان ما من العالم وباء خارج عن السيطرة وأن هذه الظاهرة تقاس من خلال طريقة علمية صارمة تكشف عن عدد وديناميات العدوى والوفيات. لنفترض أنه من خلال هذه "الأرقام" ، هناك خطر كبير من انتقال العدوى في المطاعم وأن المطاعم يرتادها بشكل أساسي شريحة معينة من السكان تتكون من الذكور الذين تزيد أعمارهم عن 70 عامًا.
لتقليل المخاطر ، يمكن للمرء أن يفكر في إغلاق المطاعم ، أو رفض مدخل المتساهل والمعرض للأكل. في الحالة الأولى ، ستكون هناك حاجة إلى بيانات وصفية يمكن من خلالها وصف الأنشطة الاقتصادية بشكل أساسي ، من أجل تحديد الشركات التي تتعامل مع توريد المواد الغذائية والمشروبات. في الحالة الثانية ، ستكون هناك حاجة إلى أرشيف للسكان يتم من خلاله استخراج قائمة بالأسماء لإرسال رسالة "ممنوع الدخول إلى المطاعم". في كلتا الحالتين ، ستكون هناك حاجة لبيانات وصفية وصفية وتركيبية عالية الجودة لاتخاذ القرار. يسمح لنا هذا المثال ، وهو بالتأكيد بخس ، ببدء تأملات عديدة حول دور البيانات الوصفية. تقرر إغلاق المطاعم ، في فترة الحد الأقصى من مخاطر كوفيد ، من خلال اعتماد التصنيف الإحصائي ATECO ، وهو مجموعة من الفئات والعلامات الوصفية التي تحدد بدقة إلى حد ما الأنشطة الاقتصادية التي تقوم بها الشركات. النقاء الإحصائي "لنظام تصنيف ، ولكن لا يمكن إنكار أن إغلاق المطاعم قد تم توجيهه بواسطة البيانات الوصفية. وبالمثل ، إذا تقرر حظر وصول شريحة معينة من السكان إلى المطاعم ، فإن البيانات الوصفية كانت ستلعب دورًا رئيسيًا في اختيار الأفراد. يبرز السيناريوهان الجوانب التي لا تشكل حاليًا جزءًا من النقاش العام: إدارة البيانات الوصفية ، واعتماد "اللغات" المشتركة لوصف البيانات ، أو الظواهر العلمية بشكل عام ، وجودة البيانات الوصفية. كان قرار إغلاق المطاعم ممكنًا بشكل أساسي لسبب: جميع الشركات لديها كود ATECO يشير إلى نظام تصنيف مشترك واحد ، لذلك كان من السهل نسبيًا تحديد الشركات التي يرتبط بها الرمز 56.10.11 - تقديم الطعام مع الإدارة . كان من الممكن أن يكون نفس الحكم غير قابل للتطبيق في سياق اعتمدت فيه كل منطقة نظام تصنيف مختلفًا ، ربما أقل صرامة ، ومنزوعًا عن السياق الآخر.
أولئك الذين يتعاملون مع البيانات الوصفية يدركون جيدًا الصعوبات التي تواجه دمج قواعد البيانات المختلفة التي ، على سبيل المثال ، يشار إلى الجنس بشكل مختلف ، M / F ، ذكر / أنثى ، 0/1 ، 1/2 ، أو يتم تدوين المنطقة على أسس التصنيفات المختلفة من حيث المنهجية والزمانية. لسوء الحظ ، ليس من الممكن دائمًا بناء نظام بيانات وصفية موحد: في بعض الأحيان يعتمد ذلك على الإغلاق الذهني لمنتجي البيانات فيما يتعلق بالخارج ، وأحيانًا على ادعاءات حقيقية أو مفترضة بصرامة علمية أكبر (أو أقل) لمجموعة من البيانات الوصفية مقارنة بأخرى ، مرات أخرى من خلال اعتماد إجراءات أو سلاسل زمنية لا يمكن مقاطعتها.
يعد الاستخدام المشترك للبيانات الوصفية عالية الجودة بعيدًا عن التافه ، وغالبًا ما تعرقله القضايا السياسية وغير المنهجية. إذا كان نطاق استخدام البيانات الوصفية مقصورًا على سوق العمل والمهن ، يظهر سيناريو قاتم: من ناحية ، هناك التصنيف الدولي ISCO (التصنيف الدولي الموحد للمهن) ، والذي سيكون مناسبًا جدًا لوصفه ، مع لغة ومهن مشتركة وذات جودة عالية وتمثيلها في جوانب متعددة ، من ناحية أخرى ، هناك مصالح حزبية وطبقات وأنانية وضعف المعرفة بالموضوع ، مما يعيق تطبيقها. ونتيجة لذلك ، عانى التوظيف ، ولا سيما في القطاع العام ، من قصور هيكلي لسنوات عديدة حتى الآن ، في وقت لا يمكن تحمله. لهذا السبب ، سيكون من المستحسن إدراج بند "البيانات الوصفية ، والإدارة ، والمشاركة والجودة" في جدول أعمال موضوع "التحول الرقمي".