(Yazan Alessandro Capezzuoli, ISTAT yetkilisi ve Aidr meslek ve beceri verileri gözlemevi başkanıBelki de "meta" ön ekinin bilinçsizce orijinal anlamı (μετά "ile, sonra") ile ilişkilendirilmesi ve bunun sonucunda metafizik veya metaforlar gibi ruhani ve anlaşılması zor alanlarla bir kavramın çağrıştırılması nedeniyle meta veriler hakkında her zaman çok az konuşulur. Muhtemelen metadata kelimesinin kendisi blockchain, büyük veri ve makine öğrenmesi kelimeleri kadar ilgi uyandırmıyor. Veriyi tanımlayan bilgi olan meta verilere verilen indirgeyici tanım, onların işlevinin tam olarak anlaşılmasına yardımcı olmuyor: Görünüşe göre onlar olmadan yapılabilecek, verilere ikincil bir şeye atıfta bulunuyorlar. Tanıma metadata olmadan verinin anlamını yitirdiği, tutarlılığının kalmadığı ve doğru okunamadığı da eklenmelidir.
Meta verinin işlevini yalnızca "açıklayıcı" bir kapsama indirgemek tehlikeli bir küçümsemedir. Birincisi, tanımlayıcı fonksiyonun bir değil birden fazla yöne atıfta bulunması nedeniyle, verilerle ilgili içerik, yapı ve bağlamı içerebilmektedir. Tam da bu nedenle tek tip meta veri yoktur. Bir dizi normalleştirilmiş açıklamalardan oluşan, verileri tanımlamak için ve Bağlantılı Açık Verileri kullanan anlamsal arama sistemlerinde yararlı olan açıklayıcı meta veriler vardır. Yapısal meta veriler ise mimariyi ve iç ilişkileri tanımlar ve verilerin doğru kullanılması için gereklidir. Daha sonra benimsenen formatlar veya teknolojik ortam gibi teknik bilgileri içeren yönetim meta verileri vardır.
Bu genel bakış yeterlidir ve profesyoneller için XSD ve JSON Object kelimeleri, meta verilerle ilgili muazzam potansiyeli anlamak için yeterlidir. Veriye dayalı bir sistemi hayal etmek nispeten basitse, karar vermek için meta verilerin kullanımını düşünmek o kadar da basit değildir. Ancak hayal gücü, pratik bir örnekle desteklenirse kesin bir şekil alabilir. Varsayımsal olarak, dünyanın bir yerinde kontrolden çıkmış bir salgın olduğunu ve bu olgunun, enfeksiyonların ve ölümlerin sayısını ve dinamiklerini tespit eden titiz bir bilimsel yöntemle ölçüldüğünü varsayalım. Bu "sayılar" aracılığıyla restoranlarda bulaşma riskinin yüksek olduğunun vurgulandığını ve restoranların ağırlıklı olarak 70 yaş üstü erkeklerden oluşan belirli bir nüfus kesimi tarafından ziyaret edildiğini varsayalım.
Riskleri azaltmak için restoranların kapatılması veya yemek yemeyi seven, yemek yeme alışkanlığına yatkın kişilerin restorana girişinin yasaklanması düşünülebilir. İlk durumda, yiyecek ve içecek tedarik eden şirketleri belirlemek için ekonomik faaliyetleri spesifik olarak tanımlayacak meta verilere ihtiyaç duyulacaktır. İkinci durumda, "Restoranlara girmeyin" mesajının gönderileceği isimlerin listesini çıkarmak için nüfus arşivine ihtiyaç duyulacaktır. Her iki durumda da karar vermek için kaliteli tanımlayıcı ve yapısal meta verilere ihtiyaç duyulacaktır. Kesinlikle indirgeyici olan bu örnek, meta verinin rolü üzerine sayısız düşünceye başlamamıza olanak tanıyor. Maksimum Kovid riskinin olduğu dönemde restoranların kapatılmasına, ATECO istatistik sınıflandırmasının, yani şirketler tarafından yürütülen ekonomik faaliyetleri az çok kesin bir şekilde tanımlayan bir dizi sınıf ve tanımlayıcının benimsenmesi yoluyla karar verildi. Bir sınıflandırma sisteminin "istatistiksel saflığı", ancak restoran kapanışlarının meta verilerden kaynaklandığı inkar edilemez. Benzer şekilde, nüfusun belirli bir kesiminin restoranlara erişiminin yasaklanmasına karar verilmiş olsaydı, meta veriler bireylerin seçiminde anahtar rol oynayacaktı. İki senaryo şu anda kamusal tartışmanın bir parçası olmayan yönleri ortaya çıkarıyor: meta verilerin yönetimi, verileri tanımlamak için paylaşılan "dillerin" benimsenmesi veya daha genel olarak bilimsel olgular ve meta verilerin kalitesi. Restoranları kapatma kararı temelde tek bir nedenden ötürü mümkündü: Tüm şirketlerin tek bir paylaşılan sınıflandırma sistemine atıfta bulunan bir ATECO kodu vardır, dolayısıyla 56.10.11 kodunun ilişkili olduğu şirketleri belirlemek nispeten basitti. teslimat. Aynı hüküm, her bölgenin farklı bir sınıflandırma sistemi benimsediği, belki de daha az katı ve diğerlerinden bağımsız bir bağlamda uygulanamaz olabilirdi.
Meta verilerle ilgilenenler, örneğin cinsiyetin farklı şekilde belirtildiği, E/K, Erkek/Kadın, 0/1, 1/2 veya bölgenin kodlandığı farklı veritabanlarının entegrasyonunda karşılaşılan zorlukların çok iyi farkındadır. metodolojik ve zamansal açıdan farklı sınıflandırmalara dayanmaktadır. Ne yazık ki, tek tip bir meta veri sistemi oluşturmak her zaman mümkün değildir: bazen veri üreticilerinin dışarıya karşı dar görüşlülüğüne, bazen de bir dizi verinin daha büyük (veya daha az) bilimsel kesinliğine ilişkin gerçek veya varsayılan iddialara bağlıdır. kesintiye uğramayan prosedürlerin veya zaman serilerinin benimsenmesiyle meta veriler başka zamanlarla karşılaştırıldığında.
Kaliteli meta verilerin ortak kullanımı önemsiz olmaktan uzaktır ve genellikle metodolojik sorunlardan ziyade politik sorunlar nedeniyle engellenmektedir. Meta verilerin kullanım kapsamını işgücü piyasası ve mesleklerle sınırlandırırsak, kasvetli bir senaryo ortaya çıkar: Bir tarafta, tanımlamaya çok uygun olan uluslararası ISCO (Uluslararası Standart Meslek Sınıflandırması) sınıflandırması vardır. paylaşılan ve kaliteli dil, meslekler ve bunların çok yönlü temsili, diğer taraftan partizan çıkarlar, kastlar, benmerkezcilik ve konuya ilişkin yetersiz bilgi, uygulamanın uygulanmasını engellemektedir. Sonuç olarak, özellikle kamu sektöründe işe alım, uzun yıllardan beri, bunu karşılamanın mümkün olmadığı tarihi bir dönemde, yapısal bir eksiklikten muzdariptir. Bu nedenle "dijital dönüşüm" konusunun gündemine "Meta veri, yönetişim, paylaşım ve kalite" maddesinin de eklenmesi arzu edilir.