(napisao Alessandro Capezzuoli, službenik ISTAT-a i menadžer za struke i vještine opservatorija podataka Aidr) O metapodacima se uvijek malo govori, možda zato što je prefiks "meta" nesvjesno povezan sa svojim izvornim značenjem (μετά "sa, nakon") i posljedičnom konotacijom pojma na eterična i neuhvatljiva područja, poput metafizike ili metafora. Vjerovatno sama riječ, metapodaci, ne izaziva toliko zanimanje kao riječi blockchain, veliki podaci i mašinsko učenje. Reduktivna definicija koja se daje metapodacima, informacijama koje opisuju podatke, ne pomaže u potpunosti razumjeti njihovu funkciju: čini se da se odnosi na nešto sekundarno u odnosu na podatke, bez čega bi se moglo. Treba dodati definiciji da bez metapodataka podaci gube značenje, više nemaju konzistentnost i ne mogu se ispravno čitati.
Smanjenje funkcije metapodataka na isključivo „opisni“ opseg opasno je podcjenjivanje. Prvo, jer se opisna funkcija ne odnosi na jedan već na nekoliko aspekata, koji mogu sadržavati sadržaj, strukturu i kontekst koji se odnose na podatke. Upravo iz tog razloga, ne postoji jedan tip metapodataka. Postoje deskriptivni metapodaci, koji se sastoje od skupa normaliziranih opisa, korisnih za identifikaciju podataka i u semantičkim sistemima pretraživanja koji koriste povezane otvorene podatke. Strukturni metapodaci, s druge strane, opisuju arhitekturu i interne odnose i ključni su za ispravnu upotrebu podataka. Zatim tu su metapodaci o upravljanju, koji uključuju tehničke informacije poput formata ili usvojenog tehnološkog okruženja.
Ovaj opći pregled i, za insajdere, riječi XSD i JSON Object, dovoljni su za razumijevanje ogromnog potencijala povezanog s metapodacima. Ako je relativno lako zamisliti sistem vođen podacima, nije tako lako razmišljati o upotrebi metapodataka za donošenje odluka. Mašta, međutim, može dobiti precizan oblik ako je potkrijepljena praktičnim primjerom. Pretpostavimo, hipotetski, da negdje u svijetu postoji epidemija van kontrole i da se ovaj fenomen mjeri rigoroznom naučnom metodom koja otkriva broj i dinamiku infekcija i smrtnih slučajeva. Pretpostavimo da kroz ove „brojeve“ postoji visok rizik od zaraze u restoranima i da restorane uglavnom posjećuje određeni segment populacije koji čine muškarci stariji od 70 godina.
Da bi se smanjili rizici, moglo bi se pomisliti na zatvaranje restorana ili na uskraćivanje ulazaka popustljivim i sklonim jedenju pojedincima. U prvom slučaju, bili bi potrebni metapodaci pomoću kojih bi se uglavnom opisivale ekonomske aktivnosti, kako bi se identifikovale kompanije koje se bave opskrbom hranom i pićem. U drugom slučaju bila bi potrebna arhiva stanovništva iz koje bi se izvukao spisak imena na koja bi se poslala poruka „Zabranjen ulaz u restorane“. U oba slučaja za donošenje odluke bili bi potrebni kvalitetni opisni i strukturni metapodaci. Ovaj primjer, zasigurno potcjenjivanje, omogućava nam da započnemo brojna razmišljanja o ulozi metapodataka. O zatvaranju restorana, u periodu najvećeg rizika Covid, odlučeno je usvajanjem statističke klasifikacije ATECO, odnosno seta klasa i deskriptora koji manje ili više precizno identificiraju ekonomske aktivnosti koje kompanije provode. ”Klasifikacijskog sustava, ali ne može se poreći da je zatvaranje restorana vođeno metapodacima. Slično tome, da je odlučeno da se zabrani pristup restoranima određenom segmentu stanovništva, metapodaci bi imali ključnu ulogu u odabiru pojedinaca. Dva scenarija donose aspekte koji trenutno nisu dio javne rasprave: upravljanje metapodacima, usvajanje zajedničkih „jezika“ za opisivanje podataka ili općenito naučni fenomeni i kvalitet metapodataka. Odluka o zatvaranju restorana u osnovi je bila moguća iz razloga: sve kompanije imaju ATECO kod koji se odnosi na jedinstveni zajednički sistem klasifikacije, pa je bilo relativno lako identificirati kompanije s kojima je povezan kod 56.10.11 - Ugostiteljstvo s administracijom . Ista odredba mogla je biti neprimjenjiva u kontekstu u kojem je svaka regija usvojila drugačiji sistem klasifikacije, možda manje rigorozan i dekontekstualiziran od ostalih.
Oni koji se bave metapodacima dobro su svjesni poteškoća s kojima se susreću u integraciji različitih baza podataka u kojima je, na primjer, spol različito naznačen, M / Ž, Muško / Žensko, 0/1, 1/2 ili je teritorija kodirana na osnova različitih klasifikacija u metodološkom i vremenskom smislu. Nažalost, nije uvijek moguće izgraditi jedinstveni sistem metapodataka: ponekad to ovisi o mentalnom zatvaranju proizvođača podataka s obzirom na van, ponekad o stvarnim ili pretpostavljenim tvrdnjama o većoj (ili manjoj) znanstvenoj rigoroznosti skupa metapodataka u usporedbi s drugim, drugim vremenima usvajanjem postupaka ili vremenskih serija koje se ne mogu prekinuti.
Zajednička upotreba kvalitetnih metapodataka daleko je od trivijalnosti i često je otežana političkim i nemetodološkim pitanjima. Ako je opseg upotrebe metapodataka ograničen na tržište rada i profesije, pojavljuje se mračan scenarij: s jedne strane postoji međunarodna klasifikacija ISCO (Međunarodna standardna klasifikacija zanimanja), koja bi bila vrlo pogodna za opisivanje, sa zajednički i kvalitetan jezik, profesije i njihova zastupljenost u više aspekata, s druge strane postoje stranački interesi, kasta, egocentrizam i slabo poznavanje predmeta, što ometa njihovu primjenu. Kao rezultat, regrutiranje, posebno u javnom sektoru, pati od strukturnih nedostataka već dugi niz godina, u vrijeme kada se to ne može priuštiti. Iz tog razloga, bilo bi poželjno da se stavka "Metapodaci, upravljanje, dijeljenje i kvalitet" uvrsti na dnevni red teme "digitalna transformacija".