(autor Alessandro Capezzuoli, ISTATi ametnik ning andmekeskuste ametite ja oskuste juht Aidr) Metaandmetest räägitakse alati vähe, võib-olla seetõttu, et eesliide "meta" on alateadlikult seotud selle algse tähendusega (μετά "koos, pärast") ja sellest tuleneva mõiste konnotatsiooniga eeterlikele ja raskesti tabatavatele aladele, nagu metafüüsika või metafoorid. Tõenäoliselt ei tekita sõna ise, metaandmed, nii suurt huvi kui sõnad plokiahel, big data ja masinõpe. Metaandmetele antud teave, andmeid kirjeldav teave, ei aita nende funktsiooni täielikult mõista: see näib viitavat millelegi andmetele teisejärgulisele, ilma milleta võiks hakkama saada. Definitsioonile tuleks lisada, et ilma metaandmeteta kaotavad andmed oma tähenduse, neil pole enam järjepidevust ja neid ei saa õigesti lugeda.
Metaandmete funktsiooni taandamine eranditult "kirjeldavale" ulatusele on ohtlik alahindamine. Esiteks seetõttu, et kirjeldav funktsioon ei viita mitte ühele, vaid mitmele aspektile, mis võivad hõlmata andmetega seotud sisu, struktuuri ja konteksti. Just sel põhjusel pole üht tüüpi metaandmeid. On kirjeldavaid metaandmeid, mis koosnevad normaliseeritud kirjelduste komplektist, mis on kasulikud andmete tuvastamiseks ja semantilistes otsingusüsteemides, mis kasutavad lingitud avatud andmeid. Struktuursed metaandmed seevastu kirjeldavad arhitektuuri ja siseseoseid ning on andmete õigeks kasutamiseks hädavajalikud. Seejärel on halduse metaandmed, mis sisaldavad tehnilist teavet, näiteks vorminguid või vastuvõetud tehnoloogilist keskkonda.
Sellest üldisest ülevaatest ja siseringi jaoks sõnadest XSD ja JSON Object piisab metaandmetega seotud tohutu potentsiaali mõistmiseks. Andmepõhist süsteemi on suhteliselt lihtne ette kujutada, kuid metaandmete kasutamise üle otsuste tegemisel pole nii lihtne mõelda. Kujutlusvõime võib omandada täpse kuju, kui seda toetab praktiline näide. Oletame hüpoteetiliselt, et kusagil maailmas on kontrolliväline epideemia ja seda nähtust mõõdetakse range teadusliku meetodi abil, mis tuvastab nakkuste ja surmade arvu ja dünaamika. Oletame, et nende "arvude" kaudu on restoranides suur nakatumise oht ja et restorane külastab peamiselt konkreetne elanikkonna segment, mis koosneb üle 70-aastastest meestest.
Riskide vähendamiseks võiks mõelda restoranide sulgemisele või keelata järeleandlikele ja sööma kalduvatele inimestele sisenemine. Esimesel juhul oleks vaja metaandmeid, mille abil kirjeldada peamiselt majandustegevust, et teha kindlaks ettevõtted, kes tegelevad toidu- ja joogivarustusega. Teisel juhul oleks vaja elanikkonna arhiivi, kust saaks välja võtta nimekirja nimedest, kellele saata sõnum “Restoranidesse sissepääs keelatud”. Mõlemal juhul oleks otsuse tegemiseks vaja kvaliteeti kirjeldavaid ja struktuurseid metaandmeid. See näide, mis on kindlasti alahinnatud, võimaldab meil metaandmete rolli kohta arvukalt mõtiskleda. Restoranide sulgemine maksimaalse Covidi riski perioodil otsustati ATECO statistilise klassifikatsiooni vastuvõtmisega, st klasside ja kirjelduste kogumiga, mis enam-vähem täpselt määratlevad ettevõtete majandustegevuse. ”Klassifitseerimissüsteemi, kuid ei saa eitada, et restoranide sulgemise taga olid metaandmed. Samamoodi, kui oleks otsustatud keelata juurdepääs restoranidele teatud elanikkonnarühma jaoks, oleks metaandmetel olnud üksikisikute valimisel võtmeroll. Need kaks stsenaariumi toovad välja aspekte, mis praegu avaliku arutelu alla ei kuulu: metaandmete haldamine, andmete või üldisemalt teaduslike nähtuste kirjeldamiseks jagatud “keelte” kasutuselevõtt ja metaandmete kvaliteet. Restoranide sulgemise otsus oli põhimõtteliselt võimalik põhjusel: kõigil ettevõtetel on ATECO kood, mis viitab ühisele jagatud klassifikatsioonisüsteemile, seega oli suhteliselt lihtne tuvastada ettevõtteid, kellega kood 56.10.11 seostati - toitlustamine haldusega . Sama sätet ei oleks võinud kohaldada kontekstis, kus iga piirkond oli võtnud kasutusele erineva klassifitseerimissüsteemi, võib-olla vähem range ja teistest dekontekstualiseeritud.
Need, kes tegelevad metaandmetega, teavad hästi raskusi erinevate andmebaaside integreerimisel, kus näiteks sugu on märgitud erinevalt, M / F, Mees / Naine, 0/1, 1/2 või territoorium on kodifitseeritud erinevate klassifikatsioonide alus metoodilises ja ajalises mõttes. Kahjuks ei ole alati võimalik ühtset metaandmete süsteemi üles ehitada: mõnikord sõltub see andmete tootjate vaimsest sulgemisest välise suhtes, mõnikord metaandmete kogumi suurema (või väiksema) teadusliku ranguse tegelikest või oletatavatest väidetest kui teine, muul ajal menetluste või aegridade vastuvõtmisega, mida ei saa katkestada.
Kvaliteetsete metaandmete ühine kasutamine pole kaugeltki tühine ning seda takistavad sageli poliitilised ja metoodikavälised probleemid. Kui metaandmete kasutusala piirdub tööturu ja ametitega, tekib sünge stsenaarium: ühelt poolt on olemas rahvusvaheline klassifikatsioon ISCO (International Standard Classification of Occupation), mille kirjeldamiseks sobiks väga hästi, jagatud ja kvaliteetne keel, elukutsed ja nende esindatus mitme aspekti all, teiselt poolt on nende rakendamist takistavad parteilised huvid, kastid, egotsentrismid ja selle teema vähene tundmine. Seetõttu on värbamine, eriti avalikus sektoris, juba aastaid olnud struktuurne puudus, ajal, mil seda ei saa endale lubada. Sel põhjusel oleks soovitav, et punkt "Metaandmed, juhtimine, jagamine ja kvaliteet" lisataks teema "digitaalne ümberkujundamine" päevakorda.