(av Alessandro Capezzuoli, ISTAT-tjänsteman och chef för Aidr-yrkes- och kompetensdataobservatoriet) Öppna, uppdaterade, strukturerade, maskinläsbara och åtföljda av metadata: de uppgifter som publiceras av de offentliga myndigheterna, för att vara riktigt användbara, borde ha åtminstone dessa egenskaper . I årtionden nu har vi hört talas om de många möjligheter som data erbjuder och följderna, när det gäller kunskap och kollektivt välbefinnande, till följd av deras delning. Trots att det värde som tillskrivs uppgifter är uppenbart i den privata sektorn, så högt att det "betalas" med hänsyn till gratis tjänster av alla slag, verkar den offentliga sektorn fortfarande alltför omedveten om den informationspotential som finns tillgänglig och oförberedd för de policyer som ska genomföras. I verkligheten beror beredskapen mer än någonting annat på grund av ett slags byråkratisk och formell obstruktion som förhindrar definitionen av magra och snabba överenskommelser mellan myndigheter.

Av denna anledning hindras utbytet av data innan de tekniska frågorna rörande applikationssamarbete, av Manzonianska samförståndsavtal, undertecknat och undertecknat av chefer, direktörer och presidenter, som i bästa fall tar månader att formaliseras. I värsta fall slutar förhandlingarna med ingenting. Det fanns en period för ungefär femton år sedan när prat om att dela och öppna data var på modet: alla som startade i fantasifulla reflektioner och hänsynslösa projektioner av alla slag, ibland till och med de som verkligen visste något om det blev frågade och som, just för detta anledning uteslöts han från viktiga forum.

Då gick mode och frågan om öppna data ansågs mer eller mindre löst. Också för att ett säkert mer kommunikativt, mystiskt och fascinerande ord har dykt upp, termen "stor", som hade makten att stoppa processen för spridning och delning av data: allt stannade vid några dygdiga upplevelser och några filer av text som fortfarande står emot, heroiskt hängande på sidorna på en bortglömd webbplats, som en gammal räfflad undertröja sträckt på de rostiga trådarna i ett övergett hus. Som ofta händer finns lagstiftningen och det är tydligt: ​​artikel I i CAD föreskriver att öppna data måste vara:

  • tillgänglig med en licens eller en regleringsbestämning som tillåter användning av vem som helst, inklusive för kommersiella ändamål, i ett uppdelat format;
  • tillgänglig via digital teknik, inklusive offentliga och privata telematiska nätverk, i öppna format och försedda med relativa metadata.
  • tillhandahålls gratis via digital teknik eller görs tillgängliga till de marginalkostnader som uppstår för deras reproduktion och spridning (förutom bestämmelserna i artikel 7 i lagdekret nr 24 av den 2006 januari 36).

Trots reglerna är den verkliga situationen dock mycket annorlunda. För det första, för inom PPAAs verkar det inte finnas många människor som känner till data och dess livscykel på djupet och kan genomföra stabila och långsiktiga delningsstrategier. De uppgifter som produceras och delas av institutionerna, åtminstone de som ingår i det nationella statistiska systemet, bör garantera kvaliteten, fullständigheten av metadata och överensstämmelse med de internationella standarderna för spridning. För att producera data med dessa egenskaper är det nödvändigt att industrialisera produktionsprocessen och se till att spridningen inte är uppgiften för någon villig person som manuellt infogar en textfil på en av de många portalerna, utan avslutningen av ett informationsflöde som passerar för insamling, validering, arkivering, publicering och eventuellt visning.

Att bygga den "offentliga dataindustrin" är mycket betungande och krävande: pandemin har tydligt visat landets beredskap, särskilt i en nödsituation, i byggandet av en rigorös och tillförlitlig insamlingsmetodik och ett valideringssystem och transparent och strukturerad delning. . Dessa gränser, i ett tillstånd av normalitet, måste ofta också hantera institutionernas dubbla själ, som samtidigt producerar flödesdata och lagerinformation. Trots att de har gemensamma element styrs de två produktionsprocesserna av mycket olika logik och kräver användning av olika metoder och tekniker när det gäller validerings-, spridnings- och visualiseringsfaser.

Lageruppgifterna bearbetas med hjälp av konsoliderade tekniker och aggregeras i syfte att beskriva ett visst fenomen i sin helhet, flödesdata beskriver den temporala utvecklingen av ett fenomen och har, förutom att vara numeriskt mer konsekvent, specificiteter som kräver behandlingar och andra validerings- och spridningstekniker än lagerdata, även i förhållande till GDPR. Valideringen av beståndsdata, som vanligtvis hänvisar till ett helt år, tar lång tid eftersom arkiven måste konsolideras och den vetenskapliga processen för att garantera deras kvalitet är mycket betungande: denna begränsning tillåter inte att data uppdateras i realtid, men tillåter att beskriva fenomenen med stor precision. Valideringen av flödesdata följer en helt annan process, genom vilken det för närvarande inte är möjligt att garantera samma kvalitet på lagerdata, men å andra sidan svarar det på det växande behovet av många forskningsområden.

Sedan finns det en känslig fråga om skillnaden mellan sammanfattande data och exakta uppgifter: den förra kan bearbetas och delas utan särskilda begränsningar, den senare, i de flesta fall, omfattas av förordningen om databehandling och inför många begränsningar inte bara för spridning men också till behandling och analys av forskare.

Efter att ha övervunnit det organisatoriska och metodiska hindret, som i sig utgör en betydande begränsning, måste den politiska frågan tas upp. Trots tillkännagivandena och riktlinjerna (som ofta ignoreras) av AGID är de offentliga förvaltningarna fortfarande femdomar där jesuiternas regulae societatis regerar, det vill säga ovillkorlig lydnad mot de hierarkiska överordnas vilja och förnekandet av bevis, genom utelämnande av spridning av kunskap, att rikta tanken med hjälp av exakta ordningar som dikteras av den gudomliga försynen, som, vem vet varför, alltid har ett mycket mänskligt utseende. Denna aspekt gör att institutionernas arkiv liknar ogenomträngliga forter, skyddade av ett staket som kallas "integritet", vilket effektivt legitimerar deras isolering.

Även om det är sant att samarbetet mellan institutioner de senaste åren har stärkts och vissa arkiv, särskilt bestånd, har delats, är det också sant att metoderna för att dela data är helt otillräckliga jämfört med tillgängliga medel och fortfarande använder gamla och osäkra manuella överföringsmetoder (uppladdning eller FTP). Med andra ord finns det ingen nationell styrning som definierar delningsstrategier, metoder och infrastrukturer, det finns mer sedda metoder som inte tar hänsyn till utvecklingen av världen och tekniken och framför allt behovet av att skapa en offentlig dataindustri. .

Ändå har offentliga förvaltningar mycket rika informationstillgångar, allt från individers egenskaper till ekonomisk data, från personalbehov till budgetar, från kompetens till yrken, genom vilka det skulle vara möjligt att medvetet genomföra alla de reformer som landet behöver. Förnyelsen av PA går igenom en mer effektiv och medveten rekrytering av personal, en flytande och transparent tillhandahållande av offentliga tävlingar, en förbättring av arbetarnas meriter, kunskap och erfarenhet, en optimering av kostnader och organisationsstrukturer genom '' implementering av hållbar arbetspolitik i ekonomisk, produktiv och miljömässig mening. Det är svårt, om inte omöjligt, att föreställa sig en reform som återigen ignorerar värdet av data och tillgodoser den gudomliga försynens vilja. Om det verkligen är nödvändigt att ge upp för tanken att människors frälsning inte är resultatet av varje individs bidrag till samhällets välbefinnande, utan ett slags mirakel utfört av en av de många frälsarna i hemlandet, mycket kära för massorna, kan vi lika gärna identifiera frälsaren i uppgifterna och inte i en improviserad helig man som fördelar elixiren av perfekta reformer.

Den offentliga dataindustrin, motorn till PA-reformen