(door Alessandro Capezzuoli, ISTAT-ambtenaar en manager van het Aidr-observatorium voor beroepen en vaardigheidsgegevens) Open, bijgewerkt, gestructureerd, machinaal leesbaar en vergezeld van metagegevens: de gegevens die door de overheidsdiensten worden geproduceerd, moeten, om echt bruikbaar te zijn, ten minste deze kenmerken hebben . Al decennia lang horen we over de talrijke mogelijkheden die data bieden en de repercussies, in termen van kennis en collectief welzijn, als gevolg van het delen ervan. Maar hoewel de waarde die aan gegevens wordt toegekend duidelijk is in de particuliere sector, zo hoog dat ze 'betaald' moet worden met een vergoeding in alle soorten gratis diensten, lijkt de publieke sector zich nog steeds te weinig bewust van het beschikbare informatiepotentieel en onvoorbereid op het te implementeren beleid. In werkelijkheid is de onvoorbereidheid meer dan iets anders te wijten aan een soort bureaucratisch en formeel obstructiebeleid dat de definitie van 'lean and quick'-overeenkomsten tussen administraties verhindert.

Om deze reden wordt het delen van gegevens, voordat we ingaan op de technologische kwesties met betrekking tot samenwerking tussen applicaties, belemmerd door Manzoniaanse memoranda van overeenstemming ondertekend en medeondertekend door managers, directeuren en presidenten, die in het beste geval maanden in beslag nemen om te worden geformaliseerd. In het ergste geval eindigen de onderhandelingen met niets. Er was een periode, ongeveer vijftien jaar geleden, dat het praten over delen en open data modieus was: iedereen die in allerlei fantasierijke reflecties en roekeloze projecties begon, soms zelfs degenen die er echt iets van afwisten, werd gevraagd en wie precies daarvoor reden, werd hij uitgesloten van belangrijke fora.

Toen ging de mode voorbij en werd de open data-vraag als min of meer opgelost beschouwd. Ook omdat er een zeker communicatiever, mysterieuzer en fascinerender woord is ontstaan, de term 'groot', die de kracht had om het proces van verspreiding en delen van gegevens te stoppen: alles stopte bij enkele deugdzame ervaringen en een paar tekstbestanden die nog steeds weerstand bieden. , heldhaftig hangend aan de pagina's van een vergeten site, als een oud geribbeld onderhemd dat zich uitstrekt over de roestige draden van een verlaten huis. Zoals zo vaak bestaat de wetgeving en is het duidelijk: Artikel I van de CAD bepaalt dat open data:

  • beschikbaar met een licentie of een regelgevende bepaling die het gebruik ervan door iedereen toestaat, ook voor commerciële doeleinden, in een uitgesplitst formaat;
  • toegankelijk via digitale technologieën, waaronder openbare en particuliere telematicanetwerken, in open formaten en voorzien van de bijbehorende metagegevens;
  • gratis ter beschikking worden gesteld via digitale technologieën, of ter beschikking gesteld tegen de marginale kosten gemaakt voor de reproductie en verspreiding ervan (met uitzondering van de bepalingen van artikel 7 van wetsdecreet nr. 24 van 2006 januari 36).

Ondanks de regels is de werkelijke situatie echter heel anders. Ten eerste omdat er binnen de PPAA's niet veel mensen lijken te zijn die de gegevens en de levenscyclus ervan grondig kennen en in staat zijn om stabiele en langetermijnstrategieën voor delen te implementeren. De gegevens die door de instellingen worden geproduceerd en gedeeld, althans de gegevens die deel uitmaken van het nationaal statistisch systeem, moeten de kwaliteit, volledigheid van de metagegevens en naleving van internationale verspreidingsnormen garanderen. Om gegevens met deze kenmerken te produceren, is het noodzakelijk om het productieproces te industrialiseren en ervoor te zorgen dat de verspreiding niet de taak is van een gewillig persoon die handmatig een tekstbestand invoegt op een van de vele portalen, maar de afsluiting van een informatiestroom die passen voor verzameling, validatie, archivering, publicatie en eventueel weergave.

Het opbouwen van de "publieke data-industrie" is zeer omslachtig en veeleisend: de pandemie heeft ruimschoots de onvoorbereidheid van het landensysteem aangetoond, vooral in een noodsituatie, bij de constructie van een rigoureuze en betrouwbare verzamelingsmethode en een validatiesysteem en transparant en gestructureerd delen . Deze grenzen hebben, in een toestand van normaliteit, vaak ook te maken met de dubbele ziel van de instellingen, die tegelijkertijd stroomgegevens en voorraadgegevens produceren. De twee productieprocessen, ondanks dat ze gemeenschappelijke elementen hebben, worden beheerst door zeer verschillende logica's en vereisen het gebruik van verschillende methodologieën en technologieën met betrekking tot de validatie-, verspreidings- en visualisatiefasen.

De voorraadgegevens worden verwerkt met behulp van geconsolideerde technieken en worden geaggregeerd met als doel een bepaald fenomeen in zijn geheel te beschrijven, de stroomgegevens beschrijven de temporele evolutie van een fenomeen en zijn niet alleen numeriek consistenter, maar hebben ook specifieke kenmerken die vereisen behandelingen en validatie en verspreidingstechnieken anders dan voorraadgegevens, ook in relatie tot de AVG. De validatie van voorraadgegevens, die doorgaans betrekking hebben op een heel jaar, neemt veel tijd in beslag, aangezien de archieven moeten worden geconsolideerd en het wetenschappelijke proces om de kwaliteit ervan te garanderen, zeer omslachtig is: deze beperking staat niet toe dat gegevens in realtime worden bijgewerkt, maar om de verschijnselen met grote precisie te beschrijven. De validatie van de stroomgegevens volgt een heel ander proces, waardoor het momenteel niet mogelijk is om dezelfde kwaliteit van de voorraadgegevens te garanderen, maar aan de andere kant beantwoordt het aan de groeiende behoefte van tal van onderzoeksgebieden.

Dan is er een delicate kwestie met betrekking tot het onderscheid tussen samenvattende gegevens en nauwkeurige gegevens: de eerste kunnen zonder bijzondere beperkingen worden verwerkt en gedeeld, de laatste zijn in de meeste gevallen onderworpen aan de verordening inzake gegevensverwerking en leggen tal van beperkingen op, niet alleen voor de verspreiding. maar ook aan de behandeling en analyse door onderzoekers.

Na het overwinnen van de organisatorische en methodologische hindernis, die op zichzelf een aanzienlijke beperking vormt, moet de politieke kwestie worden aangepakt. Ondanks de proclamaties en richtlijnen (die vaak worden genegeerd) van de AGID, zijn openbare besturen nog steeds leengoederen waarin de regulae societatis van de jezuïeten regeren, d.w.z. onvoorwaardelijke gehoorzaamheid aan de wil van hiërarchische superieuren en het ontkennen van bewijs, door het weglaten van de verspreiding van kennis, om het denken te sturen door middel van nauwkeurige bevelen die zijn opgelegd door de goddelijke voorzienigheid, die, wie weet waarom, altijd een zeer menselijk voorkomen heeft. Dit aspect maakt de archieven van de instellingen vergelijkbaar met onneembare forten, beschermd door een hek genaamd "privacy", wat hun isolement effectief legitimeert.

Hoewel het waar is dat de samenwerking tussen instellingen de afgelopen jaren is versterkt en dat sommige archieven, met name bestanden, zijn gedeeld, is het ook waar dat de methoden voor het delen van gegevens absoluut ontoereikend zijn in vergelijking met de beschikbare middelen en nog steeds gebruikmaken van oude en onveilige handmatige overdrachtsmethoden (upload of FTP). Met andere woorden, er is geen nationaal bestuur dat strategieën, methoden en infrastructuren voor delen definieert, er zijn meer gevestigde praktijken die geen rekening houden met de evolutie van de wereld en technologie en vooral met de noodzaak om een ​​publieke data-industrie te creëren. .

Toch beschikken overheidsdiensten over zeer rijke informatiebronnen, variërend van de kenmerken van individuen tot economische gegevens, van personeelsbehoeften tot budgetten, van vaardigheden tot beroepen, waardoor het mogelijk zou zijn om bewust alle hervormingen door te voeren die het land nodig heeft. De vernieuwing van de PA verloopt via een effectievere en bewustere aanwerving van personeel, een vlotte en transparante aanbieding van openbare wedstrijden, een verbetering van de verdienste, kennis en ervaring van werknemers, een optimalisatie van uitgaven en organisatiestructuren door '' implementatie van duurzame arbeidsbeleid in economisch, productief en ecologisch opzicht. Het is moeilijk, zo niet onmogelijk, een hervorming voor te stellen die, nogmaals, de waarde van gegevens negeert en zijn toevlucht neemt tot de wil van de goddelijke voorzienigheid. Als het echt nodig is om je over te geven aan het idee dat de redding van mensen niet het resultaat is van de bijdrage van elk individu aan het welzijn van de gemeenschap, maar een soort wonder verricht door een van de vele redders van het vaderland, zeer dierbaar voor de massa, we kunnen net zo goed de redder identificeren in de gegevens en niet in een geïmproviseerde heilige man die het elixer van perfecte hervormingen uitdeelt.

De publieke data-industrie, de motor van de PA-hervorming