(por Alessandro Capezzuoli, funcionario del ISTAT y responsable del observatorio de datos de profesiones y competencias Aidr) Abierto, actualizado, estructurado, legible por máquina y acompañado de metadatos: los datos producidos por las Administraciones Públicas, para ser realmente utilizables, deben tener al menos estas características . Desde hace décadas, escuchamos sobre las numerosas posibilidades que ofrecen los datos y las repercusiones, en términos de conocimiento y bienestar colectivo, que se derivan de su intercambio. Sin embargo, aunque el valor atribuido a los datos es evidente en el sector privado, tan alto como para ser "pagado" con una consideración en servicios gratuitos de todo tipo, el sector público todavía parece desconocer el potencial de información disponible y no está preparado para las políticas a implementar. En realidad, la falta de preparación se debe más que nada a una especie de obstruccionismo burocrático y formal que impide la definición de acuerdos ágiles y ágiles entre administraciones.

Por esta razón, el intercambio de datos, antes de llegar a los temas tecnológicos relacionados con la cooperación de aplicaciones, se ve obstaculizado por memorandos de entendimiento manzonianos firmados y refrendados por ejecutivos, directores y presidentes, que, en el mejor de los casos, demoran meses en formalizarse. En el peor de los casos, las negociaciones terminan sin nada. Hubo un período, hace unos quince años, en el que hablar de compartir y de datos abiertos estaba de moda: se preguntaba a todo aquel que se lanzaba a reflexiones imaginativas y proyecciones temerarias de todo tipo, a veces incluso a los que realmente sabían algo y a quién, precisamente por eso. razón, fue excluido de foros importantes.

Entonces, la moda pasó y la cuestión de los datos abiertos se consideró más o menos resuelta. También porque ha surgido una palabra ciertamente más comunicativa, misteriosa y fascinante, el término "grande", que tenía el poder de detener el proceso de difusión e intercambio de datos: todo se detuvo en algunas experiencias virtuosas y algunos archivos de texto que aún resisten. , colgando heroicamente de las páginas de un sitio olvidado, como una camiseta vieja de canalé estirada sobre los hilos oxidados de una casa abandonada. Como suele suceder, la legislación existe y está claro: el artículo I del CAD establece que los datos abiertos deben ser:

  • disponible con una licencia o una disposición reglamentaria que permita su uso por cualquier persona, incluso con fines comerciales, en un formato desagregado;
  • accesibles a través de tecnologías digitales, incluidas las redes telemáticas públicas y privadas, en formatos abiertos y provistos de los metadatos correspondientes;
  • puestos a disposición de forma gratuita a través de tecnologías digitales, o puestos a disposición a los costos marginales incurridos para su reproducción y difusión (salvo lo dispuesto en el artículo 7 del Decreto Legislativo n.

Sin embargo, a pesar de las reglas, la situación real es muy diferente. En primer lugar, porque dentro de la PPAA no parece haber muchas personas que conozcan los datos y su ciclo de vida en profundidad y sean capaces de implementar estrategias de intercambio estables y de largo plazo. Los datos producidos y compartidos por las instituciones, al menos las que forman parte del Sistema Estadístico Nacional, deben garantizar la calidad, integridad de los metadatos y el cumplimiento de los estándares internacionales de difusión. Para producir datos con estas características, es necesario industrializar el proceso de producción y asegurarse de que la difusión no sea tarea de alguna persona dispuesta que inserte manualmente un archivo de texto en uno de los muchos portales, sino la conclusión de un flujo de información que pases para la recopilación, validación, archivo, publicación y, posiblemente, visualización.

Construir la "industria de datos públicos" es muy oneroso y exigente: la pandemia ha demostrado ampliamente la falta de preparación del sistema del país, especialmente en una situación de emergencia, en la construcción de una metodología de recopilación rigurosa y confiable y un sistema de validación e intercambio transparente y estructurado . Estos límites, en condición de normalidad, suelen tener que ver también con la doble alma de las instituciones, que producen simultáneamente datos de flujo y datos de stock. Los dos procesos de producción, a pesar de tener elementos comunes, se rigen por lógicas muy diferentes y requieren el uso de diferentes metodologías y tecnologías en cuanto a las fases de validación, difusión y visualización.

Los datos de stock se procesan mediante el uso de técnicas consolidadas y se agregan con el objetivo de describir un determinado fenómeno en su totalidad, los datos de flujo describen la evolución temporal de un fenómeno y, además de ser numéricamente más consistentes, tienen especificidades que requieren tratamientos y técnicas de validación y difusión distintas de los datos de stock, también en relación con el RGPD. La validación de los datos de stock, generalmente referida a un año completo, lleva mucho tiempo ya que los archivos deben estar consolidados y el proceso científico para garantizar su calidad es muy oneroso: esta restricción no permite tener datos actualizados en tiempo real, pero permite describir los fenómenos con gran precisión. La validación de los datos de flujo sigue un proceso muy diferente, mediante el cual no es posible actualmente garantizar la misma calidad de los datos de stock, pero por otro lado responde a la creciente necesidad de numerosos campos de investigación.

Luego hay una cuestión delicada sobre la distinción entre datos resumidos y datos precisos: los primeros pueden procesarse y compartirse sin restricciones particulares, los segundos, en la mayoría de los casos, están sujetos a la regulación sobre procesamiento de datos e imponen numerosas limitaciones no solo a la difusión. sino también al tratamiento y análisis por parte de los investigadores.

Una vez superado el obstáculo organizativo y metodológico, que en sí mismo representa una limitación significativa, se debe abordar la cuestión política. A pesar de las proclamas y directrices (muy a menudo ignoradas) de la AGID, las administraciones públicas siguen siendo feudos en los que imperan las regulae societatis de los jesuitas, es decir, la obediencia incondicional a la voluntad de los superiores jerárquicos y la negación de pruebas, por omisión de la difusión. del conocimiento, para dirigir el pensamiento mediante órdenes precisas dictadas por la Divina Providencia, que, por alguna razón, siempre tiene un aspecto muy humano. Este aspecto hace que los archivos de las instituciones se asemejen a fortalezas inexpugnables, amparadas por un cerco denominado "privacidad", que legitima su aislamiento.

Si bien es cierto que en los últimos años se ha fortalecido la colaboración entre instituciones y se han compartido algunos archivos, especialmente stocks, también es cierto que las metodologías adoptadas para compartir datos son absolutamente inadecuadas con respecto a los medios disponibles y aún hacen uso de métodos de transferencia manual antiguos e inseguros (carga o FTP). Es decir, no existe una gobernanza nacional que defina estrategias, métodos e infraestructuras de intercambio, hay prácticas más asentadas que no tienen en cuenta la evolución del mundo y la tecnología y, sobre todo, la necesidad de crear una industria de datos públicos. .

Sin embargo, las administraciones públicas cuentan con activos de información muy ricos, que van desde las características de las personas hasta los datos económicos, desde las necesidades de personal hasta los presupuestos, desde las habilidades hasta las profesiones, a través de los cuales sería posible implementar conscientemente todas las reformas que el país necesita. La renovación de la AP pasa por una contratación más eficaz y consciente de personal, una provisión fluida y transparente de concursos públicos, una puesta en valor del mérito, conocimiento y experiencia de los trabajadores, una optimización de gastos y estructuras organizativas a través de '' implementación de políticas laborales en términos económicos, productivos y ambientales. Es difícil, si no imposible, imaginar una reforma que, una vez más, ignore el valor de los datos y recurra a la voluntad de la Divina Providencia. Si realmente es necesario rendirse a la idea de que la salvación de los hombres no es el resultado de la contribución de cada individuo al bienestar de la comunidad, sino una especie de milagro realizado por uno de los muchos salvadores de la patria, muy querido por las masas, bien podríamos identificar al salvador en los datos y no en un santo improvisado que dispensa el elixir de reformas perfectas.

La industria de datos públicos, motor de la reforma de la AP