(por Alessandro Capezzuoli, funcionario de ISTAT y gerente del observatorio de datos de profesiones y habilidades Aidr) Siempre se habla poco de metadatos, quizás porque el prefijo "meta" se asocia inconscientemente con su significado original (μετά "con, después") y la consiguiente connotación de un concepto a áreas etéreas y esquivas, como la metafísica o las metáforas. Probablemente, la palabra en sí, metadatos, no despierte tanto interés como las palabras blockchain, big data y aprendizaje automático. La definición reductiva que se le da a los metadatos, la información que describe los datos, no ayuda a comprender completamente su función: parece referirse a algo secundario a los datos, que podría prescindir. Cabe agregar a la definición que sin metadatos un dato pierde su significado, ya no tiene consistencia y no se puede leer correctamente.
Reducir la función de los metadatos a un ámbito exclusivamente "descriptivo" es una peligrosa subestimación. Primero, porque la función descriptiva se refiere no a uno sino a varios aspectos, que pueden incluir el contenido, la estructura y el contexto relacionados con los datos. Precisamente por eso, no existe un único tipo de metadatos. Existen metadatos descriptivos, que se componen de un conjunto de descripciones normalizadas, útiles para identificar datos y en sistemas de búsqueda semántica que hacen uso de Linked Open Data. Los metadatos estructurales, por otro lado, describen la arquitectura y las relaciones internas y son esenciales para usar los datos correctamente. Luego están los metadatos de gestión, que incluyen información técnica como los formatos o el entorno tecnológico adoptado.
Esta descripción general y, para los conocedores, las palabras XSD y JSON Object, es suficiente para comprender el enorme potencial asociado con los metadatos. Si es relativamente fácil imaginar un sistema basado en datos, no es tan fácil pensar en el uso de metadatos para tomar decisiones. La imaginación, sin embargo, puede tomar una forma precisa si se apoya en un ejemplo práctico. Supongamos, hipotéticamente, que en algún lugar del mundo hay una epidemia fuera de control y que este fenómeno se mide a través de un método científico riguroso que detecta el número y la dinámica de infecciones y muertes. Supongamos que, a través de estos “números”, existe un alto riesgo de contagio en los restaurantes y que los restaurantes son frecuentados principalmente por un segmento específico de la población compuesto por hombres mayores de 70 años.
Para reducir los riesgos, se podría pensar en cerrar los restaurantes, o en negar la entrada a personas indulgentes y propensas a comer. En el primer caso, se necesitarían metadatos a través de los cuales describir principalmente las actividades económicas, con el fin de identificar las empresas que se ocupan del suministro de alimentos y bebidas. En el segundo caso, se necesitaría un archivo de la población del que extraer una lista de nombres a los que enviar el mensaje “No hay entrada a restaurantes”. En ambos casos, se necesitarían metadatos descriptivos y estructurales de calidad para tomar una decisión. Este ejemplo, ciertamente un eufemismo, nos permite iniciar numerosas reflexiones sobre el papel de los metadatos. El cierre de los restaurantes, en el período de máximo riesgo de Covid, se decidió mediante la adopción de la clasificación estadística ATECO, que es un conjunto de clases y descriptores que identifican de manera más o menos precisa las actividades económicas que realizan las empresas. Pureza estadística ”De un sistema de clasificación, pero no se puede negar que el cierre de restaurantes estuvo guiado por metadatos. Del mismo modo, si se hubiera decidido prohibir el acceso a los restaurantes a un determinado segmento de la población, los metadatos habrían jugado un papel clave en la selección de las personas. Los dos escenarios resaltan aspectos que actualmente no forman parte del debate público: la gobernanza de los metadatos, la adopción de “lenguajes” compartidos para describir los datos, o de manera más general fenómenos científicos, y la calidad de los metadatos. La decisión de cerrar los restaurantes fue básicamente posible por una razón: todas las empresas tienen un código ATECO que hace referencia a un único sistema de clasificación compartido, por lo que fue relativamente fácil identificar las empresas con las que se asoció el código 56.10.11 - Catering con administración . La misma disposición podría haber sido inaplicable en un contexto en el que cada región había adoptado un sistema de clasificación diferente, quizás menos riguroso, y descontextualizado de las demás.
Quienes se ocupan de los metadatos son conscientes de las dificultades encontradas en la integración de diferentes bases de datos en las que, por ejemplo, el género se indica de manera diferente, H / F, Masculino / Femenino, 0/1, 1/2, o el territorio está codificado en la base de diferentes clasificaciones en términos metodológicos y temporales. Desafortunadamente, no siempre es posible construir un sistema de metadatos uniforme: a veces depende del cierre mental de los productores de datos con respecto al exterior, a veces de afirmaciones reales o presuntas de mayor (o menor) rigor científico de un conjunto de metadatos. en comparación con otras, otras veces por la adopción de procedimientos o series de tiempo que no se pueden interrumpir.
El uso compartido de metadatos de calidad está lejos de ser trivial y, a menudo, se ve obstaculizado por cuestiones políticas y no metodológicas. Si el ámbito de uso de los metadatos se limita al mercado laboral y las profesiones, surge un escenario desolador: por un lado está la clasificación internacional ISCO (International Standard Classification of Occupation), que sería muy adecuada para describir, con un Lenguaje compartido y de calidad, profesiones y su representación bajo múltiples vertientes, por otro lado existen intereses partidistas, castas, egocentrismos y escaso conocimiento del tema, que dificultan su aplicación. Como resultado, la contratación, particularmente en el sector público, ha sufrido una deficiencia estructural durante muchos años, en un momento en que no se puede pagar. Por esta razón, sería deseable que el tema "Metadatos, gobernanza, intercambio y calidad" se incluyera en la agenda del tema "Transformación digital".