(ISTATの公式であり、データ観測所の専門職とスキルのマネージャーであるAlessandroCapezzuoliによるAidr)メタデータについての話は常にほとんどありません。おそらく、接頭辞「メタ」がその元の意味(μετά「with、after」)と、その結果として形而上学や比喩などのエーテル的でとらえどころのない領域への概念の含意に関連付けられているためです。 おそらく、単語自体、メタデータは、ブロックチェーン、ビッグデータ、機械学習という単語ほど興味をそそるものではありません。 データを説明する情報であるメタデータに与えられる還元的な定義は、それらの機能を完全に理解するのに役立ちません。それは、データなしで実行できる、データの二次的なものを参照しているようです。 メタデータがないと、データはその意味を失い、一貫性がなくなり、正しく読み取ることができないという定義に追加する必要があります。
メタデータの機能を排他的に「説明的な」スコープに縮小することは、危険な過小評価です。 まず、記述機能はXNUMXつではなく、データに関連するコンテンツ、構造、コンテキストなど、いくつかの側面を参照するためです。 まさにこの理由から、単一のタイプのメタデータはありません。 正規化された説明のセットで構成される記述メタデータがあり、データの識別や、Linked OpenDataを利用するセマンティック検索システムで役立ちます。 一方、構造メタデータは、アーキテクチャと内部関係を記述し、データを正しく使用するために不可欠です。 次に、採用されたフォーマットや技術環境などの技術情報を含む管理メタデータがあります。
この一般的な概要、および内部関係者にとってはXSDとJSONオブジェクトという言葉は、メタデータに関連する大きな可能性を理解するのに十分です。 データ駆動型システムを想像するのが比較的簡単な場合、メタデータを使用して意思決定を行うことを考えるのはそれほど簡単ではありません。 ただし、実際の例でサポートされている場合、想像力は正確な形をとることができます。 仮に、世界のどこかで制御不能な流行があり、この現象は、感染と死亡の数とダイナミクスを検出する厳密な科学的方法によって測定されていると仮定します。 これらの「数字」を通じて、レストランに感染するリスクが高く、レストランは主に70歳以上の男性で構成される人口の特定のセグメントが頻繁に訪れると仮定します。
リスクを減らすために、レストランを閉店すること、または贅沢で個人を食べる傾向があることへの入場を拒否することを考えることができます。 最初のケースでは、飲食物の供給を扱っている企業を特定するために、主に経済活動を説明するためのメタデータが必要になります。 56.10.11番目のケースでは、「レストランへの入場はありません」というメッセージの送信先となる名前のリストを抽出するための人口のアーカイブが必要になります。 どちらの場合も、決定を下すには、質の高い記述的および構造的メタデータが必要になります。 この例は、確かに控えめな表現ですが、メタデータの役割について多くの考察を始めることができます。 Covidリスクが最大の期間におけるレストランの閉鎖は、ATECO統計分類の採用によって決定されました。これは、企業が実施する経済活動を多かれ少なかれ正確に識別する一連のクラスと記述子です。統計的純度」の分類システムですが、レストランの閉鎖がメタデータによって導かれたことは否定できません。 同様に、人口の特定のセグメントのレストランへのアクセスを禁止することが決定された場合、メタデータは個人を選択する上で重要な役割を果たしたでしょう。 XNUMXつのシナリオは、現在公開討論の一部ではない側面を引き出します。メタデータのガバナンス、データ、またはより一般的には科学的現象を記述するための共有「言語」の採用、およびメタデータの品質です。 レストランを閉鎖する決定は、基本的に理由で可能でした。すべての企業が単一の共有分類システムを参照するATECOコードを持っているため、コードXNUMXが関連付けられている企業を特定するのは比較的簡単でした。 。 同じ規定は、各地域が異なる分類システムを採用し、おそらくそれほど厳密ではなく、他の地域から非文脈化されている状況では適用できなかった可能性があります。
メタデータを扱う人は、たとえば、性別が異なって示されている、M / F、男性/女性、0 / 1、1 / 2、または地域が成文化されている、さまざまなデータベースを統合する際に遭遇する困難をよく知っています。方法論的および時間的用語でのさまざまな分類の基礎。 残念ながら、統一されたメタデータシステムを構築できるとは限りません。外部に対するデータプロデューサーの精神的な閉鎖に依存する場合もあれば、メタデータのセットの科学的厳密性が高い(または低い)という実際の主張または推定される主張に依存する場合もあります。他の場合と比較して、中断できない手順または時系列の採用による場合もあります。
質の高いメタデータの共有使用は些細なことではなく、政治的および非方法論的な問題によって妨げられることがよくあります。 メタデータの使用範囲が労働市場と職業に限定されている場合、暗いシナリオが発生します。一方では、国際標準職業分類ISCO(International Standard Classification of Occupation)があり、これを説明するのに非常に適しています。共有された質の高い言語、職業、および複数の側面でのそれらの表現は、一方で、党派的な関心、カースト、自我中心主義、および主題に関する知識の不足があり、それらの適用を妨げています。 その結果、特に公共部門での採用は、余裕がない時期に、長年にわたって構造的な欠陥に苦しんでいます。 このため、「メタデータ、ガバナンス、共有、品質」という項目を「デジタルトランスフォーメーション」というトピックの議題に含めることが望ましいでしょう。