1.概述
通过关联度分析,可以分析元数据的重要程度,关联度(关联次数)越高的元数据重要程度越高。
元数据的关联度等于该元数据的被依赖次数,也就是说关联度反映了元数据的影响范围。它和影响分析的差异在于,关联度分析反映的是直接影响,而影响分析反映的是整个影响链条(直接影响+间接影响)。
关联度分析的应用场景有:
1)从各业务系统中采集上来的元数据繁多,短期之内难以完成全部的梳理工作,此时可根据依赖关系筛选出核心元数据,而后优先管理这部分数据,完善补充元数据信息,进行质量检查等。
2)当元数据需要变动时可通过关联度分析评估它的影响范围、重要程度,从而评估元数据变更的风险。
3)各业务系统中共享的数据往往存在一定依赖关系,通过关联度分析可反映出依赖度高的数据,以此作为参考有助于进行主数据的识别。
2.操作说明
2.1应用前提
维护好各元数据的依赖关系,从而保证分析的准确性与全面性。
2.2关联分析
在关联度分析中,选择最新元数据或定版元数据中需要分析的元数据,设置元数据类型(如表、字段)及TopN值(指仅查询关联度最高的前N项),点击关联度分析即可得出此元数据及下属元数据与其他元数据的关联度。
假设现需查找最新元数据abidb(元数据类型:库)中关联度高的字段型元数据优先进行元数据属性的补充。这里选择abidb作为分析对象,元数据类型设置为字段,TopN值不做要求,可得到如下分析结果。
分析发现,在abidb库中,BBQ_、id、DM_ID、BTYPE_等字段关联度较高。点击柱形图中的数据块或表格中的关联次数,可查看该元数据的关联详情。
上图关联详情中显示了与id字段有依赖关系的所有元数据。点击元数据代码,可查看对应元数据的详细信息,并对元数据信息进行编辑维护。
2.3保存分析结果
在关联分析界面中,点击右上角的保存按钮可将分析结果保存至我的分析中方便进行查看,支持自定义命名。
分析结果保存成功后,就能在我的分析中查看保存收藏的分析主题。
点击想要查看的分析主题即可查看对应的分析结果。
请先登录