1.概述
血缘分析是分析元数据的上游数据信息,用于追溯元数据的来源和加工过程。影响分析是分析元数据的下游数据信息,用于掌握元数据变更可能造成的影响。全链分析是血缘分析+影响分析,用于展现数据的来龙去脉。
比如,当前平台采集了数据采集系统的元数据、数据仓库的元数据、BI报表平台的元数据以及数据工厂(数据处理工具)的元数据。数据采集系统中的数据通过数据工厂抽取到了数据仓库中,BI报表平台则是基于数据仓库做分析展现。下面我们以“ABI_运营”下的“个人周报”主题表为例,具体看下血缘分析、影响分析和全链分析的使用和具体含义。
图1元数据
2.血缘分析
2.1使用
在【元数据】-【元数据管理】-【元数据分析】模块,选择【血缘分析】进入,选中ABI_运营下的个人周报主题表,然后点击血缘分析。
图2血缘分析
得到血缘分析结果如下:
图 3血缘分析结果
点击各节点中的倒三角可将元数据展开到更细粒度的级别展示。
图 4 血缘分析展开结果
由血缘分析结果,我们可以看到:个人周报主题表关联的是数据仓库中的FACT_GRZB表,数据仓库中的FACT_GRZB表由数据采集系统中的IGRZB_B0表通过数据处理任务job1644563399048加工得到。通过血缘分析,个人周报主题表的数据来源和加工过程一目了然。
点击【保存】可将分析结果保存到【我的分析】。
图5 保存结果
对于保存的结果,我们可以在【元数据】-【元数据管理】-【元数据分析】-【我的分析】里进行查看、重命名和删除等操作。
图 6 我的分析
2.2原理
血缘分析图中,元数据节点展开后显示的元数据是由元数据的组合关系决定。比如,公司运营展开后显示了个人周报,则说明公司运营这个元数据的组合中一定有个人周报。
图7 组合关系
元数据节点之间的连线则是根据元数据的依赖关系生成。元数据采集时会自动生成依赖关系,也可以手动维护依赖关联。比如,数据仓库中的FACT_GRZB表指向了ABI_运营中的个人周报主题表,也就是说个人周报主题表依赖于FACT_GRZB表,那么在个人周报这个元数据的依赖中一定有FACT_GRZB表。
图 8 依赖关系
3.影响分析
3.1使用
在【元数据】-【元数据管理】-【元数据分析】模块,选择【影响分析】进入,选中ABI_运营下的个人周报主题表,然后点击影响分析。
图9 影响分析
得到影响分析结果如下:
图 10 影响分析结果
我们可以看到:分析报表“test1”、“06迷你图”、“表3”等引用了个人周报主题表,也就是说个人周报主题表变更后可能影响这些分析报表。
3.2原理
同血缘分析。
4.全链分析
4.1使用
用以上同样的操作方法对个人周报主题表进行全链分析,得到下图中的结果。
图 11 全链分析结果
展开各节点,得到下图结果:
图 12 全链分析展开结果
可以看到全链分析是血缘分析+影响分析,元数据的来龙去脉都可以在这张图上得到展现:报表平台中的个人周报主题表关联的是数据仓库中的FACT_GRZB表,数据仓库中的FACT_GRZB表由数据采集系统中的IGRZB_B0表通过数据处理任务job1644563399048加工得到;而个人周报主题表被“test1”、“06迷你图”、”表3“等分析报表引用。
4.2原理
同血缘分析。
请先登录