睿治
当前版本:2.7.2

了解元数据

1.概述

元数据是描述数据特征的数据,是数据治理中各类数据管理活动的基础,用于描述、分析企业数据资产,助力理清数据的来龙去脉,进而挖掘出隐藏在资源中的价值。睿治元数据模块涵盖了元模型管理、元数据采集、元数据检索、元数据质量核检、元数据分析、数据地图等功能。

2.作用

理清数据字典,了解数据来龙去脉。

提高数据信息的传递性,减少重复工作。

通过平台丰富的元数据分析和核检功能,帮助企业追溯数据流向,快速定位问题数据并及时响应,降低数据管理和维护难度。

为数据治理、数据应用及数据服务夯实基础。

3.实施流程

4.名词解释

1) 元数据:元数据是关于描述数据的数据,即关于数据的内容、质量、状况和其他特性的信息。也可译为描述数据或诠释数据,提供了相应数据的上下文环境的描述信息;元数据是业务数据中心、数据仓库和数据分析等大型应用的基础设施。
2) 元模型:定义元数据的属性、关系的模型,元数据的采集需要依赖元模型。
3) 父子关系:子类元模型可继承父类元模型所有的属性,是将所有一类元模型将相同的属性抽取出来,形成一个父类元模型。例如:父类为哺乳动物,而人、猫、狗都是子类。
4) 组合关系:描述组合端模型由被组合端模型所组成,如:物理表模型是由字段模型组成,报表是由报表字段组成,主题域由维表和主题集组成。在元数据采集的过程中会根据采集挂载点的元数据对应元模型的组合关系来将所有元模型对应的元数据都采集过来。在元数据分析时,元数据节点展开后显示的元数据是由元模型的组合关系决定。
5) 依赖关系:描述模型与模型之间的引用关联关系,如:报表用到了主题表,则报表依赖主题表;视图用到了表,则视图依赖于表。各种分析出来的效果会根据元数据之间的依赖关系来进行连线。
6) 血缘分析:血缘分析是从某一个元数据作为起点,往回追溯数据处理过程。
7) 影响分析:影响分析是从某一个元数据出发,寻找依赖该元数据处理过程的元数据或者实体。
8) 全链分析:全链分析是以某个元数据为目标节点,其前后与其有关系的所有元数据,其前反应数据的来源,其后反应数据的处理过程。
9) 数据地图:以拓扑图的形式展现各类元数据或实体、数据处理过程元数据进行分层次的的图形化展现。

5.元数据检索

睿治元数据管理提供全文检索功能。支持对检索范围、检索类型、修改时间进行过滤;可保存常用的过滤条件,方便快速查找到常用的元数据。

在搜索框中输入需要查询的内容,比如搜索excel,系统将列出与excel相关的所有信息,通过这个搜索结果,可以对这个元数据进行定位以及分析的操作。凡是字体颜色为蓝色的中文或者数字都可以点击。

点击高级检索,系统将展示更丰富的搜索内容,可以对元数据范围、类型以及修改时间进行搜索。选择右侧的个人查询条件,可将这个用户的历史查询记录快速的回填到高级搜索中。在历史记录中可查询历史搜索记录。

附件列表

0

文档内容仅供参考
如果您需要解决具体问题,还可以登录亿信社区
在提问求助板块提问,30分钟内帮您解决问题

如果您认为本词条还有待完善,请编辑

上一篇数据建模

下一篇

请先登录