1.概述
采集元数据,分为两步,第一步配置数据源和采集任务,第二步执行采集任务进行采集。对于第一步可以通过【适配器管理】中的采集向导快速完成数据源和采集任务创建;也可以分步进行,先在【数据源管理】中创建数据源,然后在【采集任务配置】中创建采集任务。
本文将使用采集向导完成采集配置,通过采集mysql库中元数据讲解元数据的采集。
2.操作步骤
2.1配置数据源和采集任务
登录睿治后,在【元数据】模块,选择【元数据采集】。
在适配器管理界面,可以看到采集元数据的各种方式。MySQL属于关系型数据库,点击选择【关系型数据库】,可以看到【MySQL采集适配器】。
鼠标移动到【MySQL采集适配器】,会显示添加图标。
点击添加,进入采集向导。
在采集向导中,填写数据源名称,并选择是否需要审核,此处选择“否”(审核选择“是”,则所有的采集数据均需要做入库审核);适配器、工具版本、采集模式默认即可;数据源挂载路径若没有,可选择【新建】。
在跳转的新页面中,选择新建元数据。
元数据代码、名称根据需求命名;元数据类型,在下拉框中选择: 数据库包-关系型数据库包-目录。
完成新建元数据挂载点后,返回采集向导数据源配置界面,先点击刷新,再选择刚刚新建的数据源挂载路径,点击【下一步】。
在数据源参数配置中,配置数据库的url、用户名、密码;配置完成,可点击连接测试,测试成功才能正常采集元数据。最后两项选择“是”,可获取库表注释信息。完成后,点击【下一步】。
按需选择入库策略和是否自动发布,这里入库策略选择“全量”,自动发布选择“否”。设置完成后,点击【下一步】。
1)入库策略 全量:删除挂载点下多余元数据,添加缺少元数据,更新不一致元数据。 增量:保留挂载点下多余元数据,添加缺少元数据,更新不一致元数据。 保守更新:保留挂载点下多余元数据,添加缺少元数据,更新不一致元数据,但这里的更新是:采集到的元数据名称或属性不为空时,才将非空值更新到已有元数据。 激进更新:删除挂载点下多余元数据,添加缺少元数据,更新不一致元数据,但这里的更新是:采集到的元数据名称或属性不为空时,才将非空值更新到已有元数据。 注:元数据代码和路径相同则认为是相同元数据。 2)自动发布 否:是指采集入库后只进入最新元数据。 是:是指采集入库后进入最新元数据且自动发布为定版元数据。 |
最后配置计划任务,填写计划任务名称,设置计划任务执行的周期。若勾选启用,计划任务会根据配置定期自动执行。也可以手动执行计划任务。点击【完成】,数据源和采集任务创建完毕。
创建完成后,在【数据源管理】中可查看、修改该数据源信息。
在【采集任务配置】中可查看、修改该采集任务设置。
2.2执行采集任务
切换到【采集任务配置】模块,找到之前创建好的计划任务,点击【立即运行】,即可开始元数据的采集。
在弹出的窗口中可以看到采集任务执行进度。
采集任务执行完成后,点击采集任务名称可查看执行日志。也可以在【采集日志】模块查看执行日志。
采集成功后,在【元数据】-【元数据管理】-【最新元数据】中可查看采集到的元数据。
如果数据源中设置了入库审核,则入库审核通过后才会进入到最新元数据中。
请先登录