使用采集向导完成采集配置,通过采集mysql库中元数据讲解元数据的采集。
1. 配置数据源和采集任务
登录睿治后,在【元数据】模块,选择【元数据采集】下的【适配器管理】。
在适配器管理界面,可以看到采集元数据的各种方式。MySQL属于关系型数据库,点击选择【关系型数据库】,可以看到【MySQL采集适配器】。
鼠标移动到【MySQL采集适配器】,会显示添加图标。
点击添加,进入采集向导。
在采集向导中,填写数据源名称,并选择是否需要审核,此处选择“否”(审核选择“是”,则所有的采集数据均需要做入库审核);适配器、工具版本、采集模式默认即可;数据源挂载路径若没有,可选择【新建】。
在跳转的新页面中,选择新建元数据。
元数据代码、名称根据需求命名;元数据类型,在下拉框中选择: 数据库包-关系型数据库包-目录。
完成新建元数据挂载点后,返回采集向导数据源配置界面,先点击刷新,再选择刚刚新建的数据源挂载路径,点击【下一步】。
在数据源参数配置中,配置数据库的url、用户名、密码;可通过选择连接池下拉框选择连接池,适配的数据库连接池高亮显示,不适配的置灰显示,选择连接池后url、用户名及密码都会自动填入;配置完成,可点击连接测试,测试成功才能正常采集元数据。最后两项选择“是”,可获取库表注释信息。完成后,点击【下一步】。
采集类型配置界面,可设置采集的元数据类型,以及每类元数据的采集范围,页面默认全部勾选。具体使用章节见《采集任务配置》。
按需选择入库策略和是否自动发布,这里入库策略选择“全量”,自动发布选择“否”。设置完成后,点击【下一步】。
1)入库策略 全量入库:对比挂载点与采集源中的元数据,删除挂载点下多余元数据,添加缺失元数据,更新差异元数据;删除多余依赖关系,添加缺失依赖关系。 追加入库:对比挂载点与采集源中的元数据,保留挂载点下多余元数据,添加缺失元数据,保留差异元数据;保留多余依赖关系,添加缺失依赖关系。 保守入库:对比挂载点与采集源中的元数据,保留挂载点下多余元数据,添加缺失元数据,更新差异元数据(采集元数据标题或属性不为空时,才将非空值更新到已有元数据);保留多余依赖关系,添加缺失依赖关系。 激进入库:对比挂载点与采集源中的元数据,删除挂载点下多余元数据,添加缺失元数据,更新差异元数据(采集元数据标题或属性不为空时,才将非空值更新到已有元数据);删除多余依赖关系,添加缺失依赖关系。 注:元数据代码和路径相同则认为是相同元数据。 2)自动发布 否:是指采集入库后只进入最新元数据。 是:是指采集入库后进入最新元数据且自动发布为定版元数据。
|
最后配置计划任务,填写计划任务名称,设置计划任务执行的周期。若勾选启用,计划任务会根据配置定期自动执行。也可以手动执行计划任务。点击【完成】,数据源和采集任务创建完毕。
创建完成后,在【数据源管理】中可查看、修改该数据源信息。
在【采集任务配置】中可查看、修改该采集任务设置。
2. 执行采集任务
在【采集任务配置】模块,找到之前创建好的计划任务,点击【立即运行】,即可开始元数据的采集。
跳转到采集任务执行进度信息页面。
采集任务执行完成后,点击采集任务名称可查看执行日志。
也可以在【采集日志】模块查看执行日志。
采集成功后,在【元数据】-【元数据管理】-【最新元数据】中可查看采集到的元数据。
如果数据源中设置了入库审核,则入库审核通过后才会进入到最新元数据中
请先登录