smartbi元数据采集,可对smartbi的元数据进行血缘分析,知道库表的变动影响smartbi报表。
1. 准备工作
在Smartbi中进入系统运维页面,点击导出资源。
勾选需要采集血缘关系的自助ETL、数据集、业务主题、分析报表节点,需要同时勾选选择节点的所有父节点,直至勾选到第一级,点击确定。
xml文件下载到本地后,到睿治平台的系统设置-资源管理器中,建立一个文件夹,并将所有xml文件放到该文件夹下。注意在建立好的文件夹下直接放xml文件,不要继续嵌套文件夹。记录建立的文件夹路径,后面会用上。
2. 配置数据源和采集任务
在元数据-元数据采集-适配器管理中,需要先把分析血缘关系涉及到的数据库配置一下,这里以mysql数据库为例:
这里数据源挂载路径点击新建,每一个数据库都需要单独新建一个挂载点
这里元数据类型选择数据库包-关系型数据库包-目录
回到采集向导,将数据源挂载路径选择刚才新建的挂载点,然后下一步。
配置好数据源信息,然后下一步。
采集类型按需勾选,至少要勾选目录-库-表,如果用到了视图也需要勾选,然后下一步。
入库策略选全量入库即可,然后下一步。
计划任务可以设置一个任务执行时间,如果不需要自动执行,把启用关掉即可,然后点击完成。
在元数据-元数据采集-采集任务配置中,找到刚才创建的数据库采集任务,点击立即执行,将数据表信息采集过来。
任务执行完毕后,到元数据-元数据采集-入库审核中,通过刚才的采集任务。如果涉及到多个数据库,需要重复操作。
回到元数据-元数据采集-适配器管理,页签选择报表工具,创建一个Smartbi采集适配器。
需要新建一个挂载点,这里的元数据类型选择Smartbi包的SMARTBI。
数据源挂载路径选择刚才新建的挂载点,然后下一步。
这里需要配置两个参数,其中mountParams为数据连接与挂载点对应关系,
格式:smartbi数据源1的节点ID=数据源1对应的挂载点ID;smartbi数据源2的节点ID=数据源2对应的挂载点ID。
其中smartbi数据源的节点ID在smartbi的数据连接菜单中,找到对应数据源,点击属性,取其中的节点ID;挂载点ID为该数据源之前新建挂载点时对应的元数据ID,在元数据-元数据管理-最新元数据中可以查看,不是smartbi挂载点;smartbi数据源的节点ID和挂载点ID之间用=衔接,存在多组数据时,使用;分隔。
示例:DS.yw1=686a5ec21c57469f948b9a0983adce97
xmlPath为资源管理器xml文件存放路径,配置之前建立的文件夹路径即可,例如/smartbipath,然后下一步。
入库策略选全量入库即可,然后下一步。
计划任务可以设置一个任务执行时间,如果不需要自动执行,把启用关掉即可,然后点击完成。
在元数据-元数据采集-采集任务配置中,找到刚才创建的smartbi采集任务,点击立即执行。
任务执行完毕后,到元数据-元数据采集-入库审核中,通过刚才的采集任务。
在元数据-元数据管理-最新元数据中,即可看到效果
3. 形成依赖关系
可形成以下几种依赖关系:
1、源表 -> 自助ETL -> 目标表 -> 业务主题 或 数据集 -> 报表分析
2、目标表字段 -> 业务对象字段 -> 分析报表字段
3、目标表字段 -> 分析报表字段
4、数据集字段 -> 分析报表字段
在元数据-元数据管理-最新元数据中,即可看到效果,可选择一个节点,点击血缘分析。
请先登录