数据整合模块分为设计区和运行区。设计区中提供了ETL任务设计,支持ETL任务的分组分类、导入导出、创建删除、发布等基本操作。
运行区为正式ETL任务的执行区,运行区中的ETL任务由设计区发布而来
本文档是ETL任务的入门示例,希望大家通过这个示例理解ETL任务的制作步骤以及设计思路。下文我们以个人周报数据抽取为例,讲述ETL任务的制作步骤。
具体需求如下:
【个人周报表IGRZB_B0】中去掉“是否合计行”为1的数据,合计行为1代表是合计数据,我们需要保留明细数据,去掉合计行;去掉“参与任务”为空的垃圾数据,个人周报填写必须包含参与的任务。
完善个人周报信息,将【员工信息表FACT_YGXX】中的“所属部门”、“工作地点”等维度字段添加到个人周报信息中。
“参与任务”由任务编号+员工id组成,员工id位数固定为7位,例如01002.01060020007P000.1400003,01002.01060020007P000为任务编号,1400003为员工id。需要截掉后面的员工id,保留参与任务编号。
为不影响源表数据,需要把处理好的数据抽取到一张新数据表中。
附件:
图1 个人周报表表结构IGRZB_B0
图2 个人周报表部分数据
请先登录