数据整合- 亿信华辰文档中心 -全面系统的学习资料和使用教程，在线知识中心

亿信华辰文档中心>> 百科分类 >> 亿信ABI >> 5.6.1 >> 数据整合

创建词条 "数据整合" 分类下的词条该分类下有36个词条

HTTP接口组件&WebService接口: 词条创建者:wxw 创建时间:09-10 10:15 编辑:0次 | 浏览:180次; 标签:; 摘要: 1.HTTP 接口组件1.组件介绍可调用数据源管理页面的接口数据源下的http格式的接口，读取接口返回结果，将结果保存到临时表的一个字段中，供后置组件使用。数据源：选择数据源下的一个接口数据源[阅读全文:]

HDFS组件: 词条创建者:wxw 创建时间:09-10 09:52 编辑:0次 | 浏览:152次; 标签:; 摘要: 1.HDFS文件输入组件hdfs输入组件是一个将hdfs服务器上的文件或压缩文件解析以供后续组件使用，从文本文件中读取数据到任务中，和表输入组件一样作为输入端。与平面文件输入不同的是hdfs文件输入组件[阅读全文:]

Hadoop文件输入组件: 词条创建者:wxw 创建时间:09-10 09:50 编辑:0次 | 浏览:125次; 标签:; 摘要: 1.概述Hadoop文件输入组件可将本地文本文件输出到Hadoop目标表，如cdh、impala、petabase等Hadoop文件输入组件，文件设置页面：源文件路径：配置产品服务器得文件路径。列分割符[阅读全文:]

Hadoop输出组件: 词条创建者:wxw 创建时间:09-10 09:50 编辑:0次 | 浏览:166次; 标签:; 摘要: 1.概述将经过数据交换etl处理后的数据保存到大数据库impala或petabase等库中，和表输出组件一样作为输出端。 用户使用Hadoop输出组件，选择Hive和对应的表并选择不存在则创建[阅读全文:]

Hadoop迁移组件: 词条创建者:wxw 创建时间:09-10 09:49 编辑:0次 | 浏览:178次; 标签:; 摘要: 1.概述用户可以通过Hadoop迁移组件将关系型数据库中的数据批量导入到impala或petabase、hive等库中。2.操作步骤前置条件：用户已部署HDFS服务器。操作入口：【任务管理>任务定[阅读全文:]

Greenplum装载组件: 词条创建者:wxw 创建时间:09-10 09:48 编辑:0次 | 浏览:215次; 标签:; 摘要: 1.组件介绍通过创建外部表方式读取第三方文件，将大数据量的表数据抽取到Greenplum目标库中。 Greenplum装载组件的目标设置中：1.协议选项，下拉框有gpfdist和file协议，[阅读全文:]

Greenplum卸载组件: 词条创建者:wxw 创建时间:09-10 09:46 编辑:0次 | 浏览:162次; 标签:; 摘要: 1.概述数据交换组件支持Greenplum数据库表导出为文本文件。通过该方式可有效的提高Greenplum数据库的数据交换的效率。2.操作步骤前置步骤：1.Liunx服务器或者windows服务器已部署[阅读全文:]

大数据引擎: 词条创建者:wxw 创建时间:09-10 09:45 编辑:0次 | 浏览:209次; 标签:; 摘要: 批处理与交换任务部分组件支持spark大数据处理引擎，使用该引擎能够有效得提升海量数据的数据传输与数据处理的效率。用户新建批处理任务或者交换任务后，执行任务时选择Spark引擎作为计算引擎，程序将自动的[阅读全文:]

循环节点组件: 词条创建者:wxw 创建时间:09-10 09:44 编辑:0次 | 浏览:185次; 标签:; 摘要: 1.组件介绍ETL任务流升级改造为调度平台后，去掉了任务循环功能，在ETL组件得流程组件中新增循环节点组件，实现数据处理的循环和遍历功能。循环节点组件支持对ETL任务中支持现有组件得嵌套。基本配置：循环[阅读全文:]

文件生成组件: 词条创建者:wxw 创建时间:09-10 09:42 编辑:0次 | 浏览:228次; 标签:; 摘要: 交换任务-文件传输组件新增一个文件生成组件。支持将表字段类型为大字段和二进制类型的数据输出为文件，每一行生成一个文件。输出支持文本、excel文件、图片、视频等。后缀支持：txt、doc、docx、js[阅读全文:]

共36条 ‹‹123 4 ››