摘要: 1.HTTP 接口组件1.组件介绍可调用数据源管理页面的接口数据源下的http格式的接口,读取接口返回结果,将结果保存到临时表的一个字段中,供后置组件使用。数据源:选择数据源下的一个接口数据源[阅读全文:]
摘要: 1.HDFS文件输入组件hdfs输入组件是一个将hdfs服务器上的文件或压缩文件解析以供后续组件使用,从文本文件中读取数据到任务中,和表输入组件一样作为输入端。与平面文件输入不同的是hdfs文件输入组件[阅读全文:]
摘要: 1.概述Hadoop文件输入组件可将本地文本文件输出到Hadoop目标表,如cdh、impala、petabase等Hadoop文件输入组件,文件设置页面:源文件路径:配置产品服务器得文件路径。列分割符[阅读全文:]
摘要: 1.概述将经过数据交换etl处理后的数据保存到大数据库impala或petabase等库中,和表输出组件一样作为输出端。 用户使用Hadoop输出组件,选择Hive和对应的表并选择不存在则创建[阅读全文:]
摘要: 1.概述用户可以通过Hadoop迁移组件将关系型数据库中的数据批量导入到impala或petabase、hive等库中。2.操作步骤前置条件:用户已部署HDFS服务器。操作入口:【任务管理>任务定[阅读全文:]
摘要: 1.组件介绍通过创建外部表方式读取第三方文件,将大数据量的表数据抽取到Greenplum目标库中。 Greenplum装载组件的目标设置中:1.协议选项,下拉框有gpfdist和file协议,[阅读全文:]
摘要: 1.概述数据交换组件支持Greenplum数据库表导出为文本文件。通过该方式可有效的提高Greenplum数据库的数据交换的效率。2.操作步骤前置步骤:1.Liunx服务器或者windows服务器已部署[阅读全文:]
摘要: 批处理与交换任务部分组件支持spark大数据处理引擎,使用该引擎能够有效得提升海量数据的数据传输与数据处理的效率。用户新建批处理任务或者交换任务后,执行任务时选择Spark引擎作为计算引擎,程序将自动的[阅读全文:]