亿信ABI

当前版本：5.6.1

产品认识

产品部署

数据源

创建数据源

数据库管理

数据整合

ETL任务管理

创建ETL任务

实时任务

发布ETL任务到运行区

批处理及交换组件使用参考

拉链表组件

存储过程组件

行更新组件

JSON解析组件

Xml解析组件

快速装卸组件

输入输出组件

批量交换组件

文件生成组件

循环节点组件

大数据引擎

Greenplum卸载组件

Greenplum装载组件

Hadoop迁移组件

Hadoop输出组件

Hadoop文件输入组件

HDFS组件

HTTP接口组件&WebService接口

JSON生成组件

ORACLE装卸载组件

参数赋值组件

分支组件

路由组件

检验组件

文件传输代理组件

Mongodb组件

redis输入组件

主题表输出组件

列转行组件

行转列组件

实时组件使用参考

KAFKA生产消费组件

实时CDC日志单表同步组件

边缘采集组件

了解数据整合

ETL任务设计器界面功能介绍

调度平台

ETL任务流设计界面功能介绍

ETL任务流设计器界面功能介绍

控制策略

条件执行

并发执行

分布式执行

血缘分析

任务流调度管理

创建和监控调度

调度补发执行

度优先级

调度重试执行

实时调度管理

事件管理

库表事件

文件事件

任务调度参数设置

任务流调度绑定事件

事件处理日志

创建ETL任务流

创建变更检测任务

发布ETL任务流到定版任务流

监控中心

数据集

主题域&主题集

创建主题域&主题集

公共维表

设置主题集属性

主题表

根据数据库表新建主题表

新建SQL语句主题表

新建虚拟主题表

新建自定义主题表

批量复制主题表

根据Excel，TXT，CSV，DB新建主题表

根据ETL新建主题表

根据接口数据源新建主题表

新建高速主题表

维表

新建单级维

新建代码层级维

新建通用维

新建螺旋维

新建SQL维

维表数据更新

了解主题域&主题集&维表&主题表

指标管理

报表分析

报表分析入门

了解报表

报表设计器界面功能介绍

浮动分析表制作

固定分析表制作

嵌套浮动和交叉浮动

报表属性设计

浮动维属性设置

过滤条件与数据期条件

报表水印设置

图像表元

条形码、二维码表元

报表参数

各种参数使用

参数属性说明

统计图&地图

了解统计图

统计图制作

统计图钻取

常用统计图举例-仪表盘

常用统计图举例-流向图

常用统计图举例-力导向图之关系网络图

常用统计图举例-全距图

常用统计图举例-K线图

常用统计图举例-矩形树图

了解地图

地图制作

Gis地图制作

其他组件

布局组件

文本组件

图片组件

Tab页与图表置换组件

树组件

卡片组件

指标数

子窗口组件

轮换组件

钻取

了解钻取

跳转式钻取

折叠式钻取

逐级式钻取

嵌入式钻取

菜单式钻取

外链式钻取

热区式钻取

浮动式钻取

对话框式钻取

组合式钻取

万能式钻取

常用函数

求序号

od函数

同环比函数

dim函数

diminf函数

if表达式

mkfilter函数

图表分析入门

领导驾驶舱制作

其他功能

列头排序

敏捷分析

敏捷看板操作流程指引

制作敏捷看板-新建数据集

制作敏捷看板-制作图表

制作敏捷看板-设计看板

制作敏捷报表

自定义敏捷看板组件

自定义敏捷看板组件-统计图组件

富文本

酷屏报表

了解酷屏

酷屏设计器界面功能介绍

制作酷屏报表

新建酷屏组件

如何使用全局资源

如何使用酷屏模板

3D模型组件

报告分析

了解图文报告

Word分析报告制作

WPS分析报告制作

幻灯片分析报告制作

分析报告宏表达式

表单应用

表单设计

表单入门

新建表单

移动表单

表单主题域、表单主题集

各种组件

栅格布局

标签页组件

分割线组件

表格组件

文字组件

数字组件

单行输入框

多行输入框

单选框组

复选框组

下拉框组件

下拉复选框

日期时间组件

按钮组件

图片组件

文件组件

地址组件

常用功能

公式编辑

关联显示

取数设置

审核公式

免登录填写

其他表单属性

取自增行中指定行数据-EATH、ETAC函数

获取登录者信息-logininfo函数

表单diminf函数

表单填报

数据管理

表单权限

表单配置

规则管理

组件库

已有信息

工作流

了解工作流

工作流设计器界面功能介绍

工作流制作与应用1

工作流制作与应用2

工作流组件

常用属性

门户

了解门户

门户设计器

根据门户模板制作门户

用户权限

了解用户权限

机构用户管理

角色管理

权限设置

库表设置

高级设置

免登录设置

常用场景权限设置

多租户

SM4加密

密级管理

三权分立

UKEY登录

秘钥管理

用户注册

系统设置

参数配置-线程池设置

企业消息集成-发件邮箱配置

企业消息集成-手机短信服务商配置

计划任务-报表计算

其他系统设置

移动端

移动端总体介绍

创建移动应用

移动端访问

如何制作适应移动端展示的报表模板

如何制作适应移动端展示的敏捷看板

与微信服务号集成

与企业微信配置

与钉钉配置

与飞书配置

运营监控

Hadoop文件输入组件

顶(0) 分享评论(0) 编辑

分享到 腾讯微博开心001 人人网新浪微博 QQ空间微信印象笔记

1.概述

Hadoop文件输入组件可将本地文本文件输出到Hadoop目标表，如cdh、impala、petabase等

Hadoop文件输入组件，文件设置页面：源文件路径：配置产品服务器得文件路径。列分割符，文件中用于进行列分割得符号。

Hdfs临时文件设置：Hdfs地址：数据源中配置得hdfs数据源。临时文件路径：文件传输过程中会在hdfs服务器上产生文件，该路径配置临时文件存放得路径。

字段列表页面选择数据源中的连接池即可，此处仅支持选择cdh、impala、petabase等大数据库，且连接池信息必需与文件设置中hdfs 数据源为同一套环境，否则执行会报错。

2.操作步骤

前置步骤：

1.产品工作目录中存放/workdir/lib/edi/hadoop 路径下放入对应的hadoop依赖jar。（需根据不同的大数据库存放对应的依赖jar包）。

2.数据源中新建大数据库连接池以及对应的hdfs数据源。大数据库必须与hdfs数据源为同一套环境。

某项目有100w数据需要写入到pb大数据库中，使用传统的表输入-表输出性能无法满足需求，故需要通过hadoop文件输入组件来提高数据传输的效率。

进入ETL任务设计页面，拖入表输入、平面文件输出、hadoop文件输入组件。

表输入组件选择100w数据的表，输出成文件，存储在服务器端。

Hdfs文件输入组件，选择对应的pb库与hdfs数据源。配置完成后，执行任务即可。

可以发现从关系型数据库到文件到pb库100w数据仅需1分钟多即可完成数据传输，相较于传统的表输入-表输出，传输效率上有很大的提升。

文档内容仅供参考
如果您需要解决具体问题，还可以登录亿信社区
在提问求助板块提问，30分钟内帮您解决问题

如果您认为本词条还有待完善，请编辑

上一篇Hadoop输出组件

下一篇HDFS组件

还有问题没解决？去亿信社区求助大神吧进入社区 >

请先登录

创建词条

全部产品

产品版本