睿码主数据

当前版本：2.7.3

产品认识

主数据产品介绍

主数据模型

模型管理

模型分类

创建模型

BOM模型

视图管理

新建视图

编辑视图

编码与分类

版本管理

标准同步

表单设计

了解表单设计

字段属性

输入方式

计算表达式

可编辑

可见

默认值

取上一页值

过滤条件字段

值域过滤

所属分组

是否可为空

是否可修改

数据展示形式

前置符号

后置符号

单位枚举值

单位可为空

格式校验

数据填写提示

表单属性

外观设置

校验设置

添加视图

添加字段

视图排序

接口取数

表单预览

表单版本管理

分类树表单设计

审批流程

编码规则管理

模型库

主数据维护

主数据查询

切换视图查询

查看主数据

查看主数据操作日志

查看主数据数据版本

导出主数据

主数据分发

分类树主数据查询

复制主数据

主数据申请

新建主数据

提交主数据

导出数据

批量审核

删除主数据

批量导入图片文件

主数据变更

单一数据变更

批量数据变更

变更状态

提交主数据

复制主数据

导出主数据

主数据变更操作日志

主数据变更数据版本

主数据移动

主数据变更增量全量导入

主数据分析

主数据接口

扩展视图数据删除接口

扩展视图数据修改接口

主数据表单定义接口

主数据查询接口

主数据冻结接口

主数据解冻接口

主数据模型接口

主数据批量查询接口

主数据批量查询接口(带查询结果总数)

主数据申请接口

主数据申请接口(bom模型)

主数据申请接口(单一视图)

主数据审批状态同步接口

主数据失效接口

主数据视图接口

主数据校验接口

主数据修改接口

主数据分发

分发配置

新建分发配置

绑定调度

调度管理

分发监控

分发任务

分发调度

数据集成

了解数据集成

数据源

连接池管理

文件数据源

接口数据源

第三方数据源

FTP服务器

文件传输代理

kafka数据源

HDFS数据源

MongoDb数据源

数据集

了解数据集

主题表&主题集

创建主题域&主题集

创建主题域

创建主题集

公共维表

主题表

根据数据库表创建主题表

根据数据标准创建主题表

设置表关联关系

维表

新建单级维

新建代码层级维

新建通用维

维表数据更新

数据整合

任务设计器界面功能介绍

ETL任务设计器界面功能介绍

菜单栏

组件区

编辑区

日志区

ETL任务管理

发布/导入ETL任务（ETL任务流）到运行区

新建ETL任务

新建实时任务

批处理及交换组件使用参考

拉链表组件

存储过程组件

行更新组件

JSON解析组件

Xml解析组件

快速装卸组件

输入输出组件

批量交换组件

文件传输组件

循环节点组件

大数据引擎

Greenplum卸载组件

Greenplum装载组件

Hadoop迁移组件

Hadoop输出组件

Hadoop文件输入组件

HDFS组件

HTTP接口组件&WebService接口

JSON 生成组件

ORACLE装卸载组件

参数赋值组件

分支组件

路由组件

检验组件

文件传输代理组件

Mongodb组件

redis输入组件

主题表输出组件

列转行组件

行转列组件

实时组件使用参考

KAFKA生产消费组件

实时CDC日志单表同步组件

边缘采集组件

调度平台

任务流设计器界面功能介绍

ETL任务流设计器界面功能介绍

菜单栏

组件区

编辑区

日志区

控制策略

条件执行

并发执行

分布式执行

血缘分析

任务流调度管理

创建调度

运行监控

调度补发执行

度优先级

调度重试执行

了解任务流调度管理

实时调度管理

实时调度

事件管理

库表事件

文件事件

任务调度参数设置

任务流调度绑定事件

事件处理日志

变更检查管理

创建变更检测

监控中心

首页

总体调度统计

创建ETL任务流

主数据治理

数据标准

了解数据标准

数据标准检索

数据标准管理

新建标准集

编码规则

新建标准

标准发布审批

标准文档管理

配置管理

新建等价评估配置

数据质量

数据质量介绍

创建质量模型

新建质检规则

质检规则通用设置说明

创建和执行质检方案

质量监控和智能修复

数据整改

质检结果表

评分卡

自定义质量分析报告

门户管理

了解门户管理

创建门户

流程管理

流程设置

编码规则维护审批

数据维护审批

数据标准评审

数据整改审批

用户注册审批

模型维护审批

流程委托转办设置

查询统计

我的流程

用户权限

机构管理

用户管理

角色管理

权限设置

库表配置

高级配置

免登陆设置

密钥管理

常用权限场景

IP接口管理

系统管理

国际化

系统国际化

数据国际化

数据消息通知

手机消息通知配置

邮件消息通知配置

企业微信消息通知配置

钉钉消息通知设置

飞书消息通知配置

站内信

第三方存储

了解数据分析

密级管理

系统连接池

产品注册

资源管理器

日志

计划任务

性能与维护

数据分析配置

Hadoop迁移组件

顶(0) 分享评论(0) 编辑

分享到 腾讯微博开心001 人人网新浪微博 QQ空间微信印象笔记

1.概述

用户可以通过Hadoop迁移组件将关系型数据库中的数据批量导入到impala或petabase、hive等库中。

2.操作步骤

前置条件：用户已部署HDFS服务器。

操作入口：【任务管理>任务定义>新建批处理任务>大数据组件】

1）新建Hadoop迁移组件

打开任务编辑器，左侧组件面板中找到大数据分组栏，选择Hadoop迁移组件拖拽到右边编辑区域。

2）界面设置

双击Hadoop迁移组件，打开源设置界面，选择源库表

切换到目标设置界面，设置组件信息，点击确定。

界面设置说明：

目标连接池：只列出impala或hive类型的库。

表名前缀：源表迁移到目标连接池时所生成的表名前缀。

数据写入时覆盖：该选项对已存在的表生效。勾选，则会覆盖已经存在的数据；否则，只是简单的追加，不做重复性校验。

HDFS地址：目的连接池所在服务器上的HDFS对应地址，默认是127.0.0.1:8020。

HDFS临时目录：指定源表的数据写入到hdfs上时的临时目录，如果是不存在的目录（因为最终在目标库中生成表时，会将该数据文件从临时目录下移到表数据文件在系统中的默认路径下，一般默认是/user/tmp）

文件格式：支持TXT和PARQUET两种格式，TDH环境只支持TXT方式，其他环境：如CDH，则使用PARQUET。

压缩方式：TXT文件默认不压缩，PARQUET文件支持几种常用的压缩方式：不压缩(默认)、SNAPPY、GZIP。

3.注意事项

1.因为HDFS文件的操作涉及到权限的问题，所以对于HDFS临时目录的选择需要注意，如果在组件执行过程中报权限的错（Permission denied），需要修改目录（该目录的权限最好为777）。

2.对权限的理解详参考： http://hadoop.apache.org/docs/r1.0.4/cn/hdfs_permissions_guide.html以及http://www.cnblogs.com/webnote/p/5734714.html

3.HDFS临时目录可以指定一个不存在的目录，系统会自动创建该目录。但因为子目录的权限会继承父目录的权限，且由于上述所述权限问题，故最好满足父目录的权限为777。

4.Hadoop迁移组件支持将原表字段注释输出到目标表，详情见批量交换到表组件。

文档内容仅供参考
如果您需要解决具体问题，还可以登录亿信社区
在提问求助板块提问，30分钟内帮您解决问题

如果您认为本词条还有待完善，请编辑

上一篇Greenplum装载组件

下一篇Hadoop输出组件

还有问题没解决？去亿信社区求助大神吧进入社区 >

请先登录

创建词条

全部产品

产品版本