睿码主数据
当前版本:2.6.1

了解主题域&主题集&维表&主题表

1.主题架构

服务器中可以建多个主题域,每个主题域下面又可以建多个主题集,主题集下面存放的是一批主题表和维表。

2.主题表

1) 概念

即事实表,由维度和指标组成。维度是描述事物的角度,如性别、地区等。指标是对事物数值型的描述,如金额、销量、工时等。一张主题表一般对应一张数据库表。

2) 作用

主题表是数据分析的数据来源,不管是报表分析还是自助分析都是从主题表取数。

3) 分类

主题表分为物理主题、虚拟主题、sql主题和接口主题。

物理主题,对应了一张数据库表或视图的主题表叫做物理主题。它是最常用的主题表类型。

虚拟主题,是根据其他主题表创建的主题表,它是将来自于不同主题表的指标和维度整合到一张主题表中。虚拟主题常用于自助分析中。

sql主题,根据一段查询sql创建的主题表叫做sql主题。创建sql主题时,需指定数据缓存方式,不缓存or缓存到内存or缓存到数据库。sql主题用于报表计算引擎不能解决的计算场景,比如复合olap分析,即在分组统计后的结果表上再次分组统计。

接口主题,用于从第三方的http接口获取数据。创建接口主题时,需指定数据缓存方式,不缓存or缓存到内存or缓存到数据库。但接口主题中的不缓存,仍会将数据缓存到内存,只是每次使用前读取数据到内存。

4) 创建入口

主题表创建入口如下:


其中物理主题提供了多种创建方式,如数据库表创建、自定义主题创建、批量复制创建、敏捷连接创建、从文件创建、ETL创建等。

为了提升大数据量下自助分析性能,创建主题表时可以选择保存为敏捷主题。创建入口有标志的表示可以保存为敏捷主题。保存为敏捷主题会将数据存储到系统的内置数据库中,可配置定时更新。

3.维表

1) 概念

维度表。一般是分层级的,如行政区划维分为省-市-县区,大学班级分为学院-系-班级。

2) 作用

主题表中维度字段,一般存储的是代码,类似01、02这种。维表则是对这些代码的描述,以及层级关系的维护等。有了维表才能更清晰的、不同层级的展示数据。

3) 分类

维表分为单级维、代码层级维、通用维和螺旋维。

单级维:数据都在同一级,呈线型。

代码层级维:数据分多级,呈树形,树形结构由id字段的分段决定。

通用维:数据分多级,呈树形,树形结构由多个属性字段指定。比如维表有3个层级,则有3个对应的属性字段存储每一层级的值。

螺旋维:当表中有3个字段,分别为维项的id,维项的名称name,维项的上级id,根据“上级id”可找出某一维项的上级节点,再根据“上级id”找到这个上级节点的上级节点,直到顶级节点,从而构建树。这种方式创建维叫做螺旋维。螺旋维最终会生成一个通用维。

4) 创建入口

主题域和主题集下都可以创建维表。主题域下创建的维表,该主题域下的所有主题集都可以使用这些维表。主题集下创建的维表,只供当前这个主题集使用。

在主题域创建维表入口如下:


主题集创建维表的入口:


4.主题集

主题集是多张主题表的集合。我们可以将相关的业务主题放在同一个主题集下进行分析。

一张分析表只能取同一个主题集下的主题表进行分析,分析表不能跨主题集取数。

5.主题域

主题域是多个主题集的集合。它为主题集提供挂载点。

附件列表

0

文档内容仅供参考
如果您需要解决具体问题,还可以登录亿信社区
在提问求助板块提问,30分钟内帮您解决问题

如果您认为本词条还有待完善,请编辑

上一篇创建主题域&主题集

下一篇创建数据源

请先登录