摘要: 用于执行Python语言脚本检查数据,通过Python脚本来判断数据的正确性,并返回检查结果。Python检查规则依赖应用服务器下的Python,需要保证其服务下有安装python环境,且安装了JayD[阅读全文]
摘要: 用于执行R语言脚本检查数据,通过R脚本来判断数据的正确性,并返回检查结果。脚本代码:需要执行的R脚本代码。 在弹出的对话框内输入R脚本。前置条件:配置R服务器,使用R脚本检查时,需要在资源管理器中/ro[阅读全文]
摘要: JAVA脚本用于执行JAVA脚本检查数据:可按需定义执行条件与逻辑,调用系统 API 处理复杂业务场景,灵活满足内置规则无法覆盖的自定义数据质量检查需求。复杂业务场景用内置规则无法准确检查,为准确检查数[阅读全文]
摘要: 数据集检查用于检查当前事实表的结果与另外一个结果集的数据是否一致:检查不同来源或版本的数据集是否遵循一致标准,识别差异问题,保障数据集合逻辑与属性的协调性。数据集检查仅返回是否一致这个结果,不返回具体明[阅读全文]
摘要: SQL脚本用于执行SQL检查数据:满足企业复杂数据质检需求,应对标准化规则难以覆盖的定制化、多源关联校验场景。依托 SQL 的灵活查询与计算能力,支持用户自定义脚本,实现个性化业务逻辑校验,填补通用规则[阅读全文]
摘要: 平衡性检查用于检查数据的误差是否在允许范围内:核心通过计算左右两侧表达式数值,校验其差值是否处于允许范围,属于准确性检测范畴。可验证数据间关联平衡逻辑,识别数值失衡问题,保障数据逻辑一致性。左值表达式:[阅读全文]
摘要: 离群值检查用于检查数据中有一个或几个数值与其他数值相比差异较大:旨在识别显著偏离数据集整体分布的异常数据。其支持拉依达法、格鲁布斯法等算法,通过界定合理数值范围,标记超出范围的极端值,可规避异常数据对后[阅读全文]
摘要: 引用完整性检查用于检查相对比招表数据是否有效:核心校验目标字段数据是否存在于比照表中,即子表外键值需匹配父表主键值或为 NULL,可识别悬空外键,防止无效数据产生,维护表间关联逻辑一致。检查字段设置:选[阅读全文]
摘要: 记录缺失检查用于检查相对比照表数据的完整性:自动比照表字段与目标字段,检查表的检查字段与对照表的对照字段的数据量、数值必须完全一样,精准识别数据缺失情况,并生成详尽报告,助力企业及时发现数据缺失问题,保[阅读全文]
摘要: 及时性检查用于检查数据上报的及时性,确保数据上报“零迟到”的核心机制:它依据业务定义的时效窗口,实时对比每条记录的上报时间与期望到达时间,一旦延迟超阈值即触发告警、拦截或补录,从源头杜绝“数据迟到”导致[阅读全文]
摘要: 重复数据检查是检查一张表内的重复数据。确保主数据唯一、指标可信的关键防线:它以唯一键、模糊匹配和归并规则为基准,实时或离线识别并消除“同一实体多次记录”带来的冗余与失真,从源头阻断虚高统计,提升数据一致[阅读全文]
摘要: 逻辑检查是多个指标的逻辑检查,确保数据一致性、合理性和业务有效性的关键环节。它通过预定义的逻辑规则,对数据之间的内在关系进行验证,识别不符合业务逻辑或数据关系的问题,从而提升数据的可靠性和可用性。检查公[阅读全文]
摘要: 波动检查用于检查指标值的波动范围是否在某个区间之内,检查维度包括有同比波动和环比波动,所以波动检查的检查表必须配置数据期字段和关键字字段。其中关键字是同一数据期内唯一标识一行数据的字段,需要保证该期数据[阅读全文]
摘要: 规范检查用于检查用于检查字符型字段的格式是否规范,支持身份证、手机号码、邮箱、日期等多种数据类型的检测。检查字段下拉框仅展示字符串类型的字段,会自动过滤数值型、时间型字段。选择完字段后点击【设置规范类型[阅读全文]
摘要: 检查目标字段是否在某个取值范围内,目标字段可以为数值型、字符型、日期型。当检查字段是数值型时值域范围支持通过定义各种数值区间来定义。()小括号是开区间,[]中括号是闭区间,区间内的空值表示无穷大或无穷小[阅读全文]
摘要: 空值检查规则用于检查字段是否为空,为空则会被质检为错误数据。检查表:选择规则作用的检查表。 检查字段设置:设置规则所检查的字段。点击“下三角”展开下拉组件,展示该主题表的所有字段,用户只需单击选中字段。[阅读全文]
摘要: 1. 单条新建在数据质量模块的质量模型管理左树上,找到对应质量模型并点击展开,选择【规则库】-【新建】,点击【单条新建】即可进入新建页面平台内置16种不同的质检规则,每个规则都有简单的使用场景[阅读全文]
摘要: 基于AI模型自动识别数据特征,结合数据标准模块定义的标准生成符合质量要求的业务规则,再利用内部规则库和函数库生成实际执行的技术规则,并支持根据当前的技术规则对检查表数据进行预检查,智能向导式的完成检查数[阅读全文]