Deequ

Deequ

基于Spark的数据质量库

数据质量Spark集成约束验证

详细介绍

Deequ 是AWS开源的数据质量工具,通过Spark实现大规模数据的约束验证与指标计算。

功能特性

  • 单元测试模式
  • 自动指标生成
  • 异常警报

相关公司

AmazonNetflix

基本信息

分类:数据治理
当前版本:2.0.3
许可证:Apache-2.0

替代方案

  • Great Expectations
  • Griffin