ReOrc docs
Get ReOrc
简体中文
简体中文
  • 欢迎使用 Reorc
  • 设置与部署
    • 设置组织
    • 安装 Reorc-agent
  • 快速开始
    • 1. 添加连接源
    • 2. 创建项目
    • 3. 创建数据模型
    • 4. 验证数据处理流程
    • 5. 创建数据管道和调度任务
  • 连接
    • 目标数据库
    • 项目连接管理
  • 数据建模
    • 概述
    • 数据源
    • 模型
      • 宏
      • 物化
      • 模型配置
    • 字段列表
    • 数据血缘
    • 数据库特定配置
      • SelectDB(Doris)
  • 语义层建模
    • 概述
    • 语义层模型 (Cube)
      • 自定义维度
      • 自定义指标
        • 聚合计算函数
    • 语义层视图 (View)
    • 模型关系 (Relationship)
    • BI 接入方式
  • 数据摄入
    • 概述
    • 连接源类型
      • 从数据库获取数据
      • MySQL
      • SelectDB(Doris)
    • 数据转换(Transform)
  • 数据管道
    • 概述
    • 建模管道
    • 任务调度
  • 进阶用法
    • Jinja 模板
    • 变量
      • 系统内置变量
      • 项目内自定义变量
  • 健康监测
    • 数据管道健康
  • 资产管理
    • 元数据
    • 版本历史
    • dbt 包和项目依赖
  • 数据服务
    • 概述
    • 创建和编辑
    • 数据预览和下载
    • 权限管理
    • 开放 API
  • 数据安全
    • 数据脱敏
  • 设置
    • 组织设置
    • 项目设置
    • 个人设置
    • 角色和权限设置
Powered by GitBook
On this page
  1. 数据建模

概述

Recurve 数据建模简介

Previous项目连接管理Next数据源

Last updated 7 months ago

数据转换(ETL)是构建有效数据管道的关键步骤之一。在这个阶段,从集中式数据库或数据仓库加载的原始数据被转换成所需的结构和格式,以便分析师可以提取出符合业务需求的关键洞察。

现代数据转换工具通过将软件工程原则应用于分析领域,显著提升了这一过程的效率,如 (Data Build Tool) 。这些原则包括模块化 SQL 脚本编写、版本控制、验证以及与编排平台的集成。这种方法使得数据转换更加可靠且具有可扩展性。

Recurve 采用了开源 dbt 的最佳实践,并结合自身的设计元素进行优化,为用户提供了一个功能强大的数据转换工作空间,所有操作均在 数据建模 模块中完成。

组件

如果您之前使用过 dbt,Recurve 数据建模模块中的一些概念对您来说可能会比较熟悉。Recurve 利用了开源 dbt 的多种数据转换技术和组件,并通过直观的资产管理系统对它们进行了增强。

以下是一些操作指南,帮助您在 Recurve 中顺利开始数据建模。

  • (Sources):数据源是对数据库中的原始表或在其他项目中定义的模型的引用。这些数据源作为数据转换的输入。

  • (Models):用于处理数据、应用转换并输出结构化数据集的查询。Recurve 目前支持 SQL 语言编写的模型。

  • (Jinja templating):Jinja 是一种最初用于 Python 生态系统的模板语言。使用 Jinja,您可以在 SQL 转换中加入编程特性,如循环、变量和函数(或宏),从而增强 SQL 的灵活性。

  • (Data lineage):数据血缘提供了数据在各个转换过程中的可视化流向,从源头到目标。该功能帮助您了解转换如何影响下游输出。

  • (即将上线)数据测试(Data tests):数据测试是对项目中的模型和资源所设定的校验条件。通过这些测试,可以验证数据转换的准确性,确保模型输出结果符合预定义的标准。

dbt
数据源
模型
Jinja 模板
数据血缘