当前位置 博文首页 > weixin_ccjz9527的博客:用报告启动数据模型

    weixin_ccjz9527的博客:用报告启动数据模型

    作者:[db:作者] 时间:2021-07-05 21:57

    Repods是一个可以创建和管理数据单元的数据平台。 这些存储单元是紧凑的数据仓库,具有灵活的存储、虚拟存储、内存和所有必需的工具。 您可以管理个人数据项目,在私人团队中一起工作,或者在公共数据单元中就开放数据进行协作。

    在创建数据荚之前,了解我们所拥有的和分析所需的信息的范围是很重要的。 目标是创建一个 数据模型 这紧密地反映了主题领域的业务实体,而不关注如何创建报告,或者我们如何用给定的数据填充这个数据模型。 一个好的开始是回答以下问题:

    • 哪些商业实体与我感兴趣的领域相关?

    • 它们是如何定义的?

    为了写这篇文章,我们将考虑一个假设的工厂,它有生产汽水瓶的机器。 可用的数据与机器及其生产的产品有关。 在一个更现实的例子中,我们将考虑实体 机器制品,但是为了简单起见,我们正在创建一个单一的实体”生产*”代表我们工厂的日生产能力(这是*机器的关系制品)。

    我们有三个不同的数据源来提供关于 瓶子,标签,瓶盖 分别(每个来自单个文件)。 查看数据,我们可以看到所有的信息都已到位,可以实现我们的实体。

    以下步骤将是:

    1. 对实体建模,为每个实体创建表格
    2. 从源(原始文件)导入数据
    3. 创建数据管道,以填充创建的模型
    4. 从我们的模型中提取一些报告

    让我们记住这一点,开始我们的教程。

    在https://repod上创建帐户。io/en或登录(如果已经有)。 Repods允许我们创建、复制或修改现有的pod,以及搜索现有的公共pod或被邀请到私有或公共pod。 您也可以在https://repods上查看此pod的实时版本。io/markode/Soda瓶子sFactory

    在本教程中,我们希望通过点击 新豆荚:

    Figure 1. Adding a New Podcs