数据库连接

数据库连接分为五个步骤:

  1. 选择连接器 ——选择需要连接的数据库类型;
  2. 选择账户——选择一个数据库连接账户;
  3. 数据库查询——填写SQL语句;
  4. 连接方式——选择数据库连接方式,数据更新周期以及增量更新等;
  5. 数据集信息——指定数据集的名称以及保存位置。

选择连接器

进入数据中心数据集页面,点击右侧“新建”按钮,选择“数据库”。创建数据库连接前,需要先选择一种数据库类型。观远数据目前支持的数据库类型包括:MySQL, PostgreSQL, Greenplum, SQL Server, Oracle, Presto, Amazon Redshift, MaxCompute, SAP HANA. 后续我们也会根据客户需求不断地添加新的数据库支持。

选择一种数据库连接器,进入到数据库连接配置界面。

选择账户

您可以选择一个已有的数据库连接账户,或者新建一个账户。数据库账户可以在数据中心—数据账户页面进行集中管理。

新建账户时,您需要提供数据库地址、用户名、密码、数据库名称、端口号等信息。测试连接成功后,便可以创建新的账户。

选完数据库连接账户后,点击下一步进入到数据库查询。

数据库查询

数据库查询界面如下:左侧为当前连接数据库中的数据表,选择数据表可快速输入SQL Query。您也可以根据自己的需要在中间“SQL Query”区域填写Query。

右侧为时间宏选择,可以在SQL中快速添加时间宏。观远数据的SQL时间宏,可以帮助您根据当前日期生成动态SQL,在定时刷新数据与增量更新时,非常有用。例如我们可以输入这样的SQL Query:

您也可以自定义时间宏,具体使用方式请阅读“卡片标题中的动态时间”。

预览数据成功后可进入到下一步。

连接方式

观远数据支持直连数据库与Guan-Index两种数据库连接方式。其中,Guan-Index为扩展功能,需要开通该功能请联系您的观远解决方案顾问。

  • 直连数据库
    选择直连数据库时,卡片数据将直接从数据库获得。您需要配置数据更新周期,以及选择是否支持实时卡片数据。

    • 设置数据更新周期的作用是,我们会定时更新与该数据集相关的所有卡片、卡片数据集、ETL、JOIN等的数据。
    • 支持实时卡片数据是指,建在该数据集上的卡片,可支持更短周期的数据更新,默认为5分钟。

  • Guan-Index
    数据被抽取到观远服务器后将构建物理数据集,支持增量更新。您可以为Guan-Index数据集设置去重主键,增量更新以及更新周期。

数据集信息

为您的数据集提供一个方便辨识的名字,以及指定保存位置。点击确认后,数据集创建成功,可以在数据中心-数据集中找到它。

需要注意的是,若创建的是Guan-Index数据集,您可能需要等待一段时间,等数据抽取完成后可以在数据中心看到正确的数据集信息。

数据更新

数据集创建完后,您也可以在数据集详情中更改数据更新的相关配置,同时可以手动触发数据集的更新。

results matching ""

    No results matching ""