数据库连接
数据库连接分为五个步骤:
- 选择连接器 ——选择需要连接的数据库类型;
- 选择账户——选择一个数据库连接账户;
- 数据库查询——填写SQL语句;
- 连接方式——选择数据库连接方式,数据更新周期以及增量更新等;
- 数据集信息——指定数据集的名称以及保存位置。
选择连接器
进入数据中心数据集页面,点击右侧“新建”按钮,选择“数据库”。创建数据库连接前,需要先选择一种数据库类型。观远数据目前支持的数据库类型包括:MySQL, PostgreSQL, Greenplum, SQL Server, Oracle, Presto, Amazon Redshift, MaxCompute, SAP HANA. 后续我们也会根据客户需求不断地添加新的数据库支持。
选择一种数据库连接器,进入到数据库连接配置界面。
选择账户
您可以选择一个已有的数据库连接账户,或者新建一个账户。数据库账户可以在数据中心—数据账户页面进行集中管理。
新建账户时,您需要提供数据库地址、用户名、密码、数据库名称、端口号等信息。测试连接成功后,便可以创建新的账户。
选完数据库连接账户后,点击下一步进入到数据库查询。
数据库查询
数据库查询界面如下:左侧为当前连接数据库中的数据表,选择数据表可快速输入SQL Query。您也可以根据自己的需要在中间“SQL Query”区域填写Query。
右侧为时间宏选择,可以在SQL中快速添加时间宏。观远数据的SQL时间宏,可以帮助您根据当前日期生成动态SQL,在定时刷新数据与增量更新时,非常有用。例如我们可以输入这样的SQL Query:
您也可以自定义时间宏,具体使用方式请阅读“卡片标题中的动态时间”。
预览数据成功后可进入到下一步。
连接方式
观远数据支持直连数据库与Guan-Index两种数据库连接方式。其中,Guan-Index为扩展功能,需要开通该功能请联系您的观远解决方案顾问。
直连数据库
选择直连数据库时,卡片数据将直接从数据库获得。您需要配置数据更新周期,以及选择是否支持实时卡片数据。- 设置数据更新周期的作用是,我们会定时更新与该数据集相关的所有卡片、卡片数据集、ETL、JOIN等的数据。
- 支持实时卡片数据是指,建在该数据集上的卡片,可支持更短周期的数据更新,默认为5分钟。
Guan-Index
数据被抽取到观远服务器后将构建物理数据集,支持增量更新。您可以为Guan-Index数据集设置去重主键,增量更新以及更新周期。
数据集信息
为您的数据集提供一个方便辨识的名字,以及指定保存位置。点击确认后,数据集创建成功,可以在数据中心-数据集中找到它。
需要注意的是,若创建的是Guan-Index数据集,您可能需要等待一段时间,等数据抽取完成后可以在数据中心看到正确的数据集信息。
数据更新
数据集创建完后,您也可以在数据集详情中更改数据更新的相关配置,同时可以手动触发数据集的更新。