7.2 列编辑

7.2.1 添加计算列

可以利用该操作符对现有数据集中存在的列维度进行扩展或合并计算,比如增加分析需要的新指标。例如在门店分析的某数据集中,已有营业额、专柜所占总坪数,即可通过公式,计算并新增列:坪效

“添加计算列”详情界面:

column selection

进入“添加计算字段”临时页面,选择需要的函数,并按照示例,编写公式、填写名称、选择字段类型:

field adding

预览或运行得到计算所得列:

qualified ornot

7.2.2 合并列

可对现有数据集中的多列进行合并,并给予新的列名,分隔符可以选择无、分号、逗号、制表符、空格、自定义等,合并前的原始列可以选择删除或保留。整体功能较为灵活、友好。一般用于特定文本信息之间的合并。

1. 选择需要合并的列,从上至下选择,后续会在“输出数据集”中从左至右转换
2. 填写新列名称
3. 选择分隔符,其中“其他”可以自定义文本信息
4. 当勾选“删除原始列”时,输出的数据集中的“店名”、“区域”列将被剔除,仅剩下“订单量”与“门店名称”

merging

7.2.3 分组聚合

“分组聚合”的详情界面:

grouping

通过对维度、数值的选择,获得右下方ETL转换后的预览

分组聚合的功能即通过对某维度或某几类维度的数值处理,将多行数据按照维度,聚合至一行

当选择多个维度时:按照颗粒度最小的维度,进行聚合

数值中的聚合方式:求和、最小值、最大值、平均值、计数、无处理

聚合方式 功能说明
求和 返回各维度下所有非空值的合计
最小值 返回各维度下所有非空值的最小值
最大值 返回各维度下所有非空值的最大值
平均值 返回各维度下所有非空值的平均值
计数 返回各维度下所有非空值的行数
无处理 返回各维度下所有值的随机一行

7.2.4 选择列

当出现一些规范化程度较低的数据,存在字段冗余、不规范的情况,可以通过此功能对数据集的各字段进行重命名、选择,得到清晰、有效的数据集。

如图,勾选修改了“店名“与”区域“,不选择”订单量“,可在右下方区域看到对应的ETL处理情况预览:

column edit

7.2.5 行转列

在众多的业务数据集中,存在部分数据集用于统计颗粒度较小的唯一特性或种类。例如电商行业的商品、单品,零售行业各类商品、餐饮行业各类菜品的SPU、SKU,环境数据中的国家、地区等。

当我们所掌握的数据集维度较为复杂,或者用户需要对经营、制造的商品、产品进行横向的分析时,需要对存储这些数据集的维表进行行转列的转换,使得例如商品、菜品、国家、地域等数据行变为数据维度,使得比较复杂、冗余、未经规范处理的数据集能够获得维度转化,形成新指标的数据集。

在“行转列”的详情界面中,包含下面要素:

1. 选择需要做行转列操作的列:选定将成为数据集列项维度的数据所在的列的列项,结合示例图来说,当用户需要采用数据集的行中的“鞋类“、”配件“、“服装”这些维度时,就选择这些数据所在的列的列名:“类别”
2. 在新建列中填充的数据列:用户选择需要的数据列项(如,销售额),来描述“鞋类“、”配件“、“服装”这些维度
3. 聚合类型:选择对这些数据列项的“聚合类型”,图中的例子是对销售额进行求和,我们还可以选择其它聚合方式(求和、最小值、最大值、平均值、计数、无处理),这些聚合方式在7.2.3分组聚合中已有相应说明,不作赘述
4. 选择主键列:主键列决定了输出的数据集将依据哪个主键。选择多个主键列时,会形成主键集,并依据该主键集输出数据集
5. “添加列”的左文本框:填写原数据转为列后的名称(一般根据“在新建列中填充的数据列”中的要素进行相应含义的命名)
6. “添加列”的右文本框:按照用户自身的需求,补充填写选择的行转列的列中的各个数据的原值

Transform

7.2.6 列转行

列转行是行转列的逆操作。通过列转行,可以把多个指标归总到一个列中去进行分析和展示。例如我们要将以下表格数据转成“姓名-科目-成绩”三列组成的新表,就可以使用列转行操作符。

姓名 语文 数学 英语 生物
张三 80 92 76 88
李四 60 82 96 80
王五 89 100 69 90

在“行转列”的详情界面中,包含下面要素:

1. 设置标签列的名称:列转行后,会将转换前列标签放至该列。例如我们要将“语文"、“数学”、“英语”、“生物”四个科目放至一个新的标签列可以设置标签列的名称为“科目".
2. 设置数值列的名称:列转行后,会将各列的值放至在该列。例如我们可以将此列命名为“成绩”。
3. 添加需要做列转行操作的列:您可以选择多个需要转成行的列,并重命名它们在标签列里面显示的名称。

results matching ""

    No results matching ""