1.概述
1.1 应用场景
数据文件是实现可上传数据表(xls/xlsx/csv)、空间数据文件(json)生成数据文件并生成数据集的功能,可对上传的数据去掉重复、覆盖数据、追加数据的功能。
本文介绍如何将 Excel 添加进星河可视化共创分析平台 ,作为后续的数据分析和看板展示的数据源。
2.上传前准备工作
2.1 确认支持上传文件类型
星河可视化共创分析平台可上传的表类型为 csv、xls、xlsx 三种格式。
注1:支持上传 2003 和 2007 版本且后缀为 xls、xlsx 的 Excel 文件,不支持上传保存类型为 Excel 5.0/95 的后缀为 xls 的 Excel 文件。
注2:不支持上传加密 Excel 文件。
2.2 Excel 首行不能有合并单元格
上传前需要确认,添加的 Excel 首行不能有合并单元格,否则会上传失败,如下图所示:
2.3 Excel 首行不能有同名单元格
上传前需要确认,添加的 Excel 首行不能有同名单元格,否则会上传失败,如下图所示:
2.4 确认是否有函数计算的内容
上传的 Excel 数据集中不能有 Excel 函数计算的内容,例如:vlookup,sumifs 函数等。
3. 数据新增
3.1 看板中新增
1)在看板编辑时,拖入所需要的图表后,在右侧“数据”面板工具栏点击图标(数据上传)按钮:
2)根据流程提示,上传Excel或CSV文件:
上传完成后,我们可以看到数据的预览。
3)如果需要数据去重(文件中存在重复的数据行),在可选字段中勾选唯一标识字段(这些字段一起确定唯一的一行记录),设置为唯一标识字段即可。如果不需要去重则略过即可。
在可选字段列选择一个字段到唯一标识字段以后,上传的数据表将按照唯一标识字段去重处理。如选择修复人到唯一标识字段,那么将数据上传以后,如修复人有同名的数据,那么同名数据只会保留一条,另外的一条会删除去掉。如没有业务需要,谨慎勾选唯一标识字段。
4)数据去重后,我们便完成了数据上传,可以开始制图。
如表格里列有类型不一致的数据,则会提示“第N列的数据类型不一致….请检查”,则需要打开上传的Excel表格,找到对应的列,仔细检查看里面的数据是否有格式不一致的,如存在则修改成一致重新上传,直到不弹出这个提示为止。常见问题如数值类型的列,个别数值以文本格式保存的,就会出现这种报错提示。
3.1.1 个人空间中新增
除了在图表制作时上传数据,也可以在个人空间找到【数据管理】,并在“数据文件”菜单下,管理所有数据文件,包括上传数据源(数据库)、数据字典、数据总线等。当然,你甚至还可以在操作栏中追加数据。
3.2 数据更新
星河可视化共创分析平台支持「追加数据」与「覆盖数据」的操作。
- 追加数据:是指在原先上传的 Excel 数据表基础上追加增量数据。
- 覆盖数据:是指上传新的 Excel ,替换掉原先上传的数据。
3.2.1 追加数据
在数据文件列表页面,点击“追加数据”弹出追加数据页面,页面上传数据逻辑跟上传数据步骤一致。追加的数据需保持跟原始数据列名、列的数据类型一致。追加成功以后,将会在原始数据后面增加新上传的数据。
追加数据即将上传的 Excel 数据作为新增数据,添加到原数据后面。如若添加唯一标识字段,则可能会影响原有数据。追加数据流程为:
1)打开【个人空间】→【数据管理】→【数据文件】→【追加数据】
2)找到所需要追加的数据,设置去重选项,添加唯一标识字段。
添加唯一标识字段后,数据上传将会更加唯一标识字段去重上传。具体操作如下:
如若不需要添加唯一标识字段,则数据会重复追加上传。
3)添加完唯一标识字段后,点击【追加数据】
3)按照提示完成追加数据
追加数据的上传逻辑如下:
情况 | 上传方式 |
---|---|
追加表中有新字段(新字段与原表所有的字段名称都不相同) | 忽略新字段,不追加数据到原表中 |
追加表中缺少字段(原表中有该字段,但追加表中没有字段名称与之相同的进行匹配) | 在上传以后的追加数据的那部分,原表该字段对应的值为空值 |
追加表中的字段类型和原表的字段类型不同 | 如若原表是文本类型,则转换成功。若非文本字段,则转换失败 |
追加表中有重复字段 | 提示有相同字段,上传失败 |
添加唯一标识字段 | 根据标识字段去重全量上传新数据(影响原有数据) |
无添加唯一标识字段 | 重复追加上传新数据 |
3.2.2 覆盖数据
覆盖数据是指将数据替换为新上传的 Excel 数据。
在数据文件列表页面,点击“更多”,在下拉项选择“覆盖数据”,弹出覆盖数据对话框,覆盖数据逻辑同上传数据一致。覆盖数据会将原来的数据全部清理掉,只展示新上传的数据,请谨慎操作。
覆盖数据流程如下:
1)打开【个人空间】→【数据管理】→【数据文件】
2)找到所需要覆盖的数据,点击【覆盖数据】
3)按照提示完成覆盖数据:
覆盖数据的上传逻辑如下:
情况 | 上传方式 |
---|---|
替换表中有新字段(新字段就是与原表所有的字段名称都不相同的字段) | 忽略新字段,不覆盖数据到原表中 |
替换表中缺少字段(原表中有的字段,替换表中没有字段名与之一致的字段) | 在上传以后的追加数据的那部分,原表该字段对应的值为空值 |
替换表中的字段类型和原表的字段类型不同 | 如若原表是文本类型,则转换成功。若非文本字段,则转换失败。 |
替换表中有重复字段 | 提示有相同字段,上传失败 |
3.3 删除数据文件
在需要删除的数据文件后单击【更多】,在弹出的选择框选择删除即可完成对数据文件的删除。
3.4 逻辑关系树查看
通过查看逻辑关系树,可以查阅到数据文件依赖关系树和被依赖关系树。
在需要查看的数据源后单击【更多】,在弹出的选择框选择【逻辑关系树图】即可查看数据源的关系树图。具体操作如图所示: