Logo
    立即注册
    数说方舟
    产品文档
    探索与分析
    最近更新时间:2022-11-15 16:47:16

    数据预览

    单击数据源的图标,我们可以看到下方有一个浮窗,点击上拉按钮,会出现用户发帖抽样表的详情。也可以通过双击数据源的图标,查看用户发帖抽样表的详情。

    file

    file

    新建数据服务表

    接下来我们要对数据展开更深入的探索与分析,可以通过创建数据服务表,来针对性的获取我们需要的数据。 创建数据服务表的方式有两个。 1.通过数据源详情页,即上述的用户发帖抽样表的详情页,在浮窗大的右上角“分析服务”下,点击“新建数据服务表”

    file

    2.点击顶部导航的“数据服务”按钮,进入相关页面,可以通过页面正中间和右上角的“+”,新建数据服务表。

    file

    选择数据源,选择我们前面导入的数据源,点击“确定”。

    file

    为数据表命名,输入对应名词后点击“确定”,一个数据服务表就创建好了。

    file

    数据探索与分析

    发表时间分析

    从分析角度而言,我们可能想要知道这些帖子数据是什么时期的发帖。为此,我们创建一个名为“时间分布”的数据服务表。进入如下界面。

    file

    我们一边了解服务表的界面,一边完成“时间发布”数据服务表。界面最左边是数据源的各个字段,可以通过其上方搜索框搜索需要的字段。

    (注意,这里的“发表时间”左边有一个“日历”图标,表示该字段为date类型,如果这里不是date图标,请拉到本小节下方的注释)

    file

    往右是透视选择框和筛选器,你可以挑选感兴趣的字段,将其拖拽到“行”、“列”、“值”中进行聚合分析,观察透视结果。筛选器不仅可以筛选数值,还可以为联动提供服务。

    我们将“发表时间”字段拖拽到“行”,右边的预览框内会显示对应的透视表。

    file

    透视表对时间类字段默认按“年”为单位进行聚合,你可以手动调整单位为“月”或“日”乃至“小时”。我们将单位改为“日”。 透视条件改动之后,需要刷新透视结果,点击上图中的“刷新”按钮,即可刷新。

    file file

    最右侧为模型视图选择栏,有多种类型的视图可以选择。 我们可以选择“面积图”,以可视化的方式查看发帖的时间趋势。

    file

    ps.“发表时间”不是date类型 请到“数据管理”模块,双击展开对应的数据源,点击“字段设置”,将“发表时间”(publish_timestamp)的数据类型修改为“long as date”

    file

    用户年龄分析

    除了发表时间,我们还需要分析一下发帖人的年龄分布。这有助于我们对数据有更深刻的理解。我们基于同一份数据,新建一个数据服务表,取名为“用户年龄分析”。并在左侧的字段选择栏中选择“age_range”字段,拖入透视表的“行”条件框中。透视表结果如下:

    file

    话题分析

    基于我们的数据源,再次创建一个数据服务表,名为“话题分析”。在左侧的字段选择栏中选择“话题标签”字段,拖入透视表的“行”条件框中,并在右侧选择“词云”模型。 (也可以先选择“词云”模型,再把“话题标签”字段拖入词云的“词”条件框中)

    file

    ps:出现“获取透视数据失败,相关字段基数乘积已超额”的报错 这是方舟为了数据访问的稳定性,设置了10000的阈值,这里不影响数据服务表的生成及使用。

    用户相关信息分析

    基于我们的数据源,除了可以得到透视结果之外,我们也可以选取自己需要的字段,创建数据表。 为了得到用户的相关信息,创建一个“用户相关信息分析”表,点击预览框上方的“显示字段”。

    file

    选择自己需要的字段名,点击“确定”。

    file

    原文数据

    为了可以展示原文,创建一个“原文数据”表,直接发布原有数据。

    发布数据服务表

    数据服务表创建之后,我们需要把它发布成为API,供后续应用使用。 你可以在服务表中通过“发布”按钮来发布你的分析成果。

    file

    点击发布按钮的时候,会出现弹框要求你输入API的命名,命名空间仅允许英文字母、数字、减号"-"和下划线"_",注意只有英文字母可以作为首字符。 例如,“时间发布”在发布的时候,命名空间可以是“time_distribution”。

    file

    其他四个服务表,可以按下表所示来分别为它们命名:

    服务表 空间名称
    用户年龄分析 age_distribution
    话题分析 topic_label
    用户相关信息分析 user_information
    原文数据 post_link

    服务表被发布为API之后,在桌面上其图标的右下角会带上一个六边形的API标记。

    file

    默认情况下,服务表发布的API是一个允许自由访问的web服务,但你可以开启动态密钥校验的安全限制。

    微信扫描二维码在线咨询