Logo
    立即注册
    数说方舟
    产品文档
    常见问题(一)
    最近更新时间:2022-11-10 16:41:34

    1、正则码表中, A(.{0,20})B 里的词距,是指A和B之间相隔20个词,还是相隔20个字符? 一个中文字占据几个字符?

    答:20个字符;一个中文字占据1个字符

    2、合并多渠道数据源,“数据追加”会有原字段缺失

    答:A←B时会优先保留A的字段,B中不被A包含的就并不进来;建议按字段数从大到小的顺序并上子数据源

    3、数据源打标发现未打上

    答:重新核对打标csv文档内的表头是否填入关联字段名与所打的标签名

    4、需要新建处理后的新数据源

    答:选择输出——工厂

    5、“正则匹配”是什么意思?

    答:详见正则匹配

    6、“正则匹配”如何使用?

    答:正则表达式:(词组)(.{m,n})(词组),m为两个词组之间的最小字符数,n为两个词组之间的最小字符数(先后顺序有意义);在工厂设置条件时选择“正则匹配”/“正则不匹配”

    7、日化库中,字段“是否广告”的判定规则是什么?

    答:

    8、“句内包含”具体以哪些字符作为分隔?

    答:.?!;。?!;…

    9、要合并数据源的时候,是选择“数据追加”还是“字段追加”?

    答:合并数据源时,选【数据追加】,点击后会看到两个数据源之间字段的对应关系

    10、工厂打标签,显示是否短路是什么意思?

    file

    答:码表匹配上第一个关键词后,是否停止往后匹配;所以一般选“否”;(过滤码表可以选“是”)

    微信扫描二维码在线咨询