对于一个项目下的标注任务,可分为两类用户:管理人员和标注人员,分别对应空间的管理员和角色。 管理人员拥有权限: 任务创建、标注人员任务分配、标注轮次创建、完成标注、修改标注、标注结果检查、标注修改情况追踪、模型训练、模型发布等完整权限。
标注人员拥有权限: 仅有查看标注任务、完成标注任务、修改标注结果的权限。
在进行标注工作之前,管理人员需要先创建标注任务。在【数据智能-标注系统-标注任务】页面,点击新建任务。 可以对已建任务进行任务参数编辑、删除任务和移动任务。
情感分类标注需要填写的参数是基本参数,自定义文本分类标注、实体关系标注、图像、视频标注会有更多额外的填写项,下面补充说明。
自定义分本分类标注需要额外输出答案,答案是指标注人员可选的答案选项。例如我要把文本分成新闻、论坛两大类,则需要在答案输入新闻、论坛。通过回车键进行输入。答案可以设置多个。
实体关系标注类型:有自定义实体关系标注和三元组实体关系标注两种分类。三元组下的实体设置默认为情感词和特征词。
实体关系问题:包括实体1、实体2、问题、答案、层级答案四个填充项。标注工作中需要先选择实体后选择实体2,才能建立实体关系。
分类标注与OCR需要填写实体设置、实体属性设置。 物体识别需要填写实体设置、实体属性设置、实体关系设置。
在开展标注工作前,需要先给任务绑定标注数据源。 进入任务管理页面,点击页面上的添加按钮,根据提示进行数据源的上传操作。如果数据源之前没有在项目中被使用过,需要选择新数据源上传,否则可以选择已有数据源。同一个任务可以添加多个数据源。 目前分类标注和实体标注任务仅支持 CSV 格式文件,图像标注任务支持上传zip压缩包,其中图片格式支持JPG、JPEG、PNG。
上传后会进入数据预览界面,可以更改数据源名称,绑定对应的字段映射关系。绑定后点击提交即可完成绑定。
字段说明
实体关系预标注数据有一定的格式要求,必须是一个json: 例子: 原文:昨天接到一个骗子的电话,说床单染料超标,睡了身上发痒,要我按她说的一步一步的做,说双倍退还,说到银行卡时,我就绝得不对,差点被骗。因为我的信息全都是对的, 希望店家要把我们的信息保管好。
预标注答案 :
{"nodes":[{"end_index":19,"id":1,"num_index":1,"start_index":15,"text":" 染料超标","text_index":1,"type":"特征词"}],"relations":[{"node1":1,"relation_type":" 情 感 极 性 ","relation_value":" 负 面 "},{"node1":1,"relation_type":" 维 度 ","relation_value":"品质"}]}
Nodes 指的是实体,id 为自增 ID,主要用于后续关系判断时的 node 声明,start_index对应起始下标(从0开始,),end_index 对应结束下标,num_index 可不填,text_index 为该词语在文本中第 X 次出现,type 为词性或标注类型。 Relation 指的是关系,多个 node 通过自增 ID 判断,relation_type 对应问题, relation_value 对应答案。 情感分类的预标注答案 为 -1:负面,0:中性,1:正面 自定义分类的预标注答案为具体的标注结果(如任务设置了:优,良,中,差,则答案为这四个其中一个)
数据源上传过程中样式:
数据源上传成功样式:
右键点击已经绑定的数据源,点击删除按钮。
产品咨询
020-38061725
微信扫描二维码在线咨询