标签:口碑传播 行操作 支持 不可 复杂 常见 评估 重要 两种
现如今,AI行业发展火热各大巨头都投入巨资在此领域布局,智能驾驶、人脸识别以及近段时间正火的AI养猪都是AI技术应用在实际生活上的体现,毫不夸张的说AI技术正在逐渐改变我们的生活而我们的生活也将因此变得更美好。一、常见的数据标注平台
由于数据标注的重要性和高质量标注好数据的稀缺性在催生了一大批专职做数据标注团队的同时也催生了一批数据标注平台,比较有名的有百度众测、京东众智、龙猫数据、数据堂等。众所周知百度在互联网大厂是最早开始且投入巨资研Ai 技术的,所以百度众测平台的任务大部分都是百度内部的需求,他们也会接受其他AI公司的数据需求,但是在数据量和价格上会有限制。相比百度而言其他几家数据标注平台就比较亲民一些了,中小型的AI公司的需求一般都会接受。为什么这个地方没有提到大型AI公司呢?那是因为大型AI公司一般都会自建平台且有专门的数据标注团队负责公司的数据需求。
二、数据标注平台的业务模式
(1)众包模式:
现在数据标注通常采取众包的模式,众包模式的优点就是成本较低响应较快。这种模式适用较简单的项目如点点拉框等项目。发布者往往将任务详细介绍和题目一同发送到平台上供广大数据标注兼职人员作答。但众包模式有一个很明显的问题就是质量较难把控,因为众包模式是面向大众的你并不知道在给你做标注的是什么人,他们可能是厨师,是全职太太,是老师每个人对规则的理解不尽相同且不可避免的会有一部分对任务乱答一通影响项目质量。为此各平台也会使用一些方式减少问题的产生提高项目质量。比如增加改判环节一道题在答完之后会由他人进行改判如若判错则不获得任务报酬,此外为防止错判维护答题人员利益还会设置申诉环节使答题人员对有疑问的题目进行申诉。设置标注人员级别,标注人员任务正确率较高答题数较多则能慢慢提高等级解锁更多任务获得更多的任务报酬且有机会进入改判环节成为改判员。
(2)外包模式
外包模式与众包模式相对是将任务外包给专门的数据标注公司和团队,在项目一开始会对项目整体进行评估然后针对项目整体进行报价由数据标注公司自行安排培训安排人手,只需要保证在项目截止日期前保质保量交付数据即可。这种模式的优势就是数据质量和项目周期有保证。但是响应速度较慢成本较高,因为一开始需要安排竞标且平台需要安排专门的项目人员进行项目对接和项目跟进。现如今国内专门做数据标注的团队较多,但是大多数只是以工作室和几十人的小团队为主且业务类型集中在简单的拉框图像标注上。也有一些的较大型的公司如贵州的梦动科技已经形成产业化带动了当地的发展。又或者是“点我科技”他们自建有平台可以自研工具同时担任着数据标注平台和数据标注公司两种角色。
基于以上两种业务模式的答题模式:
A模式:A模式指只进行一次答题模式,后续没有改判操作。这种模式应用较少主要用于较简单正确率要求不高的项目。
AC模式:AC模式指在答题完成后会有一个改判流程,改判员只能对题目进行正误的判断不能在答题的基础上进行操作。
ACC模式:ACC模式和AC模式的主要区别是AC模式不能够之前的答题情况作出更改,而
三、制约数据标注平台发展的因素
标签:口碑传播 行操作 支持 不可 复杂 常见 评估 重要 两种
原文地址:https://blog.51cto.com/14065470/2355532