当AI数据服务走进中场战事

  • 日期:02-01
  • 点击:(915)


毫无疑问,飙升的数据量是人工智能行业爆发的原因之一。很快我们就可以发现,数据的收集、整理、清理、标记,然后转移到人工智能企业进行模型培训,已经成为一条流畅的产业链。

长期以来,数据服务一直处于广泛而原始的状态,甚至有一个“数据场”说:数据服务从业者从各种公共数据集或移动互联网产品中获取数据,并雇佣大量廉价劳动力以几乎为零的门槛(threshold)的形式进行简单的清洁和贴标工作。例如,查看照片中天空和地球的位置。最后,将这些粗略处理的数据放入神经网络的黑盒中。

但是现在,我们已经看到当前的形势正在改变。人工智能企业对数据的应用需求逐渐开始分化。以前粗放的处理模式已经不能满足他们的需求,从而掀起了人工智能数据服务市场。潮水汹涌而至,让沉积物沉淀下来并清理干净。云测量下的人工智能数据服务品牌云测量数据的出现就是一个典型的例子。

这一次,我们采访了云数据公司的总经理贾亚航,并听到他谈论他所看到的为战争服务的数据。

汹涌的数据服务战场

如果数据是人工智能的营养品,营养品的营养含量自然决定了人工智能的力量。算法模型的准确性及其对不同环境的适应性几乎都来自原始数据的积累。

人工智能产业是第一个改变的。清华大学发布的《2018年中国人工智能发展报告》数据显示,去年中国人工智能产业的市场规模达到237亿元,同比增长67%。据估计,2019年中国人工智能产业的增长率将达到75%。

工业规模的爆炸性增长意味着竞争将更加激烈。面对这种竞争,人工智能公司对数据的需求将不可避免地发生变化。

例如,企业渴望更精细和定制的数据。

现实世界的环境总是比实验室里的想法更复杂。要提供一个具有更多登陆和差异化优势的模型,仅仅依靠基于移动互联网数据或众包用户数据收集的数据显然是不够的。只有通过定制的数据收集和不断深入的细节和场景,人们除了自己什么都没有,我们才能不断提高技术价值,立足当前。

例如,企业渴望获得更多专业和垂直的数据。

随着人工智能技术深入到各个子领域,许多数据标注工作必须由专业人员完成。例如,医学图像数据的标记,以及对工业生产线中各种材料的理解。这些不再像过去一样,可以通过召集一群普通人来完成,相反需要的是行业中的专业人员来进行相关的处理。如何满足这些需求是数据服务企业和人工智能企业都在思考的问题。

以及企业日益增长的数据安全需求。

除了传统的数据安全要求(如数据隐私),一些企业已经开始开发自己的硬件,以突破现有模型的限制,走向多模式集成。或者,如上所述,专门收集一些定制的专业数据。此时,这些数据将成为企业构筑自身核心壁垒的发展方向。从那时起,数据安全就成了重中之重。

另一方面,人工智能数据服务企业也是如此。

人工智能数据服务公司意识到越来越多的人工智能公司对数据准确性、安全性和标签效率提出了更多的要求,人工智能公司开始倾向于与大公司合作,对数据服务公司进行尽职调查,建立供应商名单等。这意味着数据服务企业必须加强技术能力,促进管理标准化,以满足新的需求。

中场战争的号角已经吹响。这场战争决定了人工智能数据服务公司的生存,也是它们争取进步的重要机会。

云数据的挑战逻辑

云数据是在战斗中越来越好的数据企业的代表。

自移动互联网时代以来,云测量已经从手机应用测试进入企业服务领域,成为保护暴民使用的突破口

对于人工智能企业来说,自建的数据处理团队可以满足需求,但资金成本和技术门槛相对较高。然而,数据行业中常见的众包模式,如亚马逊机械土耳其(Amazon Mechanical Turk),可以在平台上完成大量数据,但无法处理定制的场景数据。

然而,云数据正是针对定制数据市场,并完善了自己的一套作战逻辑:

首先,通过扩展产业链来满足企业丰富的业务需求。

云调查数据发现,当人工智能企业对算法登陆的要求越来越高时,他们需要更多接近真实场景的数据来满足要求。贾亚航提到,互联网上积累的数据和众包数据不足以支持现阶段安全或金融所需的人脸识别安全级别。多维和精确的数据,例如不同光照条件下不同角度的人脸数据,是最好的药物。面对这种情况,数据企业有必要拓展产业链,进行定制化数据采集。除了安全和金融领域之外,云测量数据还将覆盖辅助驾驶场景中的驾驶员表情、新零售场景中角色穿的服装、智能生活中的音箱唤醒词、智能行业中的质量检测和检验等场景。涵盖了现阶段的大多数着陆场景。

其次,注意人员培训以提高标签的准确性。

在意识到定制数据对人工智能企业的重要性后,云测量数据开始关注员工素质的培养和提高。它不仅建立了自己的数据库,对贴标人员进行了贴标技能的教学培训,还积累了各相关行业的专业知识,以确保贴标人员对贴标任务的理解。如果自动驾驶数据标注涉及交通法规和驾驶经验,云测量数据将由具有丰富驾驶经验的标注管理人员提供,为员工提供定期解释,而其他行业将逐渐需要“老司机”的干预,以提高数据准确性。

第三,坚持安全底线。

最后但同样重要的是,安全。首先,云测量数据的核心价值是让企业拥有数据,为企业构筑核心竞争壁垒。因此,数据安全是一个核心指标。为了保证人们数据隐私的安全,云测量数据不仅在硬件和操作系统上采取加密措施,密封了USB接口,使用内网浏览器操作注释数据,保证所有参与工作的员工只能操作数据而不能获取数据,并且在每次注释任务交付数据结果后销毁数据。不仅保护了数据隐私,也保证了人工智能企业的利益。

什么改变了中场战争:人工智能数据服务行业的下一步行动

贾亚航告诉我们,云测量数据的发展目标是在更细分的领域中积累更深的领域知识、更准确的数据和更安全的数据。有了这三种能力,云数据可以准确地抓住数据服务电路变化的机会。为了解决人工智能企业希望依靠独特的专业数据来提高技术能力,而无法建立数据团队的问题。

我们也担心中场战争后数据服务行业会发生什么。

在采访中,玉伽向我们提到了一个有趣的事实:目前,他们服务的甲方除了一些技术巨头之外,还有许多传统企业。“”这一事实反映了越来越多的企业参与人工智能,其类型也越来越丰富。将会有对技术一无所知的小型传统企业,植根于极其细分行业(如农业和化学工业)的企业,以及依靠丰富数据积累和提炼人工智能技术的技术巨头。他们对数据类型的需求将变得越来越详细、专业和垂直。在这种趋势下,数据和算法之间的产业分工将逐渐变得清晰。也许数据公司需要“伸出更长的手”来更好地为他们服务。

我相信在中野战争的转折点之后,数据服务行业将从简单的劳动力向技能、专业和垂直度发展。

对于数据服务行业来说,这也是一个重组的过程。工业发展历程的一半以上,真正的竞争才刚刚到来。作为…的“来源”