新闻中心

EEPW首页 > 智能计算 > 业界动态 > 火爆“智能”下的惨淡“人工”

火爆“智能”下的惨淡“人工”

作者:时间:2018-10-22来源:财经杂志收藏
编者按:没有“人工”就没有“智能”,这一幕很可能只是人工智能产业发展史上的短暂一幕。

  从人工智能发展高地北京到代河南郑州只需要两个小时的高铁,那里有中国最大的代工厂富士康。再从郑州火车站出发,半小时车程,到达 一栋不起眼的写字楼,打开一间没有任何标志的大门,就是目前河南最大的人工智能数据标注工厂翊澳数据的总部。

本文引用地址:http://www.eepw.com.cn/article/201810/393156.htm

  聚集在北京的人工智能公司里,随处可见人脸识别机器以及实时的大数据热点图。但这家数据工厂里,并没有任何智能的样子,也没有普通工厂里的流水线,更像是一间网吧——装修简单,几十台电脑依次排开。

  正值午休时间,一半的电脑前面空空如也,还有数十名员工坐在电脑前,或是吃着打包来的午饭,或是掏出手机打游戏,也有部分标注员还在处理一张张模糊或清晰的照片。

  数据标注行业流行的一句话,“有多少智能,就有多少人工”。目前算法能学习的数据,必须通过人力逐一标注,这些人力为产业提供养料,这是金字塔的基础,处于最底层。

  此前,一些数据标注工厂被冠以“血汗工厂”的名号,为了应对庞大的数据标注需求,标注员们必须加班加点的盯着电脑屏幕,夜以继日的重复枯燥的工作,但眼前的这个工厂里,似乎有些清闲。

  “听说北京AI很火,我们也想参与进来。”翊澳数据总经理靳建伟对《财经》记者说。

  靳建伟经历丰富,善于追逐潮流。微信最火的时候他做过微信推广,拼多多起来后在上面卖过袜子,还在关注短视频营销行业,“你知道抖音推广吧?就是一个后台可以操纵一百个账号那种,据说很赚钱。”

  大多数AI初创公司还处于依靠融资发展的阶段,但数据标注产业更像传统行业,拿一单数据结一单钱,江湖中流传的传说是,这个领域已经创造了不少“一夜暴富”的故事。

  被这样的故事吸引,不少像靳建伟一样的人们加入了这场淘金游戏,但现实给了他们当头一棒。

  2018年,河南省的数据标注公司死掉了一大半,剩下几乎都在艰难求生,接受《财经》记者采访时,靳建伟已经2个多月没有接到新的订单,工厂员工从600人,锐减至200人,他觉得自己恐怕需要开始找下一个风口了。

  撞进了AI圈

  靳建伟今年28岁,2017年以前,他甚至没听说过“数据标注”这个词。

  他并不懂AI算法和技术,也不太清楚AI到底能解决哪些问题,2017年,他偶然听说做数据标注能赚钱,当时他正从事证券销售业务,由于没有资质,公司被关停,他找到一个卖保健品的朋友,共同成立了这家数据标注公司。

  2017年,中国AI创业开始达到顶点。对数据标注的需求也迅速爆棚。河南是人口大省,数百家数据标注公司在此诞生。靳建伟算了一笔账,一个成熟的标注员,月产值能做到7000元,除去3000元的工资和质检、场地设备等费用,公司能赚1500元。

  “那我不断招人就行,如果招100个人,一个月就赚15万。”靳建伟说道,“怎么看都觉得这个生意靠谱。”

  有电脑,有场地,再迅速招一批没有学历、工作经验要求的数据标注员,就可以迅速上手。

  深度学习的关键在于大量的数据训练,数据训练之前,必须对这些数据进行明确的标注。例如,机器需要识别斑马线,就必须提供大量标注了斑马线的数据来进行学习,数据量足够大时,机器就可以识别出任何角度的斑马线。

  这意味着,在某种程度上,AI算法的优化,取决于数据标注的质量,而把控这些质量的,是完全不懂AI技术的一群人。

  一名没有任何经验的标注员,通过半天的培训即可开工, 1-2个月之后可变成熟练工,一天就可以完成1500-2000张图片的标注。

  需要标注的图片数据从客户提供的数据处理平台上打包下载,根据不同的需求进行标注,常见的包括物体识别和人脸识别,物体识别主要是“画框”,人脸识别则是“打点”。完成后会进行一到两道的质量检测程序,来确保标识准确率,合格后会重新传送到客户的数据平台上。

  然后,这些数据会被应用到自动驾驶、AI安防、智能身份认证等新兴应用领域。

  依靠这些应用,人工智能公司在资本市场颇受追捧,投中研究院发布的数据显示,2018年上半年,进入商业化阶段的中国人工智能行业已经获得超过400亿人民币的融资。

  这400亿的资金,仅有极少部分流入了数据标注行业。企名片收录的标签为“数据标注”的公司共有15家,2018年,这15家公司共完成6笔融资,单笔融资金额约为1000万人民币左右,总计不超过1亿人民币。

  靳建伟还没考虑过融资这件事,他听说北京的AI公司都在以亿为单位进行融资,但他的思维和之前的数次创业没有区别,找客户,做业务,能赚钱,才是应该做的事情。

  单打独斗在当下的AI圈很难混得开。由于完全没有相关行业经验,也没有资本加持,一开始靳建伟只能接二手,甚至三手订单,也即外包服务。“一些有渠道的公司接了订单,自己不做,或者自己做不过来,就分发给我们做,他们再从中间收取差价。”

  与很多行业一样,渠道是核心竞争力,中间商们不需要耗费太多的人力物力,就能赚取可观的利润,底层的工厂们,加班加点,只能勉强维持经营。

  这样下去可不行。在熟悉了行业之后,靳建伟开始主动出击,拓展渠道,试图绕过中间商。从知名的头部AI公司开始,到所有他能找到联系方式的中小AI企业,他问了个遍。得到的回应要么是“不需要”,要么是“我们已经有了自己的数据标注团队”,更多的是石沉大海,没有回音。

  “人家上来就问你,以前做过哪些项目,我说不上来。”他很无奈。

  类似这样的头部AI公司,都会自建数据标注团队,既能方便管理,也能更好的理解需求。

  但确实也有大量AI公司,由于团队人数、资金成本有限,有外包数据标注的需求,但大部分都会通过熟悉的渠道寻找标注团队,或者和大平台合作,例如百度众测平台。

  百度众测是百度旗下的一个类似众包模式的数据平台,2014年在百度世界大会上正式推出,平台上会分发各类任务,在行业内称为“放题”,包括数据采集、图片标注、文本标注等。

  百度在中国人工智能领域起步早,渠道辐射广,众测平台上每天都有大量的数据标注需求,并且开放注册,这让靳建伟看到了机会。

  饱一顿,饥一顿

  距离郑州车程两个小时的河南新乡辉县,甚至找不到一栋商用写字楼。从马路边一个毫不起眼的门洞上楼,就是翊澳在辉县的工厂,也是该公司目前规模最大的一个厂。

  两层楼,近500平方米的空间里,划分出了三片工作区域,但目前仅有一片区域开工运转。

  翊澳下面类似这样的分厂有十几个,分布在河南省内各个县市里。

  由于百度众测平台提供了订单来源,翊澳几乎是在一夜之间发展成这样的规模,靳建伟拉来以前一起做证券销售的同事们,让他们回到各自的老家成立分工厂,并担任负责人,“之前一起做过事,已经有信任关系,下面这些地方场地租金更便宜,员工工资也低,更省成本。”


上一页 1 2 下一页

评论


相关推荐

技术专区

关闭