天天看点

冒牌神童背后的AI数据标注:产值不高但被三四线城市瞄准

一位AI首席执行官在他的简历上被指控为虚假。9月12日,中国科学技术大学新校友基金会在其公众号上发布消息,白鲸CEO刘先生称自己为"中国科学技术大学初级班12岁学生"。经过多次调查:刘廷阳冒充大三班校友多年,涉嫌冒充清华大学硕士、斯坦福大学博士(或博士生),通过白鲸公司诈骗深圳、苏州、青岛、山西陆梁等城市和高科技园区。

南都记者了解到,刘恩德扬风险投资公司Moby Hi-Hei,主营业务是数据标签,在人工智能产业的上游,拥有发明、外观专利3项,软件著作权16项。Moby Hi-Chi在盐城、洛阳、盘锦等非一线城市纷纷落户,还与吕梁市通过开设合作创业公司,促进当地贫困劳动力就业。据悉,当时,鲁良村贴标员工月收入稳定在2000元左右。

虽然媒体将之称为"农民手工作业",但一些业内人士告诉南都记者,与研发相比,数据标注技术含量并不高,但这并不意味着数据标注完全没有技术门槛,自动驾驶仪、医疗等领域的数据标注需要标注人员具备一定的专业知识储备。数据标注企业都位于三四线城市,虽然产值不高,但可以留下大量职业技能后遗,带动效应不容忽视。

1名自称"12岁上大学"的中国科技大学校友被点名假

南都记者查阅公开信息发现,刘哈迪扬在2017年活跃于各种媒体。简介中,他是一位"创业神童",12岁进入中国科技大学初级班,曾就读于美国东北大学、清华大学、斯坦福大学。

在20170922期中央电视台财经创业英雄交流会上,刘强东在台上向投资者介绍了他的"在线群组智能平台"。例如,该平台可以在一天内校准7000万张图像,使用算法将7000万张图像分成700万张图像并将其分发给700万人,每张图像仅处理10张图像。

冒牌神童背后的AI数据标注:产值不高但被三四线城市瞄准

刘廷阳参加了"创业英雄交流"项目。

刘在节目中说,小时候在家养羊,羊比较听话,他在学数学题,小学一直在学高中课程,甚至大学微积分课程。从斯坦福大学毕业后,他加入了谷歌从事自动驾驶工作,然后回到家乡创业,成为一名"老肉企业家"。他说,自从从斯坦福大学休息以来,他一直在打磨自己的头脑,直到2016年该产品最终问世,并积累了20项发明专利。最终,刘晓波打算在项目中筹到资金,成功转至500万元。

Liu还是"Easy Mastery on BBC micro:bit python programming"和"Scratch Programming Paradise: Easy to Make Cool Games"一书的译者。两本书的译者简介显示,国际资深创作者莫比熙创始人兼CEO刘廷阳12岁时入选中国科学技术大学初级班,获得清华大学硕士学位和美国斯坦福大学博士学位。

然而,9月12日,中国科学技术大学新校友基金会发表了一份虚假声明,称刘是"假神童"和"即将崩溃的人工智能棒"。

基金会表示,9月4日,他们接到校友投诉,称刘强东经常与科大初级班的校友一起出现在苏州工业园区,涉嫌欺诈。经调查,他们至今未在第一届78名初中生中发现刘的名字,所有中国科技大学"文化大革命"后入学的本科生,中国科学技术大学校友会(一般)的公开注册记录和所有校友名单(不限于初级班学生, 不限于本科生)。他们还联系了所有相关机构,如中国科技大学档案馆和初级学院,以确认没有校友找到刘。

此外,该基金会还透露,经调查,他们确信刘晓波在清华大学和斯坦福大学的经历也涉嫌欺诈。

该基金表示,它于9月5日15:00向刘和摩拜黑克的所有公开电子邮件发送了一封电子邮件,限制了刘在24小时内的回复。刘晓波被要求在9月20日18:00之前以规定的方式公开道歉。但"刘尚未回复电子邮件,放弃了证明自己清白的机会。"

2 "人对人智能终端",主要AI数据标签

刘的创业公司Moby-Hei Guest,根据其官方网站,是一家"利用NLP技术,人工智能技术和BI技术创建准确智能分配任务的B2B2C平台公司","以人工智能终端,池群智能,从而解决大规模非标准任务和其他人机交互问题"。"

简单地说,在人工智能行业的上游,主营业务是数据标签。

冒牌神童背后的AI数据标注:产值不高但被三四线城市瞄准

Moby Hi Guest Website.

近年来人工智能的兴起与基于大规模数据分析的机器学习等技术的突破有关。对于要从大数据中学习的机器,它首先需要将数据标记为易于机器理解。例如,一台机器在学习了大量标记为"猫"的图像后,学会了判断另一个图像是否是猫。此标记过程称为数据标记。从第三方软件可以查询,Moby Hi-ker拥有3项发明,外观专利,软件著作权16项。

从对Moby-Hei客人的描述"到人类智能终端,池群智能",数据标签和人工智能研发,更具劳动密集型特征。有媒体将数据标注称为"农民体力劳动",将数据标注企业称为"AI富士康"。

业内人士告诉南都记者,虽然与研发相比,数据标注技术含量不高,但这并不意味着数据标注没有技术门槛。随着人工智能行业需求的不断增加,数据标注这个子行业也在升级,数据采集、审计、标注对专业的要求也越来越高。例如,审查语音文本转换或图像的专业要求很低,但审查自动驾驶和医疗保健等领域的数据需要审计人员具备一些专业知识。另一方面,用于数据标签的软件工具也在不断发展和成熟,许多简单的标签工作已经移交给软件工具。

业内人士观察到,大部分数据标注企业集中在三四线城市,较少集中在一二线城市。他分析说,这是因为一方面,三四线城市的劳动力成本较低,企业更有可能扩大规模,另一方面,如果三四线城市想要发展人工智能产业,就没有研发优势,而是更多的职业教育人才储备, 数据标签行业是一个更合适的切入点。"虽然产值不高,但可以留下很多人,驾驶效果不容忽视。

去年9月,黄河新闻网报道,白鲸黑科与山西省鲁梁经济技术开发区联合成立的鲁梁数字科技有限公司,通过吸收大学毕业生和贫困劳动力开展数据标签工作,推广当地贫困劳动力的就业体验。据悉,农村贴标人员月收入稳定在2000元左右。

3.非一线城市多,抱怨"好补贴不在手"

刘某的七家Mobi Hi-Customer数据标签公司,除了最早的一家在深圳外,分别位于盐城市、大连、苏州、洛阳、沈阳和盘锦。这也从侧面得到了证实,上述数据标注企业大多没有选择一线城市。

南都记者查询刘晓波的知识和微博账号,基本上都是关于互联网行业的内容。2019年,一篇题为《苏州适合创业吗?》的文章知情回复称,摩拜喜驰之所以要迁往苏州,是因为"感受到苏州工业园区最大的诚意",企业是AI服务业企业的负责人,"苏州工业园区管委会特别重视"。"此前,Moby-Heck在深圳的研发部门,但深圳的启动成本太高,在大连和沈阳有近300人,抱怨"整个东北确实是一潭停滞的水,当地政府没有诚信,此前表示好的补贴还没有送到手上。"

自2015年以来,中央层面不断出台人工智能产业政策,各省市也公布了自己的产业扶持政策。特别关注的苏州工业园区在2017年表示,将在三年内拨出超过15亿元的财政资源,支持人工智能相关产业的发展,同时建立并引入200亿至300亿元的产业基金。2018年将开设专门的AI产业园,2020年,将发布苏州工业园区AI产业三年专项行动计划(2020-2022),继续布局AI产业。

大连和沈阳等城市也在瞄准人工智能。去年11月,盐城举办了首届人工智能产业高峰论坛,共签约9个人工智能项目。也是在去年年底,Moby-Hei的客人定居在盐城南高科技区。在签约仪式上,Moby-Hei还承诺在五年内与盐城的九所高职院校和一些科研院所合作,开发人机交互和数据资产管理专业,分阶段为AI行业专业知识提供培训服务,并提供大量实习机会。

撰稿:南都记者马家璇 李亚宁

继续阅读