AI标注流水线上,被抛弃的“妈妈工人”
文丨徐爽
编辑丨杜雯雯
“妈妈工人”,她们通常被这样称呼。
大多数时候,她们的工作内容是在电脑前训练AI——就像教会自己的孩子一样。
在过去几年的宣传叙述中,这些女性的故事,通常与“公益新模式”“AI + 扶贫”之类的宏大用词挂钩,被视作乡村女性实现“白领工作”的化身。大山里走出的人工智能培训师,人们如此夸赞。
但这其实是一个“梦幻泡泡”逐步破裂的故事。
浙江大学社会学系副教授吴桐雨,与华东师范大学传播系副教授夏冰青,在标注行业刚开始兴盛的2019年,开启田野调查,并持续至今。她们走访各地标注车间,试图了解这一新兴产业背后的劳动问题。
起初,在贵州某贫困县,这份看似体面、灵活、门槛低的工作,甚至能解决长久以来的留守儿童问题——当地政府和招聘方,都用它召唤远在外省打工的女性“大雁归巢”。但随之而来的竞争与陷阱,却把身处其中的女性,推向比过往更艰难的困境。
至今,也没有关于妈妈工人在中国的具体统计数字。她们是未被准确书写的一群人。
妈妈工人不善言辞,这是学者反复提及的一点。她们鲜少表达自己的苦痛,更多成为家庭决策中的牺牲角色,宣传政绩的“巾帼榜样”。
她们教会AI,却淘汰自己。就像一枚“好用的棋子”,用完即弃。
这个春天,《凤凰周刊》记者访谈了两位学者。以下是她们的讲述,结合了论文内容——
“白领工作”
我们在标注基地见到李燕时,她正坐在一把劣质的人体工学椅上,脖子前倾,眼睛凑在屏幕前飞快地来回瞟动。框架眼镜挡住了她脸上的表情,只有手不带停地点拖鼠标。
她的眼前是一组汽车道路行驶图。但雷达扫描出的3D图像,是一团看不清轮廓的点状物。李燕需要对照2D图片,准确辨识出3D图片中汽车附近的障碍物,并在面板上一一标注出来。
标注是为了给AI算法提供准确的训练样本,俗话叫“给电脑喂数据”。AI通过学习这些数据中的模式和规律,获得智能视觉和语义理解能力。这是人工智能产业链上最基础、最需密集劳动力的环节。每一个AI的成长,都离不开它。
一张标注平台的3D点云图 | 网络
基地里,有二十多位像李燕这样的女工,她们年龄从28至35岁不等,多是低学历女性、单亲妈妈或家庭主妇——这和我们来调研之前的预想是大相径庭的。
毕竟社会建构出来的一套话术是,男性比女性更适合电脑工作。没想到,“妈妈工人”是这间基地的劳动主力。
标注基地位于一所扶贫社区内。外墙刷着标语,“出大山、求发展、城镇安居天地宽”。社区建筑和南方的工厂宿舍有点像,统一整齐,间距紧凑。远看是现代化小洋楼,但走近发现,底部的架空层都没造好,水管裸露,下雨时粪水到处流。
而基地内部像是另一个世界。
和她们过去在沿海打工时不见天日的流水线工厂不同,这里有窗,能见阳光,配备了电脑和空调,也没有大型机器发出的轰鸣噪音。基地甚至聘请了一名园艺师打理绿植,像北上广的互联网大厂一样,一切都是白领办公室的氛围。
就连装修也是按这家基地的源头企业——C厂的风格打造,桌子被涂成C厂的标志性颜色。
基地运行一段时间后,一批表现优秀的妈妈工人被邀请到C厂总部学习,她们和程序员在一起上班,参观车辆如何自动驾驶。
妈妈们看完后说,觉得自己的工作突然变得鲜活,有意义了。在和我们访谈时,她们将培训期间学到的一整套概念不停地重复给我们听,比如“要做人工智能的老师”,“有多少人工就有多少智能”。
她们努力把自己跟大厂连接起来,觉得某种程度上也是大厂的员工,笑称是“赚着大厂的钱”。
以前,她们并不懂什么是AI,是被规训到对此“有感觉的”。她们的家人既不了解什么是AI,也不知道她们的工作内容,唯一关心的就是——这活儿能拿多少钱。
我们第一次和妈妈工人刘翠敏见面时,她是戴着眼镜的。说了会儿话后,她把眼镜拿下来,“因为戴着不好看”。
这份工作的确很费眼睛。李燕有一段时间视力下降得特别快,吓得赶紧去医院检查。做这份工作后,眼睛出现问题的人很多。后来,一些妈妈工人即使没近视,也都买了防蓝光眼镜佩戴。
李燕总抱怨上班的时候要“揪着眉毛去看屏幕”,这让她的“川字眉”更深了。但这是一种基于经济满足之上的、有点愉悦的抱怨——当地居民的平均月收入在2000元左右,相比之下,这份月工资能达到四五千元的标注工作,算是相当不错。
这份工作,对妈妈来说是一个适应新事物的过程。标注面板上所有东西以参数形式呈现,更符合工程师和电脑的逻辑。妈妈们一开始不太上手,但很勤奋,愿意每天无偿练习。几个月内,有人的月产值从1400条涨到好几万条。
妈妈们总是不太自信,羞于谈论自己的成绩。实际上,我们访谈的那几位都是基地的“尖子生”,产值排在最前列。
在2019年订单充足的月份里,产值高的妈妈工人月收入甚至达到上万元——尽管这只持续了短暂的几个月。
竞争中,成为“差生”
变动始于2020年。
C厂在全国陆续开设了多个标注基地,李燕所在的贵州基地不再是唯一的“嫡系”工厂,干得不好随时得把项目交给别处。这使得基地之间的竞争愈发激烈,大家不得不“抢单子”做。
基地的经理峰崽,是关键人物。这位“985”大学毕业的年轻人,日常负责对接C厂的需求与统筹妈妈工人的工作——基地有扶贫性质,社区书记是基地的总负责人和法定代表人,峰崽,就是书记从当地居民中挑选出来的。
为了提高订单的效率,峰崽的策略之一,是争取将“妈妈工人”的比例降到25%以下。
在重新发布的招聘信息里,要求变为“18至28岁,高中以上学历,具有电脑基础和理解能力强”——这很大范围地筛除掉了妈妈工人群体,也动摇了原本基地扶贫的初衷。
另一个策略是分组,加大竞争。
峰崽渐渐将剩下的妈妈工人聚拢在一个组里,也就是他口中的“差生组”。他尽量避免让这个小组承接难度较高的任务,从而减轻妈妈工人对于整体业务能力的影响。
和“差生组”不同,另一个“万元户组”的工人都是年轻、业务能力强、愿意加班的女工。这是峰崽的“黄金战队”,订单充足的情况下,几乎人均月工资能达到万元以上。
峰崽非常看重“万元户组”,竭尽全力留住这个小组的女工。当时组内有个能力特别出色的女孩叫小林,她因为长期失眠问题提出辞职。峰崽来找我们时说,“出大事了”,要和我们一起商量如何留住这个女孩。
这跟他对待妈妈工人的态度截然不同。从2020年起,陆续有妈妈工人被峰崽劝退。
一位怀孕的妈妈得到的评价是“爬坡期太长”。“回去照顾小孩吧,不要再来上班了。”峰崽说。妈妈工人们时常受到苛责,被嫌弃“动作慢、效率低”,“要不你们去楼上工厂做纺织,那里你们更得心应手”。
一名数据标注工正在工作 | 视觉中国
“差生组”和“万元户组”的组长都来自早期组员。“万元户”组长晓红是一个年轻干练的女孩,产值组内第一。但没有一个妈妈工人当上过小组长。“差生组”的组长是建哥。建哥呆板执拗,整体能力比晓红差很多。因为他跟峰崽是好哥们儿,才坐上了管理岗。
建哥会辱骂妈妈工人。他在群里习惯不停地@某个人,质问“你为什么错,为什么学得这么慢,为什么跟不上最新的规则”,连续@六七次。你想,妈妈出错后已经很手忙脚乱了,这种互动只会让情况恶化。
暴怒的时候,建哥会狠拍桌子,“你给我过来!”妈妈站着,建哥坐在那儿训。事后妈妈工人刘翠敏给我们讲这些经历时,哭得泪汪汪的。
分组之后,一些费时费力还没钱拿的差事都分流到了妈妈组。峰崽的说法是,妈妈本身做不了更难的。但我们觉得,妈妈是没有机会平等地去竞争,证明自己的能力。一上来就被认为是“排名最后的”,做次要的工作,那她们自然就被淘汰成“差生”。
年轻女工琴子也为妈妈们鸣过不平:“油水多的任务永远轮不到她们,她们经常不是在做训练集就是在返工。”
年轻女工和妈妈女工的关系还是很亲近的。年轻女工会主动给妈妈们出错的项目返工,帮她们照顾放学后来基地的孩子,陪着玩耍。大家平时以姐妹相称,工作之余还相约去附近逛街。
分组并没有让女工之间的关系变紧张,大家很清楚地知道,谁是真正欺负她们的人。
互联网大厂擅长数字量化,C厂把对互联网员工的管理模式,也直接移到了标注工身上。他们制定了一套复杂的计分系统,干什么都得换算一下。这导致,妈妈工们对于自己一个小时的产值,是不清楚的。
她们会画正字,做了多少条就画几笔。可每次一结钱,画的“正”字跟她们得到的钱是不相符的。有人说自己加班到凌晨,最后发现根本就没赚几块钱。我们也试着去算过工资账,算了快三小时,也没算明白。
让我们难受的是,即使C厂把计算体系变得这么复杂,妈妈们还在试图弄清楚自己到底做一条赚多少钱,以及为什么这个月赚这么少。
她们会觉得,这是自己的能力问题。
监控与反抗
坦白说,妈妈工人是我们见过最老实、安静、认真工作的标注工群体。
这些年我们见到不同的社会边缘群体都在做标注。残障工工作期间爱聊天,职校生老溜出去玩,或是蹲楼门口抽烟、打游戏。
只有妈妈工人,一坐就是一整天,全程安安静静地干活。也就下午四点小孩放学那会儿分一下心,把孩子接来自己的工位上写作业。喧闹通常不超过一刻钟,办公室又会恢复宁静的工作状态。
工作的同时能兼顾孩子,本是这间标注厂一项隐形的默契。基地特意建造在扶贫社区内部,招聘方一开始的宣传就是“家门口就业”。但这项默契,随着峰崽更改管理制度,被逐步打破。
峰崽的身份其实一直有些尴尬。这里是熟人社会,峰崽比妈妈们年纪小,辈分上算是人家的“大侄子”,可他又得树立权威去管理。
起初,峰崽经常会有“玩不转”的时候——
比如,我们第一次去调研,峰崽站在小广场上,刚一说出口“大家必须按时上下班”时,妈妈们便把峰崽团团围住,七嘴八舌地提出自己的理由:要伺候家人的早饭,要送小孩上学,上班前有一堆家务琐事要干……有妈妈教训峰崽,“你还没结婚,不懂过日子的难处”,也有人直接质问,“你刚招我们的时候可不是这么说的”。
最后,峰崽只能不了了之。
一年后我们再去时,发现峰崽会躲在摄像头后面吼人。因为他意识到,通过线上控制能摆脱掉熟人关系的困扰,更有效地实施权力。
李燕提过,起初她以为房间里的摄像头只是个摆设,直到有一次,摄像头里突然发出峰崽的呵斥声,她吓得心惊胆战。在那之后,每次看到摄像头她都有些心理阴影。
这很符合社会学理论强调的,监控的逻辑在于,被监视者无法确知何时有人在监视台,以为监视者一直站在那里。这能起到时刻监督的作用,实现权力的驯服。
看似白领氛围的标注基地,实质上仍是按照监控逻辑的工厂来建设,甚至比流水线工厂更甚——工厂巡视是放明面上的,摄像头制造的恐惧是后知后觉的、持久的震慑。
2020年基地转型时,曾有一支河南的“专业团队”过来帮忙管理。他们在二楼建了一个经理室,透明玻璃墙,方便管理者随时监督下方,妈妈们抬头也能看见这几个人在里面忙碌,“好像在干着多么惊天的大事”。
后来产能提高,河南团队便撤出了,峰崽独自掌权。不过,峰崽没用那个透明的经理室,而是在一楼重新装修出一个完全封闭的屋子。招人、培训、裁人,他都是在那个“小黑屋”里完成。
两年的时间,我们看着峰崽从一个屈从于乡里乡亲的“小年轻”,逐渐变成为成熟、严苛的管理者。
一间数据标注基地的工作场景| 网络
新的平台经济下,每个工人都抽象成一个IP。对于大厂而言,点对点地管理人这件事变复杂了。因此,妈妈平时会利用这一点,去做一些微小的反抗。
比如,有妈妈在上班期间溜出去接孩子放学,会请另一位同伴顶着她的IP接着干,以免被系统发现。又比如,妈妈们的住所离标注基地很近,不足1000米,这导致上班打卡程序在定位上容易误判。她们就利用这一程序漏洞,提前在家线上打卡。
但峰崽也住小区里,熟悉当地情况,很快他就调整了程序的距离敏感度,让妈妈们的小伎俩纷纷落空,反抗失败。
现在大家讨论数字劳动,都说“困在算法和系统里”。但我们想强调的是,算法背后还有一套“人的逻辑”,使得弱者反抗的空间变得更小了。作为老乡和亲戚的峰崽,把对妈妈们细枝末节的了解,变成了武器——来填补算法的“盲区”,让管控变得更全面和彻底。
同样地,快递、外卖、打车等互联网行业都有类似峰崽这样的存在。如果说算法控制代表着技术抽象、冷漠、“计算”的一面,那么透过峰崽们,可以看到更复杂的背面。
大厂、峰崽、妈妈工人实际上是三角权力关系,常出现两两结盟的情况。峰崽并不是总站在大厂那一侧,偶尔他也会和妈妈工人一起,钻算法的“空子”。
C厂放出“很香”的数据任务时,峰崽便放松监管,号召大家来抢新的数据包,以避免被别的厂占先。他甚至从网上找来插件,提供“作弊”的技术支援。
峰崽和妈妈工人的这种偶尔、小规模的结盟,其实在一定程度上弱化了工人的反抗情绪,反而阻止了大规模的集体反抗。
归来,梦碎
对于妈妈们来说,年轻时代外出打工也曾是一种反抗。
回贵州老家前,李燕是东莞某电子厂流水线上的一名女工。她从十几岁便出门打工,结婚、生子,都在他乡完成。
贵州本地人把南下广东叫“杀广”:单身一人,“杀”到城市,赚钱养家。李燕爱讲自己的“杀广”故事,带着自豪的语气。对女工们来说,“杀广”代表着有勇气、愿意不顾一切地去尝试新事物,是很有魄力的。
寨子里这两代女人的人生,几乎接力构筑出一部中国沿海打工史:90年代后期,制造业兴盛,她们去制衣厂谋生;2010年左右,大量的服务业冒出来,她们又去餐馆当服务员,或站柜台卖珠宝……她们随着一波又一波的政策,变换自己的身份。
贵州喀斯特地貌,为数据产业低成本发电提供可能
2015年,政策转向消除城乡差距,推动乡村发展,于是打工妹们又回流到老家。
当年驱动年轻打工妹外出的,是她们对自由的向往——能短暂逃离婚姻和乡村现实。为此,有人几次三番偷跑出去。而这一次,打工妹们之所以愿意回来,当地政府的劝服话术还是很成功的。
他们会利用女性母职的内疚心,强调妈妈们有义务担负照顾家庭和孩子的责任。
比如会说,因为你们之前长期在外打工,导致孩子和老人无人看管——很多妈妈是很吃这套话术的,把所有的问题内化为自己的责任。
除了思想动员,还有经济上的激励政策——异地搬迁房,每家需要回来一个人,才能分到一个安置房的名额。
此前妈妈工人家庭的居住地多是在山上的寨子里,当地政府想在山下重建一个聚集地,相当于用拆迁社区替代原本的山寨。
但村民住不惯楼房,尤其是老人,总想跑回寨子里住。对于社区来说,如果一个家庭中的女性能留在这里,那么这个家庭更有可能在社区中扎下根来。
为了稳住这些女性,社区承诺帮她们找工作,每个月发250至400元补贴,以保证劳动力不会重新外流。这些家庭多是夫妻双双在外打工,为了安置房名额,在“谁走谁留”的家庭内部协商里,女性通常是被“牺牲”的那个。
对于常年在沿海打工的妈妈来说,她们习惯了长期以来工作的不稳定。她们不清楚五险一金包括哪些,也没有签过正规的劳动合同,不具有基本的劳动保障意识。
但妈妈工人也不是像“三和大神”日结工那样,干一天结一天。她们还是带着希望回来的,期待标注干个一两年后,做点小生意。但这份工作,其实是一个梦碎的过程。
工资变少对于妈妈们打击很大。
李燕之前是基地产量最高的女性,月收入过万。拿到工资后她给儿子买玩具衣服。家里满屋的玩具,被她收拾得整整齐齐。她很认真地在生活。
可等我们第二趟去的时候,她明显变得不快乐。被分组后的李燕每月只能拿到1400元。她不怎么给小孩买玩具了,和丈夫的关系也变淡了很多——在外地打工、承担主要经济压力的丈夫很少回家。
大家虽然从山寨下来了,但思维依然遵照传统农村社会的伦理观。
我们去李燕家吃饭,她就默默待在厨房里面,忙着一大堆人的饭。她的婆婆不干活,倚在厨房门口,挑剔李燕拿勺子擓油的动作,说很多恶毒的话。工资下降后,李燕她们在家变得越来越卑微。
打工妹时期的女工,是拿金钱换地位——用在工厂挣的钱,资助弟弟上学。虽然这么做也有问题,但是确实能获得话语权上升。标注挣钱多时,李燕在家里能挺直腰杆。后期工资缩水,她在婆婆面前的底气又没了。
更严重的是,妈妈们被这个社区套牢了。她们深陷母子、夫妻、婆媳关系中,不得不承担起家庭分工的责任。她们经常念叨,“唉,实在不行我就出去打工。”
但实际上她们至今还留在这里,不做标注了也是在附近找份别的工作,并没有像当年打工妹时期,随时可以离开这个家。她们陷入比打工妹时期更糟糕、价值感更低的境地,出不去了。
其实以前李燕她们沿海打工的生活很丰富,没有小孩和老人的周末,能和小姐妹出去唱歌、逛街、买衣服。
但回到贵州安置社区后,生活变单调很多,轨迹也几乎是两点一线——家和家门口的标注基地。
她们不熟悉小区之外的世界。我们当时住在离小区步行七八分钟的一家酒店,门口有早市,能买到比小区超市更便宜、新鲜的蔬果。但她们住了快两年,压根不知道酒店和早市的存在。
这是很伤人的。当人走出去,见识了世界,有一些自我意识和自主生活后,却又回来了。其中肯定有很多痛苦,但她们表达不出这种痛苦,只重新把“自我”压抑下去了。
尽管我们旁观者都觉得,这样的前后境况对比很明显,但是妈妈们从未表达过“后悔回来”。
作为母亲,不管境况多差,她们都不会说“后悔回到小孩身边”这种话。
一颗好用的棋子
从表面看,妈妈工人被摒弃,和整体的产业发展趋势有关。
目前最基础的数据标注工作已严重饱和,很多都被自动化替代,剩下的是机器解决不了的“更难的任务”——相关报告显示,未来五年,大模型时代的标注人才缺口或达百万。这些大模型的标注项目,对人的技能要求越来越高。当然,妈妈们并不是真的能力不足,只是这部分被默认轮不到她们来做。
妈妈工人被摒弃的根本原因,在于她们的顺服、乖巧,反抗性比那些以自杀为威胁的男性工人弱得多。对于资方来说,抛弃她们更容易。
不过你想,他们为什么不干脆把妈妈工全裁了,而是把她们变成一个小组,还留了一些在这儿?
说到底,妈妈们是一颗好用的棋子。
这些年,“AI标注+扶贫”的模式下,诞生了很多标注产业里的“妇女典型”,妈妈工人的形象被无限放大。她们在各种媒体采访中被推出来,成为具有表演性质的宣传工具人。
那些被打造成“贫困女性车间”的重要政绩,也用以吸引妇女基金会和政策补助。但实际上,这些妈妈的真实工资,被一层一层地压到最低。
而且一些非政府合作、纯商业目的建立的标注基地,会撕去这层“遮羞布”——妈妈工人,或者说低学历中年女性,绝不是用工主力。
妈妈们私下总和我们抱怨:“为什么要我们去接受采访呢?我们每天干的活都要返修,一个月才挣2000块钱,我在被采访的时候觉得特别心虚,心里不好意思。”
她们的心情是自责的、抱歉的,觉得自己不配代表基地接受媒体采访,仿佛“只有挣得多、有能力的人才能代表基地接受采访”。妈妈们不知道,这背后是分工导致自己的业绩差,她们总是习惯于把所有问题归因到自己身上。
2020年11月底,我们调研结束时,这个标注车间仍在扩建,从最早的40人,逐渐涨到180人。即便持续有人离职,妈妈工人群体也没有明显的收缩。
不过,现在脱贫已经不是当地最重要的事情。未来这个基地是否还会努力保住妈妈工人的这个“符号”,也是个问号。
离开贵州前的最后一晚,我们请几位相熟的妈妈工人去酒吧喝酒、唱歌,教她们玩骰子。
那天李燕有点喝多了,脸蛋红红的,一直在笑,拉着人疯狂说话。每个人都很开心,大家回忆起沿海打工那会儿,总爱一起去酒吧跳舞,“时隔多年,好像回到了那个自由的时光”。
(文中李燕、刘翠敏、峰崽、小林、晓红、琴子、建哥均为化名)
作者:徐爽
本文转载自微信公众号【冷杉RECORD】,关注冷杉RECORD,看见时代洪流中人与社会的故事。