AI训练师的困局:喂饱AI,饿死自己
“工作越积极,我被淘汰得越快!”
这听起来荒诞的现象却在AI行业如火如荼地上演。
当一种新技术诞生时,往往会带来新的工作类型。数据标注就是大火AI下的其中一种新职业。
在判定式AI的时代,人工智能中的人工主要是数据标注,帮助AI处理数据,进行分类。
到了生成式AI的时代,机器代替了原来的数据标注,但对人工的需求却没有减少,反而变成了更高的工作需求——AI训练师。
数据标注员还是AI训练师?
很多时候,市场常常将数据标注员和AI训练师混为一谈,两者都是伴随人工智能技术发展起来的一种工作类型。但实际上,负责的却是AI大模型训练中不同的阶段,且价值相差甚远。
回到在AI大模型的训练过程,主要有五个步骤:数据准备、模型设计、预训练、微调和模型部署。
数据准备便是数据标注员主要负责的环节。而AI训练师的职责范围覆盖更多环节,包含了预训练、微调和模型部署。除了具体工作内容不同,职位也有所不同。
在数据准备的环节中,数据标注员要完成对数据的处理。例如,在一张图片中,框出不同的物体并打上机器可以理解的标签,相当于教机器认识世界。这个过程不仅有图片,还有语音、文本、视频等数据。
而AI训练师则需要结合业务需要来训练数据、进行算法测试,推进模型的实际落地。另一方面,AI训练师还需要根据测试结果,反推数据准备环节的标注体系,提出对标注工具的功能建议、协作流程优化等。
总的来说,就是一手调参数,一手抓数据,让AI生成的内容更准确。于是常常招聘要求AI训练师需要有一定的IT技术背景。
在一些特定的行业,例如游戏、电商等,还会将AI训练师的工作称为“炼丹”——AI训练师需要不断地对模型进行调优、测试,大量尝试的经历就像炼丹一样需要精细的操作。
这两种职业难度的不同,最直观的还是市场薪资的差距。
AI训练师的薪资一般起薪在10k以上,而这个数值对于数据标注员来说,降到了4k。在一些非一线城市,数据标注员的起薪甚至降到了2~3k。
值得一提的是,更多的数据标注岗位是以兼职的形式出现,不需要坐班,有电脑就行。
一位招聘人员告诉PConline,兼职的薪资按劳动量来计算。招聘人员给出了一个公式:
薪资计算方式:完成2000框=8 +* 元,完成4000框=16 + *元, 完成5000框=20 +*元。
这种被称为“计件模式”,基础工资加阶梯式奖励。当处理的数据超过某个数额时,会赚取更多奖励。市场上也有不少直接明码标价的,“拉一个框2毛钱”,多劳多得。
在招聘信息上常见的话术是“项目多,结算快,宝妈、学生党速来!”“赚钱上不封顶”。PConline尝试发现,刚上手的工作人员拉一个框需要1分钟,一天8小时工作,算一天拉500个框,一个月工作25天,才能赚到2500元。
高薪下的出路迷茫
AI的发展影响着政策的变化,此时整个数据服务市场也进入了高速发展期。在2020年,由人社部、工信部等单位共同参与制定的人工智能训练师国家职业技能标准2021年版下文简称为标准中,AI训练师作为一门新兴职业被纳入了标准职业的范围。
AI训练师的职业技能划分为五个等级。值得注意的是,标准将数据标注纳入AI训练师初级工五级的职业功能之一。数据标注的工作正式成为AI训练的“子集”。
截图来自人工智能训练师国家职业技能标准2021年版
根据德勤发布的数据,中国人工智能基础数据服务的市场规模在2027年有望达到130-160亿元。
除了占据先发优势的互联网巨头——阿里众包、百度智能云数据众包等,还有不少在这个风口冒出来或是获得了迅猛增长的明星企业。
例如科创企业海天瑞声。受到AI浪潮的影响,去年该公司股价涨幅超过70%。还有“AI五小龙”之一的老牌AI公司商汤科技,在2023年财报中表示,“生成式AI收入由2022年的人民币394.7百万元增长至2023年的人民币1,183.7百万元,增幅达到199.9%”。
据天眼查数据显示,仅“数据标注”领域,目前我国就有2500余家公司。但与快速扩张的市场规模相比,行业人力资源却面临严重紧缺。
根据2020年人力资源和社会保障部官网发布的新职业——人工智能工程技术人员就业景气现状分析报告,我国人工智能人才目前缺口超过500万,国内的供求比例为1:10,供需比例严重失衡。
猛然一看,这个行业缺口大,薪资高,是一片蓝海,只要进去就能成为“第一批吃螃蟹的人”。事实上却劝退了观望的人,因为职业路径却不够清晰。
不少网友分享AI训练师的职业发展,无外乎两种方向:
一是继续考级,成为技术专家或顾问后,考虑团队管理;
二是开数据标注公司。有过训练师的经验,更了解上游的要求和玩法。如果老家是非一线城市,可以直接回家开个数据标注公司。“用三四线城市的低人力成本,赚全国的钱,降维打击。”
许多网友诙谐地将数据标注员称为“拉框的”,而AI训练师则是“调参侠”。这样的调侃背后,其实也是对职业未来规划的担忧,对未来没有安全感。
被取代的未来
回到学术界,AI训练师的工作其实是生成式AI发展中的一种范式,叫做RLHF,Reinforcement Learning from Human Feedback,人类反馈强化学习。
就像是小孩子刚开始咿呀学语的时候,大人不断指着街道上的车辆告诉小孩,这是“汽车”。随着大人的教学,小孩子才能逐渐将“汽车”和看到的事物联系起来。
这种范式就是需要AI训练师不断地“鼓励”AI生成的正确答案,“修正”AI的错误答案,从而让AI生成的内容更加准确。
其实,这就是人工智能中人工两个字的来源。但是从去年9月开始,情况发生了改变。
去年九月,谷歌发布了一篇主题为RLAIF的论文, Reinforcement Learning from AI Feedback AI反馈强化学习。谷歌提出,RLAIF用AI来代替RLHF当中的人类,完成生成反馈的工作,让大模型不再受制于人类的局限。
在对比分析后,谷歌研究员发现,RLHF和RLAIF训练后的模型生成的答案倾向性几乎没有差别。甚至一些细节上,RLAIF还更胜一筹。
技术的发展速度超过了所有人的想象。OpenAI最新公布关于CriticGPT的论文引起了不少轰动。“Critic”是批评家的意思,这个AI模型的主要功能就是在RLHF训练中挑错。名副其实的“用魔法打败魔法”。
截图来自OpenAI官网
根据OpenAI内部训练师的分享,在找bug方面,人类训练师的成功率是25%,而CriticGPT则达到了惊人的75%!这简直就是妥妥的断人财路。
虽然, AI模型“抄近道”、幻觉等问题还是困扰着这些AI巨头,但网友们看到这些技术之后的第一反应是:下一个被干掉的会不会就是AI训练师?
“prompt之类的调试,肯定会往标准化的方向走。那么一旦标准化,训练师自然就没啥价值了。”大厂资深运营牛同学对PConline说道。
“AI教父”吴恩达也曾表示过,真正的AI不应该是用prompt来调动,而是自然语言。这也就意味着,AI和实际使用的用户之间应该做到直接沟通,而不需要其它“桥梁”。
牛同学对PConline分享道,在身边有很多朋友准备考人工智能训练师的证书,想要转向AI赛道。但他给出的建议是不要“一股脑儿投入”,按照现在的技术发展速度来看,极有可能“还没就业,就先失业了”。
这便带来新的迷思,身处AI领域的从业者,其实安全感并没有保障,特别是重复类的工作,只有能够适应市场需求的工作才更有发展潜力,因为“AI训练可以标准化,但需求是一直在变的。”