AI训练师的困局：喂饱AI，饿死自己

时间: 2024-07-14 本站作者

“工作越积极，我被淘汰得越快！”

这听起来荒诞的现象却在AI行业如火如荼地上演。

当一种新技术诞生时，往往会带来新的工作类型。数据标注就是大火AI下的其中一种新职业。

在判定式AI的时代，人工智能中的人工主要是数据标注，帮助AI处理数据，进行分类。

到了生成式AI的时代，机器代替了原来的数据标注，但对人工的需求却没有减少，反而变成了更高的工作需求——AI训练师。

数据标注员还是AI训练师？

很多时候，市场常常将数据标注员和AI训练师混为一谈，两者都是伴随人工智能技术发展起来的一种工作类型。但实际上，负责的却是AI大模型训练中不同的阶段，且价值相差甚远。

回到在AI大模型的训练过程，主要有五个步骤：数据准备、模型设计、预训练、微调和模型部署。

数据准备便是数据标注员主要负责的环节。而AI训练师的职责范围覆盖更多环节，包含了预训练、微调和模型部署。除了具体工作内容不同，职位也有所不同。

在数据准备的环节中，数据标注员要完成对数据的处理。例如，在一张图片中，框出不同的物体并打上机器可以理解的标签，相当于教机器认识世界。这个过程不仅有图片，还有语音、文本、视频等数据。

而AI训练师则需要结合业务需要来训练数据、进行算法测试，推进模型的实际落地。另一方面，AI训练师还需要根据测试结果，反推数据准备环节的标注体系，提出对标注工具的功能建议、协作流程优化等。

总的来说，就是一手调参数，一手抓数据，让AI生成的内容更准确。于是常常招聘要求AI训练师需要有一定的IT技术背景。

在一些特定的行业，例如游戏、电商等，还会将AI训练师的工作称为“炼丹”——AI训练师需要不断地对模型进行调优、测试，大量尝试的经历就像炼丹一样需要精细的操作。

这两种职业难度的不同，最直观的还是市场薪资的差距。

AI训练师的薪资一般起薪在10k以上，而这个数值对于数据标注员来说，降到了4k。在一些非一线城市，数据标注员的起薪甚至降到了2～3k。

值得一提的是，更多的数据标注岗位是以兼职的形式出现，不需要坐班，有电脑就行。

一位招聘人员告诉PConline，兼职的薪资按劳动量来计算。招聘人员给出了一个公式：

薪资计算方式：完成2000框=8 +* 元，完成4000框=16 + *元，完成5000框=20 +*元。

这种被称为“计件模式”，基础工资加阶梯式奖励。当处理的数据超过某个数额时，会赚取更多奖励。市场上也有不少直接明码标价的，“拉一个框2毛钱”，多劳多得。

在招聘信息上常见的话术是“项目多，结算快，宝妈、学生党速来！”“赚钱上不封顶”。PConline尝试发现，刚上手的工作人员拉一个框需要1分钟，一天8小时工作，算一天拉500个框，一个月工作25天，才能赚到2500元。

高薪下的出路迷茫

AI的发展影响着政策的变化，此时整个数据服务市场也进入了高速发展期。在2020年，由人社部、工信部等单位共同参与制定的人工智能训练师国家职业技能标准2021年版下文简称为标准中，AI训练师作为一门新兴职业被纳入了标准职业的范围。

AI训练师的职业技能划分为五个等级。值得注意的是，标准将数据标注纳入AI训练师初级工五级的职业功能之一。数据标注的工作正式成为AI训练的“子集”。

截图来自人工智能训练师国家职业技能标准2021年版

根据德勤发布的数据，中国人工智能基础数据服务的市场规模在2027年有望达到130-160亿元。

除了占据先发优势的互联网巨头——阿里众包、百度智能云数据众包等，还有不少在这个风口冒出来或是获得了迅猛增长的明星企业。

例如科创企业海天瑞声。受到AI浪潮的影响，去年该公司股价涨幅超过70%。还有“AI五小龙”之一的老牌AI公司商汤科技，在2023年财报中表示，“生成式AI收入由2022年的人民币394.7百万元增长至2023年的人民币1，183.7百万元，增幅达到199.9%”。

据天眼查数据显示，仅“数据标注”领域，目前我国就有2500余家公司。但与快速扩张的市场规模相比，行业人力资源却面临严重紧缺。

根据2020年人力资源和社会保障部官网发布的新职业——人工智能工程技术人员就业景气现状分析报告，我国人工智能人才目前缺口超过500万，国内的供求比例为1：10，供需比例严重失衡。

猛然一看，这个行业缺口大，薪资高，是一片蓝海，只要进去就能成为“第一批吃螃蟹的人”。事实上却劝退了观望的人，因为职业路径却不够清晰。

不少网友分享AI训练师的职业发展，无外乎两种方向：

一是继续考级，成为技术专家或顾问后，考虑团队管理；

二是开数据标注公司。有过训练师的经验，更了解上游的要求和玩法。如果老家是非一线城市，可以直接回家开个数据标注公司。“用三四线城市的低人力成本，赚全国的钱，降维打击。”

许多网友诙谐地将数据标注员称为“拉框的”，而AI训练师则是“调参侠”。这样的调侃背后，其实也是对职业未来规划的担忧，对未来没有安全感。

被取代的未来

回到学术界，AI训练师的工作其实是生成式AI发展中的一种范式，叫做RLHF，Reinforcement Learning from Human Feedback，人类反馈强化学习。

就像是小孩子刚开始咿呀学语的时候，大人不断指着街道上的车辆告诉小孩，这是“汽车”。随着大人的教学，小孩子才能逐渐将“汽车”和看到的事物联系起来。

这种范式就是需要AI训练师不断地“鼓励”AI生成的正确答案，“修正”AI的错误答案，从而让AI生成的内容更加准确。

其实，这就是人工智能中人工两个字的来源。但是从去年9月开始，情况发生了改变。

去年九月，谷歌发布了一篇主题为RLAIF的论文， Reinforcement Learning from AI Feedback AI反馈强化学习。谷歌提出，RLAIF用AI来代替RLHF当中的人类，完成生成反馈的工作，让大模型不再受制于人类的局限。

在对比分析后，谷歌研究员发现，RLHF和RLAIF训练后的模型生成的答案倾向性几乎没有差别。甚至一些细节上，RLAIF还更胜一筹。

技术的发展速度超过了所有人的想象。OpenAI最新公布关于CriticGPT的论文引起了不少轰动。“Critic”是批评家的意思，这个AI模型的主要功能就是在RLHF训练中挑错。名副其实的“用魔法打败魔法”。

截图来自OpenAI官网

根据OpenAI内部训练师的分享，在找bug方面，人类训练师的成功率是25%，而CriticGPT则达到了惊人的75%！这简直就是妥妥的断人财路。

虽然， AI模型“抄近道”、幻觉等问题还是困扰着这些AI巨头，但网友们看到这些技术之后的第一反应是：下一个被干掉的会不会就是AI训练师？

“prompt之类的调试，肯定会往标准化的方向走。那么一旦标准化，训练师自然就没啥价值了。”大厂资深运营牛同学对PConline说道。

“AI教父”吴恩达也曾表示过，真正的AI不应该是用prompt来调动，而是自然语言。这也就意味着，AI和实际使用的用户之间应该做到直接沟通，而不需要其它“桥梁”。

牛同学对PConline分享道，在身边有很多朋友准备考人工智能训练师的证书，想要转向AI赛道。但他给出的建议是不要“一股脑儿投入”，按照现在的技术发展速度来看，极有可能“还没就业，就先失业了”。

这便带来新的迷思，身处AI领域的从业者，其实安全感并没有保障，特别是重复类的工作，只有能够适应市场需求的工作才更有发展潜力，因为“AI训练可以标准化，但需求是一直在变的。”

猜你喜欢