当前,数字化、智能化进程大大加速。人工智能进入产业级大模型时代,2022年全国约需200万专业数据标注师。
2000年,人社部公布了“人工智能训练师”职业。2021年,人力资源社会保障部联合工业和信息化部组织有关专家,将“数据标注师”列入国家标准中“人工智能训练师”的工种之一。
(相关资料图)
(百度智能云海口数据标注基地数据标注区 黄梦鑫摄)
为适应人工智能商业化落地进程加快、应用场景不断拓展的产业级大模型时代,百度智能云与政府合作,在全国建设了十余个百度智能云数据标注基地。其中,百度智能云海口数据标注基地于2023年4月份开始投产运营,目前主要承接自然语言处理等大语言模型相关业务,未来计划持续培养AI训练师、模型精调师、指令工程师等,形成大模型时代人工智能数据服务人才矩阵。
据了解,数据、算法、算力是人工智能的三大核心要素,作为首要要素的数据是一切智慧物体的学习资源,数据标注服务作为人工智能基础数据服务的核心环节,是借助特定软件工具,对大模型生成的内容进行打分、排序,使大模型通过大量学习这些人类反馈数据,具备自主生成内容的能力,从而化“人工”为“智能”。
(百度智能云数据标注基地业务产品负责人胡驰介绍公司情况 黄梦鑫摄)
8月24日,在媒体探访时,百度智能云数据标注基地业务产品负责人胡驰说,百度智能云是国内云计算第一的厂商,多年持续领跑国内云计算的市场,特别是在工业质检、人脸检测、对话式智能客服等AI云领域。基于市场对大语言模型的需要,百度今年推出了国内首个大语言模型产品——文心一言。
“与传统AI场景下,基于客观规则的‘拉框、描点、划线、区域、转写’等形式的数据标注不同,大模型标注基于偏主观的标注规则,通过‘排序、打分、评估、多轮对话、内容生成’等形式,完成问答、对话、专业领域的问答和对话等标注内容。‘文心一言’就是基于大模型标注训练的人工智能基座型的赋能平台,后续还将推出模型评估的服务以促进和牵引数据和模型的迭代和优化。”他说。
据了解,基于海南自贸港对于数字经济产业发展的政策和未来在自贸港数据的安全有序流动的吸引力,海口市委和秀英区委与百度智能云积极洽谈对接,于2022年12月将百度智能云海口数据标注基地落地海南省海口市秀英区。
(海口市秀英区委常委、常务副区长石晟屹发言 黄梦鑫摄)
海口市秀英区委常委、常务副区长石晟屹肯定了百度智能云海口数据标注基地的落地,对于秀英区参与海南自贸港核心区建设,实现高质量发展的重要意义。
“AI产业的发展日新月异,秀英区数字经济基础薄弱,但数字经济一直在正增长,具有发展数字经济的潜力。百度核心技术在算力、算法和数据方面具有独特优势,特别是无人驾驶、文心一言,包括机器人的一些产品系列。未来,标注基地将会投入更多的AI技术,相信这些技术会让秀英、海口,乃至海南自贸港在新一轮产业的竞争中占领到一个技术的高点。”他说。
除数字经济本身的发展和数据标注基础业务外,百度智能云数据标注基地通过引入统一标准化专业培养体系,帮助客户培育区域AI人才,并依托百度技术与生态优势提供一站式的创业扶持,助力区域数据标注企业孵化成长,带动当地就业。截至8月24日,海口基地已注入数据标注服务商4家,现场作业人数达数百人。
(中国日报海南记者站 陈博文)