本报北京3月20日电(中青报·中青网记者 贾骥业)记者今天从国家数据局了解到,我国7个数据标注基地已形成医疗、工业、教育等行业的高质量数据集335个;赋能121个国产人工智能大模型研发;引进和培育标注企业223家;标注从业人员达5.8万人;带动数据标注行业相关产值超过83亿元;数据标注总规模达17282TB,相当于中国国家图书馆数字资源总量的6倍左右。
数据标注指的是对数据进行添加标记、说明、解释、分类和编码的过程,是提升人工智能算法、模型核心能力的关键环节。目前,我国有7个数据标注基地,分别位于四川成都、辽宁沈阳、安徽合肥、湖南长沙、海南海口、河北保定和山西大同。
来源:中国青年报
2025年03月21日 04版