当前的位置:泉州人才网 >> 新闻中心 >> 政前方观察|锁定数据标注新赛道,贵州加速入局 >> 正文
政前方观察|锁定数据标注新赛道,贵州加速入局
“聚焦做强做优数字经济,以建设高质量数据集为重点发展数据产业。”“数据是重要的生产要素,要加快发展数据标注等数据产业,夯实数字经济发展基础性支撑。”……近期,省委召开专题会对数据产业发展进行部署,“高质量数据集”“数据标注”引人关注。
中国电信云计算贵州信息园一角。(图/潘德玉)
“高质量数据集”和“数据标注”是什么?
高质量数据集,就是高价值、高密度、标准化的数据。
有专家曾这样比喻,数据之于大模型,就像石油之于汽车。石油只有炼化成汽油,才能驱动汽车。同样,原始数据需“炼化”成高质量数据集,才能供大模型训练。
因此,数据集的质量影响人工智能的“智商”。
而数据标注产业是对数据进行筛选、清洗、分类、注释、标记和质量检验等加工处理的新兴产业,是“炼化”的关键一环。
由于培育壮大数据标注产业对提升数据供给质量,推动人工智能创新发展具有重要支撑作用,国家已连续多年在政策层面给予指导,推动发展数据标注行业,建设高质量数据集:
2022年,《“十四五”数字经济发展规划》提出,聚焦数据的标注、清洗、脱敏、脱密、聚合分析等环节,提升数据资源处理能力,培育壮大数据服务产业;
2023年,《深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》提出,差异化统筹布局行业特征突出的数据集群,促进行业数据要素有序流通;
2024年,《“数据要素×”三年行动计划(2024—2026年)》提出,推动科研机构、龙头企业等开展行业共性数据资源库建设,打造高质量人工智能大模型训练数据集;
2025年,《关于促进数据标注产业高质量发展的实施意见》提出,到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%,培育一批具有影响力的科技型数据标注企业。
另外,从市场空间看,数据标注产业前景广阔。
《全国数据资源调查报告(2024年)》显示,2024年,我国开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%。利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14%,数据正促进人工智能加速发展。
《报告》还预计,2025年,全国数据生产总量有望突破50泽字节。数据治理、数据标注、数据智能等相关企业迎来发展机遇期。
由此可见,入局数据标注行业,正当其时。然而,不论国家政策还是市场空间,都是外部因素。跻身这条新赛道,贵州还需结合实际,发挥自身比较优势。
贵州梦动科技有限公司一角。(图/潘德玉)
发展数据标注产业,贵州的比较优势是什么?
数据标注产业具备两个鲜明特点,一是需要海量数据作原料,二是人力资源需求大。这两者正好是贵州优势明显的领域。
数据中心集聚是贵州的显著优势。截至目前,贵州已集聚48个重点数据中心,既存储了海量数据,数据中心本身也有数据标注需求。
数据中心可谓“油田”,要开采精炼“石油”,企业当然是距离“油田”越近越好。
同时,数据标注企业需要大量人工,如全国数据标注龙头企业东软集团、博彦科技等企业,员工都在数万人规模。
“我觉得贵阳特别适合发展数据标注产业,这座城市的活力非常强。”今年4月来黔考察的上海本原智数科技有限公司创始人李逆勇就认为,贵阳青年人口红利突出,产业基础非常好。
数据显示,贵州全省每年毕业生人数超26万人,其中大数据相关毕业生5.3万人。仅在贵安新区,已累计引育数字人才3.2万人,助力引育数字经济民营企业850家。
推动更多数据标注企业在贵州成长,以人才壮产业,用产业带就业,无疑将打开政府、企业、人才多赢的局面。
此外,贵州数据标注产业发展已有一定基础。
如黔南州惠水县的百鸟河数字小镇入驻167家企业,形成以数据采集标注审核应用服务等业态。
在贵安新区,已集聚中软国际、星长征等数据标注企业7家。2024年,数据标注营收2.8亿元,同比增长44%,从业人数增长107%。
总之,锁定数据标注行业,既有国家大力推动的局势,也有市场前景广阔的形势,如何发挥自身比较优势,形成加快发展的态势,正是我省数据产业壮大的重点课题。
百鸟河数字小镇。(图/潘德玉)
快马加鞭,贵州正在做些什么?
如何破题?政前方梳理发现,今年以来,为推动数据标准产业加快发展,贵州动作频频:
3月7日,省大数据局到上海开展招商考察,重点介绍我省在算力资源、政策支持、市场潜力、人力成本等方面的比较优势;
4月1日,上海市信息化企业家协会24家企业代表来黔考察,部分企业现场签约,与贵州在大数据、人工智能等领域开展合作;
5月6日至8日,贵州大数据集团携手贵阳市云岩区,聚焦数据标注产业发展赴上海开展招商;
5月29日,贵州首批14个公共数据授权运营产品正式亮相,首个数据开发利用加工基地同步揭牌投产。
6月4日,省委召开专题会,听取全省数据产业发展情况汇报,对加快发展数据标注产业进行部署。
专题研究、上门招商、签约合作、发布产品……可以看到,贵州发展数据标注产业已是离弦之箭,志在必得。
未来还要从何处入手?数据、企业、人才、园区、政策五个方面是关键。
要供好数据——推动公共数据集引领开放、行业数据集重点突破,以改革举措加快公共数据资源开发利用;
要壮大“数商”——围绕数据产业“一图三清单”精准招商引资,支持本土企业做大做强;
要引育“数才”——着力引进高层次创新人才,做足产教融合文章;
要聚合“数园”——突出集约集聚,优化空间布局,创新打造特色产业园区,形成优势互补的垂直分工格局;
要优化政策——营造更具竞争力的数据产业生态。
发展新兴产业,贵在先人一招快人一步。培育增长极点,贵在发挥优势久久为功。通过着力完善政策举措、优化产业生态、推动集聚成势,我们有理由相信,瞄定为大模型训练提供高质量数据集的目标,这次“加速”定能不断塑造贵州数字经济发展的新动能新优势。
贵州日报天眼新闻记者陈玉林
编辑曾书慧
二审陈毓钊
三审马刚