数据标注,如同为人工智能“喂养教材”,是让机器“看懂”世界、实现智能化的关键基础环节。11月17日,由沈阳市数据局与中国信息协会数据标注专业委员会联合主办的“东北地区数据标注产业高质量发展座谈会”在沈阳召开。会议期间,辽宁、吉林、黑龙江三省及沈阳、大连、长春、哈尔滨、鞍山、本溪、阜新、延边、大庆等多家数据主管部门联合发起“东北地区具备全球竞争力的数据标注产业集群”倡议,标志着东北地区数据标注产业从“单打独斗”迈向“协同作战”新阶段。
谋建“东北数据标注解决方案联合体”
会议围绕“专业化、智能化、国际化”发展方向,提出以政府引导、企业主体、市场运作为核心的协同共建模式,整合东北地区海量数据资源、丰富教育场景和全域产业基础,共同打造“东北数据标注”集体品牌,提升区域整体竞争力。
沈阳市数据局表示,为推动产业集群建设,东北地区数据系统正“握指成拳”,谋划组建“东北数据标注解决方案联合体”,整合三省在装备制造、农业、文旅、医疗等领域的特色能力,面向全国客户提供全栈式、高价值解决方案,告别低水平、低价格的“内卷”竞争。同时,联合开拓工业智能化、农业数字化、文旅融合等全域应用场景,将东北产业升级需求打包为“内需市场”,优先为区域内标注企业提供试验田和首用地,推动技术落地与产业赋能。
沈阳数据标注产业规模约25.9亿元
作为全国首批国家级数据标注基地,沈阳市在数据标注产业发展中走在前列。截至目前,沈阳已标注数据总量超过8323TB,形成134个高质量数据集,应用于76个大模型,参与制定国家标准2项、行业标准4项。全市引育数据标注企业65家,从业人员达11800余人,产业规模约25.9亿元。
在技术创新方面,沈阳发布国内首个《数据标注技术创新指导意见》,提出十大技术方向,研发智能数据标注生成管理平台,多模态标注准确率均超91%,语音与文本标注准确率达95%。
在生态构建上,成立数据标注产业集团与联盟,集聚120余家企业,联合东北大学、中国科学院沈阳自动化研究所等高校院所组建人工智能数据产业研究院,推动产教研用深度融合。
此外,沈阳积极推动数据要素市场化,已交易《智能网联汽车大模型数据集》等28个数据集,金额达1.02亿元;正在建设《可泛化管道内检测缺陷智能模型库》等27个高质量数据集,总投资9.2亿元。其中,《输变电装备行业多模态高质量数据集》项目入选国家数据基础设施建设先行先试名单。
强化技术、人才与集聚区建设
面向未来,沈阳市将围绕“东北亚国际化中心城市”定位,持续推进数据标注产业高质量发展。
一是强化技术创新,重点突破多模态标注、智能标注算法、跨模态语义对齐等关键技术,掌握自主可控的标注算法与产品。二是加强人才储备,联合沈阳师范大学、沈阳职业技术学院等高校与企业,建设人才实训基地,计划到2026年引育2000名本科以上高水平人才、培育5000名专业化人才,基地从业人员突破15000人。三是建设数据标注集聚区,吸引算法研究、大模型应用、算力服务等机构集聚发展,设立实训中心、举办产业峰会,推动产业链、创新链、人才链深度融合。
中国信息协会数据标注专业委员会副主任兼秘书长刘志兴表示,沈阳作为国家数据标注基地,将以核心枢纽角色引领共建“东北地区具备全球竞争力的数据标注产业集群”,推动东北地区实现数据标注产业的差异化协同发展。专委会此次协同成员单位工信部电子五所、视联动力、中启联信等企事业单位共同参会,既彰显对沈阳及东北发展前景的坚定信心,更旨在通过优势互补探索创新合作模式,共助区域产业升级与数据标注产业高质量发展。

