本报太原3月13日讯(记者王蕾)3月11日,省数据局下发通知,为加快培育一批行业高质量数据集,强化数据要素高效供给,树立行业应用标杆,充分发挥示范引领作用,赋能我省数字经济高质量发展,组织开展行业高质量数据集征集工作。
通知指出,征集领域主要面向但不限于科学研究、工业制造、农业农村、智慧能源、交通运输、金融服务、医疗卫生、教育教学、商务领域、人力资源、文化旅游、应急管理、气象服务、绿色低碳、公共安全、城市治理等重点领域,以及低空经济、智慧驾驶、具身智能、生物制造等创新领域的高质量数据集。
申报主体为在省内注册的独立法人单位,包括政府部门、企事业单位、科研院所等。申报单位近3年经营状况良好,在信用、质量、安全等方面无不良记录。
行业高质量数据集是指经过系统化的采集、汇聚、清洗、标注等全流程数据处理,可直接用于开发和训练人工智能模型,并能有效提升模型性能的行业数据集合。根据数据所蕴含知识类型,可分为行业通识数据集和行业专识数据集。数据集可包含结构化数据、文本、视频、音频、图形图像等多种模态,数据规模原则上应达到TB级。数据集应为已建成或在建项目,具备实际业务应用场景,并在技术先进性、模式创新性、应用示范性以及动态更新机制等方面表现突出。
(责任编辑:梁艳)