湖北省数据局发布第三批湖北省高质量数据集

据湖北省政府网站消息,为进一步推动数据赋能“人工智能+”行动,落实国家数据局关于高质量数据集的建设要求,11月10日,湖北省数据局发布了《湖北省数据局关于公开征集第三批湖北省高质量数据集的通知》,本次征集由省数据局与市州数据管理部门协同实施,中部数据服务(湖北)有限公司提供平台支撑,建设单位通过湖北省高质量数据集公共服务平台进行数据集申报。本次共征集到覆盖科学研究、工业制造、医疗卫生等16个重点领域和低空经济、具身智能、智能驾驶等3个创新领域共66个数据集,经专家评审,最终推选出具有较高应用价值、支撑大模型开发和训练的25个数据集纳入第三批湖北省高质量数据集名单。

自2024年12月发布第一批高质量数据集以来,截至目前,湖北省数据局已累计征集高质量数据集170个,体量达15000TB,其中择优发布高质量数据集60个,体量近7700TB,数据模态涵盖文本、图形图像、视频、结构化数据等多元形式,具备模型适配性强、标注准确性高、行业辐射广的特点。

本次发布的高质量数据集聚焦AI创新与产业赋能,具有显著湖北特色。例如文旅领域的动漫数据集,依托多模态动漫制作数据,为AIGC动画生成、口型驱动、风格化重渲染等场景提供“创意燃料”,作为湖北动漫名片支撑国产动漫工业化转型;智能驾驶领域的自动驾驶环境感知、交通道路路网维护和灾害识别等方面的数据集,助力端到端自动驾驶技术在复杂道路环境下的可靠性升级;医疗卫生领域结合湖北医疗资源优势,涵盖典型病例临床诊疗结构化、血液样本库特征等数据,支撑医疗AI研发与健康产业创新。这批数据集既匹配产业共性智能化需求,又强化湖北特色场景的本地化适配性,成为驱动湖北特色产业提质升级的关键数据底座。

2026年,湖北省将聚焦科学研究、医疗卫生、教育教学、城市治理等重点赛道,布局建设一批“产业数据+产业知识+人工智能”三位一体的高质量数据集,探索开展高质量数据集运营,赋能我省人工智能产业发展。