中国科学院“十三五信息化专项科学大数据工程项目 重点数据库建设申请指南 契合国家战略,发展科学大数据”是《中国科学院“十三五”信息化 发展规划》明确的主要任务之一,并实施“科学大数据工程”以支撑该任 务的建设和实现。“十三五”期间,科学大数据工程继续推动科学数据库 持续积累与服务提升,在中科院优势学科领域、特色学科领域,特别是 数据资源建设和应用服务成效显著的方向,择优建设3-5个内容完整、质 量可靠、服务规范的重点数据库,力争达到国际领先水平,显著提升中 科院数据资源共享开放水平和国际影响力。 本指南针对重点数据库建设,目的是遴选确定重点数据库整合建设 的承担单位及其对应的课题建设内容。 此外,“十三五”期间科学大数据工程还将继续采取“先运行服务、后 择优补贴”的方式,对中科院特色数据库的运行服务进行统一监控与评 估,每年通过组织数据服务效果评估,并根据评估结果择优补贴,支持 特色数据库的持续发展和运行服务。 申报范围与建设内容 (一)项目概述 立足中科院优势学科和数据资源,面向大数据时代科研模式的变革, 通过整体设计和联合共建,建设资源体系完善和服务规范的重点数据库, 推动跨单位、跨地域的资源互补和数据整合,形成共建共享运行机制
1 中国科学院“十三五”信息化专项科学大数据工程项目 重点数据库建设申请指南 “契合国家战略,发展科学大数据”是《中国科学院“十三五”信息化 发展规划》明确的主要任务之一,并实施“科学大数据工程”以支撑该任 务的建设和实现。“十三五”期间,科学大数据工程继续推动科学数据库 持续积累与服务提升,在中科院优势学科领域、特色学科领域,特别是 数据资源建设和应用服务成效显著的方向,择优建设3-5个内容完整、质 量可靠、服务规范的重点数据库,力争达到国际领先水平,显著提升中 科院数据资源共享开放水平和国际影响力。 本指南针对重点数据库建设,目的是遴选确定重点数据库整合建设 的承担单位及其对应的课题建设内容。 此外,“十三五”期间科学大数据工程还将继续采取“先运行服务、后 择优补贴”的方式,对中科院特色数据库的运行服务进行统一监控与评 估,每年通过组织数据服务效果评估,并根据评估结果择优补贴,支持 特色数据库的持续发展和运行服务。 一、 申报范围与建设内容 (一) 项目概述 立足中科院优势学科和数据资源,面向大数据时代科研模式的变革, 通过整体设计和联合共建,建设资源体系完善和服务规范的重点数据库, 推动跨单位、跨地域的资源互补和数据整合,形成共建共享运行机制
实现学科内的基础数据资源的公共管理和共享服务,为学科领域的科技 创新活动提供支撑服务,并集成到中科院科学大数据环境与公共平台, 保障数据运行服务,确立在国际上的优势地位。 十三五”期间,科学大数据工程在中科院范围内将择优支持建设重 点数据库,原则上不超过5个。 (二)申报说明 1.课题申报名称:ⅩX重点数据库建设与应用服务 2.课题建设目标 充分联合本领域内的相关单位,通过整体设计和统一部署,按照中 科院科学数据库实施的标准规范、服务体系对已有数据库深入进行数据 关联和资源融合,建成国内权威且具有国际影响力的数据库,形成领域 内基本完整的数据资源体系和一站式数据服务系统,实现本领域内科学 数据资源的共建共享和公共数据服务,依托中科学大数据工程公共服务 云平台,为本领域内科技创新活动以及相关领域的交叉科研活动等提供 国际领先的数据支撑。 3.课题建设内容 在已有工作基础上,建设单位本着共建共享的原则,集中资源和力 量按照专业特点和知识结构建立多元、异构数据的知识关联网络,实现 数据资源的深度融合,并进一步开发数据集成应用,大幅度提升数据整 合度和服务支撑面,依托中科学大数据工程公共服务云平台向中科院提 供共享开放和应用服务。为顺利实施重点领域数据整合,“十三五”期间 应着重加强以下方面工作部署和统一建设
2 实现学科内的基础数据资源的公共管理和共享服务,为学科领域的科技 创新活动提供支撑服务,并集成到中科院科学大数据环境与公共平台, 保障数据运行服务,确立在国际上的优势地位。 “十三五”期间,科学大数据工程在中科院范围内将择优支持建设重 点数据库,原则上不超过5个。 (二) 申报说明 1. 课题申报名称:XX 重点数据库建设与应用服务 2. 课题建设目标 充分联合本领域内的相关单位,通过整体设计和统一部署,按照中 科院科学数据库实施的标准规范、服务体系对已有数据库深入进行数据 关联和资源融合,建成国内权威且具有国际影响力的数据库,形成领域 内基本完整的数据资源体系和一站式数据服务系统,实现本领域内科学 数据资源的共建共享和公共数据服务,依托中科学大数据工程公共服务 云平台,为本领域内科技创新活动以及相关领域的交叉科研活动等提供 国际领先的数据支撑。 3. 课题建设内容 在已有工作基础上,建设单位本着共建共享的原则,集中资源和力 量按照专业特点和知识结构建立多元、异构数据的知识关联网络,实现 数据资源的深度融合,并进一步开发数据集成应用,大幅度提升数据整 合度和服务支撑面,依托中科学大数据工程公共服务云平台向中科院提 供共享开放和应用服务。为顺利实施重点领域数据整合,“十三五”期间 应着重加强以下方面工作部署和统一建设
(1)制定实施数据整合建设方案与共建工作机制。建设单位应尽 快组织学科领域的数据资源整体发展规划和整合共建实施方案,确定国 际一流的建设预期,结合专业特点和共享模式、应用服务需求建立共建 工作机制,打通数据资源汇聚、整合和运维的互动关系链,形成学科重 点整合数据库建设的长期发展战略和长效合作机制。 (2)确立和全面贯彻数据整合技术路线。应针对本领域的数据资 源整合明确提出可行的技术途径和工作路线,明确整合技术部署实现的 工作计划与进度要求,实现对多元、异构数据的有效整合,为学科数据 整合提供可行的解决方案和统一技术支撑 (3)系统推进数据资源汇聚、整编和融合。按照科学数据库的相 关标准规范和软件工具要求,统一部署,分工合作,明确数据整合的任 务和分工、计划和进度,按照统一的数据资源体系和质量控制标准,推 进数据汇聚和整编,通过技术整合和运行支撑,实现学科领域面向信息 集成服务的数据融合。 (4)边整合、边服务、边提升。在全面保障已有科学数据库的正 常服务情况下,按照整合建设的部署,边整合建设、边运行服务,新增 的数据内容、服务功能应在课题实施过程中动态的发布,及时运行服务, 保障面向学科发展的公共支撑服务,不断提升数据共享与应用效果。 (5)明确数据资源的长效服务机制。十三五期间课题完成建设, 此后还应持续稳定向国内外用户提供高质量的长期服务,应结合大数据 时代本学科领域内容数据驱动科研活动的新特点,明确数据资源的长效 运行服务机制,包括但不限于数据更新机制、数据持久化标识、数据服 务环境及其长效服务保障等
3 (1)制定实施数据整合建设方案与共建工作机制。建设单位应尽 快组织学科领域的数据资源整体发展规划和整合共建实施方案,确定国 际一流的建设预期,结合专业特点和共享模式、应用服务需求建立共建 工作机制,打通数据资源汇聚、整合和运维的互动关系链,形成学科重 点整合数据库建设的长期发展战略和长效合作机制。 (2)确立和全面贯彻数据整合技术路线。应针对本领域的数据资 源整合明确提出可行的技术途径和工作路线,明确整合技术部署实现的 工作计划与进度要求,实现对多元、异构数据的有效整合,为学科数据 整合提供可行的解决方案和统一技术支撑。 (3)系统推进数据资源汇聚、整编和融合。按照科学数据库的相 关标准规范和软件工具要求,统一部署,分工合作,明确数据整合的任 务和分工、计划和进度,按照统一的数据资源体系和质量控制标准,推 进数据汇聚和整编,通过技术整合和运行支撑,实现学科领域面向信息 集成服务的数据融合。 (4)边整合、边服务、边提升。在全面保障已有科学数据库的正 常服务情况下,按照整合建设的部署,边整合建设、边运行服务,新增 的数据内容、服务功能应在课题实施过程中动态的发布,及时运行服务, 保障面向学科发展的公共支撑服务,不断提升数据共享与应用效果。 (5)明确数据资源的长效服务机制。十三五期间课题完成建设, 此后还应持续稳定向国内外用户提供高质量的长期服务,应结合大数据 时代本学科领域内容数据驱动科研活动的新特点,明确数据资源的长效 运行服务机制,包括但不限于数据更新机制、数据持久化标识、数据服 务环境及其长效服务保障等
4.课题考核指标 牵头建设单位应积极联合本学科领域内的相关单位,突出专业特征 面向国际一流的预期,突破资源整合技术框架和共建共享运行机制,创 新规划数据库建设和服务方案,明确各项工作目标和任务。“十三五”期 间,考核指标包括以下主要方面 (1)建立可行的领域内数据整合共建机制,根据数据共享发展需 求,充分联合相关单位,整合建设形成领域内基本完整的数据资源体系 确保充足的技术投入和统一组织实施,落实共建具体的保障措施和技术 措施。 (2)通过整合共建实现领域内相关数据资源的有效汇聚和数据库 能力重大提升,在已有基础上取得数据规模、服务功能的更大发展,落 实科学数据库的标准规范和软件工具等相关部署,充分支持数据云服务 的各项发展。 (3)切实采取质量控制的相关具体措施,从数据源头树立起整合 建设的统一质量标准和要求,严格把关专业数据的正确性、完整性 致性和有效性,并确保数据库共享服务的稳定性,为建设领域内权威性 重点数据库提供可靠依据。 (4)在科研活动乃至经济社会中不断取得重大的数据应用服务效 果,同时,依托中科学大数据工程公共服务云平台,保障数据库在领域 内提供公共数据服务和持续的运行服务。 学科领域重点数据库整合建设的具体考核内容应包括但不限于以 下表格列出的各项指标。其中,约束性指标是科学大数据工程的明确要 求,是必须完成的指标;预期性指标是鼓励和引导建库单位力争完成的 方向性指标
4 4. 课题考核指标 牵头建设单位应积极联合本学科领域内的相关单位,突出专业特征, 面向国际一流的预期,突破资源整合技术框架和共建共享运行机制,创 新规划数据库建设和服务方案,明确各项工作目标和任务。“十三五”期 间,考核指标包括以下主要方面: (1)建立可行的领域内数据整合共建机制,根据数据共享发展需 求,充分联合相关单位,整合建设形成领域内基本完整的数据资源体系, 确保充足的技术投入和统一组织实施,落实共建具体的保障措施和技术 措施。 (2)通过整合共建实现领域内相关数据资源的有效汇聚和数据库 能力重大提升,在已有基础上取得数据规模、服务功能的更大发展,落 实科学数据库的标准规范和软件工具等相关部署,充分支持数据云服务 的各项发展。 (3)切实采取质量控制的相关具体措施,从数据源头树立起整合 建设的统一质量标准和要求,严格把关专业数据的正确性、完整性、一 致性和有效性,并确保数据库共享服务的稳定性,为建设领域内权威性 重点数据库提供可靠依据。 (4)在科研活动乃至经济社会中不断取得重大的数据应用服务效 果,同时,依托中科学大数据工程公共服务云平台,保障数据库在领域 内提供公共数据服务和持续的运行服务。 学科领域重点数据库整合建设的具体考核内容应包括但不限于以 下表格列出的各项指标。其中,约束性指标是科学大数据工程的明确要 求,是必须完成的指标;预期性指标是鼓励和引导建库单位力争完成的 方向性指标
类别序号 指标内容 完成部署和应用中科院科学数据库相关标准规范和软件工 具,整合建成统一的数据资源体系和一站式共享服务系统。 2/初步实现对中科院本领域的数据整合,整合数据资源量在中 科院本领域的覆盖率不低于80% 整合形成的总数据量超过1TB或超过100万条数据记录,或 总数据量年度数据更新率超过20‰。 建立数据质量控制措施,提供至少3名同行(非课题组内) 约東性指标 评议和出具的质量评估报告。 保障数据库系统正常服务,年平均服务中断时间累计不超过 510天;同时作为“中国科技云”资源池的有机组成部分,集 成到“中国科技云”提供服务。 6在《中国科学数据》发表本数据库的数据论文2 实现数据应用效果总数达到或超过20项,包括支撑国家和中 7|科院重大科研工程项目、重点数据库被正式学术论文引用次 数、为经济社会发展提供数据支撑服务典型案例等,并提供 应用详细证明。 除了数据查询、下载之外,整合后重点数据库提供的数据共 享与应用服务功能项不少于5项。 年平均数据共享访问量超过50万人次,或年平均数据下载量 9超过500B 预期性指标10具有专职的运行服务队伍,基于统一咨询服务系统,对用户 需求在三个工作日内完成服务响应。 11支撑3项以上具有大数据驱动特征的学科创新应用示范 12/提供有效证明材料,证明重点数据库已经达到国内一流、国 际领先的水平。 5.组织实施 重点数据库受科学大数据工程的统一指导和管理,课题的组织实施 将按照择优立项、工程管理、绩效评估的原则进行。 (1)择优立项原则。本指南面向中科院公开发布,有意向、有条 件的研究所可牵头组织和联合学科领域内中科院属相关单位共同提出 申报,提交申报材料。通过专家评审,采用竞争择优的流程,“十三五” 期间将遴选不超过5个重点数据库课题。 (2)工程管理原则。牵头建设单位应牵头成立跨机构合作的课题 组,实施课题进度管理、经费管理和成果管理,全体建设单位应提供人 员、技术和环境等条件保障,接受科学大数据工程任务考核
5 类别 序号 指标内容 约束性指标 1 完成部署和应用中科院科学数据库相关标准规范和软件工 具,整合建成统一的数据资源体系和一站式共享服务系统。 2 初步实现对中科院本领域的数据整合,整合数据资源量在中 科院本领域的覆盖率不低于 80%。 3 整合形成的总数据量超过 1TB 或超过 100 万条数据记录,或 总数据量年度数据更新率超过 20%。 4 建立数据质量控制措施,提供至少 3 名同行(非课题组内) 评议和出具的质量评估报告。 5 保障数据库系统正常服务,年平均服务中断时间累计不超过 10 天;同时作为“中国科技云”资源池的有机组成部分,集 成到“中国科技云”提供服务。 6 在《中国科学数据》发表本数据库的数据论文 2 篇以上。 7 实现数据应用效果总数达到或超过 20 项,包括支撑国家和中 科院重大科研工程项目、重点数据库被正式学术论文引用次 数、为经济社会发展提供数据支撑服务典型案例等,并提供 应用详细证明。 预期性指标 8 除了数据查询、下载之外,整合后重点数据库提供的数据共 享与应用服务功能项不少于 5 项。 9 年平均数据共享访问量超过 50 万人次,或年平均数据下载量 超过 500GB。 10 具有专职的运行服务队伍,基于统一咨询服务系统,对用户 需求在三个工作日内完成服务响应。 11 支撑 3 项以上具有大数据驱动特征的学科创新应用示范。 12 提供有效证明材料,证明重点数据库已经达到国内一流、国 际领先的水平。 5. 组织实施 重点数据库受科学大数据工程的统一指导和管理,课题的组织实施 将按照择优立项、工程管理、绩效评估的原则进行。 (1)择优立项原则。本指南面向中科院公开发布,有意向、有条 件的研究所可牵头组织和联合学科领域内中科院属相关单位共同提出 申报,提交申报材料。通过专家评审,采用竞争择优的流程,“十三五” 期间将遴选不超过 5 个重点数据库课题。 (2)工程管理原则。牵头建设单位应牵头成立跨机构合作的课题 组,实施课题进度管理、经费管理和成果管理,全体建设单位应提供人 员、技术和环境等条件保障,接受科学大数据工程任务考核