结题验收成果简介) 结题验收成果简介 云环境下的图像视频的群体数据协同 结构化表达与处理 国家自然科学基金委信息学部于2019年5要进展,搭建了视频质量监测验证系统;(5)在 月30日上午组织专家组对由中国科学院计算技视觉特征高效压缩检索方面的成果被国际标准 术研究所牵头承担的国家自然科学基金重大项目s◎/EC15938-13采纳,在监控视频高效编码 “云环境下的图像视频群体协同表达与处理(批技术方面的成果被EEE1867.2和国家标准GB/ 准号:61390510)”进行了结题验收。 T334752采纳,实现压缩效率翻番,成果得到 该项目于2014年开始执行,历时5年,项规模化落地应 目参加单位包括北京工业大学、同济大学、中国 项目实施期间项目组成员在CCFA类期刊/ 科学技术大学和北京大学。项目下设五个课题 会议发表论文147篇,作为主要执笔人完成视频 分别从图像视频的协同结构化表达与处理、群体编解码方面国家标准1项,国际(组织)标准3项。 化图像视频的编码理论与方法、视觉失真可容忍项目执行期间,项目组成员获得国家自然科学二等 的图像视频传输理论与方法、与主观感知一致的奖3项、国家技术发明二等奖1项,各课题按计 图像视频质量评价方法以及面向群体数据的标准划全面超额完成了项目预定任务。验收专家组充分 及验证平台等方面开展研究 肯定了项目和所属课题在学术研究、人才培养和科 项目取得的成果包括:(1)在图像/视频的研奖励等方面所取得的成绩,项目验收获得特优。 联合属性与类别的层次化表达、视觉-语义关联 的结构化表达等方面取得重要进展,构建了视觉 概念库原型系统;(2)在群体图像信源模型、群 体图像的预测/变换技术和利用群体图像共性信 息的个体图像重建技术等方面取得突破;(3)研 发了数模混合的支持失真可容忍图像视频传输和 群体数据支持的图像视频传输原型系统;4在J 与主观感知一致的图像质量评价、视频质量评 国家自然科学基金重大项目云环境下的图像 价、图像质量评价参考库建设等方面取得了重 视频群体协同表达与处理”验收会 题验收成果简介
17 结题验收成果简介 结 题 验 收 成 果 简 介 云环境下的图像视频的群体数据协同 结构化表达与处理 国家自然科学基金委信息学部于 2019 年 5 月 30 日上午组织专家组对由中国科学院计算技 术研究所牵头承担的国家自然科学基金重大项目 “云环境下的图像视频群体协同表达与处理 ( 批 准号:61390510)”进行了结题验收。 该项目于 2014 年开始执行,历时 5 年,项 目参加单位包括北京工业大学、同济大学、中国 科学技术大学和北京大学。项目下设五个课题, 分别从图像视频的协同结构化表达与处理、群体 化图像视频的编码理论与方法、视觉失真可容忍 的图像视频传输理论与方法、与主观感知一致的 图像视频质量评价方法以及面向群体数据的标准 及验证平台等方面开展研究。 项目取得的成果包括:(1) 在图像 / 视频的 联合属性与类别的层次化表达、视觉 - 语义关联 的结构化表达等方面取得重要进展,构建了视觉 概念库原型系统;(2) 在群体图像信源模型、群 体图像的预测 / 变换技术和利用群体图像共性信 息的个体图像重建技术等方面取得突破;(3) 研 发了数模混合的支持失真可容忍图像视频传输和 群体数据支持的图像视频传输原型系统;(4) 在 与主观感知一致的图像质量评价、视频质量评 价、图像质量评价参考库建设等方面取得了重 要进展,搭建了视频质量监测验证系统;(5) 在 视觉特征高效压缩检索方面的成果被国际标准 ISO/IEC 15938-13 采纳,在监控视频高效编码 技术方面的成果被 IEEE 1867.2 和国家标准 GB/ T 33475.2 采纳,实现压缩效率翻番,成果得到 规模化落地应用。 项目实施期间项目组成员在 CCF A 类期刊 / 会议发表论文 147 篇,作为主要执笔人完成视频 编解码方面国家标准 1 项,国际 ( 组织 ) 标准 3 项。 项目执行期间,项目组成员获得国家自然科学二等 奖 3 项、国家技术发明二等奖 1 项,各课题按计 划全面超额完成了项目预定任务。验收专家组充分 肯定了项目和所属课题在学术研究、人才培养和科 研奖励等方面所取得的成绩,项目验收获得特优。 结题验收成果简介 国家自然科学基金重大项目“云环境下的图像 视频群体协同表达与处理”验收会
2019 科研成果年报 结 题 验 收 成结题验收成果简介 果 介差错容忍计算器件基础理论与方法 “差错容忍计算器件基础理论与方法”(批( eepBurning)、针对大规模数据检索的高速 准号:61432017)为国家自然科学基金重点项目,认知存储系统( Cognitive SSD)等,进行项目 该项目由中国科学院计算技术研究所、同济大 创新技术的验证和应用 香港中文大学深圳研究院三家单位共同承担 该项目在智能计算的硬件平台设计上取得了 目执行期为2015年1月至2019年12月 多项突破,在满足智能计算分类精度的前提下, 在应用质量约束下,差错容忍计算成为实现获得了芯片在能耗、性能、吞吐率、面积、存储 低功耗/高能效计算系统设计的重要趋势。该项密度、可靠性、成品率等方面的优化,能够显著 目围绕差错容忍计算器件提出了系列创新方法 提高计算能效、降低设计成本,为应对新一轮智 1)在面向近似计算的高能效体系结构和电能物联网(AoT)对低功耗智能处理器的大量定 路设计方面,创新地提出了性能/精度可控的神制需求提供了系列关键技术,具有重要的科学意 经网络加速器体系结构和电路设计自动化方法义和应用前景 DeepBurning等,支持可重构和可配置的卷积神 该基金重点项目合计在国内外重要期刊和领 经网络硬件加速器设计,为精度可控的高能效体域著名EEE/ACM国际会议发表学术论文150余 系结构和电路设计提供了有效解决方案。 篇,含SC|期刊论文40余篇,其中EE/ACM 2)在差错容忍管理和电路可靠设计方面,期刊论文20余篇篇;日期刊和日国际会议论文 创新地提出了满足实时性与计算精度的近似计算110余篇。 调度方法、众核处理器可靠设计方法 CoreRank 等,在确保应用服务质量、电路可靠性的前提下, 本项目成果 优化了应用程序的性能,有效节约了能耗。 创新的算法/软神经网络 3)在考虑差错容忍的功能验证和测试方面 述语言件工具链 定制芯片 创新地提出了针对基于阻变式存储器的深度学 习加速器的故障检测和性能恢复方法 RRAMedy 等,相对传统测试方法取得了更好的硬件故障检 测率,并提升了故障检测实时性。 神经网络 芯片电路 拓扑结构 结构 研发过程中,计算所项目组还研制了支 持近似计算的神经网络加速芯片自动生成平台 DeepBurning的主要框架
18 2019 科研成果年报 结 题 验 收 成 果 简 介 差错容忍计算器件基础理论与方法 “差错容忍计算器件基础理论与方法”(批 准号:61432017)为国家自然科学基金重点项目, 该项目由中国科学院计算技术研究所、同济大学、 香港中文大学深圳研究院三家单位共同承担,项 目执行期为 2015 年 1 月至 2019 年 12 月。 在应用质量约束下,差错容忍计算成为实现 低功耗 / 高能效计算系统设计的重要趋势。该项 目围绕差错容忍计算器件提出了系列创新方法: 1)在面向近似计算的高能效体系结构和电 路设计方面,创新地提出了性能 / 精度可控的神 经网络加速器体系结构和电路设计自动化方法 DeepBurning 等,支持可重构和可配置的卷积神 经网络硬件加速器设计,为精度可控的高能效体 系结构和电路设计提供了有效解决方案。 2)在差错容忍管理和电路可靠设计方面, 创新地提出了满足实时性与计算精度的近似计算 调度方法、众核处理器可靠设计方法 CoreRank 等,在确保应用服务质量、电路可靠性的前提下, 优化了应用程序的性能,有效节约了能耗。 3)在考虑差错容忍的功能验证和测试方面, 创新地提出了针对基于阻变式存储器的深度学 习加速器的故障检测和性能恢复方法 RRAMedy 等,相对传统测试方法取得了更好的硬件故障检 测率,并提升了故障检测实时性。 研 发 过 程 中, 计 算 所 项 目 组 还 研 制 了 支 持近似计算的神经网络加速芯片自动生成平台 (DeepBurning)、针对大规模数据检索的高速 认知存储系统(Cognitive SSD)等,进行项目 创新技术的验证和应用。 该项目在智能计算的硬件平台设计上取得了 多项突破,在满足智能计算分类精度的前提下, 获得了芯片在能耗、性能、吞吐率、面积、存储 密度、可靠性、成品率等方面的优化,能够显著 提高计算能效、降低设计成本,为应对新一轮智 能物联网(AIoT)对低功耗智能处理器的大量定 制需求提供了系列关键技术,具有重要的科学意 义和应用前景。 该基金重点项目合计在国内外重要期刊和领 域著名 IEEE/ACM 国际会议发表学术论文 150 余 篇,含 SCI 期刊论文 40 余篇,其中 IEEE/ACM 期刊论文 20 余篇篇;EI 期刊和 EI 国际会议论文 110 余篇。 结题验收成果简介 DeepBurning 的主要框架
结题验收成果简介) 结题验收成果简介 易编程的异构并行处理器结构 “易编程的异构并行处理器结构”是国家自运行时系统、一款异构处理器原理性样片、一套 然科学基金重点项目(批准号:61432016),起易编程的异构并行处理器参考结构。项目成果均 止时间为2015年1月至2019年12月。 达到任务书中的指标要求。在课题实施过程中 本项目形成了一套异构处理器的参考结构方本项目形成了54篇论文,其中包括10篇CCFA 案、样片和编程环境。包括一套以算法组件为中类会议论文和1篇仼EE/ ACM Trα factions论 心协作式编程范式及相应的编译工具链、异构处文,共申请10项发明专利,培养博士生10人 理器并行理论模型、面向领域的规范化算法加速硕士生15人。本课题圆满完成了任务书所规定 核设计、可进行任务调度和资源管理的异构并行的任务,达到了预期的研究目标 科研为国分忧 创新与民造福 题验收成果简介
19 结题验收成果简介 结 题 验 收 成 果 简 介 易编程的异构并行处理器结构 “易编程的异构并行处理器结构”是国家自 然科学基金重点项目(批准号:61432016),起 止时间为 2015 年 1 月至 2019 年 12 月。 本项目形成了一套异构处理器的参考结构方 案、样片和编程环境。包括一套以算法组件为中 心协作式编程范式及相应的编译工具链、异构处 理器并行理论模型、面向领域的规范化算法加速 核设计、可进行任务调度和资源管理的异构并行 运行时系统、一款异构处理器原理性样片、一套 易编程的异构并行处理器参考结构。项目成果均 达到任务书中的指标要求。在课题实施过程中, 本项目形成了 54 篇论文,其中包括 10 篇 CCF A 类会议论文和 11 篇 IEEE/ACM Transactions 论 文,共申请 10 项发明专利,培养博士生 10 人, 硕士生 15 人。本课题圆满完成了任务书所规定 的任务,达到了预期的研究目标。 结题验收成果简介 科 研 为 国 分 忧 创 新 与 民 造 福
2019 科研成果年报 结 题 验 收 成结题验收成果简介 果 数据并行与线程并行合一的可伸缩 处理器体系结构 “数据并行与线程并行合一的可伸缩处理器 4、优化了片上数据通路设计结构及片上存 体系结构”(批准号:61332009)是国家自然储结构设计,提出了高能效的片上网络数据传输机 科学基金重点项目,起止时间为2014年1月至制以及面向SMD执行模式的存储访问优化技术 2018年12月。该项目于2019年3月4日在北实现了高能效的数据搬运和数据存储访问模式 京通过了基金委信息科学部组织的结题验收,专 在执行项目期间,总共发表论文46篇,其 家组一致认为,全面完成项目计划,研究工作取中CCFA类论文5篇,B类论文10篇,包括 得较好进展,同意通过结题验收。 HPCA、CGO、CSE、PCAT、DATE等;SC论 项目主要基于数据流技术开展了可伸缩处理文7篇,包括TPDS、TSE、JCST等;培养博士生 器架构研究,完成了数据流处理器体系结构、数据22人,硕士生12人;申请发明专利25项,其 流指令系统、数据流指令影射等关键技术的研究 中6项获得授权;项目成员获得北京市科学技术 并构建了相应的原型系统,支持数据流程序的运行。二等奖1项,CCF-| EEE CS青年科学家奖1项 项目取得的具体研究成果如下 此外,1人入选中组部“万人计划”领军人才,2 1、提出了一种新型通用微处理器体系结构,名项目骨干成员由副高晋升正高职称,3名项目 具备线程并行和数据并行合一的特点,用同一套成员由中级晋升副高职称。 控制和运算部件来同时支持线程并行和数据并行 具有结构简单灵活、片上资源利用率高、性能功 数据流图 数据流程序 耗比高等特点。 progra 2、提出了基于数据流理论的众核处理器体系 架构设计方案,支持多种执行模式和多种并行运行 支持,缓解了传统控制流中的存储器、并行墙问题 以及用户无法深度控制硬件资源的隔离墙问题。 3、设计了 ETDPIC指令集系统,针对数据流 指令映射与硬件资源匹配差导致效率低的难题 实现了优化的软件指令映射算法。 数据流程序映射执行流程
20 2019 科研成果年报 结 题 验 收 成 果 简 介 数据并行与线程并行合一的可伸缩 处理器体系结构 结题验收成果简介 “数据并行与线程并行合一的可伸缩处理器 体系结构”(批准号:61332009)是国家自然 科学基金重点项目,起止时间为 2014 年 1 月至 2018 年 12 月。该项目于 2019 年 3 月 4 日在北 京通过了基金委信息科学部组织的结题验收,专 家组一致认为,全面完成项目计划,研究工作取 得较好进展,同意通过结题验收。 项目主要基于数据流技术开展了可伸缩处理 器架构研究,完成了数据流处理器体系结构、数据 流指令系统、数据流指令影射等关键技术的研究, 并构建了相应的原型系统,支持数据流程序的运行。 项目取得的具体研究成果如下: 1、提出了一种新型通用微处理器体系结构, 具备线程并行和数据并行合一的特点,用同一套 控制和运算部件来同时支持线程并行和数据并行, 具有结构简单灵活、片上资源利用率高、性能功 耗比高等特点。 2、提出了基于数据流理论的众核处理器体系 架构设计方案,支持多种执行模式和多种并行运行 支持,缓解了传统控制流中的存储器、并行墙问题 以及用户无法深度控制硬件资源的隔离墙问题。 3、设计了 ETDPIC 指令集系统,针对数据流 指令映射与硬件资源匹配差导致效率低的难题, 实现了优化的软件指令映射算法。 4、优化了片上数据通路设计结构及片上存 储结构设计,提出了高能效的片上网络数据传输机 制以及面向 SIMD 执行模式的存储访问优化技术, 实现了高能效的数据搬运和数据存储访问模式。 在执行项目期间,总共发表论文 46 篇,其 中 CCF A 类 论 文 5 篇,B 类 论 文 10 篇, 包 括 HPCA、CGO、ICSE、PCAT、DATE 等;SCI 论 文 7 篇,包括 TPDS、TSE、JCST 等;培养博士生 22 人,硕士生 12 人;申请发明专利 25 项,其 中 6 项获得授权;项目成员获得北京市科学技术 二等奖 1 项,CCF-IEEE CS 青年科学家奖 1 项, 此外,1 人入选中组部“万人计划”领军人才,2 名项目骨干成员由副高晋升正高职称,3 名项目 成员由中级晋升副高职称。 数据流程序映射执行流程
结题验收成果简介) 结题验收成果简介 面向气候和湍流模拟的百万量级异构 众核可扩展并行算法与优化方法 “面向气候和湍流模拟的百万量级异构众并行编程框架 aceMesh,实现数据驱动的细粒 核可扩展并行算法与优化方法”(批准号:度任务并行,在国产神威平台对气候模拟热点函 61432018)是基金委重点项目,起止时间为数性能提升49%。 015年1月至2019年12月,本项目按期完成 全球气候模拟应用首次在国际上实现三维剖 预定目标,达到相关成果指标 分方案并应用新颖跳点算法和高效通信优化方法 项目围绕髙性能计算中可扩展性这一核心问可扩展性提升两个数量级,突破十万核瓶颈,获 题,沿着物理模型、计箅方法、并行箅法这一技得国家最高科技奖获得者曾庆存院士高度评价。 术路线,以新型并行算法、高效通信实现、并行相关结果将会被PCC第六次评估报告采用。相 编程模型等为研究内容,较为完整的形成了一种关工作发表在CCFB类会议 IPDPS上 多层次应用协同设计优化的方法,并在三个重点 核材料数值模拟应用方面,研制世界上第 应用领域进行示范,完成了项目预期目标 款可进行千亿粒子模拟 OpenML软件包 针对E级大规模异构众核并行计算系统的多湖之光上五百万核效率高于80%,已经交付中国 层次不连续非线性可扩展现象展开理论分析,提原子能科学研究院进行模拟研究,成为国产核材 出了一套物理建模、并行算法设计和并行软件优料模拟软件生态的重要组成部分。相关工作发表 化方法分层次可扩展的理论和方法体系,指导三在CCFA类会议SC上。 个重点示范应用研究工作。相关工作发表在计算 直接法湍流计算采用了基于通信动态拓扑模 机学报上。 型优化,在神威太湖之光系统上实现了最大规模 针对应用中的 Stencil、F「T和SpM∨等共为16384立方的直接数值法湍流模拟,达到百万 性函数设计新颖算法和自适应优化实现,性能达核量级可扩展性目标 到国际领先水平。相关工作发表在CCFA类会 发表56篇论文,其中高水平论文21篇(国题 议SC、 PPOPP、CCFA类期刊TPDs、TACO 内首次同一年在SC上发表两篇论文)。项目拟冲验 ToMS上。 击2020年 Gordon Be奖,申请专利1项,软件 提出一种语义和资源感知的异构众核系统的著作权5项,培养博士生10名,硕士研究生10名。成
21 结题验收成果简介 结 题 验 收 成 果 简 介 面向气候和湍流模拟的百万量级异构 众核可扩展并行算法与优化方法 “面向气候和湍流模拟的百万量级异构众 核 可 扩 展 并 行 算 法 与 优 化 方 法” ( 批 准 号: 61432018) 是 基 金 委 重 点 项 目, 起 止 时 间 为 2015 年 1 月至 2019 年 12 月,本项目按期完成 预定目标,达到相关成果指标。 项目围绕高性能计算中可扩展性这一核心问 题,沿着物理模型、计算方法、并行算法这一技 术路线,以新型并行算法、高效通信实现、并行 编程模型等为研究内容,较为完整的形成了一种 多层次应用协同设计优化的方法,并在三个重点 应用领域进行示范,完成了项目预期目标。 针对 E 级大规模异构众核并行计算系统的多 层次不连续非线性可扩展现象展开理论分析,提 出了一套物理建模、并行算法设计和并行软件优 化方法分层次可扩展的理论和方法体系,指导三 个重点示范应用研究工作。相关工作发表在计算 机学报上。 针 对 应 用 中 的 Stencil、FFT 和 SpMV 等 共 性函数设计新颖算法和自适应优化实现,性能达 到国际领先水平。相关工作发表在 CCF A 类会 议 SC、PPoPP、CCF A 类期刊 TPDS、TACO、 TOMS 上。 提出一种语义和资源感知的异构众核系统的 并行编程框架 aceMesh,实现数据驱动的细粒 度任务并行,在国产神威平台对气候模拟热点函 数性能提升 49%。 全球气候模拟应用首次在国际上实现三维剖 分方案并应用新颖跳点算法和高效通信优化方法, 可扩展性提升两个数量级,突破十万核瓶颈,获 得国家最高科技奖获得者曾庆存院士高度评价。 相关结果将会被 IPCC 第六次评估报告采用。相 关工作发表在 CCF B 类会议 IPDPS 上。 核材料数值模拟应用方面,研制世界上第一 款可进行千亿粒子模拟 OpenKMC 软件包,太 湖之光上五百万核效率高于 80%,已经交付中国 原子能科学研究院进行模拟研究,成为国产核材 料模拟软件生态的重要组成部分。相关工作发表 在 CCF A 类会议 SC 上。 直接法湍流计算采用了基于通信动态拓扑模 型优化,在神威太湖之光系统上实现了最大规模 为 16384 立方的直接数值法湍流模拟,达到百万 核量级可扩展性目标。 发表 56 篇论文,其中高水平论文 21 篇(国 内首次同一年在 SC 上发表两篇论文)。项目拟冲 击 2020 年 Gordon Bell 奖,申请专利 1 项,软件 著作权 5 项。培养博士生 10 名,硕士研究生 10 名。 结题验收成果简介